航空环境中情境意识的个体差异和任务难度差异检测:眼动测量技术的优势*
2016-08-31刘志方
刘志方 苏 衡
(1.宁波大学心理学系暨研究所,宁波 315211;2.杭州空军疗养院,杭州 310007)
航空环境中情境意识的个体差异和任务难度差异检测:眼动测量技术的优势*
刘志方**苏衡2
(1.宁波大学心理学系暨研究所,宁波 315211;2.杭州空军疗养院,杭州 310007)
研究包含两项实验分别探讨情境意识眼动测量技术在检验个体差异和任务难度差异中的优势。实验一采用情境意识评价技术和整体情境整体评价技术,测验新手、专家组飞行员特技飞行时的情境意识差异,实验二同样采用上述测验方法检验专家组飞行员在不同难度特技飞行时的情境意识差异,两项实验同时都监测被试的眼动过程。结果发现,(1)情境意识评价技术结果不能反映个体差异,能反映任务难度差异;(2)情境整体评价技术结果能够反映个体差异,不能反映任务难度差异;(3)经验和任务难度都影响飞行员的视觉取样策略和编码信息加工。眼动数据结果与情境整体评价技术的结果相互印证,可以确定眼动测量技术可测验情境意识,且相对于其他方法,眼动测量方法有更为广泛的差异敏感性。
情境意识主观测量客观测量眼动技术
1 引 言
情境意识是工程心理学领域内的重要概念(Kaber,Perry,Segall,McClernon,& Prinzel,2006;Salmon et al.,2008)。在高需要、高危险的工作环境中,情境意识对操作者的决策和操作都有重要影响,而丧失情境意识将导致严重后果(Borghini,Astolfi,Vecchiato,Mattia,& Babiloni,2014;Endsley,1995a,1995b,2000;Klein,Calderwood,& Clinton-Cirocco,2010)。鉴于其重要性,学术界已经开发出多种测量方法。总的来说,这些测量可以分为三类:主观测量、客观测量和认知过程测量(Salmon et al.,2009),它们从不同角度、采用不同手段测量情境意识,它们各有其优势和不足,因而可能适用于不同情境和目的。有效测量手段必须有较高的区分度,也即是,它们必须对情境意识的差异性敏感;测验也应该在最大程度上不改变认知过程和操作行为。系统对比考察各种测量方法的区分度特点,可以为有效使用它们提供参考。然而,目前此方面的研究尚少。
情境意识评价技术(situational awareness rating technique)是主观测量方法中最为典型的代表,该测量技术要求操作者在完成一项任务后,对自己在操作过程中的心理体验进行估计,其中包括的10个题目可被归入注意需求、注意供应和情境理解三个维度(Taylor,1990;Endsley,1995b,Jones,2000)。证据表明,该测量技术能够正向预测操作绩效,可用来评估系统可用性,但它也常常因主观性而遭受批评(Selcon & Taylor,1990)。情境整体评价技术(Situation Global Assessment Technique)则要求操作者迅速回答预先设置好的问题,操作者回答偏离实际情况程度即为情境意识质量(Endsley,1995b)。这种评估技术能保证测验结果的客观性,但由于其只能在模拟器环境中实施,从而限制了其适用范围;由于不能排除操作者根据存储在长时记忆中图式、经验和心理模型做出回答的可能性,这项测量方法反映不同情境差异时可能会受到影响。
主观测量方法检验操作者的事后体验,而客观测量则是直接收集记忆结果。因而上述两类测量技术除了其各自优势外,它们也都有其不可逾越的局限,这归根于它们都是“结果取向”的测量。认知过程测量方法可以弥补上述方法的局限,但是目前尚无成熟的情境意识过程的测量技术。眼动技术是一种非侵入式、实时客观的监测手段;鉴于注视变化能反映注意活动(Kramer,& McCarley,2003;Rayner,2009;Shinar,2008),而注意和视觉搜索策略是情境意识的重要组成成分(Ratwani,McCurry,& Trafton,2010),因而眼动技术极有潜质被发展成为检验情境意识认知过程的有效手段(Kramer,& McCarley,2003;Kowler,Anderson,Dosher,& Blaser,1995)。然而,构建情境意识过程的眼动测量方法,还需要进行大量的研究。其中最重要的工作是要检验该技术的区分度及其使用范围问题。
从认知过程角度,情境意识可被定义为操作者对环境中的元素知觉,对环境的整体理解,以及对未来状态的预测(Endsley 1995a,1995b,2015a,2015b;Salmon et al.,2008)。Wickens则根据内容将情境意识划分为:空间意识(对“与飞行器位置直接相关信息”的把握)、系统意识(对“飞行器自身状态信息”的把握)和任务意识(在操作时,对“任务、操作步骤的管理、统筹和协调方面信息”的把握),这三类情境意识内容都会遵循上述认知过程的三阶段假设(Wickens,2002)。由于注视基本反映注意位置,因而眼动数据能够同时从过程和内容两个角度追踪情境意识状态。有人采用眼动技术测量民航飞行员遭遇飞机侧油箱漏油特情时的眼动模式,结果发现,成功觉察特情的飞行员在相关区域内注视比率明显大于未成功发现特情的飞行员(Merwe,Dijk,& Zon,2012),由此可见,情境意识的眼动测量方法在个体差异方面具有区分度。然而,该项技术是否同样具有环境/任务差异方面的区分度,则还需要进一步的研究。
研究表明,专家和新手在知识结构上存在本质的差别,专家操作者通常采用图式驱动(schema-driven)推理方式,其知觉模式、操作速度、记忆容量和图式质量等显著优于新手操作者。已激活的图式直接引导个体的探索与信息接受能力,情境意识就是图式当前的具体状态,专家能够更好地利用图式知识,而新手操作者常常采用表面的、浅层次的结构关系,因此前者的情境意识明显高于后者(Federico,1995)。基于这种考虑,实验一采用“专家-新手”范式检验不同情境意识测量技术的个体差异的敏感性,以明确眼动测量技术的优势。与此同时,复杂系统操作中的情境意识过程中不可避免地涉及数据驱动加工,因此操作环境特点(比如,任务难度)也是影响情境意识的重要因素(Endsley,1995a,2000),基于此考虑实验二检验不同测量技术对专家飞行员情境意识的任务难度差异敏感性,以再次明确眼动测量技术的优势。
特技飞行是歼击机成功躲避雷达、导弹,并击落敌机的必要手段。这项技能的高低直接反映飞行员的能力,因而考察不同经验飞行员在特技飞行中的情境意识差异,可检验其测量方法对个体差异的敏感性。而检验不同难度特技飞行任务中的情境意识差异,可检验其测量技术方法对任务差异的敏感性。因而以歼击机特技飞行任务为例,可以检验情境意识评价技术、整体情境评估技术和眼动测量技术对个体差异和任务难度差异的敏感性特点。情境意识评价技术和整体情境评估技术都是较为成熟的测量方法。然而,作为认知过程的测量方法,眼动测量技术对差异的敏感性特点,及其适用范围,目前尚无相关研究。基于上述分析,本研究参考情境意识评价技术和整体情境评估技术的特点,探讨情境意识眼动测量技术的优势特性。
2 实验一:经验水平对歼击机
特技飞行情境意识的影响
目的:在特技飞行任务中,检验情境意识评价技术、整体情境评估技术和眼动测量技术对个体差异的敏感性及其特点。
2.1实验设计
实验一为单因素被试间设计,两组不同经验水平的被试(飞行员和空军地勤战士)参与实验任务,要求他们做简单特技飞行任务(大坡度盘旋飞行)。空军地勤战士为某空军基地模拟器维护人员,所有战士均能熟练驾驶模拟器做简单特技飞行任务。
2.2被试
某空军部队基地的15名专业飞行员作为专家组被试(其飞行时间均超过3000小时,以下简称“专家”)参加实验。为了保障专家组与新手组被试存在稳定差异,选择该空军基地6名男性地勤战士作为新手组被试(以下简称“新手”),这些地勤战士主要从事维护、调试等技术工作,以保障模拟器的正常运行,他们均能够熟练驾驶模拟器战机。由于从事该项工作的地勤战士较少,且出于保密原则,不可能选择和培养其他新手组被试,因此新手组被试只有6人。新手和专家组被试的视力或矫正视力正常,之前均未参加过类似的实验。实验结束后可获得一件特定的礼物。
2.3实验设备
实验中使用的模拟器由某军事科研单位设计生产,该模拟器能够模拟相应的操作设备。眼动仪采用德国SMI公司生产的头盔式眼动仪(HED型眼动仪);该眼动仪的采样率为200Hz;跟踪空间分辨率为0.1°;凝视位置精度0.5°~1°;设备可跟踪范围为水平±30°,垂直±25°。
2.4实验过程
每个被试单独施测。被试进入模拟器座舱坐好后,主试口头讲述实验任务指导语,实验分为四个部分。第一部分要求被试自主操作模拟器飞行,主试不给予任何意见,这个部分的主要目的是要求被试熟练实验任务。第二部分中,主试要求被试将飞机飞行至3000~5000米高空,然后做一个简单特技飞行动作,其间主试随机选择一个时间点冻结模拟器(飞行模拟器处于静止状态),此时被试按照要求转头不能关注飞行仪表上呈现的任何信息,回忆回答冻结时的飞行参数,主试手动记录被试的回答和模拟器上的实际参数。模拟器解冻后返回机场降落,第二部分结束。第三部分要求被试再次执行第二部分的任务,此时主试将不再冻结飞行状态,直到被试驾驶飞机返回机场着陆实验结束,在此期间追踪被试眼动数据。第四部分要求被试填写回答情境意识评价技术问卷。
2.5结果
全部数据用SPSS13.0进行分析;采用重复测量方差时,若数据不符合球型假设,采用校正法“Greenhouse-Geisser”选取F值的自由度和相关p值。本次实验有三类因变量指标:(1)情境意识得分中包括三个子维度的得分,考虑到学术界对于如何计算情境意识评价技术的总分,尚未取得一致看法(Endsley,2000),故本研究未提供其总分结果;(2)估计误差数据(要求估计的10项飞行参数与当时实际飞行参数之差的绝对值);(3)眼动数据,兴趣区内注视平均持续时间(兴趣区域内每个注视持续时间的均值)、兴趣区内总注视时间(兴趣区域内注视点持续时间次数之和)、兴趣区内平均浏览持续时间(每次进入兴趣区域内凝视时间的均值)、注视比率(兴趣内的总注视时间与整个任务的持续时间的比值)。详细情况见后面的描述。
2.5.1主观的情境意识评价技术测量结果
对不同组别受试在情境意识自评技术得分进行独立样本t检验发现,新手组和专家组之间在情境意识各分维度得分都没有显著差异(Fs<0.25,ps>0.6),各组被试得分的均值和标准差见下表1。
2.5.2客观的情境整体评价技术测量结果
由于新手组成员能够估计出各项参数的概率较低(能够估计该参数的人数与该组总人数间比值),而专家组成员能在较大比例上(90%以上)估计每项参数,因此将两组被试能够估计的各项飞行参数的比例作为客观测量的因变量指标,由下图1可见,新手组的估计百分比明显低于专家组飞行员。
表1 新手和专家飞行员在简单特技飞行中情境意识评价技术上得分的均值和标准差
注:括号内为标准差,下同。
卡方检验显示:对于速度,两个组别被试的估计率都达到100%,两组间差异不显著;升降率估计的组别差异显著χ2=9.775,p<0.01;俯仰角估计的组别差异显著χ2=9.775,p<0.01;坡度估计的组别差异显著χ2=9.775,p<0.01;坡度估计的组别差异显著χ2=3.583,p<0.01;航向估计的组别差异边缘显著χ2=2.962,p=0.085;高度估计的组别差异不显著,χ2=0.369,p=0.544;左发动机温度(图1中简称“左发温度”)组别差异显著χ2=9.631,p<0.01;右发动机温度(图1中简称“右发温度”)估计的组别差异显著χ2=9.631,p<0.01;左发动机转速(图1中简称“左发转速”)估计的组别差异边缘显著χ2=2.946,p=0.086;右发动机转速(图1中简称“右发转速”)估计的组别差异边缘显著χ2=2.946,p=0.086。
由上述分析可知,新手组被试对所有关乎系统意识方面的参数(各项发动机参数)估计的比例都显著小于专家组;新手组除了在两项空间意识参数(高度和速度)上的估计与专家组没有差异外,其他各项空间意识方面的参数估计比例都显著小于专家组被试。
图1简单飞行任务中各组被试参数估计比例
2.5.3认知过程的眼动测量结果
飞行员可采用两类视觉取样策略获取情境信息:自然信息(natural information)取样策略和编码信息(code information)取样策略。前者是指,从舱外变化的环境中获取情境信息,比如,通过地平线、舱外气象变化,知觉当前的飞行高度和速度;后者是指通过阅读舱内仪表获取情境信息(Prinzel III et al.,2004)。基于这个分析,眼动数据首先处理分析基于机舱内和机舱外两个兴趣区域内的眼动数据,这个数据能够粗略地反映不同组别被试在视觉取样策略中的差异。鉴于自然信息取样策略只能获得粗略有限信息,完美飞行必须依赖编码信息取样策略,我们随后深入分析舱内各个仪表兴趣区域内的眼动数据。
2.5.3.1基于舱内、舱外兴趣区数据分析
被试可通过舱内仪表或者舱外环境变化获取情境意识。研究首先统计基于舱外和舱内两个兴趣区域内的眼动数据,其中各项眼动指标均值和标准差见表2(由于“舱内-舱外”兴趣区划分中整个视野被划分成两个区域,因而这部分眼动数据中未包含注视比率指标)。
表2 不同组别被试在简单特技飞行任务中舱内、舱外兴趣区域内眼动指标
对上述变量进行2(组别:专家组、新手组)×2(兴趣区:舱外兴趣区、舱内兴趣区)方差分析,结果如下:对于兴趣区内平均注视时间,舱内高于舱外达到边缘显著水平F(1,19)=6.187,p<0.05,η2=0.34;组别主效应不显著F(1,19)=0.597,p=0.449;兴趣区和组别的交互作用不显著F(1,19)=0.179,p=0.677。对于兴趣区内总注视时间,舱内显著高于舱外F(1,19)=7.599,p<0.05,η2=0.286;组别主效应不显著F(1,19)=0.740,p=0.4;兴趣区和组别的交互作用不显著F(1,19)=2.766,p=0.113。对于兴趣区内平均浏览时间,舱内显著高于舱外F(1,19)=9.532,p<0.001,η2=0.334;组别主效应不显著F(1,19)=1.714,p=0.206;兴趣区和组别的交互作用不显著F(1,19)=2.242,p=0.151。
由上述眼动数据结果可以发现,在简单特技飞行任务中只有被试对舱内信息的关注程度明显高于对舱外的信息的关注程度,其中没有发现组别差异,也没有发现组别和兴趣区域的交互作用。不过在总注视时间指标上不同组别被试间依然存在差异:舱外兴趣区内地勤人员总注视时间明显多于飞行人员(p<0.05),舱内的总注视时间则是飞行人员明显高于地勤人员(p<0.05)。这个结果提示,相对于专业飞行员,经验欠佳的新手组被试更加倾向于从舱外变化的环境中获取信息。为澄清两组被试处理信息过程的特点与差异,进一步分析舱内仪表兴趣区域上的眼动数据。
2.5.3.2基于不同仪表的兴趣区数据分析
歼击机飞行员主要通过升降率表、地平仪、发动机、高度表、航向表、平视仪表区和速度表获取飞行中的情境信息,这些仪表作为兴趣区的眼动数据的均值和标准差见表3。
表3 新手、专家组飞行员在简单特技飞行中舱内各仪表区域的眼动指标和标准差
对上述变量进行2(组别:专家组、新手组)×7(兴趣区:升降率表、地平仪、发动机、高度表、航向表、平视仪表区和速度表)方差分析后发现:
对于兴趣区内平均注视时间,兴趣区主效应显著F(3.036,57.485)=6.262,p<0.001,η2=0.248;组别主效应不显著F(1,19)=0.596,p=0.49;兴趣区和组别的交互作用主效应显著F(3.036,57.485)=4.37,p<0.05,η2=0.187,简单效应分析表明;专家组被试在发动机、高度表和航向表区域上的注视的平均持续时间显著多于新手组(ps<0.05),在其他仪表上平均注视时间差异不显著(ps>0.05)。
对于兴趣区内总注视时间,兴趣区主效应显著F(1.929,36.656)=4.843,p<0.01,η2=0.203,主要表现在地平仪上总注视时间显著大于升降率表、地平仪、发动机、高度表、平视仪表区和速度表上总注视时间(ps<0.05),升降率表上总注视时间显著少于平视仪表区域的总注视时间(p<0.05),发动机上总注视时间显著少于平视仪表区和速度表上总注视时间(ps<0.05);组别主效应不显著F(1,19)=1.493,p=0.237;兴趣区和组别交互作用边缘显著F(1.929,36.656)=3.405,p=0.062,η2=0.138。简单效应分析表明:专家组飞行员在平视仪表区域上的总注视时间显著少于新手(p<0.05),在其他仪表上平均注视时间差异不显著(ps>0.05)。
对于兴趣区内平均浏览时间,兴趣区主效应显著F(3.401,64.621)=4.694,p<0.001,η2=0.198,主要表现在升降率上的平均浏览时间显著低于地平仪和平视仪表上的平均浏览时间(ps<0.05),地平仪上平均浏览时间显著多于发动机和高度表(ps<0.05),发动机上平均浏览时间显著低于其他仪表(ps<0.05);组别主效应不显著F(1,19)=0.014,p=0.917;兴趣区和组别交互作用显著F(3.401,64.621)=7.903,p<0.001,η2=0.294,专家组飞行员在发动机航向表上的平均浏览时间显著多于新手组(ps<0.05),在平视仪表上的平均浏览时间却显著少于新手组(p<0.05)。
对于兴趣区内注视比率,兴趣区主效应显著F(2.133,40.536)=7.504,p<0.001,η2=0.283,主要表现在升降率的注视比率显著低于地平仪、平视仪表和速度表(ps<0.05),在地平仪上注视比率显著高于其他仪表,对发动机上的注视比率显著低于高度表、航向表、平视仪表区和速度表;组别主效应不显著F(1,19)=1.393,p=0.252;兴趣区和组别的交互作用显著F(2.133,40.536)=3.555,p<0.01,η2=0.158,专家组飞行员在发动机和航向表区域上的注视比率显著多于新手组(ps<0.05),在平视仪表上的注视比率显著少于新手组(p<0.05)。
2.6讨论
实验一通过三种测量技术探讨歼击机简单特技飞行中情境意识的组间差异。情境意识自测技术中没有发现显著的组间差异,说明该测量技术在区分个体之间差异上并不敏感,这应归根于经验水平欠佳的飞行员并不能准确评估其对情境的把握程度(Endsley,1995)。整体情境评估技术的评估结果显示,参数估计比例除在速度、高度指标上没有发现组别差异外,其他指标上均发现组别效应。速度和高度反映战机的空间意识,反映战机的系统意识的所有参数估计都发现组间差异,这项结果意味着系统意识较之空间意识更难掌握。这种对情境意识内容把握的全面性的组间差异可能与两组被试在视觉取样方面的差异有关。
研究检验了两组被试在视觉取样策略方面的差异,结果发现,专业飞行员倾向于从舱内仪表上获取编码性质的情境信息,而新手被试则更加倾向于从舱外环境获取自然信息。战机的高度、速度信息可以直接通过环境变化获取,而与战机自身状态相关的系统信息则只能通过仪表获得,因而两组被试获取情境信息的完备性有所差别。检验两组被试处理编码信息过程的特点与差异的分析显示:平均注视时间、平均浏览时间和注视比率指标提示,经验丰富的飞行员对发动机信息处理得更加细致;平均浏览时间和注视比率指标显示,经验丰富的飞行员较之前者更少依赖平视仪表提供的信息;平均注视时间、平均浏览时间的注视比率指标显示,经验丰富的飞行员较之前者也能够更加精细地处理航向信息。
对比眼动数据结果和整体情境意识测量结果,可以检验眼动技术测量情境意识过程的有效性。发动机兴趣区域内提供发动机运行状态信息,它们是系统意识的组成成分,实验发现,新手很少注视发动机兴趣区域,这与他们在情境整体评价技术测量中不能有效估计发动机参数的操作表现直接相关。航向信息是空间意识的重要组成成分,眼动数据发现,新手很少关注航向仪表,这与他们在情境整体评价技术测量中不能有效估计航向参数的操作表现直接相关。相对于其他仪表,平视仪表可读性较高,除不能显示发动机信息外,它能同时提供航向、速度、高度、俯仰角度、坡度和升降率信息(这些均为空间意识的组成成分);但相对于主要提供这些信息的其他仪表而言,平视仪表提供的信息较为粗略。眼动数据显示,相对于专家,新手偏重于参考平视仪表获得编码信息,不过参照情境整体评价技术的测验结果可知,新手主要参照平视仪表有意识地获取高度和速度信息。由此可见,眼动测验结果能够有效反映知觉层面上情境意识内容。
3 实验二:任务难度对歼击机
特技飞行情境意识的影响
实验一显示,情境意识自测技术在反映个体间差异上不敏感,整体情境评估技术则从信息加工结果角度反映组间差异,眼动数据则能够进一步揭示情境意识过程的组间差异。为进一步检验上述各项测量技术在区分任务难度上的敏感性,组织实验二。实验二通过检验专家组飞行员在高难度与低难度特技飞行任务中的情境意识差异,实现上述目的。
3.1实验设计
实验二为单因素被试内设计,要求被试完成两项难度不同的特技飞行任务:简单特技飞行任务(大坡度盘旋飞行)和复杂特技飞行任务(“8”字形轨迹飞行)。
3.2被试
参与实验一的专家组飞行员也参与实验二,其中有两名飞行员中途执行任务,在完成简单特技飞行任务后退出实验,因此实验二中有13名飞行员同时参与两项难度不同的特技飞行任务。
3.3实验设备和实验过程
实验设备与实验一完全相同。实验过程与实验一大致相同。
3.4结果
实验二的因变量指标和数据处理方法都与实验一相同。
3.4.1主观的情境意识评价技术测验结果
不同难度任务中飞行员在情境意识量表的均值和标准差见下表4。对其进行重复测量F检验发现:注意需求维度上得分,简单特技与复杂特技飞行差异不显著F(1,12)=0.037,p=0.851。注意供应维度上得分,复杂特技显著高于简单特技飞行F(1,12)=8.006,p<0.05,η2=0.406。环境理解维度上得分,复杂特技飞行高于简单特技飞行显著F(1,12)=5.533,p<0.05,η2=0.308。
表4 专家组飞行员在简单、复杂特技飞行中情境意识评价技术得分的均值和标准差
3.4.2客观的情境整体评价技术测验结果
飞行员几乎能够估计所有的参数,因此以估计偏差(估计值相对于实际参数值的偏离程度)作为整体情境评估技术的评估结果,表5呈现飞行员被试在简单、复杂特技中估计偏差的均数和标准差。统计各项估计偏差发现,所有估计偏差的任务难度差异不显著(ps<0.05)。
3.4.3认知过程的眼动测量结果
实验二的眼动数据处理,同样首先处理分析基于机舱内和机舱外两个兴趣区域内的眼动数据,通过这个数据粗略反映任务难度对专家飞行员视觉取样策略的影响。随后深入分析舱内各个仪表兴趣区域内的眼动数据,细化上述影响。
表5 专家组飞行员被试在简单、复杂特技中估计偏差的均数和标准差
3.4.3.1基于舱内、舱外兴趣区数据分析
基于舱外、舱内兴趣划分的眼动指标的均值和标准差见表6。
表6 专家组飞行员被试在简单、复杂特技飞行任务中舱内、舱外兴趣区域内眼动指标
对上述变量进行2(任务难度:简单特技飞行、复杂特技飞行)×2(兴趣区:舱外、舱内)方差分析后发现:对于兴趣区内平均注视时间,舱内显著高于舱外F(1,12)=8.558,p<0.05,η2=0.379;任务类型主效应不显著F(1,12)=1.265,p=0.283;任务难度和兴趣区交互作用不显著F(1,12)=0.504,p=0.49。对于兴趣区内总注视时间,舱内显著高于舱外F(1,12)=8.639,p<0.05,η2=0.419;复杂特技飞行多于简单特技飞行任务边缘显著F(1,12)=3.418,p=0.089,η2=0.222;任务难度和兴趣区交互作用不显著F(1,12)=0.471,p=0.505。对于兴趣区内平均浏览时间,舱内显著多于舱外F(1,12)=13.668,p<0.001,η2=0.532;复杂特技飞行少于简单特技飞行任务边缘显著F(1,12)=3.436,p=0.089,η2=0.223;任务难度和兴趣区交互作用边缘显著F(1,12)=3.947,p=0.07,η2=0.247,简单特技飞行时对舱内、外平均浏览时间的差异程度甚于复杂特技飞行任务。
实验一发现专家飞行员主要采用重点关注舱内信息的视觉取样策略。实验二并没有在总的注视时间指标上发现任务难度与兴趣区间交互作用,但两个变量间交互作用在平均浏览时间指标上达到边缘显著水平。平均浏览时间反映注意转换和视觉取样转换的速度问题,因而这个结果说明,对于同批被试而言,任务难度也影响视觉取样策略问题。同样,为细化上述影响继续分析舱内仪表兴趣区域内的眼动数据。
3.4.3.2基于不同仪表的兴趣区数据分析
复杂特技飞行任务中,舱内各仪表兴趣区内眼动数据均值和标准差见表7。
对上述变量进行2(任务难度:简单特技飞行、复杂特技飞行)×7(兴趣区:升降率表、地平仪、发动机、高度表、航向表、平视仪表和速度表)方差分析发现:
对于兴趣区内平均注视时间,简单特技飞行低于复杂特技飞行边缘显著F(1,12)=4.023,p=0.068,η2=0.273;兴趣区域主效应显著F(3.013,36.161)=4.511,p<0.05,η2=0.251,地平仪上显著大于升降率表、发动机表、高度表和速度表,发动机少于航向表(ps<0.05);任务类型和兴趣区间交互作用显著F(3.013,36.161)=3.129,p<0.05,η2=0.207,简单效应分析显示,复杂特技飞行导致升降率表、地平仪表和平视仪上平均注视时间变多(ps<0.05),但却导致航向表上平均注视时间变少(p<0.05)。
表7 专家组飞行员在简单、复杂特技飞行任务中舱内各表区域的眼动指标和标准差
对于兴趣区内总注视时间,任务类型主效应不显著F(1,12)=0.177,p=0.738;兴趣区主效应显著F(2.335,28.018)=11.476,p<0.001,η2=0.489,事后检验显示,升降率表显著少于高度表和航向表(ps<0.05),地平仪显著大于升降率表、发动机表、高度表和速度表,发动机显著少于高度表和航向表(ps<0.05);任务类型和兴趣区域的交互作用边缘显著F(1.956,23.468)=2.74,p=0.086,η2=0.186,简单效应分析显示,复杂特技飞行导致航向表上总注视时间减少(p<0.05),其他仪表上总注视时间则不受任务难度影响(ps>0.05)。
对于兴趣区内平均浏览持续时间,简单特技飞行低于复杂特技飞行达到边缘显著水平F(1,12)=4.093,p=0.066,η2=0.254;兴趣区主效应显著F(2.771,33.247)=4.883,p<0.001,η2=0.287,事后检验显示,地平仪显著大于升降率表、发动机表、高度表、平视仪表和速度表(ps<0.05),发动机表显著少于航向表(p<0.05);任务类型和兴趣区域的交互作用不显著F(2.67,32.034)=1.28,p=0.277。
对于兴趣区内注视比率,任务类型主效应不显著F(1,12)=0.285,p=0.603;兴趣区域主效应显著F(1.843,22.111)=13.953,p<0.001,η2=0.538,事后检验显示地平仪显著大于升降率表、发动机、高度表、航向表、平视仪表区和速度表(ps<0.05),升降率表和发动机表显著少于高度表和航向表(ps<0.05);任务类型和兴趣区间交互作用不显著F(2.793,33.521)=0.875,p=0.517。
3.5讨论
实验二在歼击机特技飞行环境中,检验三种情境意识测量技术对任务难度差异的敏感度。结果发现,情境意识自测技术中供应和理解维度的得分都可见显著的任务难度效应,这个结果意味主观测量方法在区分任务难度上敏感。整体情境评估技术的结果则显示,飞行员对各项飞行参数估计的差异不受任务难度的影响,导致这个现象的重要原因是,飞行员主要根据存储在其长时记忆中的信息,回答整体情境评估技术中呈现的问题,而非主要根据当时的实际的情境意识状态做出回答。
实验二同样首先基于“舱内-舱外”粗略兴趣区划分考察特技飞行难度对专家飞行员视觉取样策略的影响,结果发现,特技飞行难度在每次视觉取样转换的速度上影响视觉取样策略;也即是,随着难度增加,专家飞行员增加对每次舱外视觉取样时间,与此同时减少每次舱内仪表视觉取样的时间(见表7中兴趣区内平均浏览时间指标)。舱内各个仪表上眼动数据显示,任务难度并没有影响仪表区内的平均浏览时间(任务难度与兴趣区交互作用不显著);任务难度增加导致航向表上的平均注视时间和总注视时间减少;说明对航向信息加工最容易受到任务难度的影响,当任务变难时专家飞行员会损失部分航向信息以保证飞行安全。
4 总讨论
研究探讨了三种常见情境意识测量方法的区分度问题。情境意识自测技术作为常用的主观测量方法,其主要优点是简单、经济与非侵入性(Salmon et al.,2008;Endsley,1995b,2015b)。本研究采用两项实验分别检验该技术对个体差异、任务难度差异的敏感性。实验一发现,这种测量方法不能区分高经验组和低经验组飞行员的情境意识差异,导致此结果的根本原因在于,该测验技术是要求被试以其自身体验为参照评估题目,由于人类的认知局限(不能知晓自己并不知道的事情),因而其在衡量个体差异方面不足(Endsley,1995b,2015b)。实验二发现,情境意识自测技术中“注意供应”和“环境理解”维度上的题目能够反映任务难度差异,说明对于同一批被试而言,该技术可以衡量不同条件下情境意识的相对区别,这与以往的研究结论一致(Selcon & Taylor,1990;Endsley,1995b),因而这项测验技术在评估人机界面、训练方案等可以采用被试内部比较得到结论的实践中有实用价值。
整体情境评估技术作为一种客观测量方法,同样具有操作简单、经济与非侵入性等主要优点(Salmon et al.,2008;Endsley,1995b,2015b)。该技术可同时评估知觉、理解和预测方面的信息质量。由于眼动测量技术并不擅长反映理解和预测层面上的认知过程,本研究的主要目的在于检验采用眼动追踪技术检测情境意识知觉层面上认知过程的有效性及其优势特点,根据这个目的,实施整体情境评估技术时,只收集知觉层面的结果。
综合两项实验结果可见,整体情境评估技术测验仅对个体差异敏感;对任务难度差异不敏感。导致此结果的原因应该主要存在于其测验流程中。这项技术给被试呈现一系列问题,将被试的回答与实际情境进行对比得出分数。这种测验方式不能排除被试根据主要依靠存储在长时记忆中的结构性信息(比如图式、心理模型等)回答其中问题的可能性(Endsley,1995b,2015b)。本质上讲,航空环境中的情境意识是飞行员基于其经验图式(或心理模式)收集、处理环境信息过程,因而采用整体情境评估技术获得的结果可能同时反映操作者图式(或心理模式)质量以及当前的情境认知状态,也可能仅反映操作者图式(或心理模式)质量。鉴于稳定的证据表明,新手和专家操作者的图式(或心理模式)存在质的区别,而两项实验发现,整体情境评估技术可反映组间差异,却不能反映任务难度差异,说明该项测验实质上检测了操作者的图式(或心理模式)质量(这显然也是一种静态的情境意识),并非测量当时当地的情境意识过程。由此可见,整体情境评估技术在区分个体差异,评价选拔领域有重要参考价值。
除了各自有其独立的优势外,上述两种情境意识的测量技术都有其明显不足,导致其局限的根本原因在,情境意识自测技术和整体情境评估技术都不是针对情境意识本身的实时直接测量,前者测验当事人的主观体验,后者则测量情境意识的加工结果,这导致它们不能真实地反映当时当地的情境意识。视觉搜索策略和编码信息加工都是情境意识的重要组成成分(Ratwani et al.,2010;Kramer,& McCarley,2003;Kowler et al.,1995)。鉴于注视持续时间反映个体对注视客体的知觉加工过程(Rayner,2009),而飞行员的眼动模式实质上是在其内心图式(或心理模型)引导下的注意转换、视觉信息搜索与处理的过程(Kramer,& McCarley,2003;Shinar,2008;Federico,1995),因而检验经验和任务难度对视觉搜索取样策略和编码性信息加工的影响模式,可为建立情境意识的过程测量方法提供参考。本研究在考察“反映上述两类认知过程”眼动指标对个体差异和任务难度差异的敏感性基础上,检验情境意识眼动测量技术的特点及其优势。这项工作可弥补情境意识自测技术和整体情境评估技术中的不足,利于完善航空环境中的情境意识测量体系。
对于视觉取样策略而言,新手组飞行员的视觉取样策略与专家组存在本质的区别,前者更加倾向于从舱外环境中获取粗糙、直观的自然性信息,而后者则偏重从舱内仪表上获取精细的编码性信息(Prinzel III et al.,2004)。导致上述差异的主要原因在于,专家所具有的高度结构化的经验(比如图式或心理模型)能够引导其精细、高效率地从舱内仪表收集并处理关于当前飞行参数的信息;而新手组被试的结构化经验较差,由于缺乏高度结构化知识经验的引导作用,他们只能从舱外变化的环境中获取表面的、浅层次的结构关系。实验二发现,任务变难也会改变专家组飞行员的视觉取样策略,每个视觉取样周期中(从舱外取样开始到舱内取样结束的一段时间内)专家组增加对舱外视觉取样时间,同时减少舱内视觉取样的时间。考虑到对于专家飞行员而言,其内心的结构性经验是个稳定的因素,因而任务难度对视觉取样周期的影响实质上反映了环境因素对当时当前情境意识过程的影响作用。由此可见,相对于情境意识自测技术和整体情境意识测量技术,眼动数据能够反映上述视觉取样策略在不同经验水平被试间和不同操作环境之间的差异,这是情境意识眼动测量技术的优势之一。
对于编码性信息加工特点而言,专家组对发动机表、航向表投入的注视时间与注意资源较多,这意味着专家飞行员能够顾及加工该仪表提供的相关信息。整体情境评估技术结果提示,新手组不能成功报告系统意识方面的飞行参数(关于发动机的相关参数),对航向参数的估计新手组也显著差于专家组。从这个角度讲,基于仪表兴趣区域眼动数据结果与整体情境评估技术结果相互印证,相互支持。两组被试眼动模式的另一差异在于,新手组主要依赖于平视仪表获取编码性信息,鉴于该仪表能够同时提供多项空间信息,而整体情境评估技术结果中速度和高度两个参数的估计没有组间差异,说明新手组飞行员通过平视仪表获取的信息有限。眼动模式受到被试结构化经验的引导,两组被试接受的任务完全相同,因此被试对舱内仪表信息加工模式不同,应主要归根于两组被试的结构性经验的差异,可见眼动技术可监测被试结构化经验差异(这是种静态的情境意识)。实验二发现,随着特技飞行任务难度增大,专家飞行员会采用减少对航向表关注/加工的策略完成任务,说明操作环境对当时当地编码信息加工层面上情境意识过程的影响也能在眼动指标中有所反映。由此可见,相对于其他测量手段,眼动技术在区分编码信息加工层面的认知过程差异方面也有优势。
综上所述,本研究发现,经验和任务难度不仅影响视觉取样策略,也影响编码信息处理过程,说明情境意识眼动测量技术可在整体和细节上反映个体差异和任务难度差异,因而相对于其他测量方法,该测量技术有较高的区分度,其优势非常明显。当然,构建完整的、能监测理解、预测层面的情境意识的眼动技术还需深入研究。
5 结 论
情境意识评价技术不能反映个体差异,但能反映任务难度差异;情境整体评价技术能够反映个体差异,但不能反映任务难度差异;眼动测量方法则在整体视觉取样策略和细致的编码信息加工两方面,都能够反映个体差异和任务难度差异;眼动追踪技术可在知觉层面上反映情境意识的内容和过程。
Borghini,G.,Astolfi,L.,Vecchiato,G.,Mattia,D.,& Babiloni,F.(2014).Measuring neurophysiological signals in aircraft pilots and car drivers for the assessment of mental workload,fatigue and drowsiness.NeuroscienceandBiobehavioralReviews.44(1),58-7.
Endsley,M.R.(1995a).Toward a theory of situation awareness in dynamic systems.HumanFactors,37(1),32-64.
Endsley,M.R.(1995b).Measurement of situation awareness in dynamic systems.HumanFactors,37(1),65-84.
Endsley,M.R.(2000a).Theoretical underpinnings of situation awareness:A critical rewview.In M.R.Endsley,D.J.Garland,SituationAwarenessAnalysisandMeasurement.Mahwah,NJ:Lawrence Erlbaum,1-32
Endsley,M.R.(2013).Situation awareness.In J.D.Lee & A.Kirlik (Eds.),Oxfordhandbookofcognitiveengineering.Oxford,UK:Oxford University Press,88-108.
Endsley,M.R.(2015a).Situation awareness misconceptions and misunderstandings.JournalofCognitiveEngineeringandDecisionMaking,9(1),4-32.
Endsley,M.R.(2015b).Final reflections:Situation awareness models and measures.JournalofCognitiveEngineeringandDecisionMaking,9(1),101-111.
Federico,P.(1995).Expert and novice recognition of similar situations.HumanFactors,37(1):105-122.
Jones,D.G.(2000).Subjective measures of situation awareness.In M.R.Endsley,D.J.Garland,SituationAwarenessAnalysisandMeasurement.Mahwah,NJ:Lawrence Erlbaum,113-128.
Kaber,D.B.,Perry,C.M.,Segall,N.,McClernon,C.K.,& Prinzel,L.J.(2006).Situation awareness implications of adaptive automation for information processing in an air traffic control-related task.InternationalJournalofIndustrialErgonomics,36(5),447-462.
Klein,G.,Calderwood,R.,& Clinton-Cirocco,A.(2010).Rapid decision making on the fire ground:The original study plus a postscript.JournalofCognitiveEngineeringandDecisionMaking,4(3),186-209.
Kowler,E.,Anderson,E.,Dosher,B.,& Blaser,E.(1995).The role of attention in the programming of saccades.VisionResearch,35(13),1897-1916.
Kramer,A.F,,& McCarley,J.S.(2003).Oculomotor behavior as a reflection of attention and memory processes:Neural mechanisms and applications to human factors.TheoreticalIssuesinErgonomicsScience,4(1-2),21-55.
Merwe,K.V.D.,Dijk,H.V.,& Zon,R.(2012).Eye movements as an indicator of situation awareness in a flight simulator experiment.InternationalJournalofAviationPsychology,22(1),78-95.
Prinzel III,L.G.,Comstock,J.R.,Glaab,L.J.,Kramer,L.J.,Arthur,J.J.,& Barry,J.S.(2004).The efficacy of head-down and head-up synthetic vision display concepts for retro-and forward-fit of commercial aircraft.TheInternationalJournalofAviationPsychology,14(1),53-77.
Ratwani,R.M.,McCurry,J.M.,& Trafton,J.G.(2010).Single operator,multiple robots:An eye movement based theoretic model of operator situation awareness.InProceedingsoftheFifthACM/IEEEInternationalConferenceonHuman-RobotInteraction,Nara,Japan.New York,NY:Association for Computing Machinery,235-242.
Rayner,K.(2009).Eye movements and attention in reading,scene perception,and visual search.TheQuarterlyJournalofExperimentalPsychology,62(8),1457-1506.
Salmon,P.M.,Stanton,N.A.,Walker,G.H.,Jenkins,D.P.,Baber,C.,& McMaster,R.(2008).Representing situation awareness in collaborative systems:A case study in the energy distribution domain.Ergonomics,51(3),367-384.
Selcon,S.J.,& Taylor,R.M.(1990).Evaluation of the situational awareness rating technique (SART) as a tool for aircrew systems design.InSituationalAwarenessinAerospaceOperations(AGARD-CP-478,pp,.5/1-5/8).Neuilly Sur Seine,France:NATO-AGARD.
Salmon,P.M.,Stanton,N.A.,Walker,G.H.,Jenkins,D.,Ladva,D.,Rafferty,L.,& Young,M.(2009).Measuring situation awareness in complex systems:Comparison of measures study.InternationalJournalofIndustrialErgonomics,39(3),490-500.
Shinar,D.(2008).Looks are (almost) everything:Where drivers look to get information.HumanFactors,50(3),380-384.
Wickens,C.D.(2002).Situation awareness and workload in aviation.CurrentDirectionsinPsychologicalScience.11(4),128-133.
Abstract
With two experiments,the present study examined the sensitive advantages of eye tracking situation awareness method compared with two other measures,such as Situational Awareness Rating Technique (SART),Situation Global Assessment Technique (SGAT).The first experiment checked the individual differences,and the second checked the task difficulty differences.Results are three-folded.First,SART was not sensitive in distinguishing SA differences between experts and novices,but sensitive to task difficulty.Second,SAGAT was sensitive to individual differences,but not sensitive to task difficulty.Third,there were group differences between experts and novices in both visual sampling strategy and coding information procession,and there were also task differences in both of visual sampling strategy and coding information procession.Given that,the results from eye movement and SAGAT confirmed each other,and it is reasoned to conclude that eye movement data can track the situation awareness in the aviation working environment.Thus,the results suggest that eye movement measurement of situation awareness is sensitive both to individual and task differences.
Exploring the Individual and Task Difficulty Difference of Situation Awareness in Aviation Working Environment:The Advantages of Eye Tracking Method
LIU Zhi-fang1SU Heng2
(1.Department of Psychology,Ningbo University,Ningbo 315211,China;2.Hospital of China Air Force Hangzhou,Hangzhou 310007,China)
situation awareness,subjective techniques,objective techniques,eye movements
空后勤课题(DKJ09L036)。
B849
A
1006-6020(2016)-01-0012-14
**通信作者:刘志方,E-mail:lzhf2008@163.com。