APP下载

民机驾驶舱人机交互脑力负荷预测模型

2021-06-24卫宗敏

科学技术与工程 2021年13期
关键词:驾驶舱脑力正确率

卫宗敏

(中国民航管理干部学院航空安全管理系,北京 100102)

飞行特情下的脑力负荷问题是导致飞行机组人为差错的重要因素[1]。自20世纪80年代起,研究人员开始持续关注这一问题。目前,飞机驾驶舱人机交互系统中的脑力负荷问题已上升为航空、航天、航海、核电等大型复杂系统人机工效领域热点研究课题[2]。国外针对相关航空事故分析的相关研究指出,飞行员脑力负荷过高导致60%以上的事故[3-4]。国内一份针对中国民航事故原因进行分析统计的研究结果也表明,约20%的飞行事故与脑力负荷密切相关[5]。

近年来,相关研究人员已经意识到,要解决飞行员脑力负荷问题,不仅仅要考虑加强对飞行员的培训和飞行特情训练,更应该在飞机驾驶舱人机交互的设计阶段就应考虑脑力任务设计问题,并就该问题开展了系列研究[6]。但是这些研究绝大多数都着眼于探讨不同类型飞行任务下的不同的评价指标与脑力负荷之间的关系,对飞行员的脑力负荷实判别预测模型的构建关注较少。考虑到在人们所获取的信息中,80%是通过视觉通道获取的[7],因而有必要在飞机驾驶舱显示系统人机交互设计的早期阶段,开拓测评方法,开展该系统设计与脑力负荷相关研究。

针对飞机驾驶舱人机交互界面脑力负荷的测量和评价,中外相关研究人员开展了一系列研究,采用的方法包括主观评价法、绩效测评法(包括主任务测评法和次任务测评法)、生理测评法以及多指标综合测评方法。大量的研究结果表明,不同测评方法分别适用于不同的飞行任务,试图以一种测量方法或指标来完成该项测评是难以实现的。同时,脑力负荷的复杂特性也决定了对其作综合评估的必要性[8]。

在综合评估方法建模方面,目前在这一领域较常用的建模技术主要有回归分析和神经网络建模等[9-11]。例如,Mazaeva等[9]采用自组织映射(self-organizing map,SOM)网络方法,对飞行模拟试验中所采集的多项脑电指标进行分析和建模,构建了预测脑力负荷水平的SOM网络模型。Ryu等[10]分别采用因素分析法和回归分析方法将多项生理指标综合对脑力负荷进行综合评价。李金波等[11]采用反向传播(back propagation,BP)神经网络和Elman神经网络两种方法,构建了脑力负荷预测模型,两种模型的预测准确率分别在61.40%~80.49%、70.07%~89.65%。

然而该建模方法在理论基础方面仍存在较大争议[11]。而多元线性回归分析方法,能够有效用于研究不同影响因素对于多分类变量的效应,并且能够有效保留所选评价指标,防止信息丢失,预测结果稳定性较好,但是采用传统的多元线性回归方法无法对类别进行直接判定,因而采用该方法对脑力负荷类别进行数学建模,目前还未引起飞行领域的广泛重视。

现尝试改进传统的多元线形回归分析方法,并用该方法对飞行任务相关的脑力负荷进行理论建模。首先以飞行任务人机交互实验为基础,通过飞行模拟器测评人机交互飞行实验过程中被试的飞行任务绩效(反应时和正确率)、主观评价(NASA-TLX量表)和生理变化(心率和心率变异性)来间接测量脑力负荷,探索在不同难度飞行任务过程中脑力负荷在这三类评估指标上的变化;然后筛选出对脑力负荷敏感的评估指标,基于改进的多元回归分析方法构建脑力负荷预测模型,以达到对人机交互过程中的脑力负荷等级变化进行预测的目的。

1 实验测量方法

1.1 实验设计

实验采用被试内设计,每个被试共进行4次飞行模拟实验,包括对照组、低、中、高四种脑力负荷飞行任务。实验中仪表信息会随机呈现异常,不同难度飞行任务条件下需监视的仪表信息如表 1所示。

表 1 不同难度飞行任务条件下需监视的仪表信息

驾驶舱显示系统中所显示的飞行信息包括空速、俯仰角、气压高度、滚转角、航向角、方向舵状态、副翼位置、起落架状态、发动机状态等,异常范围的设置与文献[6]的系列研究相同。实验中,要求被试对显示系统上呈现的异常信息迅速准确地做出反应。

1.2 被试

被试者为北京航空航天大学16名在地面飞行模拟器上受过培训的飞行学员(21~28岁),身体健康,无睡眠障碍,右利手,视力或矫正视力正常。实验前对被试者进行模拟飞行培训,使被试者了解实验过程、熟悉实验操作方法及实验要求。

1.3 实验仪器和测试工具

实验在飞行模拟器上进行,心电测量中采集每个被试每5min内的心率、全部窦性心搏相邻心博间的距离(R-R间期)时间序列以及该时间段内心电图等数据。心率数值显示范围为20~300次/min,心率检测精度为±2次/min,采样频率为0.05~150Hz,波形记录速度为25mm/s。

实验中主观评定采用通用NASA-TLX量表[12],为便于被试操作员更准确完成量表,本研究以[0,100]范围内的分值等效替代NASA-TLX中的刻度线,分值越高负荷越大,从6个维度综合评定被试人员脑力负荷。

1.4 实验程序

针对每个被试,逐个开展实验。实验前,每个被试均完成一次无任何异常信息呈现的实验任务,该任务测量数据即为实验参照数据。被试每完成一次飞行任务后,即开展被试NASA-TLX量表。实验预设低、中、高3种复杂飞行任务,这3种飞行任务顺序在被试之间做了交叉平衡。完成实验任务的同时,计算机和心电测量设备同步相关测量数据。

1.5 实验数据记录

实验中记录如下数据:

(1)飞行任务正确探测率。利用E-prime编制的程序自动记录每次实验中被试对异常飞行信息正确响应的次数占所有异常信息出现次数的比例就作为该实验任务条件下的飞行任务正确探测率。

(2)反应时间。基于E-prime编程,由系统自动记录自飞行异常信息出现至被试操作的反应时间,以它作为该实验任务条件下的飞行任务反应时。

(3)心电图(electrocardiogram,ECG)数据。平均心率(mean HR)、R-R间期数量(RRI Count)、平均R-R间期(Mean RRI)、最大R-R间期(Maximum RRI)、最小R-R间期(Minimum RRI)、最大R-R间期与最小R-R间期的比值(Max︰Min RRI ratio)、R-R间期的标准差(SDNN)。

(4)主观评定数据。每个负荷下的实验任务结束后用NASA-TLX量表度量负荷分值。

2 实验测量结果

2.1 任务难度对脑力负荷的影响

计算各个脑力负荷评估指标在不同难度的飞行任务条件下的均值,并分别对各个评估指标在不同难度的飞行任务条件下均值的差异进行方差分析,结果如图 1所示。

图 1 不同难度飞行任务条件下均值的差异方差分析Fig.1 Variance analysis of the differences of the mean values under different difficulty tasks

从图 1可以看出,随着飞行任务难度的增加,对飞行任务主观评价值增大;对异常信息的反应时增加,对异常信息的正确探测率降低;Mean HR、RRI Count、Max︰Min RRI ratio呈现增加的趋势,而Maximum RRI、Minimum RRI、SDNN呈现降低的趋势。方差分析结果显示,在不同难度的飞行任务条件之间,NASA-TLX主观评价分值、反应时、正确率、Maximum RRI、SDNN均表现出极显著的差异(P< 0.01)。而Mean HR、RRI Count、Max︰Min RRI ratio和Minimum RRI变化的差异不显著(P>0.05)。由此可见,对飞行任务难度变化敏感的评估指标为NASA-TLX分值、反应时、正确率、Maximum RRI、SDNN等。

2.2 脑力负荷变化预测模型

2.2.1 模型的建立及使用说明

基于实验测量的分析结果,使用改进的多元回归分析方法,构建飞机驾驶舱人机交互脑力负荷预测模型,并用于驾驶舱人机交互中脑力负荷等级的判定。

为了保证方程中各变量的显著性,采用逐步筛选法建立回归分析模型,即NASA-TLX分值、反应时、正确率和SDNN按照逐步筛选策略进入回归模型。为便于对类别的预测,在传统多元回归分析方法的基础上做了相应的改进,所构建的回归模型如式1所示:

(1)

式(1)中:y为预测结果;x1为心率变异性指标SDNN测量值;x2为NASA-TLX计算值;x3为反应时测量值;x4为正确率测量值。根据x1、x2、x3和x4的数值可以计算出相应x的值,进而求出y的值。若y的值为1,则认为属低脑力负荷水平;若y的值为2,则认为属中脑力负荷水平;若y的值为3,则认为属高脑力负荷水平。

2.2.2 模型判别准确性的检验

模型的调整的R2值为0.827,较接近1,拟合效果较好。模型预测准确率的检验,基于所构建的多元回归模型,对不同类型的认知负荷分类进行预测,其结果如表 2所示。

表 2 脑力负荷水平等级预测结果Table2 Mental workload level prediction results

从表 2 的预测结果可知,采用改进的多元线形回归方法建模,模型总体预测正确率为87.50%。48组测试样本脑力负荷中,实测结果与预测结果吻合的有42组,有6组样本实测结果与预测结果相差一级,实测结果与预测结果无相差两级以上的情况。由此可见,利用改进的多元线形回归模型对个体脑力负荷水平进行分类具有较高的准确度。

3 讨论

3.1 三类评估指标对脑力负荷变化的敏感性

目前,中外学者对飞行脑力负荷的研究大都采用模拟器试验飞行方法,即通过设置飞行试验任务难度或梯度,研究各个测评指标对于脑力负荷状态的敏感性[13-15]。研究通过改变飞行任务中所需监视的仪表异常信息的数量、呈现时间和间隔时间来设置并探讨脑力负荷与三类评估指标的数学关系。

NASA-TLX量表分值呈阶梯形增加趋势,与前期研究结果一致[16-18]。该结果说明,从本实验所选拔的被试者个人主观角度,实验任务设计与预期吻合。

被试者的绩效呈阶梯形下降趋势,与前期其他飞行任务测试结果一致[16-18]。该结果支持了Sweller的认知负荷理论[19]和Lavie等[20]的注意负荷理论。

3.2 模型预测结果的准确性

模型整体评估结果如表 3所示。从总体分类预测准确来看,采用改进的多元线性回归预测模型可对不同飞行难度下个体脑力负荷水平进行预测和等级划分。该模型的分类预测准确率在81.25%~93.75%,平均预测准确率为87.50%。

表 3 模型对脑力负荷等级的预测结果Table3 Results of predication accuracy rate

3.3 研究的意义

通过设置动态飞行过程中所需监视的显示系统异常试验任务,获取飞行作业中脑力负荷评估指标,采用改进的多元线形回归方法建立起驾驶舱人机交互脑力负荷预测模型。

使用该模型可以对飞行机组脑力负荷水平是否在合理范围内进行实时分析或对可能出现的超脑力负荷现象进行有效预测,以利于在驾驶舱人机交互系统设计的早期阶段能够随时调整所设计的脑力任务,从而有效降低预期可能出现的脑力负荷超高或超低现象,保证航空安全。

同时,提供了如何构建飞机驾驶舱人机交互系统作业过程中脑力负荷变化预测的方法,即通过指标测量并基于改进传统回归分析方法,构建飞机驾驶舱人机交互脑力负荷预测模型,这一方法对于构建各类人机交互系统中的脑力负荷的预测模型可能具有普遍意义。

4 结论

研究获得以下结论。

(1)动态飞行模拟试验中,飞行作业正确率、反应时、心率变异性指标SDNN、NASA-TLX量表分值这4个指标对飞行任务相关的脑力负荷的变化有显著的敏感性。

(2)改进的多元线性回归预测模型克服了传统方法的不足,可对不同难度飞行任务人机交互中脑力负荷水平进行预测和等级划分。

(3)研究构建了一个简洁易用的飞机驾驶舱人机交互脑力负荷预测数学模型,该模型的分类预测准确率在81.25%~93.75%,平均预测准确率为87.50%。

猜你喜欢

驾驶舱脑力正确率
个性化护理干预对提高住院患者留取痰标本正确率的影响
门诊分诊服务态度与正确率对护患关系的影响
跟踪导练(三)
脑力百分百
生意
走进客机驾驶舱
跟踪导练(四)3
生意
脑力对对碰
脑力对对碰