基于TEM培训的航空公司与飞行员进化博弈分析
2014-03-14潘乐书
杨 虎,潘乐书,由 扬
(中国民航大学安全科学与工程学院,天津 300300)
基于TEM培训的航空公司与飞行员进化博弈分析
杨 虎,潘乐书,由 扬
(中国民航大学安全科学与工程学院,天津 300300)
针对威胁与差错存在的必然性,通过进化博弈的方法,建立了航空公司与飞行员之间威胁与差错管理的进化博弈模型。借助Matlab软件对进化路径进行仿真,分析不同变量对威胁与差错管理的动态影响。研究结果表明,航空公司加大对飞行员的培训可有效削弱威胁、减少差错的发生;威胁与差错的长效监管可从航空公司内部的机制调整着手,建立基于威胁与差错识别的培训,加大对飞行员不作为行为的处罚力度,合理增加航空公司培训成本,充分履行航空公司的监管职能,以更大的力度组织人员学习,加强飞行员对威胁与差错的识别及应对能力。同时,仿真结果也证实了将进化博弈应用于威胁与差错管理中的可行性和适用性,为威胁与差错管理这一新兴领域提供了研究思路。
飞行安全;航空公司;飞行员;进化博弈;威胁与差错管理
作为行业经验的集中产物,威胁与差错管理TEM(threat and error management)的概念应运而生。威胁、差错和非期望状况(undesired aircraft state)是正常飞行的组成部分,给飞行安全带来了风险,机组必须有效应对才能确保飞行安全[1]。
国内外学者均在分析威胁与差错存在的必然性。TEM在中国正处于发展时期,中国学者大多以介绍概念的形式对威胁与差错管理进行探讨,而且通常依附于对机组资源管理的研究[2-4];少数学者分析了TEM与不安全行为之间的关系以及威胁、差错与非期望状况3者引发事故的比重[5-6]。国际民航界已将TEM分析框架应用在飞行机组资源管理(CRM)、航线运行安全审计(LOSA)[7]以及空管正常运行安全监测(NOSS)等过程[8]。在飞行运行中,作为威胁与差错的直接管理者——飞行员为了增加飞行时间,不重视飞行中威胁与差错的管理,航空公司出于对飞行人员的高需求和高期望,往往更注重看得见的利益,而较少关注飞行中的威胁与差错管理。威胁与差错的存在具有必然性,不管是公司还是飞行员,都应该采取对策措施抑制其存在所带来的危害,进而保证飞行安全。
航空安全事故并不是单纯的技术问题,任何一次重大安全事故对航空公司和飞行员来说,都隐含着本能的博弈心理,即侥幸的利益动机和风险规避意识[9]。本文从博弈论角度,在进化博弈克服传统博弈完全理性的局限性基础上,构建了航空公司与飞行员之间的博弈模型,并运用Matlab软件对演化路径进行仿真,以期为航空公司管理提供新的理论视角。
图1 机组威胁与差错管理模型Fig.1 Threat and error management model of flight crew
1 机组威胁与差错管理框架体系
TEM是通过人为因素的知识在实践中综合应用,不断深入改进航空运行的安全余度逐渐发展而成的。它有助于从运行的角度来理解在动态和复杂的运行环境中安全和人的表现之间的内部关系。
1.1 威胁、差错与非期望状况举例
1)威胁
在典型的飞行运行中,机组必须管理各种复杂的前后关系。这种复杂性包括诸如处理不利的气象条件、周围环山机场、空域拥挤、飞机故障和空管人员、乘务员和机务人员等驾驶舱外人员的错误等。TEM模式认为这些复杂性是威胁,因其在飞行运行中都有潜在的降低安全余度的负面影响。
2)差错
根据差错发生时飞行员的作用对象不同,可从3个方面对差错进行举例说明。如果将差错归类为飞机操作差错,飞行员的主要作用对象必须是飞机(如通过飞机的操纵杆、自动化设备或系统对飞机进行操作);如果将差错归类为程序差错,飞行员的主要作用对象必须是程序(如检查单);如果要将差错归类为交流差错,飞行员的主要作用对象必须是人(如地面人员、其他机组成员)。
3)非期望状况
如进近着陆过程中飞机对准不正确的跑道、进近过程中飞机超出空中交通管制速度限制、或在短跑道着陆时目测过高而不得不使用最大刹车。
非预期飞机状态通常被认为是导致事故征候或事故的首要因素,所以飞行机组必须对非预期飞机状态进行有效管理。
1.2 机组威胁与差错管理模型
机组威胁与差错管理模型如图1所示。
威胁与差错在运行中不可避免,若管理不当则可能导致非期望状况的出现、导致事故或事故征候;非期望状况若得不到有效管理,也可能恶化成事故征候或事故。飞行员作为管理者,是避免威胁、差错以及非期望状况影响飞行安全的最后一道防线。针对那些可预测的威胁、差错以及非期望状况,飞行员应提前做好准备以有效应对。
2 航空公司与飞行员的博弈模型
航空公司与飞行员是利益相关者,针对威胁与差错管理的问题,双方持有各自的策略,航空公司对威胁与差错的管理工作主要放在组织飞行员培训上,而飞行员对威胁与差错的管理则体现在实际的飞行工作中,飞行员对威胁与差错管理的重视程度体现在其是否愿意主动参加该内容的培训。航空公司与飞行员的冲突在于谁来支付安全投入成本;一旦事故发生,谁来承担责任;利益又将如何分配。可见,航空公司与飞行员满足博弈模型建立的条件[10]。
2.1 航空公司与飞行员之间博弈模型的建立
1)参与者:航空公司(用1来表示),飞行员(用2来表示),博弈方I={1,2}。
2)策略空间:航空公司的策略空间为S1={培训飞行员(S11),不培训飞行员(S12)},飞行员的策略空间为S2={主动参加培训(S21),不参加培训(S22)}。
3)各种参数的设定:航空公司针对威胁与差错管理问题组织飞行员进行培训所需支付的成本为C1,培训后的有效管理为航空公司带来的收益为R1,若不培训但未发生事故则其收益仍为R1,反之,若在未培训状态下发生事故则公司会损失L,航空公司组织人员培训的概率为x;若飞行员主动参加培训,对威胁与差错进行有效管理,则其收益为R2,由于培训占用飞行员飞行时间而给飞行员带来的的损失为C2;若飞行员被动参加培训,即在受到公司处罚后接受培训,其收益为R3;航空公司发现飞行员不参加培训的概率为f,此时对飞行员罚款,罚款额为m;飞行员主动参加培训的概率为y。根据上述设定,可得收益矩阵,如表1所示。
表1 航空公司与飞行员的收益矩阵Tab.1 Payoff matrix of airlines and crew
若飞行员主动参加培训,则其短期收益降低,但飞行风险降低,安全系数增大;若飞行员不参加培训,则其短期收益增加,风险累积增加,不作为增加,飞行风险增加,安全系数降低。
根据目前大多数航空公司存在的实际情况,有:①R3
2.2 模型进化
根据上述博弈关系,可构建航空公司与飞行员之间博弈的进化动态规律,即复制动态方程RDE(replicator dynamics equation)。假设飞行员主动参加培训的期望收益为u1,被动参加培训的期望收益为u2,其平均收益为,则根据收益矩阵中的支付策略可有
同理可得,航空公司组织人员培训和不培训的期望收益v1、v2,以及航空公司的平均收益v¯分别为
根据Malthusian动态方程,即策略的增长率等于它的相对适应度,只要采取这个策略的个体适应度比群体的平均适应度高,那么这个策略就会增长[11]。由此,分别构造飞行员和航空公司的复制动态方程为
根据Friedman在1991年提出的方法,通过对该系统的雅克比行列式的局部稳定性分析,可以得到其均衡点的稳定性,其雅克比矩阵为
矩阵J的行列式
矩阵J的迹
2.3 飞行员对威胁与差错管理的进化模型均衡点及其稳定性分析
在平面M={(x,y)|0≤x≤1,0≤y≤1}上,可得到如表2所示的局部稳定分析结果,其中ESS为渐进稳定均衡或称进化稳定策略。
表2 局部稳定分析结果Tab.2 Analytic results of local stability
通过上述分析,系统最终将趋向于(S12,S21)模式,即飞行员主动参加关于威胁与差错管理的培训而航空公司不对飞行员进行培训。然而,根据实际状况,航空公司与飞行员的理想博弈结果应趋向于(S11,S21)模式,这才是良好的运行状态。在此种运行情境下资金分配方式将被界定,也正是为解决目前问题所需要的合理可行解。在合理约束条件下,进化博弈的第5个均衡点为它的行列式和迹分别为:detJ=trJ=0,此点为鞍点,记为点S;U(1,0),O(0,0)和W(1,1)为不稳定点,V(0,1)为进化稳定点。综上可得航空公司与飞行员之间策略的进化动态图,如图2所示。
图2 系统进化动态图Fig.2 Evolutionary dynamics of system
图中有1个不平衡点U,1个平衡点V和鞍点S连成的折线,可看作系统收敛于不同模式的临界线,当初始状态在USVO区域或USVW区域时,系统都将收敛于(S12,S21)模式,即飞行员主动参加关于威胁与差错管理的培训,而航空公司不对飞行员进行培训。
3 模拟仿真及结果分析
3.1 模拟仿真
设系统都以收敛于(S11,S21)模式为标准,结合目前航空公司内部实际情况进行模拟仿真,可作出如下假定:
条件1 当fm-C1-C2 条件2 在其他条件不变时,假定m=14,则利用Matlab软件可得仿真结果,如图4所示。 同理,在其他条件不变时,改变上述假定值中的任意一个,所得仿真结果大体趋势与图3中的情况是一致的,但其中实线与虚线的交汇点有所不同。 3.2 结果分析 图3 条件1的博弈演化路径Fig.3 Game evolution of case(1) 图4 条件2的博弈演化路径Fig.4 Game evolution of case(2) 图3、图4中的虚线和实线分别代表飞行员与航空公司各自的策略选择。最终,飞行员的策略选择趋于1,航空公司的策略选择趋于0,即:飞行员完全主动参与培训,航空公司无需强迫人员培训。通过条件2与条件1不同假设条件下所得曲线对比分析可知,当加大对飞行员的处罚力度时,飞行员会主动参加培训,此时,航空公司的初始投入成本降低,培训一段时间后,若未发生事故,航空公司又会逐渐减弱对飞行员的培训力度。然而,目前大多数航空公司所组织的威胁与差错管理方面的培训课程并不是很完善,有待进一步开发,鉴于此,各航空公司对此项课程的培训更不应该有所懈怠。 通过大量仿真模拟得出:加大力度处罚飞行员不作为行为,增加飞行员培训以促进其自身素质的提升,短期内加大航空公司培训力度规范飞行运行,所得曲线的稳定均衡点均为(0,1),这与目前实际情况基本吻合。然而,在航空公司与飞行员安全成本投入都很高的情况下,飞行员不愿占用飞行时间主动参加培训,但由于处罚机制的存在使得飞行员变被动参加培训为主动;当飞行员对威胁与差错管理工作已经充分重视时,航空公司又转而重视运营收益,减少对飞行员的培训从而节省其成本投入。 1)建立了航空运输中威胁与差错管理的进化博弈模型并分析了其稳定点,有效地克服了传统博弈中双方完全理性的局限性,得出了飞行员和航空公司在不同成本之下的稳定的博弈策略。 2)通过Matlab软件进行模拟仿真,得出飞行员和航空公司之间的演化路径,从模拟结果可看出,将进化博弈应用在威胁与差错管理中,具有一定的可行性与适用性,为威胁与差错管理领域提供了研究思路。 3)通过模拟过程的条件假定及所得结果可知,要想达到航空公司与飞行员之间的纳什均衡,就应加大对飞行员不作为行为的处罚力度,合理增加航空公司培训成本,充分履行航空公司的监管职能,航空公司加大对飞行员的培训可有效削弱威胁,减少差错的发生,航空公司应以更大的力度组织人员学习,建立基于威胁与差错识别的培训,加强飞行员对威胁与差错的识别及应对能力。 [1]石 凯,魏思东,张克举,等.基于TEM的机组资源管理理论及其应用[J].价值工程,2012,19(3):19-21. [2]何 煦.空中交通管制运行中的威胁与差错管理分析[J].中国民航飞行学院学报,2008,19(5):15-19. [3]张晓全.基于CRM行为的飞行运行威胁与差错管理[C].Proceedings of 2008(Shenyang)International Colloquium on Safety Science and Technology,2008:360-363. [4]霍志勤,吕人力,史亚杰.民航运行中的威胁与差错管理[J].中国安全科学学报,2007,17(12):60-65. [5]霍志勤,韩松臣.跑道侵入的威胁与差错分析及控制研究[J].安全与环境学报,2012,12(4):192-196. [6]曹海峰,李 彤.空管威胁、差错与意外状态的贝叶斯模型分析研究[J].中国安全科学学报,2011,21(8):85-89. [7]International Civil Aviation Organization.Line Operations Safety Audit, D9803-AN/761[R].Montreal:International Civil Aviation Organization,2002. [8]ASHLEIGH Merritt,JAMES Klinect.Defensive Flying for Pilots:An Introduction to Threat and Error Management[R].Austin:The University of Texas Human Factors Research Project,The LOSA Collaborative,2006. [9]文 军.航空运输安全监管的博弈分析[J].中国安全科学学报,2008,18(3):83-87. [10]姚国庆.博弈论[M].天津:南开大学出版社,2003. [11]LINGARD H.The effect of first aid training on Australian construction workers’occupational health and safety motivation and risk control behavior[J].Journal of Safety Research,2002,3(2):209-230. (责任编辑:党亚茹) Analysis of evolutionary game theory between airlines and pilots based on TEM training YANG Hu,PAN Le-shu,YOU Yang For the inevitability of threat and error,evolutionary game model of threat and error management between airlines and pilots has been established by the method of evolutionary game theory.The evolution path is simulated by Matlab,and then the dynamic effect of different variables to threat and error management can be analyzed.Result of the research shows that if more training were provided to pilots,it could effectively weaken the threat and reduce mistakes.In the long-term supervision of threat and error,the airlines should adjust its internal mechanism,the training of threat and error's identification should be established,airlines should increase the intensity of punishments for the pilots'abstain from an act and increase training costs rationally. Besides,airlines should fully perform their function of administration;and greater efforts in pilots'study organization should be given in order to strengthen the pilots'identification and responsing capacity of threat and error.At the same time,the simulation result also confirms its feasibility and applicability,providing research ideas for threat and error management which is an emerging field. safety in flight;airlines;pilots;evolutionary gaming;threat and error management V323;X949 :A :1674-5590(2014)04-0027-04 2013-07-07; :2013-09-17 :中央高校基本科研业务费专项(3122013X001) 杨虎(1965—),男,四川成都人,特级飞行员,硕士,研究方向为通用航空.4 结语
(College of Safety Science&Engineering,CAUC,Tianjin 300300,China)