航班运行风险动态传播建模与分析
2022-09-29赵宁宁林典毅
赵宁宁,林典毅
(中国民航大学空中交通管理学院,天津 300300)
引言
随着航班量的不断增加,许多飞行中出现的各种飞行的安全性问题也越来越突出。“安全”这两个字始终是航空工业的一个重要先决条件。国外对于航班运行风险的研究起步较早也较为完善,早期,外国学者对于民航运行风险采取定性和定量风险评估方法。Janick等[1]对民航危险与安全性进行了评价,并对其成因进行了详细的阐述,并对其进行了定量分析。Lee等[2]采用综合模糊语言标度的方式,建立了一个量化的飞机安全性因子评价模型。Shyur等[3]利用事故和安全指标的数据来量化人为失误造成的航空风险。研究并证明了将基线风险函数视为二次样条函数的特定比例风险模型在航空风险评估中的适用性。使用该模型可以调查航空安全因素的非线性影响,并灵活评估航空风险。结果表明,该模型是一种更具前景的方法,有可能在实践中变得非常有用,并进一步推广航空风险分析。Skorupski[4]将模糊风险矩阵带入到航空运行风险因素评估当中,将事故发生的可能性以及后果用模糊理论来表示,对飞行事故进行了分析。
在对于航班运行风险评估与控制领域虽然我国起步较晚,但也紧跟外国专家的脚步,实现了稳步发展。孙瑞山等[5]分析了民航安全的特性,提出了“人、机、环境”系统工程思想,将其运用于民航安全评估的理论和实践中,并将评估方法带到航空公司安全评估实例中。王岩韬[6]运用事故树分析法和基元分析法分析和评价签派放行评估体系中气象、航路、机场、飞机、机组等潜在风险,然后运用模糊隶属函数和风险关系矩阵计算,建立了一套实用安全的运行风险评估体系。谷润平[7]首次将PCA(主成分分析法)和CA(聚类分析法)结合运用到航班运行风险因素评估当中。此方法可以快速、精准的划分航班运行风险等级,并将风险指标降维,以主成分为变量对各类航班的风险特征进行分析,制定风险缓解措施。王岩韬等[8]首次将一种复杂网络有向加权模型带入航班运行风险因素评估当中,并结合人类社会系统传染病模型,分析元素状态演化以及航班运行风险的动态传播特性,采取多参数控制的方式,找出影响航班安全运行的关键风险因素,抑制风险传播,提出控制风险传播的方案。
之前学者多数采用机器学习算法进行风险指标的筛选与降维,机器学习算法可以实现数据可视化,降低数据的复杂程度。但是例如主成分分析法等线性降维方法,容易在特征提取的过程中将不相关的两个因素进行特征拟合得到一个新特征,从而可能舍去比较重要的因素指标。随机森林算法是以决策树为基学习的集成学习算法,由于采用了集成算法,因此本身精度高[9-10],可以解决特征过拟合问题。且很多学者[11-14]也实证了随机森林算法对指标降维的可行性,例如乔宇颖利用随机森林算法对微生物指标的筛选,确定和预测了表征土壤健康的最优微生物评价指标。伍明称[12]利用随机森林算法对于肺结节病差异基因的筛选,筛选出了有意义的肺结节病差异基因等。
研究将根据华北区域统计的航班运行风险因素,通过随机森林算法及结合民航局咨询通告AC-121-FS-2015-125中附件2:航班运行风险因素分析,实现风险指标降维,然后构建有向加权航班运行风险网络模型,分析不同的受控结点的安全风险传播参数,通过与人类社会系统中传染病的模型进行对比,构建改进SIR模型,分析航班运行风险动态传播的特性,构建风险传播的动力学模型,通过控制关键节点的方法,统计感染峰值、感染周期等数据的变化情况,研究出不同情况下航班运行风险的影响规模、传播速度、控制效果的特点和规律,并提出控制风险传播的方案。
1 航班运行风险复杂网络构建
1.1 航班运行风险数据收集
通过收集分析华北区域航班运行数据,可以将航班运行所涉及的各个因素系统地分为六大类:维修相关风险,航空器相关风险,机场相关风险,飞行员相关风险,管制指挥风险,航班风险。一共包括96个风险项和一个总运行状态。数据已对航班运行225天各项风险指标进行评分。风险值9表示已出现不安全事件;8~9表示当天虽未发生不安全事件,但有明显运行差错;5~8表示运行限制较多,运行单位安全运行压力较大;2~5表示运行压力较小;1表示无明显运行安全影响[14]。各项数据具体数值如表1所示,因篇幅问题仅展示部分数据。
表1 华北区域航班运行风险数据
1.2 航班运行风险数据降维
根据随机森林算法,得出各节点的重要度排序如表2所示。
表2 各风险节点重要度
鉴于中国民航局咨询通告《航空承运人运行控制风险管控系统实施指南》在2015年颁布实施以来,已在多家航空公司实践多年证实有效,且其风险要素终端因素可与运行数据一一对应。如运行数据中目的地机场设备设施条件节点,起飞机场设备设施条件节点,航路备降机场设备设施条件节点可对应终端因素机场设备设施条件;机组疲劳程度节点,机组压力程度节点,机组飞行时间节点,机组执勤时间节点可对应终端因素短暂性疲劳和累积性疲劳;绕飞等操纵节点,指挥撤离节点,起飞节点可对应终端因素机组成员技术水平和机长飞行经验以及其余机组人员飞行经验;签署整机接收节点,绕机外观检查节点,飞机系统检查节点和机务人员经验能力节点可对应终端因素飞行检查。通过对各节点和各终端因子进行逐一的匹配和过滤,最后得到了32个结点,见表3。结果表明:1~13个结点为“人”风险因素,14~26个结点为“环”风险因素,27~32个结点为“机”风险因素。
表3 风险网络节点
以节点11为例,特殊旅客一般包括重要旅客,老弱病残,犯人及犯罪嫌疑人等。因为特殊旅客的一些个人原因或言论就会使得航班出现风险。根据民航不安全事件记录就曾有一犯人谎称飞机上有炸弹,随后飞机紧急返航。因此,机上有特殊旅客是一个潜在风险。再以节点16航路上天气为例,天气瞬息万变,飞机在飞行途中可能遭遇各种危险天气,例如晴空颠簸,雷暴等,这些都是航班运行的潜在风险。
1.3 构建航班运行风险无向网络与有向网络
根据2009年至今以来的民航不安全事件记载,统计各类不安全事件,事故征候以及各类工作差错,当事件记载有表明两个节点间存在关系时将两个节点进行连线,例如有“...因机场临时受限,导致飞机无法降落在空中盘旋等待,使得机组成员疲劳程度加重”,此时可以认为节点24与节点9和节点10有关系,将节点14分别与节点9和节点10连线。再比如“...因发现有超高障碍物,申请修改航线...”,可认为节点21与节点13和节点14有关系,将节点21与节点13和节点14分别连线。在没有任何记录的情况下,两个结点不连接。完成连线后,发现节点28至节点32与其它节点不存在关联,且被隔离于该网络。通过参考数据和数据的分析,目前的运营条例将28号和29号作为最基础的起飞条件,即航空器都需满足这两项要求才允许被投入使用,因此这两个节点失去了成为潜在风险的资格,不考虑在复杂网络之内。而节点30,31和32,都属于航空器自身属性,例如机龄,飞机机龄一般在25~30年,如果机龄不符合要求则不会投入运行使用,再如节点31,如果飞机性能有问题也不会被投入到航班运行当中,因此予以清除。由此,构建无向网络如图1所示。
由于在实际的运行中,各风险因素之间并不是简单的关联,而是具有传播方向,所以需要在无向网络上加上箭头以弄清节点间的因果关系,认为节点21对节点13和节点14产生影响,所以应该在连线上加上由节点21指向节点13和节点14的箭头。经过相关人员及专家探讨评定,设定权重规定如表4所示,根据影响次数,定义网络权值,建立有向加权网络,如图2所示。
表4 权重设置规定
1.4 参数分析
1.4.1 度值及度分布值(Degree value)
度分布是指在一个特定的度值处,所处的结点在整个网络中所占据的比例,用以表示该网络中各个度值的分配状况。
假定某个网络在具有N个节点且具有度值为a的节点F个时,其度分布P的表达式为:
1.4.2 聚合系数(Clustering coefficient)
聚合系数是一个具有局部特色的网路特性,它能反映邻近两个人的交际圈的交集,也就是这个结社中的好友。假定一个节点具有k条边,那么由k条边所相连的节点(k)的条数最大为k(k-1)/2,由已有的边数除以最多的边数所获得的分值作为该节点的聚合系数。如果Z条边真实存在,那么这个节点聚合系数的表达式为:
1.4.3 介数(Betweenness)
介数是反映整个复杂网路整体的一个关键参量。在一种有向权重的网络内,如果任何两个节点(假定是节点x和y)的最小的路径的权值被计算成A,并且通过该两个节点的最短的通道i的通路权重用C表示,两个参量之比被确定为该节点i的一个介数,其表达式为:
通过对各节点的总度值、入度值、出度值、聚合系数和介数进行了运算,得出结果输出如表4所示。根据总度值排序,前五节点分别为9,10,3,14,20;根据出度值排序,前五节点分别为16,10,14,20,9;根据入度值进行排序,前五节点分别为9,10,3,7,、5;根据聚合系数排序,前五节点分别为1,2,6,8,15;根据介数排序,前五节点分别为10,9,16,13,23。
2 航班运行风险传播动力学模型
2.1 航班运行风险传播分析
查阅有关资料并与相关人员及专家讨论,经过对节点的分析,节点14~27是影响航班起飞后的飞行安全的主要危险因素,节点1~13在航班起飞之前很有可能会对飞行的安全性造成一定的威胁,所以将节点1~13按顺序设定为第一个被感染的节点。设定无人为干扰时,传染率β为0.5,复原率γ为0.2。按顺序将节点1~13设定为起始感染点,每个节点进行100次仿真传播,共进行1300次仿真传播。传播后总结发现,虽然每次初始感染节点都不相同,但是每个阶段的传播趋势和结果都是一样的。随着病毒的扩散,S(易感人群)节点降低,R(治愈者)节点升高,I(受感染者)节点则先升高,后下降,最后达到了一个平稳的水平。将1300次的统计数据的平均化,如表5及图3所示,可见I(受感染者)节点的高峰为13.69。
表5 对节点控制前后风险传播结果
参照中国民用航空局2011年采取六大措施进一步推进持续安全战略,措施包括严把专业技术人员资质能力关,大力抓好机长的资质管理和能力建设,强化驾驶舱的管理提升机组间的配合协作,严格执行绕机检查标准操作,严格执行交叉程序检查以及要求机场要认真贯彻《民用机场管理条例》,对复杂机场的试飞严格训练增加驾驶员熟悉程度,推进机场安全管理体系(SMS)建设,做好防机坪设施设备与航空器刮碰工作。根据以上措施,可以将节点4,5,3,20和22定义为控制节点,即“机组成员技术水平”、“机长飞行经验”、“机组人员协作能力”、“起飞步骤的复杂性”、“机场设备和设施状况”。将控制节点感染率β’设置为0.1,恢复率γ’设为0.9,即派遣经验丰富的机组,且合作多次并且表现良好;加强对相关检查技术人员的资质排查,提高其安全意识和专业技能;全面开展运行质量安全管理体系建设,完善设备运行保障机制。仿真后取平均值,感染峰值下降为约8.89个,下降率35.4%。模拟后的平均数据如表5所示,显示了在这些节点经过人为的有效管理后,风险的传播受到了很大的阻碍。实际上,正是中国民航重点监控了飞机的工作,减少了飞机的安全隐患,这也使得在东航飞机坠毁前,中国的飞机已连续安全飞行131个月,9540万个小时,并保持了19年的空中安保纪录。从运输航空每百万飞行小时重大事故率五年滚动值来看,世界平均水平为0.088,而中国民航为0,这表明中国民航安全水平现在位居世界第一,也体现了中国民航的控制措施对于航班安全运行的重要性。
2.2 有向加权网络航班运行风险控制分析
根据计算所得的有向加权网络参数,依次选取总度值,出度值,入度值,聚合系数和介数各参数排名较为靠前的五个节点进行控制。结果如表6和图4所示。
表6 按不同参数控制节点后的风险传播结果
按总度值进行控制。排名前5节点依次为节点9,10,3,14,20,即短暂性疲劳,累积性疲劳,机组人员协作能力,临时更改航线,起飞步骤的复杂性。对五个节点进行控制后,感染峰值下降为7.18,下降率为49.3%。
按出度值进行控制。排名前五节点依次为节点16,10,14,20,9,即航线上天气,累积性疲劳,临时更改航线,起飞步骤的复杂性,短暂性疲劳。对五个节点进行控制后,感染峰值下降为8.49,下降率为38.3%。
按入度值进行控制。排名前五节点依次为节点9,10,3,7,5.即短暂性疲劳,累积性疲劳,机组人员协作能力,其余人员飞行经验,机长飞行经验。对五个节点进行控制后,感染峰值下降为9.21,下降率为33.7%。
按介数进行控制。排名前五节点依次为节点10,9,16,13,23,即累积性疲劳,短暂性疲劳,航线上天气,起飞前更改航线,跑道坡度和长度。对五个节点进行控制后,感染峰值下降为7.88,下降率42.4%。
按聚合系数进行控制。排名前五节点依次为节点1,2,6,8,15,即机组技术级别搭配,机组人员英语水平,机长对航线的熟悉程度,其余人员对机场的熟悉程度,无线电通话水平。对五个节点进行控制后,感染峰值下降为11.87,下降率仅为13.2%。很明显,根据聚合系数对节点进行控制效果较差。分析得知,在航空活动中机长对航空器和旅客的安全负有直接的也是最终的责任,机长在飞行中拥有最高的法律地位和至高无上的权力,因此其余人员对机场的熟悉程度和英语水平等因素并不是保证航班安全运行的关键因素。
由以上可以得知,在控制五个节点时,按总度值进行控制效果最好。在控制五个节点的基础上,再根据总度值的排名增加一个控制节点,排名第六为节点7(其余人员飞行经验),将其也当成控制节点后,感染峰值下降为7.05,下降率48.5%。如果再按总度值排名继续增加控制节点,那么感染峰值依然还会继续降低,下降率会持续升高。此规律对照于其他参数所控制的节点也依然有用,随着控制节点的增多,感染峰值会一直降低,风险再网络上传播的抑制效果会逐步显著。但是控制关键节点也需要考虑实际情况,在有限的飞行时间中,控制的节点数量增加,工作量将会增加。在该传播网络中,总度值是有效的控制参数。
按总度值的控制效果比中国民用航空局2011年采取六大措施进一步推进持续安全战略更好。二者区别在于不控制节点4.,5,22,变更为控制节点9,10,14。即优先控制机组人员的疲劳性和控制临时更改航线。分析网络参数数据,除了在聚合系数的排名前五节点没有节点9和节点10,在其他四个网络参数排名前五的节点中,都有节点9和10,体现出了节点9和节点10在这个网络中的关键性。经对数据进行统计,结果显示:短暂性疲劳和累积性疲劳两个因素的总度值均为39,在网络中排名首位,且由于出度值和入度值也很高,显示出较高的受传染及扩散能力;两个因素的大多数权重分别为0.75和1,表现出疲劳对于机组人员的普遍性。至于节点14临时更改航路,虽然在航空事故记录中的频率并不高,但其出度值和入度值在整个网络上都很高,这就表明了其作用的广泛,在整个网络上都有很大的作用。根据资料显示,2020年八月份一个月,受雷雨,台风等天气影响,共有7329班航班出港延误,277班航班返航备降;2021年八月份,受南京疫情及其扩散影响,民航生产规模下降幅度较大,呈现客货双降的态势,但即便如此,八月份一整个月依然有479班航班返航备降。另外,如果中途改变航路,还会增加燃料的消耗,以及可用机位等问题,这些都是非常复杂的问题,很有可能会引发相应的危险,从而造成一定的后果。
而对于节点4(机组人员技术水平)和节点5(机长飞行经验),虽然这两个节点的总度值较高,但是其出度值仅为9和7,表现出了较低的传染性,且统计民航不安全事件数据发现其频次较低,对外传播性不强。通过分析资料发现,这是由于中国民用航空公司对于人员的要求一向很高,甚至被人视为非常的保守。不管是规则,还是流程,中国的航空公司,都比国际上的航空公司要严格得多。其这种严格的态度同样可以作用到节点22(机场设备和设施状况)上,正是中国民航对于这些基础问题的重视,才使得这三个节点的边权值低于节点9,10,14。
为了避免感染率β和 恢复γ的单一性对仿真结果产生影响,通过设置不同的值后重新进行仿真实验,发现传播规律保持不变,与上述所得结论一致。通过结合实际情况,近年来飞行机组疲劳是一种隐患,是可能导致航空事故或事故征候的一个重要因素,不论是短暂性疲劳或累积性疲劳。新闻也曾报道,执飞航班早出晚归,甚至昼夜颠倒,无法保证充足睡眠,最后导致疲劳驾驶,是民航飞行员普遍面临的职业困扰,长期疲劳不仅威胁航班运行安全,也会对飞行员身心健康造成严重危害。
2.3 风险传播抑制方案
虽然节点9,10,3,14,20都表现出了较强的传播性,但幸运的是可以根据现行的航班运行与管理政策,提出一些措施来缓解这些航班运行中可能产生风险的因素,表7为控制节点及一些具体措施。
表7 风险缓解措施
3 结论
根据华北区域航班运行数据和民航不安全事件记录,构建一种有向加权航班运行风险网络模型;参照人类社会系统中传染病模型,构建改进SIR模型。综合中国民航安全管理方案和网络参数计算两种控制方法,经过仿真实验得到:
通过在SIR模型中加入改进感染率和改进恢复率,可有效模拟出当部分节点被控制时下风险的传播情况。参照中国民航安全管理经验,将机组成员技术水平,机长飞行经验,机组人员协作能力,起飞步骤的复杂性,机场设备和设施状况五个节点进行控制,风险的传播得到抑制,感染峰值下降35.4%。当以加权网络中参数“总度值”为指标,选取总度值排名前五节点进行控制,感染峰值下降率为49.3%。其中,控制短暂性疲劳,累积性疲劳,机组人员协作能力,临时更改航线,起飞步骤的复杂性,可有效抑制航班运行风险的传播。为了保证仿真所得结论的科学性与准确性,特定的值可以改变,包括感染率,恢复率等。对不同的数值进行了多次的检验,所得到的结果一致。