APP下载

基于Logistic方法的鸟撞对飞行安全的影响分析

2022-01-07吴春波张海洋

航空发动机 2021年6期
关键词:参数估计概率变量

吴春波 ,罗 刚 ,陈 伟 ,,张海洋

(1.南京航空航天大学能源与动力学院,南京 210016;2.辽宁省航空发动机冲击动力学重点实验室,沈阳 110015)

0 引言

鸟撞飞机或发动机极易导致飞行事故,不仅会造成巨大的经济损失,还严重威胁到旅客和空勤人员的生命安全[1]。

欧洲航空安全局(European Aviation Safety Agency,EASA)统计分析了1990~2007 年来自美国、加拿大和英国的大约11000 条鸟撞事件记录[2];澳洲交通安全局(Australian Transport Safety Bureau,ATSB)统计分析了2004~2013年14571条野生动物撞机事件,其中绝大部分为鸟撞事件[3]。EASA 和ATSB 通过统计发现运输类飞机的鸟撞率最高,鸟撞事件中大鸟的数量有所增加。美国联邦航空局(Federal Aviation Administration,FAA)曾统计了大量来自发动机生产商、国际民用航空组织(International Civil Aviation Organization,ICAO)和其他组织的发动机吸鸟数据,涉及大型涡扇发动机[4-5]、大型高涵道比涡轮发动机[6]和小进气面积发动机[7],整合成数据库并形成分析报告。

Dolbeer[8]采用简单负指数分布模型分析了1990~2004 年美国鸟撞事件发生的高度分布,表明在0.15~6.25 km,每升高0.3 km,鸟撞率大约减小32%;74%的鸟撞事件和66%的由于鸟撞引发实质性损伤的事件发生在0.15 km以下;Zalakevicius[9]分析了立陶宛1958~1978年以及1987~1991年的鸟撞数据,表明多数鸟撞事件发生在7 月,最易发生鸟撞的飞行阶段是进近着陆阶段;Steele[10]研究了1986~2000 年影响墨尔本机场鸟撞发生率的因素,发现鸟类数量和活动情况是相当重要的因素;秋季是机场鸟数目最多的季节,8~12 时是鸟撞发生率最高的时间段,鸟撞事件大多发生在低空。

中国的研究人员对鸟撞事故也开展了大量研究。20 世纪80 年代末,李其颖[11]分析了鸟撞与月份、当日时间、飞行状态(飞行阶段和高度)、撞击部位之间的关系,表明每年4、5、9、10 月是鸟撞高发期,白昼的事故数约占一天总事故数的70 %,鸟撞事故多发生在机场附近300 m 以下的低空,其中起飞和着陆阶段最多,飞机头部、座舱风挡、发动机、机翼前缘等位于飞机前部和凸起的部位最易与飞鸟相撞;陈成等[12]采用定点观测法对河北北部机场鸟类群落和鸟类活动规律进行了调查,发现不同月份机场场区鸟类的物种数、数量和活动频率存在显著性差异,7 月鸟类物种数量最多,10月鸟类数量和活动频率最高。

在对大量鸟撞事故进行统计、总结、研究、分析的基础上,欧美适航当局和中国民航局颁布了相应的适航规章,提出了抗鸟撞要求。此外,中国军用标准和航空标准也对飞机和发动机结构的防鸟撞设计提出了要求[13]。西方航空国家的经验证明,对鸟撞历史数据进行统计分析,掌握鸟撞中各类因素对飞行安全影响的规律,开发不同鸟撞因素影响下飞行安全程度的预估方法,在适航符合性设计阶段及航空器抗冲击初始工程设计阶段十分必要。如PW公司在发动机设计初期会积累海量发动机鸟撞数据,为设计人员提供鸟的尺寸、飞行状态等参数,保障了该公司建立完善、有效的设计闭环来保证发动机抗鸟撞的能力[14]。

本文基于FAA 数据库,采用Logistic 回归分析的方法,分析了鸟撞事件中13种因素对飞行的影响。

1 Logistic模型建立

1.1 数据描述

采用FAA 公开的1990~2015年飞机遭遇野生动物撞击的数据,包括飞机的型号、类别、质量等几十项信息,总计17 多万条记录。本文采用Logistic 回归分析了飞行高度、速度、飞机质量、发动机数量、撞击前飞行员是否被提醒、飞行阶段、云量、鸟数目、鸟的尺寸、昼夜情况、季节、是否有雾、降水物这13 种因素对飞行的影响,对飞行的影响分为终止起飞、发动机停车、预警性着陆和无影响4 种,排除数据中非鸟撞、有缺失的记录和对飞行影响无关的记录,最终得到44837 条记录。本文即针对这13 种影响因素和4 种对飞行产生的影响进行分析。

1.2 模型介绍

Logistic 回归适用于2 分类和多分类响应变量的回归分析,用于分析的自变量既可以是连续的,也可以是离散的[15]。陆莹等[16]运用2 分类Logistic 回归模型分析卫生服务供方可及性对农村居民健康状况的影响;常青青等[17]采用多分类无序逻辑回归模型研究了11 个变量对农村劳动力就业模式选择的影响;罗俊峰[18]采用无序多分类Logistic 模型研究人力资本对农民工职业选择的影响,发现影响农民工从事管理类、专业技术类等职业的因素。

通过Logistic 回归分析,可以得到自变量的回归系数。考虑包含n个独立变量的向量X⇀=(x1,x2,...,xn),设条件概率P(|y=1x)=p为在取值为x的情况下y发生的概率。则Logistic 回归模型的形式可表示为

式中:π(x)称为Logistic函数;g(x)=β0+∑xi βi。

在同样条件下,y不发生的概率为

定义y发生与不发生的概率之比为式(1)与式(2)的比值

这个比值称为发生比(odds)或优比。对发生比取对数即可得

这一转换称为logit 形式,也称对数发生比或y的logit。模型中的参数β可以按照线性回归系数那样进行解释。

在Logistic 回归的参数估计方法中,极大似然法最常用。假设有n个观测作为样本,观测值分别为y1,y2,...,yn,yi的取值为0 或1。在给定的自变量的条件下,yi取值为1 的概率记为pi,取值为0 的概率记为1 -pi,则得到第i个观测值(即yi取值为1)的概率为

因为各项观测相互独立,所以其联合概率分布可以表示为各边缘分布的乘积

式(6)称为n个观测的似然函数,将式(1)代入式(6),通过最大似然估计即可求得给定样本观测数据的参数估计,即β的值。

在响应变量是多分类的情况下,要引入多分类Logistic 回归的概念,多分类Logistic 回归依据响应变量是否有序,可分为有序多分类回归和无序多分类回归,本文采用无序多分类回归。

在无序多分类Logistic 回归中,假设有J个响应类别,x为解释变量,设πj=P(y=j|x),有∑πj=1。选择1 个响应水平为参考,可建立J-1 个logit 模型,有J-1组参数估计[19]

式中:j=1,...,J-1。

2 无序多分类Logistic回归分析

2.1 回归变量信息与分类变量

本文所分析的13 个回归变量信息见表1。在13个回归变量中除了飞行高度和速度为连续变量,其余11 个变量皆为离散变量。其中,需将离散的分类变量设置为虚拟变量,分类信息见表2。本文将响应变量“无影响”设置为参考组,进行无序多分类Logistic回归分析。

表1 回归变量信息

表2 分类变量信息

2.2 多重共线性诊断

在Logistic 回归中,要求变量之间相互独立,若变量相互之间存在一定程度的线性关系,则称之为存在多重共线性。对于解释变量X1,X2,...,Xn,如果存在

式中:ci不全为0,即某一变量可用其他变量线性组合表示,则称解释变量之间存在完全共线性。若存在

式中:ci不全为0;v为随机干扰干扰项,则称为近似共线性或交互相关[20]。

若变量间存在多重共线性,会增大参数估计值的均方误差和标准误,甚至会得到符号相反的回归系数,从而导致方程极不稳定,进而导致Logistic 回归模型拟合出现矛盾及不合理[21]。多重共线性的诊断方法有简单相关系数检验法、方差扩大因子法、特征值和病态指数法等多种。本文采用方差扩大因子法进行多重共线性诊断。方差扩大因子(Variance Inflation Factor,VIF)计算式为

式中:V为方差扩大因子,Ri为以自变量Xi为因变量时,对其它自变量进行回归的复相关系数。

一般认为,当0<V<10时,自变量不存在多重共线性;当10≤V<100 时,存在较强的多重共线性;当V≥100,存在严重多重共线性,此时可采用主成分分析法来改善Logistic回归[22]。

本文应用SAS 软件计算得到的方差扩大因子见表3。从表中可见,回归变量间并无明显的共线性关系。

表3 共线性诊断

2.3 参数估计

本文借助SAS 软件对参数进行最大似然估计。由于本文将响应变量“无影响”设置为参考组,分析得到的响应变量为“中止起飞”、“发动机停车”、“预警性着陆”相对于参考组的参数估计见表4~6。表中已删去P>0.05的变量,下面对表中的结果进行简要分析。

表4 参数估计(中止起飞)

产生“中止起飞”影响时的参数估计见表4。从表中可见,变量C2、C3及B2的系数较大,说明当遭遇的鸟的数量达到100 只及以上、鸟的尺寸为“大”时产生“中断起飞”影响的概率分别为无影响的27.88 和8.603倍。

产生“发动机停车”影响时的参数估计见表5。从表中可见,变量E3、C2、B1和B2的系数较大,说明当飞机为4 发时、遭遇的鸟的数量为2~100 只、鸟的尺寸为“大”时,产生“发动机关闭”影响的概率分别为无影响的9.285、15.394和27.796倍。

表5 参数估计(发动机停车)

产生“预警性着陆”影响时的参数估计见表6。从表中可见,变量C2、C3和B2的系数较大,说明当遭遇的鸟的数量达到100 只及以上、鸟的尺寸为“大”时产生“预警性着陆”影响的概率分别为无影响的10.694和6.779倍。

表6 参数估计(预警性着陆)

总得来说,表4~6 中鸟的数量及大小相关的变量都是显著的(P<0.05)。从表4 中可见,变量C3的优比为27.880,即当飞机遭遇100 只及以上的鸟时,飞机更倾向于中止起飞;从表5 中可见,变量B2的优比为27.796,说明当遭遇的鸟的尺寸为“Large”时,发动机停车的概率相当大。根据上述分析可知,鸟的数量及大小显著影响着飞行。

此外,从表4~6 中还可见,飞行高度(ALTITUDE)、速度(SPEED)和飞机质量(MASS)对于中止起飞和预警性着陆是显著的。表4、5 中变量E3分别为3.190 和9.285,说明发动机是否为4 发对于中止起飞和发动机停车有显著影响。相比而言,当发动机为4 发时,飞机更倾向于发动机停车。是否为夏季对中止起飞和预警性着陆显著。表4和表6中变量S2皆小于1,相较中止起飞和预警性着陆而言,在夏季飞机遭遇鸟撞后,对飞行无影响的概率略高。在飞行阶段、日中时间对于发动机停车和预警性着陆有显著影响,当飞机处于进近、着陆下降阶段时,显然不会产生预警性着陆和中止起飞的影响,故变量P1优比近似为零;当飞机处于巡航阶段,P2优比很小,说明在巡航阶段对飞机产生无影响的概率更高。表5中变量D2=2.08,说明在清晨或黄昏时,飞机发动机停车概率更高;表6 中变量D1=1.174,说明晚上飞机更倾向于预警性着陆。表6 中变量Pw为1.203,说明当飞行员被警告,飞机预警性着陆的概率更高。

变量Psk、Pf和Ppr属于天气因素,其中Pf和Ppr在表4~6 中皆不显著;在表5 中Psk=0.799,说明天空有云时飞机遭遇鸟撞产生无影响的概率稍高。

2.4 分析结果对适航设计与飞行管理的意义

第2.3 节分析了与鸟撞有关的13 个因素对飞行状态与飞行安全的影响,上述分析结果对适航符合性设计及飞行管理具有较大的指导意义。分析可得,在发生鸟撞时,鸟的大小和数量显著影响着飞行安全。因此,一方面,在飞行器或发动机设计初始阶段开展适航符合性设计时,必须针对不同质量和不同数量的鸟对飞行器的撞击及其影响开展相应的分析、研究和评估,设计提升飞行器或发动机的抗鸟撞能力;另一方面,对于飞行管理部门而言,必须采取措施降低机场及周边特定质量或特定生活习性如集群鸟类的威胁,如改变机场周边生境、采取有效的驱鸟措施等。在发动机数量方面,4 发飞机遭遇鸟撞时中止起飞和发动机停车的概率较高,这会对飞行安全及机场运行秩序造成严重影响,因此4 发飞机及其发动机在设计时必须全面考虑抗鸟撞能力;此外,航空公司和机场在运营4 发重型机时,要特别考虑起飞、爬升、进近、着陆阶段的驱鸟防鸟措施。在飞行员受警告方面,必须掌握提前预警技术,以尽可能提早为飞行员的判断提供协助。

3 结论

(1)鸟的数量和大小显著影响着飞行;

(2)飞机是否有4 台发动机对于中止起飞和发动机停车有显著影响,当飞机为4 发时更倾向于发动机停车;

(3)在夏季,中止起飞和预警性着陆的概率分别为无影响的0.702和0.762倍;

(4)在巡航阶段,发动机停车和预警性着陆的概率分别为无影响的0.090和0.667倍;

(5)在清晨或黄昏时,发动机停车的概率为无影响的2.08倍,晚上飞机预警性着陆的概率为无影响的1.174倍;

(6)当飞行员被警告,飞机预警性着陆的概率为无影响的1.203倍;

(7)天气因素(包括是否有云、降水和雾)对飞行影响不大。

猜你喜欢

参数估计概率变量
基于参数组合估计的多元控制图的优化研究
概率与统计(1)
概率与统计(2)
基于部分相关的LFM脉冲全参数估计
浅谈死亡力函数的非参数估计方法
浅谈死亡力函数的非参数估计方法
统计推断的研究
概率与统计解答题集锦
分离变量法:常见的通性通法
不可忽视变量的离散与连续