面向维修差错的民航不安全事件风险分析
2018-09-06张明洁王华伟于思璇
张明洁,王华伟,付 强,于思璇
(南京航空航天大学 民航学院,江苏 南京 211106)
机务维修是民航运行中的重要组成部分,也是直接保持飞机可靠性水平、保障飞机运行安全的重要手段。在民航领域,人为因素导致的事故比率已经上升到总体事故比例的70%左右[1-2]。依据民航局不安全事件统计报告,按原因统计2010—2015年间中国民用航空事故征候,分析事故征候中机务因素所占比例,具体如图1所示,可以看出机务因素所占比例波动较大,并有上升的趋势。如果继续保持这种态势,将会对民航安全产生较大压力。
图1 事故征候中机务因素所占比例
机务维修工作受到保障航空器准点运行和航空公司降低维修成本等诸多因素影响,已经成为人为因素的重要组成部分。所以有必要对机务人为因素转化为人为差错而造成的不安全事件进行风险分析,从而得到相应影响因素[3-4]。
民航业中由于人因数据缺乏以及存在潜在风险的原因,早前通常展开以操纵员经验和专家判断为基础的人的失误概率的统计分析和预测方法[5-6],对人为因素的调查广泛使用基于专家判断的方法,缺乏充分的数据支撑研究内容[7]。ZHOU等[8]构建了一个灰色关联模型来分析民航不安全事件的各种诱发因素;倪晓梅等[9]对不平衡数据下的民航不安全事件进行分析,利用SMOTE和随机向下抽样的方法平衡民航数据,通过主成分分析方法分析引起不安全事件的主要因素。
笔者所采集数据为2011—2015年按因素统计的不安全事件,数据量偏小,故引入Bootstrap方法扩充样本量。Bootstrap通过数字仿真技术扩大样本量,该方法完全依赖于样品本身的数据,不需要任何主观假设,因此具有良好的稳健性,工程上也易于实现;与其他数字仿真方法相比,该方法模拟方差较小,适合分析小样本问题[10]。笔者通过Bootstrap方法扩充数据,利用多元线性回归分析出影响程度最高的事件类型,更加直观地呈现机务维修薄弱环节。
1 航空维修差错分析
航空维修人员是维修航空器的具体实施者。航空维修系统中的人为差错是指由于维修过程中诸多内外部因素的相互影响,引发维修人员的行为表现违背系统任务预先制定的目标和规程,从而导致航空器及其部件损害或者人员伤亡的情况。从系统角度来看,航空维修差错违背了航空器及其部件的运行规律和特性,破坏了人机环系统的整体协调性[11]。航空维修人为因素主要有6种表现形式,如图2所示,其中人为差错主要分为人员未发现故障和人员导致故障两大类。
图2 航空维修人为因素表现形式
风险有各种不同的定义。如风险可以被定义为在特定的时期内危险事件发生的概率;或被视为个人或团体被一些特定行为以更多或更少的随机方式被削弱的可能性;抑或可以被认为是统计上的损失期望值(即一个随机暴露的个体被一些危险事件影响的统计概率)。在存在危险事件的情况下,风险还包括危险事件负面影响的严重程度[12]。
简单来说,航空风险是在航空领域中可能发生的危险事件,通常表现为事故、事故征候或不安全事件。维修差错可看作是危险/威胁,最终导致上述事故的发生,这种情况下风险已经表现为具体危险事件,会产生违背任务目标的不良后果。
2 航空维修不安全事件率计算
2.1 机务维修差错引发不安全事件类型分析
笔者一共采集了2011—2015年的数据,在中国民航安全信息报告中摘取不安全事件中机务因素导致的不同类型的事件数,如表1所示。每年的运输量依次为:597.97、660.32、731.54、793.31、856.55万架次,通过计算事件数与运输量的比值,可以得出每年对应的由机务因素引发的不安全事件概率,称为事件率。
在不同的时间或者空间,事件类型不完全相同,人为因素转化为差错的过程呈现出随机性,即某个事件的形成与其他事件以及下一年发生的概率不相关。故可将5年数据平均化,分析每个事件占总体运输的比例和严重程度的综合指标。结合民航安全信息报告中事件严重程度分级与事件实际情况,划分事件严重等级为:较小(-1)、中等(-2)、严重(-5)、非常严重(-10)、毁灭性(-100),各事件对应分级见表1。按上述频率和严重程度等级做出风险水平二维图,如图3所示。
表1 机务因素导致的不同类型的事件数
从图3可看出,当事件处于A区时,表明发生频率较高,但严重程度不高,此类事件发生的数量较多,一般对安全水平影响不大,如航空器碰撞障碍物。当事件处于B区时,表明事件不但发生数量多,而且一旦发生就属于性质较为严重的事件,如客舱失压。针对此类事件,应该采取有效措施绝对杜绝事件的再次发生。当事件处于C区时,表明此类事件发生数量不多,但单起事件都较为严重,如空中解体/爆炸/失火/冒烟。因此应综合分析国内外历史上此类事件发生的规律,在事故发生之前能够进行预警,寻求降低事故发生频率的措施,进而起到降低安全风险的目的[13]。
2.2 基于Bootstrap方法的机务维修差错数据处理
2.2.1 Bootstrap方法
图3 风险水平图
Bootstrap是统计学中的基于Monte Carlo模拟的方法,是在试验样本的基础上,利用计算机生成的自助样本来估计未知分布的某种统计量的统计特性,由此在原有数据基础上生成新的数据。在总体F分布未知的情况下,通常采用非参数Bootstrap方法对总体F进行统计推断。假设数据样本F的容量为n,对这一样本按放回抽样的方法抽取一个容量为n的样本,这种样本称为Bootstrap样本或自助样本。相继独立地从原始样本中取很多个Bootstrap样本,利用这些样本对总体F进行统计推断,称为非参数Bootstrap方法或者自助法。其数学描述如下:
(1)
综上,Bootstrap方法可以自原始样本按放回抽样的方法扩充样本量,通过输入样本,返回Bootstrap索引的n个引导矩阵bootsam。bootsam中的每一列都包含从原始数据集中绘制的值的索引,以构成相应的引导样本[14]。
2.2.2 航空维修差错诱发不安全事件计算
将原始数据进行线性回归分析,事件类型作为自变量,事件率作为因变量,实验结果显示系统自动剔除部分因素,标准系数基本全部为0,处理不精确。数据量不足导致回归性分析不能将所有自变量与因变量的关系表现出来,因此,需要扩充数据量,精确表现出内部关系。
将5年由机务原因导致的不安全事件数及事件率作为输入样本x1,x2,…,x13,扩充到1 000组索引样本,经过假设性检验及剔除异常值,筛选出15组数据,如表2所示。为了更加直观地分析各事件与最终事件率的关系,将原始数据与扩充数据结合起来进行线性回归拟合分析,建立的多元线性回归模型为:
y=b0+b1x1+b2x2+…+bnxn+ε
(2)
其中,ε~N(0,σ2),将冰击、航空器撞障碍物等12种事件类型作为自变量X,事件率作为因变量Y,利用最大似然估计法估计参数,则系数(b0,b1,…,b12)T的最大似然估计矩阵为:
(3)
由上述计算过程得到的回归结果如表3所示,可以看出在12种事件类型中,按系数大小排列得出影响较大的事件类型为:冰击,航空器撞障碍物,维护、维修,客舱失压,地面撞障碍物,航空器牵引,这6种事件类型对事件率影响程度相对较高。回归残差图和回归残差标准p-p图分别如图4和图5所示。
表2 扩充数据
表3 回归分析处理结果
图4 回归残差图
图5 回归残差标准p-p图
结合表3和图4、图5的回归残差,可发现处理数据基本符合正态分布,期望拟合趋势良好,得出的误差处于合理范围内,说明对数据的处理准确,可以由各事件标准系数对影响不安全事件率的程度进行排序,不需要额外采用其他回归分析方式进行验证。
3 降低维修差错诱发事故的对策分析
由上述分析结果,排列出影响程度较高的事件类型。每个类型的出现及频率本身呈现出随机过程,但是又与维修人为因素的综合作用和安全管理措施相关。就最近5年来讲,在此阶段的安全政策条件下,不安全事件的发生,反映出此阶段的安全管理水平与薄弱环节。经分析数据得到相应结果后,可为下一个阶段的安全管理内容提出侧重点和具体的应对措施。
表4所示为6种相对影响程度较高的事件类型的人为影响因素映射网络,主要列举了影响事件发生的因素来源,针对这些因素,结合具体事件类型,找出出现频率较高即影响程度最高的因素。
表4 人为因素映射关系
(1)冰击。其是指当飞机机翼表面存在非环境性结冰或者燃油吸冷结霜时,从湿热的机场飞到很冷的机场的过程中机翼上表面所结冰层在空中脱落,脱落冰片击中飞机平衡尾翼前缘所造成的损伤。除冰过程要求严格,涉及到人员的操作、环境(结冰条件)、操作完善程度及操作过程。机务人员在专业知识技能足够的条件下,加强对机翼上、下表面的检查,及时清除机翼上、下表面的冰、雪、霜,以避免冰击事件发生。
(2)航空器撞障碍物。在维修过程中,使用的工具或其他设备,如梯架、扳手等,与航空器发生剐蹭或碰撞,对航空器造成损害,从而引发不安全事件。机务人员在进行维修任务过程中,必须要有安全意识和应急能力,严格执行“工具三清点”制度,包括对讲机、毛巾等。具体内容包括:①确认现场使用的工具没有遗留在航空器上或附近地面;②不得将工具、毛巾、手套等放置于动力装置、起落架、起落架轮舱、操纵系统等区域(防护垫、防护套、舵面夹等防护工具除外);③工具用完放回工具箱/盒或指定区域;④采取必要措施,保护飞机设备、航材、工具不受损坏;⑤将航材、工具有序摆放;⑥维修人员在维修工作结束后应擦拭清洁工具/设备及梯架,并恢复初始状态(如千斤顶顶杆复位等);⑦确认工具设备齐全并归还,相关航材退库,设备梯架归位。
(3)维护、维修。机务人员执行维护、维修任务造成飞机出现故障/缺陷,从而导致飞机零部件损坏,以及未检测出航空零部件缺陷或故障,危及飞行安全。维修工作需要注意以下几点:①维修工作必须在合理的生产计划下进行,维修过程中要保持维修现场清洁,完工后必须对相关工作区域和工具设备进行清洁整理;②拆换部件前现场核对件号和序号,检查部件的外观是否正常无损伤;③当维修工作临时中断离开时,必须有人留在现场进行监护; ④维修人员在工作中必须遵守维修手册以及相关的安全规定,保障人身安全;⑤在下雨等恶劣的气候条件下,维修人员应当及时关闭各舱门和活动窗,检查和清理机内积水,避免雨水进入驾驶舱和电子舱损坏设备;⑥绕机检查飞机时要关注飞机轮舱、减震支柱、发动机罩等易脏部位,发现有油液、污泥等赃物附着,应立即清除干净,确保各外部标牌标示清晰可见。
(4)客舱失压。由维修不当、失误造成航空器密封系统、空调设备故障或玻璃、机体受损等致使客舱内气压降低直至等于客舱外气压并持续的过程。除去航空器本身可靠性的因素,造成客舱失压的主要原因是人为因素,与维修相关的因素主要是人员本身的操作规范。与“维护、维修”因素相似,维修人员在工作中必须遵守维修手册、流程等相关的安全规定,确保操作正确。
(5)地面撞障碍物。位于供航空器地面活动的地区或突出于作为保护飞行中航空器的规定面的、一切固定的(临时或永久的)和可动的物体,或这些物体的一部分与航空器发生碰撞,如车辆与机翼剐蹭。维修保障车辆必须按照指定位置停放,与飞机的距离不得小于5 m的安全距离。
(6)航空器牵引。跟随牵引车的维修人员在指挥牵引车驾驶员开动牵引车或停车的过程中与其他航空器或物体发生剐蹭,造成航空器部件损坏,引发不安全事件。航空器牵引需注意以下几点:①牵引前应做好相关准备工作,襟翼在收上位,发动机风扇整流罩和反推整流罩已放下锁好, 起落架地面安全销已安装到位, 根据要求安装前起落架转弯销(前起落架转弯销应使用专用件),或脱开防扭臂;②检查并确保航空器机轮压力和减震柱压缩量正常;③牵引人员与牵引车司机沟通正常,白天拖飞机确认防撞灯和航行灯点亮,夜间拖飞机确认航行灯、防撞灯和大翼灯点亮;④确保飞机旁无地面障碍物;⑤牵引速度需根据滑行地点做具体要求,一般开阔地带不超过15 km/h;⑥在机位滑行道牵引航空器的直线行驶速度不应超过3 km/h;⑦夜间或特殊天气情况条件下,牵引航空器穿过机坪滑行道的直线行驶速度不应超过5 km/h;⑧牵引航空器通过障碍物、复杂区域、有坡度地带的直线行驶速度不应超过1.5 km/h;⑨在机坪滑行道推航空器,速度不应超过5 km/h;⑩转弯角度应按该类型航空器维修手册中的有关规定执行,转弯速度不应超过3 km/h;牵引飞机前应由地面指挥员明确各人员之间的责任、牵引过程中可能出现的风险隐患与应对措施,在复杂地域,应增加警戒人员数量。
在表4中出现频率较高的因素为人员的操作资格的获取和具体的人员操作过程,这两种因素对大部分不安全事件都有影响,即在这两种因素的操作过程中容易产生差错。对于机务人员本身,操作资格获取过程涉及到训练、考核、实操,操作过程也同样复杂,受到意识、记忆、环境等多种因素影响[15]。基于安全的前提,差错的控制包含减少、捕获、包容差错,因此应加强对机务人员的培训、完善考核制度,合理安排生产计划,保障机务人员的工作条件,以达到减少差错的目的。
4 结论
民航运输快速发展,机队规模大幅度增加,机务维护、维修工作日渐繁重。由机务引起的不安全事件威胁着民航安全水平。
(1)笔者针对最近五年中出现的12种不安全事件类型,分析各事件的发生频率和影响程度,通过计算不安全事件率,得到风险水平图。依据每个区域严重程度和频率特点,将风险水平划分为A、B、C 3种区域,其中,B区域为高危区域,发生频率较高,严重程度也比较高,处于此区域的事件类型为“客舱失压”。在民航事故中,客舱失压事件经常发生,且造成的后果也较为严重,因此,此类事件应严格预防,避免发生。
(2)根据12种事件类型的回归分析结果,冰击等6种事件对最后事件率的影响程度较高,依据事件具体类型,同时分析了这6种事件的人为因素来源,通过对比分析可得,机务人员的操作资格的获取和具体的人员操作过程是影响程度最高的因素,并给出了降低诱发事故发生的对策。