基于事故数据的轨道交通运行安全风险辨识方法
2022-03-18曾小清林海香王奕曾袁腾飞黄继成
曾小清,林海香,2,王奕曾,袁腾飞,何 乔,黄继成
(1.同济大学 道路与交通工程教育部重点实验室,上海 201804;2.兰州交通大学自动化与电气工程学院,甘肃 兰州 730070;3.香港城市大学计算机科学系,香港 999077;4.上海大学 悉尼工商学院,上海 01800;5.贝尔福-蒙贝利亚技术大学信息学院,贝尔福法国 90000;6.上海轨道交通十四号线发展有限公司,上海 201103)
安全是轨道交通事业永恒的主题。轨道交通信号系统作为保障轨道交通安全运行的大脑指挥系统,其安全运行水平至关重要。美国铁路事故统计数据表明,与信号设备有关的事故关联度达到0.683,信号系统故障成为美国铁路事故的主原因之一[1]。我国铁路自“7.23”特大事故后再未发生与信号相关的较大事故,然而在故障率方面,信号故障仍然高居首位。据统计,我国高铁自开通以来至2014年,仅京广、郑西两条高铁线就发生故障1 095起,其中电务(信号)677起,工务105起,供电176起,车辆132起,其他故障5起[2],信号故障占总故障的61.8%,故障率高导致发生事故的概率相应升高。根据铁总运[2015]26号《铁路电务安全规则》对信号系统故障和事故的定义,“当设备故障因处理不当、器材老化、外界不可预见影响等升级为铁路交通事故时,按《铁路交通事故调查处理规则》定性为铁路事故。”因此,从事故出发寻找风险源,是提高轨道交通信号系统安全风险预防管控水平的根本途径。
铁路信号系统事故主因素的辨识是安全风险分析的基础,也是事故致因溯源的首要条件。传统辨识方法有头脑风暴法、专家经验分析法、安全检查表法(SCL)[3]、失效模式与影响分析方法(FMEA)[4-5]、风险与操作性分析法(HAZOP)[6]、预先危险性分析法(PHA)[3]和故障树分析方法(FTA)[7-8]等经典风险辨识方法。近年来又出现了一些新的、定性的、基于事故致因系统论的因素识别方法,有分层危险起因和传播研究法(HiP-HOPS)[9]、事故因果分析方法(CAST)[10]、功能共振分析方法(FRAM)[11]等。定量辨识方法是日本铁道技术研究所针对铁路信号系统提出的一种将组件故障发生概率、功能失效概率和控制措施等相关联的风险分析方法[12]。上述除故障率统计法、FTA法属于定量辨识方法外,其余方法均为定性辨识或系统论定性辨识方法,较多依赖专家经验,受到个人专业技能的限制,主观性较强,缺少数据的支持,需定量分析以加强安全分析的客观性和提高后续安全管控的效果。对于系统安全分析模型,有多种形式,其中5M模型(Management-Machine-Man-Media-Mission factor,管理-设备-人员-环境-功能要素模型)是要素分析模型,作为分析调查事故性质的有效工具,是美国联邦航空管理局(FAA)内部航空安全计划的一部分。20世纪40年代康奈尔大学的TP Wright将人-机-环境(Men-Machine-Media)三合一引入航空安全,1965年第四个“M”(管理Management)加入,1976年“任务”(Mission)加入到整体模型中[13]。通过5M要素识别和分析,有助于确定安全隐患原因、隐患以及安全风险缓解策略。近年来5M模型在我国轨道交通信号领域,也得到了初步的应用[14-15]。
1 数据来源与事故数据特征提取
通过新闻报道、中国铁道年鉴、国家铁路局数据、各铁路局公开典型事故案例等方式收集信息,剔除与电务无关的303起典型事故样本,以余下254起与电务相关的2000—2017年典型事故案例作为数据样本1,将全年220起与电务相关的事故案例作为参考对比数据样本2。
数据样本1中,有人员死亡、重伤案例40件,轻伤案例2件,无伤亡案例212件,按照海因里希法则[16]中事故伤亡比例1∶29∶300来判别,数据样本1属于较大伤亡事故数据。数据样本2中,有人员伤亡案例2件,轻伤案例0件,无伤亡案例218件,属于较小伤亡事故数据。对数据样本1和数据样本2的分析是对较大和较小伤亡事故数据进行分析,基本涵盖导致铁路信号系统的主要事故因素和事故特征,且覆盖全国各铁路局和各个年份,能够较为全面反映信号系统事故影响因素和发生环境。
我国普速铁路、高速铁路的信号系统事故分级和定性以2007年铁道部颁布的《铁路交通事故调查处理规则》和《铁路交通事故应急救援和调查处理条例》(国务院令第501号)为主,依据事故造成的人员伤亡、直接经济损失、列车脱轨辆数、中断铁路行车时间等情形分为特大、重大、较大和一般事故4个等级,以此作为信号系统事故类型特征统计依据。
本论文研究以同济大学轨道交通运行控制实验室为实验数据支撑平台,利用Python软件和SPSS软件对较大和较小伤亡事故数据进行处理,分别提取事故类型、事故原因等特征,并对事故类型的数量进行统计分析,得到如图1所示的分布柱形和占比曲线。
图1 信号系统伤亡数据与事故类型分布及占比Fig.1 Accident type distribution and proportion of larger and minor casualty data in signaling systems
对比较大伤亡事故和较小伤亡事故,二者柱形波动趋势和占比曲线趋势相近,且基本呈正态分布,说明较大伤亡事故与较小伤亡事故样本数据选取得当,包含各种事故类型。但较大伤亡事故数据的各事故类型特征更加明显,能更加全面反映信号系统事故特征,而较小伤亡事故样本在分析单事故类型、单因素时较有优势。二者均在一般D类事故上波动较大,整体呈现大事故稀少而一般D类事故显著居多的特点。因此,现阶段我国铁路信号系统事故具有如下规律,与信号系统相关的铁路交通特大、重大、大事故较为稀少,而小事故或一般事故数量较多。
2 安全风险识别方法
2.1 一般统计法
根据铁总运[2015]26号《铁路电务安全规则》所定义的28种电务事故原因,逐条对较大伤亡事故和较小伤亡事故数据进行特征数据提取。造成信号系统发生事故的直接原因虽然很多,但在以事故数量作为唯一识别尺度的条件下,根据事故原因与事故总量的相对比例,对其中事故数量≥10的事故原因识别为事故主因素,较大伤亡事故识别出主因素7个,较小伤亡事故识别出主因素6个。不论较大伤亡事故还是较小伤亡事故,最主要原因是材质不良、外界施工、检修不良及自然灾害(雷害)。
2.2 统计识别法
以信号系统安全分析5M模型作为事故主因素的分类依据,将定义的28种事故原因细化扩充为32种事故因素,构建成事故5M数据模型。结合前述事故原因特征分析工具,基于5M模型统计较大、较小伤亡事故数据的事故原因数量。根据事故原因与事故总量的相对比例,将其中事故数量≥9的事故原因识别为事故主因素,如图2、图3所示。
图2 基于统计识别法的较大伤亡事故主因素分析Fig.2 Major factors of larger-casualty accidents identified by statistic identification method
图3 基于统计识别法的较小伤亡事故主因素分析Fig.3 Major factors of minor-casualty accidents identified by statistic identification method
统计识别法识别出较大伤亡事故主因素10个,较小伤亡事故识别主因素8个,较大伤亡事故最主要事故原因是外界人员施工,较小伤亡事故最主要事故原因是材质不良。
2.3 因子分析法
比较上述一般统计法和统计识别法,当以事故数量作为主因素唯一识别尺度时,事故原因总量增加,则所识别的主因素也增加,反映了这种事故数量尺度的单一笼统性,不够全面,未考虑事故后果、人员伤亡情况、事故形态等多指标尺度综合影响,所识别的主因素是否具有导致事故发生影响面大、造成后果损失大的特点仍未可知。由此,为了深入挖掘各事故因素对事故严重程度的影响,进一步提高安全风险源识别和安全控制的高效性和针对性,拟通过数据挖掘方法,建立多指标下的事故主因素模型。
2.3.1 建模方法
数据挖掘方法有方差分析、相关与回归分析、因子分析、判别分析、关联规则挖掘等,由于传统方差分析主要进行均值比较,并不能解决数据复杂性问题;回归分析要求各事故因素变量有非常明确的实际意义和影响机制,而本次事故因素多变量的影响机制尚不明确,不适于采用回归分析;因子分析法在数据分析中对多变量起到降维的作用,降低了数据处理的难度,减少了工作量,此外,因子分析处理后的新变量各不相关,避免了信息重叠带来的混乱,具有不受数据原本的相连性限制的优点。关联规则挖掘针对事故因素之间的关系进行分析,不适用事故主因素的挖掘。因此,针对信号系统事故主因素分析采用因子分析法建模[17],数学模型[18]如下:
设原始变量Xi(i=1,2,…,p),如果表示为
式中:A为因子载荷矩阵;F为公共因子变量;ε为残差向量;aij为因子载荷系数
使用因子分析模型的任务就是求出因子载荷系数矩阵A和残差ε,若残差影响很小可忽略,且F公因子各分量互不相关,F的期望为0、方差为1,则式(2)变为
式中:Z为主成分向量;X为原始变量;B为主成分相关矩阵(特征向量)
因子分析的目的是求出矩阵B,而主成分Z1、Z2、Z3…在总方差中的比重依次递减,一般根据方差大于70%确定出主要主成分,达到降维的目的。
2.3.2 基于5M的事故主因素建模
选取220条较小伤亡事故数据和254条较大伤亡事故数据作为因子分析对象,按照5M模型的因素分类提取事故数量、耽误行车数、脱轨车厢数、伤亡人数等统计量,对其进行Z-score标准化,截选部分标准化数据如表1所示。
3 实验分析
3.1 风险辨识方法应用
采用因子分析法,计算求得较小伤亡事故矩阵的特征值和方差贡献率,选取累积方差贡献率>70%的成分作为主成分,其特征值分别为λ1=2.405,λ2=1.571。由式(2)~(4)计算所得载荷矩阵如表2所示。
由表2计算可得到主成分的特征向量B=(0.69 0.68 0.61-0.84),则较小伤亡事故主因素计算模型为
表2 较小伤亡事故数据的载荷矩阵Tab.2 Load matrix for minor-casualty data
根据基于5M的事故主因素建模方法计算各因素的主成分值F,将表1中数据依次代入式(5)中可计算得到较小伤亡事故各因素的主成分值,同理根据式(6)可得到较大伤亡事故各因素的主成分值。将较大伤亡事故和较小伤亡事故中主成分值F≥1的事故因素识别为主因素,如图4、5所示。
表1 铁路信号系统较小伤亡事故标准化数据Tab.1 Standardized data for minor-casualty accident in a railway signaling system
由图4、5可得,综合考虑事故数量、耽误行车数、脱轨车厢数、伤亡人数等多种识别尺度时,较大伤亡事故识别出主因素9个,较小伤亡事故识别主因素5个。不论较大伤亡事故还是较小伤亡事故,最主要原因都是自然灾害、材质不良、施工管理不善、防护不力造成电务人员死亡。
图4 较大伤亡事故主因素Fig.4 Major factors for larger-casualty accidents
图5 较小伤亡事故主因素Fig.5 Major factors for minor-casualty accidents
将上述主因素识别结果按数值大小取前18位作为影响力强的主因素排序,即为事故因素重要性排序。
较小伤亡事故因素重要性排序:材质不良>施工管理不善>防护不力责任死亡>人为破坏和砸盗烧>雷害>处理延时>线缆破损>意外砸损>其他自然灾害影响>外界人员施工>人员检修不良>人员处理延时>器材失效/超期>电化干扰>施工延时>设备缺陷>厂家责任>供电影响。
较大伤亡事故因素重要性排序:外界人员施工>其他自然灾害影响>材质不良>施工管理不善>防护不力责任死亡>电务人员施工>漏检缺修管理不力>违章作业>设计缺陷>施工隐患>人为破坏和砸盗烧>施工配合不力>路外施工干扰>机务影响>车务影响>设备缺陷>供电影响。
事故因素重要性排序反映了事故因素对信号系统事故的影响力强弱,可为信号系统安全风险分析和风险评价提供风险权重值的数据支持。
3.2 实验结果讨论
一般统计法、统计识别法和基于5M的因子分析法虽然都能识别信号系统事故主因素,但识别效果不同,即不同方法识别的主因素略有不同,识别主因素数量也不尽相同。
考虑识别方法与事故原因数量、识别的事故主因素覆盖率、事故影响率之间的关系,对方法识别效果进行度量,则事故主因素覆盖率计算公式如下:
式中:C为主因素覆盖率,表示识别的铁路事故主因素占整个事故原因集合的比率;I为整个铁路事故原因的集合;i⊆I表示i是铁路事故原因集合I中的一个事故主因素;Rn(i)为识别的事故主因素集合;K为整个铁路事故原因的数量。
主因素事故影响率Ir是指主因素的事故影响力占整个事故原因数量的比率,计算公式如下:
式中:f(Zscore(i))为主因素事故影响力,表示在整个事故原因集合中由主因素所导致的事故后果经Zscore标准化后的函数值;i为衡量事故后果的指标数量,包括事故数量、伤亡人数、耽误行车数、脱轨车厢数等,当前最大取值为5,如公式(6)所示。
一般统计法和统计识别法只考虑事故数量的单一指标,其f(Zscore(i))=Z-score(1);基于5M的因子分析法是求取多指标尺度下的主因素函数,分别将Zscore值代入式(5)、(6)可得f(Zscore(i))。针对较大、较小伤亡事故数据,在不同的事故原因数量K值下,将f(Zscore(i))代入式(7)、(8)中,可得3种方法识别效果度量表,如表3所示。
表3 3种方法效果度量Tab.3 Comparison of three methods to measure effectiveness
表3分析表明,针对较大、较小伤亡事故数据,当识别方法采用单一尺度指标时,随着K值的增大,其覆盖率会有所增加,而影响率与K值无关;当识别方法采用多尺度指标时,相对单一尺度指标,覆盖率略有减小,而影响率大幅增加。单一尺度“事故数量”反映了事故发生频度,多尺度指标“事故数量、伤亡人数、耽误行车数、脱轨车厢数”等反映了事故频度、事故后果和损失严重程度。因此需选择影响率相对较高而覆盖率适中的方法,此时,K=32,较小伤亡事故数据的覆盖率为0.156 3,相较一般统计法降低了27%,而影响率为0.459 7,相较另两种方法,分别提高了56%和61%;较大伤亡事故数据的覆盖率为0.281 3,相较一般统计法提高了13%,而影响率为0.754 0,相较另两种方法,分别提高了106%和91%。由此,基于5M的因子分析法识别效果最佳。
4 结论
相较单一尺度的数据统计识别方法,本文提出了一种基于事故数据的5M因子分析法。该方法将5M模型与数据挖掘方法有机融合,先统计铁路信号系统多种事故指标并进行事故因素5M分类,再采用因子分析法建立主因素数学模型,综合考虑事故数、耽误行车起数、脱轨车厢数、伤亡人数等多尺度计量事故损失方式,对影响信号系统安全性的多种风险因素进行了全方位辨识和定量计算。该方法能应用于轨道交通信号系统安全风险辨识,计算得到辨识因素的重要性排序,能够为安全分析、风险辨识、安全管控提供有力的数据支持。
该方法对于轨道交通信号系统的安全施工建设和运营管理提出如下建议:雷害和其他自然灾害仍对当前我国轨道交通信号系统有较大影响,环境要素是信号系统事故致因的重要一环,应当加强防范;较大伤亡事故区别于较小伤亡事故的主因素有外界人员施工、人员检修不良、人员违章作业、电务人员施工、漏检缺修管理不力等,说明从长期来看,不论在施工建设还是日常维护中,人员要素仍然对铁路信号系统事故有着较大影响力,需要在事故预防管理中加以重视;较小伤亡事故的主因素以设备材质不良、电务施工管理不善为主,数据表现偏重于设备要素和管理要素,因此在多因素考虑,多管齐下的基础上,突出重点,对于铁路电务日常维护要重点抓设备安全和日常管理。
作者贡献声明:
曾小清:建模思路,5M算法分类。
林海香:数据收集,数据挖掘与建模。
王奕曾:数据收集。
袁腾飞:风险辨识。
何 乔:算法测试。
黄继成:数据收集。