我国高速铁路通信信号设备服役状态趋势研究
2020-11-04阚佳钰韩安平姜锡义富德佶刘鹏
阚佳钰, 韩安平, 姜锡义, 富德佶, 刘鹏
(1. 中国铁道科学研究院集团有限公司 通信信号研究所,北京 100081;2. 中国国家铁路集团有限公司 调度指挥中心工电调度处,北京 100844)
0 引言
21世纪以来,我国铁路进入高速发展期。2008年我国首条高速铁路——京津城际铁路开通运营,通过10 余年的快速建设,逐步形成以“八纵八横”主通道为骨架、区域连接线衔接、城际铁路补充的高速铁路网,实现省会城市高速铁路通达、区际之间高效便捷相连[1]。截至2019年底,高铁营业里程已突破3.5万km,稳居世界第一。巨大的成就与铁路安全运营密不可分,故障是评定安全的一个重要指标,因此对高铁故障进行研究具有重大意义[2]。
目前,国内外对高速铁路主要侧重于新技术引入的研究[3-5];或者是对某起高铁事故的调查、分析、研究[6];或者是将故障作为我国高铁安全运营技术体系中的一部分或案例进行研究[7]。对高铁故障的系统性研究,特别是研究通信信号设备服役状态趋势的文献还比较缺乏。在此,结合我国高速铁路10年来电务故障的统计分析趋势,总结发生规律,根据运行阶段分析影响因素,预测发展趋势,为相关部门进行故障防范、对设备元器件作出相应维修决策提供参考,以保证高速铁路电务设备高效运行。
1 服役状态趋势研究程序
1.1 概述
电务设备大多为复杂的电子系统,系统的每个部件都会影响电务安全的整体状态和发展趋势。由于大部分构成设备为电子设备,电务专业的故障发生具有随机性,因此实施电务故障规律统计和故障预测具有相当大的难度。但另一方面,电子设备的规律有相似性,对高速铁路通信信号设备的服役状态趋势研究,可以选取某种比较重要的电务设备,进行初步研究。我国铁路车站计算机联锁系统从无到有,经过几代人的努力和不断完善,得到了普遍应用,现已进入成熟运用阶段。采用计算机联锁系统的车站已超过全国车站总数的70%,这些设备为提高行车安全和运输效率发挥了关键作用。计算机联锁系统技术成熟,故障数据积累丰富,选择计算机联锁系统进行研究,具有典型性和代表性。
在前期的分析研究中发现,计算机联锁系统的硬件故障发生概率偏高。主要有电源故障、联锁机采集驱动板故障、工控机整机故障等,且故障发生的情况受部件服役时间的影响较大,是时间的函数。因此根据之前对计算机联锁系统故障数据的统计和研究经验分析,针对铁路电务设备的特点,选取典型高铁线路,按照开通运营时间进行通信信号设备的服役状态趋势研究。
1.2 研究程序
具体的服役状态趋势研究程序如下:
(1)对故障和事故情况进行收集。收集我国高速铁路通信信号设备的故障数据主要包括:故障发生时间地点、故障发生时设备使用时间、所属线路、故障具体部位、影响行车情况,以及故障描述、处理经过等情况;收集我国高速铁路通信信号设备的事故数据,对故障数据作进一步补充;对上述收集到的数据进行初步梳理。
(2)分析并确定故障原因。对收集到的数据按时间、设备类型、故障责任、线路等维度进行初步统计和分析;进行故障定位到子系统的深层次研究;进行理论分析和相关计算;分析影响行车安全的故障机理。
(3)得出结论。每一阶段的分析工作结束,都要对本阶段的问题进行集中归纳、综合分析和判断处理,形成初步结论。故障分析结束时,提出一个明确的结论以及相应建议,为积累材料、交流经验、改进工作提供支持。
2 通信信号设备服役状态趋势研究
2.1 典型线路的故障趋势
选取开通时间超过5年的典型线路,按开通年份和开通月份分别进行分析,初步选定7条典型线路,开展电务设备故障受使用时间影响的研究。7条典型线路拟合后的实际故障趋势见图1。
图1 典型线路拟合后的实际故障趋势
根据以上统计结果进行分析,在开通运营初期(1~2年),所有设备处于协同工作磨合期,设备也处于典型的电子器件早期失效期,另外维护人员对新设备也有一定的适应期,因此故障发生较多。在运营一段时间后,故障发生大幅下降并趋于平稳,其开通时间与故障发生情况的关系,与浴盆曲线的早期故障期和偶然故障期的形状极为相似。
2.2 浴盆曲线的概念
实践证明大多数设备的故障率是时间的函数,典型故障曲线称之为浴盆曲线。浴盆曲线是指产品从投入到报废的整个寿命周期内,其可靠性的变化呈现一定规律。如果取产品的失效率作为产品的可靠性特征值,它是以使用时间为横坐标、以失效率为纵坐标的一条曲线。因该曲线两头高、中间低,有些像浴盆,所以称为浴盆曲线[8]。
浴盆曲线一般有3个组成部分(见图2)。第1部分失效率是递减的,第2 部分失效率接近于1 个常数,第3部分失效率是递增的。
图2 浴盆曲线组成示意图
在产品刚开始使用时,由于元器件设计、材料、制造和安装过程中的缺陷等原因,失效率较高,表现为早期故障。为了缩短这一阶段的时间,产品应在投入运行前进行试运转,以便及早发现、修正和排除故障;或通过试验进行筛选,剔除不合格品。在此时期对元器件故障原因必须尽早发现并消除,才能使故障率降低。当排除了所有能排除的缺陷后,元器件或系统的失效率近似保持不变,进入偶然故障期。对于元器件而言,此时处于最佳状态,并希望失效率尽可能低于要求值,而且希望这一时期的持续时间尽可能长。偶然故障主要由质量缺陷、材料弱点、环境和使用不当等因素引起。随着使用时间的增加,元器件和系统开始老化,进入损耗故障期,该阶段的失效率随时间延长而急速增加[9]。
2.3 模型建立
选用一种故障率为浴盆曲线的寿命分布方法,构建高速铁路通信信号设备浴盆曲线模型[10]。方法如下:
步骤1:线路故障数据的收集。具体需要收集的数据包括试验样本量n、各故障发生的时间t1,t2,…,tn。
步骤2:参数η的确定。参数η表征产品的极限寿命,其取值与所选取的分布无关,应直接根据试件的故障情况估计η,可使用以下公式确定η:
式中:n为样本量;tn为第n个故障试件的正常工作时间;k为tn时的同时故障数。
步骤3:使用极大似然估计确定参数λ、α和β。在确定η的情况下,令x=t/η,则本分布的概率密度函数为:
对似然函数L取对数:
进而求偏导:
使各偏导函数取值为零的参数组合即为本分布的极大似然估计结果。
故障率函数为:
各参数的取值范围为λ>0,α>0,β≥0,η>0。该方法的分布根据参数取值不同,既适用于完整的浴盆曲线,也适用于特殊浴盆曲线;既适用于无限的时间区间,也适用于有限的时间区间;该方法的分布能在部分参数取特殊值时等价于指数分布和威布尔分布,也能通过调整参数取值十分接近正态分布、对数正态分布等。由于该方法的分布对绝大部分产品都适用,可以省去分布模型的选择,也为高速铁路通信信号设备服役状态趋势的研究提供了便利。
2.4 模型试算
2.4.1 典型线路数据试算
以典型线路A 高铁的故障数据为例,进行上述浴盆曲线方法的试算。
步骤1:A 高铁线路故障数据收集。具体数据包括试验样本量n、各故障发生的时间t1,t2,…,tn。
步骤2:参数η的确定。采用Spyder 软件提供的数值方法,确定η=117.004 731 861 198 74。
步骤3:使用极大似然估计确定参数λ、α和β,将故障数据和η带入各偏导函数等于零构成的方程组,采用Spyder 提供的数值方法求解得到:λ=2.106 83,α=0.617 447,β=0.204 969。
将各参数带入故障率函数的表达式中,绘制故障率试算理论曲线(见图3)。
图3 A高铁故障率试算理论曲线
与图1 中故障趋势比较,图3 中出现第1 个拐点的时间基本一致,大约在开通1年左右。但试算曲线图3中第2个拐点出现的时间大概是开通5年左右,表明在未进行设备维修及维护保养的情况下,理论上运行5年后故障发生数量就会大幅上升。但实际运营中暂时并未出现第2个拐点,原因是电务部门不断强化规范化管理,不断完善电务规章体系建设,其颁布的标准规范对高铁安全运营起到了显著的保障作用,且在A 高铁开通的5年中,设备得到良好维护,陆续维修或更换了部分达到寿命期的设备。
为验证该模型是否具有偶然性,再选取典型线路B高铁进行试算。
步骤1:B 高铁线路故障数据收集。具体数据包括试验样本量n、各故障发生的时间t1,t2,…,tn。
步骤2:参数η的确定,η=102.000 364 431 486 89。
步骤3:使用极大似然估计确定参数λ、α和β,将故障数据和η带入各偏导函数等于零构成的方程组,采用Spyder 提供的数值方法求解得到:λ=4.199 2,α=0.564 465,β=0.035 430 5。
将各参数带入到故障率函数的表达式中,绘制故障率试算理论曲线(见图4)。
图4 B高铁故障率试算理论曲线
与图1 中故障趋势比较,图4 中出现第1 个拐点的时间基本一致,也大约在开通1年左右。但第2 个拐点出现的时间大概是开通8年左右,表明在未进行设备维修和维护保养的情况下,理论上运行8年后故障发生数量就会大幅上升。但实际运营中也并未出现,原因同样是电务部门不断强化规范化管理,不断完善电务规章体系建设,其颁布的标准规范对高铁安全运营起到了显著的保障作用,且在B高铁开通的8年中,设备得到良好维护,陆续维修或更换了部分达到寿命期的设备。
2.4.2 典型线路拟合后的浴盆曲线趋势
采用Spyder 提供的数值方法,对图1 中典型线路拟合后的故障趋势数据进行计算,结果如下:η=126.000 884 955 752 21,λ=2.503 03,α=0.857 063;β=0.165 932。故障率试算曲线见图5。
图5 反映出各线路故障发生的平均水平,基本在1~2年故障发生趋于平稳,与实际情况也基本相符。且在不发生维修和维护保养的情况下,理论上在使用5年左右后,故障数量会开始大幅增加。
3 偶然故障期的延长
由于浴盆曲线是在最不利条件下,各类故障条件概率的叠加,而在受控条件下,元器件的最佳状态期-偶然故障期已经被延长。特别是电务领域的科学、技术和管理水平持续提升,实际线路数据中,运行达到或接近10年的线路,其浴盆曲线的第3 阶段尚未出现。高速铁路通信信号设备偶然故障期的延长见图6。
图5 各线路拟合后的故障率试算曲线
图6 高速铁路通信信号设备偶然故障期的延长
假设第3 阶段在12年后会出现,按选用方法绘制的曲线中,第12年时预测故障率应为0.02,在第15年时预测故障率应为0.03。假设此时线路上车站有n个,若第15年时发生设备更换的车站为m个,则第15年时实际故障率应为0.02+(n-m)×(0.03-0.02)/n。绘制浴盆曲线模型中,第3阶段可根据实际情况调整。
4 运营安全建议
通过对我国高速铁路通信信号设备服役状态趋势的研究,结合我国高铁电务设备10年来的运行情况,提出如下运营安全建议:
(1)严格遵循故障-安全设计原则,加强安全作业管理。通过对高速铁路典型线路10年的故障、事故梳理统计与分析,随着线路的开通,设备投入使用后初期故障发生较多,但伴随维护保养措施、制度的完善和人员技术水平的逐步提高,高速铁路通信信号设备的故障或事故率呈下降趋势并基本维持平稳状态。要持续加强设备源头质量控制,严格遵循故障-安全设计原则,优化勘察设计,强化现场管理,完善联调联试,加强维护人员提前介入和维护管理,稳步推进系统优化创新,尽可能避免由于设计缺陷带来设备运营后的故障增加,确保高速铁路通信信号设备安全。
(2)采取有效措施努力降低设备开通初期故障率。线路开通初期,由于元器件设计、材料、制造和安装过程中可能存在缺陷,设备也处于典型的电子器件早期失效期,并且所有设备处于协同工作磨合期,另外维护人员对新设备也有一定的适应期,或对预期风险识别的不足,会带来新的风险,造成设备故障率较高。为降低设备开通初期的故障率,在设备研发时要慎用新技术,尽可能采用既有成熟技术。维护接管人员尽早参与到设备的调试维护工作中,做到早熟悉、早上手,以使设备投入运营后能得到良好维护。在设备优化升级时,尽可能聘请行内有经验的资深专家参与评审,研发过程加强风险识别,完善测试场景和测试案例,尽可能规避引入新的风险。
(3)关注通信信号设备实际运行中“浴盆曲线”第3阶段的出现。上述方法显示,高速铁路通信信号设备在不发生维修和维护保养的情况下,理论上在使用5~8年左右后,故障数量会开始增加。在实际运营中,很多高铁线路已经运行达到或接近10年,设备已达到或接近寿命期,应高度重视“浴盆曲线”损耗期的出现,根据需要维修或更换部分达到寿命期的设备,保证备品备件充足并定期进行养护,保障列车安全运营。
(4)按不同设备特点采取有效措施降低设备故障。在研究中发现,有些典型设备故障率相对较高,要根据不同设备特点采取有效措施降低设备故障。可以根据设备特点,提升设备源头质量。通过提升软件人员水平,提升施工规范与安全管理水平,提升现场维修维护人员水平,完善设备生命周期管理,增加铁路现场综合监控等手段降低典型设备的故障率;也可以根据不同设备发生的故障规律,采取专项整治工作,完善相应管理机制。
5 总结
我国高速铁路通信信号设备故障的发生,在时间分布上存在一定的共性,即在开通运营初期,故障发生较多,在运行1年左右大幅下降并趋于平稳。针对故障发生的时间分布规律,应在故障多发的时间段采取积极的预防措施,对通信信号设备的维护保养要把握细节和时间节点,根据经验对重点、要点进行隐患排查。由于实际线路数据中,运行达到或接近10年的线路,其浴盆曲线的第3阶段尚未出现,且仍有大部分高铁线路开通时间尚未超过10年,很多方面都不能获得比较客观权威的数据,因此要构建客观权威的电务浴盆曲线模型,并对浴盆曲线第3 阶段出现时间进行预测,还需要开展更深入研究。