高速动车组安全大数据分析思考与探讨
2020-01-20陈振虹刘彬
陈振虹, 刘彬
(1.中国铁路广州局集团有限公司广州动车段,广东广州 510088;2.中国国家铁路集团有限公司机辆部,北京 100844)
0 引言
安全管控是高速铁路各项工作的重中之重。我国高速铁路运营里程已突破3.5万km,动车组保有量超过3 000标准组。高速铁路建设初期,为保障行业发展基础和最大化满足人民群众安全出行需求,在不断前置现场安全管理的同时努力提升设备运用率[1]。随着供需矛盾的逐步缓解,形势在发生质的变化,启动安全性、可用性及经济性指标综合优化工作,推动动车组修程修制改革[2-3]。实际工作中,传统安全管理工作方式面临着一些体系性的瓶颈。大数据时代的到来为进一步提升安全管理能力提供了思维的变革和有力武器。大数据应用可细分为多个维度,关键是应用大数据思维去解决具体问题,不局限于使用纯粹的大数据软件及硬件。中国国家铁路集团有限公司(简称国铁集团)适时组织全路力量,启动了基于大数据的安全规律分析课题和平台建设工作,在我国“一带一路”倡议下,对提升高速铁路行业软实力影响深远。首先研究涉及项目的总体性问题;在此基础上按照数据获取与清洗及分析、挖掘的顺序,对各阶段出现的难点进行综合分析,提出可行的优化方案。
1 大数据分析整体架构
1.1 整体功能定位
(1)明确顶层规划及工作界面。大数据分析工作受到各层面的高度关注。项目与当前热度较高的技术概念几乎都有关联和交叉,如大数据和故障预测与健康管理(Prognostics and Health Management,PHM)的关系,大数据的工作可以支持PHM,但大数据的工作目标不一定是实现PHM。推进PHM建设也可以使用大数据外的其他技术。
规划阶段可综合考虑对后续其他扩展性应用的支持,但项目实际实施需要总体考虑工作界面及可行性,避免出现项目范围过大难以落地的情况。应明确区分大数据与PHM的范畴,合理设置与PHM的衔接界面,有序规划。
(2)强化平台为主的概念。从长期运用的角度统筹考虑,需强调“平台”的概念。在此基础上把10年数据分析作为大数据平台的试点及应用场景之一。按照平台的定位进行推进,可避免系统仅按照当前发展阶段的口径要求定制设计,导致功能过于单一。
以安全数据为基础,除了传统安全责任分析外,其他领域也应兼顾展开。例如:可能某些事故虽从责任角度定责为其他甚至是非责任,但如果该问题发生频次较高,则应研究是否存在其他方面的问题,如是否可从新角度进行动车组优化改进,目标是大幅降低此类问题的发生概率。此种数据分析使用的方案借助平台实现了安全驱动下的设计优化闭环,此外也可在高速铁路同路外单位的接口优化、安全管理培训输入等多个维度进行扩展。
1.2 各层级系统目标确定
平台建设应适当优化管理深度,避免管得过深,拘泥于细节。不同管理层级对安全管理的范围和标准并不一致,对系统需求目标也不尽相同。
在铁路安全平台建设上,应进一步提升平台系统本身的灵活性,既发挥全路管理优势,具有全路整体性的功能,同时也可以为各铁路局集团公司提供二次开发的基础平台,并为全路管理政策的调整预留空间。此外,在数据方面应同时研究数据脱敏处理方案。
1.3 基础数据和扩展数据区分
为实现预留功能扩展的要求,建议系统架构上明确区分基础数据和扩展数据,避免信息化推进过程中业务数据的处理概念不够清晰。从既有数据中分离出基础数据,基础数据应尽量选择具有相对客观属性的字段,如故障现象、发生时分、担当人员、晚点时间等,此类数据应为不随管理政策变化而变化的数据。其他派生性数据纳入扩展数据,如动车组具体运用问题是否纳入安监报-1。不同发展阶段结合实际需要管理口径会有动态调整,从更长时间周期的角度,会有数据口径不一致的问题。通过派生数据的分离处理,可进行多版本保留,满足不同维度的统计和转换需求。
1.4 大数据的分步实施
对于非结构化的字段进行计算处理,由于基础工具需要根据铁路业务进行开发并通过模型训练逐步成熟,可考虑采用分步实施的方案,同步进行手工和自动的字段化处理。
此种处理方法的好处在于可同步开展工作,以字段化作为独立分析途径,也可对非结构化的大数据运算结果进行评估。
以上顶层规划进一步明晰后,便于主体框架明晰,各项工作有的放矢且边界清晰,避免项目反复。
2 数据获取及处理
2.1 数据来源
数据来源是大数据分析的关键基础。动车组数据来源非常广泛,除了车载列车网络中的各类诊断数据外,还有大量如动车组管理信息系统(EMIS)、动车组运行故障图像检测系统、车辆滚动轴承故障轨边声学诊断系统、车辆运行品质轨边动态监测系统、动车段所轮缘踏面检测装置以及车轮车床等各类监测、维修数据,同时客票等信息也可作为宝贵的数据。但实际推进中,很多数据由于数据规范及设备互联互通软硬件技术限制,实际上难以一次到位。实际项目实施必须采取谨慎评估、抓大放小、分类实施的方案。从国外项目看,德国西门子股份公司在推进轨道交通智能数字化分析Railigent®平台时,也没有一次性把所有系统数据全数获取,而是主要集中于拓展车载诊断信息落地的分析应用。
结合EMIS中既有数据情况,经过数据范围的可行性评估,对事故及安监报-1故障等核心基础数据进行阶段攻关,力争做到数据完备。在此基础上,逐步纳入前述其他各类数据信息,为后续工作全面开展做好规划。
2.2 原始数据质量问题与数据清洗
实际推进过程中,部分专业项目组反复面对原始数据的质量问题。
长时间跨度的历史数据往往都存在一些不完美之处。从动车组专业角度看,我国动车组装备的配套运用维修技术没有同步引进,基本是逐步摸索发展形成的。EMIS各模块根据实际运用需求陆续开发,因此或多或少会存在早期数据录入不全的情况。同时,随着动车组运用检修管理的深入,信息系统部分协议和字段的升级优化(如动车组编号)也会导致历史数据与当前数据有很大不同,这些情况会导致一些数据的不完备或格式等方面的不一致。
大数据技术的特性之一是接纳非理想化数据,虽然较难使用在一些如银行账务结算的场景,但在总体决策建议领域具有很高价值。需要研究如何接受不确定性,利用非结构化数据发掘出更多有价值的信息。
项目推进应先评估项目目标,在此基础上重点关注对应的清洗策略。在目前数据实际情况基础上尽量做到保真,重点研究数据的过滤算法。在系统后台设计时同步引入数据置信度属性,参与后续运算生成关键综合指标。系统生成的总体决策用指标,建议也使用概率化的数学方式进行描述。此外,在置信度问题的处理上也可再次利用大数据理念,着力增加数据的规模和维度,规模的改变有时会引起事物状态的变化;通过多维度校核等各种技术手段,随着数据的积累和系统自学习,不断提升数据的置信度。
数据清洗工作中,部分文件型的相关信息(即使没有完全使用过)也应谨慎处理,如故障调查分析报告等,可能随着分析的不断扩展,会有需求从新的维度对报告进一步提炼,通过系统进一步增加自动化分解字段,推进实现视频、音频、图片等的进一步整合。
2.3 跨专业协同与核心数据标准化
将专业间交叉性的问题进一步细化研究,实现跨专业分析,也可发掘出有价值的信息。
以动车组为例,运用故障分析过程中带有跨专业接口的问题往往需要进一步研究。典型如受电弓自动降弓装置(Automatic Dropping Device,ADD)触发故障。如果故障原因在车辆专业内部,分析比较清晰;但如果是接触网故障,信息闭环往往缺少进一步数据,因为从责任角度划分至非车辆责任时对车辆专业已完成闭环。但实际上弓网类故障是运输组织中较为核心的故障之一,处置中经常需涉及到跨铁路局集团公司多专业多层次协同,涉及到故障信息提报、作业安全防护、弓网故障综合诊断等,如处置不当容易导致事故扩大化。又如在动车组和供电专业间进行较为完整的跨专业分析,可能在优化车辆同供电专业之间接口和应急组织层面提升多个专业的综合协同,对从整体上进一步提升安全管理总体质量起到一定作用。类似情况还有电务车载设备故障、轮轨类问题(如转向架横向加速度超限报警)等。
从此角度出发,建议应建立跨专业的核心信息基础数据平台。以动车组车号、每日运行交路等作为核心基础数据项之一,在平台中进行设置;为跨专业的贯通建设数据之锚,为专业间自动化的大数据交叉分析奠定基础;各专业协同编制标准化的数据接口,达到各专业共建、共享、共用的目标。
2.4 推进设备数据现代化改造
经过数据来源范围核定及系统数据补充、清理核定工作,对数据来源的认识也有进一步提升。
系统长久的发展应定位于从既有生产系统、诊断系统获取,才能解决长期数据供给问题。此外,通过设备获取的数据可减少人为干预,为数据分析增加高置信度的数据维度。
大数据分析的推进也促使行业提升了移动装备等各类设备设施的设计理念。将动车组的动态性能状态数据(如振动、通过间接产生的噪声等)使用特定技术手段进行测量,可为大数据整合分析提供更丰富的数据。
从动车组角度,将车载监测通过远程数据落地实现基础技术状态的输入;通过地面检测监测实现轨旁红外热像、综合噪声频谱、轮轨力综合状态检测,形成综合监控体系,可解决单维度分析准确度不高问题,将对铁路行业产生深远影响。
3 数据分析及自动挖掘
在各类字段的设置及分析中应注意结合信息化手段升级数据统计计算的全面性和精准性,避免复用传统报告数据处理使用的较为简统的分析方案。
3.1 故障分类口径细分
以动车组分解结构为例,传统分析中只设有1个字段。如动车组自动降弓故障,各铁路局集团公司填写速报时,填写属于“主供电系统”。入库检查分析为网络输入输出控制模块故障后,再更改为“网络及辅助监控系统”。
传统故障分析处理中考虑优化流程,抓大放小地进行人工分析是可取的。但当信息系统具有精细化处理能力后,此种处理方式应及时升级,否则会导致后续分析能力的不足[4]。
故障现象与故障原因应作为独立概念分离为2个字段。故障现象属于哪个功能系统及故障原因在哪个部件属于2个独立范畴。只有实现分离,系统才具备按现象统计或按故障部位统计的能力,并可在此基础上研究故障现象与故障部件的综合交错关系,为后续构建高速动车组诊断体系奠定基础。
跨专业中也会出现类似问题,如问题现象在电务专业,可能问题原因在车辆专业。如果此类交叉过多,说明专业接口边界应进一步调整优化。
3.2 属性统计中的综合加权
在责任分析方面,如同一事故由甲单位承担主要责任、乙单位承担次要责任,系统统计功能设计过程中如只按照第一责任单位计算,则乙单位没有放入其承担次要责任的部分,会失去全面性。
大数据平台建议多设置字段,同时应引入加权进行更为完整的评价,实现较为完备的分析。
3.3 综合指标的多口径并存
安全管理关键指标定制过程中,存在国内外对事故等分级口径不一致及如何选取我国指标定义口径的问题[5-6]。
国内外基本指标口径不一致在日常工作中确实带来不便之处,导致横向指标不具备可比性等问题。以事故管理口径为例,德国铁路安全事故更多指列车碰撞、脱轨、平交道口冲撞、火灾等严重事故,重点关注人员死亡及重伤,把信号冒进等列为事故苗头,而对列车晚点和旅客舒适度方面的问题不列入事故[7];而我国《铁路交通事故调查处理规则》把较为严重的晚点问题也纳入安全事故办理。
在此背景下直接对故障频度数据进行对比是不科学的。建议将技术指标和管理指标分离,同时在系统中设定有多个不同管理口径的指标,基础数据一致,可互相切换视角。这样我国铁路事故可根据国外标准进行统计,实现同口径对比,同时也可满足部分国际化需求。
通过此方式还可解决在实际管理中不同时期管理要求动态调整的需求,针对同一故障可有不同的版本方案。把当前技术政策作为多路输出中最核心的输出放在默认位置,预留后续政策动态优化的空间,并可对不同时期数据进行转换和重新整合。
3.4 大数据平台自动跨维度分析能力的培养
数据梳理工作中对自动化数据处理的需求较大,从总体上看,主要集中在文本材料的自动字段化分解及多字段的自动关联分析等方面。
首先是文本材料的字段化分解。此功能可为后期自动处理海量数据奠定基础。如要达到较高的准确率,在试点阶段具体专业人员需参与模型的训练和培养。不断对典型样例进行深入、精准分析,对自动字段化的结果与人工核定结果进行比对,完善系统判别条件,矫正自动分析和实际情况的差距。系统设计中预留投入运用后的自学习功能,不断利用系统自身产生的数据与实际数据进行比对测试,通过反馈机制不断提升。
其次是多维字段的自动关联分析。大数据优势在于关联性分析自动化,找出某些倾向性关联。利用大数据思维对部分维度进行交叉分析,早期可通过人工试算先得出一些重要结论。应大力推进自动关联分析,力争实现更多维度的数据运算,经过交叉印证后可能得到更多有价值信息。在跨专业核心公共数据平台中引入全国气象数据,对全路线路数据同GPS坐标进行体系性拟合,这些基础工作都可能在各专业分析中发挥出强大力量。
最后是重要关联关系的挖掘。后续系统较为完备后,推动实现不同气候、地域、季节、时段的分析,甚至相关人员年龄、教育程度分析。可根据需要选取同一类事件进行专项综合分析,如可通过研究新车型投入运用后的时间周期规律,充分发挥我国规模优势[8],对进一步减少问题发生具有重要意义。
4 结束语
基于大数据的高速铁路安全规律分析,针对整体分析架构、数据获取及处理、数据分析及自动挖掘在实际推进中出现的问题,应结合我国高速铁路运用检修实际进行研究优化,使其既可继承历史又能面向未来。大数据分析中数据复杂多变,应抓住主要矛盾,明确具体目标需求,通过系统找出几个相互耦合的关键因素,从综合角度分析总结健康综合指标,为后续提炼核心干预措施奠定基础。