动车组安全规律分析系统设计与实现
2022-03-30杨晨
杨 晨
(中国铁道科学研究院集团有限公司 电子计算技术研究所,北京100081)
故障管理是动车组运维检修的重要环节,随着动车组数量的不断增加,如何对故障数据进行有效运用,描述动车组及其部件的安全规律和服役状态已成为重要的研究课题。同时,动车组健康管理、动车组修程修制优化和动车组数字化精准维修等业务的开展,要求故障管理系统能够快速、准确、及时地完成故障发生时相关信息的采集、处理和传递,全面提高故障分析水平[1]。
目前,运行于铁路单位的故障管理系统包括动车组管理信息系统(EMIS,EMU Management Information System)、动车组车载信息无线传输系统(WTDS,Wireless Transmit Device System)、动车组运行故障动态图像检测系统(TEDS,Trouble of moving EMU Detection System)、动车组滚动轴承故障轨边声学诊断系统(TADS,Trackside Acoustic Detection System)及各单位自建的故障管理系统等[2-5]。其中,EMIS已基本实现了对多源故障的汇集,并对故障进行了有效地闭环管理,但其更侧重于对故障处理结果的记录,并未对故障相关数据进行全面运用,也无法对动车组及其部件的安全规律分析提供行之有效的决策支持。
随着互联网技术的发展,尤其是大数据、人工智能和机器学习方面的发展,为积累的历史故障数据带来了新的利用价值[6-7]。可利用数据挖掘和分析技术,为动车组健康管理及动车组修程修制优化提
供切实可行的实施方向。基于此,本文依托动车组安全大数据平台,以动车组故障管理为核心,对动车组运用检修相关数据进行采集和存储,设计了动车组安全规律分析系统的架构和功能,提出了系统中采用的关键技术。系统的建设可以为动车组运维管理人员提供有效的管理工具和辅助决策支持。
1.1 建设目标
本文从动车组海量运用、监测及故障数据出发,研究多源数据的传输、存储、处理和分析技术。通过动车组安全规律分析系统的建设,准确地描述动车组运行过程中各种因素对动车组及其部件的失效规律和服役状态的影响,辅助动车组的运行、维护和费用控制等决策的制定,提高动车组数字化精准维修水平,促进动车组设计、制造和维修技术的改进。
1.2 总体架构
动车组安全规律分析系统依托动车组安全大数据平台,系统整体架构分为数据源、平台层、应用层和用户层,如图1所示。
图1 系统总体架构
(1)数据源:负责提供动车组及其部件的故障信息。
(2)平台层:主要完成对数据源产生的动车组故障、动态履历、线路工务和检测监测等数据进行自动抽取、存储和汇集,并利用大数据技术提供的即时检索服务、实时数据分发和共享服务,提升跨业务领域的数据挖掘能力,对海量的故障相关数据开展分析,为系统应用提供数据支持。
(3)应用层:对相关数据进行分析,为用户层提供动车组安全规律,发现动车组运行中的薄弱环节。
(4)用户层:通过动车组安全规律指导动车组安全生产,提高动车组故障分析能力和安全管理水平。
1.3 技术架构
系统综合利用分布式存储、分布式计算、数据仓库、数据挖掘等技术,满足多用户、高并发和高可用的需求,集“易用性、伸缩性、开放性”于一体,同时,采用统一的应用开发框架,定义标准的软件开发测试规范、安全管理规范和运维规范,实现基于云化、分布式和服务化的技术架构,如图2所示。
图2 系统技术架构
系统技术架构自底向上划分为基础设施层、平台层、接口层和前端展示层。
1.3.1基础设施层
基础设施层通过虚拟化资源池,对基础计算、存储、网络资源进行池化和虚拟化,为上层应用与服务提供统一硬件资源调度和监控管理,支持按需分配与弹性扩展,并通过标准化接口向上层提供计算、存储等基础服务,提高信息技术(IT,Information Technology)资源的易用性、敏捷性。通过服务器集群,实现海量数据的存储与计算,缓解资源压力,提升服务器整体性能。通过高稳定、高带宽的网络链路,实现网络资源的高吞吐、高可用、低延时。
1.3.2平台层
(1)数据平台层面向数据处理关键技术,通过数据采集工具、分布式消息队列、分布式文件系统、资源调度和平台管理工具等多种手段,实现数据采集、数据抽取、数据存储和数据分析挖掘;通过分布式协调调度服务实现数据平台的高效、稳定运行;通过可视化管理界面,为数据平台核心组件及整体环境提供性能展示、配置和预警功能。
(2)集成平台层通过关系型数据库、内存数据库、安全认证及报表组件等,提供服务运行环境与模型管理,实现中间件服务,面向应用开发,提供安全可靠的平台支撑。通过基于内存键值对的分布式内存数据库查询方法,实现对大规模并发、高速数据访问计算、实时数据处理等方面的高性能快速响应;通过身份认证确认操作者身份和资源访问权限;采用不同的数据加密策略实现数据安全保障;通过报表组件实现动车组故障统计分析功能。
1.3.3服务层
服务层通过统一认证、统一接口服务及数据集成服务等,实现前端应用的服务集成。通过统一认证为用户提供不同强度的安全认证手段和单点登录门户;通过统一接口服务实现负载均衡、缓存、日志、限流限额功能;通过数据集成服务对外提供标准、统一、规范的业务接口,实现应用功能。
1.3.4前端展示层
前端采用基于HTML、CSS和JavaScript的Bootstrap框架,提供HTML与CSS规范,结合各类前端JS控件、报表控件,实现Web前端的简洁、快速、高效开发,面向用户实际需要,提供可视化分析结果。
2 系统功能
2.1 动车组基础性安全规律分析
(1)动车组总体安全规律分析
以动车组运行故障数据为主,根据车型(批次)、走行公里、配属、检修历史、故障发生时车组的高级修程、轮次、交路和区段等多个维度,建立不同维度动车组安全规律演化模型,对不同车型(批次)及系统进行基础性安全规律分析。
(2)动车组惯性故障分析
惯性故障指动车组经常性发生的故障,惯性故障的分析能够发现故障频发事件,通过更深入的分析,帮助查找设计、运用检修过程中的缺陷和问题,有利于动车组技术的不断优化迭代。不同车型惯性故障字典不完全相同,但有“血缘关系”的动车组故障字典高度相似,针对动车组的惯性故障,描述并展示动车组惯性故障发生规律。
2.2 标志性事件的动车组安全规律分析
标志性事件指对动车组运用检修产生较大影响的事件,如动车组提速、修程修制改革等,分别提取标志性事件发生前后的动车组故障数据,从单位、车型(批次)等维度,对动车组发生标志性事件的前后进行安全规律的综合对比分析,从数据分析结果反映该事件对动车组安全的影响。
2.3 环境因素的动车组安全规律分析
高速铁路具有地域跨度大、速度快、里程长和始末时间短等特点,不同线路条件、不同天气均会对动车组故障产生影响。提取动车组开行、交路和天气信息建立站站气象信息库,基于站站气象信息库对不同交路、不同城市、不同天气环境因素对动车组各安全规律进行分析,主要包括基于线路的动车组安全规律分析、基于天气(温湿度、晴雨雪等)及多维环境因素的动车组安全规律分析。
2.4 运用检修建议
针对故障数据及安全规律模型,对动车组及部件的运用检修提出视情维修和预防性维修策略,达到降低维修成本的目的。
(1)动车组运用建议
针对运行数据、部件故障数据和部件更换数据等,分析动车组运用检修内容和运用开行需求,构建运用方案优化模型,辅助提升动车组运营品质,提出动车组运用建议。
(2)动车组精准维修建议
汇总全路动车组及部件的故障历史、检修历史情况,以车型、部件和检修项目等为维度,考虑动车组维修时机、维修间隔及维修成本等要素,在保障车辆可靠性的同时降低维修费用,提高检修效率,给出精准维修建议。
(3)动车组设计制造建议
发现批次、部件等设计和产品优化改进功能点,及时反馈给动车组及零部件造修企业进行深入研究,从设计制造角度实现动车组的改进和创新,提升乘客体验和动车组运营效率。
3 关键技术
3.1 数据分布式存储技术
动车组安全规律分析需要采集大量故障数据,包含图片、声音资源,而这些图片和声音的存储多数是小文件,且大多数文件大小在几十KB以内。如果使用以GFS、HDFS为代表的适用于流式访问大文件的分布式存储系统存储图片,在元数据膨胀的情况下扩展性和性能方面均存在严重问题[8]。系统采用基于HDFS的Hbase作为简单结构化数据分布式存储方式,用于存储海量图片小文件,并具有系统层小文件合并、全局命名空间等多种优势。
3.2 多源数据融合处理技术
将各系统数据采集至大数据平台后,需要将原始数据进行清洗、转换,采用除噪、补缺失值和除冗余值的方法对数据进行预处理,并按照主题域存放各类数据,形成可供分析的数据集。在动车组制造运用领域,需要针对设计、工艺、制造和维修等不同维度的需求对数据进行拆解。在动车组运维业务领域,主要包括基于功能分类的结构和基于部件装配的结构,两者相互对应,可互相转化。为便于数据使用,在数据处理过程中,应为各类数据创建便于统计分析的各类索引。
3.3 大数据机器学习技术
在安全规律分析过程中,需要使用大数据机器学习技术对安全规律模型进行训练与验证,动车组安全大数据平台为各类算法、模型的开发和运行、海量数据的分析存储提供环境支撑。在模型中采用了各种机器学习算法,如差分整合移动平均自回归模型、决策树、支持向量机和随机森林等,并采用准确率、精确度和召回率等统计指标对模型结果进行验证。
4 系统应用
目前,动车组故障规律分析系统已经研发完成,并以CRH380系列动车组为例,对CRH380系列动车组开行以来的数据进行特征提取与选择、时间序列预测、关联分析等,用可视化应用功能实现、验证、固化了各类安全规律分析成果,全方位地描述了CRH380动车组上线以来的安全服役状态。CRH380系列动车组作为当前应用最广泛、运行地域最广、涉及用户单位最多、线路最多的动车组,其安全规律分析对于保证中国高铁运营安全、降低运用维修成本、提高运用检修效率等都具有重要意义。
5 结束语
本文依托动车组安全大数据平台建立动车组安全规律分析系统,并介绍了系统架构、功能组成、关键技术,同时以CRH380动车组为例开展验证,取得了良好的效果。下一步,系统将扩大数据范围,对动车组安全规律分析方法和预测模型在其他型号动车组和典型线路开展验证和应用工作,全面提升动车组安全管理水平。