动车组故障预测与健康管理系统方案研究
2018-10-09周军伟
李 燕,张 瑜,周军伟
(中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081)
我国动车组车型较多,应用环境较国外差别较大,行车设备故障、源头质量、作业检修质量等问题时有发生,对动车组运营、维修时常产生不可避免的影响。同时,动车组的计划预防修和状态更正修方式,存在过度修和欠维修的情况,导致动车组维修保养成本高昂、次生灾害及行车设备故障时有发生。基于上述现实情况,建立一套适合中国高速铁路国情的故障预测与健康管理系统(PHMP,Prognostics and Health Management)具有重要的现实意义。
近年来, 国外已在航空航天、国防军事以及工业领域开展了PHM技术的研发和应用工作。直升机健康与使用监控系统(HUMS), 用来监控转子轨迹和平衡等,提供维修趋势信息[1-2];飞机状态监测系统(ACMS)系统[3]能够保证航空公司减少飞行延误、航班取消、中途返航和中途换机等事件[4]。在动车组领域,法国TGV、德国ICE、美国AC6000CW、英国IC125型高速列车等依靠车载网络控制系统实现了全列动车组关键部件及系统实时状态监控和自动诊断[5]。
国内方面,既有的CRH系列动车组的状态监测也大多依赖车载设备监控系统,以及在重要部件上加装传感器获取状态信息[6]。上海铁路局与中车唐山机车车辆有限公司联合开展动车组故障预测与健康管理的研究工作,并尝试对CRH3型车的变压器散热装置等部件发生的故障进行关联分析和故障诊断,探寻故障与外部因素的关系,从而制定不同的检修优化策略,指导维修[7]。
本文第1部分介绍了故障预测与健康管理(PHM)技术相关的基本概念和定义。第2部分对现阶段建立动车组故障预测与健康管理地面系统的数据、用户及业务需求进行了分析。第3部分在文献[5]的体系架构基础上,根据动车组管理和执行的实际需要,增加了动车组健康管理系统的硬件部署,从总体架构、逻辑架构和功能设计角度出发提出了一整套的系统设计方案,并在接口设计部分首次明确了与动车组管理信息系统的包含关系。第4部分对动车组健康管理系统的应用前景进行了展望。
1 PHM定义与内涵
从定义上,PHM指利用各类先进传感器实时监测装备运行的各类状态参数及特征信号,借助各种智能推理算法和模型来评估装备的健康状态,在其故障发生前对故障进行预测,并结合各种可利用的资源信息提供一系列的维修保障决策,以实现装备的状态维修[8]。
上述定义中涵盖了以下若干个相关概念:
(1)状态维修:指通过对设备状态进行检测,并且按设备的健康状态来安排维修的一种决策方法[9]。
(2)故障诊断:指利用被诊断对象的各种知识,进行信息的综合处理,最终得到装备运行和故障状况综合评价结果的过程,目的是确定有无故障及故障情况。
(3)故障预测:以装备的使用状态为起点,结合各类信息,对装备未来时间可能发生的故障进行预报、分析和判断。
(4)健康状态:对装备系统、子系统、部件在执行其设计功能时所表现出的能力的描述。
(5)状态监测:根据装备的状态特征,利用检测设备,连续或定期采集装备系统的状态特征参数,并对其进行分析和解释。
(6)状态评估:以先进的状态监视手段、可靠的评价方法和完整的运行数据来判断装备所处的健康状态。
这些概念或涵盖了一部分PHM的研究内容,或描述了PHM研究的最终目标,从各个不同角度详细剖析了故障预测与健康管理的内容和作用,他们之间的关系,如图1所示。
图1 PHM相关概念关系图
2 动车组PHM系统需求分析
动车组故障预测与健康管理系统应依托各类数据建模、分析和挖掘技术,依托铁路总公司(简称:总公司)和各铁路局动车组技术中心,满足不同层级故障预测与健康管理的需要。
2.1 用户需求
从用户层级划分,系统用户可分为总公司、铁路局、动车段3个级别;从用户类别划分,系统用户可分为模型构建及训练用户和车辆业务用户。
2.1.1 从用户层级划分
(1)总公司用户:统筹管理全路车辆运用、维修工作;查看全路动车组健康状态、检修修程优化建议;查看数据统计分析相关功能。
(2)铁路局用户:合理安排局管内动车组的运用检修工作;查看局管内所有动车组的健康状态;跟踪监督故障预警的执行情况;组织开展应急指挥工作。
(3)动车(车辆)段用户:执行动车组的运用检修工作计划;完成故障预警的闭环管理;监控所内动车组的健康状态,根据不同状态等级安排后续操作;具体落实应急指挥工作。
2.1.2 从用户类别划分
(1)模型构建及训练用户:对包括可靠性模型、大数据模型、机理模型等在内的平台各类模型进行建模、训练和管理。通过系统对模型进行新增、修改、删除、导入、导出等操作,评估模型适用性,与业务管理人员共同保证模型预警及规则的有效性。
(2)车辆业务用户:通过对动车组健康状态的监控,及时发现问题,确保动车组设备正常运营;通过查看健康管理模型预警结果,实时监控动车组故障发生情况,并进行相应的后续处理。
2.2 数据需求
为支持动车组故障预测与健康管理系统中对故障模型的建模和计算,实现故障预测和健康评价应用,系统需要从业务系统、手工渠道及外部环境采集5大类,25小类数据,进行存储、筛选、转化和清洗工作,如表1所示。掌握故障发生规律,并预测未来的动车组状态,包括剩余寿命、可正常工作时间等。
(4)维修决策建议:通过对动车组故障发生规律、动车组健康状态的评估,结合当前定期检修机制,给出视情检修建议,包括车组检修时间和项目,以及不同级别检修优化建议。
表1 数据类型列表
2.3 功能需求
结合动车组运用检修实际,故障预测与健康管理地面系统大体应具备以下功能:
(1)动车组状态监测:接收来自动车组制造或检修厂家的传感器数据,并对数据进行解析,对于故障进行等级管理,根据不同用户需求,对故障进行分层展示,根据报警规则,对重要故障进行实时报警。
(2)健康评估:根据各车组的故障发生情况、运行和检修记录等对动车组健康状态建模,计算各动车组、各车组子系统、各系统部件的健康状态值,并对不同用户进行不同级别的报警,确保上线动车组原设计功能正常,状态良好。
(3)故障预测:通过对动车组机理、可靠性、故障发生规律进行建模,预测动车组设备故障发生,
3 系统设计方案
3.1 总体架构
PHM系统的结构形式取决于装备的组成结构和功能关系,从信息处理方式的角度,可将装备PHM系统的结构归结为3种类型,即集中式结构、分布式结构和分层融合式结构。集中式结构简单、信息传递过程清晰、中央故障管理控制器的功能强大,但执行效率低,一般只用于小型系统;分布式可有效地提高子系统故障管理控制器的执行效率,但无法有效利用健康状态信息之间的冗余信息,系统级诊断/预测的可信度较低,适用于大型但结构简单的装备;分层融合式结构能够在系统各层全面的利用冗余信息,降低了系统整体的虚警概率,更适用于结构复杂、产品结构层次多的装备[8]。
动车组作为结构复杂的大型装备,宜采用分层融合式结构进行故障预测与健康管理系统的建设。系统物理部署可分为两层,总公司服务器部署在铁科院动车组技术中心,支持全路动车组的健康管理应用、通用模型的建立和训练;铁路局级服务器部署在各铁路局动车组技术分中心,支持铁路局范围内动车组的健康管理、通用模型的配置和个性化建模应用。
在逻辑结构上,动车组故障预测与健康管理系统划分为总公司级、铁路局级及动车(车辆)段级3层,分别与EMIS的总公司、铁路局、动车段层相对应,可逐级嵌入,进行故障、检修等数据的交互,形成紧密耦合的统一整体。其总体架构,如图2所示。
PHM系统设计为B/S架构,总公司级别的应用由铁科院动车组技术中心服务器集群支撑相关应用、计算和数据管理;铁路局级别和动车(客车)段级别功能均由各铁路局动车组技术分中心服务器集群支持,通过用户和权限管理区分不同层级的应用和不同属性用户的功能。PHM系统本身无车间级应用,故障预警、个性化检修周期配置等功能在段级PHM系统与EMIS进行交互,在车间级EMIS内部,通过计划及检修管理模块完成闭环管理。
图2 动车组PHM总体架构图
3.2 逻辑架构
参考铁路大数据应用体系架构[10],基于5大类26个小类基础数据,PHM系统逻辑架构自下而上划分为数据采集处理、数据管理、智能分析支撑、健康管理应用和用户访问5个层次,其架构,如图3所示。
(1)数据采集层:通过数据自动接入、人工导入和人工录入等方式,获取项目所需的监测、检测数据,运用检修数据等,通过对数据进行格式处理、清洗等操作,形成符合要求的数据,存储到主数据库。
(2)数据管理层:集中存储和管理经过结构化和标准化处理的监测、检测数据,业务数据以及知识库数据等,为数据分析打好基础。
(3)智能分析支撑层:为分析模型提供数据和模型运行环境,支撑分析模型的实现和评估。集中存储分析模型的运行结果数据和大数据挖掘及分析应用的各类指标数据,为后续更多的智能分析数据应用提供支持。
(4)健康管理应用层:完成健康管理的应用业务支撑,实现各种类型的健康管理功能,主要包括健康监测、预警预测、分析决策支持及模型管理等。
图3 动车组PHM系统逻辑架构图
(5)用户访问层:依托统一门户管理,通过单点登录,用户权限和安全管理,通过可视化报表、交互式操作、定制开发和页面功能集成,为用户提供灵活多样的访问方式,并保障用户访问功能时的数据安全及系统安全。
3.3 功能设计
基于视情维修的开放体系(OSA-CBM)[11]综合了现有PHM系统的共同设计思想、应用技术和方法,已在舰船、飞机、车辆等领域到初步的应用和验证,如图4所示。
图4 OSA-CBM体系结构
(1)数据采集与传输:利用各种无源和智能传感器采集装备系统的相关参数信息,作为数据基础,本部分具有数据转换和传输的功能。
(2)数据处理:接受传感器及其他数据处理模块的数据和信号,并将数据处理成后续状态监控、健康评估和故障预测等部分处理要求的格式。
(3)状态监测:接收来自传感器、数据处理以及其他状态监测模块的数据,然后将这些数据同预订的失效判断等进行比较来监测装备系统当前的状态,可根据预定的各种参数指标极限值/阈值进行故障报警。
(4)健康评估:进行被监测系统(子系统、部件)的健康状态评估,形成故障诊断记录并确定故障发生的可能性。
(5)故障预测:对被监测系统进行状态评估和预测未来的健康状态,包括剩余寿命、可正常工作时间等。
(6)自动推理决策:接收状态监测、健康评估、故障预测部分的数据,通过推理决策产生更换、维修等活动的建议与措施。
(7)接口:人–机器接口—数据信息表示与交互;机器–机器接口—各模块之间、PHM与其他系统之间的数据信息传递。
学生信息管理系统主要功能包括:学生基本信息和成绩的录入,浏览、查询、删除、修改及计算成绩等功能。功能分析如下:
动车组故障预测与健康管理系统参考OSA-CBM开放体系结构来进行地面系统的功能设计,主要包含4部分功能,即车组状态监控、故障分析、故障预警和维修建议支持。功能结构,如图5所示。
3.3.1 车组状态监控
车组状态监控模块全面监控全路动车组的运用状态及健康状态,通过对动车组健康状态的建模、定义和计算,关注车组运用情况,确保上线动车组状态良好,高效完成运营任务。模块分为全图车组状态和单车组状态查询两个功能:
(1)全图车组状态以全路动车开行线路图为依托,通过不同颜色标识健康状态不同的动车组,及其目前所处的运用状态(开行显示途中位置,检修显示检修地点),对于健康状态不达标的上线车组进行状态报警;
(2)单车组状态以车组的视角展示动车组健康状态,并追根溯源、逐层逐级地剖析动车组各系统及部件的健康状态值,并结合车组一车一档履历,给出进一步的跟踪或维修警示。
图5 动车组PHM系统功能构成图
3.3.2 故障预警
故障预警模块通过大数据、可靠性模型及机理模型等,对动车组部件、系统等故障发生规律进行建模,预测未来故障发生的时间、部位,动车组剩余寿命等属性。模块分为车组数据预警、系统可靠性预警、部件机理预3个功能。
(1)车组数据预警模块基于动车组运用开行历史、故障发生历史、车载故障历史数据、检修历史等,利用大数据平台及方法,从数据分析建模的角度预测故障的发生和发展趋势。
(3)部件机理报警根据动车组部件的组成和工作原理,构建模型,结合车载离线数据,预测部件故障的发生和发展趋势。
3.3.3 故障分析
故障分析模块针对动车组在开行途中及运用检修、高级修中发生的故障进行逐步深入的分析,全面描述故障发生的规律和趋势,根据不同的统计分析级别,又可以划分为远程故障报警及分析、故障基础性分析、故障率分析和可靠性分析4个功能:
(1)远程故障报警分析利用WTDS实时和离线下载数据,进行故障分析与报警。其中,实时报警数据根据不同级别,在全图车组状态页面进行复视;离线数据进入大数据平台,进行动态分析、相关分析和回归分析等。
(2)故障基础分析从故障发生的时间、里程信息、配属和担当属性、车型属性及故障发生结构点等维度,进行基础的描述性分析,通过可视化工具进行展示。
(3)故障率分析通过将故障发生的时间、里程、发生线别等信息的联合查询,显示故障沿各个维度的变化规律,通过百万公里故障率、平均无故障时间、平均无故障公里数等指标的计算,对不同维度的故障发生进行评价。
(4)RAMS分析模块从可靠性分析角度,通过设置可靠性、可用性、可维修性和安全性性能指标,对单车组和车型进行评估分析。
3.3.4 维修建议
维修建议模块通过动车组全生命周期中的故障数据和检修数据发生频率、检修频率、检修范围的划定,给出维修项目及维修周期的优化建议,辅助维修人员达到视情检修的目标,最大限度的节约动车组运用、检修的人力、物力和时间成本。该模块又可划分为全生命周期故障发生规律和检修项目与故障相关性两个功能。
3.4 接口设计
动车组管理信息系统接口,如图6所示。
图6 动车组管理信息系统接口
动车组故障预测与健康管理系统作为动车组管理信息系统的一部分,通过动车组管理信息系统获取众多系统的数据。
3.4.1 数据采集
5大类系统数据及人工导入数据统一接入动车组管理信息系统总公司级系统进行存储、管理,通过内部接口向动车组故障预测与健康管理系统提供健康计算所需的输入数据。
3.4.2 数据交互
动车组故障预测与健康管理系统同动车组管理系信息系统通过系统间接口服务器进行健康相关数据的交互。动车组故障预测与健康管理系统将动车组特征指标、健康状态评估、状态修任务等发送给动车组管理信息系统,后者将状态检修回填信息发送给动车组故障预测与健康管理系统子系统,进行迭代的模型计算,完成预警故障的闭环管理。
4 结束语
本文结合铁路总公司和铁路局实际情况,通过对用户、数据、功能等的需求分析,提出了一套动车组故障预测与健康管理系统建设方案,对于完善动车组运用检修信息化体系,实现动车组视情检修,提高动车组运用、维修效率具有积极的推动意义。
动车组故障预测与健康管理是动车组运用检修质量管理及技术管理工作的热点,能够有效减少动车组运营过程中故障引起的风险,提高运营效率。但除了系统建设本身,对于动车组故障预测与健康管理完整体系的建立,还应同步完成以下两部分工作:
(1)动车组构型数据的不断完善和优化。构型管理能够控制各个构型部件发生的变化,并在系统的整个生命周期内保证此部件的完整性和可追溯性,这对于研究部件乃至系统和车组的可靠性至关重要。
(2)动车组健康体系的建立是一个复杂、庞大的工程,每个环节的确定都需要大量的理论、实践的论证。