CRH3C型动车组人机接口显示屏惯性故障分析及整改措施
2015-06-01钱卿,周文
钱 卿,周 文
(1 广州铁路(集团)公司 车辆处,广东广州510088; 2 广深铁路实业发展总公司,广东广州518001)
CRH3C型动车组人机接口显示屏惯性故障分析及整改措施
钱 卿1,周 文2
(1 广州铁路(集团)公司 车辆处,广东广州510088; 2 广深铁路实业发展总公司,广东广州518001)
介绍了CRH3C型动车组HMI硬件结构、通讯机制与工作原理等,针对动车组运用过程中发现的4类HMI惯性故障,进行深入的原因分析,提出了有效地整改措施与运用建议。
动车组;CRH3C;人机接口显示屏;故障
近年来,随着我国铁路事业的快速发展,特别是客运专线建设的推进,动车组列车在铁路客运中承担着越来越重要的作用,CRH3C型动车组设计时速高,旅客乘坐舒适,承担了京津、武广等高铁线路的客运任务。
由于动车组连续运行时间长、运用环境复杂,CRH3C型动车组作为我国投入使用的第一批高速动车组,在运用初期,动车组设计不能完全适应我国实际运用环境的需求,尤其是作为动车组神经中枢系统的列车网络控制系统。所有通信、控制、设备状态监控和处理都依赖于网络,一旦网络系统出现问题,很有可能影响列车的正常运输秩序。
其中列车人机接口显示屏(Human Machine Interface,简称:HMI)作为列车控制网络系统的重要组成部分,存在黑屏、以太网中断等惯性故障,既影响司机操控列车,也可能因故障造成晚发、临停甚至换乘等影响运营秩序的事故,亟需对此进行深入分析,并提出针对性的整改措施。
1 HMI组成及工作原理
1.1 列车网络控制系统基本结构
CRH3C型动车组是动力分散型电动车组,采用8辆编组,分为两个牵引单元,每个牵引单元由2辆动车和2辆拖车组成。整车采用TCN网络控制系统,列车级使用WTB总线,车辆级使用MVB总线[1]。CRH3C型动车组的列车网络系统拓扑结构为一列车两个MVB车辆网络,为反对称结构,每个MVB网络上均有WTB/MVB网关,两个MVB网络经过网关通过WTB进行列车级通信。半列车网络的拓扑结构如图1所示。
CRH3C型动车组共装有5台HMI,其中4台是司机HMI,每个头车司机室内各安装2台,采用左右冗余对称布局;1台机械师HMI安装在5车机械师室内。所有HMI均接入MVB总线,通过MVB总线与列车网络控制系统实现数据交互。HMI的主要功能是帮助司机(机械师)掌握列车当前各子系统的工作状态、便于司机(机械师)按不同权限对列车施加控制指令,以及实现整车运行情况综合诊断。
1.2 HMI硬件结构
CRH3C型动车组HMI硬件由嵌入式计算机、环境控制器、MVB控制器、TFT显示器和各种外围接口组成,硬件结构如图2所示。
1.3 HMI通讯机制
CRH3C型动车组HMI主要对外接口是MVB和以太网,其中MVB接口用于接入MVB总线,从而与列车网络控制系统进行交互;以太网口用于司机HMI左右屏之间的数据同步。
HMI使用的MVB数据包括过程数据和消息数据。过程数据用于获取网压、网流、本牵引单元车门、照明等子系统状态,本牵引单元各关键部件温度等信息。此外,HMI跳动信号也通过过程数据发送。消息数据用于获取受电弓、主断路器等子系统状态,司机(机械师)对空调、照明等系统的指令也通过消息数据发送。不同牵引单元之间的HMI采用私有消息数据协议进行通讯,从控单元的HMI通过WTB网关将本单元的子系统状态以及本单元的列车故障信息向主控单元HMI发送。
1.4 HMI冗余设计
由于HMI是司机掌握列车状态,施加控制指令的重要设备,因此CRH3C型动车组对司机HMI采用了主从式冗余设计。每个司机室内配备有2台司机HMI,采用左右式布局,默认状态下,右屏为主屏,左屏为从屏。
图1 半列车网络拓扑结构
图2 HMI硬件结构
主屏是列车的诊断中心,负责采集各子系统诊断数据,并对这些数据进行融合,进而实现整车的综合故障诊断。为了保证列车诊断功能稳定可靠,从屏会始终监测主屏的心跳信号,当主屏故障时,从屏自动重新配置,切换到主屏模式;当主屏故障恢复时,当前工作在主屏模式下的从屏会自动恢复到从屏模式,防止功能冲突。
2 HMI惯性故障现象及原因分析
2.1 HMI黑屏故障
故障现象:动车组正常运行途中,偶发HMI无任何显示,等同关机状态,且无法自动恢复,发生该故障后,按照相关操作规程,司机需立即停车处理,并占用一定时间进行恢复操作,极易形成临停、造成列车晚点。如2015年1月15日,CRH3C-3054车组担当G6224次交路时,由于HMI黑屏导致列车临停6分;2014年1月18日,CRH3040C+037C车组担当D7802次交路时,由于HMI黑屏造成临停21分。
原因分析:
(1)看门狗失效
HMI设计了硬件看门狗,HMI应用软件必须定时更新看门狗心跳信号,以表明软件工作正常。当HMI应用程序出现处理器阻塞,而心跳信号未能及时更新时,看门狗控制器出于对HMI软件的保护目的,会自动重启,在连续3次重启后,需要人工干预进行重新开机,从而发生HMI发生黑屏故障。
(2)环境控制器通讯异常
HMI的显示器背光由环境控制器控制,环境控制器与HMI内置的嵌入式计算机通过串口进行通讯。如果二者之间的通讯出现异常,环境控制器有可能会自动关闭显示器背光,造成HMI发生黑屏故障。
2.2 HMI“问号”故障
故障现象:动车组正常运行途中,偶发HMI会出现某子系统(如制动、空调、照明、车门)的状态无法正常获取,对应于该子系统的显示页面为问号。发生该故障时,司机无法得知该子系统的状态,尤其是涉及行车相关的制动或车门状态,在状态未知时,司机为安全起见,可能会停车进行故障排查,稍有延误,可能导致列车临停甚至晚点。
原因分析:
(1)HMI作为列车诊断中心,需要实现整车综合诊断功能。因此各从控单元主屏,需向主控单元主屏发送本单元的故障信息。此外,各从控单元HMI还需向主控单元HMI发送本单元各子系统的状态数据。为保证列车运行安全,按照故障导向安全原则,故障信息的处理优先级高于状态数据。因此,当故障信息较多时,主控单元HMI有可能出现数据通讯拥塞,无法及时更新其他单元的子系统状态,进而导致子系统状态无法显示故障。当列车重联运行时,由于牵引单元数量增多,网络通信延时加大,发生该故障的可能性也相应增大。
(2)当从控单元的主屏发生黑屏时,不再向主控单元发送故障信息与状态数据,也可能导致主控单元无法显示该单元所采集的子系统数据。
2.3 以太网中断
故障现象:动车组正常运行途中,偶发司机左屏和右屏之间以太网通信中断的故障。由于HMI左右屏之间通过以太网进行数据同步,因此以太网通信中断会导致左右屏之间的协调工作出现问题,给司机操作带来不便。
原因分析:HMI显示屏目前采用的以太网控制器型号较为落后,驱动软件可靠性不高。同时,由于司机室左右屏之间通过以太网进行数据同步,因此当数据吞吐量较大时,可能偶发以太网控制器驱动崩溃或硬件异常,造成以太网通信中断,甚至触发HMI操作系统异常退出。
2.4 操作系统崩溃
故障现象:动车组正常运行途中,偶发HMI操作系统崩溃,一旦发生,HMI软件会退出正常程序与图形界面模式,无法继续实现监控功能,影响司机对列车的操控。
原因分析:目前HMI目前采用的操作系统版本为Microsoft Windows 3.11版本,运行可靠性不足。当列车持续运行时间较长,或数据处理负载较大时,有可能由于操作系统自身原因发生系统崩溃,造成HMI应用软件退出,无法继续实现功能。
3 HMI故障整改措施与运用建议
根据上述故障现象及原因分析,结合CRH3C型动车组的运用经验,制定了如下有针对性的整改措施。
3.1 HMI故障整改措施
(1)操作系统及软件升级
原有CRH3C型动车组HMI软件设计中,过多的考虑了设备的自我保护功能,无法适应我国高速铁路对运营秩序的严格要求。因此,改变原有设计思路,采取了延长硬件看门狗激活的时间,降低因未及时喂狗导致HMI关闭的发生几率;同时,为防止由于操作系统崩溃导致的HMI故障,基于高可靠性的嵌入式实时操作系统QNX[2],重新研发HMI应用软件中,提高系统软件的可靠性。
(2)优化通讯机制
为避免由于数据通讯拥塞导致的子系统状态无法显示故障,需要优化HMI通讯机制,改变了原有系统各牵引单元间定时完整同步故障的方法,采用故障数据响应式更新机制,仅当本单元故障信息发生变化时,才向主控端HMI发送数据,并且对同步发送的数据采用压缩机制,从而极大地减小了数据通讯负载,降低了发生数据拥塞的可能性。
(3)研制与使用自主化HMI硬件
采用工业级嵌入式计算机,结合嵌入式实时操作系统,研制自主化的HMI硬件,采用工业控制领域的主流以太网控制芯片,从根本上解决了以太网控制器硬件可靠性低导致的故障,同时解决了HMI硬件的质量保证期结束后维修成本高的问题。
3.2 运用建议
(1)强化现场作业人员应急处理能力
动车组网络控制系统技术先进、逻辑复杂,HMI是网络控制系统显示列车状态、施加控制指令的重要设备,当HMI发生故障时,对相关技术人员的应急处理能力提出了较高的要求。为防止技术人员在现场采取措施不当,延误故障应急处理,应依据《CRH3C型动车组应急故障处理手册》,加强对司机、随车机械师的培训,并适当安排故障处理演练。
(2)加强HMI软件维护管理
动车组HMI作为人机交互的接口,当网络控制系统有逻辑调整、问题修正或新的功能需求时,都会发生对应的软件更新。有关软件管理人员应加强显示屏软件维护,及时更新软件版本,降低软件故障风险。
(3)加强HMI运用情况跟踪
在实际运用过程中,为保证应急指挥人员能及时准确掌握故障现场信息,地面检修人员能完整全面了解列车故障数据,应充分利用高速动车组远程无线传输系统[3]加强对显示屏的运用情况跟踪;当某列车HMI出现故障时,应举一反三,分析故障规律,及时制订解决方案并推广,避免同类故障再次发生。
4 结束语
通过对CRH3C型动车组HMI惯性故障现象进行统计与原因分析,制定了有针对性的整改措施。同时,在动车组实际运用过程中,动车组设计、运用和检修部门还需要密切协作,对运用过程中的各类问题进行深入总结和分析,不断完善整改措施,才能有效地减少故障发生次数,消除惯性故障,提高动车组运用效率。
[1] IEC 61375-1 Train Communication Network Protocol[S].
[2] 程 斐,苗克坚,王瑞敏,等.QNX与VxWorks的特性分析和实时性能测试[J].计算机工程与设计,2008,18:4734-4735.
[3] 黄志平,赵红卫,朱广超,等.高速动车组远程数据传输系统的研究与实现[J].铁道机车车辆,2011,34(1):33-36.
Failure Analysis and Lmprovement Design of Human Machine Lnterface for CRH3C
QIAN Qing1,ZHOU Wen2
(1 Car Department,Guangzhou Raiway(Group)Corporation,Guangzhou 510088 Guangdong,China; 2 Guangshen Raiway Industrial Development Corporation,Guangzhou 510088 Guangdong,China)
The hardware structure,communication mechanism and working principle of Human Machine Interface(HMI),which is installed on EMU CRH3C,is described in this article.The reason of inertia failures during EMU operating are discussed and analyzed,improvement design is also proposed.
EMU;CRH3C;HMI;failure
U260
A
10.3969/j.issn.1008-7842.2015.02.26
1008-7842(2015)02-0107-03
)男,高级工程师(
2015-01-12)