TSP轨旁安全平台硬件功能故障检测平台的研究与实现
2021-06-29卡斯柯信号有限公司郑重虎董高云
卡斯柯信号有限公司 郑重虎 张 彬 董高云
本文介绍一种系统化的硬件检测平台,应用于排查TSP轨旁安全平台的硬件功能故障,以解决TSP平台机柜的出厂检验测试鉴定和排除TSP平台硬件问题需要。本文描述了TSP平台需要检测的硬件及其功能,根据检测功能需求,设计出合理有效的检查方法,并对这些方法进行系统化架构,构成一种系统级的检测平台,并将其划分为TSP平台的功能化测试和老化测试两大部分,如果需要,可以精简到单板级测试。该检测平台已应用于TSP平台机柜出厂检测和自查TSP平台硬件功能故障,事实证明该检测平台可有效、准确定位出未知的硬件问题,防止将隐藏的硬件问题带到现场应用。
TSP轨旁安全平台是卡斯柯信号有限公司研发的全自主化轨旁安全计算机平台,该平台已产品化应用于区域控制(ZC)、线路控制(LC)和通信服务器(CCS)等地铁和铁路的信号系统中,这些轨旁上层应用系统通过平台提供的接口,实现与外部设备通信,依靠平台的2乘2取2系统架构、热备冗余和BIT自检等重要功能,保证整个信号系统的安全等级达到SIL4级要求。
TSP平台应用越来越多,其系统硬件架构复杂,若应用于现场开通运营和实验室开发测试,需事先保证整套机柜的硬件设备功能具备条件,这种要求下,不可能依靠人工去一个个检查测试每个硬件设备,所以需要设计出一套系统化的测试软件,达到高效准确的测试出机柜上重要设备的功能具备发往现场和实验室使用的条件。研发TSP硬件功能测试平台的目的是为TSP平台机柜出厂功能测试、设备进货检验、设备维护与硬件故障排查,以及为TSP平台老化测试提供可用的测试软件,将TSP平台做成产品化。TSP硬件功能测试平台不仅能测试系统部件级功能和系统老化功能,还可以精简到测试单板级功能,其中,系统老化测试的时间至少得两天。
1 TSP硬件功能测试平台架构设计
TSP硬件功能测试平台的实现目标是提供一种功能齐全、性能稳定、灵活方便和自动化的测试平台,具体如下:
(1)功能齐全方面,测试TSP平台所包含硬件的内部功能和外部功能是否正常,其中,硬件包括MCU前后板、MPU前后板、VPS前后板、串口通信板、维护台SDMS、切换单元STBY、网关GGW、风扇设备、电源模块等。
①硬件的内部功能主要是MCU前后板和MPU前后板所包含硬件的自身功能,不需要与外部硬件进行功能交互,MCU模块包括内存检测、计数器、FLASH、安全时钟、LED显示;MPU模块包括内存检测、计数器、FLASH、温度、电压。
②硬件的外部功能主要包括设备间的串口通信和网口通信,及其它需要与外部硬件进行交互的功能。
(2)性能稳定方面,大量测试数据包通过网络或者串口发送和接收不出现丢包、错误包现象,数据包有两种,一种是板级之间的测试数据包,另一种是执行单元测试结果通过网络向控制单元发送的数据包。
(3)灵活方便方面,测试者根据测试需要,选择想要测试的模块,可以是一种硬件设备,也可以是若干种硬件设备组合,或者是设备上的某些特定功能。
(4)自动化方面,测试一旦开始,不需要人为干预,测试完成后自动生成测试报告,测试者通过该报告知道测试结果,成功或者失败。如果测试失败,测试者也可通过该报告知道功能测试失败之处。
测试平台的系统结构如图1所示,该系统由外部电脑、测试交换机和TSP平台三大部分组成,其中,外部电脑上运行测试软件的界面终端,通过一根RJ45网线连接在交换机上,与TSP平台相互通信。
整个测试系统设计分为控制单元和执行单元两部分,控制单元相当于测试监控中心,通过操作界面上的控制按钮实现相应的测试操作,由执行单元完成。图1中,外部电脑设计为控制单元,TSP平台设计为执行单元。
图1 TSP硬件功能测试平台系统结构图
1.1 控制单元介绍
控制单元设计着重使用方便,功能齐全,能够及时接收显示测试结果,测试结束后生成测试报告,并且界面上按钮的图示含义应直观明了。根据测试功能的需要,界面上控制按钮的设计包括“开始握手”、“停止握手”、“开始测试”、“停止测试”、“查询”、“重启”和“测试设置”等,如图2所示。执行单元在测试执行过程中将测试结果报告给控制单元,报告方式分为实时报告和汇总报告两种,控制单元根据与执行单元事先约定好的通信协议数据格式,对报告内容在后台进行筛选过滤,对测试不合格的单项进行红色警告标记,最后生成测试报告,表明测试成功或者测试失败,并自动保存在本地设定的路径下。
图2 控制单元设计图
图3 TSP硬件功能测试平台测试流程图
1.2 执行单元介绍
执行单元为测试的设备对象,主要依据TSP平台的系统组成,由多个子系统组成,设计所包含的内容比控制单元多,也较复杂,主要包括:
(1)测试硬件环境,除满足TSP平台本身的系统架构外,还需满足控制单元和执行单元之间的通信环境,如图1所示。
(2)测试程序和配置文件的存放、读取和更新方式用起来方便高效,主要是MPU、MCU、维护台SDMS和网关GGW这四部分。
①MPU的测试程序和配置文件存储在专用优盘中,优盘插在MPU板卡的USB接口上,优盘的内容可通过PC机直接拷贝或者删除。
②MCU的测试程序和配置文件存储在专用小扣板中,小扣板安装到MCU板卡上,可插拔使用,小扣板的内容可通过烧录工具拷贝或者删除。
③维护台SDMS可通过操作系统界面人工直接操作将测试程序安装到指定目录中,将配置文件拷贝到指定目录中。
④网关GGW可通过专用优盘插入设备专用的USB接口上,将测试程序和配置文件更新到指定目录中,GGW设备LED屏上显示“更新完成”后拔出优盘,烧录完成。
其中,配置文件中包括:各子系统之间网口通信测试IP,和与控制单元通信使用的IP;包括串口通信测试相关的端口对接设置。另外,硬件内部功能的测试无需进行相关配置。
(3)对风扇设备的测试基于HTTP协议,设计一套适用的WEB文件,设置风扇工作的用户名和IP地址,通过调试线将风扇工作所需的WEB文件上传到风扇存储单元中。
(4)系统功能测试设计在一定时间内完成,根据测试内容评估,设计为500秒。
(5)为加快测试进度,测试通信容量大的对象设计在不同测试任务内完成,如串口测试任务和网口测试任务;能够很快完成测试的对象可直接串行测试。
图4 TSP硬件功能测试平台测试报告图
(6)系统运行老化测试时,下位机测试软件模拟现场使用应用软件的运行流程,现场实际用到的所有功能都应被测试到。
(7)设计带有定位到板级或部件级的故障追踪功能。
(8)测试结果数据量较大,采用及时上传和非及时轮转上传方式给控制单元显示,根据测试数据量大小,硬件内部功能测试结果设计采用及时上传方式;硬件外部功能测试结果设计采用非及时轮转上传方式,每隔一段时间上传几百包数据,保证执行单元发送不丢包和控制单元接收不丢包。
2 TSP硬件功能测试平台架构设计实现
整个测试为上电自启动环境,即整个机柜上电,执行单元的测试程序各自完成初始化,监听控制单元发送的测试指令,执行单元接收到指令后开始执行相应的测试过程,系统功能测试或者系统老化测试,其中,系统老化测试的执行是通过MCU、MPU、SDMS和GGW测试程序加载TSP平台中各CPU的目标文件和配置文件而实现的。正常测试过程是先进行系统功能测试,确保TSP平台硬件没问题后,再进行系统老化测试。
根据第2章节测试平台的架构设计和TSP平台系统组成,整个测试平台的测试实现过程如图3流程图。测试之前准备好测试环境,机柜中各子系统镜像及相应的测试配套应用程序应在测试前分别安装到各子系统的指定加载区。每次断电重启系统,控制单元可不重启,执行单元需要重启,重启完成后需要重新握手才能再测试,待测部件握手成功后进行设置,设置成功后方可开始相应测试。测试结束前,控制单元统计接收到的测试结果数据,生成测试报告,告知用户本次测试是PASS(如图4(a))还是FAIL(如图4(b)),如果是FAIL,报告中显示对应板卡的测试不通过。其中,图4(a)和图4(b)中“部件功能测试”即为“系统功能测试”。
每次关闭测试平台时,记住检查是否将所有测试都停止,若没有停止,很可能在下次打开时再次开始同一次测试,这样会造成该测试不能正常停止,如果造成这样的情况可通过测试平台的重启功能恢复,或者通过断电测试机笼的方法硬重启测试系统。如果测试过程中,因为误操作造成不可控情况,可尝试重启硬件环境和测试平台,重新开始测试。
结论:TSP硬件功能测试平台不管是控制单元设计,还是执行单元设计,包含的内容层次都比较清晰,易懂易操作,用户容易接受使用。实际应用中,测试平台有效检测出了TSP平台硬件在出厂时的各种不符合项,防止了现场应用中硬件隐患的发生,从而保证TSP平台在现场稳定运营,如北京房山地铁线TSP机柜SDMS网口新老驱动问题,无需人工审核,通过TSP机柜出厂测试确保SDMS网口安装的是新驱动,老驱动网络接收数据效率相对来说较低,甚至有时出现丢包现象;实验室调试测试过程中,对遇到问题怀疑是TSP平台某方面硬件引起时,可通过测试平台进行单板级测试排查,提高解决问题的效率。因系统功能测试的内容较多,一轮测试下来时间较长,测试执行效率有待进一步提高,下一步可通过改进测试策略和测试任务逻辑,进一步找到有待优化提高的空间。