基于DMS传输平台的CTCS3-300H ATP车载设备数据无线下载及分析系统设计
2024-02-22赵志鹏高占盈黄红强张宇
赵志鹏,高占盈,黄红强,张宇
列控系统是保障高速列车运行安全的核心装备,其中ATP车载设备连续、实时监督列车运行,实现超速防护功能[1-2]。截至2023年5月,CTCS3-300H型(简称“300H型”)ATP车载设备已配属12个铁路局,装备各型动车组200余列。随着ATP车载设备现场运营数量与日俱增,运维标准也在提高,这对列控车载设备厂家,以及各铁路局集团公司的电务处、电务段、车间提出了巨大挑战。针对当前300H型ATP车载设备维护存在的数据下载接口多、下载时间长、下载和分析软件种类繁多、各种分析软件交叉分析关联性弱等问题,引入先进的检测手段,提升设备信息化、智能化检测和运维技术水平是十分必要的。
当前铁路信号行业对列控车载设备数据无线下载及分析的研究还处于研究推广阶段,目前运用的系统主要下载ATP车载设备安全计算机的运行数据,无法覆盖所有车载设备关键单元;下载数据通常以天或车次为单位,并且需要完整下载全部数据后再进行分析,既浪费无线带宽资源又影响分析效率。在深入研究列控车载设备技术和运用维护经验基础上,本文通过对车载设备关键单元记录数据的梳理和关联性分析,根据300H型ATP车载设备系统架构,设计了基于动态监测系统(DMS)传输平台的ATP车载设备无线下载及分析系统。下载数据覆盖ATP车载设备所有关键单元,通过车载端实时感知设备异常,触发系统进行ATP设备运行日志信息的自动下载和智能分析,提升电务部门的工作效率,为电务部门的日常维修、应急保障提供可靠依据,为车载ATP设备的安全、高效运维提供技术支撑[3]。
1 系统总体架构及功能分配
基于DMS传输平台的ATP车载设备数据无线下载及分析系统主要由ATP数据无线下载单元(DWDU)、ATP日志分析工作站、智能诊断分析终端3个部分组成[4],系统结构见图1。其中,DWDU实时采集并存储ATP的记录数据,实时感知ATP设备异常状态并推送给地面设备,利用既有的DMS传输平台,经过MTUP(Unified Mo⁃bile Data Transmission Platform for Railway)安全平台实现高可靠性的数据无线传输[5-6];ATP日志分析工作站通过与DMS传输平台服务器交互实现数据下载,根据ATP车载设备单元类型实现数据分类存储,同时ATP日志分析工作站作为服务器端为多个智能诊断分析终端提供数据下载服务;智能诊断分析终端可实时获取管辖列车ATP车载设备的异常状态,自动下载故障时间段车载设备关键单元的运行数据,智能诊断分析故障原因,给出建议处置措施,并提供历史故障查询和统计服务。
图1 基于DMS传输平台的ATP车载设备数据无线下载及分析系统结构
本系统主要实现以下功能。
1)ATP车载设备双系多通道的并行采集,采集数据包括安全计算机(VC)、无线传输模块(RTM)、应答器传输模块(BTM)、轨道电路信息读取器(TCR)和GSM-R电台(MT)等的数据,覆盖ATP车载设备各关键单元。
2)对ATP车载设备异常的实时感知。DWDU检测到ATP异常后,通过无线传输通道和ATP日志分析工作站将异常信息推送给智能诊断分析终端,终端进行报警提示并启动异常时间段数据自动下载流程。
3)系统通过统一的无线下载接口,提供异常数据自动下载、电务维护人员按需下载2种无线下载方式。车载设备在上电情况下均可实现无线下载,不影响列车运行。
4)对传输数据进行压缩和加密处理,数据存储基于时间片索引,同一索引数据仅需下载一次,在保障数据安全性和完整性的同时,降低了无线数据流量的使用。
5)发生异常事件时间段的数据下载完成后,系统自动进行诊断分析,生成分析报告并给出建议处理措施。
6)根据设备历史运行规律和异常故障统计信息,分析设备状态趋势,协助维护人员对潜在故障做出预判和提前处置。
2 系统设计
2.1 ATP数据无线下载单元
2.1.1 硬件设计
ATP数据无线下载单元由核心处理模块、数据传输模块、数据采集模块和电源模块组成[7],通过以太网接入DMS传输平台。
1)核心处理模块。采用64位四核Cotx-A55架构,主频高达1.8 GHz,内部集成Mali-G52高性能GPU,结合2 GB DDR4内存和16G ROM空间,提供了强大的数据处理能力;负责对采集数据进行预处理,识别ATP异常状态,对采集数据进行压缩和加密处理并实现数据存储;与数据传输模块交互通信,实现请求数据的检索、获取和组包,以便于传输给DMS传输平台;为系统提供基于IEEE 1588标准的精确时间协议时钟,通过一个周期性的同步信号对无线下载单元内网络上所有节点的时钟进行同步校正,从而保证数据采集的时效性。另外还预留了高速USB2.0接口,可支持通过USB移动存储设备高速下载数据。
2)数据传输模块。为无线下载单元内模块间通信提供高速以太网、串口、CAN总线等多种通信方式,并通过与外部DMS传输平台交互通信,实现车上数据通过无线网络传输到地面。
3)数据采集模块。通过RS-232接口采集ATP设备的VC1系、VC2系、RTM1系、RTM2系数据;通过以太网接口采集BTM、TCR和MT数据。
4)电源模块。可独立控制DWDU上下电,DWDU上电时,采用延缓启动100 ms的方式,以错开DMS车载主机的上电冲击时间段,避免造成对电源负载的影响。
DWDU除了拥有强大的数据处理、多样的数据采集、高速的数据通信等能力外,还具备模块状态自检能力,方便状态获取及远程维护。同时DWDU与ATP车载设备采用既有接口进行通信,接口采用电气隔离、数据单向传输的方式,实现DWDU故障后不影响ATP车载设备正常运行的安全要求。
2.1.2 软件设计
ATP数据无线下载单元软件由数据交换模块、数据存储模块和维护模块组成,软件架构见图2。
图2 ATP数据无线下载单元软件架构
1)数据交换模块。通过实时接收ATP主机VC、BTM、RTM等的日志数据,初步识别异常状态信息,并对采集数据进行压缩和加密处理,然后转发到数据存储模块进行持久化存储。同时响应地面系统的数据请求,将数据通过DMS传输平台回传到地面。
2)数据存储模块。具备数据分类存储和日志记录功能,可将不同单元和系别的数据按照时间片索引方式进行存储,方便地面按需下载。
3)维护模块。支持设备维护人员通过USB移动存储设备现场快捷下载车载数据,同时支持在DW⁃DU软件升级和定期维护保养过程中监控单元运行状态。
2.2 ATP日志分析工作站
ATP日志分析工作站部署于路局站段数据中心,通过与DMS传输平台服务器的交互通信实现车载设备数据无线下载,工作站主要实现以下功能。
1)与DMS传输平台服务器交互通信,获取落地的车载数据。
2)对下载数据进行分类存储。
3)支持为多个智能诊断分析终端提供数据下载服务。
4)支持存储智能诊断分析终端上传的分析记录,并为终端提供查询统计服务。
5)为智能诊断分析终端提供软件授权、更新、用户登录和权限管理等服务。
2.3 智能诊断分析终端
智能诊断分析终端部署于电务段维修工区,主要是对通过DMS传输平台获取的ATP车载数据进行智能诊断分析,实现ATP车载设备状态的实时监控。针对异常信息实时报警,启动异常时间段车载数据自动下载功能,完成数据下载后自动进行诊断分析,生成分析报告并给出建议处置措施。同时终端提供管辖列车历史故障查询和统计功能,可辅助电务人员分析设备状态趋势[8]。智能诊断分析终端功能结构见图3。
图3 智能诊断分析终端功能结构
3 关键技术及特点
3.1 无线数据下载智能控制
为充分利用车地数据传输资源,减少冗余数据的重复下载,系统采用控制状态机以按需下载的方式控制数据下载,数据下载控制状态机见图4。ATP日志分析工作站在收到来自智能分析终端的数据下载请求时,若本地已经存储有相关数据,将自动从本地获取,从而减少对车地数据流量的消耗。
图4 数据下载控制状态机
系统将所有下载任务加入预约管理[9],实时检测车载是否在线,对已上线车载设备,根据下载任务中的时间和数据类型,由ATP日志分析工作站通过DMS传输平台将下载数据请求发送到车载端,车载端进行相应数据的响应。若超过规定请求次数,车载端仍未完成数据下载,系统将该请求任务置为超时任务,并从预约管理队列中删除。
系统采用基于标准的通用协调时间(Univer⁃sal Time Coordinated,UTC)的时间片索引进行数据存储,通过解析数据请求中包含的时间段信息,ATP日志分析工作站首先检索本地是否存储该时间段的数据,若本地包含全部请求时间段数据,则直接将本地数据返回给终端;若本地包含部分请求数据,ATP日志分析工作站则将请求数据任务分解为多个子任务,仅将未下载的数据请求加入系统的预约管理,待完成所有子任务的数据下载,再组包返回给终端;对于本地不存在的请求数据,ATP日志分析工作站将终端的数据请求作为一个完整的请求任务,待完成数据下载,直接返回给终端。完成数据下载的任务将从预约管理队列中清除。
3.2 传输通道利用率优化
车载无线通信面临的一个典型问题是受公网信号覆盖范围影响,通信质量优劣浮动较大。针对这种情况,车载端需要进一步优化无线传输通道利用率。当检测到通道质量较好时,提高数据传输速率,尽可能多地传输数据;当检测到通道质量较差时,降低数据传输速率,减少无效的数据传输。
为实现上述目标,车载端通过对车地数据重传率(单包数据从传输到地面确认之间重传的次数)进行统计,将通道质量分为“优”“良”“中”“差”4个等级。当通道质量为“优”时,将车地间通信的滑动窗口动态调整到最大,最大限度提高发送车载数据的速率;当通道质量为“良”时,将滑动窗口动态调整到最大值的75%,尽可能多地在单位时间内传输数据;当通道质量为“中”时,将滑动窗口动态调整到最大值的50%,通过减少单位时间内发包数来减少对通道资源的浪费;当通道质量为“差”时,将滑动窗口动态调整到最大值的25%,最大限度减少单位时间内滑动窗口内待发送的数据量,提高数据确认包的命中率,进而提升通道利用率。同时为减少因通道质量抖动造成滑动窗口频繁调整的问题,滑动窗口调整策略会有一定的延迟性,只有当通道质量持续维持在一个等级超过一定时间时,车载端才会调整窗口大小。
3.3 QoS调度算法
为应对动车组高速运行过程中数据传输的不稳定性,同时由于系统对车载数据进行分析需要涉及不同单元、不同系别和不同时段的数据,系统通过引入服务质量(QoS)调度算法对传输数据队列进行管理,确保各类数据在传输中得到及时调度。
VC、BTM、MT等不同种类的业务数据根据数据传输需求进入到统一的调度队列。调度队列基于报文的公平调度(Round-Robin,RR)算法[10],对每一种业务数据进行轮询调度。如果出现轮询的队列不为空,则从该队列取走一个报文;如果该队列为空,则调度器不等待直接跳过该队列。调度队列中的数据依次发送到地面,确保每种业务数据均能在有限的上线时间内落地,提升地面数据协同分析的时效性。基于RR算法的QoS调度队列示例见图5。
图5 QoS调度队列示例
3.4 基于语义分析构建专家知识库
ATP车载设备结构复杂、运行环境多变,特别是对于CTCS-3级列控系统,因列车运行速度快、基于无线网络通信、车地交互信息量大等特点,为获取发生故障的原因,需要专业技术人员基于完整的列控系统车载、地面和无线网络监控数据进行综合分析判断。
基于对ATP车载设备关键技术的深入研究和设备长期运用的丰富经验,系统结合大量的ATP车载设备运行数据,利用语义分析引擎对ATP车载设备历史故障分析报告和各关键单元运行数据进行特征信息提取;对大量、多源、异构的非结构化数据进行智能解析;结合业务逻辑建立ATP故障信息与ATP运行数据特征值的多层次映射关系,进而构建包含故障类型、故障状态迁移信息、故障建议处置措施等关键特征的专家知识库,从而为智能诊断分析奠定基础。可结合现场运行情况的迭代更新,不断丰富专家知识库内容。
3.5 采用智能分析算法实现数据诊断分析
首先,系统对运行数据进行筛选,标记存在故障信息的数据并获取数据特征信息,数据特征包含等级、模式、速度、关键单元是否故障、关键单元故障状态码、关键单元故障前状态迁移情况等,然后进行规范化处理形成导入信息;其次,结合专家知识库,分别采用基于正向推理策略的推理引擎[11]、基于分类与回归树CART算法的决策树[12]、模糊贝叶斯网络[13]3种数据智能分析算法,获取分析结果;最后,采用决策融合的方式对基于3种算法生成的分析结果进行表决,获取最终输出结果。
对于确定的输出,系统可形成包含故障内容、故障原因分析和故障建议处置措施的分析报告;对于复杂场景下智能分析诊断结果不确定的情况,系统将在描述故障现象的同时,提示运维人员进一步通过手动方式下载车载、地面和通信网络等多源数据,通过专业技术人员人工分析来准确定位故障原因,防止系统故障诊断分析出的故障原因和建议处置措施干扰运维人员的判断。
综上所述,系统通过实时感知ATP车载设备故障,自动实现ATP车载设备关键单元数据的按需下载,对下载数据进行预处理后,结合专家知识库,通过智能分析算法对故障进行分类识别,并给出建议处置措施,最终生成故障分析报告。以CTCS-3级列控系统车载设备运用过程中故障出现频次较高的无线通信超时问题为例,系统处理流程示例见图6。
图6 无线通信超时故障处理流程示例
4 结束语
基于DMS传输平台的ATP车载设备数据无线下载及分析系统的研制和运用,实现了对ATP车载设备运行数据的自动下载、智能诊断分析及自动生成分析报告,解决了目前300H型ATP车载设备故障时无法及时准确掌握和运维数据分析效率低两大难点,为300H型ATP车载设备状态监测及运维提供了高效便捷的解决方案,提高了ATP车载设备异常状况从发现到处置过程的及时性和有效性,缩短了故障处理周期及故障持续时间,提升了车载设备信息化、智能化检测和运维技术水平,进而保障列车运行安全及运输组织效率。