ATP 车载设备智能检修管理关键技术及应用
2023-11-21康仁伟衣沛然
戴 博,康仁伟,李 科,王 彧,衣沛然
ATP 车载设备是保障动车组运行安全的关键设备,其日常检修是支撑设备正常运转的必要手段。目前各铁路局集团公司主要采用传统的检修方式,人工编制检修计划,携带检修记录单和摄像手电等上车作业,作业完成后再手动填写检修记录,检修效率低下,过程监控缺失,信息统计困难,严重制约了ATP的检修效率和安全保障能力。
按照工业4.0 战略部署和技术引领,传统的铁路行业急需数字化升级改造[1],并逐步向智能化发展。文献[2]从建设、装备、运营三大业务主线出发,搭建了集业务、应用、数据、技术、评价和标准为一体的我国智能高铁体系架构;文献[3]将高铁作为一个复杂系统,从系统论的角度,构建了高铁建设、运营、管理的系统模型。这2 个文献从宏观的角度,顶层设计了智能高铁未来发展的蓝图和技术发展方向。在铁路信号领域,自动驾驶、智能调度指挥和智能运维被认为是高速铁路信号系统的3 大典型智能技术[4-5]。由此可见,ATP日常检修的全程信息化管理是实现智能运维的必然要求,也是实现从预防修到状态修转变的必然途径[6-8]。文献[9]提出了一种ATP 车载设备全路通用的唯一标识编码方案,以二维码的形式粘贴在设备固定位置,为检修管理快速精准地识别特定设备提供了技术保障;文献[10]设计了一种基于手持终端的ATP 作业检修系统,重点说明手持终端在检修作业中的功能,但是缺少整体的架构设计和流程规划。
综上所述,本文研究ATP 车载设备智能检修管理系统,实现设备从检修计划到检修过程,从检修结果到统计分析的全程信息化和智能化,具有重要的现实意义。
1 ATP设备智能检修管理需求分析
从2008年京津城际开始,全路ATP 车载设备在将近10年的时间内统一采用固定周期、固定项目的检修方式,设备一级修平均每天做一次,二级修平均每个月做一次。随着ATP 设备数量逐年递增,检修任务量越来越大,迫切需要提质增效,减轻现场职工的作业负担。此外,设备运用趋于稳定,故障率逐年下降,说明固定周期的检修必要性降低。因此,从2016年开始,上海局集团公司率先开始ATP 车载设备修程修制的改革探索,适时延长检修周期并调整检修项目。
为进行差异化检修,提出了“检修包”的概念,即用户可以根据实际需求,集合若干条检修项目构成一个检修包。例如所有一级修的无电项目组成一个检修包,当本次列车入库时,可以只按照该检修包的条目和要求作业。除了灵活定义检修包的内容之外,每个检修包的周期也可以灵活配置。由此,形成了以检修包为核心的检修方案。
在既有检修模式的基础上,ATP 车载设备智能检修管理系统整体需求如下。
1)灵活配置检修周期和项目。全路ATP修程修制改革鼓励检修单位根据实际情况制定检修项目和周期,因此,各路局每个电务段的检修项目和周期都不尽相同,需要提供用户自定义检修项目和周期的平台,各基层单位可按照实际情况制定不同的检修策略,并设置失修漏检的报警条件。
2)自动生成检修计划。目前,ATP 车载设备的检修计划是先由人工手动编制,交由车间审核,再由工区具体实施。而智能检修管理系统是根据动车组的检修计划及电务段自定义的检修周期,自动生成ATP 的当日入库检修计划,并在系统中完成检修计划的审核和下派等卡控流程。
3)作业过程闭环控制。实现检修作业过程留痕和卡控,自动记录用户实施的作业流程和作业规范,从任务发起到任务结束全流程闭环控制,自动生成检修记录和异常情况记录,并将数据自动上传至服务器,由调度分析人员即时调阅。
4)失修漏检实时预警。由于不同电务段设置不同的检修周期,同一等级的检修任务又包括不同的检修包,因此,需要对即将到期或者已经超期的设备分级预警,及时提醒现场作业人员ATP 设备的检修状态,尽量做到既不失修,也不过剩修。
2 智能检修管理系统设计
2.1 检修作业闭环控制流程
ATP 智能检修业务主要从检修计划、检修任务、作业过程、作业结果、失修漏检预警等方面进行约束和控制。整个闭环控制流程见图1。
图1 ATP车载设备检修作业闭环控制流程
1)检修计划。ATP 车载设备需要伴随动车组的检修而检修,只有动车组入库之后才具备检修条件。通常,车辆专业有明确的检修计划,包括动车组的计划出入库时间、停靠股道、有电作业时间段、无电作业时间段、作业项目等,这些信息由动车组管理信息系统负责存储和更新。ATP 车载设备日常检修计划来源于两方面:一是通过ATP 智能检修系统与动车组管理信息系统的接口获取;二是用户新建的ATP 检修计划。前者通常会根据车辆和电务的作业重叠关系,在车辆计划基础上,结合ATP 设备修程,自动生成ATP 检修计划;后者则可根据临时性、突发性的情况,由用户再次新建检修计划。2 个方面相互补充、灵活运用,共同服务ATP设备日常检修计划。
2)检修任务。ATP 设备检修是一项相当严肃的业务,对于生成的检修计划,需要更高级别的权限进行审核。高权限用户对初始计划可以编辑、删除等,最后形成规范的、有效的、有约束力的检修计划,以此计划作为每天检修任务的基准。
3)作业过程。为实现作业过程控制,设计研发移动终端。PC 端生成的检修计划传输至移动终端[10],用户携带移动终端上车作业。提供2 种方式将PC 端的计划分派至移动终端:一种是高权限用户将计划分派给特定用户,由上车作业的用户被动接收;另一种是已经核实确认的任务以广播的形式扩散至同一部门所有用户,需要上车作业的用户主动领取。移动终端APP 界面显示需要检修的车组号、端位、ATP 类型、检修包等信息,用户按照提示,对关键项点逐一进行确认。对特定的设备,例如轨道电路接收(TCR)天线、应答器传输模块(BTM)天线等进行拍照(或者录视频),以记录设备表面是否完好。作业过程中若发现设备异常,可以通过移动终端扫描二维码,快速获取该设备的上道日期、版本信息、检修历史、配件更换历史等。同时,移动终端提供对讲功能,实时与相关专业人员联络。
4)作业结果。用户完成作业之后,移动终端自动生成作业结果,包括作业人员、时间、地点、项目、多媒体等信息,自动上传至路局集团公司服务器,便于后期作业分析、作业查询等。
5)失修漏检预警。作业结果一经上传成功,系统便自动更新失修漏检库,重新计算每台ATP某个检修包的预警时机。对于即将到期的设备检修包,自动纳入下一次的检修计划,如果该动车组入库,则优先安排ATP特定检修包的作业。
2.2 系统架构
ATP 车载设备智能检修系统由支撑层、应用层构成,其系统架构见图2。
图2 ATP车载设备智能检修系统架构
1)支撑层在服务器、存储设备、网络设备等硬件资源的基础上,部署Windows Server 2019 操作系统、Oracle 19c 数据库、.NET 7 开发平台等应用运行环境,具有轻量、跨平台、高性能、支持云原生等优势。
2)应用层采用前后端分离的架构模式,适用于以用户需求和体验为导向的智能检修作业场景,不仅大大提高开发效率,而且系统性能增强,用户体验感提升。前端分为浏览器端和移动终端,浏览器端以固定PC 的方式进行人机交互,移动终端用于车上设备检修作业;后端采用“仓储层+服务层+控制层+基础设施层”的Restful 风格的WebAPI 框架[11],其中基础设施层封装各种功能组件供其他3个层级使用。Restful风格的最大特点是系统中所有的事务都被抽象为资源,所有的资源操作都是统一接口,这种格式设计的软件更简洁、更有层次、更易于实现缓存。
2.3 软件设计
系统软件设计采用前后端分离架构,见图3。前端以React 18为基础搭建框架,服务于浏览器端和移动终端,包含用户界面(User Interface,UI)、数据管理、应用程序接口(Application Programming Interface,API)请求、工具、路由管理等模块;后端是以.NET 7 为平台的WebAPI 框架,包括用户认证、API接口、业务处理、数据持久化等模块。
图3 ATP车载设备智能检修管理软件架构
1)UI模块。根据功能需求进行页面布局、样式、动态效果的设计。页面设计使用Ant Design 4.0 技术,风格简洁大方。图片等动态效果展示基于Echart 5.0 技术,例如以饼状图的方式展示检修任务完成进度。每一个UI 对应后端的一个API,用于人机交互和数据传输。
2)数据管理模块。包括数据模型、数据缓存、数据校验等。前端应用中最基本的数据模型是JavaScript 对象,根据业务需求对数据进行适当的转换。对于查询量大但是短时间内不改变的数据,例如失修漏检预警信息,通过本地存储LocalStorage 或者会话存储SessionStorage 技术实现数据存储和校验。
3)API 请求模块。用于与后端通信,基于Axios 技术实现前端请求,调用后端API 接口获取数据。
4)工具模块。提供常用的工具函数或工具类,例如日期格式化、字符串处理等,有其他类似需求的业务可直接复用该模块。
5)路由管理模块。基于React Router 路由库技术,实现不同页面之间的跳转,以及与后端API接口的映射,主要适用于浏览器端。
6)用户认证模块。负责用户身份认证、权限管理、登录验证等。该模块基于JWT(Json Web Token)协议,保证数据传输的安全和控制用户权限。
7)API 接口模块。提供Restful API 接口供前端调用,实现客户端与服务器端的解耦,使得前后端可以各自独立进行迭代和升级。
8)业务处理模块。负责处理后端接收到的业务数据,包括数据检索、数据校验等。
9)数据持久化模块。负责读写数据库及文件系统操作,将检修计划和任务结果最终持久化到数据库,将作业过程中的视频和照片等多媒体文件持久化到文件系统中。
3 关键技术
3.1 ATP车载设备编码唯一
ATP 车载设备的编码需要保证全路唯一性,并且要简洁明确。为此,在国家标准和铁路标准的基础上,针对ATP 车载设备随动车组频繁调配的特点,设计专用的ATP 车载设备编码,由12 位数字组成,包括11位序列码和1位校验码[9]。
采用Oracle 数据库存储和管理唯一标识编码,数据库自带唯一的约束判断功能,若编码出现重复,则无法写入数据库。此外,数据库的容灾备份机制保证了唯一标识全生命周期的稳定性。数据容灾是基于连续数据保护技术实时监测数据的变化,自动保存记录每一次编码数据读写的变化,如遇服务器故障、软件错误、病毒等突发情况,可快速恢复至任意时间点的数据。数据备份是按固定的时间间隔,可以每天将某一时刻全路所有的编码数据备份到磁盘上,然后再传递至异地保存。
3.2 基于工作流组件的检修作业过程闭环管理
ATP 设备入库检修作业从检修计划开始,到任务派发、作业设备人机校对、上车作业、生成作业结果、结果评价等多个环节,环环相扣,在时间维度上建立工作流模型。工作流组件是以ATP 检修作业各模块独立升级及减少各模块之间不必要的交互为基本原则,通过将检修作业分解为定义良好的任务(如检修计划生成、检修任务校核、检修记录上传等)、角色(如计划编辑、任务审核、结果查看等),按照现场惯用的作业规则和过程来执行,并监控每一个任务的执行结果。
工作流组件的核心是工作流引擎。首先设计规则引擎将检修流程中的业务逻辑分离,业务逻辑成为一个共用体在多个流程中调用,例如车组号的识别和解析,可复用于多个模块,避免大量重复性的编码工作。其次设计安全引擎对系统操作进行监控,并实时将用户角色和操作权限相互匹配,发现异常及时预警。基本流程是工作流组件接收来自外部接口有关过程控制的请求(如过程初始化、获取活动及结束活动等),根据不同的请求类型调用相应的处理模块,完成与本次请求相关的操作,并将结果返回。对外部请求的处理涉及工作流组件相关数据的读写和更改操作,同时通过工作流控制数据辨别每个过程或活动实例的状态,并推动工作流过程的执行。由此约束检修作业过程的流程和逻辑,实现全程作业闭环控制和痕迹管理。
3.3 服务器端与移动终端间数据安全传输
移动终端用户繁多,为了对用户身份进行验证,采用基于令牌(Token)的用户认证技术。基于JWT 统一标准,用户使用账号/密码等凭据登录到应用程序,由服务器端验证凭据,生成令牌并使用密钥对其进行签名;然后服务器端发送加密的Token,移动终端收到Token存储在本地、会话存储或小型文本文件中。此后,该Token被添加到后续请求的授权头中,与服务器端请求交互数据时,无需再次输入账号和密码。
为防止用户篡改数据,服务器在生成Token时添加一个签名来保证移动终端的安全接入。服务器端和移动终端数据传输时,基于超文本传输安全协议,通过数字签名和非对称加密技术,保证数据传输的安全性和完整性。此外,根据ATP 检修作业的实际场景,设置令牌的有效期。一旦Token过期即反馈给前端,前端使用更新令牌(RefreshToken)申请一个全新Token 继续使用。该方案中,服务器端只需要在移动终端请求更新Token 时对RefreshToken的有效性进行一次检查,避免频繁读写。令牌机制正是通过其随机性、不可预测性、时效性、无状态等特点,保证服务器端和移动终端数据传输的安全性。
3.4 检修多媒体数据压缩和传输
移动终端内部集成了H.264 硬件编解码模块,采集到的视频信号可以实时进行编码压缩。H.264的核心是采用更高效的视频压缩算法,在获得有效压缩效果的同时,由压缩引起的失真最小。H.264在视频编码层和网络抽象层的框架上,定义了3 类帧:I 帧、B 帧和P 帧。I 帧指的是完整的图像帧,B 帧和P 帧是指不对全部图像进行编码的帧。不同之处是B 帧是参考前后的图像帧生成,P 帧是参考I 帧生成。H.264 的压缩算法分为帧内压缩和帧间压缩,前者用于生成I 帧,后者用于生成B 帧和P帧。帧内压缩指当压缩一帧图像时,仅考虑本帧的数据而忽略相邻帧之间的冗余信息;帧间压缩指根据相邻帧数据的相关性,压缩相邻帧之间的冗余量,仅仅记录本帧与相邻帧的差值,从而大大减少数据量。
此外,移动终端与中心服务器之间采用断点续传技术保证文件传输的稳定性。移动终端获取到相应的文件,按照指定的分割方式将大文件分段,然后通过HTML 协议分段传给后端服务程序,由后端服务程序再按顺序将文件进行拼接。这样即使传输文件中断,也可以迅速定位,并重新进行传输。
4 系统实施和运用效果
系统现场部署方案示意见图4,主要由服务器组、网络设备、移动终端等组成。通过搭建服务器组实现数据的收发、存储和运算,设置防火墙实现网络安全防护,移动终端用于车上检修作业。所有设备通过铁路内网互联,铁路局、电务段、车间工区等用户通过铁路内网访问系统。
图4 ATP车载设备检修管理系统现场部署方案
作业前,将待检修ATP设备的履历信息、配件更换历史等数据提前下载至移动终端。作业过程中产生的数据,包括ATP各子设备状态信息、设备外观图片、检修异常记录等,均暂时存储在移动终端。作业完毕,移动终端进入工区有网络的环境时,所有数据自动上传至中心服务器。通常作业地点在动车所检修库中,根据各动车所的网络环境(若网络资源充裕,服务器端与移动终端可实时交互数据),数据由移动终端暂存是现场运用的主要模式。
目前该系统已陆续在郑州铁路局、上海铁路局集团公司等部署实施,服务于路局所有ATP 设备的日常检修和管理。据统计,使用该系统之前,ATP 车载设备一级检修作业平均用时48.2 min,主要消耗在检修计划编制、作业记录填报等方面;而使用该系统之后,平均用时降至25.6 min,下降46.9%。在作业过程管控方面,检修项目失修漏检率由0.3%下降至0.1%,检修管理效果显著,所有信息均有迹可循,促进了铁路信号设备运维精细化和智能化的进程。
5 结论
通过分析ATP 车载设备既有检修模式的改进需求,设计了一种智能检修管理系统,从检修计划开始到失修漏检预警,全程实现了自动化及检修过程的闭环管理。经在郑州局、上海局集团公司等部署运用,检修效率明显提升,具有极大推广价值,为设备精准检修和智能检修奠定基础。