上海城市轨道交通信号系统智能运维需求分析
2021-12-08段亚美
段亚美
(上海地铁维护保障有限公司通号分公司,200235,上海∥工程师)
根据规划,2030年上海的城市轨道交通线网运营总长度将超过1 000 km,工作日均客流将超过1 000万人次/d。上海城市轨道交通日趋网络化、密集化和复杂化,对线网的“大脑”——信号系统的运行维护提出了更高要求。
为了满足超大规模城市轨道交通网络运营对设备维护质量的严格要求,上海地铁维护保障有限公司通号分公司(以下简称“通号分公司”)通过对信号系统的智能运维探索,从经验思维转向数据思维,以数字化驱动质量提升,优化上海城市轨道交通信号系统的维护管理方法。在生产组织结构方面,通号分公司基于“云(云平台)、管(网络管道)、端(终端)”的分级运维架构逐步向扁平化生产组织模式转型,以突破专业独立、多层分散的管理界限,形成集约复合、协调联动的生产管理体系。在设备的运维模式方面,通号分公司持续推进基于状态修的新型维护模式,以打通生产体系中的数据流、信息流,实现由传统的线路级维护模式向网络级运维模式的转变。
1 上海城市轨道交通信号系统的运维现状
1.1 线网级监测功能不完善
目前上海城市轨道交通各线路均已具备一定的信号设备在线监测功能,但仍存在着采集覆盖不全面、监测技术不完善、新老线路标准不统一、各维护子系统不联通等问题[1],难以实现对全网络信号设备运行状态的跟踪、分析及管控,且缺乏集成化统管能力,在一定程度上影响了应急响应及应急处置的速度。
1.2 故障处置过程不可控
传统运维模式下的故障处置过程对人工经验的依赖性较强,包括人工现场检测、人工调阅数据分析、故障经验判断等,存在着效率低、工作量大、不确定因素多等问题[2]。以道岔转辙设备为例,在正常运营时段,维修人员无法进入正线,难以准确获取设备工况实时变化的情况。故障发生时,现场技术人员一般需要耗费15~30 min对室内或室外轨行区故障点进行定位,历时较长。此外,通过人工调度申请获取抢修点后进行室内/室外排除故障,故障修复时间也较长,应急抢修成本较高。
1.3 设备管理平台不统一
目前存在物资管理平台、EAM(资产管理平台)、施工管理平台等多个管理平台对设备进行管理,平台间相互独立,数据标准和数据格式不统一、信息不对称,且缺乏全寿命周期设备的动态化统一管理,因而无法满足自动化及标准化生产流程的建设需求。
2 维护管理模式不适应
在超大规模城市轨道交通网络下,运行场景复杂多样,设备的维护作业体量快速增长,维护难度日趋增加。当前以计划性防范为主的维护管理模式主要基于标准化维护规程,大多参考铁路行业传统条件下的运维标准,已无法满足现场设备精准、高效、便捷的维护需求。而且,传统的维护模式对人力、物力的投入极大,在运营管理上难以支撑高强度、超大网络下高额的运维成本。
针对目前上海城市轨道交通信号系统运维存在的问题,本研究从信号系统的功能需求、采集需求出发,对后续线网级智能运维平台升级、线路侧维护支持子系统建设标准提出建议,如图1所示。
图1 上海城市轨道交通信号系统智能运维的需求分析
3 信号系统智能运维的功能需求分析
3.1 集成化的在线监测
面向全线网的信号系统设备包括道岔转辙设备、电源系统设备、CBTC(基于通信的列车控制)系统设备、列车检测系统设备、联锁系统设备等。为了实现全面的集成化监测,集成化的在线监测应以图形化的方式监测设备的实时状态(包括线路图、车站室内/室外关键设备图形化等),便于快速辅助进行设备的故障判断及隐患定位,直观调取信号设备运行状态全景图、实时跟踪记录线路关键运营运维信息、监控设备运行指标、发出故障告警及迅速定位、设备智能预警等信息[3]。
3.2 高可靠的故障处理
将信号设备系统多维度的采集数据及生产维护信息等进行综合,形成规范化的故障处理流程。具体要求包括:① 建立信号设备的故障体系,定义故障代码,形成故障树,以有效分析设备故障分布及故障关联,在日常维护时实施预防性维护措施;② 构建基于BIM(建筑信息模型)的设备维护视图,实现设备在线状态、设备基础信息(如名称、型号、品牌、参数等)和设备位置信息的融合,通过图谱化对故障进行精准定位,指导现场人员快速操作;③ 基于故障案例库、智能分析库、维护手册等生成信号设备故障处理的标准化操作流程,同时支持单兵设备的现场实况传送和远程技术,以实现故障处理的全过程管控。
3.3 敏捷化的应急联动
建立应急协同一体化机制,进一步提升信号系统的应急抢修效率和水平,减少对正常运营的影响。其措施主要包括:① 构建应急调度指挥体系,实现应急抢修资源(如人力、物资、设施等)的实时定位及快速调度,预测故障对运营影响的范围、时间等,并提出相应的运维组织建议;② 对于部分关键信号设备,如车站ATS(列车自动监控)工作站、ZC(区域控制器)机柜、车载子系统等,实现其远程重启功能;③提供场景化的应急处置预案,并结合多样化运维场景需求及故障统计情况,建立并动态更新应急处理方案。
3.4 全周期的设备管理
基于“采购、管理、使用、保养、维修、报废”设备管理流程,实现设备从采购入库到报废的全生命周期管理,打通各平台间的壁垒,实现对设备的统一台账、设备树、动态履历、备品备件等的管理功能,并与设备采购计划、物料管理、施工管理等工作对接。其中,设备台账不仅包含设备编码、设备类别、设备名称、厂家、出厂编号、产品规格、购置时间、投产时间、使用部门、使用位置等基本信息,还应包括设备可全程追溯的各类过程信息。
3.5 数字化的决策支持
对海量的设备运维数据进行挖掘,分析、总结数据呈现的历史规律,为决策支持提供依据。其要求主要包括:① 智能诊断分析,可实现信号设备的故障溯源、关联分析,解决多点故障根源追溯难题;② 多专业接口分析,可实现信号专业和车辆、供电、工务等专业接口的故障诊断,解决跨专业故障定位困难的问题;③ 通过机器替代人工的方式,从海量设备数据中分析其规律,挖掘运维数据的潜在价值,依据规律优化、改进信号设备的维护策略;④ 专项分析,针对道岔转辙动作、定位信标读取、车载无线通信、紧急停车等场景建立相应的数据模型,通过分析发现其故障的发展趋势;⑤ 设备健康质量评估,建立适用于信号设备的健康质量评估体系及关键设备的寿命预测评估方法,为设备的状态修提供数据支撑。
4 信号系统智能运维的采集需求分析
4.1 采集范围
信号系统关键设备的数据采集应实现全覆盖,其监测采集范围包括车载、ATS、ZC、DCS(数据通信子系统)、联锁系统等关键设备的状态和报警信息,故障应定位到板卡级。同时,应实现道岔转辙机、道岔缺口、道岔组合全继电器、列车检测设备、信号机、站台门、电缆绝缘、排架熔丝、电源设施(含外电网、电源屏、UPS(不间断电源)、电池)等设备的监测采集,以及设备房(含温湿度、粉尘、烟感、水浸等)环境、无线环境等的监测采集等。
4.2 采集数据类别
传统的单一数据采集模式已不适应网络化系统运维的要求。超大线网规模下信号系统采集数据呈现多样化、全面化的特征,数据类别主要包括系统日志、故障报警、设备状态、性能信息等。
4.2.1 系统日志
信号系统将传统的单一数据采集方式扩展为多维度的信息采集方式,其日志信息采集包括车载日志、ATS日志、联锁日志、计轴日志、信号网络日志等。其中:① 车载日志可实现远程自动传输下载,并具备离线分析功能,日志分析的典型场景包括列车的EB(紧急制动)、停车精度、人工驾驶、停站时间等,通过对这些主题分析,挖掘数据规律;② ATS日志信息包括ATS告警信息、事件信息及关键操作记录,可实现对运营场景规律的深入挖掘;③ 联锁日志信息包括联锁告警信息、内部系统日志及关键操作记录,可实现对联锁运行内部状态、运营影响情况及故障分布等的挖掘及分析;④ 计轴日志信息包括计轴原始日志、计轴故障日志及计轴维护建议,可通过数据分析实现故障诊断及维护指导;⑤ 信号网络的抓包数据收集,可实现基于网络日志的通信质量监督。
4.2.2 故障报警
作为数据采集的重要组成部分,信号设备报警信息的采集包括ATS系统报警、ZC报警、DCS网络设备报警、电源屏及UPS报警等。其中:ATS系统报警包括一般系统报警、系统错误、网络故障、第三方接口通信故障等;ZC报警包括一般系统报警、系统错误、网络故障、板卡故障、冗余丢失等;DCS网络设备报警包括设备通信异常、电源报警等紧急报警,端口流量异常、丢包率、信息传输延时等主要报警,以及CPU(中央处理器)、内存利用率等次要性能报警。
4.2.3 设备状态
如表1所示,信号系统智能运维需具备对状态量、模拟量、曲线量、测试量、结构化量、非结构化量等形式数据的采集能力,以实现设备状态的数字化。
表1 通号设备维修系统的典型数字化运维应用场景Tab.1 Typical digital operation and maintenance application scenarios of Telecom & Signaling maintenance system
表1 信号设备状态的数据采集形式Tab.1 Data collection type of signal device status
4.3 采集机理
信号系统智能运维数据采集主要包含设备直接采集、系统接口2种方式,可解决传统模式下数据采集实时性、安全性等难题,实现信号系统的可信、精准、全覆盖感知。
4.3.1 设备直接采集
由于信号设备的数据采集要求提升,需要从传统的低频采集扩展为需捕获毫秒级瞬间特性的高频采集。且由于采集场景复杂,传统的单一固定取样需要逐渐转变为时间域及对象可变的复杂取样。可通过智能传感器、智能仪表、智能视频等技术手段,打破信号系统高隔离、非浸入、强实时的系统参数采集瓶颈。
智能传感器是具备信息处理能力的传感器,智能传感器间可进行信息交流,并完成分析、计算等任务。例如:图2所示的交直流电流智能综合采集器采用了ASIC(专用集成电路)和数字测量技术,能够分别采集灯丝电流、50 Hz交流电流、移频发送电流、ZD7型道岔电流、EJ型道岔电流、电源屏直流电流等的数据信息,并支持远程功能配置及升级、滤波参数配置、在线诊断等功能。
图2 交直流电流智能综合采集器Fig.2 AC/DC current intelligent comprehensive collector
智能视频是利用计算机自动处理视频图像技术,将目标对象与其周围场景分离,追踪并分析视频场景内的目标对象。例如,道岔缺口视频监测装置如图3所示,可定时拍摄转辙机内部缺口图像,通过图像识别来监测道岔缺口变化情况。
图3 道岔缺口视频监测装置模型Fig.3 Model of switch gap monitoring device
4.3.2 系统接口
信号设备智能运维系统可通过与车载系统、ZC系统、ATS系统、DCS系统、联锁系统、智能电源屏、UPS、蓄电池、转辙机缺口、智能灯丝、计轴等进行接口,获取设备的报警信息及关键数据。同时,智能运维系统还需预留与其他第三方系统对接的接口。
5 信号系统智能运维的管理建议
1) 强化技术支撑,提升运维管理的智能化水平。进一步完善线网级信号智能运维平台,建立数据分析中心,建设信号专业多维度的设备检测中心和数据库。利用数据挖掘技术结合算法模型,提升数据分析能力,为信号设备的运维管理提供决策分析数据支持。
2) 优化业务流程,实现全面集约化管理。业务流程的转型升级包括从线路级运维到线网级一体化运维的升级、人工巡检到自动化巡检的升级、各系统分散管理到集中化管理的升级等方面。同时,基于设备全生命周期管理,规范不同阶段、不同部门的业务流程,通过设备管理、生产管理、资产管理的信息融合,实现信号设备整体安全性和维护保障能力的提升。
3) 维护策略差异化,分阶段推进状态修。基于信号设备的全面监测及浸入式集中管理,加速形成以状态修为主、故障修及计划修相结合的差异化综合性维护策略。根据现场情况分系统、分线路逐步试点推进状态修,如根据现场智能运维建设的成熟度及维护需求。对道岔转辙设备进行试点,并选取新建线路实施试点。同时,基于现场实际情况更新维护规程,实施差异化维护策略下的标准作业指导。
6 结语
城市轨道交通信号系统在安全性、可靠性及可用性上已有一系列成熟的标准规范,而信号系统智能运维方面目前急需制定有明确约束力的标准和规范。究其原因,一方面是信号系统迫切需要配置相应的智能技术装备,以实现有效的维护管理、保障系统可靠运行。另一方面是超大规模的网络运营容易形成蝴蝶效应,信号系统当前的运维管理模式仅能满足基本维修需求,还存在诸多问题[4],需要通过建立智能化的运维体系进行升级改造。
上海轨道交通已于2017年完成线网级信号智能运维平台一期的建设并投入使用。现阶段需结合信号系统智慧运维的需求,进一步完善线网侧运维平台及线路侧维护支持系统的功能,增强数据的采集能力,大幅提升全网络信号设备状态监测的覆盖率,以实现设备一体化协同运维与健康管理。