基于云平台的电务综合监督系统部署研究
2016-10-18鑫吴
卢 鑫吴 昊
(1.北京全路通信信号研究设计院集团有限公司,北京 100070;2.北京市高速铁路轨道交通运行控制系统工程技术研究中心,北京 100070)
基于云平台的电务综合监督系统部署研究
卢 鑫1,2吴 昊1,2
(1.北京全路通信信号研究设计院集团有限公司,北京 100070;2.北京市高速铁路轨道交通运行控制系统工程技术研究中心,北京 100070)
从电务综合监督系统的功能和结构出发,主要研究电务综合监督系统部署和现场试验,系统基于云平台架构。现场的示范应用表明,系统能够完成高铁信号系统运行状态的监督,电务安全生产指挥管理,辅助电务人员进行维护维修工作。
电务综合监督系统云平台部署;云平台;系统布置
1 概述
高速铁路的快速发展,铁路通信信号系统规模日趋庞大,数字化、精密化程度越来越高,对高速铁路信号设备维护技术要求也越来越高;随着时间的推移,高速铁路信号设备在高速条件下运用的故障率明显增大。随着高铁维护期的到来,信号系统的维护需求日益迫切,需要的维护技术支持也将越来越多。综合来看,在高速铁路信号系统领域,迫切需要一套具有较高智能化、信息化、网络化的基于云平台的综合运维系统,来解决系统运行维护所面临的问题:1)对信号设备的运行状态进行全面监督;2)对信号设备的运行风险进行及时预警;3)辅助电务人员对信号设备进行维护维修;4)实现电务维修应急指挥;5)支撑电务维修模式由传统的“车站分散自治”向未来的“中心调度集中”转变;6)降低设备故障率,缩短维修时间,减少故障停车时间;7)满足铁路科技发展创新的长远要求。基于云平台的电务综合监督系统正是在这个背景和需求下应运而生的,来支持日益扩大的高铁信号设备的维护维修工作。
电务综合监督系统用于铁路电务设备运行状态监督以及电务安全生产指挥管理,其系统是基于云平台的。云平台是由底层软件以及运行在其上的云计算分布式软件系统组成。电务综合监督系统充分利用云平台各种优势,主要是数据的处理能力强、数据存储的能力大、索引的能力强,稳定性和可靠性高,这些特性都是电务综合监督系统的重要依托。云平台的服务特征为,平台即服务。用户决定应用,云平台就伴随着开发出的各种基础服务,供用户使用。云平台的本质不是技术上的革命,而是一种管理模式的革命。所有资源虚拟化后,伴随着动态可调的能力,大大加快了新应用建设在平台层的建设速度,这也是电务综合监督一个主要的特点,即部署速度快,功能拓展灵活。
2 系统功能和结构
2.1系统的功能
电务综合监督系统主要功能为电务设备的状态监督、故障诊断、智能预警、设备管理和运维调度等,如图1所示。设备状态监督是运维系统的基础;系统故障诊断是系统的重要功能;系统智能预警是系统综合智能化运维的体现;系统设备管理和运维调度是系统功能的丰富和扩展。
1)设备状态监督
监督范围覆盖轨旁设备、车站设备、中心设备、车载设备,状态信息类型包括设备板卡状态、设备通信状态、设备输入输出状态、站场状态、线路状态等。通过三维场景重建技术实时复现设备工作状态。通过集成类地理信息系统直观展示设备的分布情况,并综合展示区域、线路、车站、设备等各个层次的状态。
2)系统故障诊断
故障诊断功能包含4个层次:一是基于设备的报警,直接获取故障;二是从设备的状态信息中识别故障特征,间接确定故障;三是利用设备间的冗余信息校验,识别并定位故障;四是利用设备应用信息之间的相关性,识别并定位故障。系统基于上述4个层次,对电务设备的故障进行综合诊断并报警。
3)系统智能预警
智能预警包含4方面的功能:一是根据应用逻辑中的安全原则,对危害行车安全的风险进行识别并预告;二是对设备发生的异常情况进行统计分析,进而对设备可能发生的故障进行预警;三是根据设备性能衰退模型,对性能下降超过容忍范围的设备进行预警;四是根据设备电气特性变化特征,对于电气特性有异常的设备进行预警。
4)设备管理
系统综合采用条形码/二维码、数据总线等技术,支持在轨设备及备品备件信息的录入、上架、下架、维修、盘点等操作,实现设备履历管理、设备台帐管理的信息化。根据设备实时状态实现设备故障、异常信息的自动登记,并建立维修工单进行问题跟踪和监督。根据设备历史运行情况建立问题库,实现故障处理辅助决策。
5)运维调度
采用流程引擎技术,实现维护信息的入库、统计、分析,自动制定维护计划,优化维护工作流程。采用多目标动态规划算法,通过集成类地理信息系统,自动生成维修任务及维修路径。采用综合定位技术,通过集成类呼叫中心系统,实时追踪维修人员的位置,通过维修人员的手持终端及时获知现场情况。完成安全调度及应急指挥的智能化、自动化管理,提供及时准确的调度信息,实现敏捷运维的功能。
2.2系统的结构
系统整体结构为云平台架构,即需要相应云架构的软硬件实体来承载,系统结构如图2所示,系统主要分为数据层和业务层,数据层包含车站内和中心的云前端来完成信息的采集,数据层通过车站监测网与业务层通信。业务层主要包含系统的各类云服务器、核心交换机、网络安全隔离系统、云存储单元、平台监测系统、云终端显示器等,同时通过监测网,把信息同时传到路局、车间、工区的云前段。
业务层功能主要进行数据的汇集处理、数据的集成处理、数据的综合分析、数据的存储和运维的管理,包含网络安全隔离,防病毒/身份认证,平台监测系统、备份系统。同时还有系统针对各种需求,在路局、车间、工区、中心等完成系统相关显示功能。
系统部署于车站(含中心设备机房)及电务段,可根据需要在路局、车间、工区设置云终端。系统从车站、车载数据中心采集各设备的监测数据。对于新建线路,各设备维护机按照与系统的接口标准统一实施,CSM由系统自带,车载ATP上加装车载数据中心;对于既有线路,各设备维护机、CSM按照与系统的接口标准统一修改,车载ATP上加装车载数据中心。
3 部署研究
3.1系统部署的依据
电务综合监督系统部署最根本依据是系统的功能和结构,根据线路和车站的实际需求,按照维护中心、电务段、车站等现场情况灵活进行部署。电务综合监督系统由数据采集、数据汇集、数据集成、综合分析、展现模块和数据中心组成,分别部署于车站、电务段和区域维护中心,云前端是系统最小的单元,可以根据线路电务系统的设备实际情况灵活部署。数据采集模块,通过与联锁维护机、TCC维护机、ZPW-2000A维护机、RBC维护机、TSRS维护机、数据安全网网管等车站相连接,(车站的数据采集模块应根据各车站被采集设备的具体配置,与相应的维护机、维护终端或微机监测连接)实现对车站设备数据的采集;数据汇集模块接收各车站数据采集模块采集的数据,将其汇集后发送给区域维护中心的数据集成模块;数据集成模块对区域内各类数据进行解析和存储,将解析后的数据发送给综合分析模块;综合分析模块对数据进行规则集处理,展现模块主要完成系统的展示功能,可以分为几种模式,包含子系统级的展现,区域级的展现和系统级的展现。
3.2系统实际部署流程
通过对电务综合监督系统数据流的研究和基本模式结构的描述,结合现场试验段相关经验,系统实际部署流程研究如图3所示。
系统实际部署主要流程:现场需求的调研—设计方案制定—硬件设备采购准备—工程实施—系统数据配置—软件部署—系统联调测试—系统正式使用。
*通过需要部署线路的实际情况,进行现场需求的调研,主要分为3部分:一是线路情况包含车站分布和车站内机房的位置;二是车站内部设备的摆放位置;三是车站与线路网络布置的情况。
*通过现场情况基本调研,制定设计方案,方案主要为中心、车站硬件设备的需求,设备空间的需求,网络配线的需求,电源需求。
*硬件设备采购准备为机柜、服务器、工作站、交换机、存储系统、显示器、网线和电源线等,按照电务监督系统具体部署要求,不同的区域部署不同的设备。设备具体型号根据现场的实际情况,云平台机柜主要包含云存储单元、云服务器,完成数据的采集、汇集、集成、综合分析,地理信息/时间同步/身份认证等功能,交换机、网络安全隔离系统、防雷单元。
*工程实施主要包含现场设备机柜的安装部署,服务器的布置,工作站的布置,显示器的布置等。同时包含系统各个设备之间的网络通信和系统与外部设备的通信,电源环境的搭建,电磁环境的满足。重点在于设备上电,基本软件的安装工作,设备与设备网络正常的通信。
*系统数据配置。在完成系统设计和硬件环境的搭建后,在系统联调联试前,需要对电务综合监督系统各种静态数据进行全面的配置,包含线路数据、车站数据、设备数据、互联互通数据。同时还包含相应各个展示图的图形文件。
*软件的部署。完成以上工作,即开展系统的软件部署,软件部署分为基础软件的安装、配置,和运维系统自身的软件。不同的区域中相应的硬件设备部署不同的软件,主要包含数据采集模块、数据汇集模块、数据集成模块、综合分析模块和展现模块。
*完成软件的部署和与其他监测设备互联互通后,即对系统进行全面的测试工作,主要测试系统互联互通中的通信问题和系统的数据配置相关问题。
*完成如上工作,完成系统的部署,为用户提供用户手册和操作指导,同时交付现场试用,并提供售后服务。
3.3部署需要注意的问题
部署中需要注意的问题如下:
站机设备需要注意的问题:在各车站设备机房或中心设备机房设置站机设备,站机服务器进行冗余设置,实现系统核心业务连续运行。网络交换机和网络安全隔离系统保证维护机与站机设备之间网络通信的安全性。当采集条件不具备时,在该机房设置独立的通信前置机,实现维护数据的采集。
中心系统设备需要注意的问题:在电务处或电务段中心设置中心系统设备,云服务器组成中心系统核心业务运行的云计算平台。云存储单元及磁盘阵列组成原始监测数据,运维关键数据的云存储平台。局域网交换机为中心系统云平台的数据交换提供高速网络通道。
展示需要注意的问题:在车间、工区、电务段中心和电务处,可部署本系统的终端设备。终端设备根据用户需求多种形式的信息展现,包含4种主要形式:1)大屏。全面展现中心管辖范围内信号设备、电务人员、维修进度的状态;2)多屏组合。多视角展现某一线路范围内信号设备的运行状态和维修信息;3)工作台。根据不同角色的业务需要定制;4)移动终端。用于辅助现场作业,实现人员管理、应急指挥等.
4 示范应用
目前,基于云平台的电务综合监督系统已经在某高铁线路进行示范应用。线路部署范围包含两个车站、两个线路所、4个中继站。系统用于高铁信号系统运行状态监督以及电务安全生产指挥管理,辅助电务人员对信号设备进行维护维修,实现电务管理信息化。
现场实际的设备部署方面,云平台部署于中心机房,通过内部网络接收RBC维护机、TSRM、车站机房TCC维护机、联锁维护机、ZPW-2000A轨道电路维护机、CSM站机的监测维护数据。通过专用网络安全设备隔离监督系统与各设备维护机,确保监督系统不会对主系统产生影响。系统终端部署于中心,供中心的电务人员使用。
系统试验共分为4个阶段。一是系统部署阶段,包括系统供电、网络布线等现场施工工作以及系统软硬件的安装;二是系统联调阶段,包括系统与RBC、TCC、TSRS、联锁、ZPW-2000A轨道电路等设备维护机的接口调试,以及系统内部接口调试;三是系统验证阶段,通过系统持续运行,验证云平台的性能,根据试验情况修正系统缺陷,根据现场用户的反馈进一步完善系统功能;四是系统推广阶段,通过系统在现场试验产生的示范效应,积极向电务段、路局推广系统。
通过系统在现场的试验,验证了系统功能及设计理念,印证了铁路电务部门对具有较高信息化、网络化、智能化水平的信号设备综合运维系统的迫切需求。后期将在目前成果的基础上,根据用户反馈意见,扩展系统监督范围、持续完善系统功能,将系统构建为一个覆盖信号系统绝大部分设备、满足电务部门日常工作信息化需求的综合性系统,成为电务维护部门的一个生产系统。
5 总结
本文从概述、系统功能和结构、系统部署的研究、示范应用等方面介绍电务综合监督系统的部署。电务综合监督的系统功能主要解决如以下问题:对信号设备的运行状态全面监督,对信号设备的故障进行识别与定位,辅助电务维修工作,对信号设备的运行风险进行预判,降低事故发生概率,对电务维修工作进行高效指挥,减少故障停车时间。
系统经过近2年的研究,完成了样机系统的研制。通过实验室的试用,证明样机功能达到了设计要求,同时能够满足相关的标准规范。目前系统样机已通过第一阶段在地铁的试验应用和第二阶段在某高铁的车站现场试验,试点情况良好,业主给予了较高的评价。后期主要进一步丰富系统功能,持续按照业主的要求对系统进行优化完善。系统将进一步产业化,工程化应用在其他的高铁线路中。
[1] Buyya R,Yeo C S,Venugopal S.Market-Oriented Cloud Computing:Vision,Hype,and Reality for Delivering IT Services as Computing Utilities[C]//HPCC2008-10TH IEEE International Conferece on Derformance Computing and Communications. IEEE Computer Society.2008.
[2]梁勇,张攀翔,陈秋华.企业级数据库云平台的建设与运维方案[J].电信科学,2012(2):146-148.
[3]李萍.铁路信号集中监测系统[M].北京:中国铁道出版社,2012.
[4]铁道部劳动和卫生司铁道部卫生局.高速铁路现场信号设备维修岗位[M].北京:中国铁道出版社,2012.
[5]岳春华,郭颂章.高速铁路信号设备典型故障案例[M].北京:中国铁道出版社,2013.
From the function and structure of the comprehensive monitoring system, this paper mainly studies the system deployment and fi eld test. The system is formed based on the cloud platform architecture. On-site demonstration application of the system shows that the system can complete operation status monitoring of high-speed signal systems, administration of safe production and auxiliary maintenance work.
comprehensive monitoring system; cloud Platform; system deployment
10.3969/j.issn.1673-4440.2016.03.004
2014-09-11)