地震台站智能运维保障系统开发
2016-11-26陈军辉沈晓健邱晓宇
陈军辉 沈晓健 邱晓宇
(中国杭州310013浙江省地震局)
地震台站智能运维保障系统开发
陈军辉 沈晓健 邱晓宇
(中国杭州310013浙江省地震局)
针对浙江省地震监测台站不断增加,地震台站设备运维流程无序化、纸质化的管理现状,设计台站智能运维保障系统,实现台站运维智能化监控管理。与传统台站运维相比,该系统不仅实现台站运维资料的数字化管理,还通过引入抢修工单形式,保障台站抢修顺利进行。
智能;运维;监控;数字化;工单
0 引言
随着地震台站,特别是无人值守台站不断增加,台站日常运维管理业务越来越重,台站运维管理模式落后,未形成流程化、数字化管理,且运维人员有限,故障查询、通知、抢修及运维资料记录等均需人工处理,台站运维管理工作任务艰巨,难以保证运维工作的高效、可靠,迫切需要新技术、新思路,对地震台网及子台进行科学地运维管理。
在地震台站智能查障设备等基础上,围绕运维资料完整、 故障第一时间抢修与规范抢修的理念,开展数字化运维系统建设,为台站运维管理制定规范流程,开发地震台站智能运维保障系统,使台站运维资料管理、运维抢修环节等工作纳入数字化、网络化管理方式,提高地震台网及台站技术系统运维管理的规范性,为地震数据产出的连续可靠奠定基础。
1 设计方案
地震台站智能运维保障系统是一种集设备管理、数据采集、通信传输、数据管理与应用于一体的集成应用系统,通过传感器技术、可视化技术、网络技术等,进行地震台站故障点定位和抢修态势的综合分析。利用部署在地震台站的智能查障设备、视频监控设备、门禁系统、通讯网络设备,系统实现台站的远程监控,当台站设备运行发生物理故障时,能够快速、准确判断故障位置,合理、有效地调配运维资源,从而更快地处理故障设备,保障地震台网的高运行率和数据的准确率。
由于地震台站运维管理业务的特殊性,对该系统提出以下要求:①智能查障、视频监控、门禁等台站设备,可对系统进行实时信息数据传输;②集台站实时信息监控、台站设备信息管理、故障工单派发、现场抢修等功能于一体;③以派单形式对台站抢修进行过程管理,以智能手机APP终端进行抢修信息实时上传,实现抢修全过程跟踪,依次
规范台站故障抢修流程,保障抢修过程完整;④对历史运维资料进行按台站、按故障、按时间段等进行归档、查询、打印;⑤以数字化方式实现快速高效的多科室协同处理台站故障的工作机制,促进科室间协同工作沟通。
运维保障系统通过部署在台站的智能查障、可控PDU、视频终端及门禁系统,实现台站状态的远程监控,根据检测信息进行综合研判,得出台站故障结论,继而进行以人工派单、自动派单相结合的方式进行APP端工单发送及故障告警短信发送。系统构成见图1。
图1 系统构成Fig.1 The system structure
智能查障设备主要采集实时监控和读取的台站环境动力参数及设备网络连通参数等信息。环境动力参数主要为台站温湿度、UPS电源参数等(包括市电电压、充放电电流等)(窦雪英等,2015)。通过TCP/IP协议查询台站设备的网络联通情况,包括台站路由、交换机、数采、地震计等网络连通信息,并可通过查障设备的开关模块远程控制PDU的通断,远程重新启动前台机,以便数据正常转发(訾少刚等,2006)。系统对智能查障设备信息的传输方式实现双网络备份传输,除原固有传输网络外,接入备用无线网络设备(GPRS)。
视频设备实时监控台站外景和室内设备,直观判断并处理台站设备及远程故障。通过台站硬盘录像机的存储功能,记录台站及周边视频信息,例如:2015年丽水某台站记录到地震台站设备被非法恶意破坏现象。
2 系统架构
地震台站智能运维保障系统主要分为4层:硬件层、数据层、应用层和表现层,见图2。
(1)硬件层:主要包括平台服务端所在的服务器、远程监控台站门禁状态的门禁网关、控制视频监控设备的接入网关等,是平台运行的基础设施。其中,系统所在的服务
器采用icooper 3000控制平台,实现与各台站视频、门禁、查障设备的集中管理、控制。
(2)数据层:主要由地图数据、台站设备监测数据、台站设备告警数据、台站信息数据、用户信息数据、值班业务数据、值班日志数据、业务统计数据等。其中,台站信息数据和设备告警数据是整个系统的重要业务数据,为GIS应用、值班派单业务、台站运维抢修管理等提供数据支撑。
(3)应用层:结合地震局实际工作,Web服务端实现业务逻辑;流媒体服务器处理视频监控业务需求;门禁控制器对可监测目标台站进行设备管理和远程控制;短信服务器作为浙江省地震局短信网关代理,为平台短信分发提供统一接口,解决自动发送告警短信和工作提醒问题。
(4)表现层:也就是终端层。基于REST的服务端设计,使得平台能够同时支持用户使用多种终端接入系统,包括桌面程序、Windows 8平板电脑。
图2 运维系统分层Fig.2 Layered-graph of the maintenance system
3 软件模块化设计
地震台站智能运维保障系统软件设置:用户管理、值班工作管理、设备管理、台站状态监控、短信报警、故障派单处理6个模块。
3.1 用户管理模块
户管理模块用于工作人员权限和职责定位。各级用户包括:管理员、台网值班人员、仪器值班人员、各地方地震局业务负责人员、台站看管人员等。管理员具备最高权限,具体为使用系统PC端桌面程序,可以进行台站运维资料的录入、调整,调取查看视频监控,远程控制门禁设备、PDU设备、管理抢修业务等功能,实现系统业务的综合监控管理;台网值班人员主要具备调取查看本台网内台站的所有监控设备的功能,如果发现系统告警,或者人为发现波形故障等,派发故障工单给仪器值班人员并完成对仪器人员故障处理后的工单审核;仪器值班人员负责接单后的具体故障处理,同时具备调取查看各类台网所属台站监控设备及完成台站设备重启等必要远程控制处理;仪器值班人员与仪器抢修人员为一人双岗,非值班工作日则根据抢修任务的实际需要,针对无人值守台站进行的现场故障抢修处理,运维工单中的一切流程都需要在抢修过程中使用移动客户端APP得以完成,台网值班人员可以通过系统桌面程序查看故障处理进程。
3.2 值班工作管理模块
值班工作管理模块用于安排、管理值班事宜,包括录入值班表、换班、替班和查看值班记录等。在以月为单位的日历上,列出已有排班数据,包括历史数据和未来排班计划。因数据保护目的,历史数据不可更改,未来排班计划可按照排班人员数及次序进行任意
更改。系统自动或人为把每日重要事情记录下来,形成可供查询的值班日志,内容包括:告警发生、告警解除、故障处理等事件。
3.3 设备管理模块
设备管理模块是建立台站电子档案的核心。在设备管理模块中,管理员可以简易地管理台站基础信息及各种设备(主要包括地震专业、网络、视频监控、门禁等通用设备)属性信息。台站基础信息构成为:台站建设情况、位置、岩层、网络方式、租用时间及看管人员情况等。设备属性信息构成为:设备型号、编号、IP地址、UPS设备的使用情况、摄像头通道位置、门禁控制板的序列号、门的编号。设备属性信息随抢修人员接单后进行手机端APP台站现场处理时设备信息输入而更新,保证信息实效性及准确性。
3.4 台站状态监控模块
台站状态监控模块实现以下功能:①视频实时监控和历史回收,云台远程控制;②门禁状态监控,远程开门控制;③查障设备采集的实时数据监测;④PDU设备监测和远程控制;⑤网络设备状态监测等。
通过现场采集终端及门禁系统,采用软硬件结合方法,将台站部署的智能查障设备、视频监控、门禁系统等无缝集成,以GIS、三维实景等方式直观展示台站运行状态,为运维人员提供决策依据。其中,三维实景建模,在平台上直观展示台站内外结构,包括台站建筑外观、内部布局和设备外观。在三维场景中,用户可以进入台站内部,查看设备详细外观,目前只有仙居、松阳、临安地震台站开发了3D建模。
本系统表现层端的桌面程序直观显示电源UPS参数及网络设备状态及地图、其他相关参数。
3.5 短信报警模块
短信服务器采用浙江省地震局项目 “浙江省防震减灾公共服务信息系统”的短信报警服务器,并通过数据库服务器的应用编程接口API,实现与系统数据库服务器的互联,经数据库缓冲池实现指令收发,支持多线程、多连接并发(陈吉锋等,2015)。一旦运维保障系统判断需要报警,即触发短信报警,短信报警流程见图3。告警短信主要包括:告警通知短信、告警解除通知短信、工单催促短信、预警提示短信等。
图3 短信报警流程Fig.3 The SMS alarm process
3.6 故障派单处理模块
故障派单处理模块是运维保障系统关键模块,是整个系统的业务核心。采用工单信息系统,在安全、科学调度和监控等方面成效显著,并实现精细化、程序化管理模式,降低抢修成本。智能运维保障系统中故障抢修主要由故障工单而展开,并涉及多个部门协同工作。首先,工单主要由台网值班人员或系统自动在PC系统桌面端发起,值班人
员通过手机端应用程序接收、处理、上传任务资料,仪器室主任负责统筹调度。同时,台网值班人员在值班中心可以实时查看工单任务进展情况,并审核抢修结果。系统自动对各抢修环节设置时间点,统计各类角色各工作环节的完成时间,包括故障初步处理、现场抢修及故障审核时间等。故障工单处理流程见图4。
图4 工单流程Fig.4 Flow chart of the work orders
4 系统应用
台站运维抢修系统的移动客户端APP,具备Android和iOS版本。根据使用角色的不同,APP设计相应使用界面。根据任务状态,APP主界面由5个功能模块构成:未接任务、已接任务、转单、申请挂起和已完成任务,其中“已接任务”是主要功能模块,具体任务在此模块开展完成,内容包括现场抢修人员的任务执行操作,如:处理任务、出发、到达、维修、资料上传等,在APP端或PC端的桌面程序中均实时可见工作流的历史状态和最新状态。
目前,本智能运维保障系统已经在浙江省地震台站运维中得以应用,实际运行表明,
系统运行正常,数据可靠,达到设计目的。不仅实现台站基础资料、运维记录资料等的准确与可查可统计,同时通过告警—派单—抢修方式实现运维抢修环节的流程化、数字化,保障抢修任务完成。实际应用中,工单步骤以时间轴的方式展开,只需远程故障处理的工单流程多为3步,需要现场维护抢修的工单流程多为9—10步。
5 结束语
地震台站运维过程中抢修往往是应急性维修,时间要求紧迫,由于地震台站的特殊性,执行效率较低,资源耗费大,急需“预防性维修”功能。虽然本系统实现了线路租用到期报警,UPS电池使用时间到期报警等简单预防性故障报警,但针对台站历史故障运维抢修情况,如何进行运维抢修数据的深度挖掘,做到对不同台站设备运行状态的精细化管理,进行台站设备的统计性分析、模糊化故障判断,特别是鉴于台站的运维抢修业务外包的可能性等,还需要在专家智能故障判断、决策支持等方面进行系统功能拓展。
陈吉锋,陈军辉,张帆,等.物联网技术在浙江省地震台站设备管理中的应用[J].地震地磁观测与研究,2015,36(2):108-113.
窦雪英,张刚,金艳,等.信息中心机房建设探讨[J].当代化工,2015,44(5):1 009-1 011.
訾少刚,刘春云,常明,等.银川地震台数字地震仪系统及维护[J].内陆地震,2006,20(4):378-383.
The intelligent operation and maintenance system for seismic stations
Chen Junhui,Shen Xiaojian and Qiu Xiaoyu
(Earthquake Administration of Zhejiang Province,Hangzhou 310013,China)
In view of the management status that the present earthquake monitoring stations of Zhejiang Province continue to increase,while the equipment repair process in seismic stations is disorder and paper-based,we designed an intelligent operation and maintenance system for seismic stations in order to achieve the intelligentized monitoring and management.Compared with the traditional maintenance,this system is not only to achieve the digital management of operation and maintenance information,but also to ensure the smooth progress of the repair process through the introduction of the form of work orders.
intelligence,maintenance,monitoring,digitized,work orders
10.3969/j.issn.1003-3246.2016.05.026
陈军辉(1984—),男,工程师,主要从事测震、强震台站设备维护工作。E-mail: 183831732@qq.com
浙江省防震减灾公共服务信息系统项目
本文收到日期:2016-02-24