APP下载

水运信息化项目运维管理系统设计与应用

2021-09-23杨文军李明轩

湖南交通科技 2021年3期
关键词:功能模块链路运维

杨文军,李明轩

(湖南省水上交通安全指挥监控中心,湖南 长沙 410000 )

0 引言

湖南内河航运发达,水上交通资源丰富,水上运输在湖南省经济发展和对外开放进程中占据重要地位。近些年,湖南省先后建设了渡口视频监控系统、航道视频监控系统、VHF安全通信系统、危化品码头视频监控系统、视频会议系统、内河客运船舶3G视频监控系统等项目。通过这些信息化手段,加强了渡口、航道、渡船、危化品船及运砂船等的水上交通安全监管,提升了水上交通安全监管和应急反应能力,提高了水上交通安全监管效率,有效降低了执法成本[1]。如何保障上述多个系统稳定运行,在水上交通安全中持续高效发挥作用,实现系统的高质量运维管理,成为信息化系统运维管理工作的重点和难点[2]。

目前运维工作所涉及的网络设备、VHF通信基站、视频监控监控点位等数量已经突破2 000个,硬件设备上万台,主要分布在全省各地的码头、航道、渡口、客渡船、危化品船、运砂船以及湖南省中心机房。随着系统持续建设和升级,系统所需硬件设备数量也将呈现几何增长。目前,省监控中心对于系统的总体运行情况和运维工作难以进行全面客观评估[3],尤其是对各个运维单位的运维质量好坏缺乏有效监管手段。

1 技术方案

传统的系统故障检查一般是通过人工巡查方式来实现,故障的发现时间周期长,信息反馈被动,故障的发生和恢复时间缺少准确记录[4-5]。目前运维工作所涉及的网络设备系统、VHF通信系统、视频监控系统等,没有自带故障检测功能。经过研究分析,上述系统设备都部署在专网中,每个设备都有固定的IP地址。运维管理系统对信息系统设备故障监测主要采用2种方式:① 对于网络设备和VHF通信系统设备,通过IP包进行设备运行情况检测;② 视频监控设备,通过对接设备厂商,阅读和分析设备(IPC)网络SDK技术文档,利用监控设备的RTSP协议实现对监控设备操作。

系统开发基于自有的应用框架XWAF(XML-based web application framework)。XWAF是一个基于XML描述的应用框架,技术成熟稳定又能保持先进性。可实现2个方面的通用功能:① XML描述 + 数据库引擎 可建立数据库;② XML描述 + 界面引擎可实现后台管理页面的建立。

1)系统架构方面:采用B/S架构使系统能集中部署,分布使用,有利于系统升级维护。

2)开发模式方面:采用MVC开发模式并参考SOA体系架构进行功能设计,可快速扩展业务功能,且不影响现有系统功能的正常使用,还可根据实际业务量进行部分功能扩容,在满足系统运行要求的同时实现成本最小化。

基于信息化项目运维管理系统的需求以及 XWAF框架优点,采用PostgreSQL关系数据库作为本系统存储方式,采用Python作为开发技术栈[7-8]。

2 系统设计及实现

2.1 架构设计

信息系统设备分布在全省各码头、航道、渡口、客渡船、危化品船和运砂船等,设备通过专用光纤、无线通信设备等接入水运内网;而运维人员则使用外网(互联网)通过运维外业APP查询与上报运维过程数据。另外,故障预警从服务器实时主动推送消息到省监控中心浏览器端和外业运维APP上,设备状态监控需要轮询设备的工作状态。所以系统是一个内外网交互、支持多通讯协议的分布式物联网应用,系统硬件组成见图1。

图1 系统硬件组成

基于系统的组成及特征,构建信息化项目运维管理系统架构。宏观层面上,本系统拟采用分布式部署方案,即分别在外网和内网部署相应的服务器和服务应用,并在这些跨网、跨机器的服务应用之间构建一条分布式的异步事件总线(相当于计算机主板),各服务应用(相当于显卡、声卡模块)连接在该异步事件总线上,发布请求事件、响应通知事件。通过这种架构,既降低了各应用服务之间的耦合程度,提高了各应用服务的鲁棒性,又降低了系统的总体复杂度,保证了系统的可伸缩、可扩展性。系统分布式架构如图2所示。

图2 系统分布式架构图

微观上,在单一应用系统内部架构上,则采用基于插件的微内核架构。系统以微内核为交易中心(相当于市场),应用系统内的各模块以插件的形式加载到应用系统内,并通过微内核发布服务(卖服务),发现并调用服务(买服务)。通过这种架构,解耦了各模块之间的相互依赖(各模块之间互不依赖,它们都依赖于微内核),降低了应用系统复杂度,提升了应用系统的可扩展性,应用系统内部架构如图3所示。

图3 应用系统内部架构图

2.2 架构决策设计

将各子系统从业务逻辑上划分为表现层、感知层、业务层、平台层和持久层[7]。表现层(presentation)提供用户界面,负责视觉和用户互动;感知层(perceptual)提供设备状态反馈和视频反馈;业务层(business)提供业务逻辑实现;平台层(platform)提供事件总线、权限/安全和其它中间件;持久层(persistence)提供数据永久存储。系统分层架构如图4所示。

图4 系统分层架构图

2.3 系统功能模块设计及实现

根据省监控中心管理诉求及运维工作流程,将系统分为设备资产管理、故障告警、链路检测、GIS图层展示、运维绩效管理、合同管理、档案管理、运维管理APP等8大主要业务功能模块(见图5)。

图5 系统功能模块

2.3.1设备资产

设备资产功能模块针对所涉及的硬件设备,将其按照所属系统、所属类型进行分类,建立设备档案,记录设备的厂家、技术指标、招标信息、质保周期、维修记录、IP地址、安装位置等相关信息。该功能模块由设备清单、备品备件、二维码管理组成。

2.3.2故障告警

故障告警功能模块是系统的核心功能之一,系统按照设定的时间点或时间间隔自动检测所有监控设备的运行状态。管理人员可查看最新一次检测得到的信息列表,包含每个设备的检测日期、时间、故障等级以及故障描述等。若设备检测正常,则可以查看获取的监控图像;若设备检测异常,则系统根据预先设置的权限,通过短信、APP两种方式对相关管理人员、运维单位推送故障提醒消息,达到预警、告警的目的。

2.3.3链路检测

链路检测功能模块主要针对各子系统的网络链路通信情况进行监测,及时反馈通信故障。模块包含航道视频监控系统链路检测、VHF安全通信系统链路检测、网络设备通信系统链路检测和危化码头监控系统链路检测4个子系统。通过页面UI的精细设计,可清晰地展示各子系统链路情况,深色为故障链路,浅色为正常通信链路。下拉列表还可查看子系统的故障情况统计及明细。图6为航道视频监控系统链路检测页面。

图6 航道视频监控系统链路检测页面

2.3.4GIS展示

GIS展示功能模块能够让管理者以最直观的视角掌控所有设备的空间位置,并了解各个设备的系统级别和状态。该功能模块由监控系统分布图层、故障分布图层组成。监控系统分布图层主要功能是在监控中心内网航道图上展示各个监控点所在的空间地理位置,以图标颜色区分监控点状态;点击设备图标,显示设备详细信息及最新一次检测时获取的图片,可更加直观地了解系统运行情况。故障分布图层主要功能是在监控中心内网航道图上展示故障设备所在的空间地理位置及基本信息,方便运维人员及时掌握需要维护的设备的位置及损坏情况。

2.3.5运维管理

运维管理功能模块是将故障检测数据、链路检测数据、APP反馈的运维记录、巡查记录、超时情况说明等信息,自动整理出运维报告,并生成各类统计图表,供客户查看,使客户对运维情况一目了然。同时系统可根据客户对运维管理的相关规定,通过故障响应时间、故障率等指标对运维单位进行考核评级。该功能模块由故障统计、运维报告、维修记录、巡查记录、服务商评级组成。

故障统计模块,可以直观查看各子系统设备的故障率及故障等级占比,还可以直观看到最近一个月内故障数的波形变化情况。

运维报告模块能够针对各子系统运维商的故障率、故障响应速度、维修记录、巡查记录进行统计,自动形成运维日报、周报、月报、季报、年报推送给监控中心。客户可通过左侧竖轴切换运维报告的时间段,点击右侧标签键切换子系统,并可对选定的运维报告进行预览和下载。

2.3.6合同管理

合同管理功能模块包含合同信息和运维进度款两个功能。合同信息可以录入运维合同的关键条款,并添加电子档附件,作为纸质合同的备份,防止纸质合同丢失,并且方便及时查看。运维进度款能够根据合同条款、系统的运维绩效评分、省监控中心的相关管理规定辅助运维进度款支付,并可查询到各个运维单位的合同日期、应付款、已付款以及相应的付款进度。

2.3.7档案管理

档案管理功能模块可以录入各个子系统建设过程中的重要档案文件,形成电子档案,作为纸质档案的备份,可以一键打印成卷宗文本,方便查看。

2.3.8运维APP

省监控中心信息化项目运维管理系统APP是整个运维系统的重要组成部分,使用对象为运维单位的管理人员及设备维修人员。APP分为:我的工单、日常巡查、巡查记录、故障采集4个功能模块,以及系统设置、登出账号2个账号管理模块。系统监测到设备发生故障后,将故障信息自动推送至APP我的工单中,运维人员通过APP及时响应,并将维修后的设备状态拍照上传。另外,运维人员在日常巡查过程中若发现故障,APP能够自动记录运维人员对故障的响应时间,方便一线人员记录运维过程。

3 应用效果分析

3.1 运维管理工作更规范化、流程化

以往信息系统运维工作,由负责运维工作的第三方公司接到故障电话后进行处理。对故障的发生时间、处理响应时间、处理过程及时间、恢复时间缺乏记录或记录不全。故障处理后,不能清楚地描述故障发生原因以及处理的方法和方案,也不能跟踪设备修复后运行状况。而运维管理系统能记录故障发生的时间,通过手机APP记录运维的技术员响应时间、故障修复过程记录、故障原因、以及故障修复情况。对于不能在规定时间恢复的故障,报相关系统管理人员进行情况审核,给予故障修复建议。管理人员能够一目了然地了解运维工作的各个环节情况,促进运维管理工作的规范化,流程化。

3.2 及时发现故障,提高用户满意度

有些系统平时应用较少,在需要使用时,又存在故障,且故障恢复需要一定时间。如网络专线故障,使用单位在需要用时才能发现网络专线故障(例如视频会议),导致工作不能及时开展,影响工作进度。运维管理系统能每天对网络系统各设备进行监测,及时发现网络专线问题,督促网络运营商及时维护网络,提高用户使用满意度。

3.3 公开透明,运维工作考核有依据

各信息系统的运维工作都纳入到一个运维运维管理系统中,每个故障发生的时间,负责运维技术员响应时间,故障存在的时间、故障恢复时间等,以及系统中各设备在某一段时间发生了多少次故障等都有详细记录。一方面对系统运维工作考核有详细的数据记录,可为运维工作公司的选择提供依据;另外一方面,通过系统设备故障发生的记录,了解各设备的运行状况,对故障发生次数多,不稳定的设备进行更换,确保各系统的正常稳定运行。

4 结语

水运信息化项目运维管理系统能够主动发现、诊断故障,并将故障信息自动推送给对应的运维人员;并对故障状况、维修情况、巡查情况实时统计,方便管理人员查看,了解系统的整体运行状况;同时该所有建立了标准化运维管理流程,通过APP监督并跟踪运维人员及时响应,保障故障设备得到及时维护及更换,真正做到了监控设备物尽其用。另外系统还可对运维单位进行科学客观的绩效考核,督促运维管理人员和技术人员尽职履责,从而保障所有系统设备的高效运转,真正行之有效地保障信息系统的高质量稳定运行。在后续使用中,还将不断完善系统,更好地为水运信息系统运维管理服务。

猜你喜欢

功能模块链路运维
高速公路智能运维平台
天空地一体化网络多中继链路自适应调度技术
基于星间链路的导航卫星时间自主恢复策略
浅析民航VHF系统射频链路的调整
运维技术研发决策中ITSS运维成熟度模型应用初探
一种IS?IS网络中的链路异常检测方法、系统、装置、芯片
商业模式是新媒体的核心
配电线路的运维管理探讨
基于ASP.NET标准的采购管理系统研究
高校二手交易网络平台功能及技术框架分析与设计