APP下载

江苏水文自动测报系统智慧化运维研究与设计

2019-07-13王美玲曹晓宁

水利信息化 2019年3期
关键词:分中心测报水文

王 培,王美玲,曹晓宁

(江苏省水文水资源勘测局,江苏 南京 210029)

0 引言

江苏水文自动测报系统按照统一平台、管理、标准的要求,通过对已建水文自动测报站整合、新建水文自动测报站集成,解决了几十年来水文自动测报多系统、平台运行及信息孤岛等问题,建成了覆盖全省的高效可靠、先进实用的水文信息采集系统。全省省级以上报汛站、资料整编站、小型水库预警站、中小河流范围内的水文站、地下水站全部实现自动测报。自动采集站点达2000 多个,主要监测雨量、地表水和地下水水位、墒情、闸位、风速、风向及运行状态等信息。但是,随着系统建设范围的进一步扩大,测站分布地域越来越广泛,自然环境优劣不一,特别是测报方式改革以来,全省范围内全面使用遥测报汛代替人工报汛,数据实时性和准确性的要求越来越高,如何科学管理和维护水文自动测报系统变得非常迫切。本文从江苏水文自动测报系统的运维现状出发,提出一套智慧化的运维管理方案,为系统的精细化管理和运行提供一个新的思路和解决方案。

1 系统运维现状与问题分析

1.1 系统运维简介

江苏省水文自动测报系统以江苏省地方编制的《江苏省水文自动测报系统数据传输规约》[1]为数据传输标准,系统由数据传感器、远程终端控制单元(RTU)、数据传输单元(DTU)、数据传输信道、采集服务器、数据库服务器等构成,数据传输采用 GPRS/CDMA 为主/备双信道,水文要素数据通过主信道传输到分中心,当主信道不通时,数据通过备用信道传输到省中心平台,再通过水利专网分发至分中心采集服务器,数据在分中心落地入库。最后数据交换软件将数据从分中心数据库同步到省中心数据库,以便数据对外应用和发布,其通信结构如图1所示。

图1 江苏省水文自动测报系统报汛通信结构图

自测报方式改革以来,全省范围内全面使用遥测报汛代替人工报汛,数据实时性和准确性的要求越来越高,为了加强系统的维护和管理,江苏水文制定了《江苏省水文自动测报系统管理办法》,要求各地市每月1次对系统及测站进行巡检。江苏水文利用自主研发的自动监测工具,监控数据的在线率、完整率及故障处置效率。除了政策和技术手段,江苏水文还积极寻找过硬的市场服务,每年汛前对全省水文自动测报系统进行检查,并提供全年的技术支持和保障服务,为各级运维人员提供技术支撑。

1.2 问题分析

尽管江苏水文部门为测报系统的维护制定了专门的管理办法,但全省2000 多个站点分布在不同地域,布设线长、面广,各地运维工作很重。总结当前面临的问题,主要表现在:

1)实时性不足。依靠各地的巡检难以快速地发现问题,同时发现依赖于人工判断。在汛情紧张时,只能通过值班等制度上进行补充。

2)人力成本高。目前省中心和19个分中心需配备 2~4 名专职维护人员,检查和维护任务占据每日工作量的 80% 以上,与测报系统的采集自动化不匹配。

3)运维耗时长。运维工作多依赖维护人员的技术水平和经验判断,但是运维人员的水平参差不齐,一旦主观判断失误,运维工作将面临更大延迟。经统计,出现的故障点主要集中有5类,占总体故障数目的 50% 以上。

4)考核激励缺失。《江苏省水文自动测报系统管理办法》虽然规定了对分中心运维工作的考核,但是目前的运维体系无法对运维人员的工作效率及效果进行量化,考核结果只能根据数据的畅通情况和省中心的运维记录判断,数据来源较单一,没有形成科学的考核激励制度来刺激下级运维人员对工作的责任意识。

运维工作如何化被动为主动,降低人力使用成本,切实为发挥水利信息化的优势做服务,成为当前必须要解决的问题。

2 智慧化运维平台设计

2.1 平台目标

智慧化的运维管理平台将为系统建立完善的运维机制,包括详尽的数据分析、科学的规则管理、高效的处置推荐、精细的考核量化、合理的人员激励等。平台利用现代化的信息手段如“互联网 +”技术、大数据分析手段等,通过对海量的自动采集数据和历年维护记录的分析,并依赖专家推荐,建立运维模型,为自动测报系统科学、主动、精准地处理运维工作,甚至可以预警可能发生的运维事件,最大限度发挥人力和资源优势,保障水文自动测报系统高效、可靠运行。

2.2 平台结构

根据江苏水文自动测报系统的现状和运维所面临的问题,本文提出智慧化运维平台以采集层、服务层、应用层三层架构,具体结构如图2所示。

图2 智慧化运维平台结构图

以自动测报系统的测站设备、采集平台和遥测数据为基础,监测采集平台的运行情况、各个遥测站点的硬件设备状况,并提取数据库的遥测数据,根据监测,提取和分析数据畅通率、数据完整率、系统运行状态和故障维护情况,对水文自动测报系统的整体运行情况进行统计、分析和考核,同时为系统故障的诊断进行告警和跟踪,并做出智能调度、方案决策和处置推荐。运维过程中积累的知识和经验可以自动录入知识库系统,为后期运行维护提供参考意见。

2.3 实时状态监测与统计

平台以自动测报系统数据、采集平台运行状态和分中心的硬件设备状态为基础,监测自动测报系统的实时运行状态并统计,具体包括:

1)对自动测报站点的实时入库数据监测,并根据自报判断系统运行状态是否正常。根据实时入库数据的监测判断数据的通畅率和正确率,如果某个分中心整体通畅率均低于系统设置标准,则可能是分中心数据库、采集平台或者通信网络故障;否则可能是测站设备或者通信信道故障。

2)根据自动测报数据的采集、到达平台及入库三者时间之间的关系判断系统的实时性及运行状态,如果采集时间与到达平台的时间差超出阈值,则数据实时性较差,可能是系统的采集平台或者通信网络的运行状态故障;如果到达平台与入库的时间差超出阈值,则可能是系统的采集平台或者数据库的运行状态故障。

3)监测各测站站点的设备状态,如蓄电池电压、硬件仪表、来数信道等状态,根据设备状态监测结果判断硬件设备或者通信信道的运行情况,及时告警。

4)实时监测系统的自动测报数据和设备运行状态,对数据的入库、在线、信道、硬件运行等情况进行统计,并生成专业报表。

2.4 智能处置知识库

通过专业总结、实践检验的问题处置预案,可以有效地降低系统运维成本,缩短故障恢复时间。一方面建设有厂商专业指导、领域专家认可的系统内置专家知识库,这部分知识库汇聚有厂家多年的业务运维积累,也有内部专家多年现场维护记录总结,具有很高的权威性,具体包括测站状态、通信信道、数据库、数据质量等方面;另一方面发挥运维人员主观能动性,结合当地特色,主动提出更优异的处置预案,供全省运维人员共享。

平台结合故障现象,配合专家库预案,自动完成必要前置检查,将故障现象、推荐预案、前置检查结果一起反馈给属地运维人员,可以极大地降低其学习成本。通过每一次的维护记录,又可以进一步丰富处置预案及其评估效果。

2.5 运维考核

全面的自动化监测平台只能实现故障快速发现定位,但是保障水文自动测报工作继续高效开展还需要各级运维人员高度的责任意识和主人翁精神,加以合理的考核激励[4-5]。

1)数据质量。自动测报数据的完整性和正确性直接关乎报汛工作的正常开展,是系统的生命线,汛期要求尤甚。平台以测站和分中心为单位,对数据质量进行分析,形成报告。

2)运维日志。检测的每一次系统故障,对维护过程进行全链路跟踪,包括运维时长、运维内容、恢复正常时间点及运维效果反馈等,可以为后续的预案和运维其他方面(如人员和物资调度等)的改进提供依据。

综合上述2个方面形成对分中心的综合评分,激励分中心运维人员对运维工作的重视,积极增强自身专业知识。但考核不是最终目的,只有不断积极分析和改进运维流程,才能保障好全省水文自动测报工作。

3 结语

江苏水文自动测报系统集成并整合了全省省级以上水情报汛站、水情分中心和省水情中心,后期还会进一步发展,运维管理平台对全省的水文自动测报数据以可视化和智慧化的方式进行科学、有效管理,及时掌握系统运行状态,并结合智能处置知识库为运维人员提供高效的诊断和决策,同时科学地对运维人员进行综合考核评分,刺激工作人员的积极性和主动性,提高江苏水文自动测报系统的精细化管理水平。但是目前的运维工作仅限于发现问题到解决问题的过程,后期可以尝试结合硬件设备的使用状态、网络拥塞率等情况,预警可能存在的问题,把问题消灭在萌芽状态。

猜你喜欢

分中心测报水文
综合流量法在金沙江下段水文测报中的应用
继往开来 守正创新——河北省水文工程地质勘查院
继往开来 守正创新——河北省水文工程地质勘查院
水文
水文水资源管理
夸夸咱们的测报员
国家测绘地理信息局卫星测绘应用中心河南分中心
浅谈林业有害生物测报与防治
高速公路监控分中心网络配置探析
梨小食心虫性信息素在测报和防治上的应用