APP下载

水文水情分中心冗余管理技术分析

2021-05-10张利田次平

水利水电快报 2021年4期
关键词:沙市

张利 田次平

摘要:为实现水文水情分中心冗余管理功能,达到精细化管理的目的。分析了网络设备、数据库、水情数据处理、相应流量推算、值守人员管理等每个环节的冗余管理技术。对关键环节进行监控,建立了质量管理保障体系。冗余管理技术的应用已在沙市水情分中心实践应用多年,应用冗余管理技术使水情报汛每个环节都有一定的容灾能力,实现了经济上合理可行、水文信息安全通畅、报汛质量达到或优于有关技术要求的目标。

关键词:冗余管理技术;水情数据:水文信息;水文水情分中心;沙市

中图法分类号:P332 文献标志码:A DOI:10.15974/j.cnki.slsdkb.2021.04.015

文章编号:1006 - 0081(2021)04 - 0083 - 07

1 概 述

及时准确地掌握水情信息对国家防汛抗旱、防灾减灾不可或缺。水文水情分中心(以下简称“水情分中心”)作为所辖区域内水文站点与上级水文情报预报中心水情信息的收集、贮存、处理、完善的中转节点,必须确保水情信息完整、安全、及时、准确地报送,满足水情报汛漏、错报率≤1%,预报合格率≥75%。因此,水文水情分中心的网络设备、水文信息数据库、水文信息处理、相应流量推算、值守人员管理等都要应用冗余管理技术,使每个环节都有一定的容災能力,达到经济上合理可行、水文信息安全通畅的目的。

水情分中心由1 个或若干水情分中心,若干个中央报汛站或流域报汛站组成,图1为水情中心水情数据传输与处理流程。

容错技术是指在系统部分硬件发生故障或部分软件发生错误的情况下,系统仍能正确执行任务的能力。其实质是利用“冗余”思想屏蔽故障影响,提高系统的可靠性[1]。水情分中心运行管理时,要求能够做到无论任何时刻,发生任何故障,均需保证水情报汛工作正常进行。水情分中心工作与业务系统密不可分,火灾、地震等灾害和人为操作失误、联网攻击等“灾难”一旦发生时,要尽快且完整地恢复正常的业务工作,减少灾难造成的损失。通过冗余管理技术,能较好地解决系统安全稳定不间断运行的需求。网络设备冗余管理为水情传输提供保障,数据库冗余管理保证水情数据的安全,水情数据处理冗余管理、相应流量推算冗余管理为水文实时报汛提供接口,值班冗余管理辅助水情中心日常工作正常运行,图2为冗余管理功能模块。

在冗余管理功能模块中,以灾备措施为基础,将水情分中心硬件进行灾备,以保证设备运行正常;传输层包含网络拓扑与GPRS信道、北斗信道等,为水情分中心信道冗余管理;表现层为数据的需求展示结果,即应用系统冗余管理包括数据库冗余管理、相应流量推算冗余管理和值班冗余管理等。

2 水情分中心冗余管理

2.1 信息网络

报汛要求水情分中心信息网络必须24 h不间断。水情分中心网络设备主要包括:核心交换机、接入式交换机、防火墙、深信服VPN和路由器等。在实际工作中,人为失误操作、电脑硬软件损坏、病毒侵入、黑客攻击以及天灾等因素都会造成计算机网络系统的瘫痪以致数据丢失。水情分中心主要网络设备实现冷热备份,网络线路实现双路或者多路实时切换,图3为水情分中心网络拓扑图。网络拓扑图中有4条逐步报汛信道,主信道为移动MSTP专线,备用信道包括电信MSTP专线、VPN和水利卫星网络。网络设备中核心交换机互为热备份,能在不断网的情况下自动切换,到分局线路为移动和联通双线路备份,服务器与其他网络设备均设相同应用系统备件。

对水情工作中信息网络收集与转发故障进行总结,采用冗余管理技术对信息故障处理流程进行梳理,以沙市水情分中心为例,建立水情分中心信息冗余管理图。根据其信息冗余管理图,分中心值班人员能够快速解决信息传输与转发故障,图4为水情分中心信息冗余管理图。管理图分解为以下情况:

(1)服务器损坏(数据存储)。①水情接收服务器损坏,直接切换到备用接收服务器;②水情交换/处理服务器损坏,切换到备用水情交换/处理服务器;③主数据库切换备用数据库。

(2)网络设备损坏(数据交换)。①防火墙损坏,直接切换备用防火墙;②核心交换机损坏,热备份自动切换;③核心路由器损坏,接入备用核心路由器。

(3)网络线路故障(数据接收及转发),提供4条备用线路(除无线mifi,其余自动切换)。①MSTP链路故障(电信,移动);②VPN故障;③水利卫星链路故障;④无线mifi操作。

(4)备用电源故障。①市电故障,自动切换到UPS;②UPS故障,接入市电或者发电机;③备用发电机操作。

2.2 水文信息数据库

水文信息数据库容灾是为了保证数据库完整性,其对于水情报汛工作极为重要。水情分中心数据库容灾有两种方式:①采用水情交换系统,将主数据库连接到备用数据库进行实时备份;②采用数据库快照,复制定时备份主数据库到专用存储器。

越来越多有价值的关键信息转变为水情数据,如果未及时有效地进行数据备份与恢复,损失将是无法估量的,数据库冗余管理显得尤为重要。数据冗余管理主要指数据备份技术,主要有快照备份、离线备份、异地存储备份等[2]。为便于管理,自动备份,水情分中心采用数据库订阅与水情交换的方式实现备份。水情数据冗余管理见图5。

(1)主要备用方式:采用主数据库发布,备用数据库订阅的方式,对主数据库进行复制,保证水情数据的安全性。

(2)冗余备用方式:采用水情交换系统,在异地或者异服务器新建数据库,将主数据库数据实时交换到备用数据库,实现异地备份。

两种方式实现以下备份策略:①每日01:00,启动数据备份服务机制,通过网络连接到异机服务器上或进行本地备份。②值班人员每日对备份机制进行巡检,检查是否成功备份。每周测试验证备份数据的可用性。③定期对备份进行刻盘,移交到档案室保存。当本地数据库出现灾难,将备份数据库恢复即可,解决实时数据保护不能解决的人为误操作、恶意操作等行为。

2.3 水文信息处理

水文信息处理冗余管理包括水情信息接收、处理与转发等功能。水情分中心接收冗余管理由两套水情接收系统构成,主接收系统为移动网络接入,备用接收系统采用电信网络接入,两套水情接收系统分别安装在两台服务器上,互不干扰。该冗余管理能够实现在一台接收系统网络或者服务器故障時,另一台正常接收数据。水情处理、交换冗余管理以备用服务器为基础,安装水情处理与交换应用系统,主服务器故障时能够及时切换到备用服务器,并正常处理与转发水情数据。

根据水情处理冗余管理技术,创建水情信息接收应急措施流程,值班人员能够在较短时间内快速处理网络设备故障,如图6所示。水情分中心值班人员每时整点过5 min后查看数据是否完整。若所有测站数据未到达,查看GPRS信息是否在线。若在线,则检查服务时间设置格式;若GPRS不在线,则测试能否ping通外网,按照步骤进行检查。若测站只有部分数据到达,查看GPRS在线信息,若GPRS掉线可能为电源故障或者RTU、DTU故障,若GPRS在线,则测试能否招测测站数据设置信息,根据步骤检查。特殊情况下,通知测站工作人员检查设备。

2.4 相应流量推算

相应流量推算分为临时绳套线交互与单一流量关系线。目前,水情分中心拥有一套流量转换系统,经过该系统直接推算相应流量。开发水情APP作为另一套方便报汛人员直接录入,推算流量与临时绳套交互,值班人员进行审核,审核成功发送到水情分中心现有流量转换系统进行转换与发送,并发布到水情信息网。水文测站人员与值班人员可随时在水文信息网查看数据,发现不合理也可重新校正,增加流量预报准确度,两套系统互为备份,图7为临时预报线交互录入流程。

水情中心临时交互线绘制为实测流量报汛的重要手段。目前正在开发水情APP实现远程录入实测流量,并提供临时预报线交互绘制功能,图8为绘制临时绳套交互线界面。在日常报汛工作中,提供历史水情流量过程线,快速绘制出当前水位流量关系线,完全模拟人工手绘报汛关系线的过程。实测流量均登记到值班记事本上,包括时间、水位、流量等信息。

2.5 值守人员

值守人员冗余管理在防汛报汛中十分重要,主要包括水情分中心各个应用软件的提醒报警功能与正在开发的值班管理平台及值班制度。各个应用软件自带报警功能,但无法进行重要信息识别与智能提示,值守人员利用值班管理平台能够将各个软件报警信息收集处理成为有价值的信息,提高值班人员工作效率,减轻工作压力。

2.5.1 水情值班管理平台

水情分中心的各个应用系统均有预警功能,但较为分散,水情值班管理平台通过收集各个应用系统告警信息,经过加工过滤选取重要信息生成提示信息。该平台以水情报汛工作为导向,以满足水情分中心日常工作、减少值班人员工作量为主,达到信息实时监控,信息处理标准化,为值班人员提供一体化工作平台,并为智慧水文打下基础。该平台主要具有以下功能:①网络故障语音短信报警功能;②水情信息错、漏报语音、短信报警功能;③机房环境监控功能。经语音短信报警等提示功能,该平台对值班人员常规错误进行提示纠正,达到冗余管理效果。图9为值班预警信息冗余管理。

(1)网络故障语音短信报警功能。TTS语音合成技术实现机器阅读文字与预警信息。安装真人语音包后,利用水情网络监控软件,可人性化提醒值班人员网络故障,降低工作压力。当网络出现故障,ping不通的情况下,语音提示网络不通,并发送短信告知值班人员。该系统可实现网络情况实时监控,并实现网络拓扑通过大屏展示,使值班人员随时了解网络情况,确保网络畅通。

(2)水情信息错、漏报语音、短信报警功能。与水情处理数据库关联,当值班人员录入实测流量与水位相差较大、出现明显错误的情况下,平台发出语音短信报警。

(3)机房环境监控功能。与机房环控数据库连接,机房出现温度升高或其他故障时,根据提示报警并推送短信。

2.5.2 值班制度冗余管理

(1)排班制度。对值班人员结对替补安排,按照值班管理系统中的排班顺序进行日常轮班,值班人员有特殊情况下,可随时替换。

(2)水情分中心报汛制度。按照“顶得住、测得到、报得出、报得准”的要求,15 min内收齐局属各类水情信息,并于30 min内报送上级水情信息中心,总到报率或正确率达到95%。在整点报文收齐后40 min内不得离开,以备各方随时查询。值班人员完成当天各类质量文件记录,严格填写设备运行记录和值班日志,负责本局当天的水情信息发布,并对所发生的问题如实反映。发生重大事件时,应及时向领导反映,同时采取有效措施将影响降到最低水平。

3 质量管理保障体系

水情分中心质量保障体系包括网络设备、分中心设备和人员等保障,图10为水情资料保障体系关系。

水情信息网络保障:报汛站点多面广,网络为报汛主要传输通道,一旦出现故障,靠人工报汛无法保障时效。汛前,进行网络安全检查及网络与信息安全自查工作,软硬件统计表与软硬件资产清查;汛中,进行网络故障排查、网络监测评估;汛后,进行总结,开展自查自评等工作。

分中心设备保障:主要设备包括服务器、报汛站及网络设备等。服务器为重要存储运行设备,出现故障,其他设备无法替代,为保证其正常运行,水情分中心制定定期巡检流程、硬件备份等措施。报汛站设备要求短时间恢复,必须做好备品备件准备。网络设备保障水文信息正常传输,利用故障监测,应急备份等冗余管理进行保障。

人员保障:值班人员能够做到灵活,并按制度规程处理故障。主要包括以下人员:

(1)网络管理人员:①必须熟悉各种网络设备的性能和操作方法,不得带电进行硬件维修。②经常检查机柜及设备接地情况,保证设备接地良好,防止静电伤人或起火。③检查设备运转情况,防止设备过热损坏或起火。④气温较高时,必须开启空调对设备降温。

(2)通讯管理维护人员:①巡查机房设备运转情况,如果发现可疑噪音或不正常现象,必须立即断电检查,及时采取措施加以排除,在没有排除故障前不得上电。②检查机柜风扇运转情况,确保设备运行时风扇运转正常。③检查机柜及设备接地情况,确保设备接地良好。④不得带电检修基站设备,防止高频灼伤。⑤检修设备时,必须配带防静电手镯,防止静电损坏设备。⑥随时观察系统运行情况,防止高压电源通过用户线路损坏设备并危及人身安全。⑦巡查避雷接地设施,保证避雷线可靠入地。

(3)水文测验维护管理人员:①工作前,应戴好劳动防护用品。疫区作业时,应涂抹血吸虫防护膏,以防血吸虫感染。②水上作业时,应穿着救生衣,做好救生防护措施。③作业时,要集中精力,以防刀伤、碰伤、棒伤、砸伤、烫伤、踩膜跌倒及身体被卷入转动设备等事故的发生。

(4)报汛值班人员:①巡查机房设施设备,发现问题及时上报。②检查机房温、湿度情况,以防设备过热损坏或起火、湿度过高导致绝缘性降低或短路。③检查后备电源供应,以防电瓶发生漏液、锈蚀、接触不良等情况;④检查市电供应及线路使用情况,确保不发生打火、线路老化过热、绝缘不良等现象。⑤熟悉消防设施存放位置及使用方法。

4 冗余管理在沙市分中心的应用

自2015年起,信息网络未出现因故障导致的报汛延迟;水文信息数据库未出现数据丢失或其他故障;水情信息处理系统均正常运行,主备切换正常;相应流量推算及时录入;值守人员未出现不在岗情况,保障了沙市水情分中心可靠運行。2018年沙市分中心累计发送信息量37万余条,30 min有效数据98.53%,如表1所示;更正信息总量6 672条,占总量1.7%,更正信息超时效数量占总量0.6%,如表2所示。

5 结论与展望

水情分中心以报汛为第一需求向导,通过冗余管理技术应用,融入备灾措施,使各个环节合理的重复备份,达到一定的容灾能力。同时,对信息网络、数据库、相应流量推算、值守人员等水情分中心运行的关键环节进行监控,建立质量管理保障体系,以达到精细化管理的目的。

冗余管理技术的应用已在长江水利委员会水文局荆江水文水资源勘测局沙市水情分中心实践应用多年,达到了经济上合理可行、水文信息安全通畅、报汛质量达到或优于有关技术要求的目的。

由于研究仅仅只是初探,今后还有若干问题要利用未来技术进一步完善,包括:①值班管理系统开发完善与其他报汛软件的融合性。②实现异城备份,进一步保障数据安全。③加强网络安全探索。④应用虚拟技术提高设备利用率。

参考文献:

[1] 程新明,熊家军,陈劲松,等. 一种航空机载容错计算机的冗余管理技术[J]. 计算机工程与应用,2002(12):248-250.

[2] 周立桥,杨乐乐. 浅谈血液中心信息系统容灾备份系统的建设和维护[J].信息化建设,2019(3):126-127.

(编辑:唐湘茜)

Analysis on redundancy management technology of hydrological sub center

ZHANG Li, TIAN Ciping

(Jingjiang Bureau of Hydrology and Water Resources Survey, Bureau of Hydrology , Changjiang Water Resources Commission, Jingzhou 434000, China)

Abstract: In order to realize redundancy management function of hydrological sub center and realize fine management, the redundancy management technology of each link, such as network equipment, database, hydrological data processing, calculation of corresponding flow and management of personnel on duty , should be analyzed. This paper analyzes the monitoring of key links in hydrological sub center, the establishment of quality management assurance system. The application of redundancy management technology has been applied in Shashi hydrological sub center for many years. The application made every links of flood reporting have a certain disaster tolerance ability, achieved the purpose of reasonable and feasible economy, safe and smooth in hydrological information, and up-to-standard or higher standard flood reporting quality required by relevant technical requirements.

Key words: redundancy management technology; hydrological data; hydrological information; hydrological sub center; Shashi City

猜你喜欢

沙市
庆祝建党100周年
党的100年
为党增辉
亮晶晶的大眼睛
无人机告白
神笔会