新型自动气象站数据传输监控及保障系统
2020-04-07姚浩立李从初许皓皓徐振宇
姚浩立 李从初 许皓皓 徐振宇
(宁波市气象网络与装备保障中心,浙江 宁波 315012)
0 引 言
大气科学取得迅速发展,原因之一是重视观测系统的建设以及新探测技术的运用[1]。近年来,气象探测技术取得了卓越的发展,地面观测向遥测化、自动化迈进,专业气象观测和大气特种观测网日趋完善,探测能力显著增强,观测自动化水平迅速提高,重视观测方法、观测网的设计,注重观测工具的配合,各取所长[2-3]。
气象观测技术蓬勃发展,基层气象台站的测报业务逐渐自动化[4],新型地面气象观测站从人工观测转化为无人值守[5-6],为了适应不断发展的需求,更好地为业务人员做好辅助工作,加强气象观测保障能力,运行监控日渐成为工作侧重点[7-8]。
新型自动气象站改造之后观测数据增加,数据传输频率增大,每个新型自动气象站的传输频率都为5 min一组观测报文,特殊情况下可加密到1 min一组观测报文,传输和考核要求高。从县、市局到省局,数据经过的各链路和节点都存在故障隐患。根据以上情况,对新型自动气象站观测数据、传输节点和通信链路进行完整、可靠的监控,可以提前或最短时间发现并解决问题,提高业务质量,使损失降到最低。
新型自动气象站数据传输监控及保障系统围绕气象部门测报基础业务工作,旨在提高测报业务的通信传输质量。在经济可行性方面,主要用到的是软件开发和无线通信报警一体机,具有成本低的特点。
1 新型自动气象站数据传输监控及保障系统
新型自动气象站数据传输及保障系统分为链路监控、数据及时率监控、内外网FTP服务器监控以及无线通信一体机监控及报警4个组成部分。
1.1 链路监控
链路监控:实时对县局各测报机和省局内外网FTP服务器做网络检测,若网络不通则监控服务器通过音乐发出链路异常报警,硬件无线通信一体机则发送短信和拨打报警电话给特定人员。
图1是监控软件主页面,用于监控各重要报文的发送情况和重要服务器及发报机的网络运行情况。其中红框部分为链路监控模块,该模块可以配置服务器及其IP,这里对县局的主备发报机,市局核心交换机和省局的路由器及报文接收服务器均做了实时监控。链路监控模块工作原理为:实时对各网络节点做ping操作,若连续6 s ping不通则报警。
图1 业务监控程序
1.2 数据及时率监控
数据及时率监控:定时每5 min从省内网FTP服务器下载常规站数据并入库,注意避开各县局的常规站报文上传时间,定时检测报文是否及时上传,并通过消息中间件进行消息反馈,若检测到连续两个时次未及时上传报文则监控服务器声音报警,硬件无线通信一体机发送短信和拨打报警电话给特定人员。
图2为新型自动气象站报文入库软件主页,由于新型自动气象站报文是直接由台站直接发送到省级报文接收服务器,未进入市级存储系统,通过该软件从省级服务器下载报文,每5 min将报文入库到市级数据库。
图2 新型自动气象站报文入库软件
图3为数据及时性监控软件主页,用来监控各重要数据是否及时入库,其中红框部分为国家新型自动气象站数据入库及时性监控。
图3 数据及时性监控软件
结合图2新型自动气象站报文入库软件和图3数据及时性监控软件就可以实现对新型自动气象站数据及时率的监控。若新型自动气象站数据未及时传输到省级服务器,数据及时性监控软件首先会监测到市级数据库无数据而报警,再检查新型自动气象站报文入库软件,没有对应的新型自动气象站报文,则可以确定该台站出现故障未及时传输报文,从而可以第一时间找出并解决问题。
1.3 内外网FTP服务器监控
内外网FTP服务器监控软件,分两种途径对内外网FTP服务器做监控:1)直接对内网服务器做FTP测试,监控服务器状态、FTP server软件状态。若出现问题则弹窗和音乐报警,并将报警信息发送到硬件,由硬件进行手机报警。2)通过测试外网FTP服务器监控外网服务器、外网服务器FTP server状态以及外网服务器向内网服务器数据转移的程序状态监控。若出现问题则弹窗和音乐报警,并且将报警信息发送到硬件,由硬件进行手机报警。
图4是内外网FTP服务器监控软件流程图。内网FTP服务器监控定时每5 min执行FTP登陆测试,若连续5次登陆失败则将错误信息记入日志并且音乐和短信报警。外网FTP服务器监控定时每10 min执行程序,将本地生成的测试文件上传到无线外网服务器,若成功,延迟20 s登陆内网FTP服务器并删除测试文件,若连续5次删除失败,则判断外网往内网转发程序失效,报警响起。
图4 内外网FTP服务器监控软件流程图
1.4 无线通信报警一体机监控及报警
无线通信一体机监控及报警:1)监控县级测报机的测报和发报,若停电、测报机死机则无线通信报警一体机报警;2)若监控服务器或者监控软件出问题,硬件通信模块不能获得心跳包,从而报警,实现对监控服务器和监控软件的监控作用;3)若内外网FTP服务器出现问题,由监控软件发送信息到硬件通信模块,由硬件通信模块打电话或发信息到值班手机,起到报警的作用。
该设备采用工业级无线移动通信模块,具有较高的可靠性和稳定性,符合地面测报业务自动化的要求。
1.4.1 主要功能
1)通信链路监测
通过软件对内网有线网络和在线式应急备份通信链路(如无线无线网络)进行实时监测。每10 s钟测试一次网络状态,当通信链路发生连续2 min通信中断时,则通过短信或语音电话发出报警信息,通知值班员或网络保障员,及时处理线路故障,确保自动气象站数据文件能及时发送出去。
2)值班室停电监控
为了满足测报值班室停电报警的需求,监控报警专门设计了停电自动拨打值班员电话的功能。机内配置了12 V锂电池,用于市电中断情况下提供工作电源。当检测到市电中断时,自动提取预存的值班手机号码,拨打电话和播放停电信息,通知值班员及时处理停电故障。尽管台站测报业务计算机配置了UPS供电,但往往在夜间发生停电,易造成UPS的蓄电瓶过放电而导致后备电源电能耗尽影响业务工作。停电报警功能为业务用电的意外停电守住最后一道防线。
3)计算机死机监控
为了监控计算机工作状态和业务软件运行,报警监控机通过串口与通信软件形成了定时应答互动联络机制,一旦计算机死机或软件异常退出,报警监控机得不到传输软件的应答,将自动向值班手机号发送报警短信和拨打语音电话,提醒值班人员处理异常情况。确保自动气象站计算机和业务软件运行正常,起到“看门狗”的作用。
2 系统运行情况
新型自动气象站数据传输及保障系统已业务化运行一年多的时间,运行期间稳定可靠,未出现明显的误报、错报和遗漏等现象。多次及时发现报文未上传并准确定位,例如县市测报机或者测报软件死机,值班员未发现,该系统发现问题并由保障中心通知相应台站;报文接收FTP服务器网络不通或者FTP服务不可用,保障中心及时发现问题并通知省网络中心处理。
3 结 语
本文阐述了新型自动气象站数据传输及保障系统,实现一个完整、可靠的监控和报警系统,使县、市到省3级的整个闭环通信各个数据、节点和链路都能得到有效的监控,能够提前发现并解决问题,提高数据传输业务质量。整个闭合链路的监控系统,从县级测报计算机的发报到最后从省级数据中心返回数据,形成一个完整可靠的监控机制,不仅能够提高我市的数据传输质量,对全省其他市县也有借鉴作用,可以加快辖区内数据传输故障的定位,快速解决问题,提高数据传输质量。