依托天镜本地化,构建全省气象业务监控一张网*
2022-01-12张雅旎胡永亮张云飚
张雅旎 胡永亮 张云飚 刘 瑞
(浙江省气象信息网络中心,浙江 杭州 310017)
0 引 言
气象综合业务实时监控系统(以下简称天镜)是国家气象信息中心基于全国气象业务监控系统的现状,结合气象信息化和业务现代化的目标,采用大数据、云计算等信息技术建设的统一技术架构的国省两级气象综合业务实时监控系统[1]。天镜系统具有开放、高效、可扩展的监控系统框架,通过规范化的监控信息采集和控制接口,接入观测、信息、预报、服务和政务管理等气象业务“全流程、全要素、全过程”的监控信息,横向整合气象核心业务系统运行监控,实现数据从采集、传输、处理、存储到服务的全流程监控;纵向实现对支撑气象业务的基础设施、场地环境全面监控,实现气象综合业务横纵一体化监控[1]。
天镜系统采用国省两级布局模式,自2018年开始,在中国气象局预报与网络司、国家气象信息中心的指导下,浙江省气象局作为省级试点单位,完成了省级气象综合业务实时监控系统(以下简称天镜·浙江监测平台)的部署和应用,实现了省级基础资源、网络、数据全流程等气象业务的集中监控。但全省气象部门的监控业务仍存在一些问题,如市县级气象部门本地化监控依靠人力、监控系统分散、缺乏规范标准等等,严重制约了全省气象业务信息化、集约化的发展进程。而省级部署的天镜·浙江监控平台已经具备对市县级气象业务的监控能力,但没有在全省得到充分的利用。本文依托天镜·浙江省级监控平台,结合市县级监控运维需求,构建全省气象业务监控一张网,实现市县级气象业务的本地化集中监控及可视化展示,为市县级本地化气象业务提供一套通用的、整体的监控服务系统。
1 市县级监控现状及问题
虽然天镜·浙江监控平台已实现了省级基础资源、网络、数据全流程等气象业务的监控服务,但该平台只是被省级业务人员使用,市县级气象部门的本地化监控仍然存在以下几个方面的问题。
(1)市县级监控能力不足,缺乏本地化适用系统。调研发现,全省大部分市县级气象部门都有对当地业务不同程度的监控需求,但鉴于开发能力有限,大部分缺乏本地化监控系统,不能满足当前的业务运维需要。
(2)市县级监控平台分散,集约化程度不高。各市(县、区)气象部门没有统一、规范化的监控平台,缺少全局设计,导致监控系统重复建设,造成资源浪费。此外,监控系统之间独立分散,监控信息无法共享,气象业务无法统一监控,也制约着全省气象业务的集约化发展。
(3)监控智能化程度不高,值班依赖人力。目前大部分气象台站的气象业务还是依靠值班人员人工监控,气象资料传输告警依靠省级值班人员电话通知,无法提前发现问题,缺少工单提交等解决问题的智能化手段,增加了省市县3级值班工作的繁琐程度,降低了整体业务的运维效率[2-3]。
2 技术路线
2.1 总体架构
基于现有天镜·浙江监控平台,结合市县级监控运维需求,通过数据传输流程和市县级当地业务监控两条路线,共同推进全省气象业务监控一张网的建设,实现市(县、区)基础资源、网络、数据传输等气象业务的本地化监控及可视化展示,为市县级当地气象业务提供监控服务。
系统使用省级集中部署模式,采用B/S架构系统,市县级用户无需部署、无需安装客户端,只需连通网络即可通过Web网页查看当地气象业务的监控信息。当全省业务监控需求增加时,扩充省级平台资源即可,释放市县级投入运维的压力[4]。系统架构图如图1所示。
图1 系统架构图
2.2 全省数据传输监控一张网
全省数据传输监控的技术思路如下:(1)天镜·浙江数据全流程模块前期已实现对全省上行考核资料的传输监控,传输故障时会形成相应的告警信息推送到集中告警台;(2)根据浙江省资料传输业务要求,制定省市县各级适用的告警规则;(3)告警关联信息配置,即设置告警关联规则,包括告警短信模板、告警通知对象、告警接收手机号码、告警执行时间等信息;(4)对接短信、语音平台,将告警信息写入短信平台数据库,实现短信、电话自动通知省市县3级值班人员,完成全省数据传输链路全网监控。
2.3 市县级当地业务监控一张网
市县级当地业务监控的技术思路如下。(1)通过天镜监控信息采集控制统一接口获取市县级当地气象业务的监控信息;(2)通过天镜平台的标准接口对接探测中心装备信息;(3)所有监控信息纳入天镜数据库,统一规范管理;(4)借助天镜众创平台服务接口,实现市县级当地气象业务的可视化监控,完成全省市县级当地气象业务监控一张网。
3 本地化应用成果及效益
3.1 全省数据传输自动告警
目前,浙江省各气象台站先将气象观测资料(文件、消息等格式)发送至省级气象通信系统(CTS),再由省级气象通信系统发送至中国气象局气象通信系统[5-6]。在上行资料的传输流程中,任意节点、任意传输链路发生故障都会影响气象资料的传输。
为了做好全省气象数据传输保障工作,借助数据全流程监控模块及阿里云服务,开发了短信、电话自动告警功能,当数据传输业务发生故障时,短信、电话自动告警提示省市县3级值班运维人员。
数据传输告警业务流程如图2所示,以中国国家观测站地面小时观测资料(BUFR格式)和中国酸雨观测资料((BUFR格式))为例,当省级系统未收到县级资料时,省级平台自动发送告警短信、语音电话给县级值班人员,提醒处理故障;当国家级系统未收到省级上传的资料时,平台自动发送告警短信、语音电话给省级值班人员。短信及语音电话内容包括资料名称、资料时次缺报站号、资料缺报的具体传输节点,值班人员接收到告警短信后,可根据该短信的提示信息精确定位故障点,缩小故障排查范围。
图2 省市县3级数据传输告警示意图
3.2 市县级本地化大屏监控系统
依托天镜基础平台,建成市县级本地化大屏监控系统,并完成与试点气象局的数据对接,目前天镜·浙江基础平台已监控试点宁波市基础资源(服务器88台)、网络(设备16台)及考核观测站点175个。通过平台第三方服务接口,开发了宁波市当地气象业务可视化大屏,在省级天镜平台上实现了对宁波市气象局地面综合观测、装备信息、天气雷达、基础资源、网络环境等气象业务及运行支撑环境的本地化监控。
3.3 创新点及效益分析
3.3.1 全省一个平台,打造集约化监控
(1)省级监控。前期通过全国统一部署的天镜基础平台,实现了对省级基础资源、网络及机房环境、数据传输流程的综合监控;(2)市县级监控。依托天镜本地化建设与应用,建设了市县级大屏监控系统,实现了对市县级当地气象业务的集约化监控。
通过本地化建设,天镜平台监控初步实现了省市县3级业务监控功能,为全省气象业务提供了“一个平台、一套软件”的集约化监控服务。通过省级集中部署模式,将所有的应用和数据集中部署在省级天镜硬件集群中,市县级应用服务,通过浏览器快速访问天镜平台[7],与以前相比,有以下4点效益。
一是市县级气象局无需部署服务器和安装软件应用,减轻了运维投入和人员工作量。
二是方便平台应用的全省更新,通过省级集中部署方式,仅通过省级的调整即可,市县级气象局无需操作。
三是监控数据的完整性、正确性及系统的稳定性,都较之前未集约时有了很大的改善。
四是天镜平台针对市县级气象局的资料传输、基础资源、网络环境等共性业务建设了通用的监控系统,避免了各地政府对气象监控系统建设资金的重复投入,以免造成资源浪费、功能重复。
3.3.2 监控一张网,纵览全省气象业务
通过天镜平台数据流程全省监控告警及市县级当地业务监控初步实现全省监控一张网,有以下几点效益。
一是从技术上实现了气象数据传输流程全网监控,借助天镜平台的短信及语音告警,无需人工干预,省市县3级值班人员可第一时间发现问题,第一时间处理及解决问题,提高了气象数据的传输质量和服务时效。
二是故障精准定位,当资料传输缺报时,结合天镜平台对基础资源、网络环境的监控,可区分物理链路故障与数据链路故障,做到故障精准定位,提升业务故障处理的自动化和智能化水平,增强业务系统稳定性。
三是以省级天镜平台为全省气象业务监控中心,为省市县3级提供业务监控服务,全省统一监控业务流程,形成气象监控业务管理新模式。之前省级及市县级建设有多个小型的监控系统,且相互之间有各种信息交换,全省业务监控杂乱无章;天镜全省统一监控平台建成后,全省共享一个监控平台,业务流程更加优化,业务职责更加明晰,避免重复劳动[8]。图3为全省监控业务变化示意图。
四是规范业务值班流程,提高省市县3级运维工作效率,逐步改进基层值班人员24 h人工值守的工作模式,大量释放人力资源,将更多的精力投入气象科研、业务和服务工作中。
3.3.3 市县级当地大屏,形成当地气象名片
建成市县级本地化监控大屏,解决了市县级气象部门缺乏本地化监控的难题,依托天镜本地化大屏展示平台,市县级气象部门可做到对整体气象业务的全盘掌控。不仅为气象数据业务及其信息支撑提供了可视化分析展示,有针对性地提升了数据共享服务能力和数据环境支撑能力,为气象预报预测、研判分析与决策提供了及时、准确的数据支撑,而且为当地气象部门打造了一张靓丽的“气象名片”。
4 结 语
依托省级天镜硬件基础设施,通过天镜·浙江监控平台的本地化建设,开发实现了短信、电话告警功能,为全省数据传输业务提供了及时、高效的监控告警信息,同时建设了市县级当地业务监控大屏系统,为全省市县级用户提供了一套统一、规范化的监控服务系统,解决了台站资料传输告警依靠省级值班人员电话通知、市县级气象部门缺乏本地化监控、业务监控大量依靠人力的难题。此外,天镜本地化建设是依托天镜省级通用版,基于平台提供的统一标准接口,在其他省市级业务应用中,也能方便快速地进行移植。
平台虽然在功能上实现了全省气象数据业务的集约化监控,但在实际业务应用中还存在一些问题,如平台的并发访问优化、平台稳定性、安全性等,还需进一步总结试点经验,完善平台功能,并在全省推广应用。