APP下载

监控易在民航气象信息系统运维上的应用探析

2023-08-04吕常胜薄双录

电脑知识与技术 2023年18期
关键词:监测点运维气象

吕常胜,薄双录

(民航东北空管局气象中心,辽宁沈阳 110043)

1 民航气象信息系统

民航气象信息系统包括民航气象数据库系统、民航气象信息服务系统以及相关的辅助支持系统等。主要负责民航气象信息的发布、接收、存储、交换,并对外提供气象信息的查询服务等[1]。民航气象信息资料包括有报文格式的实况报(METAR)和预报(TAF)[2],图片格式的卫星云图、雷达图、重要天气预告图以及专有气象信息格式的自动观测资料等。民航气象信息的及时、准确发布与获取,不仅关乎民航空管系统的服务质量,也影响到民航运输的安全与高效,所以,保证民航气象信息系统的正常运行至关重要。

2 民航气象信息系统的运维

民航气象信息系统自开始运行以来,其间经历了多次的更新改造,并且增加了其他一些相关辅助系统。虽然系统功能的逐步完善,服务质量也有了显著提高,但随着系统软、硬件的增加,系统的复杂程度也越来越高,相应的系统监控运维也越来越难,按原有方式的系统运维难以保障系统的稳定运行。

目前,民航气象信息系统的运维与监控主要通过岗位日常监控与巡视及用户主动报告问题来完成。虽然民航气象信息系统的部分子系统有些自带了监控功能,但监控信息不够全面、深度不够、定位不准,而且相关系统的监控关联度不高,也给系统的运维造成一定的困难。另外,日常监控主要是维护人员在岗监控,如果是夜间或人员不在岗,则系统的运行状态及监控信息不能及时获得,则会延误解决问题的时间,影响系统的正常运行。

如何更好地整合各系统监控信息,及时准确定位故障原因,除了自行开发一套针对本系统的监控外,市面上也有许多成熟的相关监控产品可以采用,比如“监控易”。

3 监控易

监控易是美信时代自研的分布式、一体化数据采集与洞察管理平台。专注对局域网、广域网和互联网中的IT 资源和网络的故障监测和性能管理,是集中式、跨平台的一体化IT监控运维管理软件。监控易打破了采用多种监控工具对数据中心进行离散式管理的模式,采用多TS架构,集中统一实现IT、动环、智能物联网等智能设备和软硬件系统的自动采集、监测、巡检、告警及展现,实现不同系统间的数据关联与共享,从全局视角把控系统运行态势,实现故障快速定位和根源诊断[3]。

监控易系统为B/S 架构,采用底层分布式架构设计,各地数据中心可部署监控终端,设备监控指标的采集在监控终端完成,监控终端的状态数据和告警数据上传到集中管理控制台,所有监控内容通过集中管理控制台进行统一展示。

监控易的逻辑结构如图1所示。

图1 监控易的逻辑结构

在IT基础设施监控方面,监控易支持对上百家厂商的服务器、操作系统、数据库、中间件、应用、网络设备和存储设备的深入监控。除了支持自行研发的Agent 私有协议外,还支持SNMP、HTTP/HTTPS、ICMP、ODBC、SSH、TELNET 等公有协议[4]。并且有多种告警方式可供选择,如声音、短信、微信、邮件和脚本等,保证运维人员第一时间获得告警信息,及时排除系统故障,同时,也减轻了运维人员的工作强度。

4 监控易的部署

监控易支持多种形式的部署方式,常用的有本地部署、分布式部署、混合云部署、多层级部署等,本次安装选择本地部署。监控易软件安装完成后,即可对监控对象进行配置操作,通常包括以下几个步骤。

4.1 设备连接

在设备管理界面选择添加设备,这里包括服务器、应用和业务、网络设备、存储设备、虚拟机监测等项目,每个项目下有各个系统及应用厂家的产品及连接方式可供选择,选择好连接方式后,即可按照该连接方式的要求提供连接参数,如选择Linux 服务器的SSH Linux 连接方式,需要填写服务器IP 地址、端口号、登录名和登录密码等,之后选择下一步,进行与监控设备的连接。

4.2 添加监测点

与监控设备连接成功后,系统出现基本监测点和高级监测点两个选项,每个选项下面列出了若干可供选择的监控项目,用户可以选择所需的监测项目并对其进行基本配置,以满足不同的监控需求。如选择监控CPU、物理内存、网卡、磁盘、进程等。

4.3 编辑与测试

通过以上设备连接和基本监测点的添加后,在设备管理界面上便有了该设备项目。在该设备项目下列有多个监测点,对每个监测点可以进行编辑、测试、禁止和删除等操作。通过选择编辑监测点,可以对该监测点的监测参数重新设置,以满足实际监控需求。如执行间隔时间、计划任务、危险阈值、故障阈值等,还可对该故障处理方法进行描述,以提示用户如何处理。

5 监控易在民航气象信息系统运维上的应用

下面通过几个具体示例,简单描述监控易在民航气象信息系统监控方面的应用。

5.1 网络设备的监控

网络设备有各种品牌的交换机、路由器、防火墙、负载均衡、VPN 等设备可供选择监控,如选择锐捷交换机产品,通过配置SNMP端口进行设备连接,监控项目有交换机的CPU、内存及各接口的连接状态等。

5.2 服务器的监控

可监控的服务器包括Windows 服务器、Linux 服务器、IBM AIX服务器,HP和SUN的服务器等,如通过选择IBM服务器类别、连接方式选择SSH IBM AIX,配置好IP 地址、端口号22,登录名和密码后连接成功,可选监控点CPU、交换分区、物理内存、网卡、磁盘和进程等。

如对民航气象数据库通信系统进程rmqtxt 的监控,该进程负责获取通信系统MQ 本地队列LOCAL.TXT 的报文数据,交由后续的进程处理,如果该进程down,则导致队列数据积压,影响报文数据的接收及处理。该监控点的监控参数可以选择5分钟监控时间间隔、故障阈值为小于1。如果该进程down,则系统监测到该进程运行个数小于1,满足故障阈值条件,监控系统提示警告。

5.3 数据库的监控

可监控的数据库类型包括Oracle 数据库、IBM DB2 数据库、Sybase 数据库、MySQL 数据库、SQL Server 数据库等。民航气象数据库系统采用的是Oracle数据库,首先选择Oracle数据库连接,设置数据库用户名、密码、数据库SID、端口号、数据库IP 地址后,连接成功[5]。监控点包括连接会话数、Oracle 当前状态、逻辑读语句Top10、执行语句Top10、Oracle表空间等。

另外,可以配置SQL 自定义监测,通过查询数据库表信息内容,对数据库业务进行监控。如民航气象数据库系统会每分钟接收到本场的自动观测数据并处理入库,通过自定义SQL语句可监控自动观察数据是否按时收到。自定义SQL语句如下:

其中:

DBINFO.INFO_AWOS_RPT为自观数据表名

CCCC=′ZYXX′选择查询本场数据

OTIME为自观数据时间

该SQL 查询语句通过计算最新本场自观数据时间与系统时间的差值,再通过设置危险阈值和故障阈值的行数信息,得出自观数据是否收到的结果。如调试后设置故障阈值为行数60,当自定义SQL语句执行结果大于60 时,说明已有10 分钟未收到本场的自观数据,监控系统随即警告。

5.4 MQ的监控

IBM MQ 是消息传递中间件,用于简化和加速多个平台中各种应用和业务数据的集成。民航气象数据库系统使用了MQ(消息队列)进行数据的传输。可以通过添加监控点完成对MQ的监控。

首先对MQ服务端进行配置,具体步骤如下:

1)切换到系统root 用户,在MQ 服务器上创建SYSTEM用户,并添加到mqm组

2)切换到MQ 管理员mqm 用户,查看MQ 服务器上的队列管理器

3)创建服务器连接通道,并指定为SYSTEM用户

中国的物流是个很极端化的行业,当然也许并不特殊。有明哲保身,谋求生存的物流企业,也有敢于叫板国际物流巨头,甚至收购国际物流巨头的物流企业。

4)创建监听器,注意端口号(默认1414)

其中,ZYXX是MQ本地队列管理器名称。之后,在监控易上选择添加中间件设备的IBM MQ 选项,输入MQ服务器IP地址、端口号、队列管理器名称、服务器连接通道后,完成IBM MQ 中间件的连接,并对队列、通道、系统队列、系统通道及侦听器状态等指标进行监控。

5.5 文件的监控

通过安装监控易私有Agent 插件,可以完成对文件信息的有效监控。

1)文件大小的监控

民航气象信息服务系统在Linux 服务器安装了Web服务,可以通过添加监控点完成对文件大小的监控。首先下载安装监控易Agent Linux 插件,完成对Linux 系统的Agent 方式连接,Agent 端口号默认是2198。配置监测点选择高级监测点的Linux File 选项,监控参数有要监控的文件名、危险阈值和故障阈值为文件的大小。如要监控tomcat 日志文件/home/tomcat/tomcat1/logs/catalina.out 大小,可设置危险阈值和故障阈值分别为2GB和4GB,当日志文件字节数大于4GB时,监控系统告警。

通过一些辅助的脚本编写,也可以完成对新增文件的监控。例如,气象雷达基数据每2~6分钟自动更新,而且数据会以不同的文件名存储在Windows服务器中。首先通过同步软件将最新获取的文件拷贝到其他目录,并更改为一固定文件名如radar.new。再通过编写定时删除脚本将其删除,如设置10分钟定时删除radar.new文件。这样通过监控易监控是否存在radar.new文件,即可完成对新增文件的监控目的。

首先下载安装监控易Agent Windows 插件,完成对Windows系统的Agent方式连接,Agent端口号默认是2198。配置监测点选择高级监测点的Windows 文件信息选项,监控参数有要监控的文件名、危险阈值和故障阈值为文件的大小。如要监控新增文件D:DATARADAR adar.new 大小,可设置危险阈值和故障阈值为none,当未监控到该文件存在时,也就是监控周期内没有新增文件到达,监控系统告警。

6 结束语

民航气象信息系统在空管服务及航空运输方面起着至关重要的作用,维护该系统的正常运行是提供保障的基础。监控易在民航气象信息系统监控运维上的应用,不仅提高了系统运维效率,也降低维护人员的工作强度。随着监控易系统在民航气象信息系统监控运维方面的不断开发与应用,必将在保障民航飞行安全,提高服务质量方面发挥更大的作用。

猜你喜欢

监测点运维气象
气象树
天津南港LNG接收站沉降监测点位布设
抚河流域综合治理监测布局优化
《内蒙古气象》征稿简则
全站仪极坐标法监测点稳定性分析方法研究
运维技术研发决策中ITSS运维成熟度模型应用初探
大国气象
美丽的气象奇观
我省举办家畜血吸虫病监测点培训班
基于ITIL的运维管理创新实践浅析