气象短信平台监控系统设计
2015-02-14吴媛,万明,罗迎
吴 媛 ,万 明 ,罗 迎
(1.江西省气象局气象服务中心,江西南昌 330046;2.江西省气象局气象台,江西南昌 330046)
一套完善的气象短信业务平台监控系统及其告警机制,对短信业务系统中的硬件、软件设备进行实时监控和告警,可让业务管理者及值班人员随时、直观、便捷地掌握平台运行情况,及时发现并解决软硬件故障及问题,提高气象短信业务平台的稳定性,提升气象短信服务的工作效率。
1 气象短信平台监控系统概述
约定短信平台被监控模块与监控展示端通讯接口,设计监控前端展示界面的界面布局。监控短信平台从收集到审核、管理、发布以及发布完成等每步的状态监控;监控所有正在发布的任务执行情况,并可以根据正在执行的任务进行调整; 系统监控模块,可以提供对系统中的硬件、软件设备的实时监控和告警。主要包括如下设备:服务器主机设备、接入网关模块、业务模块、群发服务器、包月扣费模块。被监控的信息内容主要包括:系统资源占用信息(CPU占用,内存占用,磁盘空间占用等)、模块的记数信息、模块的运行状态。
1.1 告警系统模块图
告警系统模块图如下图。
1.2 系统监控
系统监控可以分为信息采集、信息存储、信息发布三个部分。
1.2.1 信息采集
信息采集模块能够获取被监控设备的特定信息,如CPU、磁盘空间、内存、特定进程、话单文件等,采集到的信息,经过特定的处理后,提交给服务器做分析、处理。每个信息采集模块可以按照不同的策略来配置信息处理策略,比如话单数据库服务器,对磁盘空间的使用比较大,我们就可以把磁盘空间的处理策略设得比较敏感一些;对于应用服务器,内存和CPU的开销比较大,就可以对这两项的处理策略做相应的调整。
1.2.2 信息存储
信息存储模块负责存储信息采集模块发送过来的各种监控信息,并对各种信息内容进行相应的分类分析,以便于事后的系统监测和故障分析。
1.2.3 信息发布
监控系统支持多种信息发布方式:
1)数据库存储:缺省情况下,所有的信息都会存储在数据库当中,以便查询分析。
2)告警终端显示:可以支持在某一台或者多台计算机上运行告警终端程序;并支持声光显示。
3)短信/EMAIL告警:可以通过短信、或者EMAIL,把特定级别的告警信息发送给特定人员。
同时,系统也提供告警的API接口,系统以外的网络其他模块,通过该API接口,或者直接使用信息采集模块,就可以把该模块的信息采集过来,达到统一监控的目的。
2 通讯协议约定
短信平台与监控展示前端的数据传输基于HTTP协议,采用POST方式。各被监控模块通过HTTP接口定时向监控展示前端上报模块的运行数据。
3 通讯接口定义
见下表。
字段 说 明 长度(字节)备 注ModuleName 模块名称 32 每个被监控模块都有一个唯一的名称ModuleType 模块类型 32 被监控模块的类型,例如:1、短信网关,2、业务模块,3群发器,4、协调器,5、CAP模块MsgType 消息类型 32 消息的名称,一个模块可能会发送多种消息
3.1 短信网关上报消息定义
3.1.1 消息头定义
ModuleName:自行定义;ModuleType:规定为Infomaster;Carrier:运营商标识;MsgType:短信网关。
3.1.2 接口数据字段
网关模块上报的数据字段如下:
LinkStatus(短信中心连接状态);
DeliverySpeed(上行速度(条/秒));
SubmitSpeed(下行速度(条/秒));
CacheCount(当前缓冲个数);
SendCacheCount(发送缓冲个数);
SubmitCount(下行短 信数);
DeliveryCount(上行短信数);
SmcAckCount(短信中心回复ACK个数);
SmcAckSuccessCount(短信中心回复ACK成功个数);
SmcAckFailCount(短信中心回复ACK失败个数);
SmcAckExceptionCount(短信中心回复ACK异常个数);
SRCount(接收状态报告数);
SRSuccessCount(接收状态报告成功数);
SRFailCount(接收状态报告失败数)。
3.1.3 数据格式定义
各字段数值根据模块实际数据填写
4 结束语
本文主要介绍了气象短信平台监控系统的设计思路,监控系统的建立能实时、有效的监控气象短信的发送情况,保障气象短信平台的稳定运营,提高气象服务的工作效率。
[1]马玉春.计算机监控系统开发与实战[M].机械工业出版社,2012.
[2]古尔利,陈涓,赵振平,等.HTTP权威指南[M].人民邮电,2012.
[3]孙卓,袁婧,丁娜,等.市级自动气象站数据监控短信通知平台的设计与实现[J].信息化建设,2013(09).