APP下载

基于移动端的服务器运行监控系统设计与实现

2019-01-08苏健张进猛李冀东

电脑知识与技术 2019年33期
关键词:可视化服务器数据库

苏健 张进猛 李冀东

摘要:私有云服务器在大中型企业中的应用越来越广泛,服务器数量随着应用扩展越来越多,给运维监控带来了巨大挑战,为了解决服务器运维监控问题,提高运维率,提高系统的高可用性,方便运维人员操作,该文设计实现了基于移动端的服务器运行监控系统,包括系统架构、系统功能,并对其系统构成模块和系统实现进行了介绍。

关键词:运行监控系统;服务器;数据库;监控指标;可视化

中图分类号:TP393 文献标识码:A

文章编号:1009-3044(2019)33-0014-03

1背景

随着信息产业的进步,大中型企事业单位的信息化建设程度不断加深,私有云服务集群在大中型企业中的应用越来越广泛。私有云平台是一系列物理服务器通过管理软件虚拟成若干台服务器池。虚拟的应用服务器数量可能多达上百台,而且根据应用的扩展还可以不断扩充,这就引发对大量主机、数据库、应用系统进行综合监控的需求,当管理员面对越来越多的服务器及其应用的时候,用人工方式对数据进行分析处理变得越来越不现实。为了及时发现陸能瓶颈,保证整体系统的高可用性,保证其高性能运行,企业系统运维部门面临着巨大挑战。因此,必须有一套合理的服务器监控管理方案。

目前传统的服务器监控系统不能实现移动化监控管理,使用监控系统的用户难以走出监控机房,而且没有集成网页防篡改功能,不能随时随地利用手机等移动设备查看系统服务器的各项运行指标和应用系统的运行状况,一旦应用系统出现运行故障还需要运维人员到机房现场处理。基于以上背景本文给出了基于移动设备的服务器运行监控系统设计方案和系统实现。

2系统架构设计

由于私有云集群系统涉及的服务器众多,要支撑上百个节点的服务器与应用的运行,传统的网络管理和监控面临巨大挑战,所以监控系统首先需要有一个好的架构,实现自动的监控和管理,这样可以大大减少运维人员的工作和降低维护成本。随着国内4G网络的成熟、支持wifi的智能移动终端价格持续下降,解决以上问题的网络和设备条件已经成熟。

系统在架构上由移动终端、调度服务器、预警服务器、代理服务器、数据库、监控服务器、真正为用户提供具体服务的应用节点服务器集群和应用数据库节点服务器集群组成,系统架构见图1。移动终端负责监控数据展示。调度服务器用来分析监控数据提供给移动终端展示、对于超出设定阈值负载的服务器调用告警服务器发出告警、向代理服务器发送故障管理与恢复指令功能。数据库存放所有的监控数据。监控服务器负责监控所管辖各节点服务器的实时陸能和综合状况,并按设定参数实时采集各应用节点和应用数据库节点的各种监控数据并存人监控数据库。

本方案做到了与平台无关而且能够实时通过移动设备实现远程移动监控,由于移动监控是通过互联网连通,而所有的应用服务器和数据库服务器都是内网部署,为了系统安全性考虑,方案中设置了前置代理服务器,代理服务器负责实时分析监控数据,再把分析结果实时传输给调度服务器,调度服务器把监控结果推到监控移动端和告警服务器。

3系统功能

为了能够及时有效地对越来越多的服务器及其应用监控数据进行分析处理,监控系统主要包含了以下几方面的功能:

系统管理功能,包括系统参数设置、维护被监控的服务器节点等。

应能够及时发现硬件故障并报警提示。

能保障系统的正常运行。

能够对系统关键资源的使用情况进行监测,超出预先设置的阈值参数主动向管理员发送告警信息间。

能够处理应用服务器的突发故障,保障应用的高可用性。

能够监控应用数据库服务器的运行状态。

能够对应用系统关键页面进行防篡改监控,防止不法黑客的攻击。

具体功能见图2:

4系统实现

系统分为监控调度模块,监控数据采集模块,网页数据比较模块,报警模块,故障处理模块,监控展示模块六个部分。如图3所示:

4.1监控调度模块

监控调度模块按照系统预设频率读取数据库中的监控数据,根据系统设置的参数标准判断各项指标是否异常及异常级别。系统运行指标项包括应用系统运行情况,应用数据库运行情况,硬盘使用率情况,CPU占用率情况,内存使用率情况,网络带宽使用情况,网页篡改情况等等。如果出现异常系统通过综合分析,根据预先设定的告警级别决定是否将调度指令发送给告警服务器。具体监控指标项及告警级别见表1:

4.2监控数据采集模块

应用系统运行情况数据采集模块根据数据库中设置的应用节点服务器网址,使用系统预设频率读取应用服务器的监控页面,如果網站能正常打开,说明该应用节点运行正常,然后调用网页数据比较模块采集首页是否被篡改数据。

应用数据库运行情况数据采集根据应用数据库节点ip地址定时向目标数据库发送“select I from dual”语句测试返回情况,如果能返回结果说明该数据库节点运行正常,否则该节点数据库异常。

网络带宽使用情况监控服务器定时调用网络流控设备接口返回当前带宽使用情况。

监控数据采集模块将所有这些监控信息存人监控数据库,为代理服务器分析整个私有云的服务运行及性能状况提供数据基础。

4.3网页数据比较模块

网页数据比较模块是在打开网站首页获取到网页数据后,将当前获取的网站首页数据与预先保存的网站首页标准数据内容、大小、更新日期比较,如果一致说明首页没有发生篡改,否则有被篡改嫌疑。

系统实现过程是通过编写defense.sh脚本,该脚本定时调用执行网页数据比较程序,比较程序主动抓取应用节点页面的数据项和数据库预存的数据项做比较,然后通过分析做出监控结果,如果发现网页内容异常,比较程序根据数据库预存数据自动恢复网站首页内容。

4.4报警模块

报警模块可以通过电子邮件、手机短信二种方式将网站异常信息发送给预设系统运维人员。保证运维人员能第一时间获得告警信息,及时进行紧急处理,以最大限度地减少损失。

电子邮件的发送使用TldSMTP控件,只要设置好参数,导人消息内容就可以了。

手机短信将各种报警预编译成每种告警模板,当出现告警时,调度服务器直接将相关参数传递给短信服务器,短信服务器通过短信接口进行短信发送。

4.5故障处理模块

在系统出现紧急宕机时,调度服务器调用告警模块发出告警信息,系统运维人员收到告警通知后,第一时间通过手机可以向调度服务器发送故障处理指令,调度服务器再通过代理服务器向故障节点监控服务器发送指令,监控服务器负责执行管理指令,包括服务器重启,网络链路切换等故障处理指令。

4.6监控展示模块

各种监控结果都能在移动设备上可视化查看,结果展示层使用java创建Web应用程序,以html5网页形式呈现功能界面,系统管理员可以查看各集群总体状态以及监控服务器主机性能指标、网络和数据库状态。集群服务器状态监控大屏查看页面见图4。

网络监控页面见图5。

本监控系统服务器端采用tomcat作为中间件发布平台,监控数据库是oracle,展示前端利用Echars结合JSP与JavaScript技术实现。

5结束语

本系统已经在中国邮政网络学院系统成功应用,运行一年以来,接收到各种系统警告40余次,给运维人员提前介入系统运维提供了宝贵时间,减少了由于系统问题导致的整个应用系统的停机时间,给故障排除和准确定位提供了依据,提高了系统的运维效率,大大提高了中国邮政网络学院系统的可靠性和可用性,经过上线以来的运行显示,该系统运行稳定,且满足了设计要求,达到了预期效果。接下来将不断根据实际监控需求对系统进行升级完善。

猜你喜欢

可视化服务器数据库
基于CiteSpace的足三里穴研究可视化分析
基于Power BI的油田注水运行动态分析与可视化展示
基于CGAL和OpenGL的海底地形三维可视化
通信控制服务器(CCS)维护终端的设计与实现
“融评”:党媒评论的可视化创新
中国服务器市场份额出炉
得形忘意的服务器标准
计算机网络安全服务器入侵与防御