APP下载

医科大学校园关键业务链监测与预警系统的设计与应用

2021-12-05李彭军戴少锋

中国信息化 2021年11期
关键词:可视化关键预警

李彭军 戴少锋

随着国家教育信息化进程的推进,近年来,数字化校园和智慧校园的各种解决方案不断在高校校园中落地交付和推广应用。保障师生教学教务活动的正常开展,更是离不开各类业务系统的稳定运行。如何及时和有效地感知各种业务系统,尤其是关键业务的运行态势,并对异常的运行指标进行预警和分析等问题,成为了信息部门的重要任务之一。本文提出了关键业务链模型的设计思路和实践应用,包括运行指标定义、数据采集、联动预警和业务链可视化,能帮助有效提高关键业务运维的整体效率。

一、系统整体架构设计

校园关键业务链监测与预警系统基于B/S架构进行设计与开发,系统功能模块包括:指标定义模块、监测数据采集、告警策略模块、通知推送模块、业务链构建模块、业务链可视化和系统管理等。

业务系统层: 需要做监测与业务预警的各类校园业务应用;

监测数据采集与存储: 通过各类标准协议(SNMP、Agent、IPMI、Syslog、业务API接口等)采集各个业务系统和IT基础设施的运行数据和历史数据,整合到统一的数据层中;并通过标准格式定义进行转换,把有价值的数据输出到基础库中,便于进一步对数据的价值进行挖掘和可视化输出;

指标定义与分析:通过分析采集到的运行数据,定义业务健康度关键指标体系。并由系统自动校对关键指标配置,对业务运行数据进行比对和分析,对异常数据进行触发预警和通知推送动作;

可视化层:通过可视化组件,构建业务链可视化视图,并绑定实时业务运行数据和指标体系,通过大屏投屏的方式,对业务链实现一图一业务的全局监测效果呈现,让业务系统运维人员一眼能看懂业务的健康度。

二、关键业务指标定义

关键业务指标的评判和阈值的设置方法通常分为客观评价法和主观评价法。其中主观评价法通常由业务领域专家根据实际的经验值、業务需求来设置各个业务系统的运行健康指标阈值,确定影响业务系统运行的关键指标,这种方法的缺陷是具有一定的主观性和随意性。客观评价法大多采用神经网络等机器学习方法,通过海量训练样本建立评估模型。本系统结合两种方法,基于层次分析法综合考虑信息系统的业务逻辑和物理设施这两个主要维度,包括节点CPU利用率、带宽利用率、应用系统响应速度等因素,构造判断矩阵得到各个指标的权值。这些指标将作为衡量关键业务运行健康度的标准,系统会根据采集到的运行数据与指标进行比对,从而触发预警等动作。

三、监测数据采集的实现

底层通过开源软件Zabbix实现对监测对象(网络设备、服务器、PC设备、数据库、中间件、存储、备份、安全设备、应用系统等)的运行数据进行采集。

数据采集可以分为两种:主动监测和被动监测,系统采集端支持的采集方式包括Agent、SNMP(包括Trapping和Polling)、IPMI、JMX、SSH、Telent等,适合众多复杂系统环境的部署。本次业务链监测主要采用了SNMP、Agent和IPMI三种方式实现数据采集。

(一)SNMP协议方式

通过SNMP的查询和陷入进行监控数据的采集。适合对网络设备,如防火墙、交换机、路由器等监控数据的采集。目前Zabbix系统支持SNMP v1 SNMP v2c和SNMP v3版本的协议。这种方式安全方便,只需在相关设备上配置和开启SNMP服务,并允许监控服务器查询即可。

(二)Agent方式

在被监测对象上安装并运行zabbix被代理进程,通过该进程收集监测对象的运行数据,并与Zabbix服务器或代理(Proxy)通信,主动发送或被动接受服务器的数据。这种方法只适用于采集服务器或工作站上的监测数据,不适合路由器、交换机、防火墙等网络设备。

(三)IPMI协议方式

智能平台管理接口(IPMI,Intelligent Platform Management Interface),是管理基于Intel架构的企业系统中所使用的外围设备所采用的一种工业标准。通过这种方法采集数据的优点是:可以采集到其它方法无法采集到的硬件状态信息,例如CPU温度、风扇转数、电源状态等等,特别适用于服务器和存储系统等硬件。缺点是需要被监控硬件能够支持。而目前主流服务器和存储都会支持IPMI协议接口。

四、联动预警的实现

在数据采集完成之后,监测数据会统一保存到系统的标准数据表中,系统的联动分析模块会对采集到的数据和已经定义好的业务健康度指标体系进行指标比对和处理,判断运行数据是否有异常,是否符合预警条件。当达到预警条件时,则把信息推送给联动预警模块,预警模块根据业务的级别通知渠道设置,主动发送预警信息给管理人员。达到业务健康度的监测和预警效果。

五、可视化应用

通过上述的采集,系统里面已经存有各关键业务的运行数据。需要把这些数据以关键业务的维度,以直观的方式整合和呈现出来。根据各业务链的特性,把各类数据按照故障排查的思路去梳理,包括物理层、数据层、应用层、网络层和体验层五个维度去构建业务链。

物理层:包括设备设施和运行环境。

数据层:包括数据库和数据保障系统。

应用层:包括操作系统和中间件。

网络层:包括网络传输和支撑的相关设备设施。

体验层:包括用户对业务体验敏感的数据,如页面响应时长、下载速度等。

业务链构建完成后,把相关的关键运行数据和预警联动的触发数据绑定到业务链上,最终构建出一图一业务的全局监测效果,让业务系统运维人员在业务链视图上快速判断业务的健康度。如下图是基于关键业务构建的业务链可视化。

六、结语

本文利用Zabbix工具对关键业务链的运行数据进行采集,并按照业务特性构建业务健康指标体系,基于采集回来的运行数据和业务健康指标体系进行指标比对和处理,判断运行数据的健康度,实现联动预警的推送。同时通过把业务数据构建到业务链上,实现了一图一业务的可视化效果,并在真实的校园网环境下进行部署和使用。实践结果表明,本文提出的关键业务链监测与预警方法可以为业务系统运维人员提供一种透明、高效和低成本的支撑手段,进一步提高了校园关键业务的整体运维效率。

猜你喜欢

可视化关键预警
数据可视化设计在美妆类APP中的应用
思维可视化
超级秀场 大风预警
金融系统中的早期预警信号及其统计物理性质
复变函数级数展开的可视化实验教学
复变函数级数展开的可视化实验教学
复变函数共形映射的可视化实验教学
复变函数共形映射的可视化实验教学
清淡健康的饮食是预防橘皮纹的关键!
卷烟工业企业产品质量预警机制的建立