应用性能基线在企业信息化运维中的研究与应用
2020-11-20高峰王迪张静
高峰 王迪 张静
一、引言
性能基线就是在可控的标准化的环境下,通过测试工具采集和人工分析后得出的有参考价值的指标数据,其主要作用包括:
为容量规划确定系统和应用程序的标准参考数据;
为配置测试的参数和配置选项提供参考依据;
为验收测试确定系统是否具备自己所宣称的能力;
为性能基线的建立提供长期的数据统计来源以及比较基准。
二、国网河南省电力公司现状
目前,河南省电力公司的基线管理办法是借助应用性能管理软件,配合拨测系统,了解和掌握系统当前在运情况,然后以平均值的方式计算出系统的平均运行基线,在此基线的基础上上浮和下调一定比例来计算基线值。依赖这种基线管理办法,河南省电力公司为部分系统制订了基础的性能管理基线,基线管理工作已经取得一定成效,但由于这种基线管理办法依赖运维人员经验,基线的建立没有可靠的数据及科学依据,且无法覆盖业务系统的主要业务操作,在实际管理过程中存在以下问题:
(一)重点业务不清晰
目前的基线管理工作,是以业务为单位开展的,一个应用系统内哪些业务操作是重点操作难以进行有效区分,这就使基线的制订工作缺乏重点,实际使用过程中哪些系统的哪些业务操作是常用且重要的功能,缺乏有效分析手段。
(二)缺乏细节的数据采集
目前正在进行的基线管理工作,利用APM工具能够基于URL采集到不同业务系统的响应时间,但由于国网目前一些重要系统的特殊性,如营销系统,PMS系统等系统,系统具体操作业务之间的切换是以URL参数进行传递,整体URL路径不发生变化,目前无法统计具体业务操作的响应时间,无法采集并计算具体业务操作基线。
针对这些情况,河南省电力公司从实际情况出发,以信息系统运行性能指标作为切入点进行面向业务的性能基线分析处理研究,通过建设性能基线管理平台,基于历史数据,利用统计学原理计算科学基线,使性能基线管理活动更加深入有效,从人工统计转变为自动化、科学化的基线管理。
三、性能基线管理的实践
(一)建设目标
通过数据采集分析、基线模型生成、重要业务梳理等一系列工作,精准掌握重要业务系统重要业务的性能基线,并根据该基线数据进行持续监控,发现、分析处理性能问题,为河南省电力公司信息系统稳定运行提供有效人员及技术支撑。
(二)实施方法
河南省电力公司通过系统的数据采集、模型生成、关键业务梳理、业务统计分布、基线预测等方法,为业务系统的基线管理、基线监控、基线梳理、基线生成提供了可靠技术支撑。
1.数据采集
采用嵌入式引擎的方式进行数据的采集,完成数据全量采集工作,实现业务基线数据的获取与分析,数据分析数据精度达到URL参数级,完成业务性能数据的细节采集工作。
2. 模型生成
开展模型生成工作,以采集到的业务流量为基础,利用统计学模型进行基线生成,使信息系统应用性能管理的基线具备科学性和有效性,模型可采用六希格玛质量管理方法,对历史数据99%的数据作为上下基线。
3. 关键业务梳理工作
开展关键业务梳理工作,将不同单个功能的URL进行关联,从而使重要业务系统之间形成工作流,并对此工作流进行基线计算,从而使基线分析处理工作基于用户实际操作行为进行,而不仅仅针对具体页面。
4.业务统计工作
开展业务统计分布工作,按照统计学二八原则对数据进行统计,统计出一个系统内用户访问最多的业务,使数据基线制订工作具有更强的针对性。
5.数据预测工作
基于基线开展数据预测工作,基于历史数据的统计学方法预测,根据现状预测出问未来系统的变化趋势,从而帮助管规避部分业务问题。
(三)系统实现
1.系统架构
基线系统采用模块化的方式设计,利用嵌入式的数据采集引擎进行代码级运行指标数据采集,之后将采集到的代码执行效率数据存储至代码执行效率数据库内,将运行相关信息存储到关联分析数据库内,系统代码性能分析引擎则对这些采集到的数据进行处理,在代码执行效率分析、内存分析、参数关联分析、数据库语句分析引擎的共同作用下,为用户提供代码实时监测、关联分析报告、数据库深度监测功能。系统的架构具体如图1所示。
2.功能实现
基线系统通过嵌入式数据采集引擎采集来自中间件、应用服务器、数据库上的代码执行效率数据以及运行状态数据,并将数据存储数据库内,在这里数据处理分析引擎会对获取到的各类数据进行处理并进行关联分析存储,存储的数据最终将由数据应用层展示给用户,进行数据的各类监测、分析以及处理工作。
(1)重要业务系统运行数据采集分析
采集重要业务系统运行数据,采集的数据应重点关注不同业务系统的响应时间,同时在采集力度上能够达到URL参数级别,以此区分重要业务系统内部重要业务操作数据,为基线的分析工作提供数据基础。
(2)业务交易量分析
提供重要業务的操作交易量排名报表,能够按照不同应用系统进行区分,以此帮助管理人员分析出哪些业务操作是工作中经常会用到的重要操作,并重点计算这些业务的响应基线。
(3)业务基线计算
通过对采集到的数据进行分析实现不同业务,不同细节业务以及不同时段的基线计算,基线的计算方法应依赖统计学原理,包括数据正态分布校验,基于六希格玛的统计学基线计算等。
(4)业务运行数据预测
提供基于历史数据的预测活动,能够利用统计学知识进行数据预测,实现包括ANOVO数据关联分析以及蒙特卡洛分析在内的各种预测模型分析,预测未来系统运行情况。
(5)异常基线告警处理
能够监控运行数据并对运行数据与基线异常时产生的差异数据进行告警处理,能够根据告警信息判断事件是否是故障还是普通偏出,能够分析异常点并生成异常分析报告。
(6)数据报表与展示
提供数据报表服务,能够对主要管理业务系统的基线和运行数据进行日常报表报告,帮助管理人员直观的发现业务运行问题并分析数据。
(四)实施环境
本次性能基线系统建设主要部署数据采集模块、基线分析引擎模块、应用代码追踪监控模块以及系统展示平台,实施环境如表1所示:
四、系统实施效果
通过实施应用性能基线系统,实现了系统的数据采集、模型生成、关键业务梳理、业务统计分布、基线预测,为业务系统的基线管理、基线监控、基线梳理、基线生成提供可靠技术支撑;引入代码级监测与管理系统,在性能优化前后明确指出需要优化的语句以及代码,使得优化工作更具针对性及深度,切实帮助系统提升稳定性和可用性,消除故障隐患,防止故障发生,使运维管理人员在进行系统建转运、日常运维、日常巡检、应用性能优化等多项工作时加深工作深度、提升工作效率、提升运维管理工作精细化程度,从而降低整体运维工作成本。
五、结束语
通过建设性能基线平台,河南省电力公司实现了重要业务基线的自动化生成管理,完成了对重要业务系统进行业务流量监控、基线生成、数据预测等工作,为性能基线在业务系统运维工作中的应用作出了有益的探索。后续还将结合人工智能(AI)和机器学习(ML)技术进一步完善智能化的性能基线管理,提升对业务系统运行状态的准确预测,保障业务系统健康、稳定的运行。
作者单位:国网河南省电力公司信息通信公司