APP下载

基于用户体验的应用性能可视化研究

2015-02-07国网陕西省电力公司信息通信公司张忠浩赵西林

电子世界 2015年16期
关键词:网络流量分部运维

国网陕西省电力公司信息通信公司 张忠浩 赵西林 徐 敏 尚 勇

基于用户体验的应用性能可视化研究

国网陕西省电力公司信息通信公司 张忠浩 赵西林 徐 敏 尚 勇

本文在详细分析了国家电网西北分部信息系统运维现状的基础上,采用理论分析与实践结合的研究方法,建设了一种新的基于用户体验的应用性能管理平台。通过可视化的业务性能和网络性能关键指标,并结合成熟的网管技术,对影响业务的相关性能问题进行主动预警,快速识别潜在的风险,变被动运维为主动运维,为业务流量和应用性能提供可靠、科学的数据支撑,不断提高应用性能和用户满意度,提升IT系统核心价值。

用户体验;应用性能管理;可视化;主动运维

前言

“关键复杂应用不具备高性能和高可用性将直接给业务生产力,业务收入和IT效率造成负面影响。”——Forrester

国家电网公司高度重视信息化工作,通过信息化SG186和SG-ERP工程建设,建成了完整的一体化企业级信息系统,其基础设施、硬件设备、应用系统、平台软件等软硬环境建设水平得到快速提高。因此,如何对现有的运维流程进行优化,保障关键业务的高可用性和高性能,推进信息通信工作向更集约、更精益、更专业方向发展,成为信息化建设中面临的重要问题。

1 国家电网公司西北分部现状

国家电网公司西北分部现有重要系统数十套,覆盖了规划、建设、检修、运行、人力资源、财务、物资等多个业务领域;在数据集成方式上,采用数据交换平台(DXP)、数据中心和应用集成平台(ESB)实现业务数据的横向纵向级联;在应用端集成方式上,采用单点登录集成方式,实现了应用系统界面集成;由于应用系统数量众多,逻辑关系复杂,使得系统运维工作难度较大。

在西北分部的持续投入及发展下,西北分部的信息系统运维管理水平取得了长足的发展,但随着业务系统的复杂度提升,在运维工具、管理体系方面还存在提升的空间,这体现在:

(1)缺乏终端用户感知体验的监控。目前对于终端用户的业务访问真实质量监控手段缺乏,由于客户端操作系统、服务器、数据库、中间件、网络等引起的突发性性能下降问题无法有效监控及定位。

(2)网络流量和应用性能监控仍需要提高。网络流量监控虽已具备一定的能力,但是网络流量的监控颗粒度较粗,对于基于应用的流量监控仍存在明显的不足,缺少基于业务的网络流量和应用性能的可视化监控。

(3)运维分工带来信息不对称、突发事件处置效率低。由于信息系统规模庞大、集成度高、系统之间联系复杂,在运维管理工作时往往采取将系统按照网络、系统、数据库、应用进行分层管理的方式进行管理。发生问题时涉及环节众多,各层面运维管理人员分头查找问题原因,各自为战,一方面需要付出较多的沟通和定位问题的时间成本,另一方面导致事件处理时间过长,影响被放大。

针对这些情况,西北分部从实际情况出发,以网络流量作为切入点进行面向业务的网络流量和应用性能可视化研究,通过建设信息系统应用管理平台,对网络流量进行可视化和精细化监控与分析,面向业务,从监控最终用户体验出发,解决了目前运维管理中面临的一些实际问题,最终达到提升业务连续性管理水平,提升运维管理水平的目的。

2 应用性能可视化的实践

2.1 建设目标

2.1.1 建立完整的网络流量监控分析平台

建立西北分部的网络流量监控分析平台,建设基于业务流的端到端的性能监控体系,对业务流进行多点关联监控部署,实现完整业务流的集中监控。

2.1.2 业务性能和网络性能预警与告警

集中展现关键应用或业务的SLA服务水平。定义关键性能指标的阀值,与当业务或网络相关性能达到阀值时,进行主动预警,快速识别潜在的风险,变被动运维为主动运维,

2.1.3 最终用户感受监控和优化

从两个层面实现最终用户感受的监控,基于网络流量的用户体验和基于HTTP应用的页面访问用户体验,同时监控HTTP应用层协议其它各项指标,为应用优化提供有价值的建议和意见。

2.1.4 性能故障的快速分析与定位

快速的对故障进行分析和初步定位,定位问题是网络问题还是服务器问题等,在问题出现时提供第一判断,为问题分析定位指明方向,使问题分析具有清晰的界面。

2.2 实施方法

本次系统建设在前期进行充分的需求调研基础上,在实践的过程中对原理和方法进行研究分析与验证,在后期进行综合测试和优化以确保业务监控的准确性和全面性。

2.2.1 需求调研

结合现有运维管理工作经验、工作流程及历史问题记录,对现有应用流量情况、网络情况及信息系统性能管理工作具体需求进行整体调研,确定管理范围、业务架构及系统功能架构等内容。

2.2.2 业务梳理

制定包含业务系统相关的负载均衡、服务器、中间件、数据库等组件的完整调研模板,通过该模板为载体,与应用管理部门进行有效沟通,形成系统调研报告,为后期的部署验证工作提供数据支撑。

2.2.3 部署验证

根据需求调研报告及系统调研报告在监控平台内进行软/硬件部署、业务监控定义、视图定义、报警定义以及报表的定制等部署工作并通过系统抓包分析、现场客户确认、架构分析等手段验证部署的正确性及有效性。

2.2.4 经验总结

利用应用性能管理系统,进行持续的日常性能监控、问题发现定位、问题处理工作,形成以业务系统特性为基础的经验分类总结库,根据各类型应用的独立特点形成性能管理经验及监控模型,以便在后期类似业务上线时采用类似模型进行监控,利用历史运维经验提升问题定位及处理速度。

图1 实施方法

2.3 系统实现

2.3.1 系统设计原则

应用性能管理系统总体设计遵循以下原则:

(1)先进性:业内先进解决方案,代表未来IT与业务融合趋势;

(2)安全性:旁路、非侵入式的监控,对现有网络和系统“零”影响;

(3)全面性:对全网流量、所有关键业务进行全面精细化监控;

(4)灵活性:业务监控部署灵活,具有多种灵活的性能指标展现方式。

2.3.2 功能结构设计

根据西北分部网络及应用性能可视化的需求,结合西北分部现有环境,采用目前成熟的交换机SPAN技术,通过端口镜像方式,汇聚数据中心和各网络区域关键监控点的流量,并实现按需分配给相应的流量监测工具,实现基于业务系统、业务流对网络流量进行实时的各项性能指标分析,定制关键业务性能指标告警,并实时地将告警信息以Syslog形式发送给网管平台。

3 系统实施效果

3.1 实施环境

本次应用性能可视化系统建设主要部署信息系统响应分析组件、事务分析组件、应用系统结构分析组件以及系统展示平台,实施环境如表1所示:

表1 应用性能管理系统环境

3.2 应用效果

经过5个多月的系统建设和不断地分析验证,在西北分部构建了完整的应用性能可视化监控平台,并建立了完善的业务可视化监控流程和规范,西北分部的业务清晰度和可视度得到了全面的提升,部门间的沟通合作进一步紧密,故障处理效率得到显著提高,运维人员的业务意识和业务管理、问题处理水平也得到一定程度的提高。

搭建了完整的应用性能可视化监控平台:

(1)通过构建应用性能可视化监控平台,实现了西北分部全面、可视化、精细化监控关键业务系统的网络流量及应用性能;建立对关键业务统一的预警、告警机制;同时在业务质量的分析与统计、业务性能优化与提升、新业务的开发和测试等方面提供有力的数据支撑,对未来基于大数据的数据挖掘方面的研究也提供了基础的、必要的条件。

(2)实现了基于用户体验的性能监控。

性能监控更多关注了业务的终端用户体验,当业务的整体服务水平开始下降时,可以及时发现、深入分析,在一定程度上提高客户的满意度,提升了业务的价值。

(3)关键业务系统的实时预警与告警。

通过对历史问题的分析、归纳和总结,精心挑选了12个监控指标进行集中监控,从最终用户体验出发,实现了对业务系统、业务流关键点的7x24小时不间断监控。

(4)形成了快速故障处理主动运维流程。

以“恢复生产为第一要务”为生产运营核心理念,加强业务连续性和突发事件应急处置,建立了完整的生产运营管理体系。基于网络及应用可视化平台,借鉴网络运维经验,建立了快速故障分析和定位的流程,加快了故障分析和定位的速度,减少了故障处理时间,降低了故障影响的范围和严重度,提升运维管理水平,提升了客户的满意度。

4 结束语

完善的应用性能管理体系不仅需要单一业务故障点的性能监控,还需要从网络层面全面分析应用性能,完整的性能体系的建立还需要进行很长时间的研究和实践。虽然西北分部的网络及应用性能管理体系还不能解决所有的性能问题,但通过整合传统监控工具软件和应用性能监控平台,并在该平台及工具的体系上建立可行的、有效的应用性能监控体系方案,加强人员的培养,提升运维能力和自动化水平,西北分部正在逐步提高应用性能管理水平,提升信息科技风险管理水平。

[1]范建华,等译.W.Richard Stevens(美).TCP/IP Illustarated Volume1:The Protocols[M].北京:机械工业出版社,2007:227-229.

[2]宋义华,班孝明.应用性能管理分析[J].金融科技时代杂志,2014,10: 65-67.

[3]李璐.应用性能管理解决IT架构难题[J].通信世界,2012,27: 78-80.

表4 最快速度到达参数测试

表5 最稳定到达模式参数测试

通过对表4中的耗时数据和其他的数据对比,可知在相同测试条件下,最快到达模式下的耗时是最少的,符合设计要求。通过表5的耗时时间和角度误差两项数据共同对比,加入随机干扰信号和不加入随机干扰信号下,耗时时间相当,误差也不超过0.35度,说明了在最稳定到达模式下的设计满足预期要求。

5 结论

本系统设计了一个驱动电流可调节的以MOS管为核心器件的H桥电机驱动电路,其最大的驱动电流可达到1.3A;该驱动电路在电路仿真软件中得到了理论的设计验证;结合单片机外围电路,它们构成了一套完整的微电机驱动系统;实际测试表明,该系统不仅能完成各个指标要求,细致的电路板设计使得电路板稳定性良好,能够抵制一定干扰,同时还加入了丰富的人机界面,使得该系统易于使用,增强了实用性。

参考文献

[1]康华光.电子技术基础(模拟部分)[M].高等教育出版社,2005.7.

[2]电子技术基础(数字部分)[M].康华光高等教育出版社,2005.7.

[3]胡汉才.单片机原理及其接口技术[M].清华大学出版社,2011.11.

[4]刘玫,张雨萍.电机与拖动[M].机械工业出版社,2009.1.

[5]李全利.单片机原理及接口技术(第二版)[M].高等教育出版社,2009.1.

作者简介:

刘湃(1992—),男,在读研究生,现主要从事自动检测与控制的研究。

陈永军(1972—),通讯作者,男,教授,硕士生导师,现主要从事电力电子与电力传动的教学与科研。

阮波(1990—),男,硕士研究生,现主要从事电力电子与电力传动、电子与通信工程方面的研究。

张忠浩(1969—),男,陕西西安人,高级工程师,主要研究方向:企业信息化、电力信息化运维。

猜你喜欢

网络流量分部运维
几个关于1-2有序分拆的恒等式及组合证明
基于多元高斯分布的网络流量异常识别方法
基于神经网络的P2P流量识别方法
运维技术研发决策中ITSS运维成熟度模型应用初探
风电运维困局
杂乱无章的光伏运维 百亿市场如何成长
AVB网络流量整形帧模型端到端延迟计算
关于正整数不含分部量2的有序分拆的几个组合双射
分部积分公式的解题技巧
关于分部积分的几点说明