银行业IT运维管理监控指标体系研究
2019-10-21薛翔
薛翔
摘 要 银行信息化建设和有效运行与IT运维服务体系息息相关,而检验信息系统是否安全运行的主要标准是系统是否能完成定量、实时的交易数据、事件以及性能指标,所以,银行作为一个信息流动量大且对安全性能要求高的交易平台,更需要构建一个完善的IT運维管理监控指标体系。本文首先认为银行业建立IT运维监控指标体系具有必要性,其次对IT运维监控指标体系进行了简单的研究,最后提出了建立IT运维监控指标体系的方法,希望对银行业的管理体系建设具有借鉴作用。
关键词 银行业;IT运维管理监控指标;体系研究
引言
在银行信息管理系统运行周期中,80%的时间都是用来进行系统的运行与维护,这就决定了IT运维服务在银行信息化建设和运行中的核心地位。因此,银行需要投入更多的精力去建立一个系统化、规范化的面向业务服务的运维监控指标体系,同时提高了银行的管理水平。
1 建立IT运维监控指标体系的必要性
1.1 业务发展的客观需要
一个完整的IT运维监控指标体系具备深度监控、全面数据采集和智能分析的特点,它将是一个能够给银行繁杂的业务流程带来便利且提高效率的服务系统。传统的业务管理流程大多数由人完成,在复杂、烦琐的IT细节上花费了太多的人力资源,而拥有了一套规范化的监控系统后将极大改变这种情况。从管理层面上看,可以让更多的管理者从具体琐事中解放出来,将更多精力用于决策上,这样才能真正发挥管理者的职能作用。该体系通过仪表盘将服务水平管理、监控和诊断结果呈送给管理者,让管理者一目了然;既提高了管理服务水平,又对管理者的业务管理活动提供了IT决策支持。不仅如此,该体系不仅能够提供实时监控与帮助,还能通过内嵌系统的方式,把需要关注的监控指标通过技术人员内嵌入系统应用中,起到“未雨绸缪”的作用。可想而知,该体系的建立是银行的业务发展需要。
1.2 完善监控体系的需要
建立一套切实可行的运维监控指标体系进行监控和分析工作是促进运维管理工作系统化和规范化的需要,它为运维提供了安全保障;另一方面,为了适应银监会《商业银行数据中心监管指导》关于加强采用监控管理工具实行监控重要信息系统的要求。其中的条例规定:“应集中监控重要信息系统和通信网络运行状态。采用监控管理工具,实时监控重要信息系统和通信网络的运行状况,通过监测、采集、分析和调优,提升生产系统运行的可靠性、稳定性和可用性。监控记录应满足故障定位、诊断及事后审计等要求[1]。”
2 对IT运维监控指标体系进行研究
2.1 IT运维监控指标体系的定位
该系统是以ITIL为理论基础,把业务服务与IT管理相融合,以此为客户提供更为优质服务的同时便于银行的信息管理。再将ITIL与业务流程管理(BPM)相结合,以可视化的方式给管理者提供业务状况,让管理者的工作与IT服务相协调。
2.2 IT运维监控指标体系的设置流程
首先通过层次分析法将监控要素(包括网络、主机、数据库等)进行分类,然后根据专家经验将各监控要素进行整合,经过两两要素的定量描述后建立起关系矩阵。最后进行层次排序,总共分为四个层次:应用系统层、系统资源层、网络服务层以及基础设施层。各个领域的相互协调能够保证业务的连续性。
2.3 IT运维监控指标体系中资源层面的分类
该体系的资源层面大致可分为四大类,包括数据库类、中间件类、操作系统类和储蓄类。其中数据库的指标是用于反应服务器等各个环节的运行状态,以保证体系运作的连续性;中间件类是将不同的使用特性的中间件进行分类,细分为WAS、Weblogic以及MQ这三种;操作系统是为了客观反应各种主流操作系统的运行状态;储蓄系统类是用于客观反映存储系统端口到端口的运行状态,可分为光纤交换机端口、XP储存系统等[2]。
2.4 完成监控指标工作的前提
该体系要想实现切实可行的指标监控,就要通过标准化的数据采集接收端口对数据进行收集整理、分类汇总和关联分析,以实现事件管理、性能管理、告警管理以及风险管理。
3 构建IT运维监控指标体系的方法
该体系的构建是一个循序渐进的过程,为了监控指标体系的有效运行,需要在前期的准备工作中做好监控指标的采集及其处理。包括指标的梳理、指标的设置、指标权重的计算、指标的评估,最后是建立体系。
3.1 指标的梳理
体系开发团队需要根据银行的业务特点,针对现实的工作需要,通过调查和采集的方式收集指定的监控指标的基本信息,汇总形成特定的监控指标集。而且指标可以根据实际情况进行调整。这样就可为监控系统提供对象的监控指标标准[3]。
3.2 指标的设置
指标的科学设置需要在指标的梳理上完成,设置的具体内容包括采集方式、采集频率、指标数据类型、触发告警条件与告警级别、指标数据输出接口类型等。值得注意的是,关键指标要做出标记。
3.3 指标权重的计算
指标权重的计算可通过定性或者定量这两种方法,即层次分析法或者专家经验法。两种方法配合使用可以互补长短,专家经验法在指标太多时无法综合判断导致指标权重不准确,而层次分析法正好能弥补这个漏洞。
3.4 指标的评估
对指标进行评估是为了更好地推动运维管理质量的提升,而评估过程中要遵守SMART原则,即坚持监控指标的针对性、监控指标的可量化、监控指标可收集、监控指标之间的相关性以及监控指标的实时性[4]。
3.5 确定并建立指标体系
完成以上四个步骤后基本上就明确了需要实施监控的指标,了解了指标之间的层次和依赖关系等重要信息后,就可构建起一个规范化、系统化的监控指标体系。
4 结束语
建立IT运维监控指标体系是行业发展的必然结果,符合现代企业的管理模式。成熟的IT运维监控指标体系能够极大地提升运维管理的水平,今后不管是在管理层面还是在技术层面,该体系都会有更大的进步,从而实现“运维经验”与“实时数据”共同作用,既能监控指标也能预测风险,同时为优化应用系统提供更多科学有效的参考依据。
参考文献
[1] 高绍新.银行业IT运维管理监控指标体系的研究[J].金融电子化,2014,(12):58-60.
[2] 戴长臻.银行IT运维操作审计系统的设计与实现[D].长春:吉林大学,2016.
[3] 李璐璐.IT资源监控管理系统的设计与实现[D].沈阳:东北大学,2016.
[4] 王钦可.基于ITIL框架的IT运维管理系统设计与实现[D].长沙:湖北工业大学,2017.