基于ITIL的运维管理系统设计
2015-12-27张晓玲钟名丽
张晓玲 钟名丽
(兰州石油化工公司研究院,甘肃 兰州 730060)
基于ITIL的运维管理系统设计
张晓玲 钟名丽
(兰州石油化工公司研究院,甘肃 兰州 730060)
通过对ITIL运维服务管理流程的分析和研究,针对信息系统的自身特点,设计出信息系统运维管理系统并应用,使得信息系统运维管理能力得到提升。
ITIL;运维请求;问题管理;变更管理;知识管理
随着IT技术对企业业务的作用日益显著,企业投入了大量资源用于信息化建设,然而,在IT技术不断给企业业务带来效益的同时,也带来了IT运营成本和服务风险不断增加等诸多困扰。
一、基于ITIL的信息系统运维管理系统的研究
1.ITIL标准框架概述
ITIL(Information Technology Infrastructure Library)又称作“信息技术基础构架库”。是英国政府组织并由一批国际知名IT厂商和专家共同研究开发形成的一套IT行业的服务管理标准库。20世纪90年代中期ITIL已经成为IT管理领域事实上的国际标准。
ITIL标准主要包括6大模块(图1),即业务管理、服务管理、ICT基础构架管理、IT服务管理规划与实施、应用管理和安全管理。ITIL的核心模块是“服务管理”,这个模块一共包括10个流程和1项职能,这些流程和职能又被归结为两大流程组,即“服务提供”流程组和“服务支持”流程组。其中服务支持流程组归纳了与IT管理相关的1项管理职能及5个流程,即事件管理、问题管理、配置管理、变更管理和发布管理,是信息系统运维的核心管理流程。
2.运维管理系统在设计时应遵循的原则
以ITIL的框架为基础,分析比较目前相对成熟的运维系统,在设计信息系统运维管理系统时,应当遵循以下原则。
(1)界面简洁友好。
(2)注重信息系统运维的全过程管理。
(3)追踪运维请求的根本原因。
图1 信息技术基础构架库
(4)考虑运维问题的关联性。
二、信息系统运维管理系统设计
中国石油炼化企业设备综合管理平台自2006年推广应用以来,已完成多家地区公司的上线工作,随着平台在企业设备管理中不断深化应用,信息资源的增长也对平台的运维服务管理部门提出了更高的要求,不仅要进行平台基础设施的日常运行维护管理,支撑业务系统稳定、高效运行,而且应该实现长期安全、可靠、持续的运行环境,使平台能够以用户为中心,主动适应业务发展需求。实现上述目标的关键是建立一系列的管理流程和支持工具,提高平台运维工作效率,提高用户的满意度。
2012年初平台运维项目组在学习了ITIL和ISO20000等国际标准和认证体系的基础上,以ITIL的运维流程(图2)为基础,考虑平台当时运维工作的实际情况,分别设计运维系统各模块的功能及流程,明确各功能模块之间的流转关系,最终形成了适合平台需求的运维管理系统。该系统通过近3年的应用实践,不断完善,使得本企业信息系统运维管理能力得到很大提升。
图2 ITIL服务支持流程关系图
通过对ITIL服务支持流程的分析,考虑信息系统运维工作的迫切需求,运维系统在设计时,初步考虑实现运维请求管理、问题管理、变更管理和知识管理4个部分,其他相关功能在后续的工作中逐步实现。运维系统各模块功能及流程设计如下。
1.运维请求管理
(1)功能描述。运维请求模块是运维系统的入口之一,目的是实现日常问题的快速处理响应、统计处理时间、处理情况。通过采用主体界面分层级展示的方式,确保基层用户录入界面简洁、减少必填字段、减少用户操作环节。其中,属于未知问题需要寻求根本解决方案的转入问题管理模块处理。
(2)流程描述如图3所示。
①用户提出运维请求并记录。
②进入问题类型判断,已知问题处理并记录;未知问题,提供临时解决方案,同时将运维请求转入问题管理功能进行处理;变更或新需求转入变更管理功能进行处理。如果都不是,由实施方对请求提出解决方案进行处理,然后由二级运维单位判断事件是否永久解决和是否变更,不是永久解决事件转入问题管理功能,变更的进入变更管理功能。确认后,由发起人将运维请求关闭。
③对于运维请求的管理要求采取谁发起谁关闭的原则。
(3)指标(请求管理指标):常规请求处理时间不得超过48h。超过48h未处理的常规请求需要给请求处理负责人发提醒。
每级运维请求处理的时间定义为该级用户将该请求从前一级发出的时间到将该请求发送至下一级运维的总耗时。
2.问题管理
(1)功能描述。问题管理是对问题进行分类总结管理,可以将目前不具备条件实现的运维请求转为问题进行处理。
由运维人员对问题进行识别、记录、分类,由系统实施商提供解决方案,运维人员对该方案进行审核、确认,系统实施商对该方案进行实施后,运维人员确认并关闭问题。关闭的问题由运维人员判断是否需要对信息系统进行升级,需要升级的转入变更管理流程,不需要升级的将该解决方案录入知识库。
(2)流程描述如图4所示。
①由运维人员针对未知问题进行确认。
②提交给系统实施商编写解决方案。解决方案由用户进行审核,判断是临时方案或永久方案。如果是永久方案就直接进行修改实施,如果是临时方案,先由实施方进行处理,之后在进行详细处理,提出永久方案。
③问题源于运维请求,统一由运维人员进行关闭。
图3 运维请求管理流程图
图4 问题管理流程图
④问题关闭之后,将具备解决方案的问题记录到知识管理中。
3.变更管理
(1)功能描述。变更管理模块是运维管理系统的入口之一,同时也是一个单独的功能模块,基于变更纸质表格进行设计,同时新增需求也在此处合并处理,通过增加字典加以区别。
(2)流程描述如图5所示。
图5 变更和新增需求流程图
变更与运维请求管理的主要区别在于需要控制的字段不同,主要过程基本保持一致。
4.知识管理
(1)功能描述。知识管理与问题管理具有关联关系,已经解决的问题可以转入知识库,形成系统常见(已知)问题知识库(按点击率统计),便于运维知识的共享与查询。可分别从所属功能模块、根原因分析、运维事项等多纬度多角度进行管理。具体要求如下。
①实现操作手册按照条目拆分查询。
②采用标签方式对知识库提供检索功能,并提供全文搜索功能。
(2)流程描述。对于问题管理模块中已提供永久解决方案的问题转入知识库,由运维人员对问题原因进行分析,加注根原因,形成信息系统运维知识条目。
三、结论和建议
通过该系统的应用,实现了:信息系统运维请求的全过程管理、追踪运维问题的根本原因、控制信息系统的变更和新增需求,并形成了运维知识库,便于对运维问题进行统计分析,为运维工作提供了依据。
在运维系统的设计中还增加了“补充信息”的特色功能,该功能是在该条运维请求关闭前,相关人员可以随时添加对该问题的说明和解释,确保运维问题的描述更加清晰明确,同时提供了问题提出人和问题解决人的沟通渠道,提高了解决问题的准确性。
随着运维系统的进一步应用,应当考虑在运维系统中设计“监控管理”、“配置管理”和“发布管理”等功能,更加全面地对信息系统的运维进行管理,同时随着运维数据量的增加,形成相应的统计报表,分析和统计运维服务的各项指标的完成率,进一步提高信息系统运维服务的质量和工作效率,提高信息系统用户的满意度。
[1]黄岩渠.ITIL实践:运维管理系统设计与实现[J].金融信息化论坛,2009,8(12).
[2]刘志刚.IT系统运维服务流程管理的探索与实践[J].机场建设,2010,4(41).
[3]刘通.ITILV3服务管理与认证考试详解(第2版)[M].哈尔滨工业大学出版社.
[4]张礼立. IT服务管理新论[M].上海交通大学出版社.
F273.4
B
1671-0711(2015)03-0050-03
2015-02-12)