基于ITIL4构建运维管理服务体系支撑数字化改革
2022-11-02文侯元刚孙建山
文侯元刚 孙建山
5G时代的全面到来,围绕新兴技术推进数字化建设就成为未来发展的主要方向。上述背景下,数字化技术开始在多个行业进行广泛的应用,利用数字化优化管理模式、提升管理效率、再造服务流程等逐渐成为各个行业转型发展的主要方向。从数字化建设动态来看,ITIL4作为“数字化转型”和“工业4.0”而引入的新版本,无疑成为社会共同关注的焦点。
随着数字化改革的不断创新与发展,需要构建全过程、全方位、全协同的运维管理服务体系。ITIL4 提供一种端到端的数字化运营模式,用于交付和运营信息化技术支持的产品和服务,并使IT团队能够继续在更广泛的业务战略中发挥重要作用;ITIL4 还提供了一种整体的端到端的方法,它集成了诸如精益、敏捷和DevOps等框架。
一、IT运维服务的发展
ITIL作为全球IT服务管理领域的最佳实践知识体系在过去的30年里通过出版、培训和认证为IT管理者,特别是从事运维工作的人员提供了指导。伴随着ITIL4 版本的升级和发布,全新的ITIL将IT服务管理延伸至客户体验、价值流和数字化转型等方面,与此同时也将进一步拥抱当今盛行的IT管理最佳实践例如精益、敏捷和DevOps。
ITIL4 为新型服务管理的挑战与优化现代新兴技术方面提供了指导。新的知识体系确保了IT驱动服务高效治理及管理的灵活性、协同性和集成性。
二、现代IT运维管理面临挑战
(1)运维对象资产不清晰,系统运行状况、购买服务清单等各类软硬件资产数量庞大、种类繁多,需要对其进行梳理和维护,作为运维管理的基础信息和依据。
(2)运维内容复杂多样,运维内容包括应用、数据等,业务系统多由建设单位负责维护,运维复杂度高,缺乏有效的知识管理,容易产生人员单点故障。系统建设单位多,维护服务分散,容易形成技术孤岛,造成资源浪费。
(3)运维服务不规范,维护人员处理问题主观性强,运维工作缺少针对本业务系统的相应规范;突发的事件多,救火式的被动维护;各系统厂家遇到系统边界线问题时,相互推责任,影响系统整体运行效果;项目建设转入运维的流程不规范,项目验收缺乏运维团队接受和确认,资产移交、配置管理缺乏有效的规章制度管控,给后续系统稳定运行埋下隐患。
(4)运维过程不透明,“谁建设,谁维护”的运维模式下,运维过程黑盒化,对IT系统的运行情况、资源、技术等,大数据中心不能掌握;运维过程缺乏监管,无法跟踪管理运维过程及结果;大数据中心汇聚全省的信息数据,信息的安全性要求越来越高,需要对系统建设和维护厂商进行有效监管。
三、运维管理服务的实践
首先建设完善的运维服务体系为基础,建设标准化、规范化、流程化的运维管理体系,确定各项运维活动的标准流程和相关岗位设置等,使运维人员在制度和流程的规范和约束下协同操作。其次建设统一、集成并可扩展的运维管理平台,实现跨域、跨云、跨部门、跨业务、跨层级的集中管理;实现运维体系流程的信息化运转;实现对各类监控数据和告警信息的全面采集、及时处理与合理分析;实现运行维护工作的智能化、可视化和高效率。最后建设运维服务团队,有效利用技术手段和工具,做好各项运维工作。
(一)明确建设方针与指导原则
基于ITIL4构建运维管理服务体系的建设,首要任务在于明确建设的具体方针与建设过程中需要遵循的指导原则。具体来说,基于ITIL4必须要严格遵循从你的位置开始、专注价值体、全面思考与工作、反复进行反馈、保持简单与实用这几项基本原则。在推进运维管理服务体系建设的过程中,应当将其全面渗透到建设的各个环节,同时针对建设的方针进行规定。比如,对于专注价值体这个基本指导原则的遵循,基于ITIL4构建运维管理服务体系的整个过程中都需要从客户或者其余利益相关者入手,应当主动为他们创造价值。对于服务提供商来说,必须要明确究竟谁是自身的服务者,同时也需要明确存在哪些利益相关者。在此基础上,服务提供商还需要真实了解对服务使用者存在价值的东西包含哪些。因此,基于ITIL4构建运维管理服务体系的指导原则需要明确消费者为何会使用服务,上述服务能够帮助消费者达成怎样的目标,在为消费者服务的过程中是否会产生风险。在此基础上,针对指导原则进行全面的分析,制定详细的建设方针,包括基于ITIL4构建运维管理服务体系始终围绕建设方针与指导原则来开展。
(二)服务管理体系制定
在完成建设方针与指导原则建设的基础上,基于ITIL4构建运维管理服务体系还必须要针对内部观念进行转变,通过全面宣传ITIL4理念,使得内部能够在精细管理理念方面达成一致。在此基础上,针对传统分散管理模式进行优化,建立高度统一、集中的IT服务管理模式。通过建设IT服务管理平台,引入更多的软件、工具,同时完善整个服务的流程,进一步提升服务的专业性、规范性。
IT系统运维三分技术七分管理,管理的落脚点首先体现在制度流程。因此本文运维管理服务体系的核心就是围绕如何建立制度流程、如何落实制度流程、如何实现制度流程的持续优化。
下图为IT运维管理过程中基于ITIL逐步形成的IT运维管理体系图,从中可见既有一些标准的ITIL流程,也有在标准ITIL流程基础上的改造,还有许多是ITIL中未提及,但在运维实践中根据实际需求逐步探索出的有效解决方案,如工程配合、任务管理、系统交维等管理流程。
图-1 运维服务管理流程
(三)运维管理工具平台搭建
建设一体化运维管理系统,解决入口杂、效率低、问题追溯困难、管理难等问题,实现各类运维工作线上化、标准化,将复杂的各类运维流程规范进行标准化对接和输出,实现运维整体流程可用、易用;通过监控数据的实时汇总分析,对监控数据进行可视化分析后,为运维对象的稳定性和可用性提供数据支撑,为运维提供可靠的数据支撑判断。
1.统一IT资源管理,全面、动态掌握IT资源的性能变化,实现IT系统中不同品牌、不同类型的IT资源实时监控,包括网络设备、安全设备、主机、虚拟化、存储设备、数据库、应用服务、机房环境等,支持多种数据采集方式,将所有资源的实时信息纳入同一个管理平台中,实现集中、统一管理、实时告警。
2.提供流程咨询,实现定制化流程,实现运维体系的管理制度、岗位职责、工作模板、管理流程、工作流程、管理工具等要素,采用先进科学的技术工具搭建运维管理流程和有效的知识交流平台,切实保障运维管理体系的落地实现,建立知识共享机制,实现IT信息系统内部知识的交流与积累。
3.提供统一门户,实现实时服务监控和绩效管理,整合告警、资源、业务、拓扑、个人工作台等IT基础架构的监控功能,并对各项资源进行数据采集,建模分析实现业务视角IT管理,为决策者提供信息化管理决策依据。
4.丰富的图形化综合视图,呈现IT建设与管理业绩,实现良好的可视化效果,利于大屏展现,呈现IT设施的分布及运行状态,管理更直观、更轻松。
(四)运维服务保障团队建设
基于ITIL4构建运维管理服务体系,所有的操作最终均需要人来完成。要想保障最终的建设成果,必然需要加强运维服务保障团队的建设,通过全面提升运维服务队伍的综合能力,保障运维管理服务体系的各个环节都能够高标准执行。这就需要充分结合现有运维服务队伍实际情况,针对现有运维服务队伍进行全面的调研,以此来制定针对性的培训教育措施,全面强化运维服务专业的培训教育工作,同时落实思想政治教育工作,使得运维服务队伍能够统一思想、统一意志,最终保障行动的高效统一。对于专业技能的培养,需要全面围绕ITIL4、运维管理服务体系进行系统的讲解,全面讲解基于ITIL4构建运维管理服务体系的具体流程,以此来强化运维服务队伍的理论知识、专业技能。
根据业务属性组建运维专项人员保障,落实IT运维管理体系,整合服务资源,以流程为导向,发现问题、转变服务、改进服务水平和效率,提高用户满意度。对所有服务安排7✕24小时值班监控人员,第一时间发现和通告报警信息,提升故障及时响应率和缩减故障影响时长,持续改善现有IT服务。
在此基础上,为进一步提升运维服务队伍的主观能动性,还必须要加强运维服务队伍的绩效考核体系,在针对传统绩效考核指标进行分析的基础上,积极纳入服务指标、服务请求完成率、客户满意度等相关指标,并针对各个指标赋予科学的权重,进一步提升绩效考核的针对性,保障考核的公平性、公正性。此外,绩效考核指标应当与薪酬进行挂钩,并建立对应的奖惩体系,保障运维服务队伍能够严格落实自身的责任,切实保障运维管理服务体系的顺利执行。
四、结语
ITIL是当前全球信息技术服务管理领域的最佳实践,经过多年的发展,已经成功应用于运维管理的各个领域。随着数字化改革的不断创新与发展,传统的运维管理模式已经无法满足日益增多的运维服务需求,ITIL 4时代的到来,发展为提供端到端的IT/数字运营模式,涵盖技术支持的产品和服务的全面交付,指导IT与更广泛的业务战略接口衔接,引领业务发展。
在数字化改革中,运维管理服务还将面对更多的挑战,需要通过不断的技术和理论发展创新,运维管理服务体系不断的打磨,提高运维管理服务的质量和水平,为数字化改革贡献力量。