基于ITSS的政府云计算中心运维服务
2020-05-15祝越郭婵娟
祝越 郭婵娟
摘要:政府云计算中心在发展到一定阶段后,运维管理工作将面临巨大挑战,主要来自于技术和管理2个层面。为了处理好这类问题,将信息技术服务标准(ITSS)的规范与政府云计算中心的日常运维进行了深度的结合和探索,将日常抽象化的运维工作具体化,并结合ITSS中的人员、过程、技术和资源四要素,持续改进运维服务工作。既转变了传统的运维工作方式,又实现了对运维工作的可量化、可监控、可评价、可改进,从而达到对问题提前预警、避免重大事故发生,以及提升用户服务的满意度等效果。
关键词:信息技术服务标准;运维服务;政府;云计算中心
中图分类号:TP393文献标志码:A文章编号:1008-1739(2020)08-65-3
0引言
信息化作为如今社会发展的主流,俨然成为了各行业向前发展的核心动力。为此,各IT机构大力投入对新产品、新技术的研发,推动IT服务飞速发展。IT运维服务作为IT服务的关键组成部分,是IT产品投入使用后稳定运行的基础保障,并且随着产品技术和管理难度的不断加深,优质规范的运维服务才是信息化的根本。ITSS是我國工信部自主制定,用于指导IT企业提供优质规范的运维服务,ITSS体系对于提高IT行业整体服务质量有很大帮助[1]。因此,本文将结合ITSS的理念和要求,分析对比 ITSS指导工作后的成果,探索并优化设计政府云计算中心的运维服务工作。
1云计算中心的现状及存在的问题
目前,扬州市政府云计算中心机房已承载了近500个数据机柜,支撑运行了上千台虚拟机和PB级的数据存储。但依然存在以下3类问题:①运维职责不清晰、边界模糊,引发人手不足、服务效率不高及对接不畅等问题。②运维团队不稳定、运维事项繁多和运维人员身兼数职,以及自身经验和技术不足以应对运维工作,往往造成人员的高流动性。③运维工具不足、功能同质化严重,日常运维工作中使用的工具类型匮乏,功能趋于同质化,缺少定制化开发,没有体现出实际需求,使得工具在实际工作中并不好用,监控工作需要投入大量的人力资源。
2基于ITSS模型改进运维服务工作
通过整理和分析,目前扬州市政府云计算中心运维工作的痛点主要集中在服务范围、组织架构和运维工具3个方面,涵盖ITSS的人员、过程、技术和资源4个要素。将以ITSS模型作为指导,以运维服务作为核心的标准化对象,重点优化改进运维服务所采用的方法和流程,从而实现对服务全生命周期的规划设计、部署实施、服务支持、持续改进和监督管理各个阶段[2],如图1所示。
2.1梳理服务目录、界定服务边界
按照《信息技术服务·分类与代码》的标准要求[3],从以下3个方面着手,明确服务范围和内容。①重新梳理市政府云计算中心职责范围内的运维服务条目,从基础环境运维服务、硬件运维服务等方面,细化了19类服务内容[4],从根本上界定了市政府云计算中心的运维服务范围,不仅可以帮助运维人员专注于该目录范围的服务事项,也为明确运维岗位的职责内容提供了依据。②依据梳理完成的服务目录,进一步制定了《云上扬州信息系统运维保障指南》,指导和帮助各云上扬州信息化项目责任单位梳理清楚所要承担的运维工作内容,界定与市政府云计算中心的运维边界,从而保障信息化项目的各方都能够各司其职、协同合作。③依据该指南,市政府云计算中心和各业务单位分别签署信息系统服务协议,进一步明确双方的运维工作职责,界定工作范围和边界,承诺各自履行的安全保密职责等,如图2所示。
2.2优化组织架构、细化岗位职责
依据ITSS四要素之一对于人员的要求[2],从以下2个方面来进行优化和调整,如图3所示。①制度和管理层面:重新梳理并优化市政府云计算中心的运维服务组织架构,形成了由主任室领导,办公室、网络部和安全部3个职能部室具体负责的运维管理组织架构,其中办公室下设质量组,主要负责人事及运维服务质量监管工作;网络部下设基础设施组、网络组、主机组和灾备组,主要负责日常各类运维服务工作;安全部下设安全服务总包(应急组),主要负责信息安全和应急保障相关工作。②实际操作层面:通过信息化项目来进一步保障驻场运维团队稳定性,如设备维保项目,对运维驻场人员的数量、服务年限及专业技能等提出具体要求,不仅对运维团队提供了经费保障,也为团队扩充了具备相应技能要求的运维人员,既保障了运维团队的稳定,也提升了业务服务能力,从根本上保障了运维服务质量。
2.3完善运维工具、服务全程留痕
ITSS体系对资源有明确的要求,不断完善运维工具,既可以减少不必要的工作量,也可以提升运维工作质量和效率[2 ],所以重点从以下2个方面进行改进,如图4所示。①定制开发运维全过程管理工具[5]:搭建统一的运维管理入口来统管其他各类监控服务平台,并且要做到过程留痕,记录可查。为此,通过本地软件公司按照实际运维需求和ITSS体系要求,专门定制开发了一套市政府云计算中心运维管理系统,对机房内设施、设备和业务信息系统进行全生命周期的管控,替代之前纸质化工作流转,做到线上流转、工作留痕、责任到人。②完善现有运维监控工具[6]:对网络、主机、存储、备份及动态环境等监控平台进行功能性完善,特别在本地化需求方面进行二次开发,让工具更实用。
3基于ITSS设计的运维工作出成效
扬州市政府云计算中心从2019年初引入ITSS,同年7月初通过了现场ITSS符合性评估,获得了由中国电子工业标准化技术协会颁发的《信息技术服务运行维护标准符合性证书》,成为当时江苏省内唯一一家获此殊荣的地市级政府数据中心。
2019年以来,扬州市政府云计算中心通过探索结合ITSS体系指导日常运维工作,已经在IT运维服务质量、效率方面有了很大程度的提升,在防范故障风险、降低故障率方面得到了有效控制。此外,中心主动与各市直业务单位签署信息系统服务协议,覆盖率达到100%。2019年度报障数相较于2018年,整体下降了57.7%,故障处置时效性进一步提升。驻场运维团队更加壮大和稳定,团队从原有6人扩充至现有22人,细分5个运维保障组,其中基础设施运维组4人、主机存储运维组4人、网络安全运维组3人、灾备组3人和安服总包8人,确保机房全年7×24 h的运维服务不间断。新开发的运维管理系统全面指导市政府云计算中心日常运维工作,实现了对资源的申请、审核、上线、变更、回收等全生命周期的监管。全年实现对22个整合业务和6个托管业务的线上审批和部署。同时还加强了对运维人员日常工作的考核和管理,所有运维值班人员的考勤、日报、月报、当月工作完成情况和次月工作计划等都在运维管理系统里体现,实现了对日常运维工作的梳理和总结,全年形成1 800多份人员运维工作日报和48份运维组别月报和计划。
4结束语
2019年以来,扬州市政府云计算中心结合ITSS模型优化运维服务工作,初显成效。ITSS虽然不是一件新生事物,但这些年在企业中应用较多,政府层面少有涉及,雖不是第一个将ITSS引入工作中的政府数据中心,但希望借此探索,让更多的运维工作者认识ITSS,并有所启发,切实地解决自身IT运维服务所面临的问题。
展望未来,将继续严格按照ITSS的体系标准落实各项IT运维服务工作,继续从人员、过程、技术和资源这4个方面进行运维服务工作的整改和优化,确保中心的运维服务工作正常、有序、高效、协调地开展,努力助推“十四五”时期扬州政务信息化的全速发展。
参考文献
[1]张林.ITSS模型的云服务信息系统架构分析[J].福建电脑, 2019,35(6):61-62.
[2]国家信息技术服务标准工作组.ITSS系列培训IT服务项目经理[M].北京:电子工业出版社,2016.
[3]乔慧媛.关于ITSS信息技术服务标准探析[J].科技创新导报,2017,14(3):113,115.
[4]覃芳.基于ITSS的电子政务信息技术运维服务管理平台分析[J].电子世界,2019(17):98-99.
[5]吴建超.基于ITSS建设企业运维服务能力体系探究[J].通讯世界,2016(15):220.
[6]史立伟,马洪杰. IT服务组织实施ITSS过程要素的实践[J].信息技术与标准化,2017 (10):45-47.