国网陕西电力SG-ITOM 3.0运维体系研究与实践
2018-08-07陈思羽宋潇杨贾伟昭张银锋
孙 蒙,吴 庆,陈思羽,宋潇杨,贾伟昭,张银锋
( 1. 国网陕西省电力公司 信息通信公司,西安 710000;2. 北京国网 信通埃森哲信息技术有限公司, 北京 100032 )
按照国网“十三五”信息化和通信发展规划,信息化建设持续推进,公司智能电网边界持续延伸,通信网络边界加速扩展,信息采集终端不断扩充,信息通信运维对象的规模、集中度和复杂度越来越高;同时云计算、大数据、物联网、移动互联网等新技术的大规模应用对公司信息通信的敏捷服务、快速部署和安全稳定运行提出更高要求。
为确保“十三五”期间信息系统运行“可视、可信、可管、可控”,在总部信通部统一组织下,国网陕西电力开展了SG-ITOM 3.0一体化运维体系的试点建设工作,并取得初步成效。为进一步优化一体化运维体系,创新运维模式,提升信息通信运维工作成效,确保信息系统安全可靠运行,2017年以来,国网陕西电力全面开展了SG-ITOM 3.0运维体系建设的深化研究及围绕加强管理集约化、运行精益化、作业智能化和服务敏捷化方面具体实践工作。
1 研究目的
依据SG-ITOM 3.0一体化运维体系顶层设计,开展运维体系研究与实践,调整运维组织,完善人员角色,优化运维流程,开展技术支撑平台建设;推动信息通信运维从面向设备向面向业务与数据、从支撑业务向推动业务的转变;实现管理集约、运行精益、作业智能、服务敏捷,确保信息系统运行“可视、可信、可管、可控”。
2 运维体系架构
运维体系架构如图1所示。
图1 国网陕西电力运维体系架构
结合信息通信运维现状,从运维组织、人员角色、业务流程、技术平台4个方面开展对运维体系的深化研究。通过对上述4个方面的优化设计,支撑专项工作开展,最终实现管理集约、运行精益、作业智能、服务敏捷的目的。
2.1 运维组织
依据“十三五”公司信息通信运维对象分布特点,在国网公司“两级调控、三层检修、一体化运行、全业务支撑”的运维模式指导下,完善现有调运检客体系,优化职能。如图2所示,客服作为业务类问题的前端统一窗口,承担更多的运维服务职能;调控和运行、检修、三线支持在后端共同完成运维的技术支撑;质量管理为运维提供质量保障。
图2 信息通信运维模式
国网陕西电力在信息通信原有的调运检客的组织架构基础上新增了方式计划组,并对各小组的职能进行优化与完善。信息通信调运检客组织设计如图3所示。
图3 国网陕西电力信息通信调运检客组织设计图
信息通信各运维团队协作如图4所示。
图4 国网陕西电力信息通信运维团队协作框架图
2.2 人员角色
根据运维体系建设目标,完善现有体系,加强人才队伍自主化建设,优化岗位职能并增加角色。
(1)在管理集约方面:优化调控职能,将在线处置职责转入调控,提高远程控制和实时处理能力;
(2)在作业智能方面:增设自动化管理角色,开展自动化运维工具、运维大数据分析建设;
(3)在服务敏捷方面:增设业务运维经理角色,作为业务部门统一接口,受理业务需求;增加质量管理职能,建立服务质量管理机制,对运维服务的各环节进行质量评估。
2.3 业务流程
本着简化现有流程、以用户为中心、面向业务与数据的要求,设计了18个运维流程及关系,如图5所示。
图5 运维流程图
18项流程以服务战略(客户关系管理、需求管理、成本管理)为核心,围绕服务战略开展服务设计(服务目录管理、服务级别管理、连续性管理、容量管理、可用性管理、厂商管理),通过服务转换(检修管理、两票管理、方式与配置管理、知识管理)将服务设计转化为服务产品,通过服务运行(缺陷管理、问题管理、服务请求管理)来确保服务战略的实现,通过服务提升(服务报告和质量提升)对运维工作开展持续优化。
2.4 技术平台
为确保运维体系落地实施,运维支撑平台以SG-I6000为核心,统一现有的信息通信调度管理系统(IDS,Information Telecommunication Dispatcher System)、信息通信客服管理系统(ICS,Information Telecommunication Customer System)等平台;建立完善的配置管理数据库(CMDB,Configuration Management Database),为监控和流程运作提供数据支持,具备自动发现信息通信设备的能力;实现信息系统运维的全业务监视和全流程控制;加强运维工具建设,实现自动化巡检、部署、配置、资源调度及自动化处理。
运维支撑系统整体功能规划包括6个应用层,整合设计10大类业务应用模块,构建统一运维门户,将运维功能延伸到移动终端,为上层业务提供公共平台服务和自主高效的基础数据采集。按照一次规划、逐步完善、分步实现的原则,满足基层人员实际工作需要。
2.5 专项能力提升
(1)在管理集约方面,开展增强调度控制能力、强化运行方式管理、推进终端运维融合专项工作;
(2)在运行精益方面,推进运行支撑平台建设,开展统一日志管理专项工作;
(3)在作业智能方面,开展实现资源自动分配、系统自动部署专项工作;
(4)在服务敏捷方面,开展建立运维经理制、客服多渠道建设和服务目录应用专项工作。
3 关键技术
3.1 信息技术服务标准运维能力模型
信息技术服务标准是一整套体系和综合配套的信息技术服务标准库,全面规范了IT服务产品及其组成要素,用于指导实施标准化和可信赖的IT服务。信息技术服务标准运维能力模型如图6所示,模型给出运行维护服务能力的4个关键要素:人员、资源、技术和过程,反映运维服务具备的条件和能力,人员利用资源、运用技术,通过规定的过程为需方提供运行维护服务。
图6 信息技术服务标准运维能力模型
3.2 数据中心服务能力成熟度模型
数据中心服务能力成熟度是指数据中心对其提供服务的能力实施管理的成熟度,即从数据中心相关方实现收益、控制风险和优化资源的基本诉求出发,确立数据中心的目标以及实现这些目标所应具备的服务能力,每个能力项基于证据进行评价得出其成熟度,单个能力项成熟度经加权计算后得到数据中心服务能力成熟度。
数据中心服务能力成熟度模型由能力域、能力子域和能力项构成。通过人员、过程、技术、资源、政策、领导和文化7个评价要素进行,如图7所示。
图7 数据中心服务能力成熟度模型
3.3 运维关系模型
信息通信运维体系中服务、流程、运维工作和运维对象之间的关系如图8所示。
图8 运维关系模型图
通过运维工作来管理运维对象,通过运维流程来规范、提升运维工作,通过运维流程来实现服务。其中,信息通信部门以服务产品的形式向客户提供价值。运维对象的位置属性决定运维职责由谁承担,资产属性决定运维费用由谁支付,调控属性决定运维对象由谁调度管辖。运维工作是管理运维对象的活动,客服管理面向客户的服务,检修管理运维对象本体,调控管理运维对象的状态,运维工作的单位属性决定了运维工作的执行主体。
4 体系实践
根据运维体系架构,调整运维组织,完善人员角色、优化运维流程、支撑平台建设,开展增强调度控制能力、强化运行方式管理等专项工作,国网陕西电力成立了SG-ITOM 3.0运维体系建设领导小组和工作小组,明确职责分工、细化工作安排,建立组织内部集中讨论及汇报机制,全面推进运维体系实践工作。
(1)在运维组织调整方面,新增方式计划组,负责信息通信运行方式管理;调整网络组职能,改为安全组,负责信息通信安全管理。强化客户服务组、调度控制组职能,分别负责信息通信客服、调控工作。进一步明确信息通信运检职责分工,系统组、平台组、终端组负责信息运检工作;传输运维组、业务保障组负责通信运检工作。
(2)在人员职责完善方面,重点明确方式组职责,优化其他各组运维职责。调控组增加在线处置职责,系统组强化业务运维经理职责,运检中心各班组增加自动化工具建设职责。
(3)在运维流程优化方面,按照评估优化→流程调整→流程宣贯→试运行的思路,分类开展优化工作,逐步实现流程线上运行。
(4)在支撑平台改造方面,运维骨干全程积极参与,集中宣贯,集中测试运行,确保体系落地效果。开展CMDB配置管理数据库设计及建设,进行自动化运维工具建设,提高自动化运维能力,逐步实现自动化、智能化运维。
5 建设成效
国网陕西电力通过SG-ITOM3.0运维体系深化研究和实践,优化运维模式,完善运维业务,开展专项能力提升,在管理集约、运行精益、作业智能、服务敏捷4个方面取得了一定成果。
5.1 管理集约化
(1)增强调度控制能力。国网陕西电力将调控作为缺陷管理的核心,发挥了调控组7×24 h值班的条件,快速处置缺陷,持续保障业务;完成近800个节点接入应用服务一键启停平台,显著提升了调控快速处置能力。
(2)强化运行方式管理。持续提升信息运行方式的实用化水平,完善了运行方式线上管理模块功能,扩大了在线处置范围与深度。
(3)推进终端运维融合。开展了信息、通信终端的运维融合工作,将行政电话报修业务纳入186信通客服体系,并由终端组统一运维,提升了客户服务满意度。
5.2 运行精益化
(1)深化运维流程落地。完成51项职能性流程简化与优化,形成18项运维流程,实现信息通信运维纵向贯通、横向协同,优化职能间工作方式,提高了工作效率。
(2)推进运行支撑平台建设。推进运维支撑平台适应性改造,完善配置管理数据库(CMDB),为监控和流程运作提供数据支持;推进业务应用模块设计和改造,满足信息通信运维业务需求。
(3)开展统一日志管理。深入推进统一日志收集和分析,完成了系统日志和硬件日志接入端配置规范制定,明确了接入端的接入方式及自定义属性,提升对系统运行的支撑,提升运行精益化管理水平。
5.3 作业智能化
(1)实现资源自动分配。推进自动化运维建设,具备了资源的在线申请和自动完成资源分配的能力,实现了资源管理的规范化、标准化和自动化。
(2)实现系统自动部署。研制了应用程序自动部署工具,实现应用系统版本的自动发布和快速部署,极大地提高了工作效率。
5.4 服务敏捷化
(1)建立业务运维经理制。将信息系统进行了全面的梳理,依照业务范围,分为10个业务域,每个业务域下设置1~2名业务运维经理,形成A/B岗互备。业务运维经理对外承担与业务部门及项目组的对接工作,对内作为总协调人,负责公司内部信息通信运维班组之间的衔接工作。业务运维经理制建立后,变被动运维为主动运维,简化了信息系统运维流程,显著提高了与业务部门的沟通效率,提高了客户满意度。
(2)客服多渠道建设。通过企信、邮件、电话、集中会议等方式建立了与业务部门的多渠道互动机制,提升了业务服务的响应能力。
(3)服务目录应用。梳理了19类面向业务的服务目录,明确服务时间、响应时间等服务要求,向业务部门提供端到端服务,体现运维价值。
6 结束语
国网陕西电力成立运维体系工作组,依据SGITOM 3.0运维体系顶层设计,结合信息通信运维现状,从运维组织、人员角色、业务流程、技术平台4个方面开展信息通信运维体系的深化研究与实践,完成运维体系设计,根据体系设计开展调整运维组织、完善人员角色、优化运维流程、支撑平台建设,开展增强调度控制能力、强化运行方式管理等专项工作,初步实现“管理集约、运行精益、作业智能、服务敏捷”的预期目标。