APP下载

从运维到运营的转型

2018-03-04北京夏刚

网络安全和信息化 2018年11期
关键词:运维信息系统工具

■ 北京 夏刚

编者按:如何在不降低运维水平的同时,降低企业TCO成本,把运维工作从压力转化为价值?本文从运维工作转型到运营的方法和路径开展研究,提出运维到运营转型的可行思路和方法推荐。

从业务连续性到IT系统连续性的基础支撑,是生产运维主要职责。

运维工作的目标是保障IT信息系统平稳运行,降低信息系统运行风险,减少系统的宕机时间。

运维发展阶段从工作方式特征上,可简要分为人工操作、自动化操作、智能化操作三个阶段。

运维面临的挑战

IT运维业界发展阶段正处在人工操作阶段转向自动化操作阶段过程中,这个过程中各类企业均在大力发展自身的自动化运维体系,将监控、变更、应急等管理流程、技术操作全部纳入,主要措施是开发IT运维自动化工具替代人工运维操作。典型的企业代表是以BAT为代表的互联网公司。

而银行等金融机构也对此提出了自己的自动化运维体系建设需求;技术方面以DevOps为代表提出开发+运维的自动化体系规范与标准,指导企业向自动化运维转型和发展。

人工操作阶段对业务连续性要求的支持能力已到达瓶颈上限,单纯依靠增加人力,已经不能再进一步提升企业的信息系统连续性运维能力,数据中心迫切需要更好的手段和方法来解决这一问题。

此阶段的提升瓶颈体现在三个方面:

1.运维人员压力

运维工作是信息系统运行的一线环节,直接面对业务可用性的压力。而信息系统规模不断增长给运维人员带来越来越多的工作量。

2.信息技术挑战

随着计算能力成本的不断下降,PC服务器的X86架构已经能够成千上万的进行大规模部署,而互联网+云计算的技术成熟,为单体计算资源的大规模整合应用提供有力支撑,数据中心的计算能力出现爆发式增长。支撑计算资源增长的服务器数量也在爆发式增长,信息系统规模指数级上升,技术发展对运维效率提出挑战。

3.业务需求挑战

随着业务量增长,数据中心的IT信息系统在设备数量、网络规模、系统复杂度等方面持续快速扩张。人工操作运维不能满足业务发展和产品创新的技术支持需求,体现为计算资源部署的效率、周期过长,运维服务供给效率低下等。单纯的依靠增加维护人员、购买服务支持等人海战术的方式,效率增长空间有限,极端情况还带来效率的下降,已不能满足业务发展和创新带来的效率增长要求。

运维到运营转型研究

运维到运营的核心是从被动支撑到主动服务的变化,这一转变的核心推动力是自动化和产品化,自动化--解放人力,产品化--提供服务。运维的工作目标不再局限于保障信息系统平稳运行,还要开展主动的管理和创新工作,通过运维提供优质服务并产生新的价值,支持业务发展。

向运营转型的核心措施包括技术改造和组织优化两个核心点:

1.运维技术改造

在标准化基础上,推动运维工作的全面自动化。应用DevOps技术和思路,建设打造符合企业需求的自动化运维体系,通过部署Jenkins、Kubernets、GitHub等 自 动化框架工具,或基于Java、python等语言自研开发类似的自动化运维框架工具,形成覆盖技术操作、运维管理的自动化体系。

通过把成就感不高的例行工作由工具自动化、AI机器人等进行替代,实现日常运维的例行工作纳入自动化工具覆盖,降低维护人员工作压力,提高工作效率等目标。将专业人员的时间节省出来,把工作重点转向工具开发、产品创新等研究内容,面向业务、应用提供增值服务,体现运维价值和成就感。

2.组织架构优化

组织结构方面,需要建设一支开发团队来支撑自动化工具和技术平台开发,将工具研发和运行维护团队融合,两者之间的紧密合作,建立工具研发支持生产运维,生产运维回馈工具研发的良性循环,开发+运维两个团队融合协作,这是转向运营提升自动化水平的核心要素之一。

生产运维管理流程也要进行相应的配套改造,对于生产运行的ITIL流程进行调整,针对监控、事件、应急、变更等核心流程进行梳理和优化,基于自动化流程进行改造,从操作权限、审批环节、风险控制等各个角度基于自动化工具进行配套调整。对应建设自动化流程工具,减少在管理环节的人员投入,取消不必要的审批环节,减少管理资源投入。

下面以变更自动化实施工作开发为例,简要介绍DevOps团队的一个自动化工具开发过程。

首先,运维团队分析评估,从高频工作中选择网络变更实施场景制定出工具开发需求。需求分析确定,网络变更实施方式和工作流程都是标准化模式,包括登录变更系统,下载变更附件,打开变更方案,获取用户口令,登录变更设备,贴入变更命令,共计6个操作环节。每个操作环节的执行都是手工标准操作。运维和开发人员通过面对面的需求沟通,每个环节的实现方式、用户界面等全部转换为开发的逻辑流程,作为开发的工作目标。

其次,变更自动化实施工具开发过程中,运维人员加入开发团队进行定时沟通,此外,还作为开发团队的一员协同进行工具开发。通过将工具开发切分为不同的工作阶段,开发过程划分为不同的工作流,部分开发由运维团队承接,过程中由一致的语言进行高效沟通,工作中不断磨合完成工具的快速开发、快速验证、快速修复,最终完成变更实施自动化工具开发目标,通过团队的共同验收确认满足最初的业务需求。

猜你喜欢

运维信息系统工具
企业信息系统安全防护
波比的工具
波比的工具
运维技术研发决策中ITSS运维成熟度模型应用初探
准备工具:步骤:
风电运维困局
基于区块链的通航维护信息系统研究
信息系统审计中计算机审计的应用
杂乱无章的光伏运维 百亿市场如何成长
“巧用”工具