集中运维知识管理与运营分析IT解决方案研究
2018-02-27费春勇韩啸虎周洁杨红叶
费春勇 韩啸虎 周洁 杨红叶
摘要
随着企业信息化的不断发展,信息管理系统的维护工作已成为了企业管理的重要组成部分。为了提升IT系统运维管理水平和效率,不断有新的运维管理平台涌现和需求迭代,以支撑不断升级的运维管理需求。但传统的运维平台在知识管理、运营分析方面往往独立于实际应用层面,即知行不一,无法通过知识数据积累对实际应用进行指导,且无法进行有效的统计分析从而提升运维效率。本文基于江苏电信集中MSS一线运维管理平台针对知识管理与运营分析业务提出一种IT解决方案。
【关键词】集中运维 知识管理 运营分析
1 背景及面临的问题
1.1 集中运维知识管理和运营分析的行业背景
随着企业信息化程度越来越高,在IT运维管理过程中,经常会遇到运维问题重复、IT人员流动性高、知识传递出现断层等问题,给企业带来损失。基于以上问题,企业也逐渐关注IT知识管理体系的构建,但大部分企业的知识管理体系仅仅是对日常运维知识和经验的积累,并没有应用到实际运维过程中,从而无法保证知识的应用质量。随着新的运维管理平台不断涌现和需求迭代,传统的IT运维不能满足企业发展需要,很多企业开始追求实现从被动到主动的转变,通过运营分析,发现运维工作中出现的痛点,研究解决措施,从而减少运维成本,提升运营效率,为公司创造价值与效益。
1.2 面临的问题
目前的运维平台在知识管理和运营分析存在一些问题:
(1)知识管理内容单一,不能形成知识链。目前企业知识管理库里的问题大部分是只涉及单个系统菜单模块,很少记录跨系统的问题,造成知识体系无法还原跨系统业务问题,无法形成更完善的系统运维知识链。
(2)知识管理无法直接指导实际应用,无法保证知识库质量。运维人员一般凭借自身经验或者求助同事的方法解决实际运维问题,很少会直接利用系统知识管理模块来查询解决运维问题的方法。系统中的知识与实际脱钩,因此无法通过应用来判断知识库质量。
(3)运营分析维度单一,不能与实际应用相结合进行分析。不能全面精确反映运维过程中的实际情况,无法精准地定位问题。
2 平台解决方案
2.1 方案描述
2.1.1 打造贯穿运维全过程的信息化知识链,构建知行合一的完整知识体系
为解决传统运维系统知识管理的相关问题,需要建设一个可将理论知识与实践相结合的管理平台。将知识管理相关的运维工单、常见问题、知识库管理模块业务与流程贯穿,常见问题是知识库的数据来源,同时常见问题与运维人员工作记录进行关联,运维人员在处理运维工单时,可直接查询并关联常见问题模块的已有记录,减少记录运维作业时间,有效指导实际运维,提升运维效率。运维工单、常见问题、知识库管理三者之间的关联,构建了全过程的运维知识链,实现了知行合一的完整知识体系。
2.1.2 实现企业信息化运维管理由被动运维向主动运营分析的转变
为了解决大多数企业信息化运维管理处在被动运维,尚未达到主动分析或者分析维度单一的问题。建立平台通过对运维工单发生场景进行打标分类来记录运维场景,并通过统计呼叫中心接通率、用户服务满意度、标签使用频率等指标信息,筛选出运维过程中的热点及难点问题,及时分析并提供出优化方案,减少重复工作量,降低运维成本,提升用户感知。
2.2 系统实现
系统结构如图1所示。
2.2.1 知識管理主要功能
(1)常见问题管理:包括常见问题和常见问题统计分析。运维人员将日常工作积累的应用系统操作或故障解决方法,与问题发生的场景标签进行关联后记录到平台,同时可以利用统计分析功能对常见问题进行数据统计。
(2)知识管理:包括知识录入和搜索。运维人员除了可将常见问题相关知识记录外,还可以将业务资料与实践经验记录下来。并且可通过快速知识搜索通道,搜索关键字,来实现知识检索,减少传统查阅知识库时间,提升对客户服务响应效率。
2.2.2 运营分析主要功能
(1)标签管理:运维人员将运维过程遇到的问题进行场景分类,并定义成标签。方便后续对问题发生场景进行量化分析。
(2)日报表查询:从每日的维度,对系统和运维人员的接通情况和满意度进行统计。根据查询结果,发现运维管理过程中出现的异常现象并及时作出改进措施。
(3)月报表查询:从每月的维度,对各个系统接通情况、工单情况、工单对应客户单位和满意度等指标进行统计。根据查询结果,分析改进措施,为决策者提供决策依据。
3 平台功能建设成效
江苏电信集中MSS一线运维管理平台自2015年12月在江苏电信开始正式上线运行至今,平台功能稳定,对业务起到了有效支撑,其中:
(1)知识管理的推广,有效减轻了运维人员工单记录的工作量,同时提升了知识库的质量;
(2)运营分析的应用,为客户提出50多项优化建议,其中有30多项建议己被采纳并发布到生产系统,提前发现并规避了生产系统的潜在问题。