95598话务平台系统运维服务体系建立
2018-12-20徐立波张冶蔡颖凯王丹妮刘立洋国网辽宁省电力有限公司
徐立波 张冶 蔡颖凯 王丹妮 刘立洋 国网辽宁省电力有限公司
1.概述
近年来国网辽宁公司积极推进信息化运维“主业化、集中化、专业化”进程,在运维工作机制、流程优化、组织构建、制度建设、人力资源保障等方面深化落实,遵循“两级三线”体系框架和“调运检”体系,构建省公司“客户服务、二线运维、三线技术支持”的运维架构。二线运维是保障95598话务平台系统安全、持续、可靠、稳定运行的核心,负责解决客户反馈的问题,分析系统结构,提供系统功能问题分析报告、需求方案编制,根据发现的问题不断对平台进行初步优化调整,对深度优化问题、Bug问题形成报告及时转给三线运维团队,并持续跟踪解决进度。
2.95598话务平台运维服务范围
■ 咨询受理
负责受理一线运维团队提交的运维问题,并予以分析解决。
■ 接口运维
保障与95598话务平台系统相关的营销接口、短信接口等功能稳定运行。
■ 应用问题处理及分析
采取不同的问题分析处理方式解决和回复一般性日常问题。定期对长期出现的业务复杂类问题需要与相关专责沟通确认,形成解决方案。对疑难问题进行深度分析和挖掘。解决配置变更类问题。
■ 业务数据维护
日常数据维护申请及审批,根据数据修改要求,制定数据修改方案,由业务部门提出数据修改申请,并由省公司营销部相关专责确认后进行修改。
■ 需求管理
受理业务单位新增需求或需求变更,以会议或电话沟通的形式,对需求讨论和确认,提请业务主管部门分析审核,跟踪开发厂商进行问题修改完善,并形成需求变更确认单。
3.运维主要工作
1系统巡检
制定巡检工作制度,每天至少完成1次系统巡检工作,检查系统运行状况以及相关接口运行情况,确认日常备份数据的有效性,清理维护过程中及系统自身产生的垃圾数据,巡检过程中填写巡检记录、及时了解系统及设备运行状态,确保系统安全稳定运行。
2故障处理
制定故障处理制度,系统发生故障后,组织故障调查,分析故障影响范围和程度,及时启动应急响应,开展系统恢复再造工作;一般性故障协调检修部门确认问题产生的根本原因,制定检修方案实施工作;对于二线运维无法解决的问题,及时联系三线或原厂商解决。故障处置按照“先抢通,后抢修”的原则开展,在恢复系统运行后,执行后期整改方案。
3技术支持
制定技术支持管理制度,对客服不能解答的有关系统的事件进行专制运维,一线顾问受理事件后须完整、准确记录问题,分类事件,结合业务实际情况安排事件处理优先级,完成事件处理后应及时归档,更新运维知识库,将工单转回客服团队,由客服统一安排用户回访。
4现场支持
制定现场支持管理制度,对于远程方式无法解决的问题,业务部门上报主管领导审批同意后,由运维团队安排运维顾问提供现场支持服务,现场支持人员原则上不允许修改程序,仅解决应用、操作类问题,并记录新需求或Bug,现场支持工作完成后,业务部门须确认现场支持工作单。
5数据检查
制定数据检查管理制度,每月检查系统垃圾数据以及系统文件并进行处理,防止系统运行期间由于客户机系统出现问题导致文件内容被破坏。数据检查工作须包括但不限于数据一致性检查、完整性检查,数据检查工作完成后,出具数据检查报告。
6运维分析
制定运行分析管理制度,建立运行分析常态化机制,分析系统运行、检修和团队管理等内容,定期组织运行情况分析会,分析系统运行状况及系统环境情况,总结运行工作情况、典型经验和教训,分析运维工作存在的问题,制订解决方案,安排后续整改工作;定期分析运维团队工作绩效水平,分析存在的问题,制订、实施改进方案。
7运维记录
强化运维工作文档化、量化管理水平,在日常运维工作中,须准确记录用户提出的服务请求、系统巡检过程中识别的问题、运维人员在日常维护过程中发现的隐患,促进定期开展的系统升级和改进工作的有效实施,提高运行、检修工作效率。
8现场监护
制定检修监护制度,建立检修监护机制。检修人员须在办理两票许可后方可实施检修工作,在检修工作过程中,须安排一名运行人员开展检修监护工作,确保检修人员在控制区内活动,同时运行人员与检修人员共同确认检修目的、目标、操作步骤和预期结果。
9经验总结
运维团队须遵循省公司相关管理办法,在运维过程中及时、积极总结用户提出的典型问题和解决方案,每年度至少完成1份典型经验与运维技术论文并及时完成相关申报工作。
10组织协调
建立及时、透明、协作的沟通协调机制,对系统使用、账号管理和调优升级等运维工作予以充分沟通和统一协调,每周开展运维工作分析工作,建立风险、问题和变更的实时上报和分析机制;遵循省公司运维管理要求,适时优化运维工作界面和人员职责,确保运维工作有效展开。
11运维报告
制定运维报告管理制度,运维团队遵循运维报告模版和上报周期要求,按时提交系统运行分析报告、运维服务情况统计分析周报,每月提交信息系统的运行及维护情况等分析报告,确保运维绩效的及时总结分析和上报,促进运维管理水平的持续提升。
4.运维服务成效
1、2 017年9 5598话务平台系统运行良好,系统运行中无重大事故和重大隐患,无厂商考核事件。
2、顺利完成营销交接数据库各项隐患整改。完成营销交接-数据库隐患整改3次月检修,整改内容共35项。
3、保障了十九大期间95598话务平台系统运行平稳。
4、及时完成各项系统优化及消缺。及时排查整改主机、数据库、网络设备等设备弱口令账号200余个,完成各项系统漏洞排查和相关整改工作28项。
5、及时排查测试国网北中心反馈辽宁部分手机号拨打95598落地码错误原因,并及时反馈等。
6、保障联通侧专线切换成功配合联通及营销部对95598话务平台短信业务-联通线路进行割接测试。