浅析中国大唐集团公司“数字燃料”管控平台运维方法
2019-02-13谌志东
谌志东
(湖南大唐先一科技有限公司,长沙 410004)
中国大唐集团公司(以下简称大唐集团)“数字燃料”管控平台(以下简称平台)的系统运维是指系统正式上线运行后的硬件设备以及软件平台的运行维护工作,随着基层火力发电企业(以下简称企业)燃料管理工作逐步从手工粗放式的管理方式转变成精细化的信息管理,当平台发生故障的时候如果不能及时有效予以解决,严重影响到企业燃煤有关联数据的实时生成和上传。非系统性的信息化运维管理方式已经不能满足平台的运维需求。如果缺乏有效的平台运维管理,就会造成应用效果出现“短板效应”。为了保证平台安全平稳运行,思考并且构建一套运维监测体系,如何去维护好、控制好、管理好日趋复杂的平台,创造并发挥好平台的使用效益,就变成企业十分想解决的一道难题。
1 当前平台运维情况简述
1.1 开展“数字燃料”管控平台运维工作要求
企业对燃料管理工作信息化深度应用以及燃料管理流程再造,通过平台对包括燃煤采购、过衡、采样、制样、化验、存储和掺烧等各类流程进行业务数据横向共享,纵向贯通,很多重要敏感的如采制化数据都存储在数据库中,确保平台能够稳定可靠的一天24小时不间断运行对于企业而言显得异常重要。不论从运维管理制度还是从运维技术支持力量而言,都有相当高的要求。开展“数字燃料”管控平台运维工作主要包括以下几个方面的服务要求。
1.1.1 解决问题的专业化
无论是燃煤采制化设备和网络设备等硬件功能,还是对如业务流程设置、系统功能操作、业务报表与告警参数值调整设定等平台软件功能,都是平台运维的工作范围。当出现问题的时候运维人员不仅要有计算机网络专业方面的知识,还要求对燃料采制化管理方面有比较深刻的理解,并且能够结合企业特点,有针对性的提出行之有效的专业建议。
1.1.2 解决问题的及时率
当平台出现问题时,用户会第一时间通过电话、即时通讯或者客户服务运维平台等多种方式进行反馈,从接到运维服务工单到解决的工时长短决定了问题解决的及时率。用户提交的运维服务工单可以通过运维小组负责人进行派发给运维技术人员或者转发给研发人员进行处理。当运维服务工单处理完成后,技术人员反馈处理结果,用户同时会收到处理结果的反馈并确认,从而形成运维服务工单的闭环管理,确保问题解决的及时有效。运维服务工单处理过程能够在客户服务平台中以图行表单的形式进行可视化管理,不断提高运维问题处理的及时率,并简化运维问题处理的流程。
1.1.3 定期开展运维巡检
平台在日常使用操作的过程中,除了日常需要解决的问题之外,还需要对各企业每月进行定期巡检。大唐先一公司承担着“数字燃料”管控平台日常运维工作,分区域分企业进行定期巡检,包括对平台软硬件设备、操作系统、应用软件和数据库软件等巡检,巡检工作完成后出具工作评估报告,对出现的问题进行认真分析总结,并给出问题解决方案,助力企业燃煤量质价管理取得更好的成绩。
2 基于ITIL框架的客户服务平台运维服务体系
2.1 客户服务平台运维体系建设思路
英国国家计算机和电信局在20世纪80年代末制订ITIL(Information Technology Infrastructure Library),即信息技术基础架构库。英国国家计算机和电信局为了提高IT服务管理效率和质量,通过归纳英国各行业在IT管理方面最好的方法,并形成规范。ITIL为企业的IT服务管理实践提供了一个可度量的、实际的、可靠的规范和标准,同时,ITIL提供的最佳实践方法论可以帮助客户享有更高质量的IT服务。
大唐先一客户服务平台运维体系建设思路是:基于ITIL V3框架最佳实践模型,结合平台功能模块和实际业务需求,创建一套对运维管理制度、运维组织、运维技术人员、运维管理流程和运维技术进行统一管理的运维管理指标体系;定组织机构、定运维管理制度、定运维流程、定岗位、定职责,保证“数字燃料”管控平台在运行过程中出现的各类问题都能得到及时的响应,并且有效的解决和反馈。
2.2 客户服务平台的建设方法及运维服务体系构建
通过对大唐先一公司信息系统运维现状的深入调研,借鉴国内外各行业应用系统运维体系的建设运维经验,在客户服务平台建设过程中遵循PDCA思想,定期检查运维作业流程的合规性,并且对运维结果开展差距分析和评估,完成自查报告并纠偏。结合对信息系统运维管理方法论和最佳实践,持续提升运维管理技术服务水平。
2.2.1 安全加密理念
“数字燃料”管控平台属于燃料管理业务平台,系统在运维的同时还具有关键敏感数据的传递存储,也就是说,“数字燃料”管控平台运维工作中处理的数据要进行安全加密传输。运维服务的时候要特别注重系统数据的安全可靠性,在运维服务的工作中,采用大唐先一运维审计平台,运维操作通过加密VPN专线传输,运维过程进行录像,运维数据进行加密存储。
2.2.2 业务型主导
大唐集团公司燃料管理部门每年都会下达与运维相关的重点工作任务,确定“数字燃料”管控平台运维负责单位,运维单位也同时把工作任务分解到各区域运维小组和指定运维专责。
在“数字燃料”管控平台运维过程中,用户要对提出的业务功能新增需求方案、新增业务功能设计开发原型、新增业务功能测试案例进行审批,对用户的实际业务需求与系统功能进行相互验证,并且要求对此过程管控的环节进行确认,签字认可后才能生效,统一开展系统版本升级。
2.2.3 定质定量运维理念
定质定量的运维理念是为了更加科学有效、系统完整地体现“数字燃料”管控平台运维工作的价值。将运维工作分解后的目标与运维工作质量评价建立可视化的量化关系,并明确运维岗位职责,在此基础上,量化和细化运维服务清单以及技术运维人员绩效考核指标,打造精益化的管理方式。
3 集团化“数字燃料”管控平台运维
“数字燃料”管控平台的运行效果取决于运维工作的质量好坏,建立和完善科学合理的运维管理体系,是平台应用的重要保障。大唐集团基层火力发电企业较多,地理位置分布比较分散,平台上线后,有大量的运维工作要处理,问题搜集及反馈存在难度。大唐先一公司根据实际情况,创建了三级运维层级模式。一级运维由行业资深燃料咨询专家组成,用来解决系统重大业务问题,并提供咨询意见;二级运维由技术支持团队组成,集中对包括业务系统平台权限设置、参数配置、OS操作系统、数据库软件等进行管控;三级运维则由各企业信息主管或者燃料主管组成,用来对各企业的平台运维工作提供指导意见和行之有效的解决方案。三级运维体系的建立,使得运维工作响应处理及时、运维效果有很高的质量保证。
大唐先一公司建立了一套集中统一的运维客户服务系统,能够对运维工作进行审计监控,并且具有缺陷申报、缺陷审批、缺陷处理进度跟踪、缺陷处理评价、缺陷统计分析查询、定期巡检登记及管理、系统升级、软件安装登记及管理(包括第三方软件)、新业务需求开发申请、审核、批复及研发过程管理、燃料异常数据情况修正申请及管理等业务功能。
4 结束语
“数字燃料”管控平台运维方法是基于ITIL V3框架,通过组织模式、制度规范体系、技术支撑体系3个层面的内容,并结合平台的业务特点,构建出的一套行之有效的运维方法论。为了更好的发挥好客户服务平台的运维监测作用,我们不仅需要从评价体系、运维标准化流程、沟通机制等方面进行进一步完善,还要发挥好运维客户服务平台的安全性、及时性和知识库的作用,为打造精益高效的运维体系发挥突出的作用。