APP下载

精益化IT运维关键技术研究

2016-01-05马斌周平钟方伟张超

电脑知识与技术 2015年29期
关键词:精益化

马斌++周平++钟方伟++张超

摘要:主要研究信息通信系统建设、建转运、运维全过程精益化管控的关键技术;首先阐述了电力行业精益化IT运维技术的研究现状和重要性,然后论述信息化项目建设中业务活动联动性管理技术,重点论证了运维过程中系统运行状态可靠性分析方法、多维告警相关性分析方法和检修预评估方法,最后总结了关键技术应用情况和未来技术展望。

关键词:精益化;IT运维;业务联动性;状态可靠性;告警相关性

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2015)29-0185-03

Research on Key Technologies of Lean IT Maintenance

MA Bin1, ZHOU Ping2, ZHONG Fang-wei2, ZHANG Chao2

(1. State Grid Xinjiang Electric Power Information TelecommunicationCompany, Urumqi 830068, China; 2. Xinjiang Information industry Co, LTD, Urumqi 830068, China)

Abstract:The key technologiesof whole process and lean control of construction, transfer and maintenance of the information and telecommunication systems are researched in the paper. At first theresearch status and importance of IT maintenanceis described, then discuss the technologies of business linkage in construction of information and telecommunication system.Focus on methods of system running state reliability, multidimensionalAlarm correlation and maintenance Pre assessment. At last, we summarize applicationof the key technologies and development in the future.

Key words: lean;IT maintenance; business linkage; statereliability; alarm correlation

随着坚强智能电网的全面建成和全球能源互联网概念的提出,信息通信技术已渗入电网各环节,成为电网的核心中枢神经网,电网的生产控制信号和业务信息全部通过信息通信平台实现传递。支撑电网运行管理的IT平台出现问题,将严重影响电网的“内供、外送和接纳新能源”三大任务。建设坚强、可靠、具有精益化管理特征的电力行业IT支撑平台对打造安全能源通道,实现大规模新能源接入战略具有重要作用。

目前,电力行业IT支撑平台还没有统一的技术体制,更没有适合国内复杂环境和投资高速增长特点的成熟案例。为解决大量IT建设运维任务与电力IT技术人员不足的矛盾,提高IT系统建设质量、运维水平,实现IT精益化管理要求,解决大规模IT投资项目全过程管控、精益化信息运维和精益化通信运维3大问题,需要开展如下关键技术的研究:

建立基于合同、项目之间多对多联动关系的业务模型,实现IT系统建设全过程精细化管控;构建共享数据平台,实现系统运行状态可靠性分析、多维告警信息相关性分析机制、系统检修影响范围预评估,完成运维检修闭环管理。

1 业务活动联动性管理方法

电力信息化项目建设需要严格遵循合同来计算资金收支、管控项目进度计划,因此,需要建立合同、项目之间的业务模型,管理合同之间、项目之间、合同与项目之间的联动关系。同时,在审核流程中,通过联动关系量化判断因素,为审核人员提供辅助判断结果。

1.1 业务联动数据模型

根据实际业务需求分析,合同分类形成一种网状结构,例如,按照合同的资金流向将合同分为收入类合同和成本类合同,成本类合同又分为自建项目合同、技改大修项目合同、分包项目合同,而分包合同要对应收入合同。一个合同可以分拆为多个子合同,一个项目又可以由多个子项目组成,一个合同可包含多个项目、一个项目可以对应多个收入和支出合同,每个项目下又可能对应多个成本项目。项目与合同,项目与项目之间都是多对对多的关系。在进行项目过程管控和合同管理的时候,这种复杂的关联关系将影响上层项目与合同的进度整体管控、合同资金支付审核。

为建立上述的业务关系模型,需要建立虚拟合同和虚拟项目,将网状结构拆分为树形结构,构建了虚拟合同与实际合同、虚拟项目与实际项目之间的虚拟关联关系,从而在虚拟关联关系的基础上将实际的多对多的联动关系转换为一对多的关联关系,建立了合同与合同、项目与项目、合同与项目之间一对多关系,简化项目过程管控和合同资金支付的实现难度。

1.2 基于加权法的联动性计算方法

在构建业务联动性模型后,在审核流程中引入加权项,通过加权项权重、权值设置,在审核节点自动触发加权计算方法,根据业务联动关系收集加权项设置的数据,按照线性加权法计算该节点项目进度、合同执行情况,以及资金支付比例,为审核人员给出科学的辅助审查的建议值。

加权项设置在联动关系或者项目属性上。在联动关系上设置加权项,例如:项目与子项目之间、合同与子合同之间设置加权项,并根据子项目工程量或者资金比例设置权重,则在计算项目进度、合同完成率和资金支付比例时,需要根据子项目权重联动计算子项目进度、完成质量等,汇总得出项目进度、合同完成率和资金支付比例。

在项目属性之间设置加权项,是指在具有联动关系的属性之间设置加权项,并根据属性特点设置权重,例如,计算某一个项目应支付资金比例,则需要在项目进度、里程碑交付物、工作质量评价、环境因素评价等关联属性设置加权项和权重,根据获得的加权项的值和权重计算资金支付比例。

2 基于状态可靠性的检修预评估方法

2.1 运行状态可靠性分析

采集系统建设费用、运维成本、运行时长、运行状态、故障次数、检修次数,计算可靠性指标(MTTF(平均失效时间),平均无故障工作时间(MTBF)、平均修复时间(MTTR),故障率),反映建设期的建设质量、建转运质量。

MTTF作为最为广泛的衡量系统可靠性的参数,指系统平均能够正常运行多长时间才发生一次故障,系统可靠性越高,平均失效时间越短。MTBF越长可靠性越高,正确工作能力越强。MTBF的目的是找出设计中的薄弱环节,用于判断可维护性和不可维护性的系统。MTTR包含维护所需时间,获得配件时间,维修团队响应时间,记录所有任务时间以及重新投入运行时间。MTTR越短表示恢复性越好。通过对系统运行状态分析的可靠性研究,在某一方面反映运维团队的执行效率与可靠程度,另一方面通过对运维阶段发现的问题,追溯到建设期项目与合同配置项等信息,检查是否是建设期出现的缺陷。

2.2 多维告警相关性研究

信息、通信系统在运行过程中,针对异常现象会抛出告警信息,但这些告警信息的内容在故障定位和排除的时候其可参考性不强,并且没有对告警资源类型进行分类、分层详细说明,因此需要对告警进行过滤、分类等预处理,对告警原因进行层次化分析,找出发生告警的最初资源项。告警相关性分析如下图所示:

图4 告警集中监视逻辑关系

告警集中监视应包括告警分类、告警过滤、告警显示、告警操作(确认、清除、封锁)、告警提示(短信、语音)、告警根原因分析、告警查询、告警状态计算等功能。

告警过滤主要通过制定合理的告警过滤规则,从大量告警中屏蔽用户不关心的告警,过滤出重要告警从而有效防止告警风暴。告警过滤包括告警过滤规则定制、告警过滤规则应用。告警过滤规则定制指对告警等级、告警原因、告警所属设备、告警关联业务等制定相应的过滤规则,并存储到过滤规则库

告警原因分析依据告警之间的相关性,通过对众多的告警信息进行处理,找出根告警,从而定位出故障产生的根本原因。告警根原因分析包括规则制定、规则应用。告警相关性规则制定是通过资源对象之间的关联性、告警之间的相关性以及告警与资源对象之间的所属关系,动态判断根源告警与衍生告警之间的推导关系。

告警状态计算根据对象的层次关系,分析对象及下属子对象的告警信息,提取告警的最高等级作为该对象的告警等级,并计算该对象内所有告警数目和已确认告警数。

2.3 检修预评估方法

由于信息通信系统间的耦合度和关联度越来越高,一个系统功能点可能会影响多个系统,要求检修人员在进行检修工作前必须做好检修影响范围的分析做好对应的防范措施。但面对支撑电网的几十套核心业务系统和数以万计的系统间接口关系、数据横向纵向集成关系、数千台硬件设备间的拓扑关联关系和电力内外网的拓扑关系,检修人员缺乏全面了解如此庞大的系统关联关系,存在检修风险点分析不到位而造成检修过程中其他关联系统中断。

因此,需要建立检修预评估影响范围模型,识别关键检修步骤,评估每一个步骤的检修影响范围、检修成本和检修时间,结合最短路径法,根据所有关键步骤的检修影响范围、检修成本、检修时间3个方面综合选择最优的检修方案,提高检修效率、降低检修风险与成本。

基于系统资源数据库,提供制定检修计划功能,通过对系统关联关系以及传输网络业务保护关系等计算,实现影响业务范围自动分析,完成检修计划的制定。针对检修的系统、设备和设施,利用通信网络、传输通道、通信业务、系统之间各种关系分析受到影响的通信业务。对于当前的检修单需要与正在执行的检修单进行相关性分析,避免多检修单执行时中断业务。

3 结束语

业务活动联动性管理方法、基于状态可靠性的检修预评估方法等关键技术,已经应用于电力行业精益化IT支撑平台,实现了信息通信系统建设、建转运、运维全过程管控,大幅提高运维效率和系统运行可靠性。

随着信息通信技术的发展、智能电网建设的深入,IT运维技术必然积极跟进才能,才能支撑电网的大发展,尤其是大数据分析、虚拟现实、基于RFID的物联网等新技术的发展和大规模应用,必将提升故障精确定位、系统运行风险预警、设备运行状态趋势预测、智能检修评估、日常自动巡检等方面性能,为精益化IT运维提供助力。

参考文献:

[1] 王晓磊, 余长江. 基于加权计算的自动审核算法[J]. 计算机与现代化, 2014(4).

[2] 李猷, 马斌. 企业生产经营管理系统的研究与实现[J]. 电脑知识与技术, 2014, 3(10): 9.

[3] 马斌, 周平. 大数据时代的数据挖掘[J]. 中国科技信息, 2014(23).

[4] 李雅洁, 沈佳. 信息资源管理系统在信息系统运维中的应用[J]. 电子制作, 2013(12).

[5]马天福, 宋子成. 关于信息系统“建转运”的有效探讨[J]. 电子技术与软件工程,2014(10).

猜你喜欢

精益化
高海拔地区高压架空输电线路无人机巡视精益化研究
变电运维精益化管理
变电运维精益化管理
提高掘进工作面单进水平的探索与实践
医院精益化供应链管理探索