APP下载

一种基于灰色关联的智慧能源运维成本回归模型

2021-03-31黄贺郭晨晨

微型电脑应用 2021年3期
关键词:工作量关联度运维

黄贺, 郭晨晨

(中国神华国际工程有限公司, 北京 100007)

0 引言

自发改能源[2016]392号文“关于推进‘互联网+’智慧能源发展的指导意见”发布以来,智慧能源的建设成为能源电力系统、技术厂家和社会资本追逐的热点[1-3]。同时,随着物联网及新能源技术的发展,开展综合能源服务已成为降低成本、提升能源使用效率的重要方向[4-5]。

综合能源信息系统有效、安全、可靠的运行会对整体能源信息化管控工作起到重要影响[6]。但是智慧能源系统组成部分繁多、涉及部门较广,目前IT运维服务内容、服务质量、运行维护造价与取费等方面管理薄弱,这不利于智慧能源信息化运行维护工作的统一管理,同时在运行维护服务内容上难以做到统一协调、统一考核、统一指挥和协同提高[7-9]。为了满足能源信息化建设工作的精益化要求,进一步加强运维服务过程的规范化管理,统一取费口径,使智慧能源运维服务成本度量更加科学化和合理化,完善运维计价与取费标准并进行相应的评估验证,从而有效、合理的利用资金,保障智慧能源运维工作正常开展,确保信息化对业务的有效支撑[10-11]。本文基于机器学习和灰色关联度分析法,首先确定运维工作量和资产原值之间的定量关系,其次将运维服务要求、运维系统特征等因子与工作量分析方法相结合,提出了一种基于IT运维工作量调整因子的智慧能源运维成本度量模型。

1 智慧能源运维成本度量存在的问题

为了不断增加有效供给、提升能源产业竞争力、提高能源系统效率、保障整体工程的正常运转,能源行业每年信息化投资上亿。智慧能源工程自动化、信息化系统在实时监测、预警预报和自动控制等方面承担了重要的任务,是工程运转保障的重要组成部分。综合能源信息系统涉及种类多、初始投资大、质量要求高、服务单位多和服役时间长等特点,尤其系统运行维护贯穿整个信息化工程的生命周期,运行维护主要保障各个系统的正常、稳定运行。

因此需要制定信息化运维服务相关标准规范,从而保证信息化运维服务采购内容、采购预算方式、服务内容、服务质量和考核目标的相对一致,为智慧能源信息化管理提供规范支撑,保障系统的可靠运行。

2 理论研究基础

2.1 机器学习中的回归数学模型

(1) 回归理论基础

设定目标为y,影响该目标的因素往往不止一个,这里设定为m个属性(影响因素)描述,记为x=(x1,x2,…,xd,…,xm),其中xd是x中第d个属性的取值。线性回归模型在基础数据之上学习可以得到一个通过属性组合来进行预测的函数,设定目标为f,如式(1)。

f(x)=ω1x1+ω2x2+…+ωmxm+b+ɛ

(1)

一般可用向量形式,如式(2)。

f(x)=ωTx+b+ε;ω=(ω1,ω2,…,ωd,…,ωm)

(2)

式中,ɛ表示随机误差;ω表示针对每个因素对应的系数;b表示对函数模型的一个调整。在模型训练过程中,通过实际中收集的已知数据,进行整理后输入到模型作为模型给定的依据,便可以得到式子中ω和b,因此模型就可以确定,经过检验之后就可以用于实际的预测。

(2) 均方误差最小化来确定模型

式子中ω和b是模型的参数,也是最终需要得到的数据。均方误差表达式,如式(3)。

(3)

基于均方误差最小化来进行模型的求解,如式(4)。

(4)

在均方误差公式E(ω,b),分别对ω和b求偏导数,如式(5)、式(6)。

(5)

(6)

令上述两式子为0,可以求得ω和b的最优解,如式(7)、式(8)。

(7)

(8)

计算模型,如图1所示。

图1 计算模型

模型生成后的验证是至关重要的一层。在实际验证中,需要把收集到的数据进行划分,将数据拆分为训练集数据以及验证集数据。最简单的拆分方式是按照一定的比例(比如1/4)进行拆分,该方式在大数据量的前提下,使用起来比较方便且不会影响模型的准确性能。

2.2 基于灰色关联分析的方法原理

首先,选取IT运维工作量的影响因子(业务重要性、安全等级、部署方式、系统关联性……)为子序列A,选取在各种子序列因子对应条件下的IT运维工作量作为母序列B,其矩阵表示如下。

子序列A,如式(9)。

(9)

母序列B,如式(10)。

(10)

为保证建模质量和获得正确的系统分析结果,必须对原始数据进行数据规范化变换和处理,采用极差最大值变化法对数据进行处理,如式(11)。

(11)

从处理后子母序列中做如下变化,形成新的序列Δ,如式(12)。

Δij=|aij-bij|

(12)

并在新序列中取出极值最大值和最小值,如式(13)、式(14)。

Δmax=max(Δij)

(13)

Δmin=min(Δij)

(14)

其次,关联度是作为衡量指标序列相似程度的测度,关联度的计算可由下式得到,如式(15)。

(15)

最后,对关联度gi进行从大到小排序,关联度越大,该因子对IT运维工作量的影响越大。

3 智慧能源运维成本度量模型研究

3.1 基于回归分析的基准运维工作量模型建立

基于回归分析的基准运维工作量建模是利用数据驱动的方法寻求工作量与资产原值的内在规律,从而得到这两大指标估算的最优方案。基于回归分析的基准运维工作量模型可分为两层。

(1) 数据采集层,为达到基准运维工作量模型的训练需求,需要获取如下相关数据:信息系统资产原值、工作量数据、系统更新频率用户规模、支持方式、接口数量、外围系统数量、部署方式和运维年度等。

(2) 数据融合层,进行相关模型参数优化。

3.2 运维成本度量模型建立

智慧能源运维成本度量模型。先分析计算用户规模、支持方式、接口数量、外围系统数量、部署方式和运维年度的工作量调整因子对IT运维成本的影响程度,然后将调整因子作为机器学习的输入变量,最后以IT运维成本预测值作为输出变量,建立基于工作量调整因子的智慧能源运维成本度量模型。操作步骤,如图2所示。

图2 流程图

(1) 灰色关联度分析。计算运维工作量与调整因子的灰色关联度。

期刊评价与学术评价过度依赖JIF,驱使期刊争相提高自己的JIF,形成了一个恶性循环。几乎与此相关的每个人都对这种怪象既爱又恨,但苦于尚未找到比JIF更客观的定量指标。既然JIF的作用异化了,那么能不能直接废除JIF量化评价指标呢?事实上,期刊评价与学术评价通行的方法有依据各类量化指标的定量评价和采用同行评议的定性评价。如果在评价中完全废除类似于JIF的定量指标,仅仅依靠同行评议其实是很不现实的。因为同行评议也会受评议人的学术修养、价值偏好、科学范式、学识水平乃至人际关系和利害冲突等等因素的影响,其客观公正性也难以保障。事实上,正是为了克服定性评价这些弊端,定量评价才应运而生并被广泛使用 。

(2) 由上述步骤得到的灰色关联度来确定影响IT运维工作量的主要调整因子。

(3) 根据主要调整因子通过机器学习算法建立智慧能源运维成本度量模型。

3.3 工作量调整因子分析

根据国家标准《信息技术服务运行维护费用度量规范》草案相关内容,本文选取运维工作量调整因子主要包括用户规模、支持方式、接口数量、外围系统数量、部署方式和运维年度。为了使这种直观上的关联度分析更具一般性,本文对运维成本和工作量调整因子序列之间的关联度进行了量化:首先设定分辨系数r,然后计算调整因子的灰色关联度。数据测算结果,如图3所示。

图3 灰色关联度数据测算结果

由图3可知,用户规模、接口数量、系统数量调整因子的灰色关联度较大,可以作为影响运维工作量的主要调整因子。因此,选取影响运维成本的序列组{用户规模、接口数量、系统数量}作为机器学习的输入变量,以IT运维成本作为机器学习的输出变量,建立智慧能源运维成本度量模型。

4 调整因子回归拟合分析

4.1 影响因素分档划分

选取影响运维成本的序列组{用户规模、接口数量、系统数量}作为机器学习的输入变量,由于这些因素中,某些因素跨度范围较大,一般在实际模型训练中都是通过对调整因子进行分档的方式来区分,因此对于某些跨度很大的影响因子进行分档处理。

(1) 用户规模划分,如表1所示。

表1 用户规模划分表

用户规模表征了系统的支撑能力,范围划为参考系统的并发量支持。

表2 外围系统划分表

外围系统的数量,体现了系统与外部的关联程度。

(3) 接口数量划分,如表3所示。

表3 接口数量分表

接口数量的多少关系到系统内部实现的复杂性。

4.2 拟合结果展示

在基于机器学习中的回归数学模型分析中,采用了多种回归算法作为模型的拟合算法,分别包括:岭回归算法、线性回归算法和向量机回归算法。不同的回归算法拟合结果,如图4—图6所示。

图4 岭回归拟合结果展示

三种算法的R2分别为0.537 8、0.557 0和0.452 3。

通过信息化运维服务费用测算,使得信息化系统的运行维护内容、运行维护费用支出有章可循,有据可依,从根本上确保各个系统投入运行后,以合理的运行维护费用保障系统按运行维护要求,实现稳定、可靠和安全运行。

图5 线性回归拟合结果展示

图6 向量机回归拟合结果

5 总结

综合能源信息系统运维成本模型统一了测算口径,使运维服务费用测算评估更加科学化、合理化,统一了运维服务费用测算方法、模型及标准并进行相应的评估验证,从而有效、合理的利用资金,保障信息系统运维工作正常开展,确保信息化对业务的有效支撑。通过信息化运维服务费用测算,使得信息化系统的运行维护内容、运行维护费用支出有章可循,有据可依,从根本上确保各个系统投入运行后,以合理的运行维护费用保障系统按运行维护要求,实现稳定、可靠和安全运行。

猜你喜欢

工作量关联度运维
嵌入式系统软件工作量多源线性估算方法仿真
运维技术研发决策中ITSS运维成熟度模型应用初探
中国制造业产业关联度分析
中国制造业产业关联度分析
风电运维困局
沉香挥发性成分与其抗肿瘤活性的灰色关联度分析
杂乱无章的光伏运维 百亿市场如何成长
思科发布云计算市场发展报告
基于ITIL的运维管理创新实践浅析
网上互动教学工作量管理的困境及对策