基于机器学习的智能电网调度控制系统在线健康度评价研究
2021-01-07邓智广,谭振鹏
邓智广,谭振鹏
摘 要:针对智能电网调度控制系统的在线健康度评价问题,基于机器学习算法中的随机森林算法(RF),提出一种智能电网调度控制系统在线健康度评价模型——不需设复杂参数、指标权重及分级标准。通过构建模型并进行实例验证分析,证明了该模型的有效性。
关键词:机器学习;随机森林;智能电网;调度控制;健康度评价
中图分类号:TM73;TP181 文献标识码:A 文章编号:1001-5922(2021)12-0158-04
Research on Online Health Evaluation of Smart Grid Dispatching Control System Based on Machine Learning
Deng Zhiguang, Tan Zhenpeng
(Foshan Power Supply Bureau, Guangdong Power Grid Corporation, Foshan 528000, China)
Abstract:Aiming at the problem of online health evaluation of smart grid dispatching control system, an online health evaluation model of smart grid dispatching control system is proposed based on random forest algorithm (RF) in machine learning algorithm, which did not need to set complex parameters, index weight and grading standard. The effectiveness of the model is proved by building the model and performing the case verification analysis.
Key words:machine learning; random forest; smart grid; dispatching control; health evaluation
0 引言
智能电网调度控制系统集成了动态预警、调度计划等多个应用系统,实现了多级调度业务的联合协调管理工作,对于保障我国电网的安全和稳定运行有着极大的作用。为了加强智能电网调度控制系统的运维、预警以及快速处置等能力,提高相关工作的效率,运维人员需要对系统运行实时状态信息能够全面地了解掌握。因此,本文針对智能电网调度控制系统的在线健康度评价问题展开研究,探讨更快速、更精确的健康度评价方法。
1 智能电网调度控制系统在线健康度评价指标体系的构建
在评价问题上,构建合理的指标体系是最基础的阶段,因此本文首先对智能电网调度控制系统运行过程仔细分析,归纳总结其健康度影响因素主要包括系统硬件设备的状态、系统中各项业务的状态等,并在此基础上构建了智能电网调度控制系统在线健康度评价指标体系。
1.1 系统硬件设备在线健康度评价指标体系
本文所构建的系统硬件设备在线健康度评价指标体系如表1所示。
从表1可以看到,系统硬件健康度评价指标体系中包含了3个等级的指标。系统服务器作为最核心的硬件,其健康度为最高层次的一级指标;CPU、网卡以及硬盘等设备的健康度为二级指标;在各二级指标下,有对应硬件的使用率等三级指标。
1.2 系统业务在线健康度评价指标体系
智能电网调度控制系统集成了公共服务等多个应用系统以及关系数据库、实时数据库等,因此与系统硬件健康度评价指标体系相比,系统各项业务在线健康度评价指标体系的构建相对复杂。本文对数量较大且层级关系复杂的各项业务进行分析归纳后,分别建立了各子业务相应的业务在线健康度评价指标,再将智能电网调度控制系统中所有子业务的业务在线健康度评价指标结合为一个系统业务在线健康度评价指标体系,具体如图1所示。
2 基于随机森林的智能电网调度控制系统在线健康度评价模型
近年来在对象评价问题上常用机器学习算法,如神经网络、支持向量机、随机森林等。这些机器学习算法都具有较好的处理非线性数据处理能力;但是相比较而言,随机森林算法(RF)有行随机和列随机两个随机性,因此可以有效地降低过拟合的概率,对离散型和连续型的数据均能够进行处理,并且更适合并行化应用。本文根据前文所构建的智能电网调度控制系统在线健康度评价体系,构建基于随机森林算法的智能电网调度控制系统在线健康度评价模型。
2.1 系统在线健康度评价模型的构建
本文采用了多层级联的架构方案,在多层级的原则基础上,构建了各业务通用的子模型,同时也根据不同业务评价指标的差异性,相应的构建了一部分特有的子模型。本文所构建的基于随机森林算法的智能电网调度控制系统在线健康度评价模型中共包含了17个评价子模型,分别具体负责系统中子进程、多个子进程相关的总进程、实时数据库、关系数据库、其他各个应用的健康度评价,以及相应的设备硬件健康度评价。
2.2 评价子模型的构建
本文构建的智能电网调度控制系统在线健康度评价模型中,最底层的子进程模型是最基础的评价子模型。因此以子进程模型作为典型来对评价子模型的构建方法进行具体阐述。
对于智能电网调度控制系统而言,其中所包含的各子进程指标以及计算方法是一样的,本文将各子进程的数据组成原始数据集,从而扩大数据的规模和变化范围。评价子模型的具体生成步骤:
(1)将智能电网调度控制系统中各节点的子进程资源占用情况作为原始数据集(x,y), x 表示资源占用情况,y 表示健康度等级,其中 x 包含CPU、内存占用情况及线程数等6个特征,y 分为良好、正常、异常等5个等级,离散化为0、1、2、3、4;
(2)以原始数据集(x,y)中70%的数据作为训练集D,余下的数据作为测试集S;对训练集 D 进行Bootstrap重抽样,得到 k 个容量与训练集 D 相同的样本,每个样本均为分类树的所有训练数据;
(3)对k个样本重复步骤(1),以此生成 k 个分类树并得到对应的分类结果;
(4)以简单投票法得到最终分类结果,即得到子进程模型;
(5)训练子进程模型,并以交叉验证方法评估训练精度;若不满足要求则重新选取指标数和分类树的个数,直到满足要求。
在上述步骤中,子进程模型的具体训练过程如图2所示:
3 实例验证及分析
为了验证本文所构建的基于随机森林的智能电网调度控制系统在线健康度评价模型的有效性,选取10 000条智能电网调度控制系统的进程运行数据作为原始数据集,对该模型进行实例分析。
3.1 模型实现
在Python语言环境下,根据前文所述方法构建基于随机森林的智能电网调度控制系统在线健康度评价模型,同时还构建了基于支持向量机(SVM)的智能电网调度控制系统在线健康度评价模型,以此对比验证性能优劣情况。
将包含10 000条数据样本的原始数据集分割为训练集D和测试集S。其中,训练集D为原始数据集中70%的数据,用于构建子进程模型;测试集S为余下的30%数据,用于检验子进程模型的性能。
根据一定规则对原始图像进行尺度变换,最终构建成如图2所示的多尺度空间表示序列。
3.2 评价结果分析
3.2.1 评价精度分析
本文采用5折交叉验证方法来验证基于随机森林的智能电网调度控制系统在线健康度评价模型的评价精度,结果如表2所示。
从表2所示结果可以看到,与基于支持向量机的模型相比较,本文所提出的基于随机森林的智能电网调度控制系统在线健康度评价模型达到了更高的精度。对此,本文分析认为其主要原因在于随机森林算法本身就内置了比交叉验证方法更高效的验证计算能力。
3.2.2 模型指标重要性分析
基于本文所提出方法而构建的子进程模型,其所有指标的重要性的验证结果如图3所示。
从图3中可以看到,子进程健康的评价指标中重要性最大的为内存占用指标,超过了30%。此外,CPU占用指标也非常显著,接近30%。其他几项指标的重要性则差异不大,均在10%左右。
3.2.3 评价结果分析
将用于检验子进程模型性能的测试集S 输入到训练完毕的基于随机森林的智能电网调度控制系统在线健康度评价模型中,得到评价结果;同样将测试集S 输入到基于支持向量机的智能电网调度控制系统在线健康度评价模型中,得到相应的评价结果。两个模型的最终评价结果分布结果如表3所示。
对比两个模型的评价结果后发现:对于测试集S中包含的3 000条智能电网调度控制系统进程运行数据,两个模型的预测差异点数量只有150条,预测结果的差异性非常小。
4 结语
本文构建了基于随机森林的智能电网调度控制系统在线健康度评价模型,并与基于支持向量机算法的模型进行了实例对比验证。验证结果说明:基于随机森林的智能电网调度控制系统在线健康度评价模型不需要设置复杂参数、指标权重以及分级标准,既容易实现又具有较好的客观性。该模型能够很好地解决多分类问题,达到了较高的精度要求。
参考文献
[1]李海英,劉中银,宋建成. 电力系统静态安全状态实时感知的相关向量机法[J]. 中国电机工程学报,2015,35(02):294-301.
[2]熊 伟,程小丽,刘飞源,等. 电网调度安全评价体系信息化研究[J]. 科技视界,2015(01):328-332.
[3]冯长有,金一丁,史东宇,等. 基于D5000系统的互联电网在线安全稳定分析异地联合计算技术与实现[J]. 陕西电力,2015,43(02):39-44.
[4]吴潇雨,和敬涵,张 沛,等. 基于灰色投影改进随机森林算法的电力系统短期负荷预测[J]. 电力系统自动化,2015,39(12):50-55.
[5]姚锡文,汤规成,许开立,等. 复杂系统安全评价模式的集成研究及应用[J]. 东北大学学报(自然科学版),2015,36(07):1047-1 050+1 055.
[6]茹笑天,车成华. 电力调度运行中的安全控制分析[J]. 中国高新技术企业,2015(34):127-128.
[7]李婉华,陈 宏,郭 昆,等. 基于随机森林算法的用电负荷预测研究[J]. 计算机工程与应用,2016,52(23):236-243.
[8]刘 帅,于晓飞. 智能电网调度控制系统“两级三化”的管理[J]. 中国管理信息化,2017,20(02):102-103.
[9]王安颖,许志成,甄 庆,等. 天津滨海电网D5000系统中PAS应用的研究[J]. 科技资讯,2017,15(28):54-55.
[10]孙伟卿,王承民,张 焰,等. 电力系统运行均匀性分析与评估[J]. 电工技术学报,2014,29(04):173-180.
[11]刘桂华,刘慕娴,陆力瑜,等. 一种基于层次分析和支持向量机的电网安全评估模型[J]. 无线互联科技,2019,16(21):109-111.
[12]杭 琦,杨敬辉. 机器学习随机森林算法的应用现状[J]. 电子技术与软件工程,2018(24):125-127.