基于GBDT算法的变电器重过载精准预测研究
2023-06-25李淑玲
摘 要:为了实现变电器稳定安全的运行,解决设备预警的时效性差、精准度低、故障后抢修成本高等问题,文章基于配电设备历史运行数据和机器学习等相关知识,采用梯度提升树(GBDT)算法,对设备重过载情况进行预测。研究结果表明,建立设备运行状态智能感知模型和设备重过载预测模型,能够精准预测设备重过载现象,优化设备检修维护策略,降低设备检修维护成本,可实现保障电网经济运行的目的。
关键词:变电器;重过载;GBDT算法
中图分类号:TP39;TM715 文献标识码:A 文章编号:2096-4706(2023)07-0144-03
Abstract: In order to realize the stable and safe operation of the transformer and solve the problems of poor timeliness, low accuracy and high cost of emergency repair after failure of the equipment early warning, this paper uses the gradient lifting tree (GBDT) algorithm to predict the equipment overload based on the historical operation data of the distribution equipment and machine learning and other relevant knowledge. The research results show that the establishment of intelligent perception model of equipment operation status and equipment heavy overload prediction model can accurately predict the phenomenon of equipment heavy overload, optimize equipment maintenance strategies, reduce equipment maintenance costs, and can achieve the purpose of ensuring the economic operation of the power grid.
Keywords: transformer; heavy overload; GBDT algorithm
0 引 言
隨着科学技术的进步和人们生活水平的提高,我国的电力系统得到了极大的发展,在促进经济发展和便利人民生活方面起到了至关重要的作用,但不容忽视的是,电力系统在实际运行过程中存在各种各样的问题,其中,作为电网的核心组成部分,电力变电器在电网运行中发挥着无可替代的作用,其故障检修和维护事关整个电力系统运行的安全稳定与高效。但是由于受到运行原理和自身构造的限制,电力变电器的重过载事故时有发生,对电力系统的安全运行造成严重威胁,需要进行有效的设备运行检修和日常维护,及时发现并处理设备故障,保证输电工作的正常运行。因此,根据变电器日常运行状态大数据,有效分析与深度挖掘变电器运行状态及重过载事故特征数据,提炼变电器日常运行状态特征及状态指标,以此构建变电器重过载精准预测模型,对保障电力系统的正常运行愈发重要。
本文以变电器设备的精准故障预测研究为基础,基于现有配电设备历史中的设备运行状态数据积累和机器学习方法等大数据方面相关基础理论知识,一方面深刻分析当前各类供电系统设备故障所存在的潜在问题成因,另一方面应用机器学习技术建立供电设备的重负荷过载故障预测分析模型,从而全面掌握电网设备日常运行检修状态,优化用电设备运行检修的维护服务策略,提升主配电网用户的稳定供电可靠率,降低电力设备检修与维护成本,保障电网经济运行。
1 梯度提升决策树(GBDT)算法
梯度提升决策树(Gradient Boosting Decision Tree, GBDT)是一种决策树的迭代算法。GBDT模型的应用范围特别广,是一个强有力的模型,可以同时应用于重归、二分类和多归类问题。它应用的是多方位遍布优化算法,作为弱学习者,第一次决策树练习是给树配方差。因而,第一轮的强学习者等同于前轮的强学习者和新的弱学习者。根据这些方法反复升级,可以不断降低全部模型的偏差。
在GBDT的迭代中,假设我们前一轮迭代得到的强学习器为fm-1(X ),损失函数为L( y,fm-1(X )),本轮迭代的目标是找到一个弱学习器hm(X ),使损失L( y,fm(X ))=L( y,fm-1(X )+hm(X ))最小。GBDT分类的损失函数一般为:
L( y1,fm(Xi))=-( yilog pi+(1-yi)log(1-pi))
其中:pi=1/(1+ )表示预测概率值,xi表示第i个样本特征,yi表示xi的观测类别概率值。
GBDT算法具有以下优点:
1)相较于其他模型算法,GBDT算法具有在预测阶段集上计算速度快,树群之间的可并行化和计算简单性。
2)由于采用决策树模型作为最优弱的分类器而使得GBDT模型同样也保持着较高可重复解释的性能和较高的鲁棒性。
3)数据不需要归一化,特征的作用只是用来分裂结点,叶结点的值与特征值的大小无关,是否归一化并不影响叶结点值的大小,也不影响梯度下降的进程。
2 变电器重过载预测模型构建
2.1 建模思路
针对变电器日常运行的状态指标,基于AI技术分析变电器的基本数据(如出厂年限、投运年限等)、运行数据(如近一年运行数据、近几月运行数据等)、设备运行智能感知数据等,寻找影响因素,对是否为重过载设备进行预测和分析,进而进行设备维护。建模思路如图1所示。
2.2 数据说明
本文提取变电器设备基本数据、运行数据,包括配变编号、运行年限、额定容量、是否为节假日、上个月重过载数据、上两个月重过载数据、上三个月重过载数据、气象数据、去年同期运行数据等特征,共32个自变量,是否为重过载设备设为因变量,每一个样本为每一台设备的相关信息,共146 590个样本。设备重过载变量说明如表1所示。
2.3 数据处理
首先对数据进行过滤,设立条件为将数据中数值为0的数据过滤掉。根据所设的条件完成行数据的过滤,满足条件的记录将被保留,不满足条件的记录将被过滤删除。其次再对缺失值进行处理,这里我们将数值型属性的缺失值用平均值填充,字符型属性的缺失值用最多次数项填充:
1)对数据的重复值、缺失值和空格值进行处理,同时进行字段抽取、字段拆分和记录抽取。由于数据集中包含许多会对预测结果产生误差的值,因此在加工处理数据之前有必要对原始数据进行初步的清洗,删除对研究无影响的数据内容。例如,对数据集中包含的缺失值进行加工处理,找到缺失值所在的行将其删除得到最后所需的数据集。
2)一阶特征组合。通过对现有特征数据的一阶运算,得到新的一阶特征数据。如利用数据日期和月份,计算出运行设备的正常运行天数,表达式为:
负载率(20_50)次数+负载率(50_80)次数
3)二阶特征组合。在现有特征数据的基础上进行二阶特征组合,产生新特征。如在原始特征“重过载点数”的基础上进行二阶特征组合,得到“上个月重过载次数”“上两个月重过载次数”“上三个月重过载次数”。
4)数据拆分是将原始样本集按照2个(训练集和测试集)或者3个(训练集、测试集和验证集)的方式,拆分为2或3的子集个数。拆分后各个子集的比例总和小于等于100%。数据拆分经常作为回归或者分类算法节点的前置节点。重过载精准预测模型是将原始样本拆分为2个数据集(训练集和测试集),用60%的数据作为训练集,进行建模,寻找影响因素和是否为重过载设备之间的关系模型;用40%的数据作为测试集,验证该模型的准确率。
2.4 模型建立
重过载精准预测模型是将设备基本信息(如投运年限、出厂年限等)、运行信息(如近一年运行数据、近几月运行数据等)、設备运行智能感知数据等作为影响因素,通过数据处理,用60%的数据作为训练集,用40%的数据作为测试集。通过梯度提升决策树分类算法对训练集进行建模,寻找影响因素和是否为重过载设备之间的数学模型,然后通过测试集来验证该数学模型的准确率。如果误差能够控制在一定的范围内,则认为该模型很好地反映了影响因素和是否为重过载设备之间的关系,可以用来进行预测和分析。本文采取的分析软件为Tempodata机器学习平台。
GBDT模型中重要参数信息配置如下:
迭代步长:设置每次迭代的步长,浮点型,取值范围(0,1),取值为0.1。
决策树个数:设置决策树个数,整型,取值范围[1,∞],取值为20。
最大深度:树的最大深度,整型,取值范围[1,30],取值为5。
最大份数:数值型属性分割份数设置,整型,取值范围[2,10 000],取值为32。
收敛容差:设置终止树生长的误差界,浮点型,取值范围[0,1),取值为0.01。
2.5 模型评估
模型评估一方面能够对模型的表现进行评估,另一方面能够根据指定的评价指标进行模型比较,推荐出最佳模型。
经过特征指标重要度计算,得出判断变电器是否重过载最重要的因素是上个月重载点数和温度相关特征,其次是时间相关的变量。
检测模型的准确度,以60%的数据作为训练集,以40%的数据作为测试集。训练集和测试集结果如表2、表3所示。
从整体正确率来看,训练集平均正确率为95.89%,测试集平均正确率为95.58%。为了尽可能监测设备检修工作,更希望预测设备是故障设备,因此分类准确率更为重要。通过对测试集上的混淆矩阵结果的分析,可以得到预测为0的准确率为96.06%,预测为1的准确率为90.71%,分类效果较好,预测精度较高。
模型的ROC曲线如图2所示。
由ROC曲线可知,ROC曲线下面积AUC为0.959 2,接近于1,说明模型的诊断效能很好。
3 变电器重过载预测模型应用效果
针对传统设备检修面临的工作量大和检修不及时等问题,基于历史设备运行数据,建立设备状态和重过载预测模型进行精准检修管控,制定有针对性的检修策略,并提供高概率重过载的设备清单,切实降低检修人员的工作量,提高用电服务效率。历经2个月的业务验证,对200多台设备进行精准维护,避免了3次大范围停电,减少大约300多个检修人天,验证期间整体效果保持相对稳定。实际业务验证效果同模型评价结果基本一致,符合模型的预期目标。
4 结 论
本文对设备历史运行相关数据进行挖掘建模及应用,达到对设备进行精准管控的目的。通过对所建立模型的部署和应用,实现模型的工程化应用。基于设备重过载精准预测是将设备基本信息、运行信息作为影响因素,构建设备重过载精准预测模型,基于该模型,可以预测高概率发生重过载故障的潜在设备,为检修人员提供精准设备清单,提升检修维护效率,降低检修成本,保障电网运行效率。
综上所述,变电器的安全、稳定运行为我国的经济建设提供了充足的动力,在配电变电器的运行和故障维护方面要给予高度的重视,因此,变电器运行故障处理中维护技术的应用也愈来愈重要,特别是要加强对变压器重过载的实时监督与检测。为保障电力系统的正常运行,供电企业要全方位地掌握设备的运行状态,优化设备检修维护策略,提升配电网的供电可靠率,降低设备检修维护成本,保障电网经济运行,提高人民生活质量,为我国的经济建设保驾护航。
参考文献:
[1] 倪益民,杨宇,樊陈,等.智能变电站二次设备集成方案讨论 [J].电力系统自动化,2014,38(3):194-199.
[2] 蒋益强.二次系统基础上的状态检修技术在智能变电站中的实践分析 [J].中国新技术新产品,2014(8):2-3.
[3] 李方震.浅析电力系统变电运行中常见的故障类型及解决措施 [J].中国战略新兴产业,2017(12):176+178.
[4] 高吉普,徐长宝,戴宇,等.智能变电站 IEEE1588 以太网交换机故障案例复现测试及分析 [J].电力系统保护与控制,2014,42(14):146-150.
[5] 曹琪娜,张诗建.配电变压器轻重过载治理方法探讨 [J].大众用电,2018,32(4):25-26.
[6] 贺建章,王海波,季知祥,等.基于随机森林理论的配电变压器重过载预测 [J].电网技术,2017,41(8):2593-2597.
作者简介:李淑玲(1976.10—),女,汉族,河南郑州人,副教授,硕士,主要研究方向:计算机应用、数据挖掘与分析、应用统计。