APP下载

基于改进决策树算法的电能计量装置故障自动化诊断系统

2024-03-06赵书函

自动化与仪表 2024年2期
关键词:算例决策树电能

张 驰,王 栋,赵书函

(国网甘肃省电力公司信息通信公司,兰州 730000)

电网当中电能计量装置作为进行电量结算的重要电力设备,对其运行状态以及故障监测是保障电网系统稳定运行的关键一步[1]。目前对电能计量装置的故障监测主要通过人工巡检的方式实现,存在不能及时发现故障、存在较长巡检周期等问题[2-5]。本文通过结合改进决策树算法的电能计量装置故障自动化诊断系统设计,实现信息化、精细化、自动化的电能计量装置故障监测,以实现降本增效、提高故障检测精确度的目的。

1 电能计量装置故障监测

1.1 电能计量装置在线监测

电能计量装置的主要构成包括电流互感器(CT)、电压互感器(PT)以及电能表等[6]。电能计量装置在线监测的整体系统流程如图1 所示。

图1 电能计量装置在线监测整体流程Fig.1 Overall process of online monitoring of the electric energy metering device

1.2 电能计量装置的数据挖掘

数据挖掘过程对大量数据进行收集分析[7],首先提取数据特征,建立工程模型,而后对采集信息比对,从而判断电能计量装置是否存在故障。数据挖掘的整体流程如图2 所示。

图2 数据挖掘整体流程示意图Fig.2 Schematic diagram of the overall data mining process

1.3 决策树算法

在数据挖掘算法中,决策树算法属于监督学习算法的一种[8],其结构如图3 所示。

图3 决策树结构示意图Fig.3 Decision tree structure

图3 中,不同节点表示不同对象,分叉路径表示相应可能出现的特征值。

2 决策树算法

2.1 决策树算法简述

决策树算法通常分为CART、C4.5 以及ID3。CART 决策树以二叉树结构为基础,C4.5 决策树以多叉树结构为基础,ID3 决策树无法进行剪枝以及缺失值的处理。在电能计量装置系统运行中,数据包括相应的缺失值,因此通过C4.5 决策树进行具体系统研究。

2.2 选择数据特征

设集合D 为对应的样本数据集合,样本数据的容量用∣D∣表示,样本数据中包含的类Ck的个数为K,k=1,2,…,K,类Ck中的样本数量为∣Ck∣。对于某一个数据特征A,其中包含的取值个数为n,也即{a1,a2,…,an},依据数据特征取值对数据样本集合进行划分,得到的子集D1,D2,…,Dn的个数为n。对于某个子集Di,其中包含的样本数量为∣Di∣,对于某个子集中属于某个类的样本集合表示Dik,其对应的样本数量表示为∣Dik∣。

可以将经验熵表示为

式中:H(D)为相应的经验熵。某一数据特征在特定条件下的经验熵表示为

式中:A 为对应的数据特征;D 为特定条件。数据特征对于特定条件下训练集产生的信息增益表示为

式中:g(D,A)为相应的信息增益。由此得到对应信息增益比表示为

式中:gR(D,A)为对应信息增益比。基尼系数表示为

数据特征针对训练集对应基尼系数表示为

式中:Gini(D,A)为数据特征针对训练集对应基尼系数。D1={(x,y)∈D∣A(x)=a},D2=D-D1。

2.3 决策树算法及剪枝

CART 决策树算法中,将停止对节点样本个数进行计算法的阈值、特征集A 以及数据的训练集合D 作为对应的输入,将决策树T 作为输出。CART决策树算法通过由根节点不断递归进行二叉树的构建。

为避免决策树过于复杂可能导致对应的过拟合情况,需要对决策树进行剪枝,从而简化复杂决策树,避免过拟合情况出现。

3 算例仿真及分析

算例仿真采用某电网在线监控系统当中的电能计量装置数据作为实验数据,结合C4.5 具体的模型构建流程如图4 所示。

图4 结合C4.5 系统模型构建流程示意图Fig.4 Schematic diagram of the construction process based on the C4.5 system model

图4 中对应的电能计量装置运行状态的参数如表1 所示。

表1 电能计量装置运行状态参数设计Tab.1 Design of parameters of operating status of electric energy metering device

3.1 数据预处理

3.1.1 运行数据融合

在电能计量装置当中,对二次回路当中三相压降相关的特征参数δ(′)以及f(%)进行融合,融合后得到合成误差。

系统运行的三相电压以及电流对应的测量值变差可以通过式(7)以及式(8)进行求取:

3.1.2 分析特征相关性

运行数据融合之后得到新的特征数据,对系统中包含的里变量做出独热编码,而后对数据特征属性进行相关性分析,依据相关性大小进行决策树当中特征属性的选择。

3.2 算例仿真

3.2.1 运行状态

电能计量装置在正常运行状态下,其各项运行参数指标如下:电能表的有功变差在0.1%以内,有功误差在0.16%以内,等级为0.2S;电能表的无功变差在1%以内,无功误差在1.6%以内,等级为2;二次压降的合成变差在0.06%以内,合成误差在0.16以内;二次回路中电压互感器的负荷为2.5 VA~80%,电流互感器的负荷为3.75 VA~80%,三相电流对应监测的变差在10%以内,电压对应监测的变差在2%以内。

3.2.2 算例设计

算例在Anaconda 环境中实现,使用python 语言,机器学习数据库采用sklearn。通过CART 算法与C4.5 算法做出对比,验证设计系统的可行性,数据集所得结果如表2 所示。

表2 电能计量装置数据集Tab.2 Data set of energy metering devices

表2 中通过K 折交叉验证的方式,将数据随机分配为10 组,其中1 组为验证集,9 组为训练集,之后进行重新随机选取,一次进行交叉验证。

3.3 仿真结果分析

3.3.1 C4.5 仿真结果

结合C4.5 算法进行故障自动化诊断系统仿真后得到的可视化结果,从根节点的分割方式来看,先通过二次压降的C 相进行划分,其对应的变差为X9,对应的信息增益比为1.5。其中1 组104,对应的value=[28,33,43],即正常值为28,预警值为33,故障值为43;另一组103,对应value=[28,70,5],即正常值为28,预警值为70,故障值为5。1 组104 中,依据二次压降A 相的变差继续进行划分,2 组103中,依据电能表对应的无功误差继续进行划分,其他层次依次类推划分。

3.3.2 CART 仿真结果

结合CART 算法进行故障自动化诊断系统仿真后得到的可视化结果。根节点以X19 即三相电压监测的一致性进行分割,对应基尼系数为0.625,一组16,对应value=[16,0,0],即正常值为16,预警值为0,故障值为0;另一组191,对应value=[40,103,48],即正常值为40,预警值为103,故障值为48。而后一次进行向下分割。

3.4 工程调参及结果对比

在不同决策树对应的深度中,通过对参数进行调整,比较2 种算法的准确率。其中决策树深度与准确率的关系如表3 所示。

表3 决策树深度对准确率影响Tab.3 Influence of decision tree depth on accuracy

决策树深度与预测准确率的关系如图5 所示。

图5 决策树深度与准确率关系Fig.5 Relationship between decision tree depth and accuracy

结合图5 与表3,CART 算法与C4.5 算法均能保证决策树的预测准确率,且深度越深,能够得到越高的准确率。但是决策树的同等深度下,CART 算法的准确率相对更高,因此系统设计中采用CART算法。

结合CART 算法的故障监测系统与人工判读的方式进行对比,其比较结果如表4 所示。由表4可知,决策树算法在快速高效的同时,能够更大程度地提高对故障判断的准确率。

表4 人工判读与CART 算法检测系统对比Tab.4 Comparison between manual interpretation and CART algorithm detection system

4 结语

在电能计量装置的在线监测系统中,引入了改进的决策树算法,以期提高电能计量装置的故障诊断效率以及精确度。通过算例验证,基于改进决策树算法的电能计量装置故障自动化诊断系统能够对电能计量装置进行实时分类预测,通过算例模型进行数据比对,精确识别运行状态,及时提供预警和故障信息。算例结果表明,该办法能够实现比人工判定更高的精确度,同时效率更高。

猜你喜欢

算例决策树电能
苹果皮可以产生电能
电能的生产和运输
一种针对不均衡数据集的SVM决策树算法
海风吹来的电能
决策树和随机森林方法在管理决策中的应用
澎湃电能 助力“四大攻坚”
基于决策树的出租车乘客出行目的识别
基于振荡能量的低频振荡分析与振荡源定位(二)振荡源定位方法与算例
互补问题算例分析
基于CYMDIST的配电网运行优化技术及算例分析