基于分类决策树对电网配变不匹配问题的故障诊断算法
2020-06-29饶欢陈凤超何毅鹏
饶欢 陈凤超 何毅鹏
摘 要:针对配电网配变不匹配的问题,本文提出基于分类决策树对电网配变不匹配问题的故障诊断算法,通过获取省海量平台计量数据和营销数据,从数据质量检查、数据真实性校验、数据修正和数据驳回四个步骤对数据进行分析,从而达到提高数据质量的目的,分类决策树算法的应用可以辅助调度人员迅速识别故障,保证配电网的安全稳定运行。
关键词:配电变压器;决策树算法;数据质量;故障诊断
0 引言
配电变压器数据中电压或电流超限后报警,配网调度员从数据库中核查报警位置处理数据,调取台账数据与原始报文,逐一排查配变匹配问题。这种利用手工排查故障过程十分繁琐,需要大量人力而且容易出错,自动化数据校验水平较低。为提高故障诊断的准确性和快速性,一些学者提出了基于专家系统[1]、人工神经网络[2]、遗传算法[3]和Petri网络[4]的等多种排查方法,上述方法均存在一定的局限性,基于分类决策树对电网配变不匹配问题的算法应用适应各种不利情况的配电网故障诊断方法,辅助调度人员迅速识别故障,保证配电网的安全稳定运行。
1 决策树算法
1.1 决策树算法原理
决策树[5-7]是在已知情况发生概率的基础上,通过构成决策树来计算净现值的期望值是否大于等于零的概率,判断发生问题可行性的决策分析方法。在机器学习中,决策树是一个预测计算模型,它代表的是对象属性与对象值之间的相互映射关系。决策树是一种树形结构,其中决策树每个内部节点表示一个属性上的测试,决策树每个分支代表一个测试输出,决策树每个叶节点表示一种类别。
1.2 分类决策树算法原理
分类树是一种比较常用的分类方法,属于一种有监督机器学习算法,从一堆待测试样本中选取样本,每个样本都有一组相应的属性和类别,属性和类别是提前确定的,那么通过有监督学习得到一个分类器,分类器可以新的样本给出正确的分类。分类决策树模型表示一种对实例进行样本分类的树形结构,决策树通常由有向边和结点两部分组成,样本中的每个结点由内部节点和叶子节点组成。内部节点通常表示的是特征或者属性,叶子节点表示单个独立的个体,属于不能再细分的类别。当样本的节点进行分类划分时,从一个根节点开始,针对实例的某一特征向量进行测试,依据样本的测试结果,将样本实例分配到其子结点,每一个样本子结点和特征的取值相对应。设置相应阈值,不断递归向下移动,到达叶结点为止,这时将样本实例分配到叶子结点的种类。
1.3 分类决策树的建立
分类决策树剪枝是针对决策树过早拟合问题而提出来的。分类决策树剪枝一般分先剪枝和后剪枝。通过提前停止树的构造方法属于先剪枝,假如决定在某个关键节点不再进行分裂,对树节点进行剪枝,如果剪枝停止,那么该节点就变成样本中的叶子节点。对该叶子节点选取包含样本子集中类别最多的一个类,作为样本节点的一个类别。后剪枝是针对完全成长的树进行剪枝,通过去掉节点的分枝,用叶子节点代替,叶子节点用子集中类别中出现频率最高的类别进行标记。本文基于分类决策树对电网配变不匹配问题的故障诊断算法采用后剪枝的策略。
2 整体实现
本文从数据质量检查、数据真实性校验、数据修正和数据驳回四个步骤实现了解决电网配变不匹配问题,在同一个用户同时拥有高供高计和高供低計两个测量点,电压数据经常在高压侧和低压侧切换,造成电压越限。用户侧设备更新,而计量系统或营销系统中的变比数据未及时同步或填写不规范,或由于计费原因不能同步更新,直接影响PQIU等量测数据计算。本文数据来源于某省海量平台计量数据和省海量平台营销数据,先匹配台帐营销数据,获取导致错误异常报数据警,系统中对UI设定上下限的阈值。获取某省海量平台计量数据和省海量平台营销数据。检查电压电流,匹配台帐营销数据,提取异常报警数据,检查异常数据确实、重复情况,如果没有重复,提取异常超限数据,提取数据相关匹配、变比、电压、电流信息,利用变比关系对比量测数据,高供高记变比计算和高供低记变比计算,利用变比关系对比量测数据,如果匹配,录入缺失数据计量点位,如果不匹配。利用专家系统分析具体原因[8,9],建立数据规则,利用决策树皮判别,训练决策树参数,载入后续参数,分析电压电流报警原因,建立数据集规则,判断是否误报警,如果没有报警输出真实报警信息,并重新检查线路功率,如果报警,恢复变比数据,包含匹配信息、变比信息、电压计量数据和电流计量数据。
2.1 数据质量检查
首先由计量系统得到越限警告,核查越限处数据是否有缺失、重复、格式错误,如果数据有问题,结束质量检查;再判断数据有问题的次数,生成错误报告,结束质量检查,如果数据多次没有问题,从省海量平台重新下载数据。提取报警数据,校验警报信息的完整性,包括报警数据的时间、地点、设备编号、报警类型与严重程度,并且需要检查报警时间是否缺失。报警地点与报警设备线路需要相匹配,报警设备编号与台账数据信息需要匹配等。等待报警类型提取确认,查看是否存在明显误报信息如图1所示。
2.2 数据真实性校验
使用基于决策树的专家系统判别错误原因,判别规则流程如图2所示,越线比例安装大、中、小三个维度来划分,持续时间按长、短两个维度来划分,其中规则中的“大”、“中”、“小”、“长”和“短”等词语使用明确的阈值替代。排查工作集从越线比例大小、持续发生时间长短、是否断续出现、是否有高供高计和高供低计混乱。
拟使用分类和回归书(CART)模型来训练阈值。CART描述如:用s表示阈值,t表示节点位置,则s的优劣衡量为:其中tL,tR为t的左/右子节点,其中,PL代表左子节点的记录数占训练集的记录数比例,PR代表右子节点的记录数占训练集的记录数比例,P(j|tL)表示在tL处,j类的记录数占节点的记录数的比例,P(j|tR)表示在tR处,j类的记录数占节点的记录数的比例,使用Φ(s|t)取得最大值的划分阈值作为本条规则的阈值。
2.3 数据修正
当配电变压器重过载报警,负载超限60%,持续发生30分钟阈值大于12h,时常出现断续,利用分类决策树算法进行数据分析和过滤,如果没有超限,将数据写入修正工单如图3所示。
2.4 数据驳回
当越限比例阈值大于130%,持续时间大于16h,采用分类决策树算法,如果没有断续出现,变比未及时更新,将数据驳回进行手工排查如图4所示。
3 结语
本文提出基于分类决策树对电网配变不匹配问题的故障诊断算法,从数据质量检查、数据真实性校验、数据修正和数据驳回四个步骤实现了电网配变不匹配问题的快速诊断和定位。该故障诊断流程包括分类决策树的建立、剪枝与测试。与其他分类算法相比,分类决策树不需要参数假设,且准确率较。
参考文献
[1] 刘少宇,郭宗军,董明,等.专家系统在变电站设备诊断中的应用[J].高电压技术,2001(5):17-19.
[2] 陈长征,勾轶,王毅,等.基于遗传神经网络的汽轮发电机组故障诊断研究[J].高电压技术,2003(8):1-2+25.
[3] 颜景斌,夏赛,王飞,等.基于改进遗传算法的有源配电网故障定位分析[J].电力系统及其自动化学报,2019(6):107-112.
[4] 刘栋,陈允平,沈广,等.基于UML和Petri网的电力系统恢复模型[J].高电压技术,2006(6):90-93+121.
[5] 焦亚男,马杰.一种改进的MEP决策树剪枝算法[J].河北工业大学学报,2019(6):24-29.
[6] 王英英,罗毅,涂光瑜.基于粗糙集与决策树的配电网故障诊断方法[J].高电压技术,2008(4):794-798.
[7] 中国电力科学研究院,国家电网公司,国网辽宁省电力有限公司沈阳供电公司.基于复杂事件处理技术和决策树的配电网态势感知方法:CN201610237515.2[P].2016-09-07.
[8] 马春雷,丁健,陈宣林,等.基于决策树自标识的主动配电网状态估计算法[J].電力大数据,2019(5):26-32.
[9] 陈思翰.试析智能配电网技术在配电网中的应用[J].大科技,2019(35):101.