基于机器学习的继电保护故障诊断和分类研究*
2021-11-22王晓丽孙晓莉
王晓丽,孙晓莉
(甘肃机电职业技术学院,甘肃天水741001)
电力系统各元件在实际运行过程中由于外力、过负荷、内部绝缘老化、误操作、设计缺陷和自然环境等原因导致异常运行,最终发生如短路和断路等故障[1-3]。故障状态不仅破坏自身系统中其他正常运行的元件,还有可能造成其他级联系统中生产设备和人身安全的损害。因此,设置继电保护装置将有利于及时准确的恢复故障[4-6]。
传统继电保护系统使用单一系统阈值判定方法进行异常检测。该方法有三个方面的局限性:一是依赖单一系统的数据精度;二是难以检测出设备的潜伏性故障及故障类别;三是特定工况下准确率无法得到保障[7-9]。
近年来,随着继电保护系统计算机化、数据化和网络化,大量状态数据呈现体量大和类型繁多等特点,依赖大数据集的机器学习算法为继电保护故障诊断和分类带来了机遇[10-12]。
机器学习(ML)的本质在于寻找输入与输出之间的最佳映射,其在继电保护故障诊断和分类中的内涵为继电保护网络中各节点的状态数据与电力系统运行状态的最佳配对。ML算法主要分为有监督学习和无监督学习两种模式。无监督模式直接使用网络节点中的状态数据进行学习,有监督模式需要构建带有系统状态标识的数据集[13]。
综上,本文提出一种基于带分类评价的有监督机器学习的继电保护故障诊断方法。通过模拟网络节点状态数据,计算出系统的运行状态,并给出该状态的致信度。
1 继电保护故障数据集
电力系统元件故障主要包括三类,即电力输电线路故障、母线故障和电力变压器故障。其中电力输电线路故障包含短路和断路故障,短路故障中又包含相与相短路和相与地短路,短路故障是由闪络等原因造成的绝缘子的破坏。归纳为表1所示。
表1 电力输电线路故障
母线故障多为短路故障,其中接地和相间短路居多,母线故障是由绝缘子对地放电等原因造成。
电力变压器故障分为油箱内故障和油箱外故障两种,总结为表2所示。
表2 电力变压器故障
集成式或分布式继电保护网络通过电压、电流和其他传感器将电力系统各元件的数据汇总到录波装置,借助子站通信接口将数据汇入主站。示意图如图1所示。
图1 继电保护网络数据接入示意图
利用主站采样和过程数据,形成特征值数据集和预期结果数据集,通过数据分析手段,提取利于构建数据集特征和状态标识的关键因素。构建过程如图2所示。
图2 数据集特征值和状态量构建示意图
特征值由峰值电压电流等组成,经过二次处理,形成最终特征值;状态标识由是否产生故障和故障类型经编码后组成。
经过以上数据集构建过程,最终形成多传感器信息和故障状态组成的特征矩阵。若数据集包含N条记录,包含M个特征,K个状态,则数据集Y表示为特征X与状态S的矩阵如式(1)所示。
将其展开表示为式(2)。
式中:n=1,2,…,N k=1,2,…,K m=1,2,…,M
2 机器学习分类算法
LDA(Linear Discriminant Analysis)是一种从高维空间投影到低维空间的分析方法。针对具有K个特征向量,C类故障状态的数据集,定义m个采样值的X为训练集,Y为降维结果,W为降维矩阵,则LDA算法可表示为式(3)。
LDA算法将具有C类的继电保护状态训练集数据投影到C-1维空间,投影的数据服从高斯分布,则根据投影后的数据对应数学期望和方差可求得投影后的概率密度函数(PDF),示意图如图3所示。对测试集数据同样进行投影后,根据其分布,可得到测试数据中继电保护故障的类型和致信度。
图3 概率密度函数示意图
3 基于ML的故障诊断和分类
大规模的继电保护装置形成的数据集可近似看作服从高斯分布的随机变量,通过模拟数据对基于LDA的ML算法做出验证。数据模拟方法使用Box Muller变换,该方法是通过服从均匀分布的随机变量,来构建服从高斯分布的随机变量。具体描述为服从[0,1]上均匀分布的随机变量和,X满足
则,X服从均值为0,方差为1的高斯分布。
故障诊断和分类算法验证流程如图4所示。
图4 算法验证流程图
验证流程如下:
第一步:以期望值为[3,13],[2.5,1.5]和[12,10];方差为[5,-1;-3,3],[4,0;0,4]和[3.5,1;3,2.5]模拟三组状态数据,分别代表无故障,故障类型I和故障类型II。如图5所示。
图5 状态数据模拟
第二步:使用训练集计算最大特征值为3834,其对应的特征向量为[0.7821,0.6232]。
第三步:使用测试集计算PDF,如图6所示。
图6 三种类型数据对应的PDF
第四步:根据概率密度函数,计算致信度。见表3所示。
表3 故障类型分类致信度
4 结论
通过对大规模集成式电力系统继电保护装置录波系统的分析,构建了对应期望和方差的高斯分布的数据统计模型。并基于模型形成数据训练集和测试集,分析了基于Fisher判别式的线性判别方法原理,阐述了线性判别分类原理在继电保护诊断与分类中的映射关系,提出了基于概率密度函数的致信度形成方式。最终,基于数据集验证了机器学习算法在继电保护故障诊断和分类中的应用。