基于知识图谱的变压器匝间短路故障辨识研究
2024-05-07查易艺张明明
查易艺,王 翀,张明明
(国网江苏省电力有限公司信息通信分公司,江苏 南京 210000)
0 引言
变压器具有电力运输、电压转换与电能分配的作用,是保证电力系统正常运行的重要组成部分之一。匝间短路故障往往发生在变压器故障初期。其故障程度轻且不易被准确识别。一旦没有及时处理,故障会迅速扩大,从而造成严重的安全运行问题。现阶段的变压器匝间故障自动辨识方法存在辨识不及时、辨识效果不佳的问题。数据挖掘技术的发展可解决传统方法中故障辨识不及时的问题。为了获取更好的变压器匝间故障自动辨识效果[1-2],相关学者提出了一些方法。
马鑫等[3]首先通过回溯算法提高残差收缩网络的完整性;其次通过权重交叉熵函数提高残差收缩网络的精度;最后基于数据特征增强方法结合优化后的残差收缩网络模型完成变压器短路故障的自动辨识。该方法存在故障辨识错误率较高的问题。张嗣铂[4]提出电力变压器故障自动化检修技术,并利用核主成分分析方法实现了对变压器故障的自动辨识。但该方法存在故障辨别不及时的问题。曹伟嘉等[5]首先通过改进遗传算法-极端梯度提升,提取变压器诊断故障特征向量;其次采用遗传算法实现对电力系统分级故障的建模;最后通过改进遗传算法优化变压器故障诊断模型并完成短路故障自动辨识。但该方法存在变压器短路故障辨识精度低的问题。
为了解决上述方法中存在的问题,本文提出基于知识图谱的变压器匝间短路故障辨识方法。该方法首先根据柔性策略,对变压器数据进行采集,并根据实际运行情况和数据采集目标需求调整采集量和时间间隔;然后利用采集到的数据构建知识图谱,提取知识图谱中故障样本特征,输入到你只看一次(you only look once,YOLO)v4检测模型中,以完成变压器匝间短路故障的自动辨识。试验结果表明,该方法的准确率、召回率和F值均较高,具有较好的自动辨别效果。
1 变压器故障关联数据采集
通过传感器配合柔性策略采集变压器数据,可以提高数据采集的准确性[6-7]。为解决传统采集策略造成大量冗余数据且故障数据难以区分的问题,本文使用柔性策略采集变压器实时数据。柔性策略即根据实际运行情况及数据采集目标需求,调整数据采集量及时间间隔等,以实现最终的数据采集。
(1)
式中:go为区间内第o个采样点的采样数据;l为采集区间。
第二重判断指标采用移动平均法判断。变压器设备有瞬时干扰、不可回复性两种特殊状态。根据设备状态量Δg1的计算,排除瞬时干扰。
(2)
式中:go-1为区间内第(o-1)个采样点的采样数据。此时采集间隔时间不变,将区间内的一个数据作为目标准则,以判断之后的数据是否存在数据波动。
设备状态不可回复性可通过设备另一状态量Δg2的计算完成。
(3)
式中:go-2为区间内第(o-2)个采样点的采样数据。此时,变压器数据采集间隔不需发生改变。根据变压器数据变化量完成数据波动程度的判定,减少了数据采集时间。同时,两种特殊设备状态减少了对数据采集间隔的干扰,提高了数据采集精度。
(4)
式中:m为原始数据变化的上限值。
本文依据最大变化量、最小变化量设计应激调整方案。具体步骤如下。
(1)当ζmin≤Δgo≤ζmax时,变压器数据采集间隔不变。
(2)判断设备是否处于如下三种特殊状态。
①当ζmin≤Δg1≤ζmax时,变压器数据采集间隔不变。
②当Δg1>ζmax且Δg2>ζmax时,降低变压器采集间隔。
③当Δgo≤ζmax时,实行步骤(3)。
(3)判断变压器是否处于如下两种特殊状态。
①当ζmin≤Δg1≤ζmax或ζmin≤Δg2≤ζmax时,变压器数据采集间隔不变。
②当Δg1<ζmax且Δg2<ζmax时,增大变压器采集间隔。
基于以上步骤,本文完成变压器数据的采集。
2 故障关联知识图谱的构建
故障关联知识图谱的构建过程如下。
①通过采集到的变压器数据,构建面向变压器故障辨识的知识图谱[8-9]。本文选择自上而下的知识图谱构建方法。该方法分为本体构建、实体抽取、关系抽取和图谱构建四个步骤[10-11]。
面向变压器匝间短路故障自动辨别的知识图谱本体可根据专家先验知识获取,并将本体作为实体抽取和关系抽取的规范准则,完成变压器知识图谱的实体抽取。实体抽取的对象为非结构数据。实体抽取选取原始语料,并将其划分为训练集和测试集两个部分,以分析原始语料中字符的实体信息;以原始语料作为训练集的输入,使用训练集标注标签结果。
语料抽取标签和人工标注标签的准确率一致,均为A。
(5)
式中:YA为实际正确并且预测正确的数据量,个,GA为实际正确但预测错误的数据量,个。
语料抽取标签和人工标注标签的召回率一致,均为R。
(6)
式中:GM为实际错误但被预测为正确的数据量,个。
知识图谱构建步骤如图1所示。
图1 知识图谱构建步骤
②根据训练集训练效果评估完成实体抽取。针对变压器匝间短路故障的自动识别,本文采用了一种基于注意力机制的双向长短期记忆网络算法,以实现对故障的自动辨识。注意力机制模型包含注意力概率分布和注意力分布最终特征计算两个部分。对于最终状态,本文设输入序列元素个数为M,则n时刻的输出数据注意力概率sm为:
(7)
式中:jn为双向隐藏层状态值;I为权重矩阵;T为类别标签数量,个;G为特征向量。
注意力分布的最终特征Gatt为:
(8)
经softmax函数获取输入注意力机制的数据特征向量分类标签的概率分布u为:
(9)
式中:G′att(o)为第o个注意力分布的最终特征分量;G′att(k)为第k个注意力分布的最终特征分量;B为模型输出层权重矩阵。
交叉熵损失函数R(U,u)的表达式为:
R(U,u)=U×lg(u)
(10)
式中:U为真实类别分布。
③根据R(U,u)构建非结构化知识的实体关系,以抽取构建知识图谱。Neo4j是一种高度可扩展、基于图的数据库管理系统,以节点和边的形式存储数据,并允许使用索引快速查询。存储原生图数据的Neo4j可通过遍历图数据以避免节点查询算法。Neo4j具有高性能及敏捷性。在Neo4j中,每个节点都可以包含任意数量的属性。这些属性可以通过键值对的方式进行存储。节点之间的关系通过边来表示。每条边都可以包含任意数量的属性,并且可以指定方向和权重。通过这种方式,Neo4j能够清晰、直观地表示出数据的结构和关系。Neo4j提供了清晰、直观的数据存储和查询方式,可以快速、高效地进行实体关系抽取和知识图谱构建。
3 变压器短路故障自动辨识方法设计
本文将上述构建的面向变压器故障辨识的知识图谱与YOLOv4检测模型相结合,完成变压器短路故障自动辨识[12]。本文提取知识图谱故障样本的特征,将其输入到YOLOv4检测模型中,以实现变压器故障识别。YOLOv4检测模型是一种运行速度快的回归功能实现模型,是通过对YOLO模型的跨阶段局部网络改造和金字塔池化优化而来的,具有更好的特征提取能力和特征融合能力。
本文设置信度误差为Zconf,则阈值函数Z为:
Z=(Zloe+Zels+Zconf)×R(U,u)
(11)
式中:Zloe为回归框预测阈值;Zels为分类阈值。
本文假设两框中心点的知识图谱关联注意力距离为σ2(Sctr,Nctr)、两框最小封闭区域的知识图谱类间距注意力距离为q,则Zloe为:
(12)
式中:OPI(S,N)为预测框S和真实框N的交并比;ehy、e分别为真实框和预测框的宽度,m;jhy、j分别为真实框和预测框的高度,m。
(13)
4 试验与分析
为了验证基于知识图谱的变压器匝间短路故障自动辨识方法的有效性,本文完成以下测试。本文在计算机系统上使用Simulink软件搭建变压器匝间短路模型。
本文采用基于知识图谱的变压器匝间短路故障辨识方法(所提方法)、基于数据特征增强和残差收缩网络的变压器匝间短路故障辨识方法(文献[3]方法)和基于核主成分分析的电力变压器故障自动化检修技术(文献[4]方法)完成试验。
变压器匝间短路模型如图2所示。
图2 变压器匝间短路模型
4.1 故障响应特征曲线
本文设置匝1、匝2、匝3短路故障,采用所提方法、文献[3]方法和文献[4]方法完成变压器匝间短路故障检测,并记录变压器匝间短路响应特征曲线。
匝1、匝2和匝3短路故障响应特征曲线分别如图3、图4和图5所示。
图3 匝1短路故障响应特征曲线
图4 匝2短路故障响应特征曲线
图5 匝3短路故障响应特征曲线
由图3~图5可知,文献[3]方法和文献[4]方法在匝1、匝2和匝3的短路故障时,响应特征曲线较匝间短路和无匝间短路故障曲线偏离较大。所提方法在匝1、匝2和匝3的短路故障时,响应特征曲线与匝间短路故障曲线较为接近。该结果表明,所提方法可以较好地检测到变压器匝间短路故障。其原因是所提方法通过采集到的变压器数据构建面向变压器故障辨识的知识图谱,并选择自上而下的知识图谱构建方法。该方法分为本体构建、实体抽取、关系抽取和图谱构建四个步骤,有利于较好地检查变压器匝间短路故障。
4.2 准确率、召回率、F值
本文引入准确率、召回率、F值三个指标评估所提方法、文献[3]方法和文献[4]方法的故障自动辨别性能。
F值是一种衡量变压器匝间短路故障自动辨识精度的指标,在计算过程中综合了辨识方法的准确率和召回率两个指标,具有综合性和平衡性的特点。
F值为:
(14)
通过F值的计算,可以判断故障自动辨别性能是否具有全面性。采用三种方法完成变压器匝间短路故障检测,得到三种方法的检测准确率、召回率、F值的结果如表1所示。
表1 三种方法的检测准确率、召回率、F值的结果
分析表1可知,所提方法的变压器匝间短路故障检测准确率、召回率和F值均高于文献[3]方法、文献[4]方法,表明所提方法的变压器短路故障自动辨识效果更佳。其原因是所提方法对非结构数据实行实体抽取。所提方法选取原始语料,并将其划分为训练集和测试集两个部分,以分析语料中字符的实体信息。以原始语料作为训练集的输入、标签使用训练集标注结果,在一定程度上有利于提高变压器短路故障自动辨识效果。
通过上述试验可知,所提方法通过知识图谱的构建,提高了变压器故障检测准确率;通过YOLOv4检测模型与知识图谱结合的检测方法,提高了变压器匝间短路故障自动辨识性能。
5 结论
变压器匝间短路故障影响着电力系统的运行情况,对变压器实行故障自动辨识检测是发展趋势。因此,本文提出基于知识图谱的变压器匝间短路故障辨识方法。本文首先采集变压器数据;其次构建面向变压器匝间短路故障自动辨识的知识图谱;最后将知识图谱与检测模型结合,以完成变压器匝间短路故障的自动辨识。通过研究可知,所提方法的准确率、召回率和F值均较高。该方法解决了传统方法中存在的问题,具有重要的现实意义。