基于人工神经网络的智能变电站保护系统故障诊断
2023-09-22王洪彬黄睿灵周念成
王洪彬, 何 荷, 黄睿灵, 高 鹏, 周念成, 任 博
(1. 国网重庆市电力公司电力科学研究院, 重庆 401123; 2. 重庆理工大学电气与电子工程学院, 重庆 400054; 3.国网重庆市电力公司丰都供电分公司, 重庆 408200; 4. 输配电装备及系统安全与新技术国家重点实验室(重庆大学), 重庆 400044)
1 引言
区别于常规变电站,智能变电站的主要特点是网络化的二次部分[1,2]。作为二次部分的核心,安全可靠的保护系统支撑着电网的稳定运行。现如今针对保护系统的故障诊断仍依赖于网络报文和过往经验判断缺陷位置[3]。但随着站内设备智能化程度的不断提升,缺乏有效的数据分析方法处理海量的故障信息极容易导致重要的特征被遗漏,因此难以实现精确识别保护系统中发生的故障。
传统的故障分析方法中,文献[4]基于采样值(Sample Value, SV)报文和变电站事件 (Generic Object Oriented Substation Event, GOOSE)报文的传输机制,结合Petri网模型判断常见的保护系统故障,但针对结构复杂的智能变电站,人工搭建模型带来了庞大的工作量,使得此方法成本较高;文献[5-8]基于全站配置描述文件(Substation Configuration Description, SCD)实现保护系统的故障诊断,值得注意是,现有智能变电站的集成方式和配置工具与厂商密切相关,这使得不同变电站的SCD文件不具备规范性,此外保护系统可采用多种拓扑结构,除常见的“直采直跳”外,还有“网采直跳”和“网采网跳”,因此基于SCD文件的方法不具备通用性;文献[9]充分挖掘网络分析装置的信息流处理功能,通过配置保护系统与关键报文的对应关系判断设备运行状态,但仅能辨识装置故障,难以发现保护系统中的通信链路问题。
随着人工智能的不断发展,其应用于智能变电站保护系统的研究也在不断深入。文献[10]提出融合学习的方法评估保护系统的运行状态,虽然在评估过程中考虑到了影响保护系统运行的多方面因素,但权重取值主观性较强的问题仍未得到有效解决;文献[11]基于深度神经网络(Deep Neural Network, DNN)提出智能变电站通信网络故障分析方法,文献[12]基于循环神经网络(Recurrent Neural Network, RNN)提出智能变电站二次设备故障分析方法,上述2篇文献分别研究了通信网络和二次设备的状态感知,但针对保护系统整体的故障诊断仍有待开展。
综上所述,当前智能变电站保护系统的故障诊断方法主要存在以下问题:
(1)保护系统配置了多种二次装置,导致出现的故障类型复杂多样,但能直接诊断故障的特征较少,且依靠传统方法很难寻找故障特征间的关联。
(2)间隔内以及间隔间二次设备的广泛连接使得通信网络日趋复杂,故障时将会产生海量特征信息,但现有方法无法快速分析。
针对上述问题,本文提出了基于人工神经网络(Artificial Neural Network, ANN)的保护系统故障诊断方法,从人工智能的角度为保护系统的稳定运行构筑新的防线。首先基于保护系统内不同装置插件故障时的特征信息,得到了故障诊断所必备的推理知识库;其次结合保护系统内报文的发布/订阅关系、装置的自检信息和交换机端口的流量状态提出了故障特征信息的表征方式;最后结合人工神经网络搭建保护系统故障诊断模型并给出具体步骤;根据某110 kV智能变电站保护系统的数据样本,实例验证了本文所提方法的有效性。
2 保护系统的故障特征
当前智能变电站二次系统中绝大部分设备均配置了网络通信和在线自检功能[13],因此仅需通过网络分析装置和交换机捕捉关键特征信息即可获悉保护系统的运行状态。关于保护系统的故障诊断目标,本文根据实际变电站的保护信息流传输过程,选取线路间隔保护装置、母线间隔保护装置、变压器间隔保护装置以及光纤链路作为主要研究对象。
2.1 故障推理知识库
当某间隔保护装置的不同插件发生故障时,将产生不同类型的告警报文[14],报文信息分析作为故障诊断模型中的重要环节,需要梳理出其与故障插件之间的映射关系,通过查阅相关技术规范和现场运行资料,列出主要的推理规则见表1。
表1 保护系统故障诊断推理知识库
2.2 故障特征的表征方式
当不同保护装置或其间的通信网络发生故障时,保护系统内将产生不同的特征信息。利用这些特征信息组成的集合Xi即可描述保护系统的故障状态,如式(1)所示:
Xi=[XSPiXSTiXFLi]
(1)
式中,Xi为第i(i=1,2,…,N)个故障样本的特征信息集合,包括SV报文和GOOSE报文的发布/订阅关系XSPi、各间隔内保护装置的自检信息XSTi、关键交换机节点的流量状态XFLi;N为故障样本总数。
XSP综合了与保护信息传输相关的测控装置、合并单元、智能终端、线路/变压器/母线保护装置的SV报文和GOOSE报文的接收状态,如式(2)所示:
(2)
式中,D1~Dz为接入保护系统的z个二次设备,由前述测控装置、合并单元等组成;Dj为设备j(j=1,2,…,z)订阅的SV/GOOSE报文的接收状态;t为设备j订阅的报文总数,若设备j未能成功接收其订阅的报文x(x=1,2,…,t),则向系统广播断链信息,此时Mjx=1,否则Mjx=0。
XST综合了线路保护装置、变压器保护装置和母线保护装置的自检信息,如式(3)所示:
(3)
式中,XLP、XTP、XBP分别为线路保护装置、变压器保护装置和母线保护装置的自检信息集合;下标k、m和n分别为二次系统中线路保护装置、变压器保护装置和母线保护装置的总数;XLPα、XTPβ和XBPγ分别为第α(α=1,2,…,k)个线路保护装置、第β(β=1,2,…,m)个变压器保护装置和第γ(γ=1,2,…,n)个母线保护装置的自检信息,包括存储器错误EM、开入开出异常EIO等表1所列特征,若运行时监控后台收到某一特征信息,则该信息所对应的位置元素置为1,否则为0。
XFL综合了保护系统中交换机端口的流量状态,如式(4)所示:
(4)
式中,下标nt为保护系统中通信交换机的总数;Sc为第c(c=1,2,…,n)台交换机的流量状态;Pj为第c台交换机端口j(j=1,2,…,w)的流量状态,包含流经此端口的m条报文的流量信息F,若在运行过程中流经端口j的报文e的流量过低(以正常运行时最小流量值的10%作为阈值),则Fe=1,若流量正常,则Fe=0。
3 基于ANN的保护系统故障诊断模型
由前述可知,智能变电站保护系统故障时不仅会产生大量的故障信息,而且数据维度极高,为了能快速处理故障信息并能准确诊断故障,本文采用ANN建立故障位置与特征信息的映射模型。
ANN的组成包括输入层、隐藏层和输出层,图1展示了典型ANN的拓扑结构[15]。其中,输入层为保护系统故障时采集的特征集合Xi=[x1x2…xp],p为选取的特征数量;输出层为保护系统中可能的故障位置编码Yi=[y1y2…yq],q为可能的故障位置数量,若编号为i的位置发生故障,则yi=1,否则yi=0。
图1 典型ANN的拓扑结构
(5)
在误差的反向传播中,损失函数J用于描述预测输出与真实标签之间的差距,结合保护系统的数据类型,本文选用交叉熵作为损失函数如式(6)所示。通过反向传播算法(Back Propagation, BP)求解损失函数的最小值即可得到神经网络中的权重参数ω和偏倚参数b。
(6)
式中,θ为参数ω和b;N为故障样本总数;tlr为样本的真实标签;ylr为ANN的预测输出;下标l为样本索引;下标r为样本内的数据索引。
为了优化ANN的训练过程并提高模型的泛化能力,本文还引入了Dropout正则化、学习率的指数衰减策略以及适应性矩估计(Adaptive moment estimation, Adam)优化[16]。
4 基于ANN的保护系统故障诊断步骤
基于选定的故障特征和ANN的原理,建立智能变电站保护系统故障定位框架如图2所示。
图2 基于ANN的保护系统故障诊断框架
具体步骤如下:
离线训练阶段中,首先准备包含大量故障样本的结构化数据库,故障样本应涵盖可能的装置插件及光纤链路;其次将故障样本及对应标签送入ANN中进行训练,在信息前向传播和误差反向传播的共同作用下得到权重参数和偏倚参数的值;最后根据训练效果选取超参数组合并保存最优模型。
在线诊断阶段中,为了排除可能出现的极个别错误信息的干扰,避免频繁计算,应设置激活诊断模块的判断过程,当监控后台检测到故障特征信息的总数大于设定的阈值时,则可进入下一步骤,判断过程的阈值应小于数据库中所有样本的故障特征信息总数的最小值;当诊断模块被成功激活后,通过监控后台调取报文接收状态XSP、保护装置自检信息XST和交换机流量状态XFL形成故障特征集X,随后将X送入事先保存的最优ANN模型得到诊断结果。
5 算例分析
5.1 算例简介
以典型的110 kV智能变电站为例验证本文所提故障诊断方法的有效性。该智能变电站的二次拓扑结构如图3所示,包括1个母线间隔、2个变压器间隔和2个线路间隔,每个间隔内均配置了必要的合并单元、保护装置、智能终端、测控装置和交换机;保护信息流的传输方式为“网采网跳”;图3中已给出各设备名称、端口编号和链路编号;解析SCD文件得到的SV/GOOSE报文见表2。
图3 110 kV智能变电站保护系统拓扑结构
表2 SV/GOOSE报文
5.2 ANN模型的搭建及优化
如图3所示,依据表1、表2选择的故障特征和式(2)~式(4)的表征方式可知,报文接收状态XSP包含102个元素,保护装置自检信息XST包含133个元素,交换机流量状态XFL包含179个元素,因此ANN输入层的神经元数量设置为414;依据前述故障诊断对象可知,图3中5个间隔内保护装置包含的30个插件和30条光纤链路均为可能的故障位置,因此ANN输出层的神经元数量设置为60。
通过在实验环境中模拟故障以获取数据样本,在此过程中分别对每个故障位置进行70~90次模拟,共获取4 963组数据样本构成故障样本库。将每个故障位置得到的样本划分为训练集(80%)和测试集(20%)。通过设置不同的超参数优化ANN,以训练过程的准确率作为参考指标,结果如图4和图5所示。
图4 神经元和隐藏层的影响
图5 初始学习率和批处理参数的影响
图4显示当隐藏层的数量为1以及神经元的数量为512时训练效果最优,增加隐藏层的数量和神经元的数量虽然可以快速收敛,但考虑到整个训练过程是离线的,因此更快的收敛速度并不具有很强的吸引力;图5显示当初始学习率α0=0.07以及批处理参数bsize=256时训练效果最优,过大或过小的初始学习率α0将导致最终训练准确率降低,增大批处理参数bsize虽然有助于提高准确率,但增加到一定程度时对准确率的影响将会大幅度减少;综合考虑训练效果、计算负担等多方面因素,最终选择超参数的组合见表3,在此基础上,迭代计算46次后训练准确率可达到96.58%。
表3 最优ANN模型的超参数
5.3 故障诊断结果
为验证本文所提故障诊断方法的泛化能力,调用得到的最优ANN模型用于判断测试集,结果如图6所示。
图6 测试集的验证结果
图6(a)显示ANN模型面对不同间隔的保护装置故障和光纤链路故障均有良好的诊断效果,总体准确率达到97.68%,其中变压器保护装置故障诊断的准确率相对较低,这是由于变压器间隔内二次设备的数量相对较多,保护的信息传输更加复杂。从插件的角度来看,图6(b)显示ANN模型针对各类插件故障均保持93%以上的诊断准确率,其中I/O插件故障、SV插件故障和GOOSE插件故障时的精度相对较低,这是由于在保护信息流的传输过程中,I/O插件、SV插件和GOOSE插件的链接关系十分紧密,导致模型相对容易误分类。
5.4 与现有方法的对比
为比较不同方法的故障诊断效果,引入预测故障与真实故障间的误差作为参考指标,如下所示:
(7)
式中,Y′为真实的故障范围;Y为各种方法预测的故障范围;规定|·|为统计集合内非零元素的数量。
传统的故障诊断方法以文献[9]为例,文献[9]利用两方面特征分析保护系统运行状态,一是对比保护装置的采样值和网络分析装置的采样值;二是分析事先选择的关键报文,具体见表4。结合式(7),使用文献[9]所提方法判断前述测试集的结果见表5。
表4 文献[9]选择的关键报文
表5 与文献[9]的对比
由表5可知,文献[9]仅能正确识别保护装置整体是否发生故障,但如果将故障诊断的目标深入到模块级,则在误差和准确率方面均不如本文所提方法。究其原因,一是仅依靠采样值和选择的关键报文并不能准确描述故障状态;二是未采取有效的数据处理手段,导致无法准确感知特征信息与故障类型间的关联;三是应对光纤链路故障时没有相应的分析方法。
基于人工智能的方法以文献[17]为例,该方法选择三种类型的特征表征故障状态,一是装置自检信息,二是设备端口状态,三是网络流量值。在此基础上,利用图神经网络识别保护系统的故障位置。结合式(7),使用文献[16]所提方法判断前述测试集的结果见表6。
表6 与文献[17]的对比
由表6可知,基于人工智能的方法在故障诊断效果上较传统方法有了大幅度提升,但在选择的特征上,文献[17]并没有囊括可能的装置自检信息,仅选择了53个常见的告警,而本文选择的133个告警能够全方面描述保护系统的运行状态;此外,以发送功率为主的端口状态和网络流量值具有重复性,而本文选择的报文接收状态和交换机流量状态能够产生更好的叠加效果。
6 结论
为提高智能变电站保护系统的运维效率,本文提出了一种基于人工神经网络的智能变电站保护系统故障诊断方法。依据SV/GOOSE报文的发布/订阅关系、保护装置的自检信息以及交换机端口的流量状态提出了故障特征信息的表征方式,结合ANN搭建了故障诊断模型并给出了相应步骤。算例结果表明,本文所提出的基于ANN的保护系统故障诊断模型能够应对海量高维度故障数据,并具有准确识别故障的能力,在独立测试集上的准确率能够达到97.68%。与基于交叉对比的传统方法和基于图神经网络的智能方法相比,本文选择的特征能够更好地描述故障状态,平均误差仅为前述两种方法的1.61%和14.8%。