APP下载

基于DCAE-KSSELM的变压器故障诊断方法

2022-03-02郝玲玲朱永利王永正

中国电力 2022年2期
关键词:学习机编码器故障诊断

郝玲玲,朱永利,王永正

(1. 华北电力大学 控制与计算机工程学院,河北 保定 071003;2. 国能网信科技(北京)有限公司,北京 100096;3. 中国科学院 计算机网络信息中心,北京 100190)

0 引言

变压器作为电力系统中的重要设备,其运行状态直接影响整个系统的安全水平。对变压器故障进行有效诊断很有必要[1]。目前油中溶解气体分析 (dissolved gas analysis, DGA)[2-3]技术是判别油浸式变压器故障诊断的常用方法,而基于DGA的变压器故障诊断常用的智能方法有支持向量机(support vector machine, SVM)[4-6]、人工神经网络(artificial neural network,ANN)[7-9]和极限学习机(extreme learning machine,ELM)[10]等,但这些方法都是用有标签样本测试的,因此,如何有效地利用无标签样本成为重要问题。

文献[11]中将深度自编码网络应用于变压器故障诊断中,用无标签和有标签样本进行训练和微调,诊断精度高于多层前馈(back propagation,BP)神经网络;文献[12]将堆栈降噪自编码器应用于变压器故障诊断中,通过对原始数据添加噪声的方法提高了分类准确率,鲁棒性较好;文献[13]利用粒子群算法优化极限学习机参数并应用于变压器故障诊断中,诊断效果良好但不适用无标签数据;文献[14]将自编码网络与极限学习机相结合应用于变压器故障诊断中,诊断效果较好;文献[15]将降噪自编码网络与极限学习机相结合构成深度降噪极限学习机,该模型诊断准确率较高。

鉴于此,本文将深度收缩自编码器(DCAE)与核半监督极限学习机(KSSELM)相结合应用于变压器故障诊断中。其中,收缩自编码器(CAE)是在自动编码器(AE)的基础上,加入了雅克比矩阵,增加了网络的鲁棒性,提高了特征提取能力;KSSELM是在半监督极限学习机(SSELM)的基础上将其隐含层的激活函数改为正定核函数,提高了网络稳定性。DCAE是由多层CAE构成的神经网络,利用无标签样本逐层训练,之后用有标签样本数据对深度收缩自编码器与核半监督极限学习机(DCAE-KSSELM)混合网络参数微调后得到网络模型,最后将有标签样本与无标签样本一起作为混合网络的输入,得出实验结果。

1 DGA故障诊断原理

DGA技术是根据油浸式变压器在运行过程中产生的气体含量来对变压器故障进行预测的方法,其中主要包含5种气体:氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)和乙炔(C2H2),当变压器发生故障时,气体含量以及产生速率也会发生变化。

因此,可以将DGA中5种气体的含量作为故障诊断的依据。本文对变压器的故障状态进行编码,包含正常情况在内共有6种状态,如表1所示。

表1 变压器状态编码Table 1 Transformer state coding

2 基于DCAE-KSSELM的故障诊断

2.1 深度收缩自编码器

2006年,文献[16]提出了深度学习的思想,之后,文献[17]为了提高AE的鲁棒性,提出了收缩自编码器[18],比AE的鲁棒性更好,本文采用的深度收缩自编码网络由多个CAE叠加构成的。

2.2 核半监督极限学习机

半监督极限学习机[19-21]是在极限学习机[22-24]基础上利用无标签与有标签样本一起训练的新网络模型。SSELM的稳定性较差在一定程度上是由于随机给定的权值和阈值造成的。本文在SSELM基础上引入了核函数。根据核理论,当隐含层输出值不可知时,可以用核矩阵Ω表示,即

式中:xi为第i个样本的输入向量;xj为第j个样本的输入向量;K(xi,xj)为满足Mercer定理的正定核函数,可选用线性函数、高斯核函数等SVM中常用的核函数。

核半监督极限学习机[25]可表达为

式中:Y为目标矩阵;I为l+u维的单位阵;l和u分别为有标签样本和无标签样本的数量;C为惩罚系数;λ为权衡系数;L为有标签样本与无标签样本共同构成的拉普拉斯矩阵;为强化的训练目标矩阵。

此时,KSSELM分类性能受惩罚系数C及相应的核函数参数的影响,与隐含层节点数、权值以及激活函数均无关,提高了分类的稳定性。

2.3 基于DCAE-KSSELM的故障诊断

DCAE网络是基于无标签样本训练的网络,能够较好地提取出样本中的特征,本文结合KSSELM模型进行故障诊断,具体诊断流程为:首先用部分无标签样本数据训练DCAE网络,然后用一部分有标签样本输入到DCAE-KSSELM混合网络中,调整网络参数,最后将剩余的无标签与有标签样本数据一起输入到混合网络中,并对输出的故障诊断结果进行评价。故障诊断流程,如图1所示。

图1 故障诊断流程Fig. 1 Fault diagnosis flow

3 实验与结果分析

3.1 数据预处理

本文使用的样本数据来源于某单位提供的同一型号的变压器发生故障前后油中溶解气体含量的数据集,共包含无标签样本数据1 500组和有标签样本数据360组,把无标签样本中的750组数据作为DCAE网络的训练集,然后用180组有标签样本数据对DCAE-KSSELM网络参数进行微调,最后将剩余的750组无标签样本数据与180组有标签样本数据作为DCAE-KSSELM网络的测试集。

根据DGA数据特点,选取H2、CH4、C2H6、C2H4和C2H2这5种气体的含量作为DCAE网络的输入项。在每升气体中,有标签特征气体样本含量,如表2所示。因为气体含量差异较大,所以需进行标准化处理。

表2 有标签特征气体样本Table 2 Labeled gas samples

3.2 参数测试与分析

本文选用的编程环境为 Matlab R2016 a,硬件环境为Lenovo,处理器为i5-7300,运行内存为8 GB,操作系统为 64 位 Win10。

首先,对DCAE网络中参数进行设置:最大迭代次数为1 000,学习率为0.01,网络连接权重W和偏置系数b都是服从正态分布的随机较小数值。

针对DCAE网络中的隐含层层数和节点进行实验如下。

(1)隐含层节点数。设定DCAE网络隐含层层数为1,隐含层节点数为0~100时,对比网络输出的均方根误差(RMSE)的值,其中,用DGA数据中的750组无标签样本数据进行实验,实验结果,如图2所示。

图2 隐含层节点数与RMSE的关系Fig. 2 Relation between number of hidden layer nodes and RMSE

从图2中可以看出,当隐含层节点数在0~30时,RMSE的值下降趋势十分明显;隐含层节点数在31~59时,RMSE的值下降趋势较为缓慢;而当隐含层节点数>60时,RMSE的值几乎不变且有上升趋势。因此,选定的隐含层节点数为60。

(2)隐含层层数。设DCAE的隐含层层数为1~7,对应节点数依次为:60、30、15、8、4、2、1。实验结果,如图3所示。

图3 隐含层层数与RMSE的关系Fig. 3 Relation between RMSE and hidden layer number

同样用DGA数据中的750组无标签样本数据进行实验,得到网络输出的均方根误差(RMSE)。从图3中可以看出, 当隐含层层数大于3时,RMSE的值趋于稳定,因此在综合考虑故障诊断准确率与计算效率之后,本文选用的隐含层层数为3层,各隐含层节点数分别为:60、30、15。

其次,对KSSELM网络中的核函数进行选择。设定核函数为一次线性、二次多项式和高斯径向基 (radial basis function,RBF)核函数 3 种。然后用750组无标签样本和180组有标签样本对KSSELM网络进行测试,其中,RBF核函数参数Gamma为0.008,惩罚系数C为80。

3种不同核函数的分类效果对比,如表3所示。从表3中可以看出,当样本数量完全相同时,选用RBF核函数的KSSELM网络的分类效果最好。当核函数相同时,随着样本数量的增加,网络的分类准确率均有所提高。

表3 3种不同核函数的分类效果对比Table 3 Comparison of classification effects of three different kernel functions

3.3 结果测试与分析

本文首先对比了在同等隐含层层数、隐含层节点数以及其他参数情况下深度收缩自编码器与深度自编码器的RMSE的值,如图4所示。

图4 2种自编码器的RMSE值对比Fig. 4 Comparison of RMSE values of two kinds of AE

实验选用的样本数据为DGA数据中的750组无标签样本数据。从图4中可以看出,随着隐含层节点数的增加,2种网络的RMSE的值均在下降,但是DCAE网络的RMSE的值始终都比深度自编码网络的RMSE值低,表明DCAE网络输出的样本特征比深度自编码网络更接近于输入值。

用180组有标签样本数据调整DCA EKSSELM网络参数,最后用另外750组无标签样本数据和180组有标签样本数据作为测试集测试DCAE-KSSELM网络的准确度,同时为了对比实验效果,本文将DCAE-KSSELM网络分别与DCAE-SSELM网络、KSSELM网络、SSELM网络以及常用的SVM和BP神经网络进行对比。

DCAE网络参数的设置不变,SSELM网络中隐含层节点数等参数设置与KSSELM网络相同,SVM的核函数选用RBF核函数,惩罚系数C和参数Gamma的值与KSSELM网络中的值也相同,BP神经网络最大迭代次数设为1 000,学习率设为0.01,分类结果取的是多次实验的平均值,平均诊断精度,如表4所示。

表4 不同方法故障诊断精度比较Table 4 Comparison of fault diagnosis accuracy of different methods

从表4中可以看出,基于DCAE-KSSELM网络与DCAE-SSELM网络的故障诊断精度相对较高,但是本文提出的DCAE-KSSELM网络的稳定性更高,在多次实验过程中诊断结果相差不大,而且不用随机给定隐含层参数,训练速度快,且能利用无标签样本数据进行训练,效果更好。

4 结语

本文提出了一种基于深度收缩自编码网络与核半监督极限学习机相结合的变压器故障诊断方法,可以充分利用无标签样本和少量有标签样本数据进行实验,而且实验结果表明该方法稳定性好,特征提取能力强,诊断准确率高于SVM、BP神经网络等算法,是一种有效的变压器故障诊断方法。

猜你喜欢

学习机编码器故障诊断
融合CNN和Transformer编码器的变声语音鉴别与还原
基于包络解调原理的低转速滚动轴承故障诊断
设定多圈绝对值编码器当前圈数的方法
“机”关
转炉系统常用编码器选型及调试
舞台机械技术与设备系列谈(二)
——编码器
基于随机权重粒子群优化极限学习机的土壤湿度预测
数控机床电气系统的故障诊断与维修
基于改进极限学习机的光谱定量建模方法
基于量子万有引力搜索的SVM自驾故障诊断