一种基于深度收缩自编码网络的变压器故障诊断方法
2020-08-13杭颖廖昌义任广为黎楚阳
杭颖 廖昌义 任广为 黎楚阳
摘 要:变压器油中溶解气体方法(Dissolved Gas-in-oil Analysis, DGA)由于其结果直观、操作简单和在线观测等优势,被广泛应用于变压器领域。然而传统的DGA难以充分利用不带故障类别标签的样本信息,导致故障诊断准确率不高。针对此问题,本文提出了一种基于深度收缩自编码(Deep Contractive Auto-Encoder, DCAE)网络的变压器故障诊断方法。首先,将深度收缩自编码网络和分类器组成DCAE分类器,构建基于深度收缩自编码网络的变压器故障诊断模型。其次,考虑工程中存在的数据采样错误情况,选取部分测试样本将其随机置零,研究该模型的容错性。结果表明,所提出的变压器故障诊断模型准确率均高于传统的粒子群优化支持向量机和BP神经网络模型,该模型适用于变压器故障诊断。
关键词:变压器 油中溶解气体分析 故障诊断 深度学习 收缩自编码
中图分类号:TM41 文献标识码:A 文章编号:1674-098X(2020)06(a)-0005-05
Abstract:Dissolved gas-in-oil Analysis (DGA) is widely used in the transformer field due to its advantages such as intuitive results, simple operation and online observation. However, it is difficult for traditional DGA to make full use of the sample information without fault category labels, leading to low fault diagnosis accuracy. To solve this problem, this paper proposes a transformer fault diagnosis method based on deep contractive auto-encoder (DCAE) network. First, the deep contractive auto-encoder and the classifier were combined into DCAE classifier to construct the transformer fault diagnosis model based on the deep contractive auto-encoder and dissolved gas in the transformer oil. Secondly, considering the data sampling error in engineering practice, some test samples are set to zero randomly to study the fault tolerance of the model. Finally, an example analysis shows that the accuracy of the proposed transformer fault diagnosis model is higher than that of the traditional particle swarm optimization support vector machine and BP neural network models. The model is proved to be suitable for transformer fault diagnosis.
Key Words: Power transformer; Dissolved gas-in-oil analysis; Fault diagnosis; Deep learning; Contractive auto-encoder
變压器作为电网变电过程的重要设备,其工作状态与电网安全运行密切相关[1]。变压器随着服役年限的增加,发生故障几率会显著上升,严重故障时可能导致范围性的大面积停电。目前国内存在着许多运行超过20年的油浸式变压器,及早发现这些变压器的故障,准确识别其故障类型,对于保证电网运行的可靠性具有重要意义[2]。变压器运行中因为老化、电、热故障等内部原因产生少量的气体,这些气体溶解于变压器绝缘油中,与变压器的运行状态紧密相关,可用于诊断变压器的状态。基于这个理念,油中溶解气体方法(Dissolved Gas-in-oil Analysis, DGA)在变压器故障诊断领域得到了广泛的应用[3-4]。
由于具有结果直观、操作简单和在线诊断等优势,DGA成为了现场变压器最常用的故障诊断方法[5]。但是,传统的DGA所采用的故障诊断判据主要依靠检修人员的现场经验,容易造成较大的诊断偏差。因此,亟需探索提高变压器故障诊断准确率的新方法。
人工智能(Artificial Intelligence, AI)在建立DGA的不同气体成分含量及比例与变压器故障状态间的复杂非线性关系中具有明显优势,被逐渐应用于变压器故障诊断中,并取得了一定成果。国内外研究人员研究了聚类分析(Clustering Analysis, CA)[6]、人工神经网络(Artficial Neural Network, ANN)[7-8]、支持向量机(Support Vector Machine, SVM)[9]等方法,用于提高变压器故障诊断的准确率。但是这些方法有一定的不足之处。聚类分析只能将故障样本划分成几类,无法识别各类所对应的故障类型;人工神经网络易陷入一定范围内最优;SVM在处理大量数据多分类时,效率较低,核函数和参数较难确定。上述方法由于学习能力、处理效率、特征提取等方面存在先天的不足,在现场推广应用中存在一定的局限性。而深度学习方法具有强大的学习能力,可对复杂的非线性特征进行多层提取,充分利用大量无标签数据。因此,部分文献[10-13]将其引入变压器故障诊断领域。
深度学习(Deep Learning, DL)是一种深层次的机器学习方法,由于具有多层网络提取特征的优势,成为了近年来国内外学者研究的热点[14-17]。目前,深度学习的主要应用领域有:语音识别[18-19]、图像识别技术[20-21]、电力变压器故障诊断等。在深度学习方法中,自编码机(Auto-Encoder,AE)的半监督训练方法特征提取能力强大,不需要对训练样本进行标记,因此在训练变压器故障诊断的大量无标签样本数据中具有较大的优势。
本文将深度收缩自编码(Deep Contractive Auto-Encoder, DCAE)网络和分类器组合成深度收缩自编码分类器,以现场变压器油中溶解气体为基础,选用CH4、C2H2、C2H4、C2H6、H2五种故障气体特征量,构建基于深度收缩自编码的变压器故障诊断模型。并且,考虑工程实际中存在的数据采样错误的情况,选取部分测试样本将其随机置零,研究该模型的容错性。最后以实例进行测试,用本文模型与传统的粒子群优化支持向量机(PSO-SVM)和BP神经网络(BPNN)模型进行比较分析。
1 深度学习收缩自编码
1.1 自编码器介绍
自动编码器由三层神经网络组成:分别是输入层、隐含层、输出层,此处输入层输入数据维度和输出层输出数据维度相同。为了获得训练模型性能最佳的偏置W和权值b,尽可能地让输入和输出相等。自编码器结构如图1所示。
假设有一个输入信号x是h維的,由输入层经过函数f到达中间层,信号变为y,y可以用下面公式表示。
1.2 带收缩项的自编码器
收缩自编码器(Contractive Auto-Encoder, CAE)是在原先的自编码器的基础上增加了正则项,从而增加训练数据集周围出现小扰动时的鲁棒性。正则项为编码器的映射f关于输入x的雅克比矩阵的Frobenius范数,目的是迫使模型在训练样本上有更强收缩作用的映射。正则项形式如下:
收缩自编码器通过重构误差和收缩惩罚(正则项)这两种相反的推动力优化网络参数。正则项迫使自编码器学习到的所有映射的梯度都很小,而重构误差迫使自编码器学习一个恒等映射,保留完整的信息。在两种推动力冲击下,大部分映射对于输入的梯度都很小。当输入受到小扰动时,小梯度会减小这些扰动,从而增加自编码器输入对受到小扰动时的抗干扰能力。
2 实现步骤
(1)初始化自编码网络参数,其中包含隐含层层数,权值W、偏置b、控制正则化强度λ的超参数等参数。
(2)将训练数据x(n)通过激活函数f(x)输入到隐含层中进行编码,得到编码结果h,然后采用向前传播方法(Forward Propagation)计算代价函数大小。
(3)使用向后传播方法(Back Propagation)更新网络参数权值W和偏置b。
假设有样本集{(x(1),y(1)),…,(x(n),y(n))},样本的重构误差使用均方误差,训练集的总体误差为:
3 实例分析
3.1 故障样本选择
本文采用电网公司历年故障DGA数据和部分文献中已知故障类型的DGA数据,组成1600组数据,其中训练集1000组,微调集200组,测试集400组。本文选择用CH4、C2H2、C2H4、C2H6、H2五种故障气体特征量作为输入。为了缩小变量之间的计算误差采用公式(10)对特征量进行标准化处理。
3.2 特征气体标签及故障状态标签
根据电力系统变压器容易发生的故障状态类型,本文分为五种故障状态分别是高能放电(HE-D)、低能放电(LE-D)、中低温过热(LM-T)、高温过热(H-T)、正常状态(N-C)。故障对应状态编号及特征样本分布情况如表1所示。
当损失函数取得最小值时,即输入和输出之间的差值最小,模型故障诊断准确率最高。适当的迭代次数有利于提高收缩自编码故障诊断模型的诊断效率,而迭代次数过多对准确率影响微小。迭代次数和训练损失关系如图3所示。
由图3可知,训练损失随着迭代的次数增加而递减,模型性能逐渐优化,训练损失曲线在迭代次数500次附近保持平缓,故以下测试取迭代次数为500次。
3.3 批次大小选择
当数据集较小时,批次大小选择全数据集形式,即批次大小等于输入的数据集个数,其优点是:内存利用率高,在一定范围内,批次大小越大,引起训练震荡越小。工程实际中,大量数据处理对计算机内存要求较高,而适当的批次大小有助于缓解内存压力,提升计算速度和提高准确率。本文将批次大小分为七组(分别是50、100、150、200、250、300、350),用不同值进行独立试验,模型训练过程中的平均准确率和批次大小的关系如图4所示。
从图4可以看出当批次大小取250时,模型的准确率最高达到89.5%,故下面模型使用批次大小为250。
3.4 AE层数和准确率关系
AE层数和训练时间有关,而诊断准确率和AE层数密切相关。适当的AE层数有助于提升模型的训练效果。不同AE层数时收缩自编码器故障诊断的准确率如图5所示。
图5是不同AE层数下收缩自编码器故障模型的测试准确率,图中折线表明了模型的测试准确率随着AE层数的递增而显著提升。当AE层数到达4层时,模型诊断准确率较高,随后随着AE层数的增加,模型诊断的准确率没有显著提升,故下面测试选取AE层数为4层。
3.5 不同模型对比
选取PSO-SVM和BPNN两种模型和本文模型进行了对比,迭代次数选用500次,分别做10次独立试验,平均准确率取10次试验准确率的均值。考虑工程实际中存在的数据采样错误的情况,选取部分测试样本将其随机置零,所占比率为原测试样本的5%,即5%测试样本部分数据置零进行试验。在此条件下,用PSO-SVM、BPNN和本文方法三者进行故障诊断,并将三者模型诊断准确率进行比较,模型准确率对比如表2所示。
由表2可知,DCAE在完整的变压器故障测试数据下故障诊断准确率最高,能达到89.5%,相较于PSO-SVM模型提高了5.3%,相较于BPNN模型提高了9.9%。在5%测试样本随机置零时,DCAE准确率最高,仅比完备数据情况下降低了2.2%,能达到87.3%,而PSO-SVM算法准确率下降到76.5%,BPNN算法准确率下降到70.5%。结果表明,DCAE在完整的测试数据或是5%测试数据出错的情况下故障诊断准确率均优于PSO-SVM和BPNN算法。
4 结语
本文使用深度收缩自编码网络构建分类模型对变压器进行故障诊断结论如下。
(1)利用自编码网络增加收缩项,增加自编码网络受到小扰动时的鲁棒性。然后构建收缩自编码网络模型对变压器进行故障诊断,其准确率优于传统的PSO-SVM、BPNN算法,达到了89.5%,说明了本文方法能有效地诊断变压器故障。
(2)对比于PSO-SVM和BPNN算法需要带样本标签的数据进行模型训练而言,本文方法有强大的特征提取能力,其训练数据使用无监督学习,无需使用样本标签,适用性更广泛。
(3)在实际应用中,油色谱监测部分数据出错或是部分数据不全,导致传统的故障诊断方法准确率偏低。在此条件下,本文方法相较于PSO-SVM和BPNN故障诊断准确率更高,准确率达到了87.3%,说明了本文故障诊断模型具有较强的鲁棒性。
参考文献
[1] 荣智海,齐波,李成榕,等.面向变压器油中溶解气体分析的组合DBN诊断方法[J].电网技术,2019,43(10):3800-3808.
[2] 郑含博,王伟,李晓纲,等.基于多分类最小二乘支持向量机和改进粒子群优化算法的电力变压器故障诊断方法[J].高电压技术,2014,40(11):3424-3429.
[3] 张镱议,彭鸿博,李昕,等.基于DGA特征量优选与改进磷虾群算法优化支持向量机的变压器故障诊断模型[J].电测与仪表,2019,56(21):110-116.
[4] 张镱议,焦健,汪可,等.基于帝国殖民竞争算法优化支持向量机的电力变压器故障诊断模型[J].电力自动化设备,2018,38(1):99-104.
[5] 吐松江·卡日,高文胜,张紫薇,等.基于支持向量机和遗传算法的变压器故障诊断[J].清华大学学报:自然科学版,2018,58(7):623-629.
[6] 仲元昌,万能飞,夏艳,等.基于油气参数分析的电力变压器故障分步式诊断算法[J].高电压技术,2014,40(8):2279-2284.
[7] 张珂斐,郭江,聂德鑫,等.基于化学反应优化神经网络与融合DGA算法的油浸式变压器模型研究[J].高电压技术,2016,42(4):1275-1281.
[8] 贾亦敏,史丽萍,严鑫.改进人工鱼群算法优化小波神经网络的变压器故障诊断[J].河南理工大学学报:自然科学版,2019,38(2):103-109.
[9] 李春茂,周妺末,刘亚婕,等.基于邻域粗糙集与多核支持向量机的变压器多级故障诊断[J].高电压技术,2018,44(11):3474-3482.
[10]许倩文,吉兴全,张玉振,等.栈式降噪自编码网络在变压器故障诊断中的应用[J].电测与仪表,2018,55(17):62-67.
[11]贾京龙,余涛,吴子杰,等.基于卷积神经网络的变压器故障诊断方法[J].电测与仪表,2017,54(13):62-67.
[12]石鑫,朱永利.深度学习神经网络在电力变压器故障诊断中的应用[J].电力建设,2015,36(12):116-122.
[13]代杰杰,宋辉,杨祎,等.基于油中气体分析的变压器故障诊断ReLU-DBN方法[J].电网技术,2018,42(2):658-664.
[14]Hinton, G E. Reducing the Dimensionality of Data with Neural Networks [J]. Science, 2006, 313(5786):504-507.
[15]Bengio, Y. Learning Deep Architectures for AI [J]. Foundations and Trends? in Machine Learning, 2009, 2(1):1-127.
[16]Bengio Y, Courville A, Vincent P. Unsupervised Feature Learning and Deep Learning: A Review and New Perspectives [J]. 2012.
[17]Hinton G E, A practical guide to training restricted Boltzmann machines [J]. Momentum, 2010, 9(1):926-947.
[18]田啟川,王满丽.深度学习算法研究进展[J].计算机工程与应用,2019,55(22):25-33.
[19]侯一民,李永平.基于卷积神经网络的孤立词语音识别[J].计算机工程与设计,2019,40(6):1751-1756.
[20]马苗,许西丹,武杰.一种耦合深度信念网络的图像识别方法[J].西安电子科技大学学报,2018,45(5):102-107.
[21]郑远攀,李广阳,李晔.深度学习在图像识别中的应用研究综述[J].计算机工程与应用,2019,55(12):20-36.