APP下载

基于自编码网络模型的风机故障检测研究

2019-10-18章浩伟周琪馨任筱倩

软件导刊 2019年9期

章浩伟 周琪馨 任筱倩

摘 要:为了保障风机的正常运行,提出基于自编码(Autoencoder,AE)的风机故障检测方法。依据法国风机ENGIE公开的风速传感器数据,建立欠完备自编码模型(UAE)、去噪自编码模型(DAE)与收缩编码器(CAE)模型,对风机风速传感器数据进行编码和解码,计算重构误差并设定阈值进行故障检测。用多风机风速传感器数据建立PCA模型并与去噪编码器模型对比。根据ROC曲线与AUC值对比,得出欠完备自编码模型、去噪自编码模型、收缩编码器模型均可用于风机异常检测,且收缩编码器效果最好的结论。PCA模型也可用于故障检测,同时多风机故障检测效果高于单一风机。

关键词:风机故障;自编码;去噪自编码;收缩编码器

DOI:10. 11907/rjdk. 182849 开放科学(资源服务)标识码(OSID):

中图分类号:TP319文献标识码:A 文章编号:1672-7800(2019)009-0158-05

Anomaly Detection for Wind Turbines Based on Autoencoder Model

ZHANG Hao-wei,ZHOU Qi-xin,REN Xiao-qian

(College of Biomedical Engineering, University of Shanghai for Science and?Technology, Shanghai 200093, China)

Abstract:In order to achieve anomaly detection for wind turbines and keep the running of wind turbines,an anomaly detection method based on autoencoder is proposed. We obtained the ENGIE open data of the wind speed sensor on the French wind turbines and built the under-complete autoencoder model, the denoising autoencoder network model and the contractive autoencoder model. The power reconstruction error by encoding and decoding the power of wind turbines was calculated and the appropriate threshold value was selected as the decision criteria for anomaly detection. The PCA was built to be compared with denoising autoencoder model with four wind speed sensor data. According to the ROC curve and the AUC value, the under-complete autoencoder model, the denoising autoencoder model and the contractive autoencoder model can all be used for  anomaly detection for wind turbines, and the contractive autoencoder model is better than the other two models. The PCA model can also be used for fault detection and the wind speed sensor data of four wind turbines is better than one single sensor data.

Key Words: anomalies of wind turbines; autoencoder; denoising autoencoder; contractive autoencoder

0 引言

风能年代久远,是最重要的能源之一,具有储藏量大、可再生、无污染、分布范围广的特点。目前,世界上已有82个国家把风电列入国家战略性新兴产业,积极开发利用风能。风电数据[1]具有变量多、数据量大、类型复杂的特点。深度学习算法与传统故障诊断方法相比,克服了传统方法对诊断经验的依赖性和大数据下模型诊断能力与泛化能力的不足。

自编码器(Autoencoder,AE)是神经网络的一种,经过训练后能尝试将输入复制到输出,主要包括欠完备编码器(Undercomplete Autoencoder,UAE)、去噪编码器(Denoising Autoencoder,DAE)、收缩编码器(Contractive Autoencoder,CAE)与稀疏编码器(Sparse Autoencoder,SAE),其中欠完备编码器(UAE)又称为深度自编码器。自编码模型利用风速传感器数据作为输入进行多层深度学习[2],训练过程中对原始数据进行编码和解码,并以非监督方式学习数据的固有结构和特征。在训练过程中能使信息损失最小,且能够准确保留抽象和深层的特征信息。

Meik Schlechtingen[3]使用数据挖掘方法成功对风机功率曲线进行了监测;石鑫,朱永利[4]等提出了基于深度自编码网络的电力变压器故障诊断方法,与基于反向传播神经网络(BPNN)、支持向量机(SVM)故障診断方法相比,提高了诊断正确率;刘辉海[5]等提出了基于风电机组齿轮箱数据的深度自编码网络模型,验证了深度自编码网络学习方法对齿轮箱数据故障检测的有效性;Long Wang[6]则利用深度自编码网络(UAE)对风机叶片成功进行了故障检测;Guoqian Jiang[7]利用去噪编码器模型(DAE)对风机实现了故障检测;Pingping Wen[8]建立了稀疏编码器(SAE)模型成功对船舶叶片实现了故障检测。本文首次建立收缩编码器模型(CAE)用于风机故障检测,并且与欠完备自编码模型(UAE)、去噪编码器模型(DAE)与PCA模型(Principal Component Analysis,PCA)进行对比,利用单一风机的风速传感器数据对UAE、DAE与CAE三种模型进行实验,利用4个风机风速传感器数据进行PCA与DAE模型实验。得知4种模型均可以用于风机故障检测,收缩编码器(CAE)故障检测率最高,欠完备编码器模型(UAE)最低,多风机传感器数据可提高故障检测率。

1 自编码器与PCA

深度自编码网络也是欠完备自编码网络,由多层自编码器AE堆叠成神经网络,结构上与传统多层神经网络没有区别。训练时采用逐层训练方法,即将前一层的输出作为下一层的输入依次训练,有效解决了传统神经网络[9]训练方法不适用于多层网络训练的问题。

1.1 欠完备编码器

以一层自编码AE为例,一个基本的AE可视为一个三层的神经网络结构,即输入层、隐藏层和输出层。其中输出层与输入层规模相同。从输入层到隐含层是编码过程,从隐含层到输出层是解码过程。设[f(x)]和[g(h)]分别表示编码和解码函数,则2个过程可分别表示为式(1)和式(2)。

其中,[Sf]和[Sg]通常为Sigmoid函数[10],[W]为输入层与隐含层之间的权值矩阵,[W]为隐含层与输出层之间的权值矩阵[11],通常为[WT];[p]和[q]分别为隐含层和输出层上的偏置向量。为了下文表示方便,将AE的参数记为[θ],即[θ=W,p,q]。假设训练样本集[S=x(1),x(2),?,xN],预训练AE的过程实质上就是利用[S]对参数[θ]进行训练的过程。为此,首先定义1个训练目标,即解码后的[y]应与输入[x]尽可能地接近,接近程度可表述为重构误差函数[L(x,y)]:

基于重构误差函数,针对训练数据集[S],损失函数[12]如式(4)所示。然后利用梯度下降法对损失函数进行极小化,得到该层AE参数:

一层AE训练完成之后,将其隐含层[13]单元的输出向量作为下一层输入。对下一层AE进行训练,依次迭代,直至最终完成整个深度自编码网络训练。

1.2 去噪自编码器

去噪自编码器[14]与欠完备编码器的区别是输入数据添加了噪声。给定一个输入[x],编码器会用已经损坏的数据[x]代替原始数据[x]传输给隐藏层:

[f]是一个非线性的激活函数,[W1∈Rd*m]是权重矩阵,[b∈Rd]在隐藏层中有d个节点,也是在编码中要进行最优化的偏置矢量。同理,变量[W2∈Rd*m]和[c∈Rm],解码器利用一个非线性的转换[x]映射生成重建矢量[15][x],输出表达式如下:

[g(.)]也是一个非线性激活函数,权重矩阵[W2]被选作为[W2=W1T],绑定权重学习效果更好。

给定输入训练集[xini=1],可通过[i=1nxi-xi2]计算重构误差。去噪自编码器训练目标是通过最小化重构误差[16]找到编码和解码过程中的最优化参数[θ=W1,b,c],进而进行参数优化得到最小化[θ]。

式(7)中的重建误差计算是解码器输出结果(损坏的输入重建后的结果)与原始输入之间的差异,而不是与被破坏的输入差异,即自动编码器从有噪声的输入[x]再现原始输入[x],使自动编码器对具有噪声的数据具有鲁棒性。重构误差[E∈RM*N],其为训练输入[X]与重建数据[X]间差异为:[E=X-X]。

1.3 收缩自编码器

压缩编码器(CAE)與自动编码器(AE)不同的是增加了额外的惩罚项,用以最小化与输入有关的雅可比行列式的平方范数[17]。一个标准的自编码器包括编码器与解码器,编码器对输入数据进行编码到隐藏层,解码器对隐藏层数据进行解码到输出。通常给定输入[x∈Rdx],隐藏层表示为[h∈Rdh],编码器通过[dh×dx]大小的矩阵[We]和偏置矢量[bh∈Rdh]进行参数化,解码器通过[dx×dh]大小的矩阵[Wd]和偏置矢量[by∈Rdh]进行参数化,解码器输出[y∈Rdx]则为:

1.4 主成分分析(PCA)模型

主成分分析(PCA)是迄今为止最流行的降维算法[19],也是最经典的基于线性分类的分类系统,其最大特点是利用线性拟合的方法把分布在多个维度的高维数据投射到几个轴上。如果每个样本只有两个数据变量,这种拟合就是[a1x+a2x2=P],其中[x1]和[x2]分别是样本的两个变量,而[a1]和[a2]被称为载荷[20],P值叫作主成份。当一个样本只包含两个变量,主成份分析本质上就是做一个线性回归[21]。如果一个样本有n个变量,则主成份就变为:

A称为主成分的载荷,P则为得分。如果自动编码器仅使用线性激活函数且损失函数是均方误差(MSE),则它最终执行主成分分析。

2 分析步骤

风机正常工作状态下,风速传感器数据间的特征规则保持相对稳定。风机故障时规则改变,重构误差Re(Reconstruction Error,Re)的趋势也改变。正常状态下,Re维持在阈值[22]范围内变化,当Re 变化越过阈值并保持在阈值之上,则判定风机发生故障。利用建立的自编码模型计算数据集的重构误差Re,将其作为风机的检测量。通过分析Re变化趋势[23]或突变程度,实现对风机的故障检测。根据“受试者工作特征”(Receiver Operating Characteristic,ROC)曲线与ROC曲线下的面积AUC(Area Under Curve,AUC)[24],对比3种编码器与PCA模型故障检测效果。

基于自编码模型的风机故障检测步骤:①获取法国Engie公开的风速传感器数据建立变量数据集,对数据进行归一化处理并分为训练集和测试集;②建立欠完备自编码网络模型、去噪自编码模型、收缩编码器模型与PCA模型;③通过模型得到重构误差,设定阈值并运用测试数据集实验,检测风机是否发生故障;④对比欠完备自编码、去噪自编码与收缩编码器模型的故障检测结果;⑤对比多风机风速传感器数据与去噪自编码模型故障检测结果。

3 算例分析

选取法国ENGIE公司2017-2018年R80711、R80721、R80736、R80790四种公开数据的风机,每批次数据量均为8 125 × 7,时间为一天。DA 模型设定4 个隐含层,隐含层单元数分别为1 000、500、250、50,数据集按   8∶2 分为训练集和测试集。在训练过程中,用训练集学习每个隐含层的权值和偏置值,然后利用AE模型计算测试集的Re。AE模型的参数w、a、b 初始化为服从高斯分布的随机较小值,初始学习率设为0.1,网络更新速率设为0.001。

由图1可以看出,自编码模型可以学习到原始数据并能很好地预测原始数据趋势,根据自编码输出与原始数据作差可以得到重构误差Re。

由图2可知欠完备自编码[6]可用于故障检测,神经元数目为25时故障检测效果较好,AUC是0.831 2。

根据ROC 曲线可知,去噪自编码网络[7]可用于风机故障检测,sigma为0.1、神经元数目为25时故障检测效果较好,AUC是0.852 8,如图3所示。

由表1可知欠完备自编码模型、去噪自编码模型、收缩编码器模型与PCA模型均可以用于风机的故障检测,且3种编码器中收缩编码器故障检测效果最好,选取多风机数据可提高风机故障检测率。

4 结语

本文建立了收缩自编码模型(CAE)并成功用于风机故障检测,提高了故障预测准确率,收缩自编码网络(CAE)与欠完备自编码(UAE)、去噪自编码(DAE)与PCA模型对比,收缩编码器(CAE)模型故障检测效果最好,AUC值为0.878 4,去噪编码器(DAE)次之,AUC值为0.852 8。选取多风机数据可以提高故障检测率,选取4个风机数据可以将去噪自编码模型的故障准确率由0.852 8提高到0.864 7。今后可研究其它类型编码器或综合编码器用于风机的故障检测,提高风机故障检测率。

参考文献:

[1] 杭俊,张建忠,程明,等. 风力发电系统状态监测和故障诊断技术综述[J]. 电工技术学报,2013,28(4): 262-271.

[2] 杨明,董传洋,徐殿国. 基于电机驱动系统的齿轮故障诊断方法研究综述[J]. 电工技术学报,2016,31(4): 58-63.

[3] SCHLECHTINGEN M,SANTOS I F,ACHICHE S. Using data-mining approaches for wind turbine power curve monitoring: a comparative study[J]. IEEE Transactions on Sustainable Energy,2016(4):671- 679.

[4] 石鑫,朱永利. 基于深度自编码网络的电力变压器故障诊断[J]. 电力自动化设备,2016(5):122-126.

[5] 刘辉海. 基于深度自编码网络模型的风电机组齿轮箱故障检测[J]. 电工技术学报,2017,32(17): 58-63.

[6] WANG L, ZHANG Z, XU J, et al. Wind turbine blade breakage monitoring with deep autoencoders[J]. IEEE TRANSACTIONS ON SMART GRID, 2018,9(7):4-9.

[7] JIANG G Q, XIE P. Wind turbine fault detection using a denoising autoencoder with temporal information[J]. IEEE/Asme transactions on mechatronics,2018,26(2):100-108.

[8] WEN P P,WANG T Z. Blade imbalanced fault diagnosis for marine current turbine based on sparse autoencoder and Softmax regression[C]. Nanjing:2018 33rd Youth Academic Annual Conference of Chinese Association of Automation (YAC),2018.

[9] 趙光权,葛强强,刘小勇,等. 基于DBN 的故障特征提取及诊断方法研究[J]. 仪器仪表学报,2016,39(7): 1946-1953.

[10] 雷亚国, 贾峰, 周昕, 等. 基于深度学习理论的机械装备大数据健康监测方法[J]. 机械工程学报,2015, 51(21): 49-56.

[11] WANG X C, GUO P, HUANG X B. A Review of wind power forecasting models[C]. The Proceedings of International Conference on Smart Grid and Clean Energy Technologies,2011:770-778.

[12] HONG Y Y, CHANG H L, CHIU C S. Hour-ahead wind power and forecasting using simultaneous perturbation stochastic approximation(SPSA) algorithm and neural network with fuzzy inputs[J]. Energy,2010,35(9):3870-3876.

[13] 胡昭华,宋耀良. 基于Autoencoder网络的数据降维和重构[J]. 电子与信息学报,2009,31(5):1189-1192.

[14] VINCENT P, LAROCHELLE H, BENGIO Y, et al. Extracting and composing robust features with denoising autoencoders[C]. 25th International Conference on Machine Learning, 2008: 1096-1103.

[15] JIANG G, HE H, XIE P, et al. Stacked multilevel-denoising autoencoders: a new representation learning approach for wind turbine gearbox fault diagnosis[J].  IEEE Transactions on Instrument and Measurement, 2017,66(12):2391-2402.

[16] VINCENT P, LAROCHELLE H, LAJOIE I,et al. Stacked denoising autoencoders: learning useful representations in a deep network with a local denoising criterion[J]. Journal of Machine Learning Research, 2010(11):3371-3408.

[17] RIFAI, SALAH, MESNIL, et al. Higher order contractive autoencoder[J]. Machine Learning and Knowledge Discovery in Databases,2011(1):645-660.

[18] RIFAI, SALAH, VINCENT,et al. Contractive autoencoders: explicit invariance during feature extraction[C]. Proceedings of the 28th International Conference on Machine Learning (ICML-11),2011:833-840.

[19] 方健,李自品,袁辉,等. 基于主成分分析的 BP 神经网络的应用[J]. 变压器,2011,48(1):47-51.

[20] 叶永伟,刘志浩,黄利群. 基于PCA 的汽车涂装线设备信号特征提取[J].  仪器仪表学报,2011,32(10):2363-2370.

[21] 唐勇波,桂卫華,彭涛,等. PCA 和KICA 特征提取的变压器故障诊断模型[J]. 高电压技术,2014,40(2):557-563.

[22] ALCALA C F,QIN S J. Reconstruction-based contribution for process monitoring[J].  Automatica, 2009,45(7):1593-1600.

[23] MA L,LUAN S Y. A review on the forecasting of wind speed and generated power[J]. Renewable and Sustainable Energy Reviews,2009,13(4):915-920.

[24] ZHANG W  Y,WU J,WANG Z J,et al. Performance analysis of four modified approaches for wind speed forecasting[J]. Applied Energy,2012(99):324-333.

(责任编辑:杜能钢)