基于FMEA和Bi-LSTM的风电机组变桨系统状态监测与诊断
2021-10-30宋莹
宋 莹
(南京工程学院能源与动力工程学院, 江苏 南京 211167)
随着可再生能源发电技术的不断推进,风电机组向大单机容量发展已成为趋势,随之而来的是机组结构更加复杂化、部件之间的耦合性逐渐增强.由于风电机组运行的随机波动性,保障设备安全、可靠运行的难度较大,因此,监测风电机组运行状态、及时诊断风电机组故障已经成为当前研究重点之一.
传统的风电机组状态监测与诊断技术主要基于振动信号的处理、阈值的设定以及专家经验的累积.但单一的振动信号作为诊断依据容易产生滞后性,阈值设定的偏差影响诊断的准确性.随着人工智能的发展,机器学习方法已应用于风电机组的状态监测与故障诊断.文献[1]将概率神经网络应用于风电机组的故障诊断;文献[2]、文献[3]在人工神经网络(artificial neural network,ANN)的基础上研究状态监测与故障诊断技术,弥补了专家系统等传统方法的弊端.但机器学习方法结构相对单一,对其精确性有一定的影响,为提高精确性与时效性,深度学习方法被不断研究,其中应用较为广泛的为卷积神经网络(convolutional neural networks,CNN)和循环神经网络(recurrent neural network,RNN)方法[4-9].CNN比较适用于图片处理模式,RNN适用于时间序列较短的特征数据,但针对大部分故障具有长时序特征的风电机组,采用双向长短期记忆(bi-directional long short-term memory,Bi-LSTM)网络处理更具优势[10-16].
风电场主要通过数据采集与监视控制系统(supervisory control and data acquisition,SCADA)进行运行监测,而不同故障的特征信号又有所不同,需要研究不同故障与对应信号的关联度,避免出现数据冗余,影响监测与诊断效果.因此,本文提出基于失效模式与影响分析(failure mode and effects analysis,FMEA)和Bi-LSTM的风电机组变桨系统状态监测与诊断方法.
1 变桨系统异常状态数据挖掘
1.1 变桨系统异常状态特征数据提取
变桨系统作为风电机组的重要结构,其良好的运转是保障机组安全稳定运行的前提.变桨控制系统是通过改变叶片迎角实现功率变化来进行调节的.故障形式主要包括变桨角度故障、变桨转矩异常、变桨电机、轴承故障等.由于故障种类较多且数据量大,采用FMEA方法对变桨系统故障进行定性分析,FMEA是一种面向系统具体物理单元的分析方法,从系统构成元件或部件的基本故障模式入手,逐步分析故障的影响,以变桨轴承故障为例,表1为故障FMEA表[17-18].
表1 变桨轴承故障FMEA表
采用FMEA以及关联度分析方法对变桨系统主要故障作出分析,得出主要监测信号为风速、桨角、力矩、功率、低速轴和高速轴转速等.辅助监测信号包括风向、轴承温度和塔筒振动情况等.具体监测信号如表2所示,大体上分为运行数据、发电数据以及温度数据三类.
表2 变桨系统特征监测信号
2 变桨系统监测与诊断模型建立
本文建立3种不同的监测与诊断模型,并进行对比,分析不同模型的准确性.
2.1 循环神经网络(RNN)
传统的神经网络是从输入层到隐含层再到输出层,层与层之间全连接,每层之间的节点无连接.这种神经网络对于很多问题无法解决,因此,提出循环神经网络,结构如图1所示.
图1 循环神经网络(RNN)结构图
RNN作为深度学习技术的重要模型,已经广泛应用于语音识别和图像描述等领域,但由于其结构存在一定的局限,在处理时序较长的情况下,其结果并不理想[19-21].
2.2 长短期记忆人工神经网络及结构
长短期记忆人工神经网络(LSTM)是一种时间循环神经网络,适用于处理和预测时间序列中间隔和延迟较长的重要事件.由于LSTM在RNN的基础上添加了细胞状态,从而很好地解决了RNN在训练过程中容易产生梯度消失的问题[22],并充分利用时间序列的历史信息进行预测,图2为LSTM结构示意图.
图2 长短期记忆人工神经网络结构
LSTM由输入层、隐藏层和输出层三层结构组成.与RNN和传统神经网络结构相比,LSTM的主要特点集中在隐藏层,RNN在处理信息的过程中,只是把t-1时刻的状态作为t时刻的输入,而LSTM通过隐藏层的结构对t-1时刻的信息进行更新筛选,并判断是否作为t时刻的输入.LSTM隐藏层的结构主要由细胞状态和3类门控结构组成,分别为遗忘门、输入门和输出门.输入门控制当前计算的新状态以多大程度更新到记忆单元中;遗忘门控制前一步记忆单元多大程度被遗忘;输出门控制输出多大程度上取决于记忆单元.LSTM单元层的具体工作流程为:当前状态t-1时刻,存在序列Xt和上一时刻隐藏层中获取的ht-1,将两类数据作为此刻输入;内部结构中细胞状态在t-1时刻得到的数据Ct-1作为内部信息输入到不同的门控结构中.每个门通过计算,对输入信息进行处理,并且根据逻辑函数决定是否激活输入信息[23-24].
2.3 LSTM前向传播和反向传播
训练模型的过程分为前向传播和反向传播,LSTM前向传播在每个序列索引位置的过程为:
1) 更新遗忘门输出:
ft=σ(Wfht-1+UfXt+bf)
(1)
式中:Wf为t-1时刻输出权值;Uf为t时刻输入权值,bf为偏置;ht-1为t-1时刻的输出;Xt为t时刻的输入;ft为t时刻输出;σ为激活函数,通常为sigmoid函数或ReLU函数,本研究选取ReLU函数作为激活函数.
2) 更新输入门两部分输出:
it=σ(Wiht-1+UiXt+bi)
(2)
at=tanh(Waht-1+UaXt+ba)
(3)
式中:Wi为求it时t-1时刻输出权值;Ui为求it时t时刻输入权值;Wa为求at时t-1时刻输出权值;Ua为求at时t时刻输入权值;bi为求it的偏置;ba为求at的偏置;it为t时刻更新输入门第一部分输出;at为t时刻更新输入门第二部分输出;tanh为激活函数.
3) 更新细胞状态:
Ct=Ct-1⊙ft+it⊙at
(4)
式中:Ct为t时刻的更新输出;Ct-1为t-1时刻的更新门输入函数;⊙为逻辑运算符,表示同或运算.
4) 更新输出门输出:
ot=σ(Woht-1+UoXt+bo)
(5)
ht=ot⊙tanh(Ct)
(6)
式中:Wo为t-1时刻输出权值;Uo为t时刻输入权值;bo为偏置.
5) 更新当前序列索引预测输出:
yt=σ(Vht-1+c)
(7)
式中:V为权值;c为偏置,yt为t时刻输出.
LSTM训练过程关键之处在于反向传播的计算.反向传播是根据已有的结果不断更新迭代训练过程中的权值,以得到高准确率、低误差的训练模型.通常采用按时间展开的反向误差传播算法(back propagation trough time,BPTT)作为反向传播计算的依据.在处理时间序列较长的数据时,一般选择交叉熵函数作为反向传播的损失函数,通过对损失函数进行求导,不断更新权值[25-27].
2.4 双向长短期记忆网络及结构
Bi-LSTM是由前向LSTM与后向LSTM组合而成.由于Bi-LSTM是基于LSTM建立的,因此其内部结构类似于LSTM,如图3所示.向前的LSTM按照t-1,t,t+1,…正序进行计算与记忆信息,并形成向量,而反向LSTM按照t+1,t,t-1,…倒序计算与记忆信息,形成向量,最后将两向量进行拼接,得到隐藏层输出h0、h1和h2.
图3 双向长短期记忆网络结构图
2.5 监测与诊断建模流程
以表2的特征监测信号为基础建立监测与诊断模型,将获取的样本数据分为两部分,即训练数据和测试数据.模型建立流程包括数据预处理和模型构建,具体步骤为(见图4):
图4 监测与诊断流程图
1) 数据状态标识,模型以特征监测信号作为输入变量,形成矩阵X=[X1,X2,…,Xn],信号按照时序排列,n为输入的维数,即特征信号的种类数量.由于本研究通过训练拟得出机组运行期间变桨系统实时的运行情况,属于分类问题,因此建模初期要先对训练数据进行状态标识.以[001]表示健康状态、[010]表示初步异常、[100]表示故障状态,建立状态矩阵Y=[001,001,010,…],将X、Y两个矩阵一一对应,合并成输入矩阵XY=[X1,X2,…,Xn,Y].
2) 数据归一化处理,LSTM及其演变方法的激活函数运算范围均处于[0—1]区间,因此,需要将训练数据进行归一化处理.本文以min-max归一化方法对样本数据进行归一化预处理:
X′=(X-Xmin)/(Xmax-Xmin)
(8)
式中:Xmin为样本数据的最小值;Xmax为样本数据的最大值;X为样本原始值;X′为归一化后的数值.通过建立归一化模型,对输入矩阵XY进行归一化处理,得出归一化矩阵XY′.
3) 模型建立,本文主要研究LSTM及Bi-LSTM两种方法,并与RNN进行对比分析.建立模型的最终目的是根据输入特征信号获取状态输出,即判断输入信息是健康、异常还是故障,属于分类模型,因此模型总体上分为输入层、LSTM层、全连接层、softmax分类器层和输出类目层.模型建立的过程中需要确定损失函数、优化器等多种特征以及输入维数、输出维数、隐藏层数量、初始化权值、给定最小误差等多种参数.表3为根据研究对象特性选取的模型结构参数.
表3 模型结构参数表
4) 数据分类,将样本数据分为训练数据和测试数据.训练数据用于模型的建立及优化,测试数据用于模型的性能测试及准确率的评估.
5) 得出最优权值,确定模型,将计算出的误差作为训练结果是否达到标准的判断依据,同时作为反向传播运算因子,不断更新权值,以获取最优权值作为模型的最终结构参数.
6) 模型测试,将测试数据输入模型,进行性能测试,得出准确率,进行评价.
3 模型的训练与结果分析
本文数据来源为山东某风电场连续2年的实际运行数据.该风电场使用的机型是典型的1.5 MW陆上风电机组,切入风速为3 m/s,额定风速为10.5 m/s.SCADA系统数据包括风速、风向、桨距角、转速、力矩、有功功率、无功功率、温度值和压力值等44种信号参数.系统每10 min记录一次机组运行数据.建立适用于整个运行阶段的监测与诊断模型,取异常发生前的部分健康数据、异常数据和故障数据作为训练数据对模型进行训练.当模型训练的准确率达到既定标准后,对测试数据进行监测,若残差出现偏离既定范围时,即诊断运行出现异常.
3.1 模型分析与评估
从SCADA数据中提取出表2的20种特征信号数据共8 672组,选取前6 000组数据作为训练样本,后2 672组数据作为实测样本,对训练样本进行状态标识,构成XY矩阵.
根据测试数据特征可知模型的输入维数为20,输出维数为3.设定LSTM和Bi-LSTM的隐藏层单元个数为10,损失函数为交叉熵函数,优化器为Adam.通过训练及测试得出准确率曲线及损失函数曲线.由于迭代数据较多,分别在准确率曲线和损失函数曲线中选取10个点描绘出准确率与损失函数的趋势对比图,如图5、图6所示.测试数据得到的准确率如表4所示.
图5 准确率曲线对比图
图6 损失函数曲线对比图
表4 不同评估模型的测试结果
在处理时序较长的数据时,Bi-LSTM模型与LSTM模型的准确率均超过90%,但Bi-LSTM对于机组运行状态监测与诊断的准确率达到了96.67%,更具优势.由于RNN在处理本次测试样本时,发生了严重的梯度消失现象,因此时序较长时不选择RNN模型.
3.2 改变训练样本数量进行分析
由于样本组数过多,即时间序列过长导致RNN发生梯度消失现象.为了将RNN、LSTM和Bi-LSTM进行比较,从6 000个样本数组中分别选取50、100、150、200组数据进行训练,得到的评估准确率对比情况如表5所示.
表5 模型准确率对比表 %
由表5可知,在时间短、样本数相对较少时,3种模型的准确率相差较小,LSTM模型与Bi-LSTM模型的准确率基本一致,体现了时序在一定范围内,2种模型在监测诊断上基本一致,但准确率并不高;随着训练样本的增加,LSTM模型与Bi-LSTM模型的准确率不断提高,突显出2种模型在处理长时序问题时的优势,同时,Bi-LSTM模型在监测诊断过程中准确率更高,而RNN模型的准确率明显下降,证明RNN模型在处理时序较长数据时存在弊端.
3.3 3种模型的特征参数比较
由于训练速度与计算机配置有关,分别选取50、100、150和200组数据在同一台计算机上进行测试,测试结果如表6所示.
由表6可知,训练样本的时序较短时,3种模型耗时相差较小,RNN由于结构简单,耗时最少.
表6 模型耗时对比表 s
由于研究对象具有时序较长的特点,Bi-LSTM和LSTM两种模型对监测与诊断风电机组变桨系统运行情况具有很好的效果,且Bi-LSTM更具优势.
3.4 特征信号维度对Bi-LSTM模型的影响
通过改变特征信号的维度来进一步研究Bi-LSTM模型适用性,本次训练仅选取主要信号进行训练,并在主要信号中选出7种关联性较强的特征信号进行训练,最后选取变桨系统最直观的特征信号,即风速与功率作为输入信号进行训练,准确率如图7所示.通过对比可以得出,当特征信号种类较少时准确率较高,但并不是越少越好.由于转动设备运行的复杂性,不同信号体现出机组运行的不同性能,因此在选择特征信号种类时,要保证所选择的信号与研究对象关联度较高,并保障模型训练结果达到一定的准确度.
图7 不同特征信号维度下准确率对比图
3.5 Bi-LSTM模型监测诊断结果分析
选取相同风电场7种特征数据,取一周内共计1 200组实际运行数据进行机组运行状态评估,采集数据每10 min一组.选择已经训练好、异常诊断准确率在99.17%的Bi-LSTM模型,并依据健康(001)、异常(010)和故障(100)对数据进行归类处理,如图8所示.
图8 实际运行数据监测诊断结果
通过分析可知,在第840组运行数据附近时机组运行状态发生了变化,显示异常状态,此刻需对变桨系统做出紧密监测,必要时进行检修,当在1 060组数据附近时机组运行状态已显示为故障状态,此刻需对机组进行停机检修,以避免安全事故的发生和减少经济损失.
4 结论
为了准确、快速监测与诊断风电机组变桨系统运行状态,提出一种基于失效模式与影响分析和双向长短期记忆网络的风电机组变桨系统状态监测与诊断方法.
1) FMEA作为故障模式分析的重要手段,通过分析风电机组不同故障对应的征兆、现象以及影响,将振动信号与温度等信号相融合,获得具有关联性较强的故障特征信号,作为深度学习模型的输入信号.分析出了变桨系统故障特征信号共计20种,关联性较强的特征信号7种,即风速、桨角、功率、塔筒X向振动、塔筒Y向振动、风轮转速和轮毂温度.
2) Bi-LSTM的深度学习模型能够有效地训练深层架构的参数,获取最佳权值,以提高监测与诊断的准确率,通过模型测试得出,Bi-LSTM模型处理长时序信号比RNN模型具有明显优势,比LSTM模型具有更高准确率.
3) Bi-LSTM监测与诊断模型对输入的特征信号维度有一定的要求,维度的确定要依据特征信号与研究对象的关联度,同时要保障模型准确率达到一定的要求,变桨系统的特征信号最终选取7种,此时模型的异常监测与诊断的准确率可达到99.17%.
本文将FMEA与Bi-LSTM相结合建立风电机组变桨系统的监测与诊断模型,在较好诊断长序列特征故障的同时能够更加快速、准确地监测出机组潜在故障信息,为风电机组智能监测与诊断技术提供了一定的理论依据.