APP下载

长短时记忆的风电机组故障预测系统

2021-02-11郑修楷曾宪文

上海电机学院学报 2021年5期
关键词:时刻风电神经元

郑修楷,曾宪文

(上海电机学院电子信息学院,上海 201306)

风力发电是一种新能源发电方式,在全球能源紧缺、环境污染严重的情况下,受到了世界各国的高度重视。我国风电设备通常建立在风力资源丰富的西北地区和东南、华北沿海地区,一旦发生停机事故,一方面维修复杂,另一方面根据实际情况,故障会造成3~8天的停机[1],带来巨大的经济损失。考虑到风机设备的故障机理多为应力疲劳的累计,且应力负载的累计难以统计和建模,在实际运行维护过程中,往往桨距角发生明显的异常后才进行紧急停机处理[2]。

故障预测技术通过监测设备的实时运行数据,在故障发生之前以一定概率对未来的设备运行状态进行预估[3],从而做好充分的准备工作,保证风电机组的平稳运行。目前,故障预测技术都是以数据为驱动,对历史数据进行训练,形成对未来运行状态的评估。Zhang等[4]运用自组织神经网络建立故障发展的描述变量,并对状态变量进行跟踪,从而预测轴承剩余寿命。马玉峰[5]提出了一种小波神经网络,利用传感器检测数据建立故障演变模型,预测轴承剩余寿命。但这些模型仍属于浅层学习模型,风机运行时,各部件之间具有复杂的耦合关系,浅层学习模型很难表示出其中的关联性。

深度学习凭借其强大的特征学习能力,已广泛应用于图像处理、语音识别等[6]各个领域,但目前在风电机组故障领域的应用较少。文献[7]将长短时记忆(Long Short Term Memory,LSTM)网络用于非结构化文本的故障分类。Wang等[8]利用LSTM进行航空发动机的故障检测,保证发动机正常运行。风电设备各子部件之间相互关联、耦合,使得数据存在空间上的关联性,并且时序数据当前时刻值与历史数据亦存在时间上的关联性[9],这与LSTM善于处理高维、强耦合、高度时间相关性数据的特点相吻合。由于风电机组发生故障是一个设备状态逐渐演化的过程,具有强烈的时间特性,因此,提出了一种基于LSTM网络的故障预测方法。通过上海电气集团故障诊断平台采集数据,验证了该模型在故障随时间序列演变过程中,能尽早地做出预测,且具有较高的精确度。

1 风电机组故障预测方法研究

传统的前馈型神经网络,输入信号只能在相邻信号源之间进行正向传播,同层级的神经元之间没有相互连接,因此不能发现数据在时间上的相关性[9]。而循环神经网络(Recurrent Neural Network,RNN)在前馈型神经网络同层级神经元之间引入反馈机制,不仅能使隐藏层神经元获取输入层的输出信号,同时也能获取来自其下一层的神经元反馈信号,使得神经网络在处理数据时能获取数据关于时间的相关性。

1.1 RNN

基本的RNN结构可看作同一层神经结构在时间序列方向上的连接,形成完整的神经网络循环体,如图1所示。图中,x t为t时刻的输入;yt为t时刻的输出;st为t时刻的隐藏层状态。神经网络在计算输出值yt时会将当前时刻的隐藏层状态传递到下一时刻,从而表达数据在时序上的相关性。

图1 RNN模型图

1.2 LSTM神经网络

RNN的结构比较简单,相邻两个时刻的神经元会相互共享隐藏层的信息,如图2所示。但RNN在时间序列过长时很容易产生梯度爆炸和梯度消失的问题,导致在训练时梯度的传递性不高[10],即梯度不能在长序列中传递,使RNN无法检测到长序列的影响。对LSTM神经网络引入门控机制,提高了网络的长期依赖能力,解决了RNN的梯度爆炸和梯度消失问题[11]。

图2 RNN结构

图2中,tanh为RNN模型的激活函数,tanh的数学表达式为

tanh将输入数据归算到[-1,1]之间,使RNN模型减少迭代次数。

LSTM模型训练的关键是细胞状态的更迭,ct表示细胞状态的这条线水平地穿过图的顶部。细胞的状态类似于输送带,其在整个链上运行,只有一些小的线性操作,保持信息不变流过整个链[12]。而LSTM具有删除或添加信息到细胞状态的能力,这个能力是由被称为门(Gates)的结构所赋予。门是一种可选地让信息通过的方式。LSTM单元中,包含3种类型的门控,通过门控对信息存储和更新,如图3所示。

图3 LSTM模型

门控分别为:输入门、遗忘门和输出门。每个门结构包含了一个以Sigmoid为激活函数的神经网络结构,其输出值(表示控制信息传递的比例)范围为0~1。输出值越小,信息传递的比例就越小,从而实现对历史信息的选择性遗忘。门控的一般形式可以表示为

其中,

式中:W为输入向量的权重;b为输入向量的偏置。

LSTM决定了上一步输出结果st-1的丢失和遗忘。该决定由被称为“遗忘门”的Sigmoid激活函数来实现。ft为“遗忘门”的门限,即历史状态ct-1被遗忘的比例,数学表达式为

式中:Uf、Wf分别为当前输入值x t和上一时刻记忆单元中输出st-1对应的权重系数。

“遗忘门”决定了对上一时刻信息是否保留。当前输出值为0时,前一时刻输出值清除;输出为1时,上一时刻输出值保留。

“输入门”决定了当前输入值x t有多少被保留在ct之中,实现对状态c的更新,其数学表达式为

式中:it为经σ结构计算当前输入x t与历史输入st-1后输入数据被保留下来的比例;Ui、Wi分别为当前输入x t与历史输入st-1的权重系数;c~t为当前时刻记忆单元所更新的状态值;Uc、Wc为更新细胞状态ct时刻输入x t与历史输入st-1的权重系数。

“遗忘门”和“输入门”可以实现对状态c的删除和更新。数据经过“遗忘门”与“输入门”之后被保留下来的状态数据如下:

“输出门”用来表示隐藏层的输出,其数学表达式如下:

式中:ot为输出门,决定当前记忆单元(cell)中的信息输出程度,ot为0时表示数据完全不输出,ot为1时表示数据完全输出;Uo、Wo分别为x t、st-1的权重系数。

1.3 基于LSTM的故障预测流程

本文以风电机组的齿轮箱为例,基于LSTM建立故障预测的数学模型,流程如图4所示。其中,包括对历史数据的学习和实时数据的监测。通过经验设定故障阈值,当模型计算数据超出阈值时,发出故障预警信号。

图4 风电设备故障预测流程

1.3.1 模型构建本文以加速度传感器采样得到齿轮在正常、磨损状况下的振动信号。由于输入信号维度较多,因此选取输入轴电机侧轴承y1、输出轴电机侧轴承y2,检测得到数据构造模型。模型的输入为

1.3.2 模型参数优化在LSTM中,参数的选择关系到整个模型的性能,其中超参数对模型的复杂性和学习能力起着决定性的作用。因此,对其进行优化能提高模型的学习能力和预测效果。优化参数如下:

(1)激活函数。激活函数能够给神经网络加入非线性因素,使得神经网络可以更好地解决较为复杂的问题[13]。虽然普遍使用tanh激活函数,但在本模型中使用Softsign激活函数代替tanh函数,Softsign函数相比tanh函数,速度更快且不易饱和。Softsign函数公式为

(2)训练周期。一个训练周期的定义是完整地遍历数据集一次。在训练中,一般应让训练持续多个训练周期,并将迭代次数设为一次。一般仅对非常小的数据集进行完整批次的训练时,才会采用大于1的迭代次数[14]。若训练周期数量太少,网络就没有足够的时间选取合适的参数;训练周期数量太多则有可能导致网络对训练数据过拟合。

(3)批尺寸。批尺寸定义为一次训练所选取的样本数,其决定了训练样本每次训练的样本数量,代表控制更新网络权重的频率。

(4)正则化。正则化方法有助于避免在训练时发生过拟合。Dropout是一种常见的正则化方法[15],可以随机地临时选择一些中间层的神经元,使这些神经在本次迭代中输出为零,同时保持输入层和输出层的神经元数目不变。在反向传播并更新参数的过程中,与这些节点相连的权值不需要更新。但是这些节点并不从网络中删除,并且保留其权值,使这些节点在下一次迭代时重新被选中,作为起始作用点参与权值的更新。

(5)网络层数和隐藏层神经元个数。采用网格搜索的方法对网络参数进行优化。对比训练模型的输出预测结果在不同模型层数、隐藏层神经元个数下的均方根值和损失后,选择模型表现最优的参数值[16]。网络参数如表1所示,模型设定了2层LSTM神经网络,第1层记忆单元数为32个,第2层为16个。

表1 网络参数

(6)网格搜索法。网格搜索法作为一种常见的调参手段,是一种穷举方法。给定一系列超参数,在所有超参数组合中穷举遍历,从所有组合中选出最优的一组超参数作为最优解。

2 故障预测方法的实验验证

2.1 实验数据来源与分析

本文数据来源于上海电气集团故障诊断平台。实验平台由风机齿轮箱、变速驱动电机、轴承、传感器、主轴等各部件组成,通过安装、调试可模拟齿轮箱的各种故障。

选择振动能量较为集中和突出的齿轮箱输出端的轴承座作为测点位置,对输入轴电机侧轴承y1、输出轴电机侧轴承y2进行监测,获取其振动加速度信号。实验采用电火花加工技术在不同的齿轮上分别植入损伤点,模拟高速轴小齿轮齿面磨损和低速轴大齿轮断齿所引起的故障状态。设定采样频率为(2 000×2.56)Hz,利用加速度传感器在转速为1 470 r/min,加载电流为0.1 A时正常、磨损状态下的振动信号,对信号进行预处理得到齿轮振动信号50组,每种状态各25组。

2.2 故障状态下的模型测试

对数据划分后,使用验证数据集在LSTM模型上进行故障预测,验证数据集有5 771个数据。为了反映预测模型对于该数据预测的精确程度,数据在迭代训练中的损失值如图5所示。由图可知,训练集的损失在0~60次训练中迅速下降,但稍有波动;在60~85次之间逐渐平缓,之后又出现波动。考虑到模型训练耗时,以及在训练过程中会出现过拟合的问题,选取训练次数为80次。

图5 损失随迭代次数变化曲线

根据经验设定阈值(在齿轮故障中设定阈值T=0.2)之后,对比模型输出预测值和真实值加权残差,故障残差预测结果如图6所示。

图6 基于LSTM的故障预测结果

机组在正常运行状态下其故障残差很小,但故障状态出现时数据残差迅速增大,并且在随后工作中残差超出阈值线判定为故障,从而报警以利于尽早安排检修以及供电计划,避免故障的发生。

为了更好地反映LSTM模型的预测精确程度,迭代次数为80次时的预测结果分类混淆矩阵如图7所示。混淆矩阵中,对角元素对应预测结果的精确度。由图7可知,利用LSTM模型进行故障预测,预测结果具有较高的准确率。

图7 LSTM模型预测结果的混淆矩阵

3 结 语

本文针对风电机组运行时,各监测数据间耦合关系复杂的特点,提出以LSTM为模型的风电机组故障预测技术。首先,建立健康状态下的LSTM模型;然后,根据其运行数据与预测数据进行对比计算得出残差,当残差超出阈值时,预测其发生故障。但在建立模型过程中,模型计算时间相对较长,可进一步优化隐藏层数与神经元个数,使预测准确率进一步提升,从而使模型能够更快、更精确地预测出故障的发生,满足风电正常生产运行的需要。

猜你喜欢

时刻风电神经元
冬“傲”时刻
《从光子到神经元》书评
捕猎时刻
海上风电跃进隐忧
分散式风电破“局”
跃动的神经元——波兰Brain Embassy联合办公
风电:弃风限电明显改善 海上风电如火如荼
重齿风电
基于二次型单神经元PID的MPPT控制
街拍的欢乐时刻到来了