APP下载

基于CNN-BiGRU的风机叶片故障诊断*

2022-08-04王永平张蕾张晓琳徐立韩朋张飞

内蒙古科技大学学报 2022年2期
关键词:结冰风机准确率

王永平,张蕾,张晓琳,徐立,韩朋,张飞,3

(1.内蒙古科技大学 信息工程学院,内蒙古 包头 014010;2.包头医学院 计算机科学与技术系,内蒙古 包头 014010;3.华北电力大学 可再生与清洁能源学院,北京 102206)

风能作为可持续的清洁能源,由于其安全性、稳定性及低成本,在可再生能源的未来发展中发挥着重要作用.风机叶片是风电机组进行能量转换的核心部件之一,极易受温度低的影响而造成叶片结冰故障.对风机叶片进行及时准确的结冰故障诊断,可以提高风电场的发电效率和风电机组的运行寿命.

目前,风机叶片结冰故障诊断常采用无损检测技术,其中最突出的是声发射检测技术[1]、振动检测技术[2]以及无人机检测技术[3].除无损检测技术外,还有超声波[4]、光纤光栅[5]等损伤识别技术.超声波主要在风机出厂前的静态检测中应用,声发射与振动等动态检测需要在叶片外加装传感器收集叶片动态信息,成本高且容易破坏叶片动力学特性[6],而无人机检测技术需要停机检测,且存在续航时间短、飞行受环境因素制约等缺点[7].

SCADA系统作为当前应用最为广泛、技术发展最为成熟的数据采集与监控系统,由于其蕴含丰富的风电机组的运行状态信息且无需安装额外的传感器从而降低监测和维修的成本,因此在大量风电设备中得到应用[8].目前基于SCADA数据的风机叶片结冰故障诊断方法常用机器学习方法和深度学习方法.文献[9]采用支持向量机和随机森林模型与Stacking策略相结合的方法对特征选择后的SCADA数据进行训练,有效诊断风机叶片结冰故障.然而,基于“信号处理的特征提取+机器学习”故障分类的传统诊断方法需要复杂的信号处理技术以及大量的诊断经验,不能达到风机叶片智能诊断的要求.目前故障诊断领域研究的热点是应用深度学习方法实现数据的自主学习.文献[10]提出一种基于小波系数的全卷积神经网络处理风力发电机的SCADA数据,通过对小波系数的改进增强特征信息,完成风机叶片故障特征提取和分类.文献[11]采用滑动窗口和投票系统等预处理方法,将原始SCADA数据转化为新的数据形式拟合长短期记忆网络,用于风机叶片故障检测.上述方法需要对数据进行复杂的预处理,仅从数据的变量之间或者时间序列方面进行分析,忽略了SCADA数据存在变量关联和时序依赖等特殊性,影响故障判别结果的准确率.

选用卷积神经网络(Convolutional Neural Networks, CNN),双向门控循环单元(Bidirectional Gated Recurrent Unit, BiGRU),提出一种基于CNN和BiGRU的SCADA数据时空特征融合的故障诊断方法,首次应用于风机叶片故障诊断.利用深度学习的特性,挖掘不同水平和不同维度的有效故障特征,从而丰富特征信息,加快提取复杂特征过程的速度,达到高效状态监测和故障识别的效果.

1 相关理论

1.1 门控循环单元

循环神经网络(Recurrent Neural Network, RNN)是一种处理时间序列数据的模型,通过每层节点的连接结构来存储之前的信息,利用这些信息影响后续节点的输出.

原始的循环神经网络缺乏学习序列数据的长期依赖性,容易产生梯度消失或梯度爆炸[13],使得基于梯度的优化方法变得比较困难.为解决这个问题,其2个扩展模型:长短期记忆网络(Long Short-Term Memory, LSTM)和门控循环单元(Gated Recurrent Unit, GRU)先后被提出来.GRU网络在各种任务中表现出与LSTM类似的性能[14],其在合理利用数据的时间依赖关系上减少网络计算的复杂度,加快故障检测速度,在准确率方面同样取得了较优的效果.GRU网络结构如图1所示.

GRU时刻t隐藏层计算公式如式(1)~(4)所示,包括更新门z,重置门r,隐藏层输出h.

zt=σ(Wz[ht-1,xt]+bz) ,

(1)

rt=σ(Wr[ht-1,xt]+br) ,

(2)

(3)

(4)

式中:σ为sigmoid函数,tanh为双曲正切函数,⊙为点积,W和b为权重和偏置.

图1 GRU网络结构

1.2 双向门控循环单元

BiGRU是基于GRU的另一种变体网络.单向GRU处理时间序列的过程中,当前时刻的输出只包含前一时刻获取的信息,无法捕获未来时刻的信息,SCADA数据的时间依赖关系不能很好地反映出来.使用BiGRU引入未来时刻的信息,为当前时刻的状态分类提供判断依据.网络结构能提供输入序列中每一个点的过往时刻和未来时刻的信息[15].BiGRU网络结构如图2所示.输出由正向网络结构和反向网络结构组成,采用矩阵拼接的形式将2种不同时序方向的GRU输出整合为最终的输出,输出值为式(5)所示:

(5)

图2 BiGRU网络结构

2 基于CNN-BiGRU融合的风机叶片故障诊断方法

基于CNN-BiGRU融合的深度学习网络结构如图3所示.

图3 基于CNN-BiGRU的风机叶片故障诊断模型框架

首先采用风电机组设备自带的各类传感器作为实验数据的采集系统,对叶片实时的运行状态信息进行采集、存储,以多变量时间序列的形式展示,对分类模型进行构造,该模型融合CNN和BiGRU在SCADA时间序列分类任务中的优势,运用CNN模型自适应提取原始数据变量信息之间的特征,结合双向GRU模型分析并挖掘出叶片在不同时间点上运行状态的依赖关系,根据数据存在的特殊性,从变量之间和时间节点两方面充分获取数据蕴含的深层特征信息,之后将同shape的特征张量通过Merge层的Concatenate函数进行拼接操作,最后进入输出层通过Softmax函数输出分类结果.

CNN分支模型中,经过尺度变换、时间切片等预处理后所得到的时间序列片段输入到CNN中,通过堆叠3个卷积块,基本的卷积块包含有卷积层,批量归一化层,激活函数ReLU,将每个卷积块的滤波器大小分别设置为{128,256,128}来构建CNN网络进行卷积操作,通过最大池化和全连接层输出提取出来的SCADA时序序列的空间特征图.本文的CNN分支模型网络结构如图4所示.

图4 本文的CNN网络结构

BiGRU分支模型中,通过对层数超参k的基于BiGRU的端到端神经网络模型进行实验,使用准确率Acc作为判定标准,实验验证合适的模型参数能有效提高分类准确率.实验结果如表1所示.

表1 端到端BiGRU模型层数超参实验结果

实验数据表明,当端到端BiGRU的层数k从1增长到3,模型在测试集上的准确率不断提升.模型层数k大于3时,准确率保持平稳,但在模型层数k=4时,运行时间加大较多.因此,采用k=3构建BiGRU网络,每层神经元个数分别设置为{128,128,64},为了防止网络过拟合,在BiGRU网络层上加入了Dropout层.

在融合模块中,Merge层提供了一系列用于融合2层或2个张量的对象和方法,融合CNN网络和BiGRU网络提取的特征过程中,使用Concatenate函数对接收的两个模型的同shape张量进行拼接操作,其本质是有关维度的一个联合,axis=0表示列维,axis=1表示行维,沿着通道维度连接2个张量.最后将融合后的特征张量经过输出层,通过Softmax函数,对输出的信号归一化为类别0(正常值)或者1(异常值)的概率Pk(k=0,1),并将概率大的类别作为模型分类的结果.

网络层需要考虑的主要因素是滤波器的大小和数目、填充操作、步长值,这些参数的设置会影响提取的特征信息是否全面准确,最后的分类效果是否精确.表2为模型结构参数设置.

表2 CNN-BiGRU模型结构参数

(c)融合模型结构参数

通过表2可知,Conv1D-1层具有128个大小为8*512的滤波器,并在垂直方向上以1个单位的滑动窗口进行卷积操作,之后Conv1D-2和Conv1D-3层分别用256和128个大小为5*1和3*1的滤波器执行操作.Relu激活函数位于卷积层,其功能是将非线性可分离数据转换为线性数据.网络层的输出比输入数据越来越复杂,对于简化数据以获得高精度是必要的.

3 实例分析

3.1 实验数据集及预处理

实验采用的数据来自全球最大风力涡轮机制造商之一Goldwind的风电机组的真实监测数据,考虑到在时间尺度上保持数据的连续性,将其中3号机的SCADA数据作为实验的数据集,每条数据代表一个时间戳(每个时间戳包含多个连续数值型监测变量,每7 s采集一次).

此风电机组的SCADA监测数据包括数百个维度,结合风力发电机叶片结冰故障业务背景,对可用数据进行初步筛选,保留26个连续数值型变量的监测值,包括风电机组的叶片数据、环境参数和电机数据等多个方面的特征信息,数据状态参数描述如表3所示.

表3 SCADA风机数据26个参数描述

3.2 数据分析及预处理

研究的主要目的是对数据进行有效分类以确定风机叶片是否存在结冰故障,不考虑结冰形状和结冰程度,因此,上述研究属于二分类问题.并且针对一些关键数据进行简单的分析.

将风电场的3号机运行的329.28 h作为实验的数据集,每隔7 s记录一条数据,因此获得169 344条数据,记录为正常状态和故障状态.各状态数据量占比如表4所示.

表4 各状态数据量占比

从表4中可以发现,结冰故障状态的数据仅占所有数据量的6%左右.风机在实际运行中,大部分时间都是处于正常工作的状态,一小部分时间处于结冰状态,所以SCADA系统采集到的风机实时数据正常数据远远大于结冰数据,是数据不平衡问题.

针对上述数据分析提到的风机叶片的正常状态和故障状态数据量不平衡问题,采用滑动窗口的方法增加故障数据,可以有效的对类别不平衡问题进行最大程度的消除.首先将输入的多元时间序列分割成一组长度为512的片段,每个片段代表约1 h内风力机的状态,其次采用滑动窗口的方法解决数据量不平衡问题,具体方案如下:通过将步长设置为16(代表112 s的信号)的滑动窗口生成重叠的负片段(代表结冰的片段)增加负样本(代表结冰的样本)的数量.

由于实验数据是从不同传感器上获取的数据,存在量纲和取值范围不同的现象,如果不加以处理直接用于建立模型会降低模型诊断的精确度,因此采用标准化方法处理数据,使处理后的新数据服从正态分布,避免各个参数取值差异过大导致神经网络出现权重不均衡问题.

标准化处理数据,需要使用到原始数据的均值、标准差等.经过处理后,得到标准正态分布的数据,其均值为0,标准差为1,计算公式如式(6)所示.

(6)

式中:x*为标准化后的新数据,x为原数据,μ为原始数据的均值,σ为原始数据的标准差.

将处理后的数据集划分为训练集与测试集用于模型的训练、超参数的优化及测试,为后续构建深度学习模型奠定基础.

3.3实验设置

在实验数据处理、分析中,模型所用损失函数为二分类交叉熵损失函数,其公式为:

(7)

式中:(xi,yi)为输入样本对,N为样本总数,f(x)为Softmax函数.模型选用Adam优化器进行训练,其具有计算每个参数的自适应学习率,收敛速度非常快等优点,更适用于此模型.实验训练参数如表5所示.

表5 实验训练参数

3.4 实验结果与分析

3.4.1评价标准

实验中采用的评价指标有精确率(Precision,P)、召回率(Recall,R)、准确率(Accuracy,Acc)和F1值.设总的测试集个数为TP+TN+FP+FN,其具体含义如表6所示.

表6 评价指标相关参数含义

精确率是针对预测样本而言的,计算并预测出某类样本中,有多少是被正确预测的.召回率是针对实际样本而言,有多少被正确的预测出来的.准确率和F1值用于衡量模型综合性能,指标越高表明模型诊断能力越强,综合性能越好.评价指标公式如式(8)~(11)所示:

(8)

(9)

(10)

(11)

式中:真阳性(TruePositive,TP)即被判定为正样本,事实上也是正样本;假阳性(FalsePositive,FP)即被判定为正样本,但事实上是负样本;假阴性(FalseNegative,FN)即被判定为负样本,但事实上是正样本;真阴性(TrueNegative,TN)即被判定为负样本,事实上也是负样本.

3.4.2分析结果

为了验证所提出模型的改进对故障诊断效率的影响,选用LSTM模型、进一步优化的GRU模型以及CNN-BiGRU模型进行训练,运行时间对比如表7所示.

表7 不同模型的运行时间对比

通过表7可知,CNN-BiGRU融合模型在平均执行时间和总训练时间上优于其他模型,仅花费LSTM模型[12]训练时间的10%左右,基于风机叶片结冰故障诊断对及时性需求的任务背景,选用融合模型更加适用于对其是否结冰进行有效鉴别.LSTM模型和GRU模型在运行时间上的对比,可以看出GRU模型在训练时间上缩减近2 h,验证了其优化结构更适合于该融合模型.

为了验证该模型在测试集上可以表现良好的故障分类效果,选择CNN模型、LSTM模型、GRU模型、BiGRU模型、WaveletFCNN模型[10]这五种网络模型与文中建立的CNN-BiGRU网络模型进行对比.将经过数据预处理后的风机叶片SCADA数据集分别输入到上述6种网络模型中进行计算,其他网络模型训练参数与本文的网络模型训练参数设置一致,其准确率和F1值对比结果如表8所示.

表8 不同模型的准确率及F1值对比

由表8可知,相比其他深度学习网络模型,所提出的CNN-BiGRU融合模型的故障分类效果明显更好,其准确率达到93.83%,比单一使用的CNN和BiGRU网络模型分别高出24.02%和2.27%,F1值也相对较高达到94.36%,由于F1值属于综合评价指标,该指标的使用可以准确地体现出模型的性能,F1值越高代表其网络模型分类性能越好.

表9为在测试集上不同模型的分类混淆矩阵各元素的对应数值、精确率以及召回率.因为在实际风机叶片结冰现象中未结冰的情况总是多于结冰的情况,并且结冰严重影响风电场的正常运行,由此可见,在日常地实际应用操作中,正确鉴别结冰状态与分类出未结冰状态相比,前者更应该受到重视.从表7可以看出,本文所构建的模型对于结冰情况的正确分类数是130,错误分类数是9;该模型的精确率是0.946 4,召回率是0.940 8,分类的准确率明显高于其他对比模型.本文构建的模型能够更准确地鉴别结冰情况,正确预测样本的数量占有较高的比例,对数据的分类效果较稳定,并没有出现极端化现象.

对比实验验证了提出的CNN-BiGRU融合的深度学习方法凭借其在时间序列上独特的时空特征提取能力,充分利用风电机组的信息进行故障分类,较其他深度学习方法有更好的分类效果,有效地提高故障诊断的效率和精度,使风电场能够安全高效地运行,使风能这种绿色清洁能源得到更充分地利用.

表9 不同模型验证集分类效果对比

4 结论

针对故障诊断技术处理复杂海量风机运行状态数据时准确率低的问题,提出一种基于CNN-BiGRU融合的深度学习故障诊断方法,该方法首先在处理SCADA系统数据时,为解决数据的不平衡以及量级差异问题,采用滑动窗口的方法增加故障样本数量以达到数据平衡状态,采取标准化方法消除数据变量之间存在的量级差异,根据时间连续性的特点对预处理后的数据进行切片处理,生成多元时间序列数据.

针对原始深度学习模型处理多元时间序列时存在数据特征信息提取不全面的问题,引入卷积神经网络自适应学习变量之间存在的关联特征获取数据的空间特征图,选用循环神经网络中的优化结构门控单元分析时序依赖关系获取数据的时间特征图,双向结构引入未来时刻的信息,提升对时间的敏感度,并通过超参数实验选择适当的模型参数,可以有效提高分类准确率,提升时间利用率,通过融合两个模型从而充分利用数据的特征信息进行故障分类任务.

最后利用风电场实际叶片结冰的SCADA数据进行对比实验,验证所建立的模型具有全面深入信息的学习能力,能够更好的检测故障.此外,与目前最先进的空间特征提取模型CNN、时间特征提取模型BiGRU以及WaveletFCNN模型进行比较,该模型取得了优异的性能.综上所述,该模型在时间效率和故障检测准确率方面取得了较好的效果,为风机维护提供了强有力的参考.

猜你喜欢

结冰风机准确率
通体结冰的球
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
高炉风机用电动机制造技术研究
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
汽轮机轴封风机疏水管线改造
冬天,玻璃窗上为什么会结冰花?
鱼缸结冰
某热电厂风机电机节能技术改造