基于MSCNNSA-BiGRU的变工况风电机组滚动轴承故障诊断研究*

2022-08-25安文杰陈长征金毓林孙鲜明

机电工程 2022年8期

安文杰,陈长征,田淼,金毓林,孙鲜明

(1.沈阳工业大学机械工程学院,辽宁沈阳 110870;2.宁波坤博测控科技有限公司,浙江宁波 315200)

0 引言

作为风电机组重要的零部件,滚动轴承的健康状况直接影响整个风电机组的正常运行[1]。据风电行业统计[2],风电机组约30%的机械故障与滚动轴承相关。同时,风电机组在重负载、变转速环境下长期运行,导致滚动轴承极易损坏。滚动轴承一旦发生故障,则会影响整个机组的性能稳定性,甚至造成停机。因此,对滚动轴承进行快速、有效的故障诊断,对于保证风电机组的稳定运行,降低整体维修成本具有重要意义。

传统的轴承故障诊断主要通过振动信号分析法分析轴承的故障特征。XIANG Ling等人[3]利用最小熵解卷积和1.5维能量谱结合,实现了对风电机组轴承复合故障的诊断。CHEN Bing-yan等人[4]提出了一种增强组合差分形态滤波器,用于对强噪声背景下的轴承故障特征进行检测。洪达等人[5]提出了一种多元变分模态分解和分数阶傅里叶变换相结合的方法,对滚动轴承的早期故障进行了提取。

然而上述方法对先验知识要求高、效率低,且不具备通用性。

近年来,深度学习理论逐渐成为故障诊断领域中炙手可热的诊断方法。它能够自动提取信号特征。研究者基于深度学习理论建立了“端到端”的故障诊断模型[6]。XU Zi-fei等人[7]提出了基于一维卷积神经网络(one-dimensional convolutional neural network,1D-CNN)联合特征提取的轴承健康监测方法,通过耦合自编码器可以获得较高的故障诊断精度,以及较低的诊断延时。张西宁等人[8]采用小尺度卷积核,以跳动的方式进行采样,解决了卷积神经网络中最大池化丢失大量信息和平均池化模糊重要特征的问题。

虽然上述方法对各自的故障诊断具有较好的诊断效果,但在使用过程中也会受限。主要表现在以下2个方面:

(1)这些方法均采用单尺度卷积核提取故障特征,风电机组轴承与其他部件振动耦合会导致振动信号表现多尺度特性,故障信息呈现不同的频率变化,单尺度卷积核难以有效提取其全局与局部故障;

(2)振动信号是时序的,在时间维度上也蕴含着丰富的信息。

循环神经网络[9](recurrent neural network, RNN)能够在顺序步骤之间有选择传递信息,一次只处理顺序数据的一个元素,非常适合处理时序数据问题。然而,RNN存在梯度消失和梯度爆炸的问题。

为了解决上述这些问题,HAO Shi-jie等人[10]提出了长短时记忆网络(long short-term memory network, LSTM)结构,在RNN中引入输入门、遗忘门和输出门,其特点是隐含层节点的输入包含了该隐含层节点在前一个时刻的输出,不仅可以有效处理序列数据,而且能够解决梯度消失及梯度爆炸问题。

但相对于RNN、LSTM的结构更加复杂,需要复杂的网络调参,导致训练难度增加。AN Dong等人[11]提出了门控循环单元(gated recurrent unit, GRU),可以认为是一种改进LSTM网络结构的变体,在故障诊断领域中得到了广泛应用。但是经典的门控循环单元模型中,状态是根据序列由前向后传递的,忽略了后序状态对前序状态的影响。

双向门控循环单元(bidirectional gated recurrent unit, BiGRU)是GRU的一个变体,既能提取振动数据的前后时间序列问题,又能解决长期依赖问题,适合故障诊断的工程应用。

针对以上问题,考虑风电机组运行工况复杂,采集的数据具有多尺度特征,笔者提出一种基于多尺度卷积神经网络(multi-scale convolutional neural network, MSCNN)和自注意力机制(self-attention, SA)的[12]双向门控循环单元的,针对变工况条件下风电机组滚动轴承故障的诊断方法(MSCNNSA-BiGRU)。

首先,通过MSCNN提取原始振动信号的多尺度特征信息;然后,BiGRU结构挖掘原始振动信号的历史与未来信息,自注意机制重点关注故障特征;最后,将特征信息融合成一个特征向量,输入到SoftMax层实现故障分类。

笔者采用实际采集的不同工况下风电机组发电机滚动轴承数据集,对所提方法的有效性和可行性进行验证。

1 理论介绍

1.1 多尺度卷积神经网络

传统的CNN网络故障诊断结构中,采用相同尺度的卷积核提取故障特征,将其中一层的神经元作为回归实现故障分类[13],这样会导致一些详细的局部特征丢失。

为了解决该问题,基于MSCNN,研究者们采用不同尺度的卷积核提取特征,有效地提取了全局和局部故障特征,提高了模型的泛化能力及鲁棒性,从而获取了精准的故障分类结果。ZHU Jun等人[14]将最后一个卷积层与之前的池化层合并形成了一个多尺度层,在人脸识别任务中获得了良好的效果。JIANG Guo-qian等人[15]构建了一个1D的多尺度模型,对风力发电机的齿轮箱进行了故障诊断。

在此,笔者提出一种基于多尺度卷积神经网络(MSCNN)和自注意力机制(SA)的,变工况条件下风电机组滚动轴承故障的诊断方法(MSCNNSA-BiGRU)。

在笔者所提方法中,模型输入为原始振动信号。基于多尺度卷积神经网络(MSCNN)模型,如图1所示。

图1 MSCNN网络模型

图1中,原始信号首先由4个不同尺度的卷积核进行多尺度的特征提取,再基于多个并行的卷积层和池化层学习特征,最后利用SoftMax分类器进行故障分类。

对于输入的振动信号X=[x1,x2,x3,…,xn],笔者采用不同尺度的卷积核S对原始振动信号进行特征提取,随着S取值的增大,递增的非重叠窗口将特征构造为连续的粗粒度信号Y(S)。

不同尺度卷积核提取过程,如图2所示。

图2 不同尺度卷积核提取特征

(1)

由图2可知:多尺度特征学习采用多对卷积层和池化层并行结构,不仅可以提高特征提取能力,而且可以从不同时间尺度的多个粗粒度信号中,提取高级特征信息,进行故障特征提取。

1.2 双向门控循环神经网络

由于振动信号是时序信号,为了更好地处理时间序列数据,笔者引入循环神经网络门控循环单元(GRU),如图3所示。

图3 门控循环单元

由图3可知:通过门控机制有效处理时间序列问题,重置门rt决定如何将t时刻的输入信息xt与t-1时刻的隐藏信息ht-1相融合,重置门值越大,在t时刻候选状态ht中,隐藏状态ht-1被重置的程度就越高;

ut和rt是t时刻的输入,其计算公式如下:

rt=σ[Wr⊗cat(ht-1,xt)]

(2)

ut=σ[Wu⊗cat(ht-1,xt)]

(3)

(4)

(5)

在经典的GRU模型中,特征向量是根据序列由前向后单向传播的,但振动数据是时间序列数据,经典的GRU网络在时刻t只能捕捉t时刻之前的历史信息。

在故障特征向量提取中,笔者希望从全局层面来提取故障特征,不仅考虑t-1时刻,也要考虑t+1时刻的状态信息,显然经典的GRU显然无法满足这一需求。

双向门控循环单元(BiGRU)是GRU的一个变体,既能提取振动数据的前后时间序列问题,又能解决长期依赖问题,适合故障诊断的工程应用。

BiGRU网络结构模型,如图4所示。

图4 双向GRU(BiGRU)的结构

由图4可知:BiGRU由向前传播和向后传播组成。

(6)

(7)

(8)

式中:Wt—前向传播的权重;Vt—后向传播的权重;bt—偏差项。

1.3 自注意力机制

自注意力是指关注重要信息,而忽略不重要信息的能力。注意力机制最早出现在图像处理领域,其作用是在特征提取时,重点关注某些特征信息。

在MSCNN神经网络中引入自注意力机制,可以使神经网络有选择性地进行训练,提高其学习能力。对于输入的振动信号X=[x1,x2,x3,…,xn],无需将所有的数据都输入到神经网络进行计算,只需选择一些与任务相关的信息输入到神经网络中,这样不仅可以提高运算效率,而且可以节省计算资源。

笔者使用注意变量z∈[1,n]来表示所选输入数据的索引。已知与任务相关的查询向量q和输入数据x,选择第m个输入数据的注意分布αm表示注意分布,是给定x和q下选择第i个输入向量的概率。

自注意力机制,如图5所示。

图5 自注意力机制

(9)

式中:s(xm,q)—评分函数,用于计算每个输入向量与查询向量之间的相关性。

s(xm,q)的表达式为:

s(xm,q)=VTtanh(Wsxm+Usq)

(10)

笔者计算出每个输入向量所占权重,然后通过注意力机制加权融合得到ySA,即:

(11)

式中:U，V，W—神经网络训练中学习到的网络参数。

2 基于MSCNNSA-BiGRU的故障诊断

在变工况背景下,基于多尺度卷积和自注意力机制的双向门控循环神经单元,笔者提出了一种风电机组滚动轴承故障诊断模型(MSCNNSA-BiGRU),其总体框架如图6所示。

图6 MSCNNSA-BiGRU网络结构

对于输入的一维振动信号X=[x1,x2,x3,…,xn],经4个不同尺寸的卷积核S1,S2,S3,S4进行多尺度的特征提取,不同尺度的卷积核虽然能够很好地提取故障特征;但随着网络训练次数的增加,容易产生梯度消失和梯度爆炸等问题。

为解决这些问题,笔者引入双门控循环单元(BiGRU)结构,不仅可以有效解决MSCNN梯度消失和梯度爆炸问题,还可以有效挖掘原始振动信号的时序特征信息。

同时,为了提高模型对重点故障特征的提取,忽略不重要信息,笔者采用自注意力(self-attention)重点关注故障特征,以增强模型的泛化能力及鲁棒性,提高模型在实际风电机组滚动轴承故障诊断中的故障分类精度。

汉诺威国际林业木工展览会的参展商将来自全球50多个国家和地区，约9万多名观众遍布100个国家和地区，是同类展会中国际化程度最高的盛会。Christian Pfeiffer在新闻发布会上说道：“来自世界各地的参展商将向全球专业观众展示他们的解决方案、应用和理念，来讲述如何塑造木材行业的未来。汉诺威国际林业木工展览会是创新成果的第一展示平台，它涵盖数字化、自动化、物联网平台及协作系统，展览规模无与伦比。从林业技术、家具和门窗制造到工具系统和表面处理技术，观众将领略各个领域的创新成果。展会将为观众带来家具生产设备、工业4.0物联网平台的现场演示，以及覆盖木工行业各领域的研究项目与交流活动。”

3 实验及结果分析

为了验证该方法的有效性,笔者采用实际采集的风电机组发电机轴承数据进行实验验证。

3.1 轴承数据介绍

实验数据来源于天津某风场,笔者主要采集发电机驱动端和自由端数据。该发电机型号为湘潭电机DFWG1500/4,轴承型号为SKF6330 M/C3 H深沟球轴承,通过安装在发电机轴承座侧面位置的ICP压电加速度传感器,针对其水平和垂直2个方向,不同工况下的振动信号进行数据采集。其中,采样频率为16 384 Hz,采样时间10 s。

风电机组发电机振动数据采集,如图7所示。

图7 风电机组发电机振动数据采集

笔者根据该风场25台风电机组采集到的发电机轴承数据,划分出4种状态,并针对不同转速下4种状态,采用起点随机的方式截取1 638个数据点作为数据样本,每种状态下生成1 000个样本,随机选取80%作为训练集,20%作为测试集[16]。

风电机组滚动轴承具体标签如表1所示。

表1 风电机组滚动轴承数据样本构造

不同状态下的轴承时域图如图8所示。

图8 不同状态轴承时域图

3.2 实验结果分析

笔者将表1中的训练样本A输入网络,进行训练,同时,为防止过拟合,引入Dropout层,采用梯度下降法,对神经网络损失误差反向传播进行优化(其中,迭代次数、学习率、Dropout分别为150,0.001,0.5)。

文献[17,18]中,研究人员采用128*1、64*1、32*1的卷积核进行特征提取,取得了较好的效果。

表2 不同尺度卷积核诊断准确率

由表2可知:笔者提出的实验2故障识别准确率最高,并且采用不同尺寸的卷积核(实验1～3)时的故障诊断准确率高于相同尺度的卷积核(实验4～6);

由于风电机组在变工况环境下运行,轴承与其他部件振动耦合会导致振动信号表现多尺度特性,单一尺度的卷积核难以有效提取全局和局部特征,并且卷积核过大易出现过提取特征情况,导致模型过拟合;卷积核过小无法有效提取全局特征,进而影响故障识别精度。

表1中,数据集A在MSCNNSA-BiGRU网络迭代50次,得到的故障识别准确率与损失值曲线,如图9所示。

图9 模型故障识别曲线图

为了保证测试结果的准确性,笔者采用十倍交叉验证法(10-fold cross-validation method)来降低训练集和测试集随机分配的偶然性,将原始振动数据划分成10个大小相等的子集(其中,9个子集作为训练集,1个子集用于测试模型),交叉验证重复10次(每个子集只使用一次作为验证),最终结果为10次交叉验证的平均值;并且在MSCNNSA-BiGRU网络中添加判断语句,当训练集数据连续迭代10次,损失值同时小于0.15时,停止迭代,加快诊断速度。

对比故障识别准确率和损失值变化曲线可知:在迭代到30次时,训练集的准确率达到95.69%,测试集的准确率达到94.18%,故障识别准确率曲线和损失值曲线趋于稳定,模型达到收敛状态。

以上结果进一步验证了笔者提出的基于MSCNNSA-BiGRU模型在风电机组滚动轴承故障诊断应用中的有效性。

3.3 变工况下模型性能分析

为验证所提模型在变工况下的故障分类准确率,笔者选用不同转速下的数据,分别构建数据集和测试集,并且将其与采用①CNN、②MSCNN、③CNN-BiGRU、④MSCNN-BiGRU、⑤MSCNNSA-GRU方法所得结果进行对比实验。

例如,笔者选取表1中的数据集A和数据集B作为训练集,数据集C作为测试集,对变工况下模型故障诊断性能进行评估(AVG表示3组实验结果的平均值),最终诊断结果如图10所示。

图10 变工况下模型故障识别准确率

由图10可知:在变工况条件下,MSCNN方法故障分类平均准确率为92.7%,高于对比方法;

对比实验①和②可知:在风电机组滚动轴承故障诊断特征提取时,采用经典CNN网络结构难以有效提取全局和局部特征,在变工况下模型诊断效果较差;多尺度卷积神经网络采用不同尺度的卷积核提取特征,可有效提取全局和局部故障特征,提高模型故障诊断能力[19];

对比实验①和③可知:在变工况条件下,双向门控循环单元能够提高模型的故障分类精度,提高模型的泛化能力;

对比MSCNN方法和④可知:引入自注意力机制,重点关注有效特征,神经网络有选择性地进行训练,可提高模型诊断能力;

对比MSCNN方法和⑤可知:相比于经典的门控循环单元,双向门控单元能够提取振动数据t+1的特征信息,更适用于对变工况下实际工程故障进行诊断应用。

由此可证明,基于MSCNNSA-BiGRU的风电机组滚动轴承故障诊断方法,变工况条件下具有良好的诊断性能。

为进一步验证该方法对时域信号全局和局部特征的自适应提取能力,笔者引入T-SNE算法,对输出层进行可视化分析,针对图10中的AB-C数据集进行可视化分析,结果如图11所示。

图11 AB-C可视化分析

由图11可知:基于MSCNNSA-BiGRU的风电机组滚动轴承故障诊断方法故障识别准确率高,能够精准地区分不同故障的类型,表明该方法具备一定的泛化能力和鲁棒性,适用于在实际工程变工况条件下,对滚动轴承进行故障诊断。

4 结束语

针对风电机组滚动轴承运行工况复杂,采集的数据具有多尺度特征的问题,笔者提出了一种基于MSCNNSA-BiGRU的变工况风电机组滚动轴承故障诊断方法,实现了对变工况背景下滚动轴承的故障诊断。

研究结论如下:

(1)基于MSCNNSA-BiGRU的变工况风电机组滚动轴承故障诊断模型,采用MSCNN提取原始振动数据全局与局部特征信息,BiGRU结构考虑了原始振动信号的历史与未来信息,更全面地提取了数据时序特征信息;同时,引入Self-Attention,重点关注故障特征,最后将特征信息融合成一个特征向量,输入到SoftMax层,实现故障分类;

(2)针对实际采集的风电机组电机驱动端数据,通过不同的模型进行了对比分析,所述模型10次平均结果94.18%的故障识别准确率,优于对比实验;

(3)采用变工况数据集进行故障识别,笔者提出的模型的平均故障识别准确率为92.7%,高于对比实验;通过T-SNE可视化分析,不同的故障类型能够精准的区分开,进一步说明了在变工况下,基于MSCNNSA-BiGRU的模型可对实际工程中的风电机组滚动轴承进行故障诊断。

在后续的研究中,笔者将重点研究背景噪声及其他设备激励源对多尺度卷积神经网络的影响,并提出相应的解决方案,以提高其故障识别的准确率。