噪声环境下基于多层小波变换网络的轴承故障诊断方法研究
2024-04-10郑锋
郑锋
(金风科技股份有限公司数字化中心,北京 101102)
1 前言
滚动轴承作为机械设备的关键零部件之一被广泛应用于轨道交通、石化冶金、水电风电等领域,对其开展故障诊断技术研究,对于设备安全可靠运行具有重大意义。深度学习作为故障诊断领域的后起之秀,能直接对原始信号自动提取特征,建立从故障数据到故障类别的端到端映射,在提升故障诊断效率的同时,实现智能故障诊断,摆脱了设备状态监测过程对专家知识以及人工特征提取的依赖。
近年来,大数据和传感器技术的发展积累了大量的机械设备运行状态数据。在实验数据测试下,这些诊断模型都具有较高的精度。然而,在工程实际中,轴承的工作环境往往复杂多变,高噪声、不同工况和跨设备等场景下的轴承故障诊断具有极高的挑战性,高噪声场景下信号淹没在噪声中,轴承故障特征提取困难,导致现有方法无法满足实际应用要求。Gu等通过对原始信号进行变分模态分解后得到的二维时频图进行故障诊断。Gundewar等提出了一种基于时频变换和CNN相结合的诊断模型,再使用压缩技术来提升模型诊断速度。Li等为了改善模型可解释性,提出一种连续小波卷积层来代替原来标准CNN的第一层卷积层,使得此层具有实际意义,有效解决了高噪声数据特征提取困难的问题。
上述研究中,针对噪声环境下,使用信号处理的预处理方法对数据进行处理然后将处理后的数据用于神经网络训练,这样不仅过程烦琐诊断效果较差,而且难以应用于实际工业环境中。通过基于多层小波变换与自注意力机制构建相应的诊断模型,其中不仅可以通过小波变换层对故障信号进行处理实现数据的降噪,而且利用注意力机制使诊断模型能够更加有效地过滤掉与故障无关的信息,提高模型的诊断性能。利用江南大学提供的轴承故障数据集,在数据集上添加不同的噪声进行实验验证,并将所提模型与CNN、(Residual Networks,ResNets)残差网络、FFT-CNN的结果对比验证,证明所提方法良好的抗噪性能以及优越的诊断性能。
2 理论基础
2.1 卷积神经网络
卷积神经网络(CNN)是一种具有代表性的深度学习算法,其通过相应的卷积核进行卷积运算并加上偏置量在整体输入信号上进行特征提取,然后利用激活函数将特征输出。其计算公式如下。
2.2 小波变换
小波变换是一种强大信号处理工具,其通过使用小波函数对信号进行分解和分析。小波函数是一种有限长度的波形函数,可以在不同尺度和位置上对信号进行分析。小波变换通过对信号进行小波基函数的卷积来获取信号在不同尺度和位置上的表示。这种变换可以在不同频率范围内捕获信号的瞬时特征,对于非平稳信号的分析和处理有很大的优势。对于信号2x∈L(R)的离散小波变换如下:
式中,ψ*(t)是ψ(t)的复共轭。
2.3 注意力机制
注意力机制(Attention Mechanism)在神经网络与机械学习的模型中被广泛使用,通过注意力机制可以使模型在处理序列数据时更加准确和有效。传统的卷积神经网络中,只将前一层的所有神经元的输出作为后一层神经元的输入,相反得是在注意力机制中,神经元的输入不仅取决于上一层神经元的输出,而且还将所输入的数据按照不同部分进行加权,即对不同部分给予不同的权重,这样就可以实现在特征提取得过程中更加关注数据中的关键信息,忽略数据中不重要的信息,进而提高诊断模型得诊断精度以及效率。在诊断模型中注意力机制通过对各通道的特征加以自适应加权操作,进而实现抑制数据内不重要信息的作用。其主要原理结构如图1所示,通过对输入特征进行池化操作,并且获取不同维度通道的权重,并利用Sigmoid实施相关激活得到新权重值,最后将权重与初始特征值相乘并与初始特征值相加得到新的特征。
图1 注意力机制的工作原理
3 所提方法
3.1 小波变换层
通过小波变换层代替部分卷积层,结合小波变换的信号处理技术对数据分解出高频和低频信号,然后将低频信号和高频信号经行拼接,进而提高模型对故障信息的提取能力。由于采用小波变换层作为卷积的映射空间,在模型进行训练时,模型易出现过拟合现象。Dropout层是神经网络中的一种正则化方法,原理主要是在训练过程中随机将一部分神经元的输出置为0,也就是说,它们的权重不会被更新,同时其他神经元的权重将会按照梯度下降法进行更新。所以在多小波变换层后添加Dropout层,通过预先设定好的神经元概率,来避免网络出现过拟合现象,并且减少训练参数,从而提高模型决策效率。
3.2 注意力机制层
注意力机制可以使模型从复杂的信息中得到所需要的关注的重点。在本卷积模块中,先采用3×1的卷积,从局部感知振动信号的更细致的特征信息,并且采用1×1的卷积储存数据的原始信息,然后二者相互配合进而在更细致地提取故障信息的基础上进一步避免前一个卷积对非关键信息的错误关注。
3.3 模型架构
基于多层小波变换与自注意力机制构建相应的诊断模型,在诊断模型中小波变换层能够有效对振动数据进行降噪处理,注意力机制模块能够有效地过滤掉与故障无关的信息,提高模型的诊断性能。本模型的框架如图2所示,具体模型参数如表1所示。
表1 网络参数
图2 算法流程
4 实验验证
4.1 实验设计
为验证采用模型在噪声环境中优异的诊断性能,本实验采用江南大学标准数据集,并且对数据集数据分别加入-6dB、-4dB、-2dB、2dB、4dB以及6dB的白噪声,表达式为公式(3),用于检验模型在不同噪声环境的抗干扰能力。将所提方法与CNN、残差网络以及FFTCNN三种模型进行对比,用于验证本模型相较于其他模型优越的诊断性能。CNN模型即传统卷积神经网络,由五个相应的卷积层和一个全连接层组成;残差网络在一维卷积网络中加入残差模块,将部分一维卷积层转化为残差层,提高了模型特征提取能力;FFT-CNN首先利用傅里叶变换将所得到得数据进行预处理,然后诊断模型于CNN模型相同,经过所提方法与三个模型对比,通过与CNN与残差网络对比可以证明所提模型的诊断性能,通过所提模型与FFT-CNN对比证明所提方法的降噪能力。最后使用,断精度结果图、诊断过程图、以及特征可视化图,将实验结果进行可视化。
式中,Psignal与Pnoise为原始信号以及噪声信号的有效功率。
江南大学数据集的数据以50kHz的采样频率采集正常轴承和单点缺陷损坏轴承的振动信号,其中包括正常、内圈故障、外圈故障、滚动体故障四种状态的数据。采用重叠采样的样本分割方式,每1024个采样点作为一个样本,每种工况下的每类健康状态标记样本共有500个。
通过使用PyTorch深度学习框架构建模型,在验证过程时采用具有自适应学习率(初始学习率为0.01,权重衰减系数为0.0005)的Adam优化器来训练。实验样本批次设置为32,训练轮次为200;采取10次的随机实验的平均诊断精度验证所提方法的有效性。
4.2 不同模型结果分析与对比
各方法在的诊断结果如图3与表2所示。通常认为在添加白噪声时,SNR≤0为强噪声环境。由表2可以看出,在-4dB环境下,传统卷积神经网络、残差网络以及使用输入使用傅里叶变换进行预处理的(FFT-CNN)的诊断精度分别为74.90%、76.68%、81.962%。由结果可以明显看出相较传统卷积神经网络残差网络以及对数据事先进行预处理的方法的诊断精度明显更高。相应的所提方法在-4dB环境下的诊断精度为84.08%明显优于其他模型。而且相应的准确率标准差所提方法为0.82%相比较其他模型最低。证明所提方法的稳定性也优于其他模型。由图4不同方法在-6dB环境下单次训练结果可以看出,对比算法在迭代20次后,训练精度逐渐收敛趋于稳定,然而,验证精度在趋于平衡后明显低于了训练精度,表明存在明显的过拟合。所提方法在图上明显高于其他方法,而且并未出现过拟合现象。
表2 不同方法在-4dB噪声下平均诊断精度
图3 不同方法诊断精度
图4 不同方法在-4dB环境下单次训练结果
为验证小波变换层对数据的识别能力,将某次已训练好的模型对测试集进行验证,将四层小波变换层后的特征进行可视化。使用t-SNE将模型提取的特征降至为二维平面,并且以散点图呈现特征聚集效果。其结果如图5所示,由图(a)到图(b)可以看出,数据虽经过部分处理,但由于数据总体分布比较复杂,各数据之间相互交叉难以区分不同类别;由图(c)到图(d),可以看出,随着模型的深度增加,数据的区分度明显增加,说明所提方法对特征提取的优异性。
图5 所提方法不同层的特征可视化
5 结语
目前,大部分故障诊断方法研究基于实验室实验装置所得到的数据进行验证,但实际工业环境多为高噪声环境,与实验室环境差异过大,导致目前所研究的诊断模型难以应用于实际的工业环境中。基于小波变换与注意力机制,不仅结合了小波变换在噪声环境中对故障特征良好的识别能力,而且结合注意力机制自身的特点,即注意数据中有用信息,抛弃数据中无用信息,进一步对模型进行优化,提高了模型的故障识别能力。通过在江南大学故障数据集中加以高噪声模拟高噪声环境下的故障数据,并且对比3个目前主流的故障诊断模型,对模型优异的诊断能力以及稳定性进行了验证,实验结果证明了所提方法在高噪声环境下的诊断能力以及稳定性明显优于对比模型的方法。