APP下载

基于MR-DCA的滚动轴承微弱故障诊断

2024-04-11肖乾李楷文周生通汪寒俊宾浩翔常运清

华东交通大学学报 2024年1期
关键词:注意力机制卷积神经网络

肖乾 李楷文 周生通 汪寒俊 宾浩翔 常运清

摘要:【目的】针对滚动轴承微弱故障难以识别的问题,提出了一种基于MR-DCA的滚动轴承故障诊断方法。【方法】利用最大相关峭度解卷积以及共振稀疏分解的方法对输入样本进行预处理,可以有效地滤除原信号中的噪声,突出故障冲击成分。将所获得的故障分量的二维时频图以及原始信号作为网络的训练样本,经两个特征学习模块后,使用注意力机制对输入特征进行筛选,通过权值重分配可以有效地提高模型计算效率和识别精度。为了验证模型性能,使用某大学的滚动轴承微弱故障数据进行故障诊断分析,同时开展消融实验,对诊断模型各个模块的有效性进行验证。【结果】结果表明,所提出的方法识别准确率更高,且具有更快的训练速度和迭代速度。【结论】所提模型在进行滚动轴承微弱故障诊断时可以实现良好的诊断性能。

关键词:最大相关峭度解卷积;共振稀疏分解;卷积神经网络;注意力机制

中图分类号:TH133;U270.1 文献标志码:A

本文引用格式:肖乾,李楷文,周生通,等. 基于MR-DCA的滚动轴承微弱故障诊断[J]. 华东交通大学学报,2024,41(1):113-119.

Research on MR-DCA Based Diagnosis of Weak

Faults of Rolling Bearings

Xiao Qian, Li Kaiwen, Zhou Shengtong, Wang Hanjun, Bin Haoxiang, Chang Yunqing

(Key Laboratory of Conveyance and Equipment of the Ministry of Education of China, East

China Jiaotong University, Nanchang 330013, China)

Abstract: 【Objective】The MR-DCA based rolling bearing fault diagnosis method is proposed for the problem that rolling bearing weak faults are difficult to identify. 【Method】The input samples are pre-processed by using the maximun correlated kurtosis deconvolution and resonance-based sparse signal decomposition, which can effectively filter out the noise of original signal and feature the fault impact components. The obtained two-dimensional time-frequency diagrams of the fault components and the original signal are used as the training samples of the network, and after two feature learning modules, the input features are filtered by using the attention mechanism, and the model computational efficiency and recognition accuracy can be effectively improved through weight reassignment. In order to verify the model performance, a rolling bearing weak fault dataset is used for fault diagnosis analysis, while ablation experiments are carried out to verify the effectiveness of each module of the diagnostic model. 【Result】The results show that the proposed method has higher recognition accuracy, faster training speed and faster iteration speed. 【Conclusion】The proposed model can achieve good diagnostic performance in the diagnosis of rolling bearing weak faults.

Key words: maximun correlated kurtosis deconvolution; resonance-based sparse signal decomposition; convolutional neural networks; attention mechanism

Citation format:XIAO Q, LI K W, ZHOU S T, et al. Research on MR-DCA based diagnosis of weak faults of rolling bearings[J]. Journal of East China Jiaotong University, 2024, 41(1):113-119.

【研究意義】轴承发生微弱故障时,会产生周期性的冲击,但由于环境噪声的干扰,从原始信号中分离出故障特征并不容易[1]。如何在轴承早期故障时期实现故障特征的提取并准确识别,是滚动轴承诊断中的关键问题。

【研究进展】传统的时域分析和频域分析方法往往假设信号平稳且线性,然而微弱故障信号往往呈现非线性、非平稳和非高斯分布的特征,因此难以实现良好的诊断效果[2]。由于故障信号往往表现为冲击信号,Mcdonald[3]提出了一种最大相关峭度解卷积(maximun correlated kurtosis deconvolution, MCKD)算法并成功实现了齿轮箱故障的诊断。该方法适合对周期冲击进行分离,是较为典型的盲解卷积方法。然而该方法对于微弱故障信号效果不佳,且解卷积效果依赖于算法参数的选取[4]。在此基础上,Cui等[5]将VMD和MCKD方法结合实现了对滚动体故障的诊断。宋宇博等[6]将改进的EMD方法与MCKD结合实现了对滚动轴承早期故障的提取。李政等[7]在强噪声环境下使用MCKD与改进EWT结合的方法實现了滚动轴承早期故障识别。以上改进方法均有效提升了MCKD方法在微弱故障诊断方面的性能,为了实现最佳诊断效果,MCKD方法通常与其他算法结合使用。

共振稀疏分解(resonance-based sparse signal decomposition, RSSD)是Selesnick[8]提出的一种可以将信号平稳循环成分与故障冲击分离的算法,适用于对降噪信号进行进一步故障分离。孙占龙[9]研究了RSSD方法在滚动轴承故障诊断方面的应用。张守京等[10]使用改进的RSSD方法精确实现轴承复合故障诊断。周飞燕等[11]利用RSSD算法实现了齿轮箱的故障诊断。这些方法都有效实现了对故障冲击信号的分离,但在强噪声环境下,RSSD方法并不能实现良好的故障特征分离效果。

卷积神经网络(convolution neural network, CNN)具有自适应挖掘数据深层次特征的特性,可以实现针对抽象特征的分类识别。赵小强等[12]利用CNN实现了强噪声工况情况下的滚动轴承故障诊断。雷春丽等[13]利用改进的CNN实现了小样本情况下的滚动轴承故障诊断。然而上述方法都是从单一的时域或频域进行特征学习,模型鲁棒性不强,可能影响诊断精度。Wang等[14]提出了一种分别将小波系数和原始信号作为双通道CNN输入的方法,实现了煤矿生产中的微震事件检测。Song等[15]则利用双通道CNN对空间光谱特征进行融合,实现了高光谱图像的分类。张龙等[16]则提出一种双通道CNN-GRU模型实现了齿轮箱的故障诊断。【关键问题】然而进行双通道CNN模型往往计算量大,且有可能因为特征冗余引起过拟合,注意力机制由于其可以对输入特征进行自适应筛选的特性,在复杂样本的CNN模型训练中体现出独特优势。

【创新特色】基于上述原因,本文提出一种时频特征结合的滚动轴承微弱故障诊断方法。通过MCKD与RSSD结合对微弱故障信号进行降噪重构,将重构信号时频图以及一维原始信号分别输入双通道CNN进行深度特征提取,然后结合注意力机制对时频特征进行重筛选,最后对滚动轴承微弱故障进行分类,并通过某大学微弱故障实验数据验证了提出方法的有效性与优越性。

1 诊断模型与基本理论

1.1 诊断模型

滚动轴承微弱故障往往在时域上表现为能量低强度弱的冲击信号,为了实现对微弱故障的分离与诊断,本文提出了一种智能诊断模型。模型主要由两个阶段组成,分别是对输入样本进行预处理的MCKD-RSSD方法以及开展分类的改进的双通道CNN模型。模型的诊断流程如图1所示。

1.2 MR方法

最大相关峭度解卷积本质上是一个滤波算法。在计算过程中,以滤波信号的相关峭度值作为目标函数,利用一个有限冲击响应滤波器f获得相关峭度最大时的滤波信号。由于算法突出了信号中的冲击成分,可以有效地对原信号进行噪声的滤除,适用于开展后续研究。

共振稀疏分解可以将复杂的信号分解成平稳循环成分和瞬态冲击成分,瞬态冲击成分中包含大量故障信息,对其进行特征提取所得的样本适用于作为深度学习网络的训练样本。但滚动轴承微弱故障信号强度低,强烈的环境噪声会掩盖原信号中的冲击成分,因此共振稀疏分解难以在信噪比低的情况下实现良好的分离效果。

针对以上分析,本文提出将MCKD与RSSD两种方法结合,并使用粒子群算法分别对两种算法的参数进行寻优,以实现最好的降噪与微弱故障分离效果。

1.3 改进的双通道CNN模型

本文通过注意力机制,针对双通道特征进行权值重分配,有效避免了由于特征冗余引起的过拟合问题,提升了模型的训练速度以及识别准确率。

1.3.1 注意力机制

为了对诊断模型的融合输出[H=h1,h2,…,hn]使用注意力机制重赋权值,引入查询向量q,然后通过权值函数[sh,q]计算查询向量q和每个输入[hi]之间的相关性,得出一系列的权值。接下来使用Softmax对这些权值进行归一化,归一化后的结果便是查询向量q在各个输入[hi]上的注意力分布[a=a1,][a2,…,an],其中每一项数值和原始的输入[H=h1,][h2,…,hn]一一对应。[ai]计算式如下

根据注意力分布a可以有选择性的从输入信息H中提取关键信息,DCA架构采用的提取方式为软性注意力机制,即根据注意力分布对输入信息进行加权求和,最终结果Context为在识别中对分类结果影响更大的特征。其计算式为

1.3.2 DCA模型架构

将双通道CNN的输入以注意力机制的方式相结合,提出一种双通道融合模型的卷积神经网络模型DCA(dual-channel CNN combined attention mechanism),模型同时具有对时间和空间的特征处理能力。DCA的结构如图2所示。对原始信号使用MR方法处理的过程中,无法保证所滤除的全部为噪声信号,可能部分故障信息也被过滤,因此将原信号及MR方法处理获得的二维时频图共同作为DCA模型的输入。

DCA模型中每个通道包含两个特征学习模块,模块由卷积层、Dropout层和最大池化层组成。其中上通道的输入信号为原始信号,因此为一维卷积,输入样本的形状为5 121×1。下通道的输入信号为二维时频图像,因此为二维卷积,输入样本的形状为64×64。在特征提取模块中,两个卷积层之间的卷积核数量是不同的。卷积层有16个大小为10的卷积核,第二个卷积层有8个大小为10的卷积核。两个卷积层的激活函数设为ReLU。Dropout层被添加以防止过拟合,速率设置为0.5。为了降低特征维数,提高计算效率,提取更多的信号判别特征,在架构中加入最大池化层以实现微弱故障特征的放大。最大池化层设置大小为2,步幅为2。经过最大池化层后,连接两个通道的输出。经注意力机制进行特征权值重分配后最终输出预测结果。优化算法为Adam,学习率为0.001,损失函数为二元交叉熵。

2 滚动轴承微弱故障数据集

本文采用某大学的滚动轴承微弱故障样本进行实验,使用的数据采集仪器为CoCo80,采样频率为25.6 kHz,NSK6203型电机轴承,故障轴承位于电机驱动端与齿轮箱的同步带连接处,加速度传感器通过磁体底座部署在电机驱动端盖中。

在本实验中,通过加工具有确定损伤直径和深度的单点缺陷量化故障损伤程度,微弱故障形式统一为宽度2 mm,深度0.5 mm的微裂纹,并模拟了总共3种故障以及正常状态。其中故障位置包括内圈、外圈以及滚动体3种位置。本实验使用的滚动轴承如图3所示,其中图3(a)为外圈故障,图3(b)为内圈故障,图3(c)为滚动体故障,图3(d)为正常状态。

在本次实验中,每种样本采集8次,每次采集时间为20 s,去除在电机启动加速时间段的信号,获得每种故障类型的样本共500个。每种类型的数据随机抽取250个,按照80%和20%的比例划分训练集和测试集。训练集样本共有800个,测试集样本共有200个。

3 实验结果与讨论

3.1 实验结果

根据第1节中所提出的诊断模型,使用MR方法对输入信号进行降噪重构,并对重构信号使用短时傅里叶变换得到低共振分量二维时频图如图4所示。其中,M1为外圈故障,M2为内圈故障,M3为滚动体故障,M4为正常状态。可以发现,经处理所获得的二维时频图像,可以观察到多条水平清晰的条纹,说明经处理获得的信号有效分离出了特征频率并且在整个信号的持续时间均稳定存在。由此可以确定,噪声信号被有效滤除,微弱故障冲击得到有效凸显。

将经MR方法处理得到的二维时频图以及一维原始信号进行重构,以适应DCA训练格式。重构后模型上通道的输入为5 121×1的原始信号样本,下通道的输入为64×64的二维时频图。试验环境设置如下:Windows 10 64位操作系统,运行内存为16 GB,显卡为NVIDIA Quadro P600,程序语言为Python 3.6,程序运行环境为TensorFlow 2.1.0。训练时单次训练迭代大小、批大小、Adam算法学习率分别为30,100,0.001。为了充分利用训练数据集,严格评价DCA的学习性能,采用10倍的分层k-fold交叉验证。

绘制程序首次运行时,训练样本与验证样本的损失函数以及准确率随着训练迭代的变化曲线,如图5所示。可以发现,在前10次迭代中,训练样本与验证样本的损失函数值迅速下降,模型快速拟合;随后损失函数下降趋势减缓,在第20次训练迭代后两损失曲线几乎重合,下降斜率趋近于0,并在第23次迭代后停止下降,此时损失函数值停止下降且接近于0,模型完成收敛。而训练样本与验证样本准确度曲线在前15次训练迭代中迅速上升,准确度值接近0.98。在第18个单次训练迭代后准确度曲线重合,斜率为0,值达到最大0.981。

为了直观地显示模型诊断效果,使用混淆矩阵将测试集分类结果可视化,如图6所示。为了避免结果的偶然性,对输入数据进行10次随机重组,每次划分不同的训练集以及测试集,取10次诊断的平均结果作为模型的最终准确率。最终计算得出10次诊断的平均准确率为98.1%,证明本文方法具有很好的分类性能,且模型的鲁棒性与泛化能力优异。

3.2 消融实验与结果讨论

为了探索注意力机制和MR方法对识别准确性和效率的贡献,本节开展了一项消融研究。分别构建了3个诊断模型,第1个模型为将未经过MR方法处理过的时频图像及原始信号分别作为DCA输入。第2个模型则为将经过MCKD-RSD处理过的时频图及原始信号作为不加入注意力机制的传统双通道CNN输入(MR-DC)。第3个模型为没有MR方法处理且未加入注意力机制的双通道CNN模型,分别比较这3个模型的性能。

分别将测试集输入到训练好的模型中,为避免结果的偶然性,多次训练模型并开展诊断,取10次诊断的平均结果作为模型的最终准确率。计算得MR-DC模型、DCA模型以及DC模型的平均诊断精度分别为90.6%,87.1%以及80.1%。

为了进一步对比4种模型的性能,分别对4个模型统计其单次训练时间以及达到收敛的迭代次数,本文以准确率不再变化作为模型收敛的判据。结果见表1。

由表1可知,所提出的MR-DCA模型在3个指标上的表现都明显优于其他3个模型。对于MR-DC模型,输入的样本时频图具有更小的噪声,且原信号中的平稳循环成分被滤除,微弱故障冲击成分明显,相对于没有经过MR方法处理的样本,具有更加明显的特征,有效地提升了识别的准确性。而对于DCA模型,由于注意力机制的存在,可以自适应地对融合特征进行重赋权,对于结果影响不大的特征权值被降低,加快了模型的训练时间,同时减少了达到收敛所需要的迭代次数。因此,本文提出的MC-DCA模型,在去除噪声和平稳循环成分保留微弱故障冲击的基础上,通过注意力机制减少了输入特征的冗余,并通過权值重分配保留了对识别结果影响更大的特征,节省了算力的消耗,提升了整体诊断效率。

4 结论

1) 提出了一种基于MR-DCA的滚动轴承微弱故障诊断方法。首先通过MR方法对DCA模型的输入进行重构,有效实现了对原始信号的降噪重构以及微弱故障的凸显。同时在双通道CNN模型的基础上加入注意力机制,增强了模型的特征提取能力和整体计算效率,提高了诊断模型的精度。

2) 通过消融实验验证所提出方法的优越性,分别将本文提出的MR-DCA模型与MR-DC、DCA、DC模型对比,并对实验结果进行讨论。结果表明,本文所提出的方法识别准确率更高,且具有更快的训练速度和迭代速度。

参考文献:

[1]   刘湘楠, 赵学智, 上官文斌. 强背景噪声振动信号中滚动轴承故障冲击特征提取[J]. 振动工程学报, 2021, 34(1):202-210.

LIU X N, ZHAO X Z, SHANGGUAN W B. The impact features extraction of rolling bearing under strong background noise[J]. Journal of Vibration Engineering, 2021, 34(1): 202-210.

[2]   张菀. 基于信号稀疏表示的滚动轴承微弱故障特征提取方法研究[D]. 南京: 东南大学, 2018.

ZHANG W. Study on weak fault feature extraction of rolling element bearing based on signal sparse representation[D]. Nanjing: Southeast University, 2018.

[3]   MCDONALD G L, ZHAO Q, ZHOU M J. Maximun correlated kurtosis deconvolution and application on gear tooth chip fault detection[J]. Mechanical Systems and Signal Processing, 2012(33): 237-255.

[4]   张龙, 蔡秉桓, 熊国良, 等. 小波滤波与最大相关峭度解卷积参数同步优化的轴承故障诊断[J]. 振动工程学报,2021, 34(6): 1313-1322.

ZHANG L, CAI B H, XIONG G L, et al. Bearing fault diagnosis based on synchronous optimization of wavelet filter and MCKD parameters[J]. Journal of Vibration Engineering, 2021, 34(6): 1313-1322.

[5]   CUI H J, GUAN Y, CHEN H Y. Rolling element fault diagnosis based on VMD and sensitivity MCKD[J]. IEEE Access, 2021 (9): 120297-120308.

[6]   宋宇博, 刘运航, 朱大鹏. 自适应UPEMD-MCKD轴承故障特征提取方法[J]. 振动与冲击, 2023, 42(3): 83-91.

SONG Y B, LIU Y H, ZHU D P. Adaptive UPEMD-MCKD rolling bearing fault feature extraction method[J]. Journal of Vibration and Shock, 2023, 42(3): 83-91.

[7]   李政, 张炜, 明安波, 等. 基于IEWT和MCKD的滚动轴承故障诊断方法[J]. 机械工程学报, 2019, 55(23): 136-146.

LI Z, ZHANG W, MING A B, et al. A novel fault diagnosis method based on improved empirical wavelet transform and maximum correlated kurtosis deconvolution for rolling element bearing[J]. Journal of Mechanical Engineering, 2019, 55(23): 136-146.

[8]   SELESNICK I W. Resonance-based signal decomposition: A new sparsity-enabled signal analysis method[J]. Signal Processing, 2012, 91(12):2793-2809.

[9]   孙占龙. 基于共振稀疏分解的滚动轴承故障诊断方法研究[D]. 北京: 北京交通大学, 2017.

SUN Z L. Study on fault diagnosis of rolling element bearings based on resonance-based sparse decomposition[D]. Beijing: Beijing Jiaotong University,2017.

[10] 张守京, 慎明俊, 杨静雯, 等. 改进的共振稀疏分解方法及其在滚动軸承复合故障诊断中的应用[J]. 中国机械工程, 2022, 33(14): 1697-1706.

ZHANG S J, SHEN M J, YANG J W, et al. Improved RSSD and its applications to composite fault diagnosis of rolling bearings[J]. China Mechanical Engineering, 2022, 33(14): 1697-1706.

[11] 周飞燕, 金林鹏, 董军. 卷积神经网络研究综述[J]. 计算机学报, 2017, 40(6): 1229-1251.

ZHOU F Y, JIN L P, DONG J. Review of convolutional neural network[J]. Chinese Journal of Computers, 2017, 40(6): 1229-1251.

[12] 赵小强, 张亚洲. 利用改进卷积神经网络的滚动轴承变工况故障诊断方法[J]. 西安交通大学学报, 2021, 55(12): 108-118.

ZHAO X Q, ZHANG Y Z. Improved CNN-based fault diagnosis method for rolling bearings under variable working conditions[J]. Journal of Xi'an Jiaotong University, 2021, 55(12):108-118.

[13] 雷春麗, 夏奔锋, 薛林林, 等. 基于MTF-CNN的滚动轴承故障诊断方法[J]. 振动与冲击, 2022, 41(9): 151-158.

LEI C L, XIA B F, XUE L L, et al. Rolling bearing fault diagnosis method based on MTF-CNN[J]. Journal of Vibration and Shock,2022, 41(9): 151-158.

[14] WANG Y J, QIU Q, LAN Z Q, et al. Identifying microseismic events using a dual-channel CNN with wavelet packets decomposition coefficients[J]. Computers & Geosciences, 2022, 166: 105164.

[15] SONG H F, YANG W W, DAI S S. Using dual-channel CNN to classify hyperspectral image based on spatial-spectral information[J]. Mathematical Biosciences and Engineering, 2020, 17(4): 3450-3477.

[16] 张龙, 甄灿壮, 易剑昱, 等. 双通道特征融合CNN-GRU齿轮箱故障诊断[J]. 振动与冲击, 2021, 40(19): 239-245.

ZHANG L, ZHEN C Z, YI J Y, et al. Dual-channel feature fusion CNN-GRU gearbox fault diagnosis[J]. Journal of Vibration and Shock, 2021, 40(19): 239-245.

第一作者:肖乾(1977—),男,博士,教授,江西省“井冈学者”特聘教授。研究方向为轨道车辆运行品质分析与评价,轨道车辆运维装备研究与开发,CAX/VR/AR。E-mail: jxralph@qq.com。

通信作者:李楷文(1997—),男,硕士研究生,研究方向为齿轮箱故障诊断。E-mail: 490819906@qq.com。

猜你喜欢

注意力机制卷积神经网络
面向短文本的网络舆情话题
基于自注意力与动态路由的文本建模方法
基于深度学习的问题回答技术研究
基于LSTM?Attention神经网络的文本特征提取方法
基于注意力机制的双向LSTM模型在中文商品评论情感分类中的研究
InsunKBQA:一个基于知识库的问答系统
基于卷积神经网络温室智能大棚监控系统的研究
基于深度卷积神经网络的物体识别算法
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现