基于改进堆叠稀疏降噪自编码器的轴承故障诊断
2021-07-22张智恒周凤星严保康喻尚
张智恒,周凤星,严保康,喻尚
(武汉科技大学 信息科学与工程学院,武汉 430081)
滚动轴承被称为“工业的关节”,在旋转机械中广泛应用。由于长期处于工作状态且工作环境恶劣等原因,导致轴承成为易损坏的关键部件[1-2]。
在机械设备的大型化和自动化趋势下,设备故障可能导致巨大的经济损失甚至一系列灾难性的后果。因此,提高机械设备的故障诊断能力将是工业未来发展的重要方向。
基于振动信号的滚动轴承故障诊断技术主要可以分为信号采集、特征提取、特征选择和故障识别4个步骤[3]。其中,故障的特征提取是决定能否准确判断滚动轴承故障类别的关键步骤。常见的特征提取方法有快速傅里叶变换、小波变换、奇异值分解、共振解调、经验模态分解、局部均值分解等,同时越来越多的现代信号处理方法也不断应用于滚动轴承的故障诊断。文献[4]将局部特征尺度分解与奇异值差分谱相结合,并通过试验表明该方法能够准确、快速地提取出滚动轴承的故障特征。文献[5]针对滚动轴承原始振动信号信噪比小等问题,提出了一种基于局部均值分解和共振解调的滚动轴承故障诊断方法,最终成功提取到了故障特征频率。文献[6]提出了一种基于小波包与倒频谱结合的滚动轴承故障诊断方法,也获得了较好的特征提取性能。以上方法都具备较好的故障特征提取能力,但在诊断过程中均需要大量的先验知识以及信号处理知识,而且需要人工调节参数,增加了分析的难度以及诊断结果的不确定性。
深度学习作为深层网络,可以对原始信号进行逐层特征变换,将样本在原空间的特征表示变换到新的特征空间,自动学习得到层次化的特征表示,从而更有利于分类或特征的可视化。稀疏降噪自编码器(Sparse Denoising Auto-Encoder,SDAE)是一种典型的深度学习模型,能够很好地建立从底层信号到高层语义的映射关系[7],且具备较强的鲁棒性和泛化性,已被广泛应用于滚动轴承的故障诊断。如文献[8]在自编码器中加入稀疏限制和损伤噪声,在滚动轴承故障诊断中取得了较好的效果;文献[9]采用粒子群算法训练SDAE网络,实现编码器网络参数的自适应选取,并通过试验证明了该方法在滚动轴承故障诊断中具备很好的泛化性和故障识别率;文献[10]采用深度卷积网络和SDAE分别对多个传感器信号进行处理并将结果输入D-S证据理论进行信息融合,最终的诊断结果表明该方法在一定程度上降低了单一传感器的信息不全面性和单一模型的不确定性,提高了对滚动轴承的故障诊断能力。以上研究表明,基于SDAE的滚动轴承故障诊断方法具备良好的诊断效果。
然而,为了加强SDAE算法的性能,通常会对信号进行多次加噪处理以获取更多的训练样本,但是随着加噪次数的增加,计算复杂度和训练时间也都随之增加。为解决这个问题,文献[11]于2012年提出了边缘化降噪自编码器(Marginalized Denoising Auto-Encoder,MDAE),该算法采用泰勒展开式近似表示平均损失函数,从而降低了计算的复杂度。相比于降噪自编码器具备更快的收敛速度以及更好的诊断效果。受MDAE算法的启发,对堆叠稀疏降噪自编码器(Stacked Sparse Denoising Auto-Encoder,SSDAE)进行优化,提出了一种基于堆叠边缘化稀疏降噪自编码器(Stacked Marginalized Sparse Denoising Auto-Encoder,SMSDAE)的滚动轴承故障诊断方法,以实现噪声环境下滚动轴承故障信号更精准、更快速的智能诊断。
1 模型理论基础
1.1 自编码器
自编码器(Auto-Encoder,AE)是具有一级隐含层的神经网络,思路是让输出尽可能等于输入,让编码器自主的提取输入数据的特征。其网络结构如图1所示。假设输入样本集为{x1,x2,…,xm},首先使用编码函数f提取训练样本xn的特征表达h,随后由解码函数g将特征表达h映射为输出y,最后用损失函数J(W,b)表示输入输出的相似度。
图1 自编码器网络结构图
编码过程函数为
h=f(x)=sg(Wx+b),
(1)
解码过程函数为
y=g(h)=sf(W′h+b′),
(2)
损失函数为
(3)
式中:sg,sf均为非线性函数,一般选择sigmoid函数;θ为编码网络的参数矩阵{W,b};nl为网络层数;sl为第l层的单元数目;m为样本个数;λ为权重衰减系数,其作用为减少权重幅值,防止过拟合。
1.2 稀疏自编码器
由于自编码器提取的特征并不能简明表达输入层数据,于是文献[12]提出了稀疏自编码器(Spare Auto-Encoder,SAE),其采用向损失函数添加稀疏惩罚性的方法实现了对数据特征的稀疏提取,提高了特征提取的效率,增强了自编码器的性能。
(4)
(5)
则增加惩罚因子后,进行稀疏性限制的稀疏自编码器的损失函数表示为
(6)
式中:β为稀疏性限制条件的权重系数。
1.3 堆叠稀疏降噪自编码器
降噪自编码器[13](Denoising Auto-Encoder,DAE)在AE的基础上,为防止过拟合问题而对输入数据加入噪声,使编码器学习到的特征表达具备较强的鲁棒性,从而增强模型的泛化能力。
图2 DAE算法流程图
(7)
DAE算法的实现方法主要分为2种:一种是在数据中加入高斯白噪声,另一种则是按设定的概率随机置零输入的数据,即让原始数据部分丢失。为使编码器同时具备鲁棒性和稀疏性,在DAE算法的损失函数中添加稀疏限制条件即可得到SDAE,其损失函数表示为
(8)
SDAE已经具备了较强的特征提取能力及鲁棒性,但仍属于一个浅层网络,并不能提取深层次的数据特征信息,因此采用逐层贪婪训练策略[14]将多个SDAE逐层叠加构成堆叠稀疏降噪自编码器,从而实现对数据深层次特征的挖掘。
2 改进堆叠稀疏降噪自编码器
SSDAE既具备了SAE的稀疏性,又具备了DAE对噪声干扰的鲁棒性,因此拥有较好的诊断性能。然而,作为一种深层神经网络结构,需要逐层进行训练,存在计算量巨大、训练速度慢等缺点。针对以上问题,基于MDAE收敛速度快的特性对SSDAE的损失函数进行边缘化处理,并结合逐层贪婪策略得到了SMSDAE,实现对算法的优化改进。
2.1 SMSDAE网络的构建
(9)
受到文献[15]的启发,采用极限的思想,令m→∞,对(9)式求取平均损失函数可得
(10)
(11)
对(11)式两端求期望可得
(12)
(13)
(14)
(15)
结合以上公式可知MSDAE的损失函数为
(16)
表1 干扰分布及其均值和方差
表2 不同损失函数及其相关导数
在本文中,MSDAE算法采用加入高斯白噪声的方法实现数据的加噪,选取平方误差作为重构误差函数,根据表1和表2以及(16)式,可推导出MSDAE的损失函数公式为
(17)
式中:γ为边缘限制条件的权重系数。
2.2 基于SMSDAE-Softmax的特征提取模型
SMSDAE由多个MSDAE堆叠而成,将其最后的输出层与Softmax分类器相连接就能构成一个完整的深度学习模型。作为一种监督方式,Softmax分类器为SMSDAE的训练提供了类别信息,有效地优化了网络参数,增强了网络的特征提取能力,这一优化过程通常被称作微调。
基于SMSDAE-Softmax的特征提取过程由3个部分构成:预学习、微调以及特征提取。
2.2.1 预学习
采用逐层贪婪训练策略,依次训练SMSDAE网络的每一层,训练完成后再将各层首尾相连,形成所有权值已初始化的SMSDAE网络。
2.2.2 微调
预学习完成后,将Softmax分类器添加到SMSDAE网络的最后一层,然后输入带标签的信号,利用信号标签通过反向传播算法对整个网络进行训练,微调网络权值,使其具备更强的特征提取能力。
2.2.3 特征提取
完成微调后,去掉Softmax层,将剩余的SMSDAE网络作为特征提取网络,输入信号即可提取特征。
2.3 算法实现流程
基于SMSDAE网络的故障诊断流程具有以下4个步骤:
1)数据的预处理。首先采集滚动轴承不同故障的振动信号,然后运用(18)式对信号进行量纲一化处理,提高信号的泛化能力,最后将信号按一定比例分为训练集和样本集,并做好标签。
(18)
2)根据试验经验设置网络的各项参数,如各层神经元个数、迭代次数、稀疏惩罚项参数、边缘限制参数等。
3)特征提取模型的训练。将训练集作为SMSDAE-Softmax模型的输入,完成网络的训练。
4)诊断率准确率的计算。将测试集输入到训练完成的SMSDAE网络中,实现测试集信号的特征提取。再将提取到的特征输入到SVM多分类器中,得到算法的故障准确率。
3 实例分析
为验证基于边缘化堆叠稀疏降噪自编码器实现的深度神经网络对滚动轴承故障信号的诊断效果,采用故障诊断试验平台(图3)采集到的滚动轴承信号作为分析对象,该平台由底座、变速驱动电动机、齿轮箱、轴承、调速器、偏重转盘等结构组成。
图3 故障诊断试验平台
3.1 试验数据
振动信号来源于QPZZ-Ⅱ旋转机械振动故障试验台,试验轴承为N205EM型圆柱滚子轴承,滚子组节圆直径为39.5 mm,滚子直径为7.5 mm,滚子个数为12。在内、外圈滚道及滚子滚动面上切割宽0.2 mm、深0.2 mm的凹槽模拟轴承故障。采用IMI M626B03型加速度传感器进行信号采集,采样频率为20 kHz,采样点数为65 536,故障轴承转速为900 r/min。
从各段信号第1个数据点开始,每隔20个数据点作为一个样本采集起始点,采集连续的500个数据点作为一个样本,每种状态各采集2 000个样本作为训练集。测试集数据选取的范围在训练集采集结束后0.5 s之后的区间内,每种状态随机选取200个数据点作为采集起点,采集连续的500个数据点作为测试集。
3.2 网络参数设置
在训练过程中,网络参数的细微变化都会对网络性能产生巨大的影响。经过多次试验调整,最终设定隐藏层个数为3,网络各层神经元个数为500-250-150-50-4,边缘化权重系数λ为0.000 1,稀疏性权重系数β为0.01,稀疏性参数ρ为0.1。
3.3 收敛速度
为验证SMSDAE网络的特征提取能力,分别采用SMSDAE和SSDAE进行故障信号的特征提取,结果如图4所示。对比可知,SMSDAE模型与SSDAE模型相比具备以下3个优点:
图4 SSDAE和SMSDAE各层的训练迭代误差曲线
1)收敛速度更快。达到相同的重构误差时的迭代次数更少,表明SMSDAE模型具备更快的收敛速度,能够有效降低程序计算的复杂度。
2)运行时间更短。在相同的迭代次数下,需要更短的运行时间,表明SMSDAE模型减少了调节参数所需的时间,能够降低训练参数的难度。
3)重构误差更小。在迭代完成时,具备更小的重构误差,表明SMSDAE模型能够更好地实现信号的特征提取,保留了更完备的原始特征。
3.4 诊断性能
为验证SMSDAE算法的诊断性能,选择与SMSDAE相同网络结构的SSDAE和堆叠边缘化降噪自编码器(SMDAE)进行对比试验,结果见表3。由表可知,3种算法均取得了较好的诊断效果,平均准确率均达到了99%以上。其中,SMSDAE算法的平均准确率高达99.88%,高于其他算法。与SMDAE相比,SMSDAE算法考虑了对输入信号的稀疏性限制,因此具备更好的分类效果。与SSDAE相比,SMSDAE算法的损失函数中含有高阶特性,拥有更好的特征提取能力,因此具有更好的诊断效果。对比试验结果表明,本文提出的改进方法有效提升了算法的分类性能。
表3 诊断准确率对比
3.5 降噪效果
为验证SMSDAE算法的降噪性能,选取SSAE算法作为对比模型,通过向原始训练集中加入不同信噪比的高斯白噪声模拟实际生产过程中环境的干扰。训练集数据描述见表4。
表4 训练集数据描述
分别将训练集1,2,3输入到本文模型和对比模型中进行训练,并用测试集分别计算出各训练集的诊断率,为避免试验结果的随机性,采用10次连续试验结果的平均值,诊断结果见表5。由表可知,在原始数据集下,SMSDAE与SSAE算法都获取了较高的平均故障诊断准确率。但是随着噪声的加入,SSAE算法的故障诊断准确率显著下降,当输入噪声的信噪比达到10 dB时,SSAE算法的平均故障诊断准确率降到了90.31%,显然无法满足实际生产中的诊断需求,而SMSDAE算法的故障诊断准确率仍然达到了96.34%,说明SMSDAE算法的鲁棒性较好,在噪声环境中也能取得较好的特征提取效果。
表5 不同模型诊断结果
3.6 普适性分析
为验证改进算法在面对不同轴承信号时的普适性以及面对多种故障类型时的诊断性能,将美国西储大学轴承数据中心0负载条件下的10种轴承故障信号作为研究对象,振动信号来源于型号为SKF6205的驱动端轴承,采样频率为12 kHz,采用电火花分别在轴承的内、外圈沟道以及钢球上分别加工了直径为0.178,0.356,0.533 mm的凹槽来模拟轴承在运行过程中形成的不同损伤程度。
经过多次试验调试,最终对网络参数进行如下设置:隐藏层个数为3,网络各层神经元个数为1024-512-512-256-10,边缘化权重系数λ为0.000 3,稀疏性权重系数β为0.008,稀疏性参数ρ为0.05,训练集数量为2 500,测试集数量为200。其中训练集与测试集的制作过程参见3.1节所述内容,数据集详细信息见表6。
表6 轴承故障状态
最近一次得到的测试集分类混淆矩阵如图5所示,图中对角线展示了各类型信号的具体预测结果。由图5可知,SMSDAE算法对每一类信号的故障诊断率都达到了95%以上,整个测试集的平均分类准确率达到了98.5%,在验证SMSDAE算法普适性的同时也证明了其在面对多种故障时也具备较好的分类性能。
图5 分类混淆矩阵
4 结束语
提出了一种基于堆叠边缘化稀疏降噪自编码器的滚动轴承故障诊断方法,该算法对SSDAE的损失函数进行边缘化处理,既具备了SSAE的稀疏限制特性,又结合了MDAE收敛快速的特性,因此拥有更好的诊断性能。对比试验表明,提出的SMSDAE算法具备更快的收敛速度,更好的特征提取能力,更佳的鲁棒性,以及更高的诊断精度。而普适性试验结果表明,SMSDAE算法在面对不同类型的轴承故障以及多种故障信号时,也展现了良好的分类性能,具有一定的普适性。