基于MCKD和CEEMDAN样本熵的滚动轴承故障诊断∗∗
2019-02-27金妍
金 妍
(吉林工业职业技术学院机电与智能学院,吉林吉林132013)
滚动轴承作为支撑旋转轴的关键部件被广泛应用于机械、冶金、石化等领域的重要设备中。由于工作环境恶劣,滚动轴承易产生局部故障,且故障特征较微弱,往往淹没在背景噪声中难以提取和识别。据统计,旋转机械设备的故障中30%是由于滚动轴承故障所产生[1]。因此,对于滚动轴承的故障监测和特征提取已成为近年来的研究热点和难点[2-3]。
滚动轴承振动信号具有非线性和非平稳性特点[4]。在此类信号的分析过程中,时频分析方法具有更好的适应性,是故障诊断领域应用最广泛的方法之一。目前常用的时频分析方法主要包括小波变换法和经验模态分解[5](empirical mode decomposition,EMD)方法。然而,小波分解方法不具有自适应性,对于非平稳信号的分析效果不佳;EMD方法虽具有自适应性,但在分解过程中易出现模态混叠和虚假固有模态函数(intrinsic mode function,IMF)问题,影响信号特征提取效果。同时,由于运行工况的复杂性和时变性,滚动轴承振动信号易受强背景噪声、信号采集和传输装置的影响,致使故障特征信息难以提取[6]。
针对上述问题,提出一种基于最大相关峭度解卷积[7](maximum correlated kurtosis deconvolution,MCKD)和自适应白噪声完备经验模态分解[8](complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)样本熵的滚动轴承故障诊断方法。通过滚动轴承实测信号的分析,证明了所提方法有效性。
1 基本原理
1.1 MCKD 算法
当滚动轴承出现故障时,其故障类型多为局部损伤,此时会产生周期性冲击信号x,由于信号采集和传输设备以及环境噪声等因素的影响,实际采集到的信号y往往可表示为:
式中:h为传输衰减响应;e为环境噪声。
MCKD算法的实质是寻找一滤波器,由实测信号y可恢复其中的冲击信号x,以达到突出故障特征并降低噪声干扰影响的目的。即:
MCKD算法以信号相关峭度到达最大值作为最终处理结果。对任一信号yn,其相关峭度定义为:
式中:T为冲击信号的周期;M为位移数。
MCKD算法的目标函数为:
即求解方程:
最终用矩阵形式表示所求得的滤波器系数组合:
其中:
将上述系数代入公式(2)中即可得到冲击信号x。
1.2 CEEMDAN方法原理
CEEMDAN在信号分解的每个阶段自适应地添加白噪声,并通过计算唯一的残余分量来获取各阶IMF分量。
所定义算子Ek(.)为经EMD方法所获得的第k阶IMF分量,IMFk为CEEMDAN分解获得的第k阶IMF分量。则该方法的具体算法如下:
(1)对信号xi(t)=x(t)+ε0wi(t)进行I次实验,由EMD分解获得第1阶IMF分量。即:
(2)在分解的第1阶段(k=1),计算第1个唯一的残余信号分量。即:
(3)进行 I次实验(i = 1,2,…,I),每次实验中,采用EMD方法对信号r1(n)+ε1E1(wi(n))进行分解,直至获得第1阶IMF分量为至。则第2阶IMF分量为:
(4)对余下每阶段(k=2,3,…,K)同步骤(3)计算过程一致,计算第k个残余信号分量以获得第k+1阶模态分量。即:
(5)重复步骤(4),直到残余信号的极值点个数不超过两个时,分解停止。
假设分解结束时,获得K阶IMF分量,则最终的残余信号可表示为:
此时,原信号序列x(n)可表示为:
由CEEMDAN的算法可知,该方法的分解过程完整,在分解的每一阶段通过系数εk能够自主选择适合的信噪比,在有效解决模态混叠问题的同时,确保对原始信号的精确重构。
1.3 样本熵
由于滚动轴承振动信号的非线性特征,基于非线性动力学参数的特征提取方法在解决该类问题方面提供了一种新的有效工具。目前应用较多的有分形维数和近似熵等方法。样本熵是近似熵的一种改进算法,它可较少依赖时间序列的长度,具有更好的抗噪性能和更稳健的信号复杂性度量表现。
计算时间序列样本熵的步骤为[9]:
(1)对于由N个数据组成的时间序列,可组成一组m维矢量。
(2)定义两个m维矢量X(i)与X(j)间的最大距离。
(3)对于给定的阈值r,从1~N-m计算d(i,j)<r的数目,并记作Bi,将Bi同N-m+1的比值记作(r)。即:
其均值定义为:
(4)对m+1,重复步骤(1)~(3)可得到B-m+1(r)。
(5)对于给定阈值r,此序列的样本熵可定义为:
当序列长度N为有限值时,该序列的样本熵估计值为:
由式(19)可知,样本熵的值与m、r、N的取值有关。因此,上述参数值确定对于样本熵计算结果的准确性非常重要。由文献[10]可知,当m=1或2,r=0.1~0.25 Std(原始数据标准差),N>500时,计算得到的样本熵数值拥有较为合理的统计特性。本文研究中,取 m=2,r=0.2 Std,N=3 000。
1.4 基于峭度-相关系数的敏感IMF判别算法
当采用CEEMDAN方法对故障信号分解所获得的一组IMF分量中,通常只有一部分IMF中包含故障信息,而其它分量则是与故障无关或由于分解迭代误差、环境噪声等影响而产生的干扰成分。因此,为有效提取故障信号的特征信息,需要将与故障无关的虚假IMF剔除,提高故障诊断的准确性。在此采用一种基于峭度-相关系数的敏感IMF判别算法。
峭度是反映随机变量分布特性的数值统计量,它对轴承早期故障敏感,当轴承处于正常状态时,其振动信号近似正态分布,峭度系数约为3;当轴承出现故障时,局部损伤会在信号内激起冲击成分,使信号概率密度偏离正态分布、峭度系数值增大。由上述分析可知,信号峭度值越大表明其含有的冲击成分越多、故障特征越明显。
对于信号x而言,其峭度定义为:
式中:E(x)为信号x的期望值;μ和σ分别为信号的均值和标准差。
由于IMF分量是对信号的一种近似正交的表达,对于具有实际意义的IMF分量而言,它们应与原信号间有较高的相关性[4]。可通过计算故障信号同其IMF分量的相关系数来判别出虚假IMF分量,并在故障特征提取前将其去除。
信号x(t)和其各IMF分量c1(t),c2(t),…,cn(t)的相关系数ρi为:
计算各IMF分量与原信号的相关系数,并根据信号自身特性选取门限阈值或敏感的IMF分量。
2 基于SVM滚动轴承故障诊断
SVM是以统计学习理论为基础的通用机器学习方法。其实质是采用最优分类超平面使两类待分类样本的距离之和最大。该方法克服了神经网络的过学习和依靠经验确定结构类型的缺点,并在处理小样本分类情况时具有良好的分类性能,因此,在故障诊断领域得到广泛应用。
滚动轴承不同故障信号的复杂程度不同,致使其样本熵值也不同,但仅在信号单一尺度上提取样本熵值很难检测到微弱的故障特征信息。而采用CEEMDAN方法可实现信号多尺度分析。
基于上述分析,本文结合MCKD和CEEMDAN方法的优越性,提出基于SVM的故障诊断方法。该方法的具体步骤如下:
(1)对于滚动轴承正常、内圈故障、外圈故障和滚动体故障状态下,按一定采样频率进行分别采样,得到不同状态下滚动轴承的振动信号。
(2)采用MCKD方法对不同状态下滚动轴承振动信号进行降噪,增强故障特征。
(3)利用CEEMDAN方法对经MCKD增强后信号进行分解,得到一系列IMF分量。
(4)根据峭度-相关系数准则选取能够有效表征信号特征的敏感IMF分量,并分别计算其样本熵,组成高维状态特征向量。
(5)将特征向量输入到SVM分类器中,对滚动轴承的工作状态和故障类型进行识别。
3 试验研究
为验证本文所提方法的有效性,在滚动轴承故障模拟实验台上分别进行正常、内圈故障、外圈故障和滚动体故障等4种状态下的信号采集,每种状态下采集30组振动信号。试验所采用的轴承类型为6205型深沟球轴承,轴承滚动体直径为7.94 mm,轴承节径为39.04 mm,包含9个滚动体,接触角度为0。轴承故障为人工点蚀故障,故障点直径为 0.18 mm,深度为0.28 mm。信号采集过程中,采样频率为12 000 Hz,电动机转速为1 800 r/min。随机选取采集到的不同状态下的一组滚动轴承振动信号,如图1所示。
由图1可知,由于背景噪声的影响,从信号的时域波形中难以分辨滚动轴承的故障类型和特征。以滚动体故障为例,采用MCKD算法对该振动信号进行增强,通过计算可得滚动体的故障频率fi=137.48 Hz,图2为滚动体故障信号的频谱和包络谱,图 3为经MCKD算法增强后该信号的时域波形和包络谱。
由图2可知,在滚动体故障信号频谱的低频段内没有观察到与故障相关的峰值谱线,包络谱进一步分析可知,整个谱图中并无规律,在其故障频率处的谱线并未出现明显的峰值,为故障特征的提取带来了极大困难。由图3中MCKD算法处理后的信号同原信号相比,信号内的冲击成分更加明显,且其包络谱中信号故障特征频率处的幅值较为明显,但仍有部分噪声残留,导致包络谱中存在较多干扰成分,为轴承故障的准确识别带来困难,因此,需与其他分解方法相结合以剔除信号内的虚假干扰成分。
采用CEEMDAN方法对MCKD增强后信号进行分解,共获得9阶IMF分量,为清晰呈现各IMF分量,取前6阶模态分解示于图4。分别计算各IMF分量同原信号间的峭度值及相关系数,结果如图5所示。由图5可知,IMF1~IMF4同原信号间的相关系数及峭度值较大,选取此分量为敏感IMF分量,分别计算其样本熵,结果如表1所示。
采用上述方法步骤对图1中正常状态、内圈故障和外圈故障信号进行分析,其中,不同状态下滚动轴承的MCKD增强信号经CEEMDAN分解后,前4阶IMF分量的峭度值和相关系数值较大,选取这些分量作为敏感IMF分量并计算其样本熵,结果如表2所示。
表1 滚动体故障信号的IMF样本熵
表2 滚动轴承信号的IMF样本熵
由表1和表2可知,不同状态下滚动轴承单分量信号的样本熵值变化趋势稳定,未出现明显数值重叠现象。正常状态下滚动轴承信号拥有较强的随机性,故熵值较大;当出现故障时,信号内会随故障产生周期性冲击成分,增强了信号的自适性,从而熵值减小。同内圈故障相比,由于外圈位置为固定,其故障冲击更明显,故熵值较小;滚动体由于存在自转以及绕轴公转,故障特征存不明显,复杂程度高,故其熵值较大。为验证该方法的有效性,表3列出了本文方法求得的每种状态下随机选取的3个信号的样本熵值。由表3可知,所得结果同之前分析相一致。由此可知,采用敏感IMF分量的样本熵作为特征向量对滚动轴承工作状态和故障类型的诊断具有较好的可分性和诊断可靠性。
表3 部分滚动轴承振动信号的IMF样本熵
按上述步骤,对采集到不同状态下的滚动轴承振动信号进行分析,并将得到的敏感IMF分量的样本熵组成特征向量输入SVM分类器中,分别抽取10组数据作为训练样本;余下20组数据作为测试样本。采用线性核函数对测试样本进行分类,结果如表4所示。
表4 基于MCKD增强后滚动轴承振动信号CEEMDAN
由表4可知,除外圈故障的10个测试样本中有1个识别错误,其余各测试样本均被正确识别,总体识别率为97.5%,误判原因可能是测量误差或个别特征向量与训练样本差别较大,但总体识别效果理想。证明了本文所提方法的有效性。
4 结语
(1)MCKD算法可较好地滤除环境噪声等干扰成分对于信号特征提取准确性的影响,突显信号的冲击特性。
(2)CEEMDAN方法可有效解决EMD分解过程中的模态混叠问题,且基于峭度值和相关系数的敏感IMF选择算法可有效选取对信号自身特征敏感的IMF分量。
(3)基于敏感IMF分量的样本熵可有效从多尺度揭示信号的复杂性,同SVM方法相结合可有效实现滚动轴承不同工作状态和故障类型的识别。