基于CEEMDAN-SVM和时域特征的滚动轴承故障诊断方法研究
2022-05-27王玉承王海瑞
王玉承 李 亚 王海瑞 肖 杨
(昆明理工大学信息工程与自动化学院)
旋转机械在化工、电力、冶金及机械制造等领域有着广泛的应用,旋转机械设备故障可能会造成局部损坏、 巨大的经济损失甚至人员伤亡,大量研究表明,轴承故障占旋转机械故障的30%[1]。 因此,深入研究轴承的状态监测和故障诊断对设备维护和降低维修成本具有重要意义。
轴承振动信号是一种非平稳、非线性的随机信号,其去噪方法主要有小波分解技术和经验模态分解(EMD)技术[2]。 小波分解技术的特点是多分辨率分析和良好的时频局部化能力。 根据小波系数的不同特性, 可以分离出真实的信号和噪声。 鞠晨等提出一种基于小波包分解和粒子群优化BP神经网络的滚动轴承故障诊断方法,在信号特征提取部分,对采集的滚动轴承振动信号进行小波包分解, 得到各子频带能量和信号总能量,经归一化处理后获得表征滚动轴承状态的特征向量[3]。 孔令刚等提出一种改进型灰狼优化算法(GWO)与支持向量机(SVM)相结合的故障诊断方法, 在8种故障模式和正常模式所对应的功率曲线实施5层Mallat小波分解,得到各层近似系数和细节系数,并计算各层系数的平方和得到特征向量集[4]。 然而,小波去噪方法必须选择基函数,这就不可避免地会产生傅里叶变换等缺陷。 EMD具有多分辨率和对非平稳信号适应性强的特点,被广泛应用于振动信号的处理中。 陈俊柏等提出一种基于EMD和SVM的机载燃油泵故障诊断方法,利用EMD提取振动信号不同频段的能量值作为特征参量,并结合压力信号均值构造故障特征向量[5]。 刘柯欣等提出一种基于时变滤波经验模态分解(TVF-EMD)和Teager能量算子(TEO)相结合的故障特征提取方法,利用TVF-EMD方法自适应地分解轴承振动信号,获得了一组固有模态分量(Intrinsic Mode Functions,IMFs),其 次 对 分 解结果进行峭度计算,并根据峭度最大准则选出峰度值最高的敏感分量[6]。 上述方法用的EMD虽然是自适应的,不需要选择基函数,但在处理异常噪声信号时存在模态混叠。
为了更好地对轴承故障冲击信号进行去噪处理,避免模态混叠现象,并对原始信号进行重构,以去除虚假分量,笔者提出具有自适应噪声的完全集成经验模态分解 (Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMD-AN)方法,并进行实验。
1 CEEMDAN基本原理
Torres等为解决集合平均时IMF分量对齐问题, 同时改进EEMD 的噪声去除性能, 提出CEEMDAN[7]方法,该方法在每次经验模态分解过程中,加入一些自适应白噪声,在有限的积分次数下,使重构误差无限接近于零,也就是说,重建的信号几乎与原始信号相同。
CEEMDAN自适应完备噪声经验模态分解,若要达到一个自适应的效果,需每次添加不同的白噪声,具体如下:
其中,εk为第k次添加的白噪声幅值;std (·)为每次分解后计算剩余分量的标准差,K为IMF的总个数。 因此,式(1)可以达到一个动态变化效果,即可以依据每次分解结果来自适应地调整白噪声添加值。
设原始信号为X,定义Ek为EMD得到的第k个IMF的产生算子;w(i)为零平均单位方差白噪声的实现。 CEEMDAN的主要步骤如下:
b. 计算第1个残差r1=X-IMF1。
f. 重复步骤d、e, 直到得到的残差为单调函数,不能被继续分解。
2 SVM
SVM是一种有监督的学习方法,它基于VC维统计学习理论和结构风险最小化原理[8],引入了一个内核函数线性不可分的点在低维空间映射到高维特征空间的非线性,找到一个最优分类超平面,在这个空间可以满足分类要求,在解决小样本、非线性和高维模式识别问题中效果显著[9]。由于机械运行背景环境的复杂性,导致数据收集困难,使得样本数据量较少,同时振动数据具有明显的非线性特征,因此运用SVM可以较好地解决上述问题。
2.1 原理
SVM学习的主要目的是找到一个满足分类要求的最优分类超平面, 使超平面在保证分类精度的同时最大限度地增加超平面两侧的空白区域。
首先, 以两类线性分类问题为例进行分析。给定一组训练样本(xi′,yi′),i′=1,2,…,n,xi′∈Rn,yi′∈{±1}可以被一个超平面ω·x+b=0(ω和b分别为超平面的法向量和截距)隔开,且离该平面最近的向量距离最长,那么最优分类超平面的实现就要解决以下问题:
其中,φ(xi′)为非线性映射方程,将样本点从低维空间映射到高维空间,在该空间中寻找最优分类超平面, 以满足分类要求;ξ是松弛变量,是一个数据点的误差度量;C为惩罚因子,是错误样本对惩罚的控制程度, 惩罚越大分类效果越好,但其泛化能力也会降低;L(ω)是一个二次函数,具有唯一的极小值点。
引入拉格朗日函数将最优超平面的构造问题转化为更容易理解的对偶形式:
其中,K(xi′,xj)=φ(xi′)·φ(xj)为核函数;α为拉格朗日乘子。
2.2 核函数
由于故障信号数据通常是非线性、 不可分割的,对于此问题,研究者利用适当的核函数将输入空间映射到高维空间,实现高维空间的线性可分,将非线性问题转化为线性问题来解决[10]。 核函数的选择决定了SVM的应用性能, 常见的核函数有多项式核函数、径向基核函数和sigmoid核函数。一般情况下, 可以根据研究人员的经验选择合适的SVM核函数,也可以通过实验方法逐一尝试。
3 CEEMDAN-SVM故障诊断步骤
针对小样本和非线性数据条件下要实现高效分类,并解决模态混叠和噪声抑制效果较差的问题, 结合CEEMDAN良好的分解效果以及SVM擅长处理小样本和非线性数据的特点, 提出CEEMDAN-SVM模型进行故障诊断,具体步骤(图1)如下:
图1 CEEMDAN-SVM诊断流程
a. 首先将滚动轴承原始信号用CEEMDAN分解为一系列固有模态分量(IMFs),信号包含高频特征和低频特征;
b. 根据波形图和包络谱分析故障信号中包含的主要各种成分信息;
c. 依据倍频特征以及高低频分量的特征将虚假分量和噪声分量剔除;
d. 将剩余分量进行重构,得到降噪后的数据;
e. 提取重构信号的时域特征,构建小样本滚动轴承故障诊断数据时域特征集;
f. 将时域特征集输入SVM进行故障分类。
4 实验
本次实验所采用的原始振动数据集来自美国凯斯西储大学的开放数据, 在电机驱动端SKF6205上进行故障诊断。
对实验数据分别提取正常状态(故障深度0 mm)、内圈单点故障(故障深度0.177 8 mm)、滚动体单点故障(故障深度0.177 8 mm)、外圈单点故障(故障深度0.177 8 mm)4种类型,标签分别为1、2、3、4。采样频率12 kHz,转速1 797 r/min。将采集到的原始振动信号进行分割,每个样本包含1 024个采样点。每种状态下的样本数量为115个,4类共460个数据集。 从4类数据中每类随机抽取70个作为训练集, 将剩下的45个数据作为测试集, 两个互斥数据集作为本次实验的数据来源。先对原始信号进行CEEMDAN分解得到固有模态分量(IMFs),分解波形和包络谱图如图2、3所示。
图2 4种状态的CEEMDAN分解波形
由图2可以看出,正常状态、内圈单点故障、外圈单点故障、滚动体单点故障4种状态的第1个分量信号振动频率较快,因此可以断定该分量为随机噪声。 第2~5个分量波动较慢,时域波形大部分由高次谐波组成,频谱能量较为集中,且大部分时域波形接近正弦波,是理想的信号分析时间序列。 剩余分量含有的故障冲击信号特征较小,与原始信号相关性也较小,没有实际的信号分析价值,属于虚假分量,因此将之丢弃。
由图3可以看出,第1个分量虽然含有故障冲击信号,但信号较微弱,大部分被强背景噪声“淹没”。 而第2~5个分量含有的故障冲击信号较为明显,同时基频(30.03 Hz)、2倍频(60.10 Hz)、3倍频(90.12 Hz)和多倍频成分振动特征突出,其中以内圈单点故障和外圈单点故障的故障冲击信号最为明显,其倍频成分较为清晰,有较好的信号分析价值, 因此第2~5个分量为信号分解的最优分量,但由于故障冲击信号仅为轴承原始信号的较少部分,其能量特征较为微弱,因此将最优分量进行重构,提取10个时域特征进行进一步的故障诊断。
图3 4种状态的包络谱图
由于本次实验数据有限, 样本数量较少,不利于故障识别。 传统神经网络需要大量样本完成模型的构建, 应用于本次实验具有较大的局限性,而SVM作为一种分类器,对于小样本具有较大优势。 因此,用SVM对模型进行分类,核函数采用线性核函数, 并对实验进行10次交叉验证,以提升模型的泛化性能和拟合效果,同时直接对原始信号提取时域特征并输入SVM中进行对比实验,方法1为CEEMDAN分解后的实验结果,方法2为原始时域特征实验结果,将诊断结果准确率汇总于表1。 可以看出,原始时域信号提取的特征相较于CEEMDAN分解后的特征准确率低了近2%,主要原因是噪声信号的干扰等导致提取的特征出现一定的误差, 方法1经CEEMDAN分解后,去除了噪声和虚假分量,能够较好地表现出故障冲击信号的特点,使得提取的时域特征向量包含了较多的故障信息,因此使得分类效果较原始时域特征有较好的优势,最高准确率可达100%。
表1 诊断结果准确率 %
实际类别与预测类别的分类准确率如图4所示,可以看出,故障分类错误主要集中在第4个类别(滚动体单点故障),其原因是滚动体的工况环境相较于其他类别更为复杂,导致故障冲击信号损失较为严重,使得分类出现误差,但其他故障都正确分类,平均准确率达98.23%。
图4 实际分类和预测分类结果对比
5 结束语
针对滚动轴承原始信号包含较多的噪声、提取的时域特征不能较好地反映故障冲击信号的规律的问题, 提出基于CEEMDAN-SVM的滚动轴承故障诊断方法。 实验结果表明,CEEMDAN能将原始信号进行充分分解,噪声和虚假信息分解效果良好,突出了故障冲击信号的倍频特征,同时在有限的非线性数据条件下,运用SVM进行故障诊断,最高准确率可达100%。因此,该方法具有较高的工程应用价值。