基于MEEMD 多特征融合与LS-SVM 的行星齿轮箱故障诊断
2021-10-23黄晋英杜金波马健程王智超
蔡 波,黄晋英,杜金波,马健程,王智超
(1.中北大学机械工程学院,山西 太原 030051;2.北京北方车辆集团有限公司,北京 100072;3.中北大学大数据学院,山西 太原 030051)
0 引 言
行星齿轮箱作为机械设备的关键部分,因其运行稳定性好、体积小、传动效率高等优点在飞机发动机、风力机、化工设备等领域得到广泛应用[1]。但由于齿轮箱工作环境恶劣,所受载荷多为动态交变载荷,故在实际工作中极易出现轮齿裂纹、点蚀、磨损等故障,轻则造成机械设备停机降低工作效率,重则造成人员伤亡[2]。因此,对齿轮箱进行智能故障诊断对于提高生产安全和经济效益至关重要。
由于转速和负载的不稳定以及齿轮出现故障时产生冲击等原因,齿轮振动信号通常表现出非线性、非平稳性特点[3]。近年来,针对非线性、非平稳信号的处理方法正在逐步发展,如经验模态分解(EMD)[4]、经验小波分解(EWT)[5]、局部均值分解(LMD)[6]等。基于EMD 存在的混淆效应,Wu 等[7]提出集成经验模态分解(EEMD),虽克服了EMD 的缺陷,但计算过程复杂且信号的完备性较差,而改进的集成经验模态分解(MEEMD)[8]能够解决上述问题,其实质是在原始信号中成对添加符号相反的白噪声,使原信号极值点的分布更均匀,然后再进行EEMD和EMD 分解,该算法既能抑制模态混叠又能提高信号的完整性,在机械故障诊断领域已有广泛应用。王晋瑞等[9]提出一种MEEMD 算法与双隐层Elman(DHENN)神经网络相结合的滚动轴承故障诊断新方法,并与EMD-DHENN 和MEEMD-ENN 进行对比,结果证明了该方法的有效性和优越性;杨超等[10]利用MEEMD 算法对降噪后的滚动轴承振动信号分解处理,根据峭度-相关系数准则选取出敏感的IMF 分量并计算其Teager 能量算子,获得能量谱图,从而实现滚动轴承的故障诊断。
近年来,随着非线性技术的发展,基于熵的特征提取方法成为故障诊断领域新的研究课题。信息熵被定义为度量时间序列不确定度和复杂性的一种重要而有效的方法,主要包括样本熵、排列熵、近似熵、奇异值熵等,熵值的大小可以直观地反映故障振动信号的复杂性[11]。齿轮出现故障时,其非线性动态复杂度也会发生变化,通过借助此信息,可以采用信息熵来提取齿轮的故障特征。目前,在模式识别方面,经典分类器主要有专家系统、人工神经网络和支持向量机(SVM)等。其中,支持向量机可以在有限样本下提供相应的、准确的决策,不需要复杂的数学模型,具有较好的泛化能力,因此,在故障诊断中得到了广泛的应用[12]。该文选取算法简单,运算速度较快且具有较强的泛化能力和学习能力的最小二乘支持向量机(LS-SVM)[13]。
基于上述分析,该文首先利用MEEMD 对振动信号进行处理,得到若干固有模态分量;然后,利用相关系数剔除噪声或虚假分量,计算筛选出的敏感分量的样本熵和能量,并进行融合组成高维特征向量;最后,利用最小二乘支持向量机(LS-SVM)对齿轮的4种工况进行识别分类,并与概率神经网络(PNN)进行了对比,结果验证了本文所提方法的有效性和优越性。
1 基本理论
1.1 MEEMD 算法原理
改进的集成经验模态分解(MEEMD)是将两组振幅和标准差相等且方向相反的白噪声分别与原始信号相加,再对噪声信号进行EEMD 和EMD 分解,该算法既解决了模态混叠问题又保证了信号分解的完备性,详细分解过程如下[14]:
1)在原始信号s(t)中加入两组振幅和标准差相等且方向相反的白噪声ni(t)。
4)cj(t)可能不是标准IMF 分量且可能存在模态分裂现象,故需对cj(t)进行EMD 分解,以第一阶分量为例,即:
其中r(t)表示残差分量。
1.2 样本熵
熵作为信息复杂度的衡量指标,在测量不确定性和评估概率分布方面的应用较为广泛。熵被定义为时间序列或信号中新信息出现的概率。考虑到效率和复杂度估计精度,该文选择样本熵(sample entropy)进行分析,对于一个时间序列{x(n)}=x(1),x(2),···,x(N)},样本熵计算步骤如下[15]:
1)构造m维向量序列:
样本熵值的大小主要取决于参数m和r,根据文献[16]的研究成果并进行反复试验,该文设置参数m=2,r=0.15 Std(Std为时间序列的标准差),计算的样本熵具有更好的统计特征。
1.3 能量
信号作为信息能量的载体,主要包含幅值和相位等信息。当齿轮出现故障时,振动信号的幅值和频率均会发生变化,能量分布也会随之发生改变。不同故障类型的振动信号频率和幅值不同,所以信号的能量分布也会有所差异,因此可以采用能量来反映齿轮的不同故障特征。
式中:ci和Ei— —第i阶IMF 分量及对应的能量;
E——总能量;
pi— —第i阶IMF 分量的能量占总能量的比重。
1.4 最小二乘支持向量机原理
支持向量机(SVM)是一种基于核函数和数理统计理论的机器学习方法,在解决小样本、非线性、高维数等问题时具有明显优势,但在解决大规模问题时,比较耗时且收敛速度比较慢。最小二乘支持向量机(LS-SVM)是支持向量机的简化形式,常常被应用于分析数据、模式识别以及回归分析[17]。LSSVM 将支持向量机中的二次规划问题转化为线性方程组的求解,降低了求解的复杂性,提高了训练速度和收敛精度。
对于数据集D={(xi,yi)|i=1,2,···,n},线性回归函数为
式中:b——偏置;
ω——权重系数向量;
φ(xi)——非线性函数。
LS-SVM 的优化目标函数为:
约束条件为:
式中:εi——经验误差;
c——误差惩罚因子。
拉格朗日函数为:
其中 αi为拉格朗日乘子。
根据Karush-Kuhn-Tucker 条件,分别对 ω,b,εi,αi求 偏导,并令其等于0,消去 ω,εi可得到线性方程组:
常用的核函数有多项式核函数、径向基(RBF)核函数和Sigmoid 核函数。其中,RBF 核函数具有较强的泛化能力,表达式如下:
其中 σ为径向基函数的宽度(核参数)。
2 基于MEEMD 多特征融合与LS-SVM 的行星齿轮箱故障诊断
基于MEEMD 多特征融合与LS-SVM 的行星齿轮箱故障诊断方法的具体流程图如图1 所示,详细步骤如下:
图1 故障诊断流程图
Step1:采集4种工况下的振动信号。
Step2:利用MEEMD 分解不同工况下的振动信号,得到一系列依次由高频到低频排列的固有模态分量(IMF)。
Step3:筛选敏感分量。齿轮故障特征主要集中在高频段,根据相关系数准则筛选出包含齿轮主要故障信息最丰富的前3 阶模态分量,即敏感分量。
Step4:构造特征向量。计算选出的敏感IMF分量的样本熵和能量,考虑到能量值较大,因此对能量进行归一化处理,则组成高维特征向量为:
Step5:将特征向量T输入最小二乘支持向量机(LS-SVM)中,对齿轮故障类型进行识别分类。
3 实验与分析
3.1 实验设置
实验采用如图2 所示行星齿轮故障诊断实验台,其结构主要包括电机、联轴器、行星齿轮箱、轴承及磁粉制动器等。行星齿轮箱的具体结构参数见表1。
图2 实验台
表1 行星齿轮箱结构参数
将齿轮沿齿厚方向均匀减小1 mm 模拟齿轮磨损,将轮齿截掉半截模拟齿轮半齿截断,正常和故障齿轮如图3 所示。实验中电机转速为1500 r/min,采样频率为10.24 kHz,每个样本长度为4096,每种工况下采集样本100 组,4种工况共采集400 组样本(训练样本280 组,测试样本120 组)。行星齿轮箱4种工况以及样本数量说明见表2。
图3 正常和3种故障齿轮
表2 行星齿轮箱的4种工况
3.2 特征提取
采用MEEMD 分解4种工况下齿轮的振动信号,得到一系列IMF 分量,限于篇幅,该文仅给出行星轮单齿磨损某一样本分解处理的结果,如图4所示。
图4 工况2 某个样本MEEMD 分解结果
3.3 优选敏感IMF 分量
为了筛选出包含主要故障信息的敏感IMF 分量,该文引入相关系数来剔除与故障特征无关的虚假分量。MEEMD 分解得到的IMF 分量,根据相关系数大小筛选出敏感分量。在实际工程中,一般认为相关系数大于0.05 的分量为真实分量。行星齿轮箱各工况下振动信号分解得到的IMF 分量与原信号间的相关系数如表3 所示,根据表3 可知,各工况下的前3 阶IMF 分量与原信号的相关系数较大,均大于0.05,故可以认为前3 阶IMF 分量为真实分量。
表3 相关系数
3.4 实验结果
根据1.2 和1.3 节,计算各工况每个信号样本分解得到的前3 阶IMF 分量的样本熵和p1、p2、p3,并组成特征向量T,限于篇幅,表4 仅列出4种工况的部分特征向量。根据表4 可知,不同故障齿轮对应不同的样本熵值,p1、p2、p3也存在显著差异,故将样本熵和能量用于齿轮的故障特征提取是合理的。
表4 部分特征向量
为验证LSSVM 的诊断效果,该文引入概率神经网络(PNN)与之进行比较。LSSVM 采用RBF核函数,PNN 的散布常数Spread 选取误差最小时的值作为最佳值,此文Spread 选择0.3。将特征向量T 分别输入到LS-SVM 模型和PNN 模型进行故障分类。对两种模型分别进行10 次实验,结果如图5 所示。根据图5 可得,LS-SVM 模型对测试样本的平均分类准确率达到96.73%,而PNN 模型对测试样本的平均分类准确率为93.85%。LS-SVM模型对测试样本某一次的分类结果如图6 所示。同时,该文基于MEEMD 单特征向量与MEEMD 多特征融合向量进行了对比,采用LS-SVM 模型进行故障识别分类,齿轮不同工况下识别结果如表5 所示,根据表5 可知,多特征融合在一定程度上能够更好反映齿轮的故障特征信息,进一步提高了齿轮故障分类准确率。
表5 对比实验结果
图5 10 次的分类结果
图6 LS-SVM 某一次的分类结果
4 结束语
针对行星齿轮箱振动信号非线性、非平稳特点及故障特征提取困难的问题,本文结合了MEEMD多特征融合的特征提取方法,并采用LS-SVM 模型对齿轮故障进行分类识别,实验结果验证了该方法的有效性和优越性。
1) 改进的集成经验模态分解(MEEMD)自适应地将振动信号分解为若干个固有模态分量,较好的表征振动信号不同的局部特征。
2)基于MEEMD 样本熵和能量的特征融合提取方法,从多尺度反映了齿轮的故障信息。
3)多特征融合比仅单特征作为特征向量的故障诊断准确率要高;基于多特征融合的特征向量,通过最小二乘支持向量机(LS-SVM)的故障分类准确率高于基于概率神经网络(PNN)的分类准确率,从而验证了该文所提方法的有效性和优越性。