APP下载

基于VMD-MPE-KPCA特征提取与MRVM相混合的滚动轴承故障诊断方法

2020-11-05赵小强朱奇先

兰州理工大学学报 2020年5期
关键词:分类器特征提取模态

陈 鹏, 赵小强, 朱奇先

(1. 兰州理工大学 电气工程与信息工程学院, 甘肃 兰州 730050; 2. 大型电气传动系统与装备技术国家重点实验室, 甘肃 天水 741020)

滚动轴承作为旋转机械的重要零部件,其运行状况将直接影响旋转机械设备的整体性能,是旋转机械健康监测的重要对象.由于在运行状态时,滚动轴承产生的振动信号和它的结构有着必然的联系[1],因此研究从振动信号中提取丰富的故障特征信息,对于滚动轴承的故障诊断方法非常重要.

滚动轴承通常工作在较为恶劣的环境且易受到冲击性的干扰,使得采集的振动信号往往具有非线性、非平稳、低信噪比的特点,导致了故障信息提取较为困难[2].目前,在振动信号的分析方法中,传统的时频分析方法如傅里叶变化、Wigner-Ville分布、小波分解等都取得了一定的成果[3],但是这些方法对轴承振动信号的分析都缺乏自适应分解的能力,需要进行相关参数的人为设置,这会导致故障特征信息由于参数设置不当而引起遗漏,影响故障诊断的准确率[4].对此,有学者提出了经验模态分解(empirical mode decomposition, EMD)[5]的自适应时频分析方法之一,其在信号处理、机械故障诊断等很多领域取得了广泛应用,但是EMD存在模态混叠、端点效应,一定程度上影响了信号分解的效果,无法有效表征信号的全部特征[6].为了克服EMD的缺点,Wu等[7]提出了集合经验模态分解(Ensemble EMD, EEMD)的信号自适应分解方法,利用噪声辅助分析方法在一定程度上抑制了分解方法的模态混叠现象.但不论是EMD还是EEMD,在理论的完备性、计算效率和抗噪性等方面仍存在不足.Dragomiretskiy等[8]在2014年提出了一种新的自适应信号处理方法——变分模态分解方法(VMD),与EMD和EEMD方法相比,VMD摒弃了递归筛选的模式,能够有效地避免EMD和EEMD方法中存在的一系列不足,具有计算效率高和噪声鲁棒性强的特点,VMD是一种非递归的自适应信号处理方法,其在频域围绕某一中心频率更新,将模态带宽的求解问题转化为变分约束问题,求解出每个模态分量,分解结果不易受到背景噪声的干扰.唐贵基等[9]通过VMD进行滚动轴承早期的故障诊断,但是VMD在故障诊断引入研究还是较少.通过VMD分解方法得到的模态分量包含了滚动轴承的故障特征信息,有利于进一步进行故障特征的深度挖掘.

近年来,熵作为非线性动力学参数能够实现对信号的不确定性和复杂度进行衡量,在信号处理和故障特征提取方面得到了初步应用.向丹等[10]应用各类熵对EMD分解信号进行特征提取,陈东宁等[11]通过多尺度排列熵进行特征提取,郑近德等[12]通过改进的多尺度模糊熵进行特征提取.在把熵用于故障特征提取的研究中,由于排列熵[13]在一维时间序列的随机性和复杂性分析中具有计算简单快速且鲁棒性高的特点,优势更加突出.但是滚动轴承故障状态的振动信号往往更加复杂,其运行状态信息分布在多尺度上,排列熵达不到很好的效果.Aziz等[14]提出了多尺度排列熵,把多尺度和排列熵相融合,对排列熵进行了改进,可以实现故障特征的全面挖掘[15].

Sun等[16-19]应用主元分析法(principal component analysis,PCA)进行故障特征的降维,但是PCA方法只能提取数据中的线性关系,而对于信号中存在的非线性关系无法满足.而核主元分析(kernel principal component analysis,KPCA)[20]通过非线性映射核将原始特征数据映射到高维空间,使得计算量大大减少且具备处理非线性数据的能力,被广泛应用于故障诊断[21-22].

故障诊断的实质为实现提取特征的模式识别,实现故障特征的分类需要高性能的分类器.在工程中,很少能够获得大量的故障样本用于分类器的训练,即故障诊断属于小样本问题.在处理小样本问题方面,目前流行的方法是支持向量机(SVM),然而SVM存在着其核函数需要满足Mercer定理、需要是正定连续对称函数、其参数设置过多以及计算量会随着样本数据增加急剧增加等问题[23].针对以上不足,Tipping等[24]提出了相关向量机(relevance vector machine,RVM),RVM除具有SVM的小样本学习、泛化能力强的特点之外,还具备比SVM更加稀疏、稳定性更强、核函数不需要满足Mercer定理、正定连续对称以及需要设置参数更少、可实现不确定概率输出的特点,更加符合工程实际,在机械故障诊断领域得到一定的研究,但相比SVM、BP等方法的应用还是较少.然而RVM只能实现二分类问题,大量的故障诊断都是多分类问题.因此,Psorakis等[25]提出了多分类相关向量机(multiclass relevance vector machine,MRVM),MRVM在继承了RVM 算法优点的基础上,还可以实现不同类别的概率输出,直接实现多分类,有效降低了基于二分类RVM分类器进行多分类时结构的复杂性和累积误差等问题.

综上所述,本文提出一种基于VMD-MPE- KPCA特征提取与MRVM分类器相混合的滚动轴承故障诊断方法.该方法充分考虑了VMD在信号分解方面抗混叠、端点效应小,MPE在复杂信号不确定性方面的度量方面计算简单、抗干扰能力强,KPCA具备非线性数据挖掘能力和MRVM分类器更加稀疏、分类结果以概率输出更符合工程实际的特点.本文提出的方法通过美国西储大学数据集进行验证,结果表明具有较高的故障识别率.

1 基于VMD-MPE振动信号特征提取

1.1 VMD分解

VMD[8]是一种新的完全非递归自适应信号分解方法.可将信号x(t)分解为一定稀疏性子信号的集合或带宽有限的k个模态分量uk(t),每个模态分量的中心频率为ωk,带宽为通过梯度的L2范数进行估计.最终,VMD分解的过程可被认为是如下式所示的约束变分问题:

(1)

式中:{uk}={u1,…,uk}为分解得到的k个模态分量;{ωk}={ω1,…,ωk}为各模态分量的频率中心.为了求解式(1)约束变分问题,将利用二次罚函数项和Lagrange乘子将式(1)转化为如下形式的无约束问题:

(2)

式中:a为惩罚因子;λ(t)为Lagrange乘子.

(5)

以上迭代直到收敛,即满足终止条件:

(6)

式中:ε为判别精度,ε>0.

从以上描述中可知,模式分解个数k、二次惩罚项a、噪声容限λ和判别精度ε四个参数需要预先指定.与前两个参数相比,λ和ε对分解结果影响很小,通常采用原始VMD算法中的默认值.由于模式分解个数k是在预先不知道要分析信号的情况下指定的,因此很难保证分解后信号的适当性,从而保证信号分解的准确性和效率.此外,二次惩罚项a与抑制噪声干扰的性能有关,应仔细选择.

1.2 基于MPE的特征提取

多尺度排列熵的主要计算过程分为两步.首先,是对分析时间序列进行多尺度粗粒化;然后,计算不同尺度下粗粒化序列的排列熵.

(7)

2) 计算不同尺度下粗粒化序列的排列熵.首先对粗粒化序列{yj,j=1,2,…,m}进行m维相空间重构可得:

Yj={yj,y(j+τ),…,y(j+(m-1)τ)}

(8)

式中:m为嵌入式维数;τ为延迟时间.对于每一个j,其m维真实值序列按升序排列为y(j+(j1-1)τ)≤y(j+(j2-1)τ)≤…≤y(j+(jm-1)τ).对于任意Yj,都可得到一组符号序列S(r)=(j1,j2,…,jm),r=1,2,…,k且k≤m!,m!为不同符号序列在嵌入维数m下的最大排列数.Pr(r=1,2,…,k)为任意一个符号序列S(r)出现的概率.用Shannon熵的形式定义任意符号序列的排列熵值为

(9)

0≤Hp=Hp(m)/ln(m!)≤1

(10)

Hp值的大小反应时间序列的随机性程度.Hp的值越大表示时间序列不规则性越大,相反则表明时间序列的规则性越好.

1.3 基于KPCA的特征降维

KPCA[17]的基本思想是在PCA的基础上引入核函数,通过核函数φ(·)把初始样本空间中的数据映射到高维特征空间F中.再根据PCA的原理实现主要特征的提取.

假设高维空间中的数据φ(xi)的均值为零,则其协方差矩阵为

(11)

对C进行特征值分解,则有

CU=λU

(12)

式中:λ,U为协方差矩阵C的特征值和特征向量.然后在式(12)两端乘以内积φ(xi)(i=1,2,…,n),可得

λ(φ(xi)·U)=φ(xi)·CU

(13)

(14)

定义核矩阵为Kij=[φ(xi)φ(xj)],将式(13)可以简化为

nλα=Kα

(15)

式中:α=(α1,α2,…,αn)T,K为具体核函数表达式.

(16)

设λ1≥λ2≥…≥λm(m≤n)为K的非零特征值,(α1,α2,…,αn)为对应的特征向量,则样本φ(xi)在高维空间F中μk方向的投影即样本的第k个非线性主元为

(17)

(18)

2 基于MRVM的故障诊断

MRVM[22]是基于分层贝叶斯模型结构,引入多项概率似然函数来实现分类成员概率的估计.

(19)

式中:K是核函数,wi是权重.在MRVM中,训练集的核函数是N阶平方矩阵K.辅助变量Y∈RC×N被引入回归目标,得到标准噪声回归模型为

ync|wc,kn~Nync(knwc,l)

(20)

式中:ync为Y的第n行l列的元素;wl为W的l列.

通过tn=i,yni>ynj,∀j≠i实现多分类.其概率输出通过多项式似然概率函数求得:

(21)

P(w|Y)∝P(Y|w)P(w|A)∝

(22)

式中:Ac表示A的c列导出的对角阵.基于以上推导,最大后验概率估计为

(23)

因此,根据以上最大值,得出一个已知类的权重参数更新方式为

(24)

最后,权重向量先验参数的后验概率分布为

p(A|w)∝pπ(w|A)p(A|τ,v)∝

(25)

通过式(25)就可以得出诊断样本属于不同故障类型的概率,被诊断特征对应概率最高的类,即为诊断样本的所属故障类别.

3 本文提出的混合故障诊断方法

本方法充分考虑了VMD在信号分解方面抗混叠、端点效应小、多尺度排列熵在复杂信号不确定性方面估计计算简单、抗干扰能力强的优势进行故障特征提取,提出VMD-MPE特征提取方法实现故障特征的提取.经过VMD-MPE提取的故障特征维数高、信息冗余、特征之间存在非线性关系,会导致故障诊断准确率低,因此有必要实现重要特征的筛选.故对于提取的特征,选择KPCA进行故障特征筛选和非线性数据挖掘,最后输入MRVM分类器进行训练和测试,提高分类性能.

本文提出的基于VMD-MPE-KPCA特征提取与MRVM相混合的滚动轴承故障诊断方法实现流程图如图2所示,具体步骤如下:

步骤1) 采用VMD分解滚动轴承不同状态下的振动信号为K个模态分量;

步骤2) 计算每个有效模态分量的MPE,构造高维故障特征向量;

步骤3) 利用KPCA对步骤(2)构造的高维故障特征向量进行降维和非线性数据挖掘;

步骤4) 输入MRVM进行故障识别,以概率输出形式实现故障诊断.

4 实验研究

4.1 实验数据

本文采用美国西储大学电气工程实验室发布的滚动轴承数据库[26](Case Western Reserve University,CWRU)验证本文提出方法的性能,其测试系统应用轴承为6205-2RSJEMSKF深沟球轴承,通过电火花加工技术设置轴承不同的单点故障.振动信号数据集通过安装在电机驱动端轴承座上方的加速度传感器采集,包括滚动轴承在正常(normal,N)、滚动体故障(ball fault,BF)、内圈故障(inner race fault,IRF)和外圈故障(outer race fault,ORF)四种运行状态下获得的振动信号数据,采样频率为12 kHz.本文以负载为1 470 W、故障直径为0.356 mm、电机转速为1 750 r/min下四种运行状态数据为研究对象,其振动信号的时域分析如图3所示.

4.2 故障特征提取

首先,通过VMD把四种状态下的振动信号分解为K个模态分量,如果分解个数选择不当会导致出现过分解或欠分解现象.本文通过文献[11]中观察中心频率的方法选取K=4.以四种状态下某一组样本为例,其分解后的4个模态分量如图4~7所示.从图4~7可以看出,四种状态下分解出的各个模态分量有着不同的差异,很难直接从中区别出故障信息.

通过MPE提取上述四种不同状态下振动信号分解为4个模态分量的故障特征.根据MPE的理论分析,可知MPE的计算过程需要对参数m、τ和s进行设置,本文根据文献[27]对MPE参数影响的选择分析,选取m=6、τ=1和s=12.对轴承四种状态的振动信号进行MPE分析,每个样本可组成一个48维的特征向量,如图8所示为在四种状态下分解为4个模态分量后每个模态分量的多尺度排列熵,四种模态下每种故障状态的排列熵值各不相同,MPE会随振动信号的变化而变化.

通过MPE计算得到的故障特征直接输入分类器,由于特征维数较高、信息冗余等因素会导致分类性能降低、维数较高.因此,根据滚动轴承振动信号表现为非线性,本文选择具备非线性数据处理能力的KPCA算法,选取累计贡献率为85%的故障特征作为最后输入分类器进行分类的故障特征,则原特征向量被降维成由3个特征值构成的特征向量.表1为选择KPCA处理后的故障特征向量值,每种状态只描了一个样本.

表1 KPCA处理后的特征Tab.1 Characteristics after KPCA treatment

4.3 故障识别

MRVM算法在分类过程中,选择合适的核函数对于算法的分类性能有较大影响.本文选择具有高维和低维、线性和非线性的能力径向基函数(radial basis function,RBF)作为MRVM的核函数,核参数的值为σ=7,其RBF核函数为

(26)

经过MRVM的训练和测试,将输出测试样本属于不同故障类型的概率,故障诊断的结果即输出概率最大的故障类型.选取240个样本进行试验,其中每组样本的前30个作为训练样本,后30个作为测试样本.表2为每种状态30个不同样本故障特征的故障识别结果,可见正常、内圈故障和外圈故障三种状态的识别率都达到了100%;滚动体故障中有一个样本没有被正确识别,识别率为96.7%;总体平均识别率为99.18%.

表2 本方法的故障识别结果Tab.2 Fault identification results of this method

表3是相关文献已有故障诊断方法与本文方法的对比结果,可以看到,本文提出的方法识别率达到了99.18%,比其他四种方法识别率更高,是一种更好的故障诊断方法.

表3 故障诊断方法对比结果Tab.3 Comparison results of fault diagnosis methods

5 结语

本文提出一种基于VMD-MPE-KPCA特诊提取与MRVM相结合的滚动轴承混合智能故障诊断方法.首先,通过VMD-MPE-KPCA方法实现重要故障特征的提取,该方法可以提取反应滚动轴承丰富故障信息的熵特征,降低了故障特征的冗余性,实现非线性提取.然后,提取的故障特征被输入到MRVM分类器实现滚动轴承故障识别,分类器将输出不同类别样本的故障概率.实验结果表明,本文所提出的混合智能故障诊断方法能够实现滚动轴承故障的有效识别,故障诊断准确率达到了99.18%.

猜你喜欢

分类器特征提取模态
联合仿真在某车型LGF/PP尾门模态仿真上的应用
学贯中西(6):阐述ML分类器的工作流程
多模态超声监测DBD移植肾的临床应用
跨模态通信理论及关键技术初探
基于朴素Bayes组合的简易集成分类器①
基于动态分类器集成系统的卷烟感官质量预测方法
空间目标的ISAR成像及轮廓特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于特征提取的绘本阅读机器人设计方案
一种自适应子融合集成多分类器方法