APP下载

基于VMD和随机森林的离心泵滚动轴承故障诊断*

2022-05-12户文刚张燕霞

机电工程技术 2022年3期
关键词:离心泵特征向量决策树

户文刚,张燕霞

(甘肃交通职业技术学院,兰州 730070)

0 引言

滚动轴承是离心泵的关键部件,其正常与否决定着离心泵的稳定运行,有研究统计数据表明30%以上的离心泵故障是轴承故障引起的,因此研究离心泵滚动轴承故障诊断方法具有重要意义[1]。离心泵滚动轴承运行过程中的振动信号往往包含着丰富的状态信息,通过分析处理滚动轴承的振动信号并基于时域、频域和时频分析提取特征向量,利用提取的特征向量进行轴承故障辨识是广泛应用的故障诊断方法。离心泵滚动轴承的振动信号往往表现出非线性、非平稳特点,并且早期微弱故障信号易受噪声干扰而难以提取和识别,因此,如何有效提取早期微弱故障特征及准确辨识故障,对实现离心泵运行状态监测及故障早期预判等具有重要意义与价值[2-3]。

传统的振动信号分析方法如傅里叶变换、小波变换、希尔伯特-黄变换等大多在处理非线性和非平稳振动信号时存在局限性[4-5]。为解决传统振动信号分析方法的缺陷,Norden等[6]提出经验模态分解(Empirical Mode Decomposition,EMD)方法;Smith[7]提出了局部均值分解(Local Mean Decomposition,LMD)方法;Wu等[8]在EMD的基础上提出了集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)方法;Gilles[9]提出经验小波变换(Empirical wavelet transform,EWT)。它们都可以自适应非线性和非平稳振动信号处理,但是仍存在一定的缺陷,其中EMD算法存在模态混叠现象、边界效应、对噪声敏感、依赖插值方法选择等问题,LMD有计算量大、平滑次数最优确定等问题,EEMD在中低频存在模态混叠现象,EWT在面对复杂频谱是存在过切分问题。Dragomiretskiy等[10-12]提出变分模态分解(Variational Modal Decomposition,VMD)方法,变分模态分解是近些年广泛应用的一种新的自适应信号分解方法,它从低到高排序信号频率,自适应分解成多个模态分量(IMF),在处理非线性、非平稳信号能取得理想的效果。该方法克服了EMD等方法模态混叠现象、噪声敏感,同时避免了递归模型的缺陷。

传统的故障识别方法主要有k近邻分类器(K-nearest Neighbor Classification,KNN)[13]、人工神经网络(Artificial Neural Network,ANN)[14]、支持向量机(Support Vector Machine,SVM)[15]。这些方法在故障诊断方面应用颇多,KNN简单、易懂,在处理分类问题时对异常值不敏感,分类准确度高,但是KNN无法给出数据的内在含义,同时计算复杂度高,无法处理样本不平衡问题。ANN具有较强的自学能力与泛化能力、较好的适应性、能很好的非线性逼近等优点,但是ANN也存在参数多及优化难、学习时间过长等缺点。SVM作为比较经典的分类算法,克服了ANN学习速度慢和过拟合的问题,但也存在面对大样本数据时处理能力不足以及解决多分类问题时分类精度较低等缺陷。随机森林(Random Forests,RF)[16-17]是比较经典的集成学习算法,其将随机性引入决策树,改善了决策树易过拟合的问题,并具有较强的抗噪声能力,能够解决ANN繁琐的参数寻优过程、收敛速度过慢问题,同时解决了SVM在面对大样本数据时处理能力不足与分类精度低的缺点。基于上述分析,本文将变分模态分解(Variational Modal Decomposition,VMD)方法与随机森林(Random Forests,RF)相结合,提出基于基于VMD和随机森林的离心泵滚动轴承故障诊断。RF不需要繁琐的参数寻优过程和最优的特征向量选择。

1 算法原理简介

1.1 变分模态分解

变分模态分解(Variational Modal Decomposition,VMD)[8]是Dragomiretskiy和Zosso于2014年提出的一种新的非线性非平稳信号自适应分解计算方法,VMD方法通过预设分解个数K值,寻找变分模型最优解确定各模态分量相关中心频率和带宽带,自适应将原始信号分成K个模态分量(Intrinsic Modal Function,IMF)。假定一原始信号x(t),通过VMD分解为K个离散模态分量uk(t),k=1,2,…,K。算法的具体步骤如下:

(1)对每一个模态分量uk(t)应用Hilbert变换获取其单边谱:

式中:δ(t)为脉冲函数。

(2)将每个模态分量uk(t)频谱转移到到相应基频带:

式中:wk为uk(t)的中心频率。

(3)通过对各模态分量uk(t)解调信号的高斯平滑方式估算各模态分量的带宽,构造约束变分模型:

式中:∂t表示对t求偏导,表示L2范数。

为了求解上述变分问题,引入惩罚因子α和拉格朗日乘法算子λ,从而将约束问题转变为无约束的问题,得到扩展的Lagrange表达式为:

式中:ε为求解精度。

求解过程中的单个变量更新表达式如下:

式中:n为正整数;∧为傅里叶变换;τ为保真系数或者噪声容限参数。

根据实际信号的频域特性进行信号频带的自适应分割,原始信号被分解成K个有限带宽值的IMF分量。变分模态分解具体分解流程如图1所示。

图1 变分模态分解流程Fig.1 Flow chart of variational modal decomposition

1.2 随机森林

随机森林(Random Forest,RF)是Leo Breiman等在决策树的基础上提出的一种组合分类器,通过引入随机属性选择,由多个决策树的投票来决定最终的分类结果,相比单个分类器有更高的分类结果,可以有效地提升学习系统的泛化能力。

给定数据集D={Xi,Yi},Xi∈Rk,Yi∈{1,2,…,c},由多个决策树{h( )x,θm,m=1,2,…,M}组成森林,随机森林的基决策树在输入样本x情况下给出各自的分类结果,最后利用投票方式输出最终的分类结果。随机森林算法步骤如下。

(1)从原始数据集中利用bootstrap重采样方法随机抽取n个样本组成单决策树的训练集,其大小约为原始数据集的2∕3,依次为每一个bootstrap训练集训练组建分类数,共产生n棵决策树构成一片“森林”,这些决策树均不进行剪枝。

(2)随机森林自上而下从单棵决策树的根节点开始递归分裂。定义训练样本的输入特征个数为M,在每个节点上进行分裂时,从M个特征向量里随机(无放回)选择m(m保持不变)个特征向量,然后按照分裂节点不纯度最小的原则从上述特征中挑选出一个最好的特征进行分裂生长,重复上述过程依次分裂直至该决策树遍历所有的特征属性。

(3)在分类阶段,集合n棵决策树的分类结果,利用投票决策最终的类别。

随机森林的分类原理降低了数之间的相关性,保证了因模型输入数据维数上升过高情况下,仍能获得良好的分类效果。分类过程如图2所示。

图2 随机森林分类过程Fig.2 Randomforest classification process

2 实验验证

2.1 构建的VMD-SF故障辨识方法

基于VMD和随机森林的离心泵滚动轴承故障辨识具体实现步骤如下:

(1)从待测设备采集振动信号并进行VMD分解,得到K个模态分量IMF;

(2)基于模态分量IMF,提取如表1所示时域和频域方面特征指标,构建原始信号特征向量集;

表1 各通道故障特征参数Tab.1 Fault characteristic parametersof each channel

(3)将构建的原始信号特征集输入RF中进行训练学习;

(4)将测试集输入到RF分类器中进行模式识别,得到测试数据的故障分类诊断结果。

基于VMD和随机森林的离心泵滚动轴承故障诊断的基本流程如图3所示。

图3 故障诊断流程Fig.3 Fault diagnosis flowchart

2.2 数据来源

本文采用如图4所示某型号离心泵作为试验对象进行故障诊断试验验证。通过振动传感器采集驱动端轴承振动数据,设定电机转速2 600 r∕min,采样频率为6 kHz,通过振动加速度传感器分别采集滚动轴承正常状态、内环裂纹、外环裂纹、滚动体损坏4种状态下的振动信号,其中轴承故障由电火花加工技术而成,如图5所示。

图4 离心式化工泵故障模拟实验台Fig.4 Centrifugal chemical pump fault simulation test bench

图5 故障轴承Fig.5 Faulty bearing

为了更完整表征滚动轴承故障状态,采集各状态信号各60组,以其中的40组作为训练样本,20组作为测试样本。滚动轴承几种状态的原始振动信号波形图如图6所示。

图6 滚动轴承在不同状态下的振动信号Fig.6 Vibration signalsof rollingbearingsin different states

2.3 VMD分解及特征提取

选择内圈故障信号进行VMD分解,分解结果如图7所示。根据文献[12],设定K=7。由图可知,原始振动信号被分解成7个IMG分量。基于表1提取各IMF分量特征向量,构建原始信号特征向量集,即提取此状态下第一组信号经VMD分解的特征向量,得到7×14=98个特征向量,同理提取其他状态的98个特征向量。最后得到一个维数为1 680×14的特征向量矩阵。

图7 内圈故障样本的VMD分解结果Fig.7 VMDdecomposition resultsof inner ringfault samples

2.4 基于RF的故障分类

将得到的1 680×7特征向量矩阵随机抽取各故障模式数据组成比例为(1 120,560)的训练集与测试集,利用训练集训练RF模型,在RF训练完成后,通过测试集验证模型分类的精度,如表2所示。由表可知,每种故障状态的分类识别正确率都比较高,平均分类准确率达到了97.96%,因此表明基于VMD-RF的故障辨识是可行的且有效的。

表2 各故障状态的识别准确率Tab.2 Recognition accuracy rateof each fault state

为了进一步验证所提方法的优越性,分别建立VMD-RF、VMD-BP和VMD-SVM模型并分类。3种模型的分类结果如表3所示。结果表明,3类模型中VMD-RF分类的准确率最高,而VMD-BP分类误差最大,VMDSVM介于两者之间。由此可以看出VMD分解提取的信号特征有效地表征了原始信号的信息,同时说明VMD-RF模型在滚动轴承故障识别方面要优于传统的BP和SVM,验证了本文所提方法具有一定的可行性。

表3 各分类模型的识别准确率Tab.3 Recognition accuracy rate of each classification model

故障诊断的本质是模式识别,为了更直观地表达故障类型的分类效果,将各分类方法的可视化三维分类结果绘制成如图8所示的散点图。从图8中可以很直观地看出,基于VMD-RF的滚动轴承不同故障模式的特征具有很好的可分性,分类效果很理想,而其他组合方法VMD-BP和VMD-SVM几类故障模式有一定的重叠。

图8 各分类方法的三维可视化分类结果Fig.8 Three-dimensional visual classification results of each classification method

3 结束语

为解决离心泵滚动轴承的故障诊断问题,本文将变分模态分解与随机森林相结合,提出了基于VMD和随机森林的离心泵滚动轴承故障诊断方法。首先对滚动轴承振动信号进行VMD分解得到K个IMF分量;然后基于时频域指标构建各IMF分量的特征向量,以此作为随机森林分类的依据;最后利用离心泵轴承数据对该方法进行了可行性验证,结果表明所提方法可以有效对滚动轴承故障类型进行识别分类,与BP和SVM传统分类方法相比,本文提出的VMD与随机森林结合的方法具有更高的分类准确率,为滚动轴承故障诊断提供了新的思路。

猜你喜欢

离心泵特征向量决策树
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
一种改善离心泵运行状态的方法
大型立式单级引黄离心泵轴向力平衡的研究
离心泵流场外特性及激励数值计算
高比速离心泵的高效设计研究
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
一类特殊矩阵特征向量的求法
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用