基于PSO-VMD与贝叶斯网络的滚动轴承故障诊断

2021-01-21仝兆景芦彤秦紫霓

河南理工大学学报(自然科学版) 2021年1期

仝兆景，芦彤，秦紫霓

(河南理工大学电气工程与自动化学院，河南焦作 454000)

0 引言

滚动轴承是电机的重要组成部分，滚动轴承的故障预测对电机设备的性能、效率以及使用寿命有重要意义。滚动轴承正常运行时产生平稳信号，而发生故障时由于产生剧烈的振动和冲击，产生非平稳信号。因此，滚动轴承发生故障时会产生窄带脉冲干扰和随机信号，而窄带脉冲信号的产生会干扰和淹没故障特征信号。在工业应用中，电机常处于变负载运行状态，负载改变时振动信号也会产生波动，并伴随有噪声干扰和数据缺失，因此严重影响故障特征信号的提取和识别。

在故障诊断领域，经验模态分解[1](empirical mode decomposition,EMD)与变分模态分解[2](variational mode decomposition,VMD)是常用的信号特征提取方法。EMD易发生模态混叠问题，而VMD的非递归分解方式可以有效抑制模态混叠问题。姜万录等[3]将VMD与支持向量数据描述相结合，实现了对滚动轴承退化程度的评估。为增强VMD的特征提取效果，可以采用改进的粒子群优化算法(particle swarm optimization,PSO)优化其影响参数。Hilbert变换能有效地将时域信号转化为频域信号，避免模态泄露的问题[4]。

目前，滚动轴承的故障诊断存在数据量逐渐增大以及故障信息不完整的特点，仅通过信号处理无法有效实现故障诊断，因此信号处理与机器学习相结合的方法逐渐应用于故障诊断领域。王新等[5]将VMD能量特征提取与SVM相结合，实现了轴承故障诊断；陈法法等[6]通过KNN处理轴承振动信号的时域、频域和时频域构建的混合特征集，有效提高了模型的故障诊断精度。以上方法在处理噪声含量较少、数据完备的问题时表现良好，但实际工业中所采集的数据常包含大量噪声，并且会出现数据缺失现象。贝叶斯网络是一种处理复杂不确定系统以及不完整信息的有效模型[7]，利用变量之间的依赖关系，对节点变量进行数据更新，信息在变量之间传播，根据节点的状态推理得到故障类型，其在处理不完备数据时表现出良好的性能[8]。大多数滚动轴承故障诊断仅考虑振动频率对不同故障的影响，未考虑负荷及转速对诊断结果的影响，因此，本文在构造故障诊断模型时，加入相应的转速以及负荷节点。通过PSO优化的VMD与贝叶斯网络相结合的方法，建立符合滚动轴承特点的故障诊断模型，该模型基于贝叶斯概率推理,充分考虑不同故障情况下的特殊性，可提高故障诊断的准确率。

1 变分模态分解与算法

1.1 变分模态分解

VMD是一种非递归模态分解方式，通过构造变分模型，实现自适应分解信号。设信号X(t)经VMD分解并重构成K个IMF分量，将重构后的各IMF分量uk(t)作为调制信号，通过Hilbret变换解调，从而获得其解析信号。将所得到的解析信号与指数e-jωkt相乘，将各IMF分量的频谱调制到相应的基频带，

(1)

通过对平移后解调信号各模态带宽进行估计，得到带有约束条件的变分问题，即

式中：f为输入信号；{uk}={u1,u2,…,uK}，为原数据经VMD分解得到的K个IMF分量；{ωk}={ω1,ω2,…,ωK}，为各IMF分量的中心频率。

为了求解上述变分约束问题，引入二次惩罚因子α以保证在高斯噪声影响下信号能精确的分解。Lagrange乘法算子λ(t)能使约束问题保持严谨性，增广Lagrange函数L表示为

(3)

1.2 基于粒子群算法优化的VMD(PSO-VMD)

研究发现，在VMD分解过程中，二次惩罚因子α与IMF分量个数K对其分解效果有较大影响[9]。传统的方法中，单一考虑参数K对VMD分解的影响，只能得到一种相对较优的结果。本文利用改进的PSO算法同时对VMD的参数α与K进行寻优。

粒子群算法[10]是一种群智能的全局优化算法，具有良好的全局寻优能力。然而对于普通粒子群算法，权值ω是恒定不变的，难以同时保持较高的局部寻优与全局寻优效果。为了同时对VMD的2个影响参数寻优，本文利用自适应权重的粒子群算法对VMD进行参数寻优。自适应权重的PSO引入一种惯性权重ω，其与全局最优点紧密联系，随粒子的位置而变化。本文采用非线性动态惯性权重系数，即

(4)

式中：f为粒子实时的目标函数值；favg为粒子的平均值；fmin为粒子最小目标值。

从式(4)可知，惯性权重的大小随着粒子目标函数值的变化而更新。

首先，需要确定适应度函数fitness，finess函数随粒子位置的改变而更新，通过对比fitness值确定粒子的更新方向。fitness函数采用原信号总能量与分解后K个模态分量总能量的差值。差值代表原信号与各模态分量的相似程度，差值越小，相似程度越高。

(5)

fitness=min(Eo-Ev)，

(6)

式中：Eo和Ev分别为原信号的总能量与各IMF分量的总能量；x(t)为输入信号；ui(t)为VMD分解后的各模态分量；K为VMD的分解数量。

(1)对PSO算法的各参数初始化并确定fitness函数。

(2)对PSO算法的粒子种群位置进行初始化，随机生成部分影响参数组合[α,K]作为粒子的初始位置，并随机初始化各粒子的速度。

(3)在不同粒子位置处分别进行VMD分解，确定不同位置处的fitness函数值。

(4)对比不同位置处的fitness函数值，从而更新局部极值以及种群的全局极值。更新粒子速度和位置，

(7)

(5)根据式(4)更新权重ω。循环迭代步骤(3)～(5)，至最大迭代次数，输出最佳fitness值与最佳粒子位置。

2 贝叶斯网络

贝叶斯网络(Bayesian networks，BNs)是描述节点之间概率关系的有向无环图(directed acyclic graph，DAG)，目前被广泛用于不确定信息推理领域，如金融预测分析、生物信息处理、人工智能以及故障诊断等[11]。DAG由节点集合V={V1,V2,V3,…,Vn}和有向边E(E={ViVj|Vi,Vj∈V})组成。因此，DAG表示为G=(V,E)。条件概率表(conditional probability table，CPT)表示每个节点相对于其父节点所有可能的条件概率，Θ表示节点条件概率分布的集合：Θ={P(Vi|V1,V2,…,Vi-1),Vi∈V}。DAG与CPT组成完整的BNs，分别对问题进行定性描述和定量描述。

假设Pa(Vi)表示变量Vi的父节点集，则V的联合概率分布为

(8)

模型推理根据贝叶斯决策准则，预测故障发生的概率。假设特征向量X为v维向量，P(X|Vi)为X在类别Vi下的条件概率，Vi的先验概率为P(Vi)，根据贝叶斯公式，后验概率为

(9)

贝叶斯决策准则表达式为∀i≠j，都有P(Vi|X)>P(Vj|X)，则X被判定为类别Vi。

BNs能够明确表示复杂系统中各因素间的依赖关系，能利用专家经验知识对系统进行推断等。由于滚动轴承故障存在预测准确率低、且涉及到专家经验知识、不确定问题的推理问题，因此利用贝叶斯网络构建滚动轴承的故障诊断模型。

3 基于贝叶斯网络的滚动轴承故障诊断模型

3.1 数据预处理

采集到的滚动轴承故障样本会出现一些不符合实际情况(如存在负值)、样本数据缺失以及采集数据精度低等问题，这些数据会对贝叶斯的学习造成误导。因此，利用收集到的测试样本进行BNs结构学习前，要对数据进行预处理，删除无价值的样本数据，获得有效的训练样本。对原始数据的预处理包括2个部分，即特征提取和离散化。

(1)特征提取。采用改进PSO优化的VMD分解，将滚动轴承振动信号分解到不同的频带，并通过峭度准则筛选出Ng个IMF分量。峭度Kg能反映出振动信号的分布特性，信号包含的故障成分越多，Kg越大，正常信号的Kg值接近于3。因此，采用峭度准则筛选出模型中含故障信息最多的分量，计算公式为

(10)

式中：x为振动信号；μ为信号的均值；σ为信号的标准差。

Hilbert边际谱能准确反映信号的频谱特征，同时不会发生能量泄露问题，有利于计算能量特征矩阵。因此，本文提取滚动轴承振动信号的Hilbert边际谱，并计算其能量特征以构建特征矩阵。Hilbert边际谱就是对原信号进行Hilbert变换并进行积分运算的过程，即

(11)

根据式(11)所提取的Hilbert边际谱特征，将其均分为6个子频带，并计算各子频带的能量作为特征变量，构建特征矩阵，即

(12)

(2)离散化。目前，BNs概率推理算法大都采用离散化处理，为了精确识别故障类型，需要对数据信息进行离散化处理。由于各个节点分别代表不同的物理过程，有些节点的取值在3个数值区域中振荡，有的节点取值在4～5个区域中振荡，因此，对数据信息进行相应的离散化处理，为各个节点变量赋予相应的状态。根据不同节点变量特征，进行相应的离散化处理，将连续变量X离散化为有限个状态，

(13)

式中，P为状态数。

3.2 模型参数选取和拓扑结构确定

综合考虑故障类型及原因，以滚动轴承振动信号的Hilbert边际谱特征值、转速以及负荷作为BNs的叶节点，故障类型作为BNs的根节点。根据变量之间的因果联系，建立初步的滚动轴承故障诊断贝叶斯网络模型。

滚动轴承故障诊断模型中，节点变量蕴含着数值与概率信息，根据获取的信息，对网络结构中节点变量实时更新信息。节点之间存在概率关系复杂以及数据信息量大的问题，为简化模型，需要通过专家知识、优化算法以及数据学习删除影响相关性弱的边，对模型简化。

首先，根据专家知识删除初始网络节点相关性弱的边，为防止后续结构优化删除相关性强的边，需将通过专家知识得到的因果关系以规则的形式写入知识库。然后，采用搜索打分的结构学习算法对网络结构进行优化。本研究根据贝叶斯信息准则(Bayesian information criterions，BIC)中的评分函数作为组合优化的目标函数，基于上述初始贝叶斯网络结构结合PSO算法进行优化，得出与数据拟合度较高的拓扑结构。

经过优化，得到滚动轴承故障诊断模型的拓扑结构，如图1所示。

图1 滚动轴承故障诊断贝叶斯网络模型

滚动轴承故障诊断模型中，节点的状态划分为：故障类别={正常(S0)，滚动体轻微(S1)，滚动体中等(S2)，滚动体严重(S3)，内圈轻微(S4)，内圈中等(S5)，内圈严重(S6)，外圈轻微(S7)，外圈中等(S8)，外圈严重(S9)}；0～4kH2={超低(S0)，低(S1)，中(S2)，高(S3)}；4～8kH2={低(S0)，中(S1)，高(S2)}；8～12kH2={超低(S0)，低(S1)，中(S2)，高(S3)，超高(S4)}；12～16kH2={低(S0)，中(S1)，高(S2)}；16～20kH2={低(S0)，中(S1)，高(S2)}；20～24kH2={低(S0)，中(S1)，高(S2)}；转速={超低速(S0)，低速(S1)，中速(S2)，高速(S3)}；负荷={0(S0)，1(S1)，2(S2)，3(S3)}。

4 试验与结果分析

4.1 数据来源

试验数据源自Case Western Reserve University轴承数据中心[16]。为验证本文所提出方法的可行性，采用损伤部位分别为内圈、外圈、滚动体和无损伤共10种损伤等级不同的数据，每种故障类型分别选取负载为0，1HP，2HP，3HP的变转速、变负载数据。每种故障类型各采集240 000个信号点，每1 200个信号点构成一组样本，即每种故障类型包含200个样本，10种不同等级共2 000组样本(表1)，其中训练样本1 500组，测试样本500组。

表1 试验数据集

4.2 数据预处理

4.2.1 特征提取

首先对数据进行归一化预处理，提高数据处理速度与分类精度。利用式(14)将轴承振动数据归一化到[0,1]。

(14)

式中：n为参与训练的样本个数；zmax为样本中的最大值；zmin为样本中的最小值。

通过自适应步长的粒子群算法对VMD的最优参数组合[α,K]进行参数寻优。以一组内圈轻微故障数据进行分析，分别利用改进PSO、传统PSO以及GA算法进行参数寻优结果对比，如图2所示。从图2可以看出，PSO算法迭代速度快且寻优效果好。改进的PSO算法在迭代到第16次时达到最优的适应度值6，适用度远小于其余2种方法，此时的最优参数组合为[1 486,6]。分别计算正常、内圈、外圈、滚珠故障4种状态下的最优影响参数组合[α,K]，结果如表2所示。

图2 PSO-VMD参数优化结果对比

表2 最优影响参数

图3为4种信号的时域波形图，从图3可以看出，4种轴承振动类型都存在较为明显的周期性规律，并且存在明显差别，因此，可以进行进一步的故障特征提取与分类。

为了验证PSO-VMD-Hilbert边际谱特征提取的有效性，以内圈故障为例，分别采用EMD和VMD方法对轴承振动信号进行分解。依照表2选取VMD的最优参数组合[α，K]=[1 486，6]，其余参数保持默认值。

因为EMD分解后的能量主要集中在前几个分量中，所以选择前3个模态分量进行分析。图4展示EMD方法信号分解后的模态分量频谱图，出现了模态混叠现象；图5展示VMD方法信号分解后的模态分量频谱图，模态分量集中在各自的中心频率附近，降低了模态混叠现象。

经VMD分解后由Hilbert变换解调的包络谱如图6所示，从图6可以看出，采用VMD分解后各模态分量中都包含明显的故障特征，可以确定,滚动轴承内圈故障的频率为158.2 Hz，证明VMD算法能有效提取故障特征。

对于大量数据以及同一故障类型不同故障等级的问题，很难单一通过VMD分解判断滚动轴承的故障状态，因此利用Hilbert边际谱进行特征提取。如图7所示，4种不同类型的信号经特征提取后，边际谱信号分布在不同频带且表现出差异性特征。其中正常信号分布在3.8～6 kHz频段；内圈故障信号分布在5～6 kHz频段；外圈故障分布在2.5～3.4 kHz频段；滚珠故障信号分布在2.3-3.2 kHz频段。这证明了边际谱能准确反映滚动轴承振动信号频谱分析特征。

图3 时域波形图

图4 EMD频谱图

4.2.2 数据离散化

根据式(12)的离散化标准，对测试集中的数据进行相应离散化。根据每个节点的数据信息，确定其相应的状态。综上所述，按要求采集10种故障状态各振动频段上的Hilbert边际谱、转速以及负荷作为观测样本，从数据集中分别选取50～500组数据作为测试集，如表3所示(因篇幅限制，仅列6组)

4.3 模型诊断推理

4.3.1 完备数据下滚动轴承故障诊断推理

根据图1所示的故障诊断模型对滚动轴承的振动故障进行推理。以边际谱特征、转速以及负荷为证据节点(Evidence)，滚动轴承的故障类型作为目标节点(Target)，将表3第6组试验数据导入模型并对模型进行更新，滚动轴承故障推理模型如图8所示，推理结果如图9所示。从图9可以看出，S2的概率最大为82.1%，S2为滚动轴承滚动体中度故障。对比可知(图10)，诊断结果与实际情况吻合。

图5 VMD频谱图Fig.5 VMD spectrum diagram

图6 VMD包络谱Fig.6 VMD envelope spectrum

表3 部分试验数据集

X1：0～4kH2；X2：4～8kH2；X3：8～12kH2；X4：12～16kH2；X5：16～20kH2；X6：20～24kH2；X7：转速；X8：负荷

图7 边际谱Fig.7 Marginal spectrum

图8 BNs故障诊断推理模型Fig.8 BNs fault diagnosis inference model

4.3.2 不完备数据下推理试验

贝叶斯网络类比其他故障诊断方法在数据缺失的情况时有明显的优势。在实际情况中，针对可能会出现数据缺失的问题，贝叶斯网络根据条件独立性假设，可以解决样本数据之间的不确定问题，从而对数据进行充分地利用。

表4列出当表3中数据出现不正常的情况(假设数据出现缺失的情况)，即表3中第5组试验中的节点X1出现缺失，如果采用神经网络建模方法，需要利用数据修补，导致算法复杂度增加。为验证数据异常情况下模型的准确性，本文将X6节点设置为异常节点，其实际值应为“1”，而相应的异常观测值为“2”。

图9 故障诊断结果Fig.9 Fault diagnosis results

利用本文的贝叶斯网络诊断方法，在数据出现异常情况下的诊断结果列于表4。从表4可知，诊断推理结果与真实情况一致。

表4 数据出现异常情况下BNs故障诊断推理结果

图10 不同算法准确率对比Fig.10 Comparisons of algorithm accuracy

4.3.3 故障诊断准确率对比

为了验证其他故障分类算法和贝叶斯网络结构学习算法的准确率，分别设定300,500,700,900,1 100,1 300,1 500组样本数据进行结构学习，在样本组数相同情况下，故障诊断的正确率曲线如图11所示。从图11可以看出，随着学习样本数的增加，3种算法的诊断准确率都有提高，但贝叶斯网络结构学习算法在整体和局部都有较高的诊断准确率，诊断误差较小，可以较好地满足现场诊断的准确率要求。

图11 SNR为2时的轴承振动信号图

4.4 噪声试验测试

为验证所提出方法的抗噪性，通过原始数据构造噪声干扰试验。为原信号加入信噪比为2的高斯白噪声。信噪比SNR代表信号与噪声的比值，SNR越小，信号中所含的噪声比例越大，

(15)

式中：esignal为信号能量；enoise为噪声能量。

如图11所示，原信号添加SNR为2的噪声后，信号中能观察到明显的噪声干扰成分，周期性冲击成分减弱。

为验证所提出方法在处理含噪声干扰数据时的优势，分别与支持向量机(SVM)、最近邻(KNN)以及未加入转速与负荷节点的贝叶斯(BNs)方法进行对比试验，结果如图12所示。

图12 噪声干扰下不同算法在数据完备与数据缺失情况下的对比

如图12所示，在处理含噪声的完备数据集时，KNN方法表现出较差的抗噪性，其准确率只达到79%；SVM与BNs方法的抗噪性有所提高，但也只达到85%；相比于以上方法，VMD-BNs方法由于增加了VMD-Hilbert边际谱特征提取，能有效分离噪声信号，提取有效的故障特征，表现出较好的抗噪性，其准确率最高能达91.6%。

图12对比了以上4种方法在处理数据完备与数据缺失情况下的故障诊断效果。结果表明，数据的缺失会造成部分故障信息的缺失，从而导致其识别准确率的下降。以上算法中，数据缺失严重影响SVM和KNN算法，导致其准确率分别下降14.4%和17.1%。而BNs与VMD-BNs算法在数据缺失的情况下，准确率仍达到了79.5%和84.5%，优于SVM和KNN两种算法，验证了BNs算法处理不完备数据的优势。

5 结语

本文采用改进PSO-VMD与BNs相结合的方法对滚动轴承进行故障诊断。改进的PSO-VMD有效提高了特征提取效果，有利于Hilbert边际谱特征提取，并可对提取的特征进行相应的状态划分。根据专家经验确定节点的条件概率表，构建基于PSO-VMD与BNs的故障诊断模型，通过BNs模型的推理得到故障节点的概率分布。经试验验证该模型有效地提高了变负载状况下滚动轴承故障诊断的效果。