WOA-VMD算法在轴承故障诊断中的应用
2021-08-21张文海赵新贺吴显腾
张 萍,张文海,赵新贺,吴显腾,刘 宁
(河北工业大学人工智能与数据科学学院,天津300130)
轴承是旋转机械关键部件之一,发生故障时易导致机械停产、安全事故等问题的产生[1]。其工作环境干扰噪声较多,轴承振动信息所含频率复杂,使其早期故障特征信息难以提取和诊断[2]。滚动轴承故障诊断是一个模式识别的过程,包含特征提取和故障识别两部分,能够准确提取故障信号特征并进行诊断意义重大[3]。因此,本文对滚动轴承振动信号的特征提取和故障诊断方法进行研究,以便提高机械运行的经济性和安全性。
轴承振动信号发生早期故障时,会产生微弱周期性冲击信号,但会被噪声信号淹没,所以需要对振动信号进行分解处理[4]。变分模态分解(Variational mode decomposition,VMD)是由Dragomiretskiy 等2014年提出的一种自适应处理信号方法[5]。与传统经验模态分解(EMD)分解相比,VMD在端点效应和模态混叠方面具有很大优势[6]。目前VMD 已在信号特征提取方面得到成功应用,张超等提出采用VMD提取齿轮信号特征,并结合最小二乘支持向量机进行故障诊断[7]。杨秋玉等提出VMD 结合Hilbert边际谱能量熵对高压断路器进行特征提取[8]。VMD 中模态个数K和惩罚参数α 会影响分解效果[9]。对VMD参数优化多用中心频率观察法,但该法只能优化K值,惩罚参数α则采取默认值[10]。本文通过分析[K,α]的影响效果,提出采用鲸鱼优化算法(WOA)优化VMD 参数的方法,并计算IMF 能量熵作为特征向量,从而能更有效提取各频带故障特征。
提取信号特征后还需要采用有效的模式识别算法进行故障诊断,支持向量机(SVM)是一种针对小样本及非线性问题的模式识别方法[11–12]。胡勤等针对SVM 对参数依赖强的问题,采用遗传算法优化SVM 对机械轴承进行故障诊断[13]。赵春华等针对轴承故障诊断问题,提出采用WOA 优化SVM 的诊断方法[14]。鲸鱼优化算法(Whale Optimization Algorithm,WOA)是Mirjalili等2016年提出的,具有参数少、收敛快等优点[15]。但其种群迭代机制易陷入局部极值,导致精度不高[16]。因此本文将在WOA中引入随机变异策略,增加种群多样性,提高全局搜索能力,使分类模型具有更高精度。
综上,本文在特征提取部分采用WOA-VMD能量熵方法,故障诊断部分采用改进WOA-SVM 模型识别方法。首先采用WOA优化VMD参数,将原始信号分解得到IMF 分量,根据峭度准则对IMF 进行筛选,并计算IMF 能量熵作为特征向量。然后将提取的特征向量应用改进WOA-SVM 模型进行分类。最后,通过不同故障类型的轴承数据进行实验仿真,结果表明,该方法诊断准确率高达99.2%,相比中心频率观察法-VMD 与PSO-VMD,准确率提升了10%,证明该方法能够有效提取特征和诊断故障。
1 WOA-VMD能量熵的特征提取
1.1 变分模态分解
VMD 能够自适应匹配每种模态的最佳中心频率和有限带宽,实现固有模态分量(IMF)有效分离,其核心思想是构建和求解变分问题。VMD 将原始信号分解为K个IMF的如下变分模型:
其中:{uk}和{ωk}分别是所有模态和对应中心频率集合,δ(t)是狄拉克函数,k为模态个数,f为原始信号为经过Hilbert 变换后uk(t)的频谱,*为卷积运算,∂t为梯度运算。
为求解式(1),引入Lagrange 乘法算子λ,使约束变分问题转化为非约束变分问题,得到增广Lagrange表达式为
式中:α是惩罚因子,λ为Lagrange算子,采用交替方向乘子法将原始最小化问题转化为增广拉格朗日函数的鞍点问题。
VMD实现步骤为:
(c)判断是否满足终止条件,
式中:ε为判断精度(ε>0),若不满足,则返回步骤(b),若满足,则输出K个模态分量。
1.2 运用WOA优化VMD
由VMD分解步骤可知,分解信号前需要设置合适的模态个数K和惩罚参数α,K取值过大会导致过分解,反之,则会欠分解,α取值过大,会造成频带信息丢失,反之,会信息冗余,所以需要确定最佳参数组合[K,α]。目前多用中心频率观察法,通过观察不同K值下的中心频率确定K值,但该法具有偶然性,且只能确定模态个数K,无法确定惩罚参数α。所以本文提出运用鲸鱼优化算法(WOA)对VMD参数进行寻优,以包络熵极小值作为适应度函数,包络熵代表原始信号的稀疏特性,当IMF中噪声较多,特征信息较少时,则包络熵值较大,反之,则包络熵值较小[17]。
信号x(i)(i=1,2,…,N)包络熵EP可以式(5)表示,式中a(i)是由VMD 分解的k个模态分量经Hilbert 解调后的包络信号,ε(i)是通过计算a(i)的归一化得到的概率分布序列,N为采样点数,计算概率分布序列ε(i)的熵值即为包络熵EP。
采用WOA 出发点是该方法具有寻优速度快、全局收敛性强、参数少等特点。WOA是一种模拟座头鲸狩猎行为的元启发式优化算法。如图1 所示。算法采用螺旋来模拟座头鲸泡泡网攻击机制,该机制是座头鲸的觅食方法,当捕食猎物时,座头鲸会潜到水下,在猎物周围制造螺旋状泡泡网,将其逼向泡泡网中心,最后吞掉网集的猎物。
图1 座头鲸泡泡网攻击机制原理图
算法步骤如下:
(a)鲸鱼个体种群、位置、迭代次数等参数初始化,第i个个体位置如下:
式中:r∈[0,1]内随机数,Xi的取值范围为[lb,ub],lb为参数边界最小值,ub为参数边界最大值。
(b)当p<0.5 且 |A|<1 时,根据最佳搜索代理进行收缩包围如式(7)所示:
当p<0.5 且 ||A≥1 时,选择随机搜索代理进行迭代更新如式(8)所示,式中为随机选取鲸鱼位置向量。
当p≥0.5 时,采用螺旋收缩方式迭代如式(9)所示:
(c)判断是否满足终止条件,即t=tmax(tmax视具体问题迭代精度而定),达到最大迭代次数,且式(7)中收敛因子减小到0。若不满足,则返回步骤(b),若满足,则输出最佳搜索代理。
采用WOA优化VMD参数流程如图2所示。首先初始化鲸群位置向量[K,α],以包络熵作为适应度函数,并计算每个鲸鱼适应度,然后通过判断收敛因子大小选择迭代公式进行迭代更新,直到满足终止条件,输出最优VMD参数。
图2 基于WOA优化VMD参数流程图
1.3 特征向量
特征向量提取流程如图3 所示。VMD 利用WOA 寻优后的参数组合[K,α]采用VMD 对原信号分解,得到K个模态分量,计算每个IMF 峭度值,将其定义为
图3 特征提取流程图
式中:μ为信号x的均值,σ为信号x的标准差。
峭度可以反映信号波形尖峰度,由于每个IMF含有冲击成分不同,则对应峭度值也不同,含有冲击成分越多的IMF 分量峭度值越大,所含故障信息也越多,正常信号峭度值等于3左右[18]。筛选出峭度值较大IMF,即含瞬时能量变化的IMF,为表示各IMF能量分布情况,计算对应IMF能量熵[H1,H2,…,Hn]作为特征向量,能量熵反映能量分布均匀性,若IMF所含频率复杂,则表明能量分布混乱,能量熵较大,能量熵定义为
式中:n为模态个数,Ei为模态分量的能量,Pi为能量归一化形式。
2 改进WOA-SVM的模式识别方法
2.1 改进鲸鱼优化算法
WOA 有3 种迭代机制,分别为收缩包围、螺旋收缩和随机探索机制。虽然随机探索会增加种群多样性,增强全局搜索能力,但执行概率小,迭代过程中依然会损失种群多样性。执行收缩包围和螺旋收缩时,所有个体会根据当前最优代理进行迭代,向最优个体移动,易陷入局部极值。
为增加种群多样性,提高全局搜索能力,将随机变异策略引入WOA 螺旋收缩中,在螺旋收缩的同时产生变异个体,使收缩包围和螺旋收缩的局部搜索能力和全局搜索能力更加平衡,如式(12)所示。
式中:t为迭代次数,(t)是当前最优解位置向量,(t)是当前解位置向量是鲸群与猎物之间距离,b为螺线常数,l为(-1,1)之间随机数为随机选取鲸鱼位置向量,r为[0,1]之间随机数。
采用种群分布的标准差来衡量种群多样性,如图4 所示。迭代初期,WOA 与改进WOA 的种群分布都很丰富,随着迭代次数增加,种群向最优解移动,使得WOA 与改进WOA 种群多样性都下降,但改进WOA的种群多样性显著优于WOA。
图4 WOA与改进WOA种群多样化对比图
2.2 改进WOA-SVM诊断模型
SVM中有两个重要参数,惩罚参数C和核函数参数g,C决定支持向量到超平面的距离,C越大代表距离越小,对样本分类错误容忍度越低,准确度越高,但易造成过拟合,使泛化能力降低。反之,泛化能力强,但易造成欠拟合。核函数参数g越大,低维样本向高维空间映射维度越高,分类效果好,但会使模型复杂,易造成过拟合,反之,易造成欠拟合。
为优化SVM参数,采用改进WOA对参数寻优,改进WOA-SVM的诊断流程如图5所示。首先初始化鲸群位置向量[c,g],根据每个鲸鱼位置向量采用SVM分别对训练集进行训练,根据K-折交叉验证法得到验证集平均准确率,以平均准确率作为适应度函数,记录最优个体位置。通过判断WOA 收敛因子选择迭代公式,对SVM 参数进行迭代更新,直到满足终止条件,输出最优SVM 参数。最后,利用最优参数采用SVM对测试集进行分类。
图5 基于改进WOA-SVM的诊断流程图
3 仿真研究
为验证本文提出的基于WOA-VMD 能量熵特征提取和改进WOA-SVM 故障识别方法的有效性,采用美国凯斯西储大学轴承数据(CWRU)进行仿真实验,此数据对全球学者开放,数据特征明显,常用于轴承数据研究[19–20]。实验平台由电动机、扭矩传感器、功率测试计、电子控制器组成,故障设置采用电火花单点损伤,使用加速度传感器采集振动加速度信号,采样频率分为12 kHz和48 kHz。
3.1 基于WOA-VMD能量熵特征提取
选用转速为1 750 r/min、采样频率为12 kHz 的驱动端轴承数据,其中包括正常数据、内圈、外圈、滚动体故障4 种数据,对每种数据采取100 个样本,每个样本长度为1 024。为验证VMD中模态个数K和惩罚参数α对SVM分类结果的影响,以驱动端滚动体损伤直径为0.355 6 mm和0.533 4 mm时的两种数据为例,模态个数K∈[2,10],K取整数,惩罚参数α∈[200,4 000],仿真结果如图6所示。
图6 VMD参数选择结果
由图6 可知,根据不同组合[K,α]所提取数据集对SVM分类结果影响不同,在此基础上,采用WOA对VMD 参数进行寻优。设置鲸鱼个体为30,最大迭代次数tmax=200,K取值范围为[2,10],且为整数,惩罚参数α取值范围为[200,4 000],为提高精确度,寻优10组最优参数求其平均值,采用WOA-VMD对4种数据寻优,最优参数如表1所示。
表1 最优VMD参数
以滚动体故障数据为例,VMD中模态个数K为7,惩罚参数α为1 469.4,噪声容限τ和判断精度ϵ对分解影响较小,采取默认值τ=0和ϵ=1.0×10-7,图7为滚动体故障信号经VMD分解后的模态分量时域图,图8为模态分量频谱图。
图7 滚动体故障信号VMD时域图
由图8 可知各IMF 中心频率相互独立,能够有效避免模态混叠问题,且VMD与递归式模态分解不同,即没有采用极值包络线递归方式求取IMF,边界效应问题远弱于递归式模态分解,采用该方法能够得到较单纯模态分量。
图8 滚动体故障信号VMD频谱图
当发生故障时,不同的模态分量会含有不同的冲击成分。为查看每个模态分量含有故障信息情况,计算每个IMF分量的峭度值,正常信号的峭度值等于3 左右,由图9 可知IMF3~IMF7含较丰富的故障信息,即含有较多的冲击成分,经过峭度值筛选,分别计算其模态分量的能量熵并组成特征向量,用作故障诊断的输入数据。
图9 IMF峭度值
采用WOA-VMD 提取轴承数据特征,如表2 所示,正常数据、内圈、外圈、滚动体等故障数据的特征向量为[H1,H2,H3,H4,H5],对应标签分别为1、2、3、4,各100个样本,共400个样本。
表2 4种数据特征向量
为验证WOA 对VMD 参数寻优的有效性,分别采用中心频率观察法-VMD、PSO-VMD、WOAVMD进行对比。采用中心频率观察法-VMD方法,以外圈故障信号为例,可得不同K值对应的外圈故障信号中心频率见表3。中心频率观察法用于优化VMD 参数K,当出现较接近中心频率,则认为出现过分解[21]。由表3 可知,当模态个数K=5 时,出现较接近中心频率,即3 361.0 Hz 和3 552.9 Hz,出现过分解,因此K=4。但此方法只能优化模态个数K,惩罚参数α等于标准VMD 中默认值α=2 000[22]。所以采用中心频率观察法所确定4种数据最优参数组合如表4所示。
表3 外圈信号中心频率
采用PSO 对VMD 参数寻优中,设置粒子群个体为30,迭代次数为200,模态个数K取值范围为[2,10],且为整数,惩罚参数取值范围为[200,4 000],基于PSO-VMD 对4 种数据寻优,最优参数如表4所示。
表4 VMD参数优化结果
将观察法-VMD、PSO-VMD、WOA-VMD 3 种方法提取的特征向量分别输入同一个诊断模型中,且该诊断模型中采取同样参数进行诊断,诊断模型采用改进WOA-SVM 时,鲸鱼种群为30 个,最大迭代次数tmax=200 次,数据共400 组,每种故障100 组,70组用于SVM训练,30组用于SVM测试,K折交叉验证中取K=5,仿真结果如图10至图12所示。图10为基于中心频率观察法优化VMD诊断适应度曲线,图11 为基于PSO 优化VMD 诊断适应度曲线,图12为基于WOA 优化VMD 诊断适应度曲线,3 种方法对比如表5所示。
图10 基于中心频率观察法优化VMD诊断适应度曲线
图11 基于PSO优化VMD诊断适应度曲线
图12 基于WOA优化VMD诊断适应度曲线
平均准确率是指K折交叉验证下,将训练集分为K组,将每个子集分别作为一次验证集,将K个验证集分类准确率的平均数作为平均准确率,准确率是指测试集在已经训练好的模型上的分类准确率。由表5 可以看出基于观察法-VMD、PSO-VMD 提取的数据集经诊断后平均准确率分别为90.714 3%、92.857 1 %,准确率均为89.166 7 %,而基于WOAVMD 提取的数据集经诊断后平均准确率为95.714 3%,准确率达99.166 7%,相比其他两种方法,准确率提高10%。由此通过实验验证基于WOA-VMD特征提取能够更有效提取特征向量,从而提高诊断准确率。
表5 基于WOA-VMD特征提取
3.2 基于改进WOA-SVM故障识别
为验证基于改进WOA-SVM 的诊断模型具有更好的故障诊断能力,采用WOA-VMD 提取4 种轴承数据的特征向量,作为输入数据分别输入到WOA-SVM、PSO-SVM、改进WOA-SVM 模型中进行故障识别,且3种模型中的种群参数均为30,最大迭代次数为200 次,SVM 惩罚参数C寻优范围为[0.01,100],核函数参数g寻优范围为[0.01,100],训练数据为280 组,测试数据为120 组,K折交叉验证中取K=5,最后将3种模型分类结果进行对比分析如表6 所示。WOA-SVM、PSO-SVM、改进WOASVM3种分类模型测试集预测结果对比图分别如图13至图15所示。
图13 WOA-SVM预测结果对比图
图14 PSO-SVM预测结果对比图
图15 改进WOA-SVM预测结果对比图
由表6 可看出3 种分类模型平均准确率都可达到95.71%,且寻优时间接近,但改进WOA-SVM 模型对于测试集分类准确率达99.166 7%,相比WOASVM模型准确率提高2.5%,相比PSO-SVM模型准确率提高0.8%。经对比实验验证,改进WOA-SVM分类模型的泛化能力更好,识别准确率更高,该方法在故障诊断中具有有效性。
表6 基于改进WOA-SVM模式识别
4 结语
(1)本文提出了基于WOA-VMD能量熵的特征提取方法,并利用改进WOA-SVM 进行故障识别。通过WOA 对VMD 中模态个数K和惩罚参数α寻优,以IMF包络熵为适应度函数,根据峭度准则筛选分解后的IMF,进一步提取能量熵作为特征向量。通过对比实验可知,对于相同诊断模型,根据观察法-VMD、PSO-VMD、WOA-VMD提取的数据集,准确率分别为89.166 7%、89.166 7%、99.166 7%,证明WOA-VMD能够更有效提取特征向量,从而提高诊断准确率。
(2)基于改进WOA-SVM 的故障识别方法,针对WOA 种群迭代机制易陷入局部极值问题,通过在WOA 螺旋收缩部分中引入随机变异策略,增强鲸群多样性,提高全局搜索能力。通过对比可知,WOA-SVM、PSO-SVM、改进WOA-SVM 3 种分类模型,准确率分别为96.666 7 %、98.333 3 %、99.166 7%,证明该故障识别方法具有更好的泛化能力和识别准确率。