基于参数优化VMD和改进DBN的滚动轴承故障诊断方法研究*
2021-09-27盛肖炜于林鑫毕鹏飞康兴汝朱美臣
盛肖炜,于林鑫,毕鹏飞,康兴汝,朱美臣
(1.无锡开放大学 机电工程系,江苏 无锡 214000;2.东北大学 信息科学与工程学院,辽宁 沈阳 100180;3.哈尔滨工程大学 自动化学院,黑龙江 哈尔滨 150001;4.内蒙古北方重工业集团有限公司,内蒙古 包头 014000;5.浙江联宜电机有限公司,浙江 义乌 322100)
0 引 言
在工厂机械设备中,滚动轴承得到了广泛的应用。利用滚动轴承的振动信号对早期滚动轴承故障进行诊断,对于复杂化、大型化的专业机械设备可靠性监控以及预防大型安全事故具有现实意义。然而,带故障的滚动轴承的振动信号往往具有非线性和非平稳性的特性,其中,还包含着复杂的噪声信号。因此,提取滚动轴承的故障特征往往十分困难。
相比于小波分解法,经验模态分解法EMD[1,2](empirical mode decomposition)将振动信号按时间尺度递归分解为若干本征模态分量IMF(intrinsic mode function),它不需要事先设定基函数。但是经验模态分解法存在模态混叠、端点效应等问题。而相比于EMD,改进的集合经验模式分解法EEMD[3,4](ensemble empirical mode decomposition),能抑制模态混叠,但是其计算量很大。
2014年,DRAGOMIRETSKIY K提出了变分模态分解法VMD[5,6],即通过引入变分模型,在设定的频域带宽中不断地迭代,分解成设定好个数的IMF分量来重构信号,使每个IMF估计带宽之和最小,以此来获得信号的最优解。该算法能消除模态混叠,对噪声也具有较好的鲁棒性。文献[7]采用粒子群算法寻优VMD算法的惩罚参数α和分量个数K的最佳参数组合,参数优化后的VMD算法诊断效率更高。
2006年,HITON G E[8]提出了深度置信网络DBN,并发表于《Science》杂志。文献[9]利用奇异值分解和深度信度网络相结合的方法,来识别滚动轴承的故障信号。文献[10]利用改进VMD算法和DBN,来对风机故障部件进行故障预警,以排列熵和均方根值构成高维向量输入DBN,能够对故障进行有效识别。
本研究将采用鲸群算法优化参数的VMD算法,对原始振动信号进行降噪处理,麻雀搜索算法改进的DBN网络作为故障的分类器,诊断滚动轴承早期微弱故障;笔者选用美国凯斯西储大学滚动轴承故障诊断数据为例,利用MATLAB软件进行仿真验证。
1 相关基本算法简介
1.1 变分模型理论
步骤1。信号x(t)分解成K个函数uk(t)之和:
(1)
式中:{uk}—分解得到K个IMF分量。
步骤2。每个模态信号uk(t)进行Hilbert变换得到单边频谱,表示如下:
(2)
式中:δ(t)—Dirichlet函数。
步骤3。模态频谱调制到相应基频带ωk为:
(3)
式中:{ωk}—K个IMF分量各自中心频率。
步骤4。频谱梯度的L2范数平方构造受约束的变分模型表达式(4),求取uk(t)的带宽之和最小,表示如下:
(4)
1.2 变分模态分解原理
步骤1。引入惩罚因子α与拉格朗日乘法算子λ,将式(4)变成不受约束的拉格朗日表达式:
(5)
(6)
(7)
(8)
式中:i,k∈{1,K}。
(9)
式中:ε—给定精度。
若不满足,重复步骤4,直到满足条件,变分表达式(5)求解完成。
1.3 鲸群算法
2016年,澳大利亚格里菲斯大学SEYEDALI M[11]提出了模仿座头鲸捕猎行为的群体智能优化算法-鲸群算法(WOA),该算法能避免陷入局部最优,具有良好全局寻优的能力。该算法利用鲸群发现猎物后,螺旋环绕包围猎物,并用气泡网方式捕获猎物,捕获猎物后对猎物进行再搜索[12]。通过对上述3种行为进行数学建模,构成WOA算法寻找最优解。
(1)鲸群发现猎物的数学建模。
自然界中鲸群感知猎物位置,假定目标猎物就是当前最优解或者接近最优解,鲸群搜索个体将不断以收缩环绕方式更新位置,来靠近最优解,这一行为可以表达为:
(10)
(11)
(2)螺旋环绕包围猎物,并用气泡网方式捕获猎物数学建模(开发阶段)。
搜索个体的螺旋更新方式如下:
(12)
搜索个体以收缩环绕方式和螺旋更新方式更新位置,假设两种方式执行概率p各为50%,搜索个体总位置向量表达式如下:
(13)
(3)再捕获猎物数学建模(再搜索阶段)。
位置更新表达式如下:
(14)
整个WOA算法搜索个体,通过随机个体和最优个体更新自身位置;并随着迭代次数t的增加,不断逼近最优解。
1.4 深度置信网络算法
相比于传统浅层学习方法,DBN属于深度学习方法,能够自适应地提取特征参数,实现函数的非线性逼近,避免陷入局部最优,训练时间过长的缺陷,具有很强的泛化能力。
受限波尔兹曼机(restricted Boltzmann machine,RBM)结构如图1所示[13]。
图1 RBM结构
RBM分为隐含层h和可视层v,层与层之间有神经元相连[14],层间无神经元相连。
RBM的能量函数和(v,h)的联合概率密度表示为:
(15)
式中:θ—RBM所需要确定的模型参数,θ={ωij,ai,bj};νi—第i个可视层神经元;hj—第j个隐含层神经元;ωij—第j个隐含层神经元与第i个可视层神经元之间权值;ai—νi偏置值;bj—hj偏置值。
(16)
各个参数进行更新规则如下:
Δai=ε([ai]data-[ai]recon)
Δbj=ε([bj]data-[bj]recon)
Δωij=ε([νihj]data-[νihj]recon)
(17)
式中:ε—数学期望;[·]data—前训练模型所定义的数学期望;[·]recon—重构模型所定义的数学期望。
DBN网络结构如图2所示。
图2 DBN结构
DBN网络是由多层无监督RBM和一层有监督BP神经网络堆栈组成。最底层为输入层,最高层为输出层。
DBN训练分为预训练(pre-training)和微调(fine-tuning)两部分。预训练阶段,从底层到顶层逐步训练,前一个RBM输出作为后一个RBM输入,将输入层映射到输出层,输出值与期望值进行对比,得到每层θ;微调阶段,使用BP算法将输出值与期望值差值从顶层到底层逐步向后向传播,对整个网络的参数进行微调。
1.5 新型智群算法麻雀搜索算法
麻雀搜索算法[15](sparrow search algorithm,SSA)模拟麻雀觅食和反捕食行为,建立数学模型。群居麻雀个体分为发现者和加入者两类,依据适应度的大小来决定个体能量储备高低。
n个麻雀组成种群和适应度表示如下:
(18)
(19)
式中:d—待解决问题变量维数;f—适应度函数。
发现者位置Xi,j更新如下:
(20)
式中:t—迭代次数;itermax—最大迭代次数;j—1,2,3...d;α—0到1的随机数;Q—服从正态分布的随机数;L—1×d矩阵,元素全部为1;R2—预警值,范围[0,1]之间;ST—安全值,范围[0.5,1]。
当R2 加入者位置Xi,j更新如下: (21) 式中:Xp—发现者目前最优位置;Xworst—当前全局最差位置;A—1×d矩阵,元素[0,1]之间随机数,A+=AT(AAT)-1。 当i>n/2时,表明适应度较低的第i个加入者能量不足,飞离麻雀群去他处觅食。 意识到危险的麻雀个体进行反捕食行为,位置更新如下: (22) 式中:Xbest—当前全局最佳位置;β—步长控制参数,服从标准正态随机数;fg—全局最佳适应度值;fw—全局最差适应度值;ε—给定常数;K—麻雀移动方向同时也是步长控制参数。 当fi>fg时,表示此时的麻雀正处于种群的边缘,极其容易受到捕食者的攻击,当fi=fg时种群中间麻雀意识到了危险,需要靠近其他的麻雀,以此来减少它们被捕食的危险。 实现VMD算法需要确定的参数如表1所示。 表1 VMD算法参数 其中,对分解影响比较大的参数为K和α,其他参数影响较小。 下面仿真模拟调制-调频信号[16,17]测试不同的K和α对VMD分解效果的影响。模拟信号表达式如下: x(t)=(1+0.5cos(9πt))cos(200πt+2cos(10πt)) (23) 当采样频率fs=1 000 Hz时,仿真信号频谱如图3所示。 根据图3可知,信号的中心频率为90 Hz、95 Hz、100 Hz、105 Hz、110 Hz。 图3 仿真信号频谱A—幅值;f—中心频率 当α=2 000固定,其他参数取τ=0、DC=0、init=1、ε=1×10-7不变,K取不同值,比较VMD分解信号效果。K分别取3、4、5、6、7、8,仿真信号VMD分解后中心频率如图4所示。 图4的结果表明:(1)模态个数K过小时,如K=3、4时,处于欠分解状态,仿真信号的中心频率分量没有全部分解出来;(2)K过大时,如K=7,8时,处于过分解状态,产生虚假分量,并伴有模态混叠现象;(3)K取值适中,K=5,6时,分解中心频率与原信号一致,分解效果较好。 图4 中心频率随分解个数K的变化f—中心频率;n—迭代次数 当K=6固定,其他参数同图4,α取不同值,比较VMD分解信号效果。 α取0.3fs、0.6fs、fs、2.5fs、4fs、5fs,仿真信号VMD分解后的中心频率如图5所示。 图5 中心频率随惩罚因子α的变化f—中心频率;n—迭代次数 α=0.3fs时,信号存在没有正确分解的分量;α=0.6fs时,信号分解存在模态混叠,并且某些分量迭代次数过大;α=fs,α=2.5fs时,某些分量迭代次数过大;α=4fs,α=5fs时,迭代次数较低时存在模态混叠现象,也存在某些分量迭代次数过大。 所以K固定时,α值的选择对VMD分解效果并没有规律可寻。 由此可见,参数K和α的选择会影响VMD分解效果,但是参数的选择对VMD分解效果影响没有规律可寻。用上述方法人为选择参数,只能得到相对最优解。因此,本文采用智能算法WOA算法,全局寻优[K,α]参数组合,实现自适应优化,达到最佳VMD分解效果。 熵值表征了信号稀疏特性,即稀疏性越强,熵值越小。本文提出包络熵值EP,其定义如下: (24) 式中:a(j)—x(j)的Hilbert包络信号;pj—a(j)归一化后结果。 WOA-VMD算法算法流程图如图6所示。 图6 WOA-VMD算法流程图 WOA-VMD算法具体步骤如下, 步骤1。初始化WOA算法,设置算法各项参数; 步骤2。振动信号经过VMD算法分解若干个IMF分量,每个IMF分量作为鲸群搜索个体,极小包络熵值作为适应度值进行全局寻优最小值; 步骤3。根据随机概率,个体选择执行收缩环绕方式或者螺旋方式更新位置,判断个体是否得到改善,没有改善执行再搜索行为,否则转到步骤5; 步骤4。搜索个体执行再搜索行为; 步骤5。计算个体新的适应度值并更新最优解; 步骤6。判断是否达到最大迭代次数,没有达到转到步骤2,否则算法结束。 DBN诊断过程和传统故障诊断过程的对比如图7所示。 图7 DBN诊断与传统故障诊断分析过程比较 传统故障诊断的智能识别提取特征向量时,常用时域分析、频域分析和时频域分析3种方法,具体选择方法时需要人为选择,存在对诊断结果的人为误差[18]。 选择DBN模型模式识别时,振动信号不需要人为特意选择特征向量,能直接有效地提取故障诊断特征参数;减少了对人为诊断经验的依赖,原始信号只要做简单的降噪处理,即可直接输入DBN模型,自适应地提取故障特征和识别故障状态,充分利用了深度学习自身挖掘故障的能力。 DBN模型之所以能够有效提取表征故障的特征参数,主要还是得益于其能够学习,得到输入与输出之间复杂的非线性函数映射关系[19-21]。 针对振动信号的高维度数据,为了降低算法的时间复杂度,增强分类精度,本文提出SSA算法优化DBN网络的算法。 定义为SSA-DBN算法,其具体步骤如下: 步骤1。初始化SSA算法参数,将待识别数据分为训练集、验证集、测试集3类; 步骤2。SSA算法以验证集的错误率作为适应度函数,优化DBN网络权重值; 步骤3。优化权重值再次训练DBN网络,使验证集的错误率达到最低; 步骤4。优化好DBN网络重新训练,然后输入测试集,得出模式识别结果。 本文研究的整个故障诊断方法流程图如图8所示。 图8 滚动轴承故障诊断流程图 具体步骤如下: 步骤1。针对滚动轴承各个正常状态、各类故障状态的振动信号按照一定的采样频率进行采样,组成数据集; 步骤2。利用WOA算法寻优VMD算法模态分解个数K和惩罚因子α最优参数组合; 步骤3。参数优化过VMD算法对各个滚动轴承各个状态振动信号进行分解,每种状态得到若干模态分量IMF; 步骤4。对IMF分量求频谱组成高维数据集; 步骤5。输入SSA-DBN网络进行故障诊断分类,输出诊断结果。 本研究数据选用美国凯斯西储大学轴承数据中心测试的滚动轴承振动数据,测试装置如图9所示。 图9 滚动轴承故障实验装置图 该装置包括一台1.5 kW驱动电机,电机上的两个加速度传感器各自采样电机风扇端、驱动端的轴承振动加速度信号,16通道数据记录仪记录振动信号,采样频率为12 kHz;装置还包括一个扭矩传感器,负载端有一台测功仪。 本文选取驱动端振动信号,电机转速为1 792 r/min,负载0 hp,深沟球轴承型号为SKF 6205-2RS。装置采用电火花技术对电机轴承的内圈、外圈和滚动体进行点蚀来模拟常见故障。数据分正常信号、内圈故障信号、外圈故障信号、滚动体故障信号,4类数据分别标记为数据集Ⅰ、Ⅱ、Ⅲ、Ⅳ。数据Ⅱ、Ⅲ、Ⅳ选取点蚀直径为7 mils。4类数据集各采样300组样本,每个样本采样点1 024个,每个数据集维数为1 024×300=307 200。 下面对4类数据进行分析。振动信号时域和频域分析如图10所示。 图10(a)为正常信号时域图,幅值在[-0.2,0.2]之间,振幅最小,信号平稳。外圈、内圈、滚动体故障振幅都大于正常信号振幅,伴有明显的间隔冲击信号,这是由于故障改变轴承呎合度,振动信号更加强烈。由于故障特征信息湮没于噪声信号,直接通过时域图区分故障类型和损伤程度比较难[22]。 (a)振动信号时域图 同样,观察图10(b),4种状态频谱图也很难在图中直接找到故障特征频率。所以采用信号降噪加智能模式识别的方法进行故障诊断。 以数据集Ⅱ为例,对比遗传算法GA、粒子群算法PSO、WOA算法优化VMD算法。3种优化算法各自迭代次数取50次,测试50次取平均值,K取值范围[3,8],α取值范围[500,2 000]。 如2.1节所述,适应度越小,收敛精度越高,3种优化算法收敛性对比如图11所示。 图11 适应度值优化曲线 由图11可知:WOA-VMD、PSO-VMD、GA-VMD分别运行到第11代、第16代、第28代收敛;WOA-VMD收敛速度最快,同时,WOA-VMD收敛适应度值最小值,收敛精度最高。 不同优化算法下运行VMD所消耗时间如表2所示。 表2 不同优化算法下运行VMD所消耗时间 由表2可知:GA-VMD所消耗的时间最长,WOA-VMD相比于PS0-VMD时间增加不多,两者消耗时间相近。 篇幅所限,针对数据集Ⅰ、Ⅲ、Ⅳ,3种优化VMD算法有相似的实验结果,此处不再重复,故笔者采用WOA算法优化VMD算法全局寻优[K,α]组合。 4类数据集优化结果如表3所示。 表3 最佳参数组合[K,α] 数据集Ⅱ的VMD信号分解图如图12所示。 图12 内圈故障VMD分解 VMD算法初始化参数:τ取0,DC取0,init取1,ε取10-7。由图12知,IMF1-IMF4的中心频率没有出现混叠现象,可以分解出原信号包含的主要频率信号能够实现有效分解;其他3类数据也有类似的结果。 信号VMD分解求频谱简单降噪后,直接输入SSA-DBN网络中进行故障诊断。其中,70%作为训练集,20%作为验证集,10%作为测试集;SSA-DBN算法对4类振动信号进行故障识别。SSA算法参数初始化:n取5,itermax取10,p取0.2。 笔者将未优化网络权重DBN与SSA-DBN进行对比研究,DBN算法诊断结果如图13所示。 图13 DBN算法诊断结果 SSA-DBN算法诊断结果如图14所示。 图14 SSA-DBN算法诊断结果类别1,2,3,4—正常状态、内圈故障、外圈故障、滚动体故障 图13中,未优化网络权重DBN故障诊断结果出现了故障误识别,图14故障结果正确率达到100%,高于图13识别正确率97.5%。该结果验证了SSA优化过的DBN网络的故障诊断率相比未优化的DBN网络故障识别率更高。 为了进一步说明WOA-VMD-SSA-DBN算法的有效性,笔者加大数据量,采样1 000组样本;同时,增加EMD算法特征提取加SVM算法模式识别,和VMD算法特征提取(直接取K=6、α=2 000)加SVM算法模式识别,用两种算法测试。 增加的两种算法人为选用样本熵作为故障特征向量,其结果如表4、表5所示。 表4 基于EMD+SVM的滚动轴承故障识别结果 表5 基于VMD+SVM的滚动轴承故障识别结果 比较表(4,5)可知:VMD+SVM算法平均故障诊断率97.4%,相比于EMD+SVM算法平均故障诊断率96.8%有所提高;VMD算法相比于EMD算法诊断效果更佳。 基于VMD+DBN的滚动轴承故障识别结果如表6所示。 表6 基于VMD+DBN的滚动轴承故障识别结果 比较表(5,6)可知:VMD+DBN算法平均故障诊断率98.7%,相比VMD+SVM模式识别方法97.5%更高;DBN网络不需要人为选定故障特征,故障诊断相比SVM算法更佳。 WOA-VMD-SSA-DBN的滚动轴承故障识别结果如表7所示。 表7 WOA-VMD-SSA-DBN的滚动轴承故障识别结果 由表7可知:使用WOA-VMD-SSA-DBN识别平均正确率达到100%,优于表(4~6)算法的平均故障正确率;该结果表明,优化过参数的VMD算法和优化过DBN模型参数的故障诊断算法能进一步提高滚动轴承的故障诊断率。 本研究采用参数优化的VMD算法,分解滚动轴承微弱故障信号,输入网络参数优化的DBN网络进行了滚动轴承的故障诊断;并选取美国凯斯西储大学的滚动轴承振动数据,运用MATLAB软件对本文提出的方法进行了验证。 研究结果表明: (1)VMD分解选取合适的参数α和K能克服模态混叠现象。相同模式识别方法,VMD分解故障识别率97.4%相比于EMD分解故障识别率96.5%更高;WOA算法搜寻最优VMD算法α和K参数组合,相比于PSO算法和GA算法寻优,收敛速度更快,运行时间更短; (2)DBN网络进行模式识别故障诊断率98.7%,相比于VMD+SVM算法故障诊断率97.4%更高;SSA算法优化的DBN网络参数故障诊断率达到100%,诊断率得到近一步提高。 在接下来的研究中,研究方向主要是:(1)WOA算法参数的设置对于迭代的收敛效果,以及对优化VMD算法α和K参数结果的影响;(2)SSA算法参数设置对DBN算法的网络权重的影响以及识别正确率的差异。2 滚动轴承故障诊断方法
2.1 VMD算法参数选择
2.2 鲸群算法优化VMD算法参数
2.3 基于麻雀搜索算法优化深度置信网络的分类法
2.4 基于参数优化VMD和改进DBN的诊断流程
3 故障诊断方法验证
3.1 数据来源分析
3.2 VMD算法参数优化
3.3 振动信号处理
3.4 故障识别结果验证
4 结束语