基于IVMD与改进KELM的发动机故障诊断*
2019-08-28张英堂李志宁范红波
刘 敏, 张英堂, 李志宁, 范红波
(陆军工程大学石家庄校区七系 石家庄,050003)
引 言
发动机气缸盖振动信号中含有大量故障信息。由于缸盖振动信号具有非线性、非平稳、频带混叠和强背景噪声的复杂特性,导致故障信息被覆盖,单一的时频分析方法不能有效分离并提取故障特征[1]。近年来,基于小波包、经验模态分解、局部均值分解等时频分析方法与核独立成分分析(kernel independent component analysis,简称KICA)算法相结合的方法较好地实现了振动信号的信噪分离与特征提取[2-5]。由于上述基于递归的信号分解方法均存在端点效应较大、模态混叠和抗噪性差的问题,限制了特征提取效果的进一步提高。Konstantin等[6]提出了VMD方法,通过非递归求解变分模态的方式在频域内对信号各分量进行剖分,提高了信号分解能力和抗噪性。然而,对信号进行截断和Hilbert变换,VMD仍存在端点效应问题,影响了信号处理效果。
目前,消除端点效应的方法是对信号进行端点延拓,主要方法包括极值延拓、波形匹配延拓和数据预测延拓[7]。其中,波形匹配延拓能够同时兼顾信号内部特征和其端点局部变化趋势,且算法相对简单,应用效果较好。对于含有大量噪声的缸盖振动信号,基于互相关、互信息及波形相似系数等时域波形特征的匹配方法易受噪声干扰,难以有效反映信号内在的时频特征,信号延拓效果较差。同时,由于缸盖振动信号具有能量小、频带宽及易受噪声干扰的特点,单独使用VMD无法有效提取淹没在噪声中的有效故障特征[8]。
针对上述问题,提出了基于频谱循环相干系数进行波形匹配延拓和利用VMD,KICA提取独立的有效故障频带的独立变分模态分解方法。首先根据谱循环相干系数自适应筛选与信号边界波形频谱特征一致性最高的信号波段的两侧波形对信号进行边界延拓,然后对延拓后信号进行VMD获得各频带分量,并选择有效分量构成组合信道进行KICA,进一步消除噪声干扰和模态混叠,获得独立的有效故障特征频带,进而提取相应特征参数,建立联合故障特征向量,用于发动机故障诊断。
对于故障特征分类,神经网络、支持向量机及核极限学习机(kernel extreme learning machine,简称KELM)等智能分类方法得到了广泛应用[9]。相比之下,KELM在泛化性、计算速度和精度上具有更强的综合优势,但其分类能力受核参数和惩罚系数的影响较大。目前,采用列举寻优、遗传算法和粒子群算法等进行参数优化,但上述方法普遍存在计算时间长和容易陷入局部最优等问题[10]。因此,提出了基于社会情感优化算法的改进核极限学习机分类模型(KELM based on social emotional optimization algorithm,简称SEOA-KELM),利用寻优速度快且精度高的SEOA进一步提高模型训练速度和分类精度,进而提高发动机故障诊断准确率。
1 独立变分模态分解方法
1.1 基于频谱循环相干系数改进VMD端点效应
频谱循环相干系数用于表征两循环相干信号在全频域内的频谱相关性的强弱,可有效判定两信号是否来自同一振源[11]。对于信号s(t)与k(t),其频谱分别表示为S(f)与K(f),则两者的频谱循环相干系数定义为γs,k
(1)
其中:γs,k∈[0,1]。
γs,k的值越大,说明S(f)与K(f)在全频带内的线性相关性越强。
发动机缸盖振动信号的时域波形因噪声干扰而具有一定的随机性,但在时频域内具有循环平稳特性[8]。与基于时域波形相似性的匹配指标相比,频谱循环相干系数不受时域噪声干扰,且可有效揭示缸盖振动信号内隐藏的周期性时频结构特征。因此,笔者提出了基于频谱循环相干系数的缸盖振动信号端点延拓方法,以提高信号延拓精度,抑制VMD的端点效应误差。该方法具体步骤如下。
1) 给定长度为N的离散信号s(t),假设其有m个极大值点{p1,p2,…,pm}和n个极小值点{q1,q2,…,qn},分别对应时间序列Tp={tp1,tp2,…,tpm}和Tq={tq1,tq2,…,tqn}。
2) 若tp1 3) 对X1与Xj进行FFT获得其频谱,并根据式(1)计算两者的频谱循环相干系数,取系数值最大的子波Xjbest作为X1的最佳匹配波段,进而选取Xjbest前同等长度的波段延拓到s(t)左侧。 4) 若tp1>tq1,则将步骤2中的极大值替换为极小值进行处理,完成信号左边界延拓。 5) 利用同样的方法延拓信号的右边界。 6) 利用VMD分解延拓后信号,并截取各分量中与原信号位置对应、长度相同的波段即可得到最终分解结果。 IVMD首先利用VMD将延拓后信分解为若干近似独立的固有模态函数(intrinsic mode function, 简称IMF),然后利用KICA良好的非线性单分量提取能力,进一步消除各主IMF分量中的噪声干扰和频带混叠,从而提取相互独立的有效故障特征频带。IVMD的处理过程如下。 设采样信号x(t),t=t1,t2,…,tm由K各不同尺度的IMF分量uk(t),k=1,2,…,K组成。 1) 初始化与希尔伯特变换。初始化uk(t)并对其进行Hilbert变换,获得其解析信号Uk(t) (2) 其中:δ(t)为Dirichlet函数;“*”表示卷积运算。 2) 频谱基准化。将Uk(t)与预估中心频率e-jωkt混合,使uk(t)的频谱调制到相应基频带 (3) 3) 带宽估计。计算式(3)的信号梯度L2范数,估计uk(t)的带宽。 4) 建立约束变分模型。引入约束条件,建立最优变分模型为 (4) 其中:ωk为uk(t)的中心频率。 5) 求解变分模型。引入二次惩罚因子β和拉格朗日乘子γ(t),构造扩展拉格朗日函数为 (5) 6) 利用乘子交替方向法迭代更新{uk},{ωk}和γ(t),求得式(5)的鞍点,即式(4)的最优解。所有IMF分量均可由式(6)得到 (6) 7) 选取n个有效IMF分量构造输入观测信号Y={y1,y2,…,yn},并进行中心化和白化处理;同时,给定核函数k(·,·)。 8) 利用核函数k(·,·)计算源信号估计矢量S={s1,s2,…,sn}的Gram矩阵G1,G2,…,Gm,其中,si=Wyi,W为ICA中的解混矩阵。 9) 记λ(G1,G2,…,Gm)为下式的最大特征值 (7) 重复步骤8~10,直到算法收敛使C(W)取得最小值,即可得到最优解混矩阵W。根据S=WY求得一组独立源信号,即为最终消除噪声干扰和模态混叠后的独立故障频带分量。 社会情感优化算法(social emotional optimization algorithm,简称SEOA)是一种新的模拟人类决策行为的群体优化算法,比遗传算法及粒子群算法等具有更高的收敛速度与精度[10]。笔者使用SEOA改进KELM的建模过程,优化模型参数,建立SEOA-KELM分类模型,其建模过程如下。 f(xp)=[K(xp,x1) …K(xp,xN)]α (8) 笔者选择高斯核函数K(xi,xj)=exp(-(xi-xj2/σ))构建KELM网络,其中,σ为核参数。 2) 定义个体行为ν=[C,σ],其社会评价值f(ν)为KELM的分类准确率。给定个体数量L,情绪阈值h1与h2,学习因子为c1,c2,c3,最大迭代次数为N。 4) 更新第t+1次迭代时的个体行为 若t=0,则 (9) 若t≠0,则 νi(t+1)= (10) 其中:r1,r2,r3为服从均匀分布的随机数。 6) 判断是否满足终止条件。若满足,则输出νgbest(t)与fgbest为最优值;否则进入下一步。 7) 更新个体情绪指数Ei(t),并返回过程2。 (11) 其中:a为对数基底;k为情感强度因子。 为验证IVMD方法的有效性,构造含有噪声的多分量混合仿真信号x(t),即 (12) 其中:x1(t)为正弦信号;x2(t)为调频信号;x3(t)为调幅-调频信号;sn(t)为幅值是0.5的高斯白噪声。 设置信号采样频率为1 kHz,采样时间为1 s。仿真信号的时域波形如图1所示。 图1 仿真信号波形Fig.1 Waveform of the simulated signal 根据式(12),分别在x(t)的左右两端各产生50个新的真实数据,得到信号左右两边界延拓的真实波形如图2(a)所示。确定左右两端延拓长度均为50点,分别利用互相关法[8]和笔者所提方法对x(t)进行端点延拓,得到信号左右两边界的延拓波形分别如图2(b),(c)所示。其中,左右两端的延拓波形分别用蓝色与红色实线表示。 图2 x(t)左右两边界的延拓波形Fig.2 The extended waveforms at two ends of x(t) 图3 不同信号的幅频谱Fig.3 The spectrums of different signals 对比图2中各波形可知,利用笔者所提方法得到的延拓波形与真实波形基本一致,说明本方法可准确跟踪仿真信号的时域变化规律。由于受到噪声干扰,利用互相关法得到延拓波形与真实波形相差较大,左右两端均出现明显变形,且与原信号连续性较差。 图3(a),(b),(c)分别为图2(a),(b),(c)所示信号的幅频谱。图3(b)中30 Hz调频分量的频谱出现了明显变形,这是由于互相关法在时域内根据波形相似性选取延拓数据,无法准确反映原始信号的频谱特征,导致延拓后信号频谱失真。图3(c)与图3(a)基本一致,说明笔者提出的信号端点延拓方法可有效保留原信号的频谱特征。 对原始信号x(t)及图2(b),(c)所示的延拓后信号进行VMD分解,得到各分量与真实信号的对比,如图4所示。其中,VMD分解参数设置为K=4,α=2 000。图4中黑色实线代表VMD分解得到的各模态分量IMF1~IMF4,分别对应真实的仿真信号分量x1(t)~x3(t)及噪声信号sn(t);x1(t)~x3(t)用红色虚线表示。 图4 不同信号的VMD分解结果Fig.4 The VMD decomposition results of different signals 图4(a)为原始信号x(t)的VMD分解结果。可见,IMF1~IMF3的左右两端处均存在明显变形,且IMF3中间出现失真。图4(b)为图2(b)延拓信号的VMD分解结果。可见,利用互信息法对信号进行端点延拓后,改善了VMD的分解效果,IMF1与IMF2左端无变形。但由于信号延拓效果较差,IMF1与IMF2的右端,及IMF3两端仍存在变形。图4(c)为图2(c)延拓信号的VMD分解结果。可见,IMF1~IMF3与真实信号x1(t)~x3(t)基本重合,不存在端点效应。 综上所述,笔者提出的基于频谱循环相干系数的信号端点延拓方法,在频域内根据信号频谱特征一致性选取延拓数据,可有效避免时域噪声干扰,并保留原信号的时频特征,从而提高抑制VMD的端点效应,提高信号的延拓精度和分解精度。 为了验证所提方法在发动机故障诊断中的有效性,在F3L912型发动机台架上进行故障模拟实验。实验中在第1缸上模拟如表1所示的6种工况。建立如图5所示的信号采集系统,发动机转速保持1 200 r/min,采集第1缸缸盖振动信号,采样频率设置为40 kHz。 表1 发动机实验工况Tab.1 Engine working condition setting 图5 缸盖振动信号测试系统Fig.5 Cylinder head vibration signal test system 以故障工况3为例,截取发动机两个工作周期内的缸盖振动信号,其时频分布如图6所示。由图可知,缸盖振动信号内含有大量的宽频带噪声,导致时域波形具有一定随机性,且有效的故障特征频带被淹没。但是,缸盖振动信号在时频域内具有良好的周期性循环平稳特征。 图6 缸盖振动信号时频分布图Fig.6 Time-frequency distribution of cylinder head vibration signal 对图6中的缸盖振动信号进行端点延拓,左右两端延拓长度均为800,得到延拓后的波形如图7所示,左右两端新产生的延拓波形分别用蓝色与红色实线表示。 图7 缸盖振动信号左右两边界的延拓波形Fig.7 Extended waveform at two ends of cylinder head vibration signal 由图7可知,利用互相关法延拓得到的信号波形与真实波形相差较大,左右两端均出现了明显变形。利用笔者所提方法延拓得到的信号波形与真实波形基本一致,说明该方法从时频域选取延拓波形受时域噪声影响较小,延拓精度更高。 为评价缸盖振动信号经VMD分解后的端点效应大小,笔者根据分解前后信号能量的变化提出相应评价指标δ为 (13) 其中:E为任意信号s(i)的能量;n为信号长度;Ex为原始信号x(t)的能量;Ej为x(t)分解后第j个分量的能量;K为x(t)分解后的分量个数。 可见,δ≥0,且δ越小,原始信号与各分量之间的误差越小,即端点效应越小。 分别对图6中的原始缸盖振动信号及图7(b),(c)中的延拓信号进行VMD分解。根据中心频率接近原则[7]设置VMD分解层数K=8,惩罚因子α=2 000。根据式(13)计算不同延拓方法下信号分解结果的δ值如表2所示。 表2 信号分解后的δ值Tab.2 Values of δ after decomposition 由表2可知,利用所提的基于频谱循环相干系数的延拓方法得到的信号经VMD分解后的δ值最小,说明其端点效应最小。限于篇幅,仅给出基于笔者所提方法延拓后的缸盖振动信号的分解结果,各IMF分量的时频分布如图8所示。 图8 各IMF分量的时频分布Fig.8 The time-frequency distribution of the IMFs 由图8可以看出,分解后的缸盖振动信号包含多个不同频带,1 kHz以下为机体随机振动的低频噪声,10 kHz以上为高频噪声,1 kHz~10 kHz为有效频带分量[8]。剔除干扰噪声后的各有效分量的时频分布如图9所示。 图9 有效分量的时频分布Fig.9 Time-frequency distribution of effective IMFs 对比图6与图9可知,降噪处理消除了原信号内的宽频带噪声,并保留了有效的故障特征频带。3个有效分量的频谱分布于2 kHz,6 kHz与8 kHz附近,分别对应气缸燃爆冲击、进排气门开关冲击和针阀落座冲击产生的振动分量。由图11可以看出,各有效频带分量内仍含有部分噪声,且各分量间存在模态混叠。 为进一步消除干扰噪声及模态混叠,将3个有效分量作为输入观测信号,进行KICA处理,得到3个独立分量,其时频分布如图10所示。 图10 独立分量的时频分布Fig.10 Time-frequency distribution of independent IMFs 对比图9,10可知,经过KICA处理得到各独立分量,进一步消除了各有效分量中的干扰噪声及各分量间的模态混叠,分离出了噪声干扰小且相互独立的有效的故障特征频带。 为综合利用信号中的各类故障信息,笔者分别提取基于AR模型的时序特征、基于多尺度模糊熵的自相似性特征和基于标准化能量矩的频带能量特征构造联合故障特征向量。 对于独立分量xi(t),其AR模型可表示为 (14) 其中:k为自回归阶数;φk为自回归模型系数;αi为高斯白噪声。 xi(t)的多尺度模糊熵(multiscale fuzzy entropy,简称MFE)为 FEN(m,n,r,N/τ)=lnφm(n,r)-lnφm+1(n,r) (15) (16) 其中:N为信号长度;m为信号重构维数;τ为时间尺度;D为向量相似度函数;n和r分别为模糊隶属度函数边界的梯度和宽度。 xi(t)的标准化能量矩(standardized energy moment, 简称SEM)定义为 (17) SEMi=Ei/En (18) 其中:Ei为xi(t)的能量矩;EN为各时间序列的能量矩之和。 经过分析,笔者选择前3阶自回归参数作为时域特征参数,将τ∈[6,10]的MFE作为信号的相似性特征参数,根据式(18)计算3个独立分量的标准化能量矩SEM作为频带能量特征参数,从而构成联合故障特征向量。以工况2和工况3为例,对联合故障特征向量进行说明,如表3所示。 表3 发动机故障特征参数 Tab.3 Engine fault characteristic parameters 工况独立分量特征参数Φi1Φi2Φi3MFEi6MFEi7MFEi8MFEi9MFEi10SEMi23x1-0.675 20.604 50.331 62.1051.7471.4151.3761.2540.280 1x23.581 23.496 8-4.001 72.0011.8011.6271.5311.3590.271 5x3-5.261 17.579 8-4.512 71.0711.0510.8850.8660.7150.301 4x11.215 4-0.783 10.301 51.4761.3491.2921.2311.1950.412 5x2-1.975 43.911 5-2.815 11.3811.3651.3061.2541.2090.467 2x3-2.963 51.515 8-3.714 31.5141.4661.3911.3451.3240.278 6 表3中,x1,x2,x3为独立分量;φi1,φi2,φi3,MFEi6,MFEi7,MFEi8,MFEi9,MFEi10和SEMi依次为第i(i=1,2,3)个独立分量的前3阶自回归模型参数,5个尺度下的模糊熵和1个标准化能量矩。为对比说明上述特征参数的有效性,对直接利VMD分解后的信号分量提取相同的特征参数作对比试验。选择6种工况下的φ32,MFE38和SEM3组成特征向量并表示其空间分布如图11所示。 图11 不同特征向量的空间分布图Fig.11 The distribution diagrams of different feature vectors 分析图11可知,对信号直接进行VMD处理后提取的特征参数只能区分部分故障。经IVMD处理后提取的特征参数具有更好的类内聚集性和类间离散性,可有效区分各类故障工况,有利于提高发动机故障诊断准确率。 在发动机6种工况下,分别从缸盖振动信号中提取120组特征向量,随机选取70个作为训练样本,其余50个作为测试样本。将VMD与IVMD设置为特征提取对比实验,将SEOA-KELM与PSO-KELM设置为故障分类对比试验。SEOA与PSO中群体寻优范围为C∈[0.1,1 000],核参数σ∈[0.01,100]。群体规模为15,迭代次数为30,终止条件为KELM分类准确率不小于99%。图12为不同特征提取方案下,两种分类器的分类准确率随迭代次数的收敛过程曲线。 图12 分类准确率收敛曲线Fig.12 Convergence curves of classification accuracy rate 由图12可以看出,对于相同特征集合,SEOA-KELM的收敛速度和分类准确率均高于PSO-KELM,说明SEOA-KELM具有更高性能。对于相同分类方法,IVMD故障特征的收敛速度和分类准确率均高于VMD,说明笔者提出的IVMD特征提取方法得到的故障特征分类效果更好。 为进一步说明所提方法的有效性和稳定性,对各故障诊断方法进行30次独立重复实验,统计得到其训练时间和分类准确率的平均值,如表4所示。可见,提出的基于IVMD和SEOA-KELM的发动机故障诊断方法具有更高的计算速度和精度,平均故障训练时间为19.68 s,平均分类准确率达到99.85%。 表4 发动机故障诊断结果对比Tab.4 Comparison of engine fault diagnosis results 笔者提出的基于IVMD的特征提取方法可有效抑制VMD分解的端点效应,提高信号分解精度,消除缸盖振动信号中的宽频带噪声,并分离出相互独立的有效故障特征频带。提取各频带的AR模型参数、多尺度模糊熵和标准化能量矩构造的联合故障特征向量,具有良好的类内聚集性和类间离散性,分类性能较好。SEOA-KELM最优化分类器具有较高的训练速度和分类精度,可有效实现不同故障特征的分类识别。综上所述,采用IVMD与SEOA-KELM的发动机故障诊断方法可有效提高发动机故障诊断速度和精度,准确率达到99.85%。1.2 变分模态分解与核独立成分分析
2 基于社会情感优化算法的改进核极限学习机
3 仿真信号分析
4 发动机故障诊断实验
4.1 缸盖振动信号端点延拓
4.2 缸盖振动信号多尺度分解
4.3 故障特征提取
4.4 发动机故障分类
5 结束语