基于VMD-LSTM的滚动轴承退化状态识别
2022-06-09魏永合刘光昕尹际雄
魏永合,刘光昕,尹际雄
(1.沈阳理工大学 机械工程学院,沈阳 110159;2.浙江清华柔性电子技术研究院,浙江 嘉兴 314000)
滚动轴承是各类工程机械中关键的旋转支撑部件,其一旦发生突发性故障,轻则带来经济损失,重则导致人员伤亡,影响巨大[1]。如果能跟踪滚动轴承的故障发展,正确识别其退化状态[2],就可以有针对性地制定机械设备的维护策略和生产计划,提前排查机械设备的故障隐患,保证工业生产的正常进行。通常在实际工况下,外部环境的干扰会将原始退化信息掩盖,不利于特征提取。因此,对原始振动信号进行降噪处理和信号分析,再进行模式识别,已成为滚动轴承故障诊断与状态监测的研究热点之一[3]。
通常退化识别过程主要包括提取退化特征和建立识别模型两大部分。文献[4]利用小波包分解对电路故障信号进行有效特征提取,再通过径向基神经网络对电子装备故障诊断,相比于其他特征提取方法提高了诊断的速度与精度。文献[5]利用经验模态分解将信号分解为多个模态分量并提取排列熵特征,但由于模态混叠问题导致信号未能有效分解,使得提取到的模态分量故障特征不理想。在进行特征提取以后,有效地评估轴承滚动性能退化程度、划分退化状态区间是最终退化状态识别的关键。文献[6]利用集合经验模态分解和双超球体数据描述模型,结合隶属度函数描述滚动轴承性能退化情况,但由于数据描述模型稳定性较差,导致在滚动轴承趋于失效时模型评估准确度有所降低。文献[7]利用健康状态概率估计法对轴承退化状态离散化,为退化状态区间的划分提供新思路,然后采用支持向量机进行退化状态识别,但对于退化边界问题未进行详细研究。
针对滚动轴承退化边界模糊、退化状态难以有效识别的问题,本文采用变分模态分解(Variational Mode Decomposition,VMD)对原始振动信号进行分解,同时采用麻雀搜索算法(Sparrow Search Algorithm,SSA)对VMD的超参数进行优化,以提高信噪比,进而有效地提取退化特征。在模式识别模型上,选取长短时记忆神经网络(Long Short Term Memory,LSTM)模型,与其他分类模型相比,LSTM更适合解决时序序列的分类问题,且学习“趋势”能力强。因此将VMD分解与LSTM模型相结合,应用于滚动轴承的全寿命退化状态识别中,以获得良好的辨识能力,并通过实验数据验证本文方法的准确性和可靠性。
1 变分模态分解
VMD是一种新型自适应信号处理方法,可以有效地对非平稳、非线性信号进行分解。通过对变分问题的求解,将原始信号非递归地分解为若干个有限带宽的本征模态分量(Intrinsic Mode Function,IMF),然后确定各分量的中心频率及带宽[8]。
1.1 构造变分问题
假设原始信号可以被分解为K个IMF,解析各分量得到单边频谱,预估其中心频率ωk后,得到如下约束变分模型为
(1)
式中:uk为各本征模态分量;ωk为各本征模态分量的中心频率;δ(t)为单位脉冲函数;t为时间;j为虚部。
1.2 求解变分问题
将拉格朗日因子λ和惩罚因子α引入式(1)的约束变分模型中,将变分约束问题转变成为非约束变分问题,其增广拉格朗日表达式为
(2)
式中f(t)为原始信号。
利用交替方向乘子法更新求解参数uk、ωk、λ,找到增广拉格朗日表达式的鞍点,求得各模态中心频率,实现自适应求解。
2 长短时记忆神经网络
LSTM网络是循环神经网络(Recurrent Neural Network,RNN)的一种变体。LSTM网络区别于其他网络的特点是其在网络结构中引入记忆单元,从而克服梯度消失并解决RNN无法学习长期依赖的问题[9],有效处理序列数据。LSTM网络细胞结构如图1所示。
图1 LSTM神经网络细胞结构图
在LSTM网络细胞结构图中,ct-1代表前一个细胞状态,ht-1代表前一个细胞的输出,xt代表当前细胞的输入,ct代表当前细胞状态,ht代表当前细胞的输出。LSTM网络细胞结构包括3个sigmoid激活函数以及2个tanh激活函数。网络更新机制如下。
(1)信息流入LSTM网络细胞前,首先经过遗忘门ft,遗忘门由σ1函数单独组成,主要作用是将输入信息中的无用信息丢弃,其更新计算式为
ft=σ1(Wf·[ht-1,xt]+bf)
(3)
式中:σ1为sigmoid激活函数;W为输入权值矩阵;b为偏置。
(2)经过遗忘门的筛选后,信息传递到输入门it,输入门由σ2和tanh1函数组成,LSTM网络输入信号经输入门确定需要更新的信息以及要更新的内容,其更新计算式为
(4)
(3)输出门ot由σ3和tanh2函数构成,输入信号经输出门确定用于输出的有用信息并立即更新当前LSTM神经网络细胞状态,其更新计算式为
ot=σ3(Wo·[ht-1,xt]+bo)
ht=ot·tanh2(ct)
(5)
3 VMD-LSTM的滚动轴承退化状态识别模型的建立
3.1 麻雀搜索算法
SSA是一种新型的群体优化算法,其受麻雀种群的觅食和反捕食行为启发,通过19个标准测试函数验证SSA算法在搜索精度、收敛速度、稳定性和避免局部最优值方面均优于现有算法[10]。
3.2 SSA优化VMD参数模型
本文计算中初始种群规模取为20,迭代次数为100次,发现者占种群总数的20%。
适应度函数值是评判个体好坏的标准,其选择至关重要。峭度是反映振动信号分布特性的数值统计量及描述波形尖峰度的无量纲参数[11]。滚动轴承正常运行,其振动信号峭度值接近于3,当有明显的冲击成分时,峭度值增大。鉴于此特性,将其作为适应度函数。对于零均值信号峭度表达式为
(6)
通过SSA对VMD优化,确定最小适应度值和最优参数。其流程如图2所示。
3.3 滚动轴承退化状态数目的确定
在滚动轴承全寿命运行过程中,退化状态的确定对于轴承退化状态识别起着关键作用,尤其是首次故障点的确定,对于划分健康与故障状态、准确预测剩余使用寿命十分重要。
将滚动轴承退化状态预分为3、4、5、6四种情况,对每种退化情况给定对应的标签,再利用LSTM网络分别进行退化状态识别。LSTM网络不仅学习不同状态之间的差别,还可以学习轴承的退化趋势。不正确的退化状态数目会导致退化边界偏离正确边界,网络学习到的各状态退化趋势与实际退化趋势不符,使得退化状态难以有效识别;正确的退化状态数目,其退化边界的分布也更符合轴承退化规律,识别准确率也会更高。故通过比较分类识别的准确率来确定最佳退化状态数目。
图2 SSA优化VMD流程图
3.4 滚动轴承退化状态识别模型
滚动轴承的性能退化通常为渐变退化的形式。通过对滚动轴承振动信号的分析,结合VMD与LSTM的各自优势,实现滚动轴承的退化状态识别,具体流程操作如下。
(1) 随机抽取3组同一工况条件下滚动轴承全寿命振动信号数据,随机选取其中2组作为训练集。并进行归一化处理。
(2) 以峭度为适应度函数,利用SSA算法确定VMD分解中K和α的最优解。
(3) 进行VMD分解,根据相关系数选择敏感IMF分量重构,对重构信号提取退化特征。
(4) 以3σ和最高平均准确率为准则,确定首次故障点和最佳退化状态数目。
(5) 将特征矩阵输入LSTM网络中进行训练,得到最终的退化状态识别模型。
(6) 选取同一工况条件下另外一组滚动轴承全寿命振动信号数据作为测试集,提取退化特征后输入到训练好的LSTM模型中,实现对滚动轴承退化状态的识别。
4 实验验证
本文采用美国Cincinnati大学IMS公布的滚动轴承全寿命周期数据验证算法的有效性[13]。
实验装置主轴安装4个ZA-2115型双列滚子轴承,轴承上施加一定的径向载荷,主轴转速恒定为2000r/min,各轴承水平、垂直方向的振动信号分别由两个PCB353B33型加速度传感器采集,采集卡型号为NI DAQ-6062E,每隔10min采集一次,采样频率为20kHz,采样点数为20480个。
4.1 退化区间划分
使用1号轴承全寿命数据。从正常到完全失效共采集984组实验数据,失效形式为外圈故障。
图3 第533组数据频谱图
根据预划分的滚动轴承退化状态3、4、5、6四种情况,分别给定标签,对每种情况训练LSTM网络,得到各自对应的分类识别模型,多次进行退化识别预测。识别准确率如表1所示。
表1 预划分的退化状态识别准确率 %
由表1可知:当退化状态数目为3时,三次识别准确率都在90%附近徘徊,且平均准确率也未超过90%;当退化状态数目为4时,平均准确率为94.14%,最高准确率为95.93%;当退化状态数目为5时,平均准确率达到92.92%,但其预测准确率波动较大,可能由于退化状态的异常划分造成;当退化状态数目为6时,虽然平均准确率达到90%以上,但实际轴承退化情况不会如此复杂,将其纳入预分情况之一是为了防止偶然情况带来的影响。因此,最终确定退化状态数目为4。
根据已确定的退化状态数目和均方根特征的实际退化规律为依据,分析可知1~532组数据的RMS值整体趋势平稳,且符合3σ准则数据分布规律,认为前532组轴承正常运行;533~702组数据的RMS值缓慢上升,认为这170组轴承开始轻度退化;703~932组数据的RMS值波动反复且剧烈,说明轴承的故障点在适应当前运行工况的同时故障程度也在加深,认为这230组轴承处于中度退化;933~984组数据的RMS值波动剧烈,急剧上升,说明轴承健康状态急剧恶化并趋于失效,认为这52组轴承处于重度退化。再对已经划分好的退化区间给定序列标签,1~532组标签为1,533~702组标签为2,703~932组标签为3,933~984组标签为4。退化区间划分如图4所示。
4.2 参数优化及信号分解
使用SSA分别对4种状态下的第301组、第621组、第841组和第961组数据进行寻优,进而确定各个状态VMD分解的最优参数。以第301组数据为例进行参数优化,优化迭代曲线如图5所示,各退化状态最优参数如表2所示。
将最优参数代入VMD分解算法中,以第301组数据为例,分解结果如图6所示。
图4 全寿命数据的退化区间划分图
图5 SSA优化适应度曲线图
表2 各退化状态最优参数
4.3 信号重构与退化特征提取
根据皮尔逊相关系数法则,计算得到各分量与原始信号的相关性。选用滚动轴承各IMF分量相关系数大于0.3的分量进行信号重构,有效保留原始信号的敏感信息[14],从重构后的各模态分量中提取退化特征,选取有效值、峭度、峰峰值、波形指标、脉冲指标、裕度指标、频率均值、频率均方根、频率标准差和信息熵构成特征集。
4.4 退化状态识别
设置LSTM网络模型参数:学习步长为0.001,输入层节点数为10,输出层节点数为4,LSTM隐藏单元个数为200,输出完整序列是一个大小为4的全连接层,后续为softmax层和分类层,以此来指定四个类。指定自适应矩估计优化算法,迭代次数为150次,为防止梯度爆炸,梯度阈值设置为2。
图6 VMD分解图
在初始网络参数下完成LSTM网络训练得到预测模型,将测试集输入预测模型进行类别识别。LSTM模型分类结果及三个边界的局部放大图如图7所示,各退化状态识别准确率如表3所示。
表3 各退化状态识别准确率
图7a中横坐标代表测试集984组数据编号,纵坐标代表4种类别,对应滚动轴承全寿命周期的正常状态、轻度退化、中度退化、重度退化4个阶段。由图7可知:第一类和第四类的预测正确率为100%,这是因为其区间内的趋势明显,比较容易区分;第二类出现了误分类,将7个轻微退化样本错分为正常样本;第三类同样出现了误分类,将7个中度退化样本错分为轻度退化样本,将1个中度退化样本错分为重度退化样本。这是由于轴承退化过程为渐变形式,在刚进入下一个退化状态时会出现“亦此亦彼”的阶段,所以在一、二类和二、三类的边界处出现误分类情况,但随着轴承进一步运行,故障程度进一步加深,很快会彻底进入下一阶段。正是由于这段模糊的状态造成了误分类,但两区间的识别准确率也保持在95%以上。总体来看,综合识别准确率达到98.48%,说明本文方法可以有效解决滚动轴承退化状态识别问题。
图7 LSTM模型分类结果图及边界局部放大图
5 结束语
鉴于VMD分解和LSTM模型的优点,提出了一种基于VMD-LSTM的滚动轴承退化状态识别方法。采用SSA优化算法,获得VMD分解中两个参数K和α的最优值,避免人为设定参数造成误差。以3σ准则和最高平均准确率为依据,结合LSTM模型有效学习时序数据变化趋势的特点,确定最佳退化状态数目。采用LSTM模型进行退化状态识别,并利用实验数据进行分析与应用,验证了本文所提方法对于解决滚动轴承的非平稳、非线性问题的可行性和有效性。