基于级联长短期记忆神经网络的轴承复合故障预测
2022-12-02江旭耀林群煦侯至丞张金越
江旭耀,林群煦,侯至丞,张 弓,张金越,杨 根
(1.五邑大学 轨道交通学院,广东 江门 529020;2.广州先进技术研究所,广东 广州 511458;3.中国科学院大学,北京 100086;4.广东技术师范大学,广东 广州 510665)
0 引言
机械故障预测与健康管理技术最早属于军事领域,被应用于军用设备的维护。相比以往的修复性维修和预防性维护,预测性维护能明显提升设备的有效利用率并降低维护成本,但对机械状态的监测和健康度的判断提出了更高的要求。
传统的预测性维护方法分为两种,即基于物理模型的预测性维护法(简称“物理模型法”)和基于数据驱动的预测性维护法(简称“数据驱动法”)[1]。物理模型法是利用固有系统故障机制构建物理退化模型,再根据该模型来评估当前健康状态和预测剩余寿命,其包括基于力学的物理退化模型[2]、基于随机退化的经验模型[3]和基于确定性模型[4]等。数据驱动法则是通过传感器获取大量机械运转数据,并利用Teager能量算子[5]、小波变换[6]、经验模态分解[7]和希尔伯特包络[8]等方法来提取故障特征,再建立数学模型或神经网络模型来评估机械状态和预测剩余寿命。
对于简单机械,物理模型法尚可行;但面对结构复杂、参数相互耦合的现代工业生产设备,物理模型法会导致建模难度成倍增大,甚至无法得到精确的物理模型,且预测效果不佳。经验模型和确定性模型等根据概率论建立的模型除了会遇到物理模型相同的问题外,还可能遇到机械材料的更迭、内部材料的差异和外部环境的不断变化等因素所导致的不同材料间相互作用、互相影响的问题,致使准确的模型难以被获得且预测效果不佳。而数据驱动法则需要人工从大量数据中寻找出机械故障特征,对单一故障而言,其尚且能找到故障特征;但面对复合故障导致的故障特征相互耦合的状况时,寻找故障特征的过程则会变得非常繁琐。
针对传统预测性维护方法存在的不足,本文提出一种基于级联长短期记忆(long short term memory,LSTM)神经网络的方法来估计机械健康度衰减曲线,并与共振解调法提取的健康度曲线进行对比。结果显示,该方法能通过神经网络有效自动地提取相应数据特征;且面对复合故障时,该方法同样有较好的效果,能有效解决人工处理数据寻找故障特征繁琐以及提取复合故障特征困难的问题。文章最后根据此方法搭建了神经网络来实现健康度判断和剩余使用寿命预测,并证明其有效性。
1 LSTM神经网络和共振解调
1.1 LSTM神经网络
神经网络作为一种模拟人脑学习能力的新式模型搭建方法近年来被广泛应用[9]。其最早被Kunihiko Fukushima用于猫视觉实验中以模拟类似人脑神经元的多层结构认知体[10];而后,伴随着BP算法[11]的提出和基于GPU神经网络的搭建[12],其在工程应用上有了突破。文献[13]中提出的AlexNet神经网络在图像分类方面取得了惊人的效果[13]。除了这类在图像识别上具有优势的卷积神经网络(convolutional neural network,CNN)外,循环神经网络(recurrent neural network,RNN)在处理振动加速度、语义及音频等时间维度数据上具有十分显著的优势[14]。
RNN最大的特点是按时序输入与输出,隐藏层中参数也随时序流动而逐级传递;但其存在梯度弥散和梯度爆炸的问题,对于长时间的数据依赖存在一定困难。基于RNN的LSTM神经网络则通过引入自循环的方式提供给梯度长时间流动的路径,有效改善了梯度弥散和梯度爆炸问题。文献[15]利用LSTM神经网络来预测脑电信号,进而预测抑郁症的发病趋势。文献[16]利用LSTM神经网络和Bi-LSTM神经网络进行了风电场的风速预测。文献[17]则提出了一种利用LSTM神经网络对DDoS攻击进行判别的方法。
LSTM神经网络对处理时序数据的有效性得益于门控自循环的设计,图1示出LSTM的神经元结构。图中,F(t)为遗忘门输入,S(t)代表当前细胞状态,I(t)为输入门,X(t)为神经元输入为候选向量,O(t)为神经元输出为输出门,具体计算如式(1)~式(6)所示。
图1 LSTM神经网络神经元结构Fig.1 Neuron structure of LSTM neural network
式中:σ——sigmoid激活函数;tanh——激活函数;Wf、Wi、Wc、Wo——分别为遗忘门、输入门、候选向量和输出门的权重;bf、bi、bc、bo——分别为遗忘门、输入门、候选向量和输出门的偏置项。
LSTM神经网络除了具有RNN神经网络的时序数据流动特点外,还增加了细胞状态传入的路径,使得有价值的信息可以通过更新细胞状态的方式按时序传递至网络后面任意时刻的神经元内,实现了有益数据的长时间持续流动。
1.2 共振解调
传统轴承健康度判别法中应用最广的是共振解调技术[18],其通过希尔伯特变换和包络分析提取故障特征信号(图2)。共振解调时,首先对轴承的振动数据进行希尔伯特变换,见式(7);然后通过包络分析,获得其多阶解调谱特征,见式(8),实现故障特征频率从振动数据中分离;最后通过分析故障特征频率的变化,提取轴承健康度曲线。
式中:H[X(t)]——对信号X(t)进行希尔伯特变换;Z(t)——对应的包络信号。
图2希尔伯特包络分析Fig.2 Hilbert envelope analysis
本文将以两级级联的LSTM神经网络为基础进行轴承状态评估和预测剩余寿命。使用均方根误差(RMSE)分析第一层模型的预测结果,得到当前轴承的系统健康度,并对比利用希尔伯特包络的共振解调法,验证神经网络对提取轴承特征的优越性;提取健康度曲线,搭建第二个LSTM神经网络进行健康度判断和剩余寿命预测,以验证本方法的可行性。
2 健康度估计和剩余使用寿命预测
滚动轴承在运行过程中,轴承的内圈、滚珠、外圈以及外部机械结构之间都会产生周期性的正常冲击[19],在转速、负载、外部环境相同的工况下,这种振动规律可被神经网络学习并预测未来的振动曲线。如果轴承结构存在着擦伤、点蚀、裂纹、崩裂等损伤,则在轴承运转中通过这些损伤点处会产生更强的冲击现象,导致振动能量的突变。单一损伤点的振动在轴承工作工况相同的情况下其能量会快速衰减;复合损伤点导致的振动会因冲击能量而出现共振、谐振等现象,具有高度的耦合性。
2.1 数据前处理
搭建第一层神经网络的目的在于通过学习固定工况下轴承振动的周期性规律,并根据上一时刻的数据预测下一时刻的振动曲线。设置时间窗(图3),对数据集进行处理。时间窗每向前滑动步长Step,将其后长度为“Input+Output”的数据划分为一个时间窗数据(其中Input为模型的输入,Output为模型的输出),滑动划分出滑动时间窗数据集。
图3 滑动时间窗划分数据集Fig.3 Sliding time window partition dataset
输入数据集:
输出数据集:
用滑动时间窗可以有效地扩充训练数据,解决数据不足的问题;但过短的步长容易因数据重复程度过大而导致模型训练效果变差和预测结果准确度下降。
2.2 神经网络模型搭建
第一个模型训练的时间窗数据仅为轴承正常运行时的振动数据。对数据归一化处理后导入神经网络,神经网络本身会进行特征提取和曲线的预测。按照时间窗划分数据并归一化处理后,将其中80%纳入训练集,20%纳入验证集,搭建如图4所示的LSTM神经网络进行模型的训练。
当轴承状态正常时,预测值和真实值的偏差相对较小;而当轴承状态异常时,其振动信号与正常振动数据间存在差异,这种差异可以通过神经网络表现为预测值与真实值间偏差的增大。预测值与真实值的误差与异常振动和正常振动之间的差异呈现正相关,因此将模型的预测偏差归一化后作为轴承的健康度。通过第一层LSTM神经网络,判断所得到的轴承全寿命周期健康度曲线应符合滚动轴承典型的故障发展过程[20],其由正常状态和轴承损伤发展的4个阶段构成,包括安全、衰退(磨损)、潜在故障、故障和失效5个健康等级。
在得到健康度曲线后,将每个时间窗的健康度和实际剩余寿命作为标记,如图4所示,导入并构建训练第二层LSTM神经网络。第二层LSTM神经网络对输入数据和健康度进行关联。根据当前轴承振动数据和对应的机械健康度,学习轴承的机械退化相关特征,其目的是得到能根据输入的振动数据对当前机械健康度进行评估并预测剩余寿命的模型。
图4 级联LSTM神经网络模型训练路径Fig.4 Training pat of the cascaded LSTMneural network model
3 实验效果
本文选用西安交通大学的滚动轴承加速寿命试验数据集[21],图5所示平台被用于采集不同工况下LDK-UER204型滚动轴承的加速寿命数据。实验中,通过调整轴承的转速和负载的径向力,获取水平方向和垂直方向的振动加速度数据。该数据包含了实验轴承的全寿命周期振动数据和故障失效位置信息。其中,Bearing1_1,Bearing1_2和Bearing1_3为轴承在径向负载为12 kN和转速为2 100 r/min的工况下外圈故障数据;Bearing1_4为保持架故障数据,该数据无法体现轴承全寿命周期,故本实验不采用该组数据;Bearing1_5是相同工况下内圈和外圈复合故障数据。本文采用单一故障的Bearing1_1,Bearing1_2,Bearing1_3数据和复合故障Bearing1_5数据验证所提方法的可行性。
图5 西安交通大学滚动轴承试验平台[21]Fig.5 Rolling bearing test platform of Xi'an Jiaotong University
3.1 轴承健康度评估效果
实验采用Bearing1_1数据集的垂直振动数据进行模型训练,截取数据集前部正常状态数据,设置步长step=20,Input=4 000和Output=200,划分数据集作为模型的输入和输出。
模型预测效果如图6所示,当轴承处于正常运转状态时,模型预测值与真实振动值基本吻合;当测试轴承经过一段时间的运转、出现损伤且损伤逐步增大时,预测值与真实值的偏差也随之增大。随着损伤程度的加剧,轴承的健康度随之降低,呈现明显的阶段性下降趋势。
预测值与实际值的偏差使用均方根误差(RMSE)进行分析,见式(11)。计算该偏差值,得出健康度曲线。由于该曲线具有一定程度的波动,不适合直接用于第二层神经网络的训练,因此需对其进行归一化处理后再使用曲线拟合。本文使用最小二乘法对其进行18阶曲线拟合,得到故障频率变化曲线F(x),图6的轴承健康度曲线为1-F(x)。
图6 第一层模型预测效果Fig.6 Prediction effect of the first layer model
为评估神经网络提取轴承健康度曲线的效果,利用共振解调法分析Bearing1_2数据进行对比。按时间顺序以每周期采样数据的长度(25.6 kHz)为标准将轴承数据集划分为固定长度的时间窗数据,求得每个周期的希尔伯特包络频谱,如图7(a)所示。轴承外圈故障振动频率为108 Hz,将每个时间窗数据的108 Hz频率值按时间顺序提取,所得曲线为轴承全寿命周期的外圈故障频率变化曲线,如7(b)所示。
通过曲线拟合得故障频率变化曲线G(x),归一化并计算得出健康度衰减曲线1-G(x)。将3个单一故障数据集的健康度曲线分别用两种方式提取并进行对比(表1)。可以看出,相比共振解调法,采用神经网络提取健康度曲线的方法效果更好,所提取的轴承健康度衰减曲线更加平滑且阶段层次分明。此外,共振解调法需要找到故障特征频率才能使用,只适用于单一故障;对于轴承的复合故障,故障频率会相互耦合,相应的故障特征难以被提取。
表1 共振解调法与神经网络法结果对比Tab.1 Result comparison between resonance demodulation method and neural network method
图8示出属于内圈、外圈复合故障的Bearing1_5数据集。可以看出,面对复合故障情况,轴承故障特征频率会随之改变,共振解调法需要重新寻找特征频率,而神经网络法则能很好地从数据中提取出能反映轴承状态的健康度曲线。
图8 轴承复合故障情况的健康度评估曲线Fig.8 Composite-fault condition of bearing
为了量化评价健康度曲线的优劣,从单调性、鲁棒性和趋势性3个方面对共振解调法和神经网络法的使用效果进行评价,利用最小二乘法进行曲线拟合,将健康度曲线分为趋势值xT(t)和残差xR(t)两部分:
单调性指标M用于评价健康度曲线是否呈现持续增加或减小的趋势,具体如下:
式中:n——数据量;N+和N-——分别为相邻健康度微分为正和为负的计数值。
鲁棒性指标R用于反映健康度曲线是否存在大幅度波动的异常值,具体如下:
趋势性指标T反映了健康度曲线下降趋势与测量时间的线性关系,具体如下:
这3个评价指标越接近1,健康度曲线性能越优异。表2示出经实验得到的健康度曲线性能指标。
表2 健康度曲线性能指标Tab.2 Health curve performance indices
由表2所示实验数据可知,神经网络法的健康度评估指标相比共振解调法的有明显提升,尤其在鲁棒性方面,4个数据集分别提升了11.2%、18.2%、15.6%和13.1%(特征频率为436 Hz);在趋势性方面,其性能指标比共振解调法的呈现出更加稳定的下降趋势。根据单调性、鲁棒性和趋势性3个指标构建健康度融合评价指标I,具体如下:
综上,对于单一故障,神经网络法的健康度评估指标比共振解调法的分别提升了12%、24.8%和5%;对于复合故障,在理论故障频率108 Hz下,健康度曲线的评价指标提升了12.2%,在实际特征频率436 Hz下,评价指标提升了15.1%。
3.2 剩余寿命预测
根据上文获得的轴承健康度曲线和每个时间窗距离失效的剩余时间,训练第二层LSTM神经网络。该模型可以通过采集一个时间窗长度的数据进行健康度的评估和剩余寿命预测,数据集Bearing1_3的实验结果如图9所示。
图9 Bearing1_3的每个时间窗数据的预测结果Fig.9 Data prediction results of Bearing1_3 in each time window
轴承的损伤阶段分为故障发展阶段、带障运行阶段和失效阶段。损伤的产生具备一定的随机性。由实验结果可以看出,当轴承处于正常工作阶段时,预测损伤发生的时间点是困难的;而当轴承损伤已发生且处于损伤逐步扩大阶段时,预测其剩余寿命则是可行的;损伤发展到一定程度后会磨合,进入相对稳定而缓慢发展的带障运行阶段,此时轴承是不健康的,随时可能进入最终的失效阶段,且难以预测该时间点,在此阶段应尽早给予轴承相应的维护或直接更换。
为了能更快采集到轴承的全寿命周期数据,实验数据集中使用的径向负载属于理论极限负载。根据国家标准GB/T 6391-2010[22],该工况的理论计算寿命是5.6 h至9.677 h;实际实验中,轴承寿命均未超过3 h[21]。寿命预测真正能起到作用的阶段只有在损伤发生之后,故模型能学习到的寿命时间仅针对这种极限工况。而实际生产活动中,轴承通常不会运行于极限负载工况,若能采集到完整的轴承全寿命周期数据,实现更早的剩余寿命预测是可行的。
4 结语
本文提出了一种基于级联LSMT神经网络的轴承复合故障预测方法,其通过搭建两级LSTM神经网络实现轴承健康度评估和剩余使用寿命预测,并以西安交通大学滚动轴承试验平台数据集进行实验,验证了方法的有效性。该方法利用LSTM网络学习数据一定周期内的自相似性,这种思路也可拓展应用于电流、电压和温度等时序变化数据的分析。
但该方法仍存在一定的局限性:一方面,其健康度评估只能针对单一工况的振动数据,剩余使用寿命预测需要完整周期的振动数据,而在实际生产活动中,很多时候难以获得完整寿命周期的数据或者获取成本很高;另一方面,其寿命预测精度有待提升,需要进行进一步的深入研究。