APP下载

基于集成迁移学习的滚动轴承剩余寿命预测*

2021-11-03汪立雄徐增丙王志刚

组合机床与自动化加工技术 2021年10期
关键词:源域边界轴承

鲁 顺,汪立雄,徐增丙,王志刚

(武汉科技大学a.冶金装备及其控制教育部重点实验室;b.机械自动化学院,武汉 430081)

0 引言

为了保证轴承的正常运行,则需要通过轴承剩余使用寿命(remaining useful life, RUL)预测来安排预测性维护,防止轴承突然失效,来有效地避免发生灾难性事件的发生[1]。因此,准确的轴承RUL预测对机械设备的安全性和可靠性具有重要的意义[2]。

在轴承RUL预测的研究中,由于振动数据较容易获取,因此数据驱动方法逐渐成为轴承剩余使用寿命预测的主流方式。在基于数据驱动寿命预测方法中,从监测数据中提取特征,通过支持向量机(support vector machine, SVM)[3]、粒子滤波[4]等机器学习方法作为RUL预测模型。相比之下,由于深度神经网络可直接从原始数据中提取敏感特征,基于深度学习的RUL预测模型与传统浅层模型相比,具有自适应特征提取、模型泛化能力强等优点。文献[5]将循环神经网络(recurrent neural network, RNN)应用于健康因子的构建上,有效提高构建HI的性能,以粒子滤波的方式自动学习轴承的HI随时间的变化规律,从而提高了RUL 预测的准确性;文献[6]提出一种基于二进制分类器的自动识别故障边界计算方法,在少量标记数据的情况下有效的识别故障边界,在轴承性能退化评估中具有较好的效果;文献[7]从长短期记忆(long short-term memory, LSTM)网络的构建出发,利用轴承退化过程的时序特征,融合长期与短期的记忆信息,实现在复杂工作条件下的 RUL预测。

综上所述,尽管深度学习方法相对比较好,但由于传统的RUL预测缺乏标记的故障边界数据训练以及构建健康因子的特征多样性不足,导致轴承故障边界判断精度不足和健康因子单调性和趋势性不够理想,最终使RUL预测准确度不高。

针对上述存在的问题,提出基于迁移学习DBN的故障边界识别方法和基于集成迁移学习的健康因子构建方法,并在XJTU-SY滚动轴承数据集上进行验证,证明该方法的有效性。

1 基于集成迁移学习的剩余寿命预测框架

基于集成迁移学习的剩余寿命预测主要由迁移学习的自动故障边界识别和集成学习的HI构建两部分组成。首先,利用源域的振动数据与轴承状态之间所反映的内在退化机理,通过源域数据协助缺乏标记的故障边界目标域数据训练具有不同激活函数的多个深度信念网络(DBN),将目标域的测试集数据输入网络,计算每个网络的预测精度,再选用激活函数精度最佳的DBN模型识别目标域数据的故障边界;然后,利用具有不同激活函数的多个深度信念网络进行特征提取,通过主成分分析构建多个网络的健康因子,根据每个网络HI的评价指标构建集成矩阵,集成多个网络的HI构建集成健康因子;最后,利用迁移学习中识别到故障边界确定退化的初始时间和集成学习中构建的集成HI,确定集成HI的初始退化时间,然后通过初始退化时间之后的集成HI建立训练集,训练LSTM预测模型,并且利用实际寿命与预测寿命对预测模型的性能进行验证。滚动轴承剩余寿命预测流程如图1所示。

图1 集成迁移学习的滚动轴承剩余寿命预测流程图

2 迁移学习的自动故障边界识别

迁移学习[8]的自动故障边界识别主要包括3个部分: ①多个不同激活函数的DBN模型的训练;②计算每个DBN模型的测试集预测精度;③选取识别精度最高的DBN模型识别故障边界。通过已知的源域故障边界数据进行训练,能够建立样本振动数据Xs至样本状态Ys的非线性映射关系f:Xs→Ys,即为源域轴承的故障识别模型。由于目标域已知故障边界的数据缺乏,导致目标域轴承的故障识别模型f:Xt→Yt通常存在误差较大的问题[9],因此,本文利用源域的振动数据与轴承状态之间所反映的内在退化机理协助目标域轴承故障边界的识别。最后,为了选取最优激活函数的DBN模型,计算每个网络的测试集预测精度,选取识别精度最高的DBN模型识别故障边界。

如图2所示是一个典型的由二个受限玻尔兹曼机堆叠成的深度信念网络结构模型,隐含层单元被逐层训练去捕捉可视层的数据相关性,并且最后一层是由一个二进制分类器构成,计算故障概率和正常概率,以及故障边界识别的公式如式(1)所示:

(1)

其中,yn表示整个时间的正常概率,yf表示整个时间的故障概率。

图2 深度信念网络结构

3 集成学习的HI构建

由于单个模型进行特征提取时,提取的特征会出现特征的多样性不足,使构建的健康因子单调性和趋势性不够理想,利用多个具有不同激活函数的DBN模型,提高提取特征的多样性,并且与单个模型构建HI相比,集成模型构建HI具有更高的泛化能力和可靠性[10]。

集成学习[11]的HI构建主要包括3个部分: ①构建多网络的HI;②构建集成矩阵;③集成HI的构建。将故障边界识别的多个DBN模型参数迁移到构建HI模型中作为特征提取器,通过主成分分析法(PCA)将提取的特征进行降维构建多个网络的HI值。其次,通过计算多个网络HI的评价指标构建集成矩阵。最后,利用集成矩阵将多个网络构建的HI通过集成矩阵进行集成投票,构建集成的HI曲线。具体步骤如下:

输入:轴承的振动数据X={x1,x2,…xn},其中xi表示目标轴承第i时间之内的振动数值,n表示目标轴承从开始退化到寿命结束的时间长度。

输出:集成的健康因子值Yensenble={HI1,HI2,…,HIn}。

步骤1:通过多个DBN模型对轴承的振动数据进行特征提取,获得多个模型的特征集F=[F1,F2,…,Fk],其中Fi=[f1,f2,…,fn],其中1~k表示特征提取模型,k表示模型的数量,fi表示轴承第i时刻的特征。

步骤2:利用主成分分析法(PCA)对多个模型的特征集进行HI构建,得到多个模型的健康因子集Y={Y1,Y2,…,Yk}。

4 LSTM模型的RUL预测

5 实验验证

5.1实验数据描述

本文选择西安交通大学设计科学与基础研究所提供的 XJTU-SY轴承数据集[12]作为实验数据进行验证,实验台如图3所示。从而获得轴承全寿命周期内的实测数据来对轴承RUL预测相关算法的验证。

图3 滚动轴承寿命数据采集实验台

该数据集包含3种工况,即转速2100 r / min,负载12 kN(工况 1);转速2250 r / min,负载11 kN(工况 2);转速2400 r / min,负载10 kN(工况 3)。每种工况下的振动信号包括水平与垂直方向的振动信息,采样频率设置为25.6 kHz,每次采样总共记录了32 768个数据点(即1.28 s),采样周期等于1 min,本文采用水平方向的振动值。本文将以工况2和工况3下的轴承数据为例通过构建的HI对本文预测方法进行验证,具体信息如表1所示。

表1 XJTU-SY轴承数据描述

5.2 迁移学习的自动故障边界识别结果

由于故障边界识别主要是对早期故障出现进行识别[13],因此,本文选择工况3下5个轴承的靠近故障边界样本作为源域,其中这些样本均包含正常样本和轻微故障样本,选择工况2下5个轴承的样本作为目标域,其中标记的样本,只有正常样本和严重故障样本,其具体过程以轴承2_3为例。首先,目标域数据样本选择轴承2_3轴承的样本(0,100]作为正常样本,样本(450,500]作为严重故障样本,源域数据样本选择轴承3_1的样本(2301,2380]作为正常样本,样本(2381,2450]作为故障样本,样本如图4所示。利用源域数据协助目标域数据训练具有不同激活函数的多个DBN模型,表2列出了所选5个激活函数的方程式和波形。使用轴承2_3轴承所有数据作为测试集样本,获得相应的正常概率和故障概率,并且用移动平均法对其进行光滑处理,结果如表3所示,并选择经过迁移relu激活函数的DBN模型与没有迁移relu激活函数的模型进行展示,如图5所示。通过表3可以看到,在自动故障边界识别的基础上,经过迁移的模型要比没有迁移的模型预测精度高,说明迁移学习能够有效地提高自动故障边界识别精度,由此提高RUL预测效果。

(a) 目标域样本 (b) 源域样本图4 模型训练的样本

表2 5个激活函数的方程式和波形

(a) 迁移 (b) 无迁移图5 故障边界识别结果

表3 自动故障边界预测结果

5.3 集成学习的HI构建结果

将5.2节训练完成的网络前三层参数迁移到构建HI的网络中,对目标域数据分别进行特征提取,并且对多个网络提取的特征通过PCA分别进行HI的构建,最后通过集成矩阵对这些HI进行集成,构建集成的健康因子。同时,本文方法和单个模型进行特征提取的构建HI方法进行对比,如图6所示。可以看出,虽然单个DBN能够提取深度特征,但构建HI在趋势性不够明显,而本文所提方法构建HI有较好趋势性。

(a) Ensenble-HI及RMS走势图 (b) DBN-HI及RMS走势图图6 二种HI构建方法对比效果图

指标Cri的值越大,其对应的HI性能越好。通过表4可以看出,本文构建HI值方法的Cri值超过另二个方法,验证集成迁移学习的HI构建能够有效地提高健康因子单调性和趋势性,有利于构建RUL预测模型。

表4 三种HI构建方法的评价指标

5.4 RUL预测结果

利用5.2节中识别到故障边界和5.3节中构建的集成HI,确定数据退化的初始时间,然后将初始时间之后一段数据作为训练数据,构建LSTM预测模型。本文选用目标域中轴承2_2进行展示,如图7所示。可以看出,基于集成的HI预测失效点距离真实的失效位置要比单个模型的构建HI要近,说明采用集成方法构建的HI在LSTM模型预测效果更好,能够提高RUL预测效果。

图7 基于multiple-DBN-HI和基于DBN-HI预测结果对比

此外,为了进一步验证本文方法的整体预测性能,将选择工况2下5个轴承作为待预测的目标轴承,分别采用本文方法和单个模型构建HI方法进行预测,其中起始点是通过本文迁移学习的自动故障边界方法来识别。通过平均误差来测量预测结果的误差,并且对所有预测轴承的进行平均绝对误差,误差结果如表5所示。

表5 预测结果

(1)平均误差的定义如式(2)所示:

(2)

式中,ActRUL和PreRUL分别为第i个测试轴承的实际的剩余使用寿命值和预测的剩余使用寿命值。

(2)平均绝对误差的公式(3)如下:

(3)

式中,Eri为第i个测试轴承的平均误差。

通过表5可以看到,除轴承1之外的4个轴承中,本文方法均取得了更低的预测误差,这表明本文方法可以提高构建健康因子的特征多样性,从而提升构建HI的单调性和趋势性,由此提高RUL预测效果。

6 结论

针对滚动轴承剩余寿命(RUL)预测中自动故障边界识别精度不足与构建的健康因子单调性和趋势性不够理想的问题,提出一种基于集成迁移学习的滚动轴承剩余使用寿命预测方法。通过引入源域数据协助缺乏标记的故障边界目标域数据训练模型,该方法能够有效解决自动故障边界识别精度不足的问题。利用集成迁移学习构建的HI,能够提高提取特征的多样性,同时提高构建HI的单调性和趋势性,从而提高RUL预测性能。

猜你喜欢

源域边界轴承
轴承知识
轴承知识
拓展阅读的边界
轴承知识
轴承知识
基于参数字典的多源域自适应学习算法
意大利边界穿越之家
论中立的帮助行为之可罚边界
可迁移测度准则下的协变量偏移修正多源集成方法
“伪翻译”:“翻译”之边界行走者