基于关系网络的轴承剩余使用寿命预测方法
2023-08-04赵志宏孙诗胜
赵志宏 张 然 孙诗胜
轴承是机械设备中必不可少的零部件之一,广泛应用于各个工业领域,其健康状态直接影响了机械设备的安全性与可靠性.轴承在长期运转过程中,极易发生各种故障,一旦发生故障,轻则造成经济损失,重则危害人类生命安全.因此实现轴承故障预测与健康管理(Prognostics and health management,PHM)显得尤为重要[1].目前,针对轴承的PHM技术主要包括实时状态监测[2]、故障诊断[3]、剩余寿命预测[4]等.其中,构建能够描述轴承真实健康状态、量化退化趋势的健康指标(Health indicator,HI),并实现剩余寿命预测是PHM 的关键技术之一.
过去几年中,很多学者致力于轴承剩余使用寿命(Remaining useful life,RUL)预测方法的研究,这些方法大致分为两大类: 基于模型驱动的方法和基于数据驱动的方法.基于模型驱动的方法通过构建一个可以精确描述轴承退化过程的物理或数学模型来实现轴承RUL 预测,主要包括粒子滤波[5]、艾林模型[6]、韦布尔分布[7]等方法.构建过程不仅需要经过一系列测量后的实际工程系统的参数,还需要广泛的先验知识.基于模型的方法虽然有助于预测机械退化的总体趋势,但是在实际工业应用中,特别是对于复杂的机械设备,很难用简单的物理或数学模型精确地模拟其退化趋势.随着智能传感技术与机器学习技术的快速发展,工业生产中采集了大量的状态监测数据,使得数据驱动的方法快速发展.基于数据驱动的RUL 预测方法根据大量轴承历史数据对退化特征进行建模,主要分为3 个步骤:1) 数据采集;2)健康指标构建;3) RUL 预测.其中,构建符合轴承退化趋势的健康指标是预测RUL的核心,直接影响预测准确性.Yang 等[8]采用自组织映射(Self organizing maps,SOM)融合特征构建健康指标,并引入缩放参数统一失效阈值,最后利用粒子滤波器预测RUL.Hong 等[9]采用小波包-经验模态分解进行特征提取,然后利用SOM 进行特征融合,所得健康指标能够有效表示性能退化,实现轴承RUL 预测.以上方法相较于均方根、峰值、熵等单一特征可以更有效地表示轴承退化趋势,实现RUL 预测.但仍然需要手工选取特征,依赖专家经验.
随着Hinton 等[10]提出深度学习理论以来,一些学者利用深度神经网络强大的特征提取能力构建健康指标实现RUL 预测.Guo 等[11]选取6 个相似性特征与8 个经典时频特征相结合,形成原始特征集,然后利用单调性和相关性度量选择最敏感的故障特征,通过循环神经网络(Recurrent neural network,RNN) 构建健康指标实现轴承RUL 预测.Chen 等[12]提出了一种基于编码器-解码器(Encoder-decoder)和注意力机制(Attention mechanism)的RNN 来构建健康指标,然后通过线性回归方法预测RUL.王久健等[13]提出一种空间卷积长短期记忆神经网络(Convolutional long short-term memory neural network,ConvLSTM)的健康指标构建方法,并利用粒子滤波器更新双指数寿命模型,实现RUL 预测.康守强等[14]通过改进稀疏自动编码器(Sparse auto encoder,SAE)对轴承振动信号进行无监督深层特征自适应提取,将其作为轴承的性能退化特征,并利用双向长短期记忆网络(Bidirectional long short-term memory network,Bi-LSTM)预测轴承RUL.虽然深度学习方法在该领域中取得一定进展,但依赖大量数据进行训练,存在鲁棒性与泛化性较差的问题,难以应用于工程实践.元学习[15]能利用已学习的信息,快速适应未学习的新任务,使用少量训练样本即可得到较好的模型参数,为解决上述问题提供了新视野.因此,元学习逐渐成为故障诊断领域中热门的研究方向之一.元学习主要包括学习度量空间、学习初始化和学习优化器等方法,其中基于度量的元学习方法主要包含孪生网络[16]、匹配网络[17]、原型网络[18]以及关系网络[19]等方法.孪生网络、匹配网络、原型网络均使用固定的距离度量方式实现小样本分类,如欧氏距离、余弦距离等.而Sung 等[19]提出的关系网络由嵌入函数与关系函数组成,其中,嵌入函数用于提取样本特征,关系函数为卷积网络,用于计算样本特征之间的相似性,从而实现小样本分类.由于关系网络是对度量方式进行直接学习,实现对样本间距离的更准确的表达,避免了人为选取度量方式的弊端.起初,关系网络应用于图像识别[20-21]任务中,随着进一步的发展,很多学者将关系网络用于机械设备故障诊断中.Wu 等[22]通过机械故障诊断迁移学习任务验证了关系网络在小样本学习中的优势.吕枫等[23]利用关系网络设计了一种伪标签学习策略,进行样本集扩充,实现半监督学习机械故障诊断.
目前,尚未见到利用关系网络进行寿命预测的论文,本文利用元学习方法在少量训练样本下可以快速学习新任务的优点,利用关系网络度量的特性,通过度量轴承运行状态与初始状态之间的相似性来进行剩余寿命预测,提高寿命预测的准确性.综上所述,本文提出一种利用关系网络构建健康指标并进行RUL 预测的方法.首先通过关系网络的嵌入模块提取特征,然后将初始状态特征与运行状态特征进行拼接,通过关系模块计算两者的相似性,完成健康指标构建.最后对健康指标进行Savitzky-Golay 滤波平滑处理,并采用线性函数拟合方法预测轴承RUL.实验结果表明,基于关系网络模型所得的健康指标能够准确表示轴承性能退化趋势,所得RUL 预测结果与ConvLSTM、Transformer、RNN、卷积神经网络(Convolutional neural network,CNN)+长短期记忆网络(Long short-term memory network,LSTM)、Encoder-decoder+Attention mechanism 等方法相比,误差百分比分别减少了1.68%,3.41%,9.03%,13.72%,30.49%,体现出关系网络在解决小样本问题中的优越性.
本文的其余部分结构如下: 第1 节介绍了关系网络等相关知识;第2 节介绍了关系网络模型的结构以及基于关系网络的剩余寿命预测方法;第3 节在实测轴承全寿命周期数据集上验证所提方法的有效性,并与其他方法进行对比;第4 节概述了本文所得结论和对未来的展望.
1 相关知识
1.1 关系网络
关系网络最初用于小样本条件下的图像分类,与传统深度神经网络需要大量样本训练不同,该网络能在少量训练样本情况下,取得较好的图像分类结果.
关系网络的结构如图1 所示,包含嵌入模块和关系模块,是一种端到端的结构.嵌入模块用来提取输入样本的特征;关系模块用来度量两个特征之间的相似性,得到关系得分.
图1 关系网络结构Fig.1 Relation network structure
在关系网络中,首先将支撑集样本xi与查询集样本xj输入到嵌入模块fφ(·)中,得到样本xi和xj的特征向量
式中,Fi和Fj为输入样本xi和xj的特征向量,fφ(·)为嵌入模块,φ为相应的参数.
然后,通过拼接运算符Z将Fi和Fj拼接在一起,计算式为
式中,rij表示xi与xj之间的相似性,gϕ(·) 为关系模块,ϕ为相应的参数.
损失函数采用均方误差(Mean square error,MSE),计算式为
1.2 Savitzky-Golay 卷积平滑算法
Savitzky-Golay 滤波器是一种低通滤波器,由Savitzky和Golay[24]于1964 年提出,广泛运用于数据降噪.主要计算过程如下:
1) 定义一组数据为y(i),i-m,···,0,···,m,其n阶拟合多项式为
式中,b为多项式的系数,n为多项式的阶数,i为多项式的权数,E(n,i) 为关于n阶的多项式函数.
2)数据y(i)与拟合的多项式间的均方误差ξD为
3)要使均方误差最小,则ξD各项系数的导数均应为0,即
将式(7)代入式(8),展开后可得
通过求解式(9),可求出多项式各项系数bk,从而得到拟合的n阶多项式E(n),即可得到平滑后的数据.
2 基于关系网络的剩余使用寿命预测
2.1 基于关系网络的轴承健康评估模型
本文提出一种关系网络模型,其中,嵌入模块与关系模块的网络结构如图2 所示.嵌入模块采用基本的卷积神经网络结构,以便于衡量关系网络的性能.嵌入模块由4 个卷积层和3 个池化层组成.第1 个卷积层采用了 1×10 的大卷积核,目的是从原始振动信号中提取较大范围的特征.其他卷积层使用 1×3 的小卷积核,便于提取局部信息,并且可以减少网络参数量与计算复杂度.每层卷积后都会进行批标准化(Batch normalization,BN)和线性整流函数(Rectified linear unit,ReLU)激活,BN可以加速训练,避免梯度爆炸;ReLU 激活函数可以将负值置零,具有较强的非线性能力.前两个池化层采用最大池化,保留主要特征的同时减少参数量和计算量.第3 个池化层采用自适应池化,用于固定嵌入模块的输出大小,减少尺寸不匹配的问题出现.
图2 关系网络模型结构Fig.2 Structure of relational network model
关系模块由2 个卷积层、2 个池化层和2 个全连接层组成.每个卷积层中使用1×3 的小卷积核,从输入特征图中获取局部信息.最后一层采用Sigmoid 激活函数,以便得到两个输入样本之间的相似性,获取关系得分.
2.2 基于关系网络的轴承RUL 预测方法
基于关系网络的轴承RUL 预测方法流程如图3所示,首先利用关系网络模型构建健康指标,然后预测RUL.具体步骤如下:
图3 基于关系网络的轴承RUL 预测流程Fig.3 Bearing RUL prediction process based on relation network
步骤 1.采集不同工况运行条件下轴承全寿命振动加速度信号,划分为训练集和测试集,并将轴承的初始时刻样本作为支撑集,剩余样本作为查询集.
步骤 2.将训练集中支持集样本与查询集样本作为模型的输入,将寿命百分比值(当前使用寿命与全寿命的比值)作为模型输出标签.模型进行有监督的训练,输入输出标记形式为Dtrain其中,xtRN×S为S个时间步长的采样数据,采样数据长度为N;yt[0,1] 为时间t所对应的寿命百分比值.将真实标签与预测标签之间的均方误差作为损失函数值,利用误差反向传播算法进行训练,获取模型参数.
步骤 3.将测试集中支持集与查询集样本输入训练好的关系网络模型,计算两者之间的关系得分,作为轴承健康指标.
步骤 4.为降低振荡对预测结果的影响,减少预测误差,采用Savitzky-Golay 滤波器对获取的健康指标进行平滑处理,得到平滑后的健康指标.
步骤 5.采用一次线性函数对平滑后的健康指标进行拟合,并通过与失效阈值交点所对应的时刻对轴承的RUL 进行预测.
关系网络模型构建健康指标方法的伪代码见算法1 所示:
算法1.关系网络模型构建健康指标算法
3 实验
3.1 数据集
本文选取PHM2012 滚动轴承加速寿命实验数据集[25]进行验证.该数据集来自PRONOSTIA 实验台,实验台如图4 所示,能够在几个小时的时间内完成轴承性能退化实验.数据集如表1 所示,包含3 种工况,共 17 个轴承,工况1 转速为1 800 r/min,径向力为4 000 N;工况2 转速为1 650 r/min,径向力为4 200 N;工况3 转速为1 500 r/min,径向力为5 000 N.利用两个加速度传感器采集轴承水平方向与垂直方向的原始振动信号,采样频率为25.6 kHz,每隔10 s 采样一次,每次采样时长为0.1 s.其中,水平方向振动信号能够比垂直方向振动信号提供更多的有用信息来跟踪轴承退化[26-27].因此,本文使用水平方向振动信号进行实验.
表1 PHM2012 轴承数据集Table 1 PHM2012 bearing dataset
图4 PRONOSTIA 实验台Fig.4 PRONOSTIA test bench
3.2 轴承健康指标构建实验与分析
为验证本文所提方法的有效性,选取轴承1_3、1_4、2_3、2_6、3_3 的数据作为测试集进行测试,其余轴承数据作为训练集进行训练.经过实验确定模型超参数取值,Batch size 为200,epoch 为200,学习率为0.0005,优化器为Adam.
针对轴承退化趋势而言,不同工况下不同轴承的退化趋势不同,如图5 所示为轴承1_3 与轴承2_6 水平方向的时域振动信号,其中 g 表示重力加速度.从图5(a)中可以看出,轴承1_3 在运行过程中幅值缓慢发生变化,故障位置不太明显,退化趋势为缓慢退化型.从图5(b)中可以看出,轴承2_6在运行过程中幅值突然发生变化,故障位置较为明显,退化趋势为突然失效型.因此,轴承的全寿命周期数据的退化趋势不只是单一故障模式,可分为缓慢退化型与突然失效型的退化趋势.
图5 轴承时域振动信号Fig.5 Bearing time domain vibration signal
因不同工况运行条件下容易造成健康指标的范围相异,不利于失效阈值的确定,导致难以实现RUL 预测.因此,为确定失效阈值的取值,采用6折交叉验证法对训练集轴承1_1、1_2、2_1、2_2、3_1、3_2 全寿命数据进行交叉验证实验,查看所得健康指标的范围区间,确定失效阈值.首先,从中任意选取5 个轴承的全寿命数据进行模型训练,将剩余的1 个轴承数据进行测试,获得健康指标.然后,通过Savitzky-Golay 滤波器对获取的健康指标进行平滑处理,得到最终的健康指标.最终,可获得训练集轴承平滑后的健康指标,结果如图6 所示.训练集轴承健康指标的范围区间为[0,1],在初始时刻的健康指标值近似等于0,在失效时刻的健康指标值近似等于1,均能够反映轴承运行过程中的退化趋势,并且整体趋势具有良好的单调性.因此,可将失效阈值确定为1,并且可根据健康指标的取值,描述轴承真实的健康状态,量化轴承退化趋势.
图6 训练集轴承健康指标Fig.6 Training set bearing health indicators
为验证本文所提方法在两种不同退化趋势下的有效性,本文以轴承1_3和轴承2_6 为例,将轴承数据输入关系网络模型中,获取轴承1_3和轴承2_6 的健康指标.并采用Savitzky-Golay 滤波器对获取的健康指标进行平滑处理,得到最终的健康指标.最终,平滑前后的健康指标如图7 所示.由图7可看出,本文所提关系网络模型构建的健康指标,无论是缓慢退化型还是突然失效型轴承,均能够反映轴承运行过程中的退化趋势,具有良好的单调性,但是存在局部振荡现象.Savitzky-Golay 平滑滤波用拟合值代替原始数值,具有平滑原始数据序列的作用,可降低健康指标振荡对RUL 预测结果的影响,减少预测误差.因此,可利用平滑后的健康指标进行轴承RUL 预测.
图7 轴承健康指标Fig.7 Bearing health indicators
3.3 剩余使用寿命预测
使用本文提出的剩余寿命预测方法在测试集轴承上进行剩余使用寿命预测.由于训练过程中模型输出标签为寿命百分比值,其符合一次线性函数关系式,因此,对测试集所得健康指标也采用了一次线性函数拟合的方法来预测RUL.
为验证所提方法预测结果的好坏,本文通过计算预测剩余寿命与真实剩余寿命之间的误差百分比Eri来进行评估,计算式为
式中,ActRULi为第i时刻的真实RUL,RULi为第i时刻的预测RUL.
以轴承1_3和轴承2_6 为例,其RUL 预测结果如图8 所示.其中,虚点线为基于关系网络模型所得平滑后的健康指标,虚线为一次函数拟合值,即预测健康指标,粗实线为失效阈值.图8(a)为轴承1_3 的RUL 预测结果,可知轴承1_3 当前时刻寿命为18 010 s (由于轴承的第1 个样本作为支持集,故图中18 000 s 即为全寿命轴承中的18 010 s),实际失效时刻为23 740 s,根据失效阈值可得预测失效时刻为27 380 s,故其实际RUL 为23 740 s-18 010 s5 730 s,预测RUL 为27 380 s-18 010 s9 370 s,则误差百分比为(5 730 -9 370)/5 730 ×100%=-63.53%.图8(b)为轴承2_6 的RUL 预测结果,可知轴承2_6 当前时刻寿命为5 710 s,实际失效时刻为7 000 s,预测失效时刻为7 020 s,故其实际RUL 为7 000 s -5 710 s=1 290 s,预测RUL 为7 020 s -5 710 s=1 310 s,则误差百分比为(1 290 -1 310)/1 290×100%=-1.55%.
图8 轴承RUL 预测结果Fig.8 Bearing RUL prediction results
为进一步验证本文方法的有效性,将本文所提方法与ConvLSTM、Transformer、RNN、CNN+LSTM、Encoder-decoder+Attention mechanism 等方法进行对比,结果如下.
1) ConvLSTM[13]: 该方法采用ConvLSTM 模型构建健康指标,进而实现RUL.模型共8 层,包含3 层ConvLSTM 层、2 层池化层和3 层全连接层.其主要利用卷积神经网络的局部特征提取能力和长短期记忆网络的时间依赖特性,从原始信号中挖掘反映退化程度的特征,构建健康指标.
2) Transformer[28]: 利用Transformer 模型挖掘输入特征与轴承剩余寿命之间复杂的映射关系,通过一次线性函数拟合的方法实现轴承RUL 预测.其中,Transformer 模型包含6 层编码器和解码器,并且编码器和解码器的各个子层之间均添加了残差连接操作.
3) RNN[11]: 该方法首先选取6 个相似性特征和8 个经典时频特征,然后,利用单调性和相关性度量选择最敏感的故障特征,通过RNN 构建健康指标,最终,通过指数模型计算RUL.
4) CNN+LSTM[29]: 该方法提出一种基于CNN和LSTM 的端到端的轴承剩余寿命预测模型.该模型包含1 个卷积层、1 个全局平均池化层和1 个LSTM 层,并在全局平均池化层后加入Dropout.其主要利用卷积层进行特征提取,利用LSTM层预测RUL.
5) Encoder-decoder+Attention mechanism[12]:提取频谱的5 个带通能量值作为特征,采用基于Encoder-decoder和Attention mechanism 的RNN 来构建健康指标,最后通过线性回归方法得到最终RUL值.该模型利用卷积层进行特征提取,将双向门控循环神经网络作为编码器,带有自注意力机制的门控循环神经网络作为解码器进行RUL 预测.
本文计算了所提方法与ConvLSTM、Transformer、CNN+LSTM 等方法的模型参数量,如表2所示.从表2 中可以看出,本文所提方法的参数量只有 78.61k,与ConvLSTM、Transformer、CNN+LSTM 的参数量相比,分别减少了 64.35%、98.78%、93.08%.
表2 不同模型参数量对比Table 2 Comparison of different model parameters
测试集轴承RUL 预测结果以及误差百分比如表3 所示.从表3 中可以看出,本文方法所得误差百分比为24.24%,与ConvLSTM、Transformer、RNN、CNN+LSTM、Encoder-decoder+Attention mechanism 等方法相比,分别减少1.67%,3.40%,9.02%,13.71%,30.48%.因此,本文方法在模型参数量较小的情况下,所得误差均值更低.分析关系网络优于其他方法原因,ConvLSTM、Transformer、RNN、CNN+LSTM、Encoder-decoder+Attention mechanism 等深度学习方法需要大量训练样本才能学习到输入数据与轴承剩余寿命之间复杂的映射关系,实现RUL 预测.而关系网络方法是一种元学习方法,可以在少量训练样本下,通过学习轴承初始状态特征与轴承运行特征之间的相似性,实现轴承RUL 预测.因此,在轴承全生命数据较少的情况下,关系网络方法能够更准确地预测RUL 值.
表3 轴承RUL 预测结果Table 3 Bearing RUL prediction results
4 总结与展望
针对轴承剩余寿命预测问题,本文提出一种基于关系网络的RUL 预测方法,并在轴承数据集上进行实验.主要结论如下.
1)关系网络的方法可以应用于轴承剩余使用寿命预测,其中的关系得分可以用来表示轴承的健康状况.由于轴承的全寿命数据很难得到,关系网络体现出在解决小样本问题上的优越性,取得较好的寿命预测效果,可以更好地应用于工程实践.
2)关系网络中的嵌入模块可有效提取轴承的健康状态特征,与其他度量方式相比,关系模块可以更加准确地度量特征间的相似性.
3)对于缓慢退化型与突然失效型两种退化趋势,本文所构建健康指标均能够反映轴承运行过程中的退化趋势.
4)本文所得RUL 预测结果接近真实寿命值,所得误差百分比均值为24.24%,与其他RUL 预测方法相比,本文方法的误差均值更低.
为比较关系网络的性能,本文嵌入模块采用了基本的卷积神经网络结构,进一步研究工作可以采用其他嵌入模块结构,更好地提取轴承状态特征,提高轴承剩余寿命预测的准确性.由于在实际工业生产中轴承振动数据获取困难,因此本文所提方法在实际轴承数据集中的效果需要进一步验证.