有噪声和变工况环境下剩余使用寿命预测
2022-10-10谈为智丁婷婷
谈为智,冯 骁,邱 祺,丁婷婷
(1.合肥工业大学 管理学院,合肥 230009;2.江苏省仪征中学,江苏 扬州 211400)
高端装备的意外故障往往会造成严重的经济损失,甚至危害人员的生命安全[1]。轴承作为机械装备的关键部件之一,其能否正常运转对于高端装备能否健康工作起到了至关重要的作用[2]。因此,预测轴承剩余使用寿命,并依据预测结果确定最佳维修时间,优化维护计划受到了工业界与学术界的广泛关注。如何提高轴承剩余使用寿命的准确性和鲁棒性是一个值得思考的问题。
目前应用于剩余使用寿命预测的方法主要有以下2类:基于模型的方法和数据驱动的方法[3]。基于模型的方法主要通过构建一个数学模型来描述机械设备的退化过程,该方法能在一定程度上反映外部可测变量与内部物理性质之间的关系[4]。如谢宏远等[5]采用了基于粒子滤波和遗传算法的氢燃料电池剩余使用寿命预测方法,能够在实现长期预测精确度的基础上提高计算效率,并且得到了较为精确的预测结果。焦自权等[6]提出一种改进粒子滤波算法的状态跟踪与剩余使用寿命预测估计方法。实验结果表明,该文提出的改进算法具有计算效率性能优良、状态跟踪拟合度好及预测精度高等特点。但是,在建立数学模型时需要大量关于特定物理系统的专家知识,并且所建立的模型仅适用于特定工况条件下的工业部件[7]。实际工作过程中的工业部件工作环境往往十分复杂,不能采用简单的数学模型来预测剩余使用寿命。
伴随着传感器技术和物联网技术的迅速发展,丰富的历史运行数据可以被收集到。数据驱动的方法得到了广泛的应用,并展示出很好的前景。数据驱动方法通常分为统计学方法和机器学习方法。传统的数据驱动方法通常包括以下2步:特征提取和模型构建[8]。在特征提取阶段,目前提取的特征通常分为以下3类,包括时域特征、频域特征和时频域特征。例如Behzad等[9]选择了一个新的频域特征:高频带宽均方根,用于滚珠轴承剩余使用寿命估计。与应用其他常用特征的结果相比,应用新特征可以更准确地估计轴承的剩余使用寿命。在模型构建阶段,人工神经网络、支持向量机、灰色预测方法和马尔科夫模型等都是常用的剩余寿命预测模型。例如Elasha等[10]将回归模型和多层人工神经网络模型相结合,以预测运行中的风力涡轮机齿轮箱的剩余使用寿命。所提出的方法通过案例研究得到了较好的评估结果。然而,相关特征的提取和选择通常需要相关领域的专家知识,因此模型的泛化能力存在一定的局限性。此外,传统的机器学习模型不能自动提取非线性特征,且维度诅咒也是一个值得注意的问题。
深度学习方法能够学习原始数据中的非线性深度特征,从而吸引了各行各业的广泛关注,并在自然语言处理、图像识别等领域取得了巨大成功。本文将主要介绍与研究相关的堆叠降噪自编码器及卷积神经网络。堆叠自编码器旨在通过恢复输入过程变量数据来学习分层隐藏特征表示。此外,为了从损坏的数据中恢复原始输入数据,以增强模型鲁棒性,Vincent等[11]已将降噪自编码器(Denoising Autoencoder,DAE)用于特征提取。本文将多个降噪自编码器的隐藏层堆叠到SDAE中,以便从轴承振动数据中获取深层特征表示。卷积神经网络中的卷积核能够实现局部权值共享,并逐层挖掘相邻数据间的共性规律。例如,张继冬等[12]将全卷积层神经网络用于轴承剩余寿命预测。实验结果表明,与传统的先人工构建性能退化指标、再预测的方法相比,所提方法大幅提高了剩余寿命的预测精度。一维卷积神经网络(One-Dimensional Convolutional Neural Network,1DCNN)是卷积神经网络(Convolutional neural Network,CNN)的一种变体,不同于接收矩阵输入的标准CNN,1DCNN的输入是一个向量。目前,1DCNN被广泛应用于处理变化的一维信号以获得短期动态特征,其还可以平滑输入向量的波动。但是,由于温度、负载等外部环境的变换,轴承转子等系统的退化模式往往不是单一的,采用单一大小的卷积核容易遗漏局部重要特征。因此,通过利用大小不同的卷积核,可以使提取的特征更加全面有效。例如孙鑫等[13]提出了一种基于多尺度卷积神经网络的轴承剩余寿命预测方法。实验结果显示,该方法具有更高的鲁棒性与稳定性。为此,本文提出了一种基于SDAE和MS1DCNN的剩余使用寿命预测模型。首先,SDAE用于从添加了一些噪声的过程数据中分层学习深度的降噪特征。之后,MS1DCNN用于捕获不同退化模式对于轴承剩余使用寿命的影响。为了验证提出模型的优越性,本文将提出的方法应用于PHM2012挑战赛的轴承剩余使用寿命预测任务中,并取得了良好的预测效果。
1 模型理论基础
1.1 降噪自编码器
在实际工业系统的数据采集和传输过程中,由于工业设备内部老化、外部环境干扰等各种原因,导致收集到的轴承振动数据中往往存在大量噪声。为了增强自编码器模型的鲁棒性,在输入模型训练前需要先向原始输入数据中加入噪声。其结构图如图1所示。
图1 降噪自编码器结构图
式中:ht为学习到的隐藏层特征;sigmoid为激活函数;We,be分别为权值矩阵和偏置向量。解码阶段用于产生和原始输入维度相同的原始数据表示,其计算过程如下
1.2 堆叠自编码器
堆叠自编码网络的核心思想是通过训练每一层编码器抽象出更为稳定的特征表达。在结构上,典型的堆叠自编码器(Stacked Denoising Autoencoder,SAE)由多个无监督自编码器和反向传播神经网络监督层组成。其结构图如图2所示。
由图2可知,第1个自编码器的隐藏层特征,将作为第2个自编码器的输入特征,并借此获得更深层次的特征表示以提升模型的稳定性。当然,第2个自编码器的隐藏层特征或许还是不能够很好地反映原始数据的特性,可以将其作为第3个自编码器的输入去获得更高层次的隐层特征。
图2 堆叠自编码器结构图
1.3 卷积神经网络及其变体
1.3.1 卷积神经网络
卷积神经网络是利用卷积运算来捕获动态特征的前馈神经网络。如图3所示,传统卷积神经网络通常由卷积层、池化层和全连接层3部分组成。
图3 卷积神经网络结构图
在卷积层中,卷积核与输入矩阵进行卷积操作,然后利用激活函数得到卷积层的输出矩阵,其计算公式如下
式中:⊗代表卷积运算,能够从振动数据中提取有用的信息;Ws和bs分别为卷积核和偏置;fc为非线性激活函数。
池化层的主要操作是对卷积层的输出矩阵进行降维处理,以去除冗余特征的同时增加网络的收敛速度。常用的池化操作有最大池化及平均池化等。
1.3.2 一维卷积神经网络
不同于接受矩阵形式信号输入的传统卷积神经网络,一维卷积神经网络接受的输入为一个向量,输出也为一个向量,其结构图如图4所示。因而,在处理振动信号这一类一维时序数据时,一维卷积神经网络的应用更为广泛。
图4 一维卷积神经网络结构图
1.3.3 多尺度卷积神经网络
传统的卷积神经网络往往采用单一大小的卷积核来提取隐藏在原始信号中的特征。然而,由于原始信号的数据量较大,使用单一大小的卷积核会导致网络在自适应的提取特征时遗漏局部重要特征,难以表征不同振动模式对于轴承剩余使用寿命的影响。
2 基于SDAE-MS1DCNN预测方法
考虑到实际工况环境中常常会有噪声干扰,并且轴承工作的外部环境常常处于变化之中,本文提出了一种结合堆叠降噪自编码器(SDAE)和多尺度一维卷积神经网络(MS1DCNN)的剩余寿命预测模型,结构图如图5所示。首先进行轴承振动数据收集与预处理,之后将处理后归一化的数据输入到SDAE网络中进行数据去噪,接着通过MS1DCNN来获取不同退化模式对于轴承剩余使用寿命的影响,以提高模型在不同工况环境下的泛化能力。最后将MS1DCNN输出的特征使用全连接神经网络进行回归预测。
图5 SDAE-MS1DCNN结构图
2.1 SDAE
由于SDAE能从损坏的数据中学习隐藏的特征表示,所以可以在一定程度上消除数据噪声的干扰。如图5所示,经过预处理的轴承振动数据在输入SDAE网络之前需要向其中加入噪声,加入噪声后的振动数据便可以输入到网络之中进行编码操作,以获得第一层隐藏层的特征表示。隐藏层的特征在进行解码的操作还原出原始信号。这样第一个DAE便构造完成了。然而,由于第一层隐藏层提取到的特征往往抽象程度不高,不能够很好地提取出原始信号具有代表性的特征。因此,需要将第一层隐藏层的信号输入到下一个自编码器的网络中。值得注意的是,在第一层隐藏特征输入到下一层的自编码器网络前,仍需对该特征加入噪声,以增加网络的鲁棒性。
2.2 MS1DCNN
由于轴承快速退化与缓慢退化时所收集到的信号振幅与频率往往是存在差异的,使用相同大小的卷积核就有可能会遗漏局部重要特征,导致模型准确度低,泛化性能差。因此,本文基于CNN的基本原理,提出了MS1DCNN模型。如图5所示,在经过SDAE处理之后的最后一层隐藏层特征信号将利用m种不同尺寸的卷积核进行卷积操作,由于不同大小的卷积核具备不同的感受野,不同特征感受野层能够充分提取不同频段的振动特征,实现提高模型预测精度。进行了多次卷积池化操作后,将输出特征输入全连接层进行最终的回归预测。
3 实验与讨论
3.1 数据集介绍
本文中所使用的滚动轴承全生命周期数据来自电气和电子工程师协会(IEEE)2012年举办的PHM数据挑战赛。其数据在试验平台PRONOSTIA进行收集。该平台可用于评估轴承的故障诊断和预后方法,其可以在几个小时内加速轴承的退化过程。其实验装置包括3个主要的子系统即旋转子系统、退化生成子系统和数据采集子系统。
在实验中,获得了轴承的温度和振动数据,共进行了在不同电机转速和径向力的3种工况下的实验,工况1和工况2各进行了7个轴承实验,分别命名为Bearing1_1~Bearing1_7和Bearing2_1~Bearing2_7,工况3进行了3个轴承的实验,命名为Bearing3_1~Bearing3_3。每种工况选取1和2号轴承作为训练集,其他的作为测试集。表1列出了不同工作条件下的具体电机速度和径向力。
表1 数据集工况信息
3.2 评价指标
为了验证预测精度,采用均方根误差(RMSE)直接替换为RMSE和平均绝对误差(MAE)直接替换为MAE这两个典型指标来分析不同方法的建模性能。RMSE和MAE定义如下
式中:Ttesting为测试集样本数;代表剩余使用寿命真值的均值;yi和y^i为i时刻剩余使用寿命的真实值和预测值。
3.3 实验验证与结果讨论
3.3.1 参数设置
在样本数据的划分上,本实验遵从PHM2012挑战赛的样本划分规制,将轴承2-2作为训练集,轴承3-3作为测试集。划分完训练样本后,本小组将对网络参数进行设置,本小组采用的堆叠降噪自编码器共有3层,其隐藏层的维度分别为:2 000、1 800、800。另外,实验中的多尺度卷积神经网络分别采用3×1,5×1和7×1的卷积核。在卷积神经网络后接一个全连接层输出预测值。经过多次实验和比较,最终确定的模型的2个卷积层的通道数分别为3和6,训练学习率为0.005,批量大小为30。
3.3.2 实验结果
为了验证SDAE-MS1DCNN的剩余使用寿命预测性能,不同的回归预测方法在本数据集上进行了实验验证。具体来说,有支持向量回归(Support Vector Regression,SVR)等传统的机器学习方法,也有SAE、DAE、SDAE、1DCNN、MS1DCNN、SDAE-1DCNN等深度学习方法,具体的实验结果见表2。
表2 各模型预测效果表
由表2中数据可知,传统机器学习方法SVR的预测结果表现最差,主要是由于SVR的浅层结构难以提取数据中的动态时间特征。SDAE的预测效果好于SAE与DAE,因为一方面SDAE能够学习深层次的特征表示,另一方面SDAE能够抵御噪声对于预测结果的干扰。1DCNN及其变体的预测性能好于SVR和SAE,因为其关注到了特征间动态信息。SDAEMS1DCNN结合了SDAE和MS1DCNN的优势,能够在抵御噪声干扰的同时捕获全面的动态特征。
为了进一步探究模型抵抗噪声的能力,本文向SDAE网络中分别加入了0.1、0.2、0.3、0.4的噪声系数,其预测效果如图6所示。
由图6可知,随着噪声的增多,模型的误差也在逐步增大,但是模型仍然具有较高的准确度与鲁棒性,因此可见所提网络在处理实际工业环境中产生的噪声数据时,能够保持较高的预测精度。
图6 不同噪声系数下模型预测效果
在SDAE-MS1DCNN模型中,尺度数是一个关键的超参数,直接决定了多尺度学习的效果。单尺度学习模型不能适应非平稳的工况环境,但是当尺度个数增加过多时可能导致过度拟合问题,降低模型的泛化能力。为此,本文探究了尺度个数对于学习效果的影响。
如图7所示,在最开始时,随着尺度的增加,模型的预测效果不断提升,由此可见MS1DCNN能够学习到更加全面的轴承退化特征。但是当尺度数增加到4时模型预测效果开始下降,这可能是由于尺度数过多时模型学习了训练样本所独有的特征,从而导致过拟合。
图7 不同尺度下模型预测效果
4 结论
本文提出了一种新的剩余使用寿命预测方法,不同于以往的剩余寿命预测方法,该方法的优点主要如下:首先,通过引入堆叠降噪自编码器,充分考虑实际工业过程中的数据噪声对于剩余使用寿命预测结果的影响,增强模型的稳定性与可泛化能力。其次,通过利用多尺度一维卷积神经网络,使模型能够在面对变化的工况环境下,仍然拥有较高的预测精度。此外,所提模型在PHM2012挑战赛的数据集上得到了实验验证,实验结果表明,该方法可以有效地抑制噪声,并且实验结果的准确性也明显优于其他对照模型。在未来,研究者将进一步探索如何以更优的方式融合从不同尺度得到的深度特征,以进一步提高预测精度。