基于ANN和SVM的轴承剩余使用寿命预测*
2021-01-27冯俊杰
邹 旺,江 伟,冯俊杰,郑 凯
(六盘水师范学院,贵州 六盘水 553004)
0 引言
轴承是旋转机电设备的关键部件,它的可靠性运行能够提高现代生产设备的安全性和效率。轴承的故障通常被认为是设备故障最常见的原因之一[1-2]。轴承通常在恶劣的环境中工作,在运行期间经常发生不同类型的故障,如果不采取有效措施,轴承的故障可能导致整个机器的故障并造成大量经济损失。因此,轴承的剩余使用寿命预测技术变得非常重要,它提前为设备维修人员提供故障报警预告,提前进行零部件更换,从而减少昂贵的计划外维护并提高设备运行的安全性。近年来,轴承RUL预测的研究已经成为了重要的研究方向[3]。RUL预测方法可分为两类[4]:基于模型的预测方法和基于数据驱动的预测方法[5]。基于模型的方法的精度取决于建立模型的准确性。由于难以清晰、全面地描述轴承退化的复杂过程,因此通常难以构建轴承剩余使用寿命预测的模型。基于数据驱动的方法具有数据挖掘和机器学习的特点,在初始分析阶段不需要建立复杂的控制。此外,此方法能够提供量化预测结果和预结果概论分布,为机器学习算法构建合适的机器学习模型。奚立峰等[6]基于自组织映射和反向传播神经网络,有效预测了轴承剩余使用寿命。申中杰等[7]提出基于相对特征和多向量的剩余寿命预测方法,结果表明多变量支持向量机可在小样本条件下获得准确的预测结果。Tian Zhigang[8]开发了一种基于人工神经网络(ANN)的方法,用于实现对状态监测设备更准确的剩余使用寿命预测,但对于小样本条件下预测结果不理想。Sun Chuang等[9]开发了基于SVM的轴承寿命预测模型,将该模型应用于轴承的寿命预测,结果表明该模型具有较高的精度,但该方法采用传统的特征提取方法无法抽取出全面反应轴承退化所需的特征。Dong Shaojiang等[10]提出了一种基于主成分分析(PCA)和优化LS-SVM方法实现轴承退化预测的新方法,结果证明了该方法的有效性。Ren Lei等[11]提出了通过结合时域特征和频域特征的多轴承剩余使用寿命预测的深度学习方法,该方法是基于时域和频域特征,引入多层神经网络模型来预测轴承的RUL,所提出的方法在实际的数据集上的预测精度高于其它常用的机器学习方法,但该方法对于处理小样本数据集时不能完全反应出深度学习的优势。
目前轴承寿命预测特征学习速度和预测精度还有待进一步提高,本文结合时域特征和频域特征,提出一种基于人工神经网络和支持向量机融合模型的方法。时域特征包括均方根、波峰因素和峰度,这三个特征来自经典的时域特征,用于轴承振动信号分析;频域特征,本文采用文献[11]所提出的频谱分割求和[FSPS],该特征参数表现轴承退化前期和后期较突出;两者相结合 ,基本上覆盖了整个轴承的退化过程。人工神经网络模型具有强大的特征学习能力[8],支持向量机对解决小样本数据分类和预测问题具有绝对优势[9]。本文提出的ANN和SVM融合方法是将轴承的6维时域特征和12维频域特征作为人工神经网络模型的输入,将输入的特征做进一步的抽取,然后把这些特征作为支持向量机的输入来进行轴承的RUL预测。本文在实际的数据集上验证所提方法的有效性,并与随机森林(RFR)模型、LASSO模型、SVM模型和ANN模型进行了性能比较,实验结果表明所提方法提高了预测精度。
1 ANN和SVM预测模型
1.1 ANN模型
人工神经网络是一种由神经元网络组成处理复杂数据的学习方法。人工神经网络模型输入层和输出层之间具有单层或多层隐藏处理层。模型结构如图1所示。多层隐藏层神经网络与单层相比,具有更强的学习能力,学习到的特征更本质地反映数据变化规律,从而更有利于解决分类和回归。本文选用多隐层神经网络模型对6维时域特征和12维频域特征做处理,将ANN处理后的特征作为SVM模型的输入,通过支持向量机非线性回归方法预测轴承的RUL。本文选用如图所示的8层神经网络模型,每层的网络节点数为[300,250,200,100,80,50,30,8,1],每层的激活函数为ReLU函数。由于所提取的特征包含大量反应轴承运行变化的信息,这些信息并非都适用于RUL预测。神经网络的功能是从时域和频域特征中查找详细信息,并从详细信息中提取有用信息。
图1 人工神经网络模型结构
1.2 SVM模型
基于统计学习理论的支持向量机(SVM)是处理小样本数据集问题的机器学习算法。给定训练样本集(xi,yi),对于i=1,2,3…,m,其中m是样本的数量,xi∈Rn为输入变量,yi是对应的预期值,在线性回归的情况下,回归函数为:
f(x)=<ω·x>+b
(1)
式中,ω∈Rn为权值矢量,b∈R为偏差,可以通过求解下面最优问题来求得权值ω和偏差b:
(2)
(3)
在非线性回归任务的情况下,SVM运算中可使用核函数,通过使用非线性矢量核函数,将原始数据可以映射到高维特征空间,把非线性回归问题转换为线性问题求解。线性回归函数:
(4)
两个常用核函数分别为:高斯RBF核函数和Poly核函数,其表达式分别为式(5)、式(6)所示。
RBF核函数:
(5)
Poly 核函数:
K(xi,xj)=(xixj+1)d
(6)
式中,p是RBF核函数的指数,d为Poly核函数的阶数。通过应用拉格朗日函数将最优化问题转换成凸二次规划问题进行求解:
(7)
(8)
式中,αi、αi*为拉格朗日函数乘子。
2 特征提取
从轴承振动信号中提取并用于剩余使用寿命预测的特征可以分为三类:时域特征,频域特征和时频域特征。其中,常用的时域特征包括均值,方差,RMS,波峰因数和峰度[12]。时域特征指标可以直观反映轴承退化的一般趋势,但对降级小变化过程不能很好地反映,而且容易噪声信号干扰,影响预测结果。除了时域特征外,轴承的振动信号分析还常使用频率特性方差和频谱RMS两个频域特征。频域特征适用于固定信号处理,广泛应用于轴承故障诊断研究。时域特征适用于非线性信号处理,具体的物理含义都可以用公式来表示,也被广泛地用于在轴承的剩余使用寿命预测研究中。一组合理有效的振动信号特征指标对轴承剩余使用寿命的预测结果至关重要。本文选用时域特征和频域特征作为ANN模型的输入特征。
2.1 时域特征
时域信号特征可以有效反映滚动轴承的衰退过程和故障信息。考虑到信息表示性和信息维度之间的平衡,本文使用均方根XRMS,峰值因数XCrest和峰度XKurtosis作为时域特征,其公式表达式如下:
(9)
(10)
(11)
其中,x(i)是一系列振动信号,n是指振动信号数据点的数量。
2.2 频域特征
轴承在整个生命周期的衰退特性随时间变化而变化,但不同衰退阶段所反映的轴承健康状态不同,而时域特征不足以反映出信号频率。因此,时域特征不能完全反映轴承的衰退过程,为了从监测的轴承振动信号中提取反映全生命周期的信息,定义了一个名为频谱分区求和(FSPS)的新频域特征[12]。给定一系列振动信号x(i),其中i=1,2, …n。XFSPS(k)是指振动信号x(i)通过傅里叶变换后得到频谱(s(j)),再对频谱进行求和获得的特征,其中j=1,2,…,n。频谱分区求和特征计算公式如下:
(12)
其中,k=1,2 …n。值得注意的是新定义的频域特征XFSPS(k)是一维向量,由k个元素组成,k是一个经验参数,通常由具体领域问题决定。
3 轴承剩余寿命预测实验
3.1 实验数据说明
本实验中使用的数据来自法国FEMTO-ST研究所提供的IEEE PHM2012预测试验数据[13]。实验设备如图2所示,该设备的主要作用是提供滚动轴承全生命周期的实验数据。
图2 PRONOSTIA实验平台
该平台收集每个轴承整个寿命周期的相关信息,主要是水平方向(X方向)和垂直方向上的振动信号(Y)方向)。所有轴承材料、规格、技术等都是相同的,没有初始缺陷。加速寿命降级实验允许轴承在数小时内完成生命周期退化过程。收集数据的时间间隔是10 s,收集数据的时间是0.1 s。采样频率为25.6 kHz,每次采样将有2 560个采样点,存储在csv文件中。振动信号的振幅超过20g,轴承就会被认为失效。如图3所示显示了轴承全寿命振动原始信号。
图3 轴承全生命周期实验振动原始信号
由上述可知,采用均方根、波峰因素、峰度以及频域特征FSPS指数可以提取出轴承从运行到故障过程的有效退化信息。考虑到轴承剩余使用寿命预测问题的特性,将频域特征FSPS的经验参数k设置为6[12]。图4表现了一个测试轴承的RMSE曲线,从曲线可以大致看出轴承的衰退过程。
图4 一个测试轴承的RMSE曲线
3.2 模型评价标准
平均绝对误差eMAE和均方根误差eRMSE是两个常用的评估所提模型性能的指标,数学表达式如下:
(13)
(14)
3.3 实验结果与分析
本文采用9维向量来表示轴承的振动信号特征,其中有3维时域特征6维频域特征,由于数据集中的振动信号数据是从垂直方向和水平方向上收集的,故输入到模型的数据为18维。此外,为了进行轴承剩余使用寿命预测实验,将预处理的数据分为训练集和测试集,采用十折交叉对预处理数据集进行划分,随机生成的测试集占整个数据集10%、训练集占90%。
本文构建了一个全连接人工神经网络,用于对轴承的衰退特征做抽取,ANN模型的输入层完全连接到第一隐层,同样规则,第二隐层完全连接到第一隐层,直到输出层。 ANN由8个具有不同数量神经元的隐藏层组成(300,200,150,100,80,50,30,1)。ANN输出层输出18维特征,作为SVM模型的输入,设置相关参数,对ANN和SVM融合模型进行训练。本文使用4个轴承数据进行预测验证。实验结果如图5所示,黑色离散点表示预测结果(预测值),灰线表示测试数据上观察到的实际使用寿命(真实值)。预测的剩余使用寿命也与观察到的数据吻合良好,特别是对于轴承4。
(a) 轴承1预测值与真实值 (b) 轴承2预测值与真实值
(c) 轴承3预测值与真实值 (d) 轴承4预测值与真实值图5 基于ANN和SVM融合模型的轴承剩余寿命预测
本文将ANN和SVM融合模型方法的预测结果与常用的模型进行比较,比较结果如图6所示。本文提出的方法在验证集上的MAE和RMSE均取得最好的结果。
图6 不同模型预测的MAE和RMSE值对比
4 结论
随着现代制造业信息化、智能化的不断发展,轴承的健康分析和寿命预测成为了越来越重要的研究领域。为了提高轴承剩余寿命预测精度,本文提出了一种基于ANN和SVM融合模型方法。通过提取反映轴承运行状态的3个时域特征和6个频域特征,并应用构建的人工神经网络对特征进行抽取后输入到SVM模型预测剩余寿命。通过在实际的数据集上进行实验分析,本文所提出的方法与几种常见的预测方法相比,具有更高的预测精度。