APP下载

基于Pearson-KPCA和LSTM的伺服电机滚动轴承剩余寿命预测

2023-08-17李子涵张营左洪福

机床与液压 2023年14期
关键词:皮尔逊伺服电机频域

李子涵,张营,,左洪福

(1.南京林业大学汽车与交通工程学院,江苏南京 210037;2.南京航空航天大学民航学院,江苏南京 211106)

0 前言

轴承在伺服电机中起到了至关重要的作用,轴承故障是伺服电机故障的主要原因之一。轴承本身就是易损部件,尤其在经过长期高强度的运行之后很容易发生故障,进而影响伺服电机的性能[1]。因此,滚动轴承的早期故障诊断和寿命预测对伺服电机的预测维护和工业安全运行具有重要意义[2-5]。

现有的故障预测方法可分为三大类:物理模型预测法、数据驱动模型预测法以及物理模型数据驱动模型混合预测法[6]。其中数据驱动方法在机械设备的寿命预测中应用较为广泛;WANG等[7]提出了基于PCA和多传感器物联网的滚动轴承状态健康监测与寿命预测研究,并利用IMS滚动轴承试验数据验证其有效性。马云飞等[8]通过改进小波包频带稀疏编码对滚动轴承进行寿命预测。王奉涛等[9]基于LSTM网络对滚动轴承进行了寿命预测分析,长短期记忆网络通过改变隐藏层结构可有效解决RNN中的梯度消失与梯度爆炸问题[10]。张成龙等[11]基于改进后的PSO-SVR算法对滚动轴承RUL(Remaining Useful Life)进行预测。 ZHU等[12]利用隐马尔可夫模型有效验证了转移剩余使用寿命(RUL )预测的有效性。由于轴承的退化过程易受到外界因素干扰,因此,同一轴承模型的不同部件,即使在相同工况下,其退化过程也有可能具有不同的数据分布特征[13]。此外大部分特征指标并不能清晰地表征轴承的运行状态且容易忽略原始特征之间的联系,容易导致预测精度较差等问题[14]。

针对上述问题,本文作者提出一种基于皮尔逊相关系数(Pearson)和核主成分分析(KPCA)的LSTM滚动轴承RUL预测方法,首先提取了轴承原始全寿命周期的时、频域特征,在融合之前对所提取的时、频域信息进行皮尔逊相关性分析,在此基础上采用KPCA 进行特征融合、凝练特征,获得信息互补精简的特征[15]。将KPCA提取的若干主成分及对应的剩余寿命序列输入到LSTM中对滚动轴承进行寿命预测。最后,通过IMS轴承数据集验证了该方法的有效性和准确性。

1 轴承性能退化评估指标的建立

1.1 时、频域特征提取

时域信号具有直观、易于理解的特点,是机械故障诊断与预测的原始依据[15]。因此本文作者获取了12个时域特征:方差、均方值、均方根值、偏度、峭度、峰峰值、波形指标、裕度指标、峰值指标、脉冲指数、最大值、最小值。

频域分析常被应用于轴承振动信号处理,轴承健康状态的变化会在频率上表现出来[15]。不同的频域分析指标反映轴承运转状态的不同方面,因此,本文作者提取了4个频域特征:频率方差、频率均方根、平均频率、中心频率。时、频域信号提取如图1所示。

图1 时、频域信号提取

1.2 皮尔逊相关系数(Pearson)

皮尔逊相关系数最初是在统计学领域用来解读两个变量之间的相关性,被广泛用于衡量两个变量之间的相关性[15]。皮尔逊相关系数计算公式如(1)所示:

(1)

其中:Corr(X,T)表特征X与特征T之间的相关性。因为提取了16个不同类型轴承振动信号特征,所以每个特征需要与其他15个特征计算一次相关性,记第一个特征与第二个特征相关性为r1.2,最终将会得到一个 16×16 的特征评价矩阵,如公式(2)所示:

(2)

1.3 核主成分分析(KPCA)

主成分分析是一种从高维数据集中提取内在结构的强大技术(Bishop,1995)。然而,主成分分析是一种线性技术,无法捕捉数据集中的非线性结构。因此,人们提出了非线性泛化,特别是基于核理论的KPCA,用于计算非线性映射到高维特征空间的数据集的主成分。KPCA是一种非线性PCA方法。KPCA的实现过程为:首先使用非线性映射将所有样本转换到新空间;然后在新空间中进行主成分分析,并在新空间中提取样本的低维特征。

假设向量x1,x2,…,xN,训练样本已通过非线性函数φ。因此,可以使用φ(x1),…,φ(xN)表示特征空间中的训练样本。如果特征空间中的样本具有零均值,则协方差矩阵为

(3)

引用Γ(φ)作为特征空间的生成矩阵。根据PCA方法,特征空间中最有用的特征向量应该是Γ(φ)的大特征值对应的特征向量。最有用的特征向量应该是Γ(φ)的大λi对应的解μi,ui=λiμi。利用核函数k(xi,xj)表示点积,即k(xi,xj)=φ(xi)Tφ(xj),可以得到如下特征值方程:

Kα=λα

(4)

K是所谓的克矩阵,它有一个元素Kij=k(xi,xj),α是特征向量。基于特征值式(4)的主成分分析方法称为KPCA。

1.4 长短时记忆神经网络

针对梯度消失和RNN不能解决长期依赖问题,选择长短时记忆网络(LSTM)。LSTM的特点是用内存模块替换普通的隐藏节点,保证梯度在大量时间步长后不会消失或爆炸,并能保持长期信息。LSTM网络由多个LSTM单元链接组成,典型的LSTM单元包括写入记忆、从记忆中读取、重置记忆三大主要功能。LSTM作为一种非线性模型,也可以作为网络中的复杂非线性元素来构建更大的深度神经网络。此外,在训练阶段加入dropout以避免过拟合,提高计算效率。LSTM网络的核心思想为门控逻辑,公式(5)—(9)表示了LSTM单元中3个控制门(遗忘门、记忆门、输出门)的操作:

ft=σ(wf×[ht-1,xt]+bf)

(5)

it=σ(wi×[ht-1,xt]+bi)

(6)

(7)

Ot=σ(Wo×[ht-1,xt]+bO)

(8)

ht=Ot×tanh(Ct)

(9)

式(5)中:ft是遗忘门;wf是遗忘的权重项;bf是偏差项。公式(6)—(7)为输入门;公式(8)—(9)为输出门。Ot由输出门获得,ht为隐藏层的输出,在LSTM中采用sigmoid函数作为激励函数,具体函数公式如(10)所示:

(10)

LSTM的基本结构单元如图2所示。

图2 LSTM基本结构单元

2 预测方法及具体操作步骤

为了基于实际信号预测伺服电机滚动轴承的剩余寿命,提出一种基于皮尔逊相关系数(Pearson)和核主成分分析(KPCA)的LSTM伺服电机滚动轴承寿命预测。图3为Pearson-KPCA-LSTM预测模型流程。

图3 Pearson-KPCA-LSTM预测模型流程

(1)提取原始轴承全寿命周期的时、频域信号。

(2)利用移动平均法(MA)对时、频域信号进行平滑处理并进一步提取特征信息。

(3)将平滑后的特征信号利用皮尔逊相关系数遍历选取高度相关的特征值。

(4)将高度相关的特征值利用核主成分分析(KPCA)降维并选取若干主成分,通过第一主成分选取对应的剩余寿命序列作为测试集对滚动轴承进行RUL预测,利用第一主成分作为LSTM模型的输入并在LSTM中加入Dropout防止过拟合。

(5)二阶多项式拟合。

3 实验仿真与结果分析

3.1 数据集描述

此次实验数据来自美国国家科学基金会NSF I/UCR智能维修系统中心(IMS)进行的轴承失效测试。实验间隔20 min采集一次数据,采样频率为20 kHz,驱动电机转速为2 000 r/min,采样点为4 096,一共984组数据,共获得3组单独的轴承寿命实验数据[16],每组数据都表示一个轴承从完好到失效的状态。其中数据集2中的轴承1出现外圈故障。实验设备如图4所示。

图4 实验装置

3.2 滚动轴承RUL预测

首先提取了轴承原始全寿命周期的时、频域共计16个信号,通过移动平均法(MA)对所提取的时、频域信号进行平滑处理,可以看出平滑后的特征信号特征趋势更为明显。图5为部分用移动平均法(MA)平滑过后的特征信号。

图5 MA平滑后的时、频域信号

由于时域中的无量纲指标过于嘈杂,部分特征值对早期故障不敏感以及无性能退化趋势体现[17],且原始特征集中存在一些单调性不好和反映性能退化过程相对效果差的特征,因此需要对原始特征集进行特征筛选[18]。利用皮尔逊相关系数对平滑后的16个特征信号进行相关性分析,通过皮尔逊相关系数分析得出相关系数矩阵并得出高度相关特征图(见图6)。一般情况下,相关性r的取值在(-1,1)之间,其中当相关性|r|≥0.8时,视为高度相关[15]。通过设定阈值为0.8选取了方差、均方值、最大值、最小值、均方根值、峰峰值、频率方差7个高度相关特征指标。表1为高度相关系数矩阵。

表1 相关系数矩阵

图6 高度相关特征图

利用核主成分分析(KPCA)对所选取的9个高维特征进行加权融合和降维处理,并选取若干主成分,其各主成分的贡献率如表2所示。根据各主成分的贡献率可得出第一主成分包含了轴承全面的退化信息,因此选取第一主成分作为LSTM模型的输入。第一主成分如图7所示。

表2 各主成分贡献率

图7 第一主成分

根据第一主成分分析,其后500个点上升趋势较为明显,因此选取第一主成分后500个点及其对应的剩余寿命序列作为测试集输入到LSTM中并预测滚动轴承的RUL。

在LSTM中加入 dropout防止过拟合,文中的dropout比率设置为0.2。为更好地反映滚动轴承RUL,设定0-1直线为轴承的理想退化趋势,其中0表示轴承处于健康状态,1代表轴承发生故障。图8为轴承的RUL预测曲线,可看出:预测值围绕着理想退化趋势上下波动。

图8 滚动轴承RUL曲线

为了直观反映被测轴承的剩余使用寿命,通过二阶多项式拟合对所得预测曲线进行拟合。从图9可以看出:拟合曲线与理想退化趋势相比十分逼近,表明了该模型对伺服电机滚动轴承剩余使用寿命预测的有效性。

图9 RUL二次拟合曲线

3.3 模型评估与误差分析

为验证文中提出的模型的准确性,采用RMSE和R2作为评估指标对滚动轴承RUL预测结果进行评价。将最终得到的实验结果与LSTM和BP神经网络对比,如表3所示。评估公式如下:

表3 实验结果对比

(11)

(12)

通过对比可以看出:所提出的预测方法较LSTM和BP神经网络相比有更高的精度,为伺服电机滚动轴承零件剩余寿命预测提供一种新思路[19]。

4 结论

(1)由于单一的特征难以真实反映轴承的性能退化状态且为避免忽略原始特征之间的联系,本文作者提取了滚动轴承的16个时、频域特征指标,通过皮尔逊相关系数遍历选取了9个高度相关的特征指标,利用核主成分分析对所提取的9个高度相关特征指标进行降维,降维后的主成分能充分表征轴承性能退化过程。

(2)在LSTM中加入dropout可有效防止过拟合,通过IMS数据集验证了该方法的可行性。与LSTM及BP神经网络的对比结果表明,该方法的预测精度更高且具有更小的预测误差。

猜你喜欢

皮尔逊伺服电机频域
专利名称:一种适应压铸环境的伺服电机
现代统计学之父:卡尔·皮尔逊
现代统计学之父:卡尔·皮尔逊
Excel在水文学教学中的应用
生产线中的伺服电机定位控制
卡方分布的探源
频域稀疏毫米波人体安检成像处理和快速成像稀疏阵列设计
伺服电机控制技术的应用及发展趋向分析
浅说伺服电机位置控制下的定位问题
基于改进Radon-Wigner变换的目标和拖曳式诱饵频域分离