APP下载

特征选择与t-SNE 结合的滚动轴承故障诊断

2023-12-07殷秀丽谢丽蓉杨欢段智峰

机械科学与技术 2023年11期
关键词:峭度降维分量

殷秀丽,谢丽蓉,杨欢 , ,段智峰

(1.新疆大学 可再生能源发电与并网技术教育部工程研究中心,乌鲁木齐 830047;2.清华大学 电力系统及发电设备控制和仿真国家重点实验室,北京 100084)

滚动轴承的故障诊断在生产实际中至关重要,以振动信号分解为基础的故障诊断技术日趋成熟[1]。Huang 等[2]提出了希尔伯特-黄变换(Hilbert-Huang transform,HHT)算法,其中的经验模态分解(Empirical mode decomposition,EMD)算法被广泛用来分解各种振动信号,尤其是机械振动信号。EMD 算法较小波变换(Wavelet transform,WT)等其他信号分解方法更具灵活性[3],可根据信号的内在特性进行自适应分解,但也存在诸如模态混叠、端点效应和缺乏严格的数学理论基础等缺点。为了解决模态混叠问题,Wu 等[4]提出了改进的EMD 方法,即集合经验模态分解(Ensemble EMD,EEMD),其原理是通过添加高斯白噪声辅助分析,使信号在表征不同尺度上具有连续性[5]。

信号分解与特征提取方面,提出一种EEMD、近似熵和混合粒子群优化BP 神经网络的诊断方法,将本征模态函数(Intrinsic mode functions,IMF)的近似熵构成特征向量对故障识别[6]。关于轴承早期故障监测问题,文献提出了一种EEMD 分解与时域、能量熵相结合,并用遗传算法优化支持向量机分类的方法进行故障诊断;文献[7]采用EEMD 与线性规划结合的方法选出敏感的IMF 分量,对轴承寿命进行了预测;文献[8]提出EEMD 与奇异值熵判据的方法诊断轴承故障。上述文献表明了EEMD 方法对故障振动信号分解的优势。

时频域特征提取和降维方面,文献[9]提出利用EMD 与联合相似对角化的滚动轴承故障诊断方法,对相关特征矩阵降维,达到了较高的诊断精度;文献[10]采用相同的分解方法和改进的马田系统对滚动轴承故障进行诊断,引入粗糙集(Rough set,RS)降低特征变量的维数,该方法能够有效地识别故障类型。文献[11]提出采用EEMD 分解故障信号,采用主成分分析降维提取的样本熵和模糊熵特征,提高了故障诊断效率。以上文献中的降维方法提出较早,不能保持低维特征的信号结构。

EMD 分解算法能对不同故障类型信号表现出不同的特性,但算法自身的模态混叠等弊端限制了其的分解准确性。特征提取及降维方面,目前的方法大多是提取IMF 信号的熵值或者采用线性降维法对时域频域特征矩阵降维,可能导致过拟合等问题。近年提出的t-SNE 流形学习算法能对降维后的矩阵可视化,且能在低维数据中尽可能地保留高维数据的信号结构。文献[12]采用集成KPCA 和t-SNE 结合的方法诊断轴承故障。文献[13]结合VMD 与t-SNE 诊断轴承故障。

因此,针对滚动轴承故障诊断准确度问题,本文提出一种EEMD 分解、时频域特征提取和t-分布邻域嵌入(t-distributed stochastic neighbor embedding,t-SNE)流形学习结合的诊断方法。采用EEMD 分解故障信号,利用峭度准则筛选有效IMF 分量并重构信号;提取重构信号的高维时频域特征矩阵,采用t-SNE 对矩阵降维,降维后输入粒子群优化的最小二乘支持向量机中,对故障信号进行诊断。通过美国凯斯西储大学与MFPT 滚动轴承故障信号分析验证该方法的可行性和准确性。

1 EEMD 与t-SNE 的故障诊断思路图

故障诊断总体思路如图1 所示。

图1 基于EEMD 和t-SNE 算法的滚动轴承故障诊断总体思路图Fig.1 General idea diagram of rolling bearing fault diagnosis based on EEMD and t-SNE algorithm

2 故障状态信号的分解与重构

2.1 EEMD 算法分解故障信号

经验模态分解EMD 算法可将复杂信号自适应地分解为一系列本征模态函数之和,通过将合适的IMF 分量重构可实现信号的降噪,由于其分解结果依赖于信号本身,较适用于非线性、非平稳过程的故障信号处理[14],改进的经验模态分解方法即集合经验模态分解可有效抑制EMD 分解的缺点。

EEMD 分解的本质是一种叠加高斯白噪声的多次EMD 分解,EEMD 分解算法具体步骤如下[15](文中参数N与标准差的数值均参考文献[10]):

1)设定总体平均次数N及加入高斯白噪声;

2)在故障信号x(t)中加入均值为0、标准差为常数、同等幅值、频率均匀分布的高斯白噪声gi(t),即

3)对xi(t)使用EMD 分解,获得若干IMF 分量aij(t)与 1 个残余分量ri(t), 其中ai j(t)为 第i次加入高斯白噪声后EMD 分解的第j个IMF 分量;

4)重复步骤2) ~ 3)M次,将所得的IMF 分量总体平均,消除加入不同高斯白噪声的影响,得最终的IMF 分量为

式中aj(t)表 示被EEMD 分解的第j个IMF 分量。

2.2 峭度准则重构信号

峭度是反映随机变量分布特性的无量纲数值统计量[16]。当K≈ 3 时,正态分布曲线具有正常的峰度(即零峭度);当K>3时,称为正峭度;反之,当K<3时,称为负峭度。峭度表达式为

式中: µ为信号x的均值; σ为信号x的标准差。

峭度指标可用来判断振动信号的峰度大小,且与产生振动信号的物体本身因素无关。当峭度值的绝对值大于3 时,表明信号冲击大,振动偏离正常状态,此特性适合故障发生时对信号的识别。

3 t-SNE 提取和降维时频域特征矩阵

3.1 时频域特征提取

轴承振动信号的时域特征能反应轴承的总体状态,用于故障检测和趋势预报;频域特征能用于确定故障类型、原因和部位,时频域特征信息的结合能够准确的判断出滚动轴承当前的状态。

本文选取了多种时、频域特征参数[17-18]构成故障信息特征矩阵,其中时域特征参数分为有量纲参数和无量纲参数,具体如表1 所示。

表1 特征参数分类Tab.1 Characteristic parameter classification

特征矩阵的提取是轴承状态识别的重要步骤之一,提取出对轴承本身健康状态变化敏感的时频域参数,是滚动轴承识别诊断的关键[19]。但在轴承诊断的实际应用中,某个特征参数可能只对某一类故障比较敏感,故在提取特征参数之后,需要对所有参数进行筛选,选择出适合的特征参数。

3.2 t-SNE 算法

t-分布邻域嵌入(t-SNE)[20]算法是由学者Laurens 和Geoffrey 于2008 年提出的一种非监督、非线性的流形学习降维算法,其是由随机邻域嵌入(Stochastic neighbor embedding, SNE)算法改进而来。SNE 方法是通过仿射变换将数据点映射到概率分布上,主要包括以下两点:

1)构建一个高维数据之间的概率分布,使得相似的数据以较高的概率被选择、不相似的数据以较低的概率被选择;

2)构建一个低维空间中点的概率分布,使得这两个概率分布之间尽可能相似。

SNE 算法是将欧几里得距离转换为条件概率来表达点与点的相似度,但有不对称导致梯度计算复杂、拥挤问题和只关注局部性数据等缺点。针对拥挤问题,引入t分 布,t分布是一种长尾分布,尾部较高,对异常点不敏感,具有很好的鲁棒性,拟合结果更为合理,能较好捕获数据的整体特征。t-SNE 与SNE 有以下两方面的不同:

1)t-SNE 使用与SNE 对称的成本函数,简化梯度公式;

2)高维空间下,使用高斯分布将距离转换为概率分布;低维空间下,使用t分布替代高斯分布表达两点的相似度。

t-SNE 算法步骤如下:

步骤1 输入n个高维数据X={x1,x2,···,xn},设置成本函数参数困惑度Perp;

步骤2 初始化迭代次数、学习率和动量,计算高维数据中xi和xj两两间的条件概率分布pj|i和pi|j:

式中 σi为 对应数据点xi的高斯分布方差。

步骤3 设置联合概率分布pij,获取低维样本随机初始解y(0)为:

步骤4 计算t分布中低维样本空间点的联合分布qi j为

步骤7 循环迭代步骤4 ~ 步骤6,直到得到低维数据y(T)={y1,y2,···,yn},t∈[1,T]。

4 案例分析

4.1 西储大学轴承数据的算例分析

实验数据验证采用美国凯斯西储大学轴承状态数据,该试验平台由一个1.5 kW(2 马力)的电动机、一个扭转传感器、一个功率测试计以及电子控制器组成。待检测的轴承支撑着电动机的转轴,轴承型号为6205-2RS JEM SKF,采用电火花加工单点损伤,损伤直径为0.177 8 mm,振动信号由16 通道数据记录仪器采集得到,采样频率为12 kHz。

采集到的轴承状态分别为健康信号状态、内圈故障状态、外圈故障状态及滚动体故障状态,每种样本状态共30 组数据,每组数据1 024 个点。30 组数据分为训练组和测试组,训练组20 组,测试组10 组。4 种轴承状态的原始信号如图2 所示。

图2 轴承状态原始信号图Fig.2 Original signal diagram of bearing conditions

如图3 所示,滚动体故障信号经EEMD 分解为10 个IMF 分量和1 个残余分量r, IMF 分量从高频到低频依次排列。图4 中折线为分量的峭度值,峭度值越大,分量里所含的故障冲击越大,滚动体故障信号可筛选的分量为IMF1~ IMF3、IMF5~ IMF8,其他状态依次选取。图5 为去噪后的4 种轴承信号,去噪后计算出4 种状态的特征矩阵并对其进行归一化处理,结果表明信号相比去噪前幅值有所减小。文献[18]表明,t-SNE 降维的最好维度是二维和三维,能最大限度地保留原始矩阵的特征。为了说明t-SNE 降维法的优越性,本文还对比了等距特征映射(Isomap)、保持邻近嵌入(NPE)、主成分分析法(PCA)、核主成分分析法(KPCA)、高斯过程潜变量模型(GPLVM)、邻域嵌入法(SNE)等线性、非线性降维法,证明选择t-SNE 的必要性。

图3 EEMD 算法分解滚动体故障信号图Fig.3 Decomposition of rolling element fault signals with the EEMD algorithm

图4 4 种信号IMF 分量峭度值Fig.4 The kurtosis of the four signals′ IMF components

图5 去噪后4 种轴承信号Fig.5 Four kinds of bearing signal after denoising

由图6 可知,t-SNE 的降维效果最好,在二维和三维中清晰可分,LPP、PCA、Sammon mapping、SNE、NPE、KPCA 和GPLVM 在三维中不可分,4 种信号交叉混叠,二维中勉强可分,LDA 降维法在二维和三维中几乎不可分。得到低维特征矩阵后,输入分类器,各分类器分类结果对比如表2 所示。

表2 分类准确率及时间对比Tab.2 Classification accuracy and time comparison

图6 9 种典型降维算法结果对比图Fig.6 Comparison of results of nine typical dimension reduction algorithms

由表2 可知:PSO-LSSVM 的分类效果最好,能够达到100%,且分类时间短;支持向量机(SVM)和随机森林算法(RF)对故障分类的精确度不高,分类时间也较长;采用深度学习算法CNN 和LSTM 训练原始数据,时间长且准确率无法达到100%。

4.2 MFPT 轴承数据的算例分析

该轴承数据为机械故障预防技术学会(MFPT)发布的数据,包括来自轴承试验台的名义轴承数据、各种载荷下的外圈故障、内圈故障和3 个实际故障。每种状态30 组数据,训练数据和测试数据分别为20 组和10 组,每组的数据长度为1 024,如表3 所示。

表3 MFPT 轴承数据情况Tab.3 Conditions of MFPT′s bearing data

基线状态、内圈故障和外圈故障(负载250 lbf)这3 种状态的原始信号如图7 所示。

图7 MFPT 的3 种轴承状态信号图Fig.7 Three kinds of MFPT′s bearing state signals

如图8 所示,外圈信号分解为10 个IMF 分量和1 个残余分量r。图9 为3 种信号的峭度值,图10为根据图9 计算出的符合条件的分量重组的信号。

图8 EEMD 分解外圈故障信号图Fig.8 Decomposing the outer ring fault signals with the EEMD algorithm

图9 3 种信号IMF 分量峭度值Fig.9 IMF component kurtosis values of three types of signals

图10 MFPT 的3 种信号去噪信号图Fig.10 MFPT′s three kinds of denoised signals

图11 为MFPT 轴承数据3 种轴承状态特征矩阵降维后的二维和三维可视化图,由于篇幅原因,MFPT 数据只放两种降维算法的效果对比图,由图11 可以看出,t-SNE 降维法无论是在二维还是三维都清晰可分,SNE 算法在二维和三维虽勉强可分,但降维效果略弱于t-SNE 算法。低维敏感特征矩阵输入各分类器分类结果对比如表4 所示。

表4 分类准确率及时间对比Tab.4 Classification accuracy and time comparison

图11 t-SNE 和SNE 降维结果对比Fig.11 Comparison of dimensionality reduction results of t-SNE and SNE

由表4 可知:PSO-LSSVM 的分类效果相比于其他分类方法准确率能够达到100%,且用时最短;CNN、LSTM 和RF 分类法对故障的识别效果还有待提升;SVM 的分类率普遍较低,准确率只有83.33%,分类时间也较长。

5 结 论

本文提出一种EEMD 与t-SNE 算法相结合的滚动轴承故障诊断方法可以判断轴承损伤的位置,得出以下结论:

1)多维时频域特征矩阵经t-SNE 降维得到对故障敏感的特征因子,在保留了更多原始故障信息的同时,减少了分类器识别故障的时间。

2)对比分析了9 种典型降维法的二维、三维效果图,得到了具有内在规律的低维故障信息矩阵,证明了t-SNE 降维法效果最好。

3)提出的特征选择t-SNE 结合的故障识别方法,不论是对于西储大学轴承数据,或者MFPT 轴承数据,该方法的识别效果都较其他方法准确,识别率能够达到100%。

该方法对于转速恒定状态下的滚动轴承故障识别率很高,但对于变转速工况下的故障信号识别还未可知,还需进行下一步的研究和探讨。

猜你喜欢

峭度降维分量
基于MCKD和峭度的液压泵故障特征提取
混动成为降维打击的实力 东风风神皓极
帽子的分量
联合快速峭度图与变带宽包络谱峭度图的轮对轴承复合故障检测研究
降维打击
论《哈姆雷特》中良心的分量
基于峭度分析的声发射故障检测
分量
基于鲁棒性小波包峭度图的滚动轴承故障诊断*
基于瞬时对称分量法的三相四线制D-STATCOM控制研究