APP下载

采用规范化局部保持投影的轴承故障诊断方法

2019-06-13刘锐邹俊荣任超陶新民

西安交通大学学报 2019年6期
关键词:维维降维投影

刘锐,邹俊荣,任超,陶新民

(东北林业大学工程技术学院,150040,哈尔滨)

机械故障诊断是一种掌握机器运行状态、早期发现故障及其原因并能预报故障发展趋势的技术[1-2]。轴承作为机械设备的重要组成部分,其工作状态直接影响设备的性能及效率[3]。因此,为了增加设备性能的可靠性,降低由于轴承故障原因导致产量下降的可能,轴承故障诊断越来越受到人们的重视[4]。

轴承故障诊断涉及两方面技术:一是利用模式识别技术进行故障检测;二是利用信号处理技术进行特征提取[5]。在模式识别领域,常见的方法有神经网络[6-7]、支持向量机[8-9]等。在特征提取方面,主要包括:信号的时域特征如信号的均值、均方值、峰值、峭度和歪度等;信号的频域特征如能量谱、AR功率谱等[10];信号的时频特征如小波分析、Hilbert变换和短时傅里叶变换等[11-12]。为了充分表征不同类别的故障进而提高识别率,就需要多种不同特征进行融合,这也使得目前获取的特征向量呈现维度高、相关性强、冗余信息多等特点,严重影响分类器的分类精度及计算复杂度[13],因此如何有效地实现特征降维成为近年来的研究热点。主成分分析(PCA)作为数据降维的经典算法,因能有效去除特征间线性相关同时保持原始特征的主要信息而被广泛应用在图像分割、数据检测、故障检测等领域[14-15]。然而,传统的主成分分析对于去除非线性关系存在局限性且其只考虑到全局分布特征,没有充分考虑局部信息的保持,导致不同类别间区分能力的丧失进而降低故障识别率[16]。局部保持投影(LPP)是非线性方法Laplacian Eigenmap的线性近似,作为一种新的子空间分析方法,既解决了主成分分析方法难以保持原始数据非线性流形局部结构的问题,又解决了其无法去除指标间非线性相关性的问题[17]。目前,LPP算法在人脸识别、图像检索、故障检测等领域得到广泛应用[18]。然而,LPP算法需事先指定近邻个数以及热核函数的参数来确定相似度矩阵,而在现实应用中由于事先对原始数据的空间分布未知,导致参数设置变得十分困难,受不当参数设置的影响,传统LPP算法的性能严重下降。为了解决该问题,文献[19]采用Parzen窗函数自适应确定近邻值进而提出了邻域自适应局部保持投影算法(SALPP),但由于Parzen窗函数本身初始核参数以及用于相似度计算的热核函数参数仍需事先指定,因而导致该算法的性能提升并不明显。

为此,本文提出一种采用规范化LPP算法的轴承故障诊断方法。该方法采用熵规范化将相似度矩阵结合到优化函数中,与投影向量一并求解,弥补了传统LPP算法需事先指定参数的不足,提升了算法的局部空间保持能力。通过与不同降维方法在不同降维维度、不同特征集合以及不同分类算法相结合情况下进行轴承故障检测实验,结果表明本文提出的改进算法在保持不同类别间区分能力的同时有效实现了数据降维,大大提高了故障检测的精度和检测效率。

1 传统LPP算法

LPP算法作为一种新的子空间分析方法,可以较好地反映样本的流形结构,其思想是在特征降维的同时,保持数据局部结构特征不变[20-22]。

通过对传统LPP算法流程分析可发现,传统LPP算法其核心是线性近似,需事先指定近邻个数以及热核参数来求解样本空间的相近程度,从而确定相似度矩阵。然而,在现实应用中由于事先对原始数据的空间分布未知,导致参数设置变得十分困难,从而增加相似度矩阵的计算难度。受不当参数设置的影响,传统LPP算法的降维性能严重下降。

2 规范化LPP算法

为了弥补传统LPP算法受参数设置影响性能下降的不足,本文对传统LPP算法加以改进,提出一种规范化LPP算法。该算法通过采用熵规范化,将相似度矩阵U结合到优化函数中,与投影向量一并求解,无需事先设定近邻个数K以及热核参数σ,因此有效避免了传统LPP算法参数设置的问题,使得降维后的投影空间具有更高的局部空间保持能力。

2.1 规范化LPP算法求解

(1)已知数据集x1,x2,…,xn,其中xi∈Rd,i=1,2,…,n,n为样本总数,d为特征总数。设yi、yj是新基向量下的降维投影坐标,在总体样本中考虑,原来相近的样本xi、xj在新的基坐标空间中也同样相近。

(2)利用最大熵规范化方法构造求解U和投影向量WEnLPP的目标函数为

(1)

式中:uij为原有样本空间的相近程度参数;α表示调节损失项和最大熵正则项的控制权重,通常令α=1。

(3)利用拉格朗日数乘法构造拉格朗日函数,即

(2)

分别对β、uij求导,求得uij的表达式如下

uij=exp(-α‖VTxi-VTxj‖2)exp(-β-1)

(3)

(4)

将式(4)代入式(3)中,得到uij的迭代表达式

(5)

为求解标准基向量V,目标函数中的损失函数可作如下变换

(6)

将式(6)转换成矩阵形式表达如下

VTXDXTT-VTXUXT=VTXLXTV

(7)

VTXDXTV=1

(8)

(4)通过拉格朗日函数求解标准基向量V,得到的投影向量迭代表达式

(9)

XLXTV=λXXTV

(10)

2.2 规范化LPP算法迭代流程

输入:X={x1,x2,…,xn,},xi∈Rd,最大迭代次数rmax,降维维度P;

输出:投影矩阵WEnLPP。

(1)初始化带权重的邻接矩阵U(0)∈Rn×n;

(3)令r=0;

(4)构造拉普拉斯矩阵Lr=Dr-Ur求解XLrXTVr=λXXTVr特征值和特征向量集合Vr;

(5)当r>rmax时退出循环,否则

(11)

(6)r=r+1;

(7)根据Ur构造度量矩阵Dr;

(8)go to步骤(4);

(9)根据Vrmax取前P个最小的特征值λi,i=1,2,…,P,所对应的特征向量Vi,i=1,2,…,P,即为WEnLPP=[Vi,i=1,2,…,P];所对应的特征向量V即为WEnLPP=[Virmax,i=1,2,…,P]。

通过上述的迭代过程可知,经过最大熵规范化将U同投影向量一并求解后,通过上述的迭代算法(步骤4和5)反复迭代后即可求出uij的值和最终的投影向量WEnLPP,进而避免了传统LPP算法参数设置的问题。

3 采用规范化LPP算法的轴承故障诊断方法

采用规范化LPP算法的轴承故障诊断过程主要分为特征提取、特征降维和故障诊断3部分。特征提取首先将原始信号经过小波变换和经验模式两种信号预处理,得到10条信号分量,每个分量通过计算平均值、均方根等12种特征建立初始特征集,并进行归一化处理;然后将其输入规范化LPP算法中进行迭代,当满足终止条件时得到相似度矩阵及标准基向量,从而求得投影矩阵及降维后的特征集;最后使用极限学习机分类器进行故障类型的判别。具体训练过程如下。

(1)确定参数:分段长度L,小波变换层数N1,经验模式分解层数N2,降维维度P,最大迭代次数rmax。

(2)利用安装在轴承上的振动传感器收集该轴承在不同工状下的振动信号。设共有4种工况:正常状态、内圈故障状态、外圈故障状态和滚动体故障状态,然后分别对各种工况下的信号进行长度为L的分段处理,得到原信号样本集合S={s1,s2,…,sn},S∈Rn×L。

(3)通过离散小波变换对原信号样本集S进行N1层小波分解,得到1到N1层的细节分量和第N1层近似分量,共N1+1个频带分量。对原信号进行N2层经验模式分解,得到1到N2层的基本模式分量和第N2层余项,共N2+1个频带分量。

(4)分别对小波变换得到的N1+1个频带分量和经验模式分解得到的N2+1个频带分量进行特征提取,其中包括平均值、均方根、方差、标准差、整流平均值、峰-峰值、峭度值、峰值、波形、峭度、脉冲、裕度因子共12种故障特征。

(5)归一化。对选取的12(N1+N2+2)个故障特征量按照线性函数归一化的方式进行归一化处理,进而得到训练特征样本集X={x1,x2,…,xn},X∈Rn×12(N1+N2+2)。

4 实验分析及对比

为了验证采用规范化LPP的轴承故障诊断方法的检测性能,本文进行了下列实验。实验数据均来源于美国凯斯西储大学(Case Western Reserve University)的电气工程实验室[23],利用安装在感应电动机输出轴的支撑轴承上端机壳上的振动加速传感器来收集振动信号,采样频率为12 kHz。实验模拟了滚动轴承的4种运行状态:1正常状态;2内圈故障;3外圈故障;4滚动体故障。每个振动信号片段的样本点数L=1 024,每个工况下的振动信号片段如图1所示。

(a)正常状态

(b)内圈故障

(c)外圈故障

(d)滚动体故障图1 4种工况时域振动信号片段

采用DB1小波对振动信号片段进行分解层数为N1=5的小波变换并提取12维故障特征,共计6×12=72维特征,以及N2=3层经验模式分解,提取12维故障特征,共计4×12=48维特征,经特征融合后总计120维故障特征。实验环境为Windows7操作系统,CPU为Intel i7,3.4 GHz处理器,仿真软件为Matlab2010b。

4.1 规范化LPP算法降维性能分析

为了验证本文提出的规范化局部保持投影算法的降维性能,实验中取正常样本、内圈故障样本、外圈故障样本和滚动体故障样本各50个样本构成整体数据集合进行降维,并与传统LPP算法进行比较。其中,规范化局部保持投影算法的最大迭代次数rmax=300,降维维度P=2,传统LPP算法的最近邻个数为3,热核参数σ为1。为了便于比较,本文算法利用相同参数计算的邻接矩阵作为初始值,经两种算法降维后得到的数据分布情况如图2、图3所示。

图2 120维数据特征集经传统LPP算法投影到二维空间后的特征分布图

图3 120维数据特征集经本文规范化LPP算法迭代300次后投影到二维空间后的特征分布图

由图2、图3不难看出:传统LPP得到的投影特征虽然保持的局部邻域信息,相同类别的样本大部分能聚集在一起,但却没能实现内圈故障和外圈故障样本的有效区分;本文提出的规范化局部保持投影算法得到的降维数据具有明显的区分性,不仅同一类样本聚集在一起,而且不同类别的样本间实现了有效分离。

为了能量化地比较传统LPP算法和本文提出的规范化LPP算法所得到的降维特征的区分性能,本文采取基于类间分离指标(SC)的区分指标[24],Dj表示第j类样本的分离度,DC表示同一类样本的分离度,DB表示类与类之间的分离度,计算公式如下

(12)

(13)

(14)

式中:m是全体样本的均值;mj、nj是属于第j类cj所有样本的均值和个数;C是类别个数。设zSC是类间分离指标,则有

(15)

式中:tr为求解矩阵迹的函数,为了防止DC矩阵是奇异的,这里通常采用zSC=tr(DB)/tr(DC),zSC值越大,特征区分能力就越强。

为了比较在不同降维维度的情况下传统LPP算法和本文的规范化局部保持投影算法得到的降维特征的区分能力,本文采用正常样本、内圈故障样本、外圈故障样本和滚动体故障样本各500个样本,构成整体数据集合进行降维,除降维维度P外,其他参数设置同上,zSC值随不同降维维度P的变化对比结果如图4所示。

图4 传统LPP算法和本文规范化LPP算法在不同降维维度下的降维特征区分能力比较

从图4可以看出,本文的规范化局部保持投影算法在不同降维维度情况下降维性能都优于传统LPP算法,这也表明本文算法的局部近邻保持效果明显优于传统LPP算法,且投影后的系数向量在不同降维维度下均具有很好的区分能力。

为了考察不同最大迭代次数对本文规范化局部保持投影算法性能的影响,实验分析了本文算法在不同降维维度P=2,5,10下得到的特征区分能力zSC随迭代次数的变化情况,参数设置同上,实验结果如图5所示。不难发现,本文规范化LPP算法在不同降维维度下得到的降维特征的区分能力在初期随着迭代次数的增大呈现上升趋势,但随着迭代次数的进一步增大,上升趋势不再明显且逐渐呈现平坦趋势。因此,为了在保持降维性能的同时降低计算复杂度,建议最大迭代次数设置在300左右。

图5 本文规范化LPP算法在不同降维维度下的特征区分能力随迭代次数的变化

4.2 不同降维算法的分类精度对比分析

为了考察采用规范化LPP算法的轴承故障识别方法的故障诊断精度,本文分别选取1 000个正常样本、内圈故障样本、外圈故障样本和滚动体故障样本,并同传统PCA算法、传统LPP算法和自适应LPP算法(SALPP)进行对比分析。分类器采用极限学习机ELM进行故障检测。规范化LPP算法的最大迭代次数rmax=300,ELM输入单元个数为5,输出单元个数为4,隐层单元的个数为30。观察不同降维维度下采用不同降维算法的轴承故障识别方法的分类精度,通过10次交叉验证法进行实验并计算其平均值,其他参数设置同上,实验结果如图6所示。由图6可以看出,本文提出的故障诊断方法在不同降维维度下的分类性能都明显优于采用其他降维算法的轴承故障诊断方法的分类性能。该实验结果再次证明了经本文规范化LPP算法降维后的特征具有很好的区分能力。

图6 采用不同降维算法的轴承故障识别方法在不同降维维度下的分类精度对比

为了分析本文规范化LPP算法对不同特征集合的降维性能,本文采用基于小波变换的72维特征集合和经经验模式分解后的48维特征集合进行降维处理,其中降维维度为5,参数设置同上,结果如表1所示。由表1结果可知,本文提出的采用规范化LPP算法在不同特征集合下都具有较好的降维性能,使得降维特征具有较强的区分能力,从而提高了故障识别性能。

表1 不同特征集合的降维性能对比

4.3 同其他分类算法结合后的性能分析

最后,为了验证本文规范化LPP算法和其他3种算法与不同分类器相结合后的轴承故障识别性能,本文采用了支持向量机SVM(one-all)、RBF神经网(RBFNN)、多层感知机神经网(MLP)、极限学习机ELM这4种分类器进行对比实验,其中,SVM参数采用高斯核,核宽度和惩罚因子由grid-search搜索方法确定,RBF、MLP和ELM的隐层单元个数为30,降维维度为5,其他参数设置同上,实验结果如表2所示。

表2 不同算法的分类精度对比结果

通过表2的实验结果可以发现,本文算法同各种分类器算法组合后的故障诊断性能均优于其他降维算法。该实验结果进一步表明,经本文提出的规范化LPP算法降维后得的特征能有效地保持局部分布邻域信息且具有较高的区分能力,使得同其组合的分类器的检测精度大大提高。

5 结 论

本文提出一种采用规范化LPP算法的轴承故障识别方法。该算法采用熵规范化将相似度矩阵结合到优化函数中,与投影向量一并求解,无需事先指定参数,弥补了传统LPP算法需事先指定参数的不足,大大提升了算法局部保持能力,且使得降维后的特征具有较高的区分能力。实验结果表明,本文所提规范化LPP算法的降维性能明显优于其他降维方法,较好的降维特征区分能力使得本文En-LPP方法的故障诊断性能在不同条件组合下均具有很好的鲁棒性。

猜你喜欢

维维降维投影
“果然”有意思
混动成为降维打击的实力 东风风神皓极
解变分不等式的一种二次投影算法
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
基于最大相关熵的簇稀疏仿射投影算法
总是“大不了”的维维
降维打击
找投影
找投影
小熊维维的信