APP下载

基于半监督拉普拉斯特征映射的故障诊断

2016-08-09郭顺生

中国机械工程 2016年14期
关键词:特征提取故障诊断

江 丽 郭顺生

武汉理工大学,武汉,430070



基于半监督拉普拉斯特征映射的故障诊断

江丽郭顺生

武汉理工大学,武汉,430070

摘要:针对有标记故障样本不足和故障数据高维非线性的问题,提出了基于半监督拉普拉斯特征映射(LE)算法的故障诊断模型。该模型运用LE算法,直接从原始高维振动信号中提取低维流形特征,并将其输入到基于LE的半监督分类器,从而识别出机械设备的运行状态。与传统方法相比,该模型能明显提高滚动轴承和齿轮的故障识别性能。

关键词:故障诊断;特征提取;流形学习;半监督拉普拉斯特征映射

0引言

现代机械设备的故障数据往往呈现出海量、高维、非平稳性、非高斯分布和结构非线性的特征[1-4]。如何从高维非线性故障数据中,提取能反映其运行状态的低维故障特征,具有重要的理论意义和工程应用价值。

传统的非线性特征提取算法,如核主成分分析(kernel principal component analysis,KPCA)算法[5]没有考虑样本的类别信息,核判别分析(kernel discriminant analysis,KDA)算法[6]要求故障数据服从高斯分布。自组织特征映射(self organizingmaps, SOM)算法[7]计算复杂度比较高,在循环迭代寻优过程中易陷入局部极值。另外,它们大多在欧氏空间分析故障数据,不能充分挖掘蕴含在高维数据中的潜在信息。流形学习能很好地挖掘非线性数据中的潜在几何结构和内在规律,为基于数据几何结构驱动的机械故障诊断技术开辟了新思路[3-4,8-12]。

从机械设备获取大量有标记样本费时费力,但传统的机械故障分类,需要利用大量有标记样本训练分类器。另外,经典的流形学习算法,如拉普拉斯特征映射(Laplacian eigenmaps,LE)算法,大多是无监督的,在特征提取的过程中没有考虑样本的类别信息,不利于后续的故障模式分类。针对这些情况,本文在LE算法基础上,提出了一种基于半监督LE算法的故障诊断模型并应用于机械设备的故障识别。该模型直接运用LE算法,从原始的高维振动信号中提取反映故障数据内蕴几何结构的低维流形特征,随后将该特征输入到基于LE的半监督分类器中,从而识别机械设备的运行状态。

1基于LE的半监督分类

给定高维空间RD的一组观测数据集X=[x1x2…xN],xi∈RD,N为观测数据集中样本总数。假设其在低维嵌入空间Rd上的映射数据集Y=[y1y2…yN],yi∈Rd,d≪D。

1.1LE算法

LE算法[13]是一种基于谱图理论的局部非线性特征提取和降维方法,其基本思想是:在高维空间中离得很近的点,投影到低维流形上也应该离得很近,即保持投影前后局部近邻关系不变。该算法利用Laplace-Beltrami算子(定义为流形切空间上梯度向量的负散度函数),将两点间的加权距离作为损失函数,通过求解图拉普拉斯算子的广义特征值来实现流形的最优嵌入。其算法流程如下:

(1)构造近邻图G。计算数据集X中所有样本点对之间的欧氏距离,根据k-近邻法,确定每个样本点的k个近邻点,如果样本点xi和xj是近邻点,那么这两个点在图G上有边连接,否则断开。

(2)构建邻接权值矩阵W=[Wij]。根据样本点对之间的近邻关系,其邻接权值定义如下:

(1)

(3)计算低维嵌入。嵌入空间的代价函数定义为

(2)

1.2基于拉普拉斯特征映射的分类器

假设数据集X的前M个样本的类别标签为ci,其中M

(3)

式(3)的解可表示为

(4)

Elab=[eji]d×Mc=(c1,c2,…,cM)其中,eji为已标记样本利用Le=λDe进行拉普拉斯特征映射后,d个最小特征值对应的特征向量。

根据式(3)、式(4)构造的分类器对未标记样本xi(i=M+1,M+2,…,N-1)进行分类,其类别标签判别如下:

(5)

2基于半监督LE算法的故障诊断模型

如图1所示,本文提出的基于半监督LE算法的故障诊断模型的基本思想是:根据机械设备不同类型的故障样本在高维空间中呈现出的不同流形拓扑结构,采用LE算法,直接学习机械设备的原始高维故障信息,提取故障数据的潜在低维流形特征。随后,将该低维特征输入到基于LE的半监督分类器中,利用大量廉价的未标记故障样本学习出故障数据的潜在流形结构。然后通过少量昂贵的有标记故障样本学习出整个流形上的类别信息,从而识别机械设备的工作状态和故障类型。该算法的故障诊断过程如下:

(1)数据采集。从故障设备上采集多种运行状态下的振动信号,采用最小值-最大值标准化法对信号进行归一化预处理后,得到一个由原始振动时间序列构建的高维模式空间。

(2)运用LE算法提取低维流形特征。采用LE算法直接对高维模式空间中的故障样本进行流形学习,挖掘原始高维振动信号中的潜在几何结构,提取反映故障本质的低维流形特征,并将原始高维样本映射到一个低维的特征空间。

(3)故障分类。将特征空间中的低维流形特征分成两部分,将将有标记的特征作为训练样本(有标记样本),将未标记的特征作为测试样本(未标记样本)。依据少量昂贵的有标记样本训练出基于LE的半监督分类器,从而构造一个类别空间,并将大量廉价的未标记样本输入该类别空间进行故障分类,找出故障原因。

图1 基于半监督LE算法的故障诊断模型

本模型由于采用LE算法,因而选择合适的嵌入维数d和近邻点数k,对低维流形的构建和最终的故障诊断精度至关重要。根据文献[15-16]的研究结果,本文最优的嵌入维数d=C-1,并根据最高的故障识别精度来选取最优的近邻点数k。

3故障诊断实验

滚动轴承和齿轮广泛应用于支撑国民经济的现代机械设备中,其运行状态往往直接影响到整台机器的可靠性。因此,实验采用美国Case Western Reserve University电气工程实验室的滚动轴承故障数据[17]和布鲁塞尔自由大学的齿轮箱试验数据[18]来验证本文提出方法的有效性。同时,将其与经典的模式识别方法,如KPCA+KNN算法、KDA+KNN算法以及LE+ KNN算法进行了比较。这3种经典的模式识别算法的故障诊断过程为:分别采用KPCA算法、KDA算法或者LE算法,从原始的高维振动信号中提取低维故障特征后,再采用K近邻(K-nearest neighbor,KNN)分类器进行故障模式分类。通过五折交叉验证,分别确定KPCA算法和KDA算法对应的最佳核(本文全部选用RBF核函数)宽度σ。

3.1滚动轴承故障识别

滚动轴承实验台由1个1491.4 W的三相电动机、1个扭矩传感器和1个加载电机组成。待测试的滚动轴承(型号为6205-2RS JEM SKF)安装在电动机的驱动端,加速度传感器粘贴于电动机驱动端正上方的机壳上。故障轴承的振动数据由一个16通道的数据记录仪(采样率为12 kHz)获取。模拟了滚动轴承的 4 种故障状态:①正常运行状态(转速为1797 r/min,工作载荷为0);②内圈严重故障(转速为1772 r/min,工作载荷为745.7 W);③滚动体严重故障(转速为1750 r/min,工作载荷为1491.4 W);④外圈严重故障(转速为1730 r/min,工作载荷为2237.1 W)。后3种故障状态的损伤直径均为0.54 mm。分别采集这4种故障状态的振动信号后,每种状态选取100个故障样本,每个故障样本均包含1024个采样点,从而构建了一个1024维的模式空间,得到N×D=(4×100)×1024的高维故障样本矩阵。根据第2章的方法,确定LE算法对应的嵌入维数d=3。

原始高维振动数据的低维可视化表示,有助于直观地识别故障设备的运行状态。因此,当有标记样本数目为10时,采用LE算法(近邻点数k=5)直接对由原始振动信号构建的1024维故障样本提取低维流形特征,并与KPCA算法和KDA算法(核宽度σ分别为10和3)进行比较,图2所示为90个未标记样本的前两个主分量(原始高维样本提取低维特征后所得到的前两个低维特征)对应的可视化结果。如图2所示,因为滚动体故障和正常状态这两类样本的聚类性太差,因此KPCA算法不能完全区分这四类故障;虽然KDA特征有很好的聚类效果,但滚动体故障和正常状态这两类样本的分界面不太清晰;相比而言,LE特征表现出较好的分离性能和聚类效果,能更好地表达和区分轴承的故障状态。

(a)LE算法

(b)KPCA算法

(c)KDA算法

图2不同算法的低维映射结果

为了进一步验证基于半监督LE算法的智能诊断模型的有效性,考察了不同数目的未标记样本对其故障识别性能的影响,每类未标记样本数目以步长为10,在区间[10,90]递增变化,相应的剩余样本为有标记样本。不同数目的未标记故障样本在4种算法下对应的故障识别精度见图3,其对应的参数设置见表1。从图3可以看出,当每类未标记样本数目不超过70时,KDA+KNN算法的故障识别性能要优于KPCA+KNN算法。虽然每类未标记样本数目不超过40时,KPCA+KNN算法的故障识别性能比较接近本文提出的方法,但是每类未标记样本数目为90时,其故障识别精度不到60%。尽管LE+KNN算法的故障识别精度要高于前面两种算法,但每类未标记样本数目为90时,其故障识别率要略低于95%。另外,这3种经典的模式识别算法的故障识别精度,基本上都是随着未标记样本数目的增加而降低。相比之下,本文提出的方法比较稳定,对于不同数目的未标记样本,一直保持100%的分类精度。可见,基于全局结构的KPCA算法和KDA算法都不能很好挖掘故障轴承的潜在信息;基于局部结构保持特性的LE算法虽能很好地从故障轴承的高维振动信号中提取最具代表性的低维流形特征,然而基于监督分类的KNN分类器仅利用了少量标记样本,容易引起过拟合,降低分类精度;本文提出的基于半监督LE算法的故障诊断模型,不仅能很好地从故障轴承的高维振动信号中挖掘低维流形的潜在几何分布规律,而且大量未标记样本有助于少量标记样本学习出整个流形上的类别信息,因而该模型具有更好的分类能力。

图3 4种算法对应的最高故障识别精度

有标记样本数目KPCA(d=20)KDA(d=3)LE(d=3)半监督LE(d=3)10σ=10σ=3k=5k=520σ=5σ=3k=5k=830σ=5σ=3k=4k=840σ=5σ=3k=5k=550σ=5σ=3k=8k=560σ=5σ=3k=5k=570σ=5σ=3k=4k=880σ=5σ=3k=5k=590σ=5σ=3k=5k=5

3.2齿轮故障识别

实验采用齿数比为41∶37、模数为5 mm的低碳钢斜齿轮副,齿轮箱信号采集装置如图4所示。待测试对象为41齿的斜齿轮,其输入扭矩为80 N·m,齿轮轴转频为10 Hz,其振动加速度信号由垂直固定在箱体外轴承座上的压电式加速度传感器拾取,采样频率为10 kHz。实验模拟了该齿轮的3种故障状态(正常状态、齿面点蚀、齿面磨损)。分别采集这3种故障状态的振动信号后,每种状态选取35个故障样本,每个故障样本均包含1024个采样点,从而构建了一个1024维的模式空间,得到N×D=(3×35)×1024的高维故障样本矩阵。根据第2章的方法,确定LE算法对应的嵌入维数d=2。

图4 齿轮箱信号采集装置

当有标记样本数目为5时,分别采用LE算法(近邻点数k=5)、KPCA算法和KDA算法(核宽度σ分别为1和8)进行特征提取,30个未标记样本的低维可视化结果如图5所示,可知LE特征的3类故障样本分别聚集于一点,并具有清晰的分类边界。相比而言,KPCA特征和KDA特征的聚类性太差,3类故障样本之间存在交叉区域,因而它们完全不能分辨出3类故障。每类未标记样本数目为30时,不同数目的有标记故障样本在4种算法下对应的故障识别精度及其对应的参数设置见表2。随着有标记样本数目的增加,4种算法的故障识别率都不断提高。然而,对于不同数目的有标记样本,基于全局结构的KDA+KNN算法和KPCA+KNN算法的故障识别精度均远低于其余两种基于局部流形结构保持的算法。另外,当有标记样本数目相同时,基于半监督LE算法的故障识别率均高于LE+ KNN算法,可见,半监督学习的引入,提高了LE算法的故障识别精度。因此,相对其他3种算法而言,本文提出的方法能提高齿轮的故障诊断性能。

(a)LE算法

(b)KPCA算法

(c)KDA算法

图5 不同算法的低维映射结果

4结语

本文在LE算法基础上,提出一种基于半监督LE算法的故障诊断模型。该模型采用LE算法,直接从原始高维故障信号构成的观测样本空间中,提取反映故障数据内蕴几何结构的低维流形特征,并将其输入到基于LE算法的半监督分类器中进行故障模式分类,从而获取整个流形上的类别信息。轴承和齿轮箱故障诊断实验验证了该模型的有效性和优越性。实验结果表明,与KPCA算法和KDA算法相比,LE算法表现出较好的分离性能和聚类效果。与KPCA+KNN算法、KDA+KNN算法以及LE+KNN算法比较,本文提出的基于LE算法的故障诊断模型大大提高了轴承和齿轮箱的故障分类精度。因此,与传统方法相比,本文提出的基于半监督LE算法的故障诊断模型,能更好地表征机械设备的运行状态,并明显提高它们的故障识别性能。

参考文献:

[1]HeQingbo.Time-frequencyManifoldforNonlinearFeatureExtractioninMachineryFaultDiagnosis[J].MechanicalSystemsandSignalProcessing,2013, 35(1/2):200-218.

[2]LuWenbo,JiangWeikang,WuHaijun,etal.AFaultDiagnosisSchemeofRollingElementBearingBasedonNear-fieldAcousticHolographyandGrayLevelCo-occurrenceMatrix[J].JournalofSoundandVibration,2012, 331(15): 3663-3674.

[3]黄宏臣, 韩振南, 张倩倩,等. 基于拉普拉斯特征映射的滚动轴承故障识别[J]. 振动与冲击,2015,34(5): 128-134.

HuangHongchen,HanZhennan,ZhangQianqian,etal.MethodofFaultDiagnosisforRollingBearingsBasedonLaplacianEigenmap[J].JournalofVibrationandShock,2015, 34(5): 128-134.

[4]孙斌, 刘立远, 牛翀,等. 基于局部切空间排列和K-最近邻分类器的转子故障诊断方法[J]. 中国机械工程,2015,26(1): 74-78.

SunBin,LiuLiyuan,NiuChong,etal.RotorFaultDiagnosisMethodsBasedonLocalTangentSpaceAlignmentandK-nearestNeighborClassifier[J].ChinaMechanicalEngineering,2015, 26(1): 74-78.

[5]SchölkopfB,SmolaA,MullerKR.NonlinearComponentAnalysisasaKernelEigenvalueProblem[J].NeuralComputation, 1998, 10(5): 1299-1319.

[6]MikaS,RätschG,WestonJ,etal.FisherDiscriminantAnalysiswithKernels[C]//Proceedingsofthe1999IEEESignalProcessingSocietyWorkshop.NewYork,1999: 41-48.

[7]OwsleyLMD,AtlasLE,BernardGD.Self-organizingFeatureMapsandHiddenMarkovModelsforMachine-toolMonitoring[J].IEEETransactionsonSignalProcessing, 1997, 45(11): 2787-2798.

[8]刘丽娟, 陈果, 郝腾飞. 基于流形学习与一类支持向量机的滚动轴承早期故障识别方法[J]. 中国机械工程,2013,24(5): 628-633.

LiuLijuan,ChenGuo,HaoTengfei.IncipientFaultRecognitionofRollingBearingsBasedonManifoldLearningandOne-classSVM[J].ChinaMechanicalEngineering,2013, 24(5): 628-633.

[9]欧璐, 于德介. 基于拉普拉斯分值和模糊c均值聚类的滚动轴承故障诊断[J]. 中国机械工程,2014,25(10): 1352-1357.

OuLu,YuDejie.RollingBearingFaultDiagnosisBasedonLaplacianScoreandFuzzyC-meansClustering[J].ChinaMechanicalEngineering,2014, 25(10): 1352-1357.

[10]苏祖强, 汤宝平, 刘自然,等. 基于正交半监督局部fisher判别分析的故障诊断[J]. 机械工程学报,2014,50(18): 7-13.

SuZuqiang,TangBaoping,LiuZiran.FaultDiagnosisMethodBasedonOrthogonalSemi-supervisedLocalFisherDiscriminantAnalysis[J].JournalofMechanicalEngineering,2014, 50(18): 7-13.

[11]SuZuqiang,TangBaoping,MaJinghua,etal.FaultDiagnosisMethodBasedonIncrementalEnhancedSupervisedLocallyLinearEmbeddingandAdaptiveNearestNeighborClassifier[J].Measurement,2014, 48: 136-148.

[12]WangYi,XuGuanghua,LiangLin,etal.DetectionofWeakTransientSignalsBasedonWaveletPacketTransformandManifoldLearningforRollingElementBearingFaultDiagnosis[J].MechanicalSystemsandSignalProcessing,2015, 54: 259-276.

[13]BelkinM,NiyogiP.LaplacianEigenmapsforDimensionalityReductionandDataRepresentation[J].NeuralComputation, 2003, 15(6): 1373-1396.

[14]BelkinM,NiyogiPi.Semi-supervisedLearningonRiemannianManifolds[J].MachineLearning,2004, 56(1/3): 209-239.

[15]KouroptevaO,OkunO,HadidA,etal.BeyondLocallyLinearEmbeddingAlgorithm,MVG-01-2002[R].Oulu,Finland:UniversityofOulu, 2002.

[16]HeQingbo.Time-frequencyManifoldforNonlinearFeatureExtractioninMachineryFaultDiagnosis[J].MechanicalSystemsandSignalProcessing, 2013, 35(1/2): 200-218.

[17]LoparoKA.BearingsVibrationDataSet[DB/OL].Cleveland,Ohio:CaseWesternReserveUniversity. [2014-10-28].http://Csegroups.Case.Edu/Bearingdatacenter/Home.

[18]VibroacousticGearSignatureswithTime-FrequencySpectrograms[DB/OL]. [2015-05-09].http://www.ulb.ac.be/polytech/laborulb/gearvi/gearjtfa.htm.

(编辑张洋)

收稿日期:2015-09-05

基金项目:国家自然科学基金资助项目(71171154);湖北省自然科学基金资助项目(2015CFB698);湖北省科技支撑计划资助项目(2014BAA032,2015BAA063)

中图分类号:TP206;TP391.4

DOI:10.3969/j.issn.1004-132X.2016.14.012

作者简介:江丽,女,1980年生。武汉理工大学机电工程学院助理研究员、博士。主要研究方向为机械设备状态监测与故障诊断、模式识别。发表论文3篇。郭顺生(通信作者),男,1963 年生。武汉理工大学机电工程学院教授、博士研究生导师。

Fault Diagnosis Based on Semi-supervised Laplacian Eigenmaps

Jiang LiGuo Shunsheng

Wuhan University of Technology,Wuhan,430070

Abstract:Aiming at solving the problems of insufficient labeled fault samples and high-dimensional nonlinear fault data, a fault diagnosis model was proposed based on semi-supervised LE algorithm. The model directly extracted the low-dimensional manifold features from the raw high-dimensional vibration signals, by implementing LE algorithm. The features were fed into semi-supervised classifier based on LE algorithm. Thereby, the operating conditions of mechanical equipment were recognized. Compared with the traditional methods, the model is able to obviously improve fault recognition performance of rolling bearings and gears.

Key words:fault diagnosis;feature extraction;manifold learning;semi-supervised Laplacian eigenmap(LE)

猜你喜欢

特征提取故障诊断
冻干机常见故障诊断与维修
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
一种基于LBP 特征提取和稀疏表示的肝病识别算法
基于量子万有引力搜索的SVM自驾故障诊断
基于DSP的直线特征提取算法
因果图定性分析法及其在故障诊断中的应用
基于MED和循环域解调的多故障特征提取
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断