基于主成分分析的齿轮箱故障特征融合分析
2015-10-29古莹奎杨子茜朱繁泷
古莹奎 杨子茜 朱繁泷
江西理工大学,赣州,341000
基于主成分分析的齿轮箱故障特征融合分析
古莹奎杨子茜朱繁泷
江西理工大学,赣州,341000
为有效降低齿轮箱故障特征的维数并提高诊断准确率,提出了基于主成分分析法的齿轮箱故障特征融合方法,并结合支持向量机和BP神经网络对诊断的准确率进行了分析。以齿轮箱中不同裂纹齿轮为对象,选取能够表征齿轮箱故障状态的时域、频域和基于希尔伯特变换的36个特征,提取累积贡献率达到95%以上的主成分并输入支持向量机分类器中进行分类识别,用BP神经网络分类器进行结果的比较分析。结果表明,采用主成分分析法与支持向量机相结合的方法,既能降低特征维数,降低计算的复杂性,又能有效地表征齿轮箱的运行状态,识别不同裂纹水平的齿轮,比单独使用支持向量机分类器的方法诊断准确率更高,训练时间更短。
齿轮箱;主成分分析;支持向量机;BP神经网络;特征融合
0 引言
实现设备运行状态分析与故障诊断的必要前提是从振动信号中提取能够有效表征设备运行状态的特征,并在一定框架下对其进行选择,删除冗余,对所选特征进行深入分析,从而提高状态识别与故障诊断的准确率[1]。因而,如何尽可能多且准确地从信号中获取与设备状况相关的信息是基于振动信号进行故障诊断的关键。在故障诊断中,对任何一类诊断对象,单用一方面的信息来反映其状态行为都是不完整的。为对设备做出更准确、更全面的状态评估,需要从不同角度获取更多能够表征其运行状态的信息。但是,随着信息量的增加,如何充分地融合筛选信息并加以高效利用也成为急需解决的问题之一。当前,神经网络[2]、证据理论[3-4]、互信息[5-6]、支持向量机[7-8]、遗传算法[9]和粗糙集[10]等已被应用到故障诊断中。本文以齿轮箱为研究对象,将基于主成分分析(principal component analysis,PCA)的特征级融合引入旋转机械的故障诊断。利用主成分分析法可以有效融合去除冗余信息的优点,实现故障特征的降维,并结合支持向量机(support vector machine,SVM)分类器良好的分类性能,准确地识别不同裂纹齿轮,有效地克服由于复杂工况对故障诊断工作带来的干扰。
1 主成分分析法
主成分分析法是一种分析、简化数据的方法,该方法通过线性变换将问题从高维转化到低维,保留低阶主成分,删除高阶成分达到降低数据集维数的目的;通过降维将原本复杂的多维数据转换成简单、直观且不相关的低维数据,有效降低数据分析的难度和复杂程度[11]。
将机械振动信号用模式向量矩阵表示为X=[x1x2…xn],其中第k列为xk=[x1kx2k…xnk]T,xk表示设备的某一状态,其协方差矩阵为
求矩阵Rx的特征值以及特征向量,将特征值λi(i=1,2,…,n)进行排序:λ1>λ2>…>λn。各特征值对应的特征向量为vi(i=1,2,…,n)。将样本xj投影到特征向量vi,得到该方法所对应的主成分量:
所求特征向量构成n维正交空间,将X投影到该空间即可得到对应的n维主成分量。重构时特征向量的贡献率与其所对应的特征值大小成正比。设正交空间中前k个主成分量为y1,y2,…,yk,其累计贡献率为
θ的取值通常在95%以上,即k(k 选取以下齿轮箱的36种特征参数进行分析。 (1)时域特征参数。共有16个,即平均值、均方根标准差、方根幅值、绝对平均值、偏斜度、峭度、方差、最大值、最小值、峰峰值、波形指标、峰值指标、脉冲指标、裕度指标、偏斜度指标、峭度指标,依次编为1~16。 (2)频域特征参数。共有13个,见表1,依次编为17~29。表1中,X(n)为离散信号序列,数据长度为N,f(n)为n时刻功率频对应的频率值[12-13]。 表1 齿轮箱频域故障特征名称及定义 (3)基于希尔伯特变换的特殊特征参数。将齿轮箱振动信号通过希尔伯特变换和傅里叶变换并进行预处理,得到残余和差异信号以及频谱,按表2中公式求得30~36号特征。表2中,d(k)为样本离散信号序列,数据长度为N,r(k)为残差信号,e(k)=|b(t)+iH(b(t))|,b(t)为齿轮啮合频率的带通滤波,H[b(t)]表示对b(t)进行希尔伯特变换[14],其他参数符号意义见文献[14]。 表2 齿轮箱特殊故障特征名称及定义 如图1所示,实验设备包括一台2.2 kW的驱动电机,与之连接的速度调节器控制其转速。电磁制动器与齿轮箱输出端相连,通过制动调节器模拟不同的负载。齿轮箱内部结构如图2所示,齿轮3为测试齿轮,通过更换齿轮3可以测得不同裂纹的齿轮箱振动信号。 图1 实验设备结构图 图2 齿轮箱内部结构图 实验参数见表3,f1为轴1和齿轮1的旋转频率,f2为轴2和齿轮2及齿轮3的旋转频率,f3为轴3和齿轮4的旋转频率,f12为齿轮1和齿轮2的啮合频率,f34为齿轮3和齿轮4的啮合频率。齿轮箱中各个齿轮的齿数、数量和故障齿轮状态见表4。 表3 齿轮箱旋转频率和齿轮啮合频率 Hz 表4 实验齿轮箱中齿轮描述 通过改变驱动电机转速和齿轮箱负载来模拟齿轮箱运行的不同工况,记录各工况下的振动信号。本次实验包括以下12种实验条件:①两种不同转速,即驱动电机旋转频率为30Hz和40Hz;②两种不同程度负载,0表示无负载,h表示50%满负载;③三种齿轮裂痕故障,分别为正常、25%裂纹、50%裂纹,分别用0Q、1Q、2Q表示。 由于垂直方向上的振动信号对齿轮裂纹较为敏感,故只对垂直方向的信号进行研究。采样频率为2560Hz,数据长度N=8192,每种实验工况条件下取10组数据,共120组数据。对每组信号分别提取以上36种特征,求得120×36的特征全集矩阵。将120组样本进行整理编号,见表5。 表5 120个样本的故障类型及工况描述 由于每个特征参数表征的物理意义各不相同,参数间尺度大小不一,不同参数对不同齿轮裂痕状态的表征各不相同、规律不一,为了使参数在评价时更具参考意义,对每个参数进行归一化处理,如图3所示。 图3 齿轮箱实验提取的36种特征数据描述(已归一化) 将齿轮箱36种特征直接进行PCA融合,提取累积贡献率在95%以上的7个主成分,如图4所示。将融合结果输入到支持向量机中进行分类,为避免结果的偶然性,同时用BP神经网络分类器进行结果比较。 图4 累积贡献率达95%的7个主成分 从图4中可以看出,前7个主成分累积贡献率为95.3148%,其中主成分1在贡献率中所占比列明显高于其他主成分,其值为52.3229%。经过PCA的特征融合,原36维特征降至7维,特征维数降低80%,在压缩信息量和降低特征维数上取得的效果非常显著。 图5为利用PCA方法融合后的前7个主成分特征波形图。每40个样本为一种裂纹状态下的齿轮,不同程度的裂纹齿轮有4种不同的工况,每种工况有10个样本。 图6为PCA融合后齿轮箱主成分1的特征波形图,图中样本数量从80到120区间为50%裂纹的齿轮箱振动信号样本,该区间内主成分的变化趋势呈明显的阶梯形,且没有明显的波峰波谷,这与50%裂纹齿轮箱的4种工况完全吻合。 图6 齿轮箱主成分1特征波形图 基于融合后前3个主成分绘制的样本分布三维图见图7。通过这前3个主成分特征表征3种不同状态的齿轮,每种状态对应4种不同的工况。 图7 齿轮箱PCA+SVM方案前3个主成分的样本分布图 主成分1在其他程度裂纹样本中(样本1到80)变化也基本与工况的变化相吻合,但有几处较为明显的波峰波谷,如图6中圆圈所示。圆圈1所示为正常状态齿轮在旋转频率30Hz、负载为0的样本,开始出现了一个明显的波峰,但马上回落并保持稳定,初步认为出现这一现象的原因是实验设备在开始收集信号时,设备运行初期没有进入正常的工作状态,导致振动信号出现异常,该异常对最终故障分类工作的影响较小。圆圈2在样本10到20区间内,波谷持续时间较长,该状况在图7中表现为:正常状态下部分样本分布较为凌乱,与其他裂纹样本出现了重叠的情况,这对故障识别的准确率存在一定的影响。圆圈3处出现了一个异常波峰,这一现象对故障识别的准确率的影响较小,此处波峰在图7中表现为:极少数25%裂纹的样本脱离了密集集中区域。 从图7中可以看出: (1)通过前3个主成分特征基本可以表征3种不同状态的齿轮。不同状态的齿轮样本区分度较为明显且集中度高,只有正常齿轮在负载为0、旋转频率为40Hz工况下样本和25%裂纹齿轮在负载为0、旋转频率为40Hz工况下的样本较难区分,如图7圆圈所示。 (2)每种状态下的齿轮箱有4种不同的工况,分别对应两种不同的负载和两种不同的转速。25%和50%裂痕的样本在4种不同工况下的样本分布不但区分度高而且非常集中。图7中的问题在于正常齿轮在不同工况下的样本分布较为零散。 针对以上问题,经分析,原因有以下几点: (1)正常状态下振动信号随工况的变化而变化的程度不明显,且对转速30Hz变化到40Hz时不敏感,导致旋转频率为30Hz和40Hz样本在三维图中的分布较为模糊,如图7圆圈所示。同时也看到,齿轮箱在不同负载下的正常样本还是能保持较高的区分度。 (2)正常状态下工况1(负载0、旋转频率30Hz)与工况4(负载h、旋转频率40Hz)区分度很高且分布密集,但是工况2(负载0、旋转频率40Hz)与工况3(负载h、旋转频率30Hz)的样本区分度不高。可能原因是同一状态下且工况变化幅度不大的情况下,提取的部分特征变化趋势有一定的相似性,导致高速低载和低速高载两种工况下齿轮箱振动信号表征出现了一定的相似性。 (3)正常状态与25%状态的振动信号相似度较高,这也是早期故障检测的难点,且图7的绘制仅参考贡献率前3的主成分,其累计贡献率为81.1271%,含有原特征集合的故障信息量不高,也是导致上图中出现部分样本难以区分的原因。 PCA融合前后的故障诊断准确率见表6。 表6 PCA融合前后的故障诊断准确率 由表6可知,特征全集经过PCA融合后特征维数大幅降低,但并没有影响分类器的准确率,相反地,融合之后冗余特征减少使得准确率有小幅的增长。在分类器运行时间上,融合后的运行时间缩短幅度非常大,这说明简单有效的特征集显著减小了分类器的计算量。 针对机械振动信号的复杂性,采用主成分分析实现旋转机械振动信号的特征降维,提取旋转机械运行状态特征参数的主成分,通过SVM和BP神经网络两种分类器实现故障诊断。齿轮箱实验的结果显示,采用PCA+SVM的方法,既能降低特征维数减少计算的复杂性,又能有效地表征旋转机械的运行状态,比单独使用SVM分类器的方法诊断准确率更高,训练时间更短。通过删除冗余特征和融合的方法极大地压缩了信息量,提高了故障诊断准确率。 [1]徐晓滨, 王玉成, 文成林. 评估诊断证据可靠性的信息融合故障诊断方法[J]. 控制理论与应用, 2011, 28(4): 504-510. Xu Xiaobin, Wang Yucheng, Wen Chenglin. Information-fusion Method for Fault Diagnosis Based on Reliability Evaluation of Evidence[J]. Control Theory & Applications, 2011, 28(4): 504-510. [2]周洪煜, 张振华, 陈晓锋. 中速直吹磨组径向基函数神经网络信息融合-模糊启动控制[J]. 中国电机工程学报, 2011, 31(11): 119-127. Zhou Hongyu,Zhang Zhenhua, Chen Xiaofeng. Radial Basis Function Neural Network-data Fusion and Fuzzy Control during Direct-firing Medium-speed Mill’s Start-up[J]. Proceedings of the CSEE, 2011, 31(11): 119-127. [3]Otman B, Yuan X H. Engine Fault Diagnosis Based on Multi-sensor Information Fusion Using Dempster-shafer Evidence Theory[J]. Information Fusion, 2007, 8(4): 379-386. [4]王奉涛, 马孝江, 朱泓,等 . 基于Dempster-Shafer证据理论的信息融合在设备故障诊断中应用[J]. 大连理工大学学报, 2003, 43(4): 470-474. Wang Fengtao, Ma Xiaojiang, Zhu Hong, et al. Research on Fault Diagnosis Method Based on Dempster-Shafer Evidential Theory[J]. Journal of Dalian University of Technology, 2003, 43(4): 470-474. [5]李冰, 张培林, 任国全,等. 基于互信息的滚动轴承故障特征选择方法[J]. 测试技术学报, 2009, 23(2): 183-188. Li Bing, Zhang Peilin, Ren Guoquan, et al. Features Selection for Rolling Bearing Fault Diagnosis Based on Mutual Information[J]. Journal of Test and Measurement Technology, 2009, 23(2): 183-188. [6]Peng H, Long F, Ding C. Feature Selection Based on Mutual Information: Criteria of Max-dependency, Max-relevance and Min-redundancy[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2005, 27(8):1226-1238. [7]Niu G, Yang B S. Intelligent Condition Monitoring and Prognostics System Based on Data-fusion Strategy[J]. Expert Systems with Applications, 2010, 37(12): 8831-8840. [8]蒋玲莉, 刘义伦, 李学军,等. 基于SVM与多振动信息融合的齿轮故障诊断[J]. 中南大学学报(自然科学版), 2010, 41(6): 2184-2188. Jiang Lingli, Liu Yilun, Li Xuejun, et al. Gear Fault Diagnosis Based on SVM and Multi-sensor Information Fusion[J]. Journal of Central South University(Science and Technology), 2010, 41(6): 2184-2188. [9]刘晓平, 郑海起, 祝天宇. 基于进化蒙特卡洛方法的特征选择在机械故障诊断中的应用[J]. 振动与冲击, 2011, 30(10): 98-101. Liu Xiaoping, Zheng Haiqi, Zhu Tianyu. Feature Selection in Machine Fault Diagnosis Based on Evolutionary Monte Carlo Method[J]. Journal of Vibration and Shock, 2011, 30(10): 98-101. [10]ZhaoXiaomin. Data-driven Fault Detection, Isolation and Identification of Rotating Machinery: with Applications to Pumps and Gearboxes[D]. Edmonton: University of Alberta, 2012. [11]Jolliffe I T. Principal Component Analysis[M]. New York: Springer-Verlag, 2002. [12]Abu-Mahfouz I A. A Comparative Study of Three Artificial Neural Networks for the Detection and Classification of Gear Faults[J]. International Journal of General Systems, 2005, 34(3): 261-277. [13]Lei Y G, He Z J, Zi Y Y. Fault Diagnosis of Rotating Machinery Based on Multiple ANFIS Combination with GAs[J]. Mechanical Systems and Signal Processing, 2007, 21(5): 2280-2294. [14]Lei Y G, Zuo M J. Gear Crack Level Identification Based on Weighted K Nearest Neighbor Classification Algorithm[J]. Mechanical Systems and Signal Processing, 2009, 23(5): 1535-1547. (编辑袁兴玲) Gearbox Fault Feature Fusion Based on Principal Component Analysis Gu YingkuiYang ZixiZhu Fanlong Jiangxi University of Science and Technology,Ganzhou,Jiangxi,341000 To effectively reduce the dimension of gearbox fault feature and improve the accuracy of diagnosis, a fault signal feature fusion method of gearbox was proposed based on principal component analysis, and the support vector machine and BP neural network were used to analyze the diagnosis accuracy. The 36 features with different crack gears in gearbox were selected based on time-domain, frequency-domain and Hilbert transform, which could be used to characterize the fault states of gearbox. The principal components which had more than 95% cumulative contribution rate were extracted and input into support vector machine classifier for identification. BP neural network classifier was used for comparative analysis of the results. Results show that a combination of principal component analysis and support vector machine method can reduce the feature dimension and computational complexity, characterize the gearbox running status effectively, and identify the different levels of gear crack. The diagnosis accuracy is higher and the training time is shorter than that of individual support vector machine classifiers. gearbox; principal component analysis; support vector machine; BP neural network; feature fusion 2014-07-11 国家自然科学基金资助项目(61164009, 61463021);江西省教育厅科学技术研究资助项目 (GJJ14420);江西省自然科学基金资助项目(20132BAB206026) TH132.41; TH165.3DOI:10.3969/j.issn.1004-132X.2015.11.018 古莹奎,男,1976年生。江西理工大学机电工程学院教授、博士。主要研究方向为机械装备可靠性与健康管理。发表论文40余篇。杨子茜,女,1991年生。江西理工大学机电工程学院硕士研究生。朱繁泷,男,1989年生。江西理工大学机电工程学院硕士研究生。2 齿轮箱特征定义及其分类
3 齿轮箱振动试验分析
4 基于PCA的齿轮箱故障特征融合分析
5 结束语