APP下载

基于多特征提取与IPSO_LSSVM的故障诊断*

2019-01-03周新志刘才学

组合机床与自动化加工技术 2018年12期
关键词:降维特征提取故障诊断

付 伟,周新志,宁 芊,刘才学,艾 琼,何 攀

(1.四川大学 电子信息学院,成都 610065;2.中国核动力研究设计院,成都 610213)

0 引言

滚动轴承被称为“工业的关节”,广泛应用于各个领域,其检测技术的高低直接影响机械工业等产业的水平[1]。滚动轴承损伤往往复合发生,进行精确诊断的难度较大。

对滚动轴承进行精确故障诊断的关键是从诊断信号中提取有效的故障特征[2]。魏秀业提出的基于粒子群优化(Particle Swarm Optimization, PSO)的核主元分析(Kernel Principal Component Analysis, KPCA)特征的提取技术,主要通过单一时域或频域特征对故障形式相对简单的齿轮信号实施特征提取[3]。由于滚动轴承的高速、重载且复杂的运行过程,单域特征提取的信号含大量非线性关系,不能满足故障诊断要求。小波包变换可提供更好的高频部分的分解,对含大量的中、高频信息的信号更好的时频局部化分析,故将状态信号进行小波包分解提取能量与时频域特征共同作为识别特征来描述轴承的故障状态。

因时频域中各特征对不同的故障信号敏感度各不相同[4],同时将所有特征量用来故障识别会相互影响进而使准确率无法到达要求,为准确选取最能表征轴承状态的特征向量,Schlkopf等提出KPCA对复合特征集进行二次特征提取[5]。KPCA在非线性映射中将复杂庞大的数据集映射到高维空间中,使其在高维空间具有更好的可分性,然后对数据做主元分析(Principal Component Analysis, PCA),得到原始数据的非线性主元。KPCA有效地筛除了分类贡献率较小的特征量实现对复杂特征集的降维。

在故障诊断中,需选择高效的分类器建立故障诊断模型。支持向量机(support vector machine, SVM)是一种针对小样本和非线性问题的分类器,在故障诊断工作中得到了有效的推广[6],但它存在需预设参数和计算速度慢的缺点。最小二乘支持向量机(Least Squares Support Vector Machine, LSSVM)在SVM的基础上用等式约束来替代不等式约束,避免了求解耗时的二次规划问题[7]。LSSVM可以以任意精度逼近非线性系统,是非线性系统建模的有力工具[8]。用LSSVM模型进行故障分类时,分类效果绝大部分依赖于内部参数,故选取合适的参数是关键问题。LSSVM模型参数在应用中一般凭经验选取,参数选择不当就直接导致分类准确率较低。如果采用遗传算法来优化LSSVM模型参数,虽然遗传算法不依赖于问题的数学模型,但遗传操作比较复杂且后期收敛速度慢[9]。粒子群优化(PSO)算法是一种很好的寻优算法,原理是利用当前位置、全局极值和个体极值,指导粒子下一步迭代位置,其个体充分利用自身经验和群体经验调整自身的状态是粒子群算法具有优异特性的关键[10],非常适用于求解非线性模型参数优化问题。文中在标准粒子群算法中应用惯性权重策略,避免算法陷入边缘局部最优,增加粒子群多样性,全局最优值停止变化后改变粒子方向继续搜索,利用改进的PSO优化LSSVM参数以提高模型的分类准确率和分类速度,最后用轴承故障测试集检验该方法的有效性。

1 构建特征空间

因设备越来越复杂,包含的信息量增大,在对设备故障诊断时所测得的振动信号信噪比大,含大量冗余信息使故障识别过程变复杂,影响分类的实时性。本文通过多特征提取KPCA降维技术构建特征空间。

1.1 多特征提取

滚动轴承不同状态下不同特征参数表达信息及敏感性不同的,在时域特征中选用峰峰值、峭度、偏斜度、方差、波性指标、裕度指标等13个特征量作为时域特征参数,详细的计算公式见文献[11]。

针对时域特征量的局限性,选用平均频率及采用db4小波包函数进行3层正交小波包分解,将均匀划分得到的8个子频带滤波信号对总能量的比作为频域特征参数[12]。有Parseval恒等式得:

(1)

(2)

其中,Ni代表第i个子频带的数据长度。

能量均方根求解如下:

(3)

能量值归一化后得到能量特征向量:

(4)

所有特征量参数如表1所示。

表1 特征量参数

1.2 核主元分析(KPCA)降维

1.3 降维后聚类效果的评价

降维后的样本识别率及聚类分析法的类间距Sb和类内距Sω来评价降维后的聚类效果。假定特征向量{f1,f2,…,fdim},dim是特征向量的目标维数,选定dim=3。Sb和Sω两个参数的描述如下:

(5)

(6)

2 IPSO_LSSVM模型的构建

2.1 改进的PSO优化算法

最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)参数优化是关键,需确定r和δ两个参数:r为惩罚因子;δ为核函数参数,表示径向基核函数的宽度。改进的PSO优化算法(IPSO)可以快速解决LSSVM参数优化问题,有效地避免寻优过程过早的陷入局部寻优,又保证寻优过程具有快速的收敛速度,使得效率大大提高。此算法对粒子速度和位置进行更新的公式为:

(7)

(8)

(9)

从式(7)、式(8)中可以看出,初期引入粒子局部平均位置,相当于加入扰动项,以增加粒子群群体的多样性,避免过早陷入边缘局部极值,此时ω取值较大,具备较强的全局搜索能力,快速收敛到最优解所在局部范围;随迭代次数的增大ω线性减小,对收敛速度影响减弱,保留粒子群的全局最优位置,在此附近搜索,在全局极值停止变化后,改变粒子方向进入更新搜索过程,直到找到最优解。

2.2 改进的PSO优化LSSVM的过程

IPSO优化参数流程图如图1b,具体步骤如下:

(1)初始化粒子群的进化代数、惯性系数、学习因子等,随机初始各粒子的位置xi0和速度υi0;初始化惯性权重因子ω0;

(2)最初设置每个粒子的初始位置为最优位置,粒子群体中最优适应度所对应的初始位置为群体最好位置。根据式(7)、式(9)更新粒子速度、位置信息,进化产生下一代种群;

(3)利用适应度函数计算每个粒子的适应值。如果某个粒子的适应度Pi优于当前粒子最优解Pbest,则Pbest=Pi,xbest=xi;如果当前所有粒子中最优适应度值Gi优于上一代群体最优值,则Gbest=Gi,更新迭代次数K,根据式(8)调整权重因子ωk,若Gbest停止变化后改变粒子方向继续搜索;

(4)判断终止条件,若满足则寻优结束,并保留当前最优适应值所对应的粒子向量,译码为网络最优参数,构建一个优化的LSSVM模型;否则跳转至步骤(2)继续新一轮演化。

2.3 KPCA_IPSO_LSSVM故障诊断流程

故障诊断模型算法的总体流程如图1a所示。

(a)KPCA_IPSO_LSSVM (b)改进的PSO优化LSSVM图1 算法总体流程

3 故障分类实验与结果分析

本文采用电机故障直径为0.007英寸,转速为1750rmp,采样频率为12kHz部分数据,其中外圈故障信号取采集点为6点钟方向。每种故障状态各选100组样本,构成N×m=(4×100×22)特征矩阵,轴承4种状态各取70组数据,共280组(4×70)样本数据作为训练集,剩余每种故障各30组,共120组(4×30)样本数据作为测试集,验证组合算法性能。

使用上述多特征提取的22维特征量作为样本数据,采用线性判别分析(Linear Discriminant Analysis, LDA)和KPCA算法分别对特征矩阵学习,将特征向量融合提取得到低维特征空间,结果用可视化的三维图像形式表示。图2a为使用KPCA方法对于单时域特征降维结果图,可知:4种状态没能很好的区分,滚动体、内圈和正常轴承样本分布比较分散,且大量样本被错识,外圈故障聚类性较好,但是类间距较小;图2b为LDA方法对多特征提取降维结果图,可知正常轴承、内圈和滚动体故障3种样本之间没有很好的区分开,类间距太小,出现样本的混叠交叉以及大量的错误互识。图2c是使用KPCA方法对多特征提取降维结果,这种方法就很好的区分4种状态样本,如表2所示每种样本聚类性都很好,样本间的类间距也明显增大,这将有助于提高滚动轴承的状态识别率。

表2 特征参数值

(a)单特征提取KPCA降维结果

(b)多特征提取LDA降维结果

(c)多特征提取KPCA降维结果图2 不同特征提取降维后故障识别结果

本次实验中,设置学习因子c1=1.5,c2=1.7,迭代次数K=100,种群规模为20,惩罚因子r的取值范围为[0.001~100],核函数参数δ2的取值范围为[0.1~1000];经过100次迭代寻优之后,r的值为0.001,如图所示,δ2的值为170.712,如图3所示。

图3 改进PSO优化LSSVM参数

图4 适应度曲线变化

本次实验的适应度函数为模型训练的准确率,图4可以看出,适应度值很快接近最佳值,并慢慢趋于稳定,用时短效率高。但是模型准确率高并不代表模型具有较好的分类能力,为验证模型的分类能力,将测试集样本带入优化好的LSSVM模型中,并与其他几种模型作对比,结果如表3所示。

表3 不同特征提取方式下各模型指标对比结果

将该方法与LSSVM、PSO_LSSVM算法以及单特征提取KPCA_PSO_LSSVM模型作对比,图5为多特征提取下各模型分类结果。由表3可知,对诊断设备提取的振动信号进行多特征提取后再对复合特征空间进行KPCA降维,再利用改进的PSO优化LSSVM参数购进模型进行分类可以准确地提取滚动轴承的主要状态信息,减少模型构建时间,其模型构建时间为0.1569s,小于其余三种模型构建时长,而故障准确率却没有因此而减少,其故障准确率为99.17%,也高于其他三种模型。

(a)PSO_LSSVM模型分类结果

(b)KPCA_PSO_LSSVM模型分类结果图5 多特征提取下各模型分类结果

为进一步验证该方法的有效性,分别对轴承外圈3点钟、6点钟、12点钟方向提取的振动信号进行处理,每个方向各选100组样本,其中各取70组数据作为训练集,剩余每个方向各30组,共90组(3×30)样本数据作为测试集,验证组合算法性能。

图6 多特征提取KPCA降维故障识别结果

对三个不同方向采集的振动信号进行多特征提取,然后利用核主元分析函数对高维特征空间进行降维,得到如图6所示的三维结果图,图中可知:三个方向的样本信号几乎没有重叠,而且每个方向的样本信号都比较聚集,聚类性很好。

对轴承外圈3个不同方向的振动信号进行多特征提取并利用KPCA_PSO_LSSVM模型进行故障诊断,如图7所示,改进的PSO优化后的惩罚因子为1,核函数参数为0.1,诊断准确率为97.78%,训练时间0.1655s,满足轴承诊断的要求,可以相对准确地实现滚动轴承故障的状态识别。

图7 多特征提取下KPCA_PSO_LSSVM模型分类结果

4 结论

以上研究了一种基于多特征提取的核主元分析和改进的粒子群算法优化的最小二乘支持向量机的轴承故障诊断方法。该方法首先利用小波包对轴承的振动信号降噪、分解,提取时域特征和小波包能量多特征构建高维特征空间,然后使用核主元分析方法对高维特征空间优选与降维,从而获得样本数据,再利用改进的粒子群算法优化最小二乘支持向量机的参数并建立PSO_LSSVM故障诊断模型,对故障状态进行识别。将此模型的故障诊断结果分别与LSSVM、PSO_LSSVM模型及单特征提取KPCA_PSO_LSSVM模型的诊断结果进行对比,其模型构建时间为0.1569s,模型分类准确率为99.17%,较PSO_LSSVM模型提高了3.3%,时间缩短了0.24s,与单特征提取构建的KPCA_PSO_LSSVM模型作对比,训练时间缩短了0.13s,准度率提高了10%左右,所以实验最终表明本文研究的方法较好地完成了其各种故障状态的识别,其实时性和准确率均有所提升,且满足滚动轴承故障诊断的要求,是一种可靠的轴承诊断方法。

猜你喜欢

降维特征提取故障诊断
混动成为降维打击的实力 东风风神皓极
基于包络解调原理的低转速滚动轴承故障诊断
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
降维打击
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
数控机床电气系统的故障诊断与维修
Bagging RCSP脑电特征提取算法
基于量子万有引力搜索的SVM自驾故障诊断
一种改进的稀疏保持投影算法在高光谱数据降维中的应用