APP下载

中心修正投影结合IGWO-SVM的滚动轴承故障分类方法

2023-12-23刘运航宋宇博朱大鹏

振动与冲击 2023年24期
关键词:降维全局局部

刘运航, 宋宇博, 朱大鹏

(1. 兰州交通大学 机电技术研究所,兰州 730070; 2. 兰州交通大学 交通运输学院,兰州 730070)

滚动轴承的异常振动是引起传动系统异常噪声的因素之一[1],其健康状况影响整个机械设备的安全性和可靠性。运行状态下的轴承振动信号中蕴含着大量部件工作状态信息,基于多维度、多角度的故障特征进行分类是一种较常用的故障分类方法[2]。而特征信息冗余和诊断模型的精度不精是影响故障诊断准确率的两个重要因素[3]。因此,更好的剔除冗余信息以及提升诊断模型的精度对故障诊断过程尤为重要。

对于振动信号特征提取多维化的特点,降维算法是故障数据分析中解决“维度灾难”最广泛的方法之一。降维算法分为线性和非线性两类。主成分分析(principal component analysis, PCA)和线性判别分析是典型的线性降维算法。由于轴承故障信号具有非线性、非平稳特点,因此线性降维方法很难反映数据间的本质关系。而核函数的应用可将低维不可分数据矢量映射至高维空间使其线性可分,典型的方法是核主元分析(kemel PCA, KPCA)。除此之外,也可以采用局部保持投影(locality preserving projection, LPP),拉普拉斯特征映射,等距特征映射(isometric mapping, ISOMAP)等非线性流形学习方法[4-6]。刘锐等[7]应用规范化局部保留投影算法提取低维特征矩阵的方法提高了轴承故障分类的精度。王亚萍等[8]将模糊C均值聚类和改进的ISOMAP方法结合,减小了ISOMAP计算偏差,提升了轴承不同故障的聚类效果。上述流形学习方法能够有效保持低维特征在高维空间的局部信息,但对于全局特征分布信息的获取能力存在缺陷[9]。同时轴承故障信息并不一定处于同一流形中[10],将所有样本的高维信息都映射至一个低维流形上的处理过程制约着故障分类精度的进一步提高。

为了实现故障分类,需要将上述提取的低维特征输入至分类器中。支持向量机(support vector machine, SVM)是一种建立在统计学理论上的分类器,SVM面向低维数据分类具有速度快,准确率高的特点[11],故SVM算法广泛应用于滚动轴承的故障分类。袁宪锋[12]等引入改进的灰狼优化算法(improved grey wolf optimization, IGWO)[13]对支持向量机进行优化,结合栈式自编码网络特征自提取能力,实现了故障类型识别精度的提高。Wang等[14]采用了海洋捕食者算法(marine predators algorithm, MPA)[15]对SVM进行优化,并将经广义复合多尺度加权排列熵构建的高维特征矩阵经二次提取后输入优化后的SVM中,提高了故障分类精度。虽然上述方法实现了SVM参数寻优,但寻优结果能否有效提升SVM的模态识别精度,很大程度上依托于寻优算法的寻优性能。因此,面向SVM寻优过程如何通过改进算法性能提高SVM的模态识别精度成为国内外专家的研究热点。

针对滚动轴承故障分类中全局信息损失和模态识别精度低的问题,本文提出一种中心修正投影算法结合IGWO优化SVM的滚动轴承故障分类方法。该故障分类方法能较完整的融合样本高维空间全局分布信息和样本局部信息,同时结合IGWO优秀的参数寻优能力和SVM小样本、低维度的模式识别能力,避免了降维过程样本分布信息损失的弊端。试验结果表明,该方法具有更为精准的故障类型辨识能力。

1 CMP结合IGWO-SVM的滚动轴承故障分类方法

CMP(center modified projection)结合IGWO-SVM的滚动轴承故障分类方法诊断流程分为特征提取、特征降维、SVM参数寻优和模式识别4个阶段,其整体设计如图1所示。首先对轴承故障信号进行时域和频域分析,提取高维特征矩阵。其次对高维特征矩阵进行二次特征提取实现特征降维。最后将降维后的敏感特征矩阵输入到经IGWO优化的SVM分类器中,实现故障分类。

图1 CMP结合IGWO-SVM的滚动轴承故障分类方法设计流程Fig.1 Design flow of rolling bearing fault classification method based on CMP and IGWO-SVM

基于轴承故障数据进行特征提取,构建样本高维特征矩阵,高维特征矩阵在特征降维阶段进行二次特征提取,实现特征矩阵降维。在降维阶段为了避免降维过程中全局信息损失,本文提出CMP投影算法,该方法基于样本高维空间全局分布信息和样本局部信息,在保留了样本高维特征矩阵中的局部结构信息的基础上,获取了更多的全局信息,得到了低维敏感特征矩阵。

在模式识别阶段,灰狼算法的求解性能决定了SVM的分类好坏。为了提升灰狼算法的求解性能,本文从算法收敛过程控制和搜索模式两个方面对算法进行了改进。引入基于正太分布曲线的钟形收敛因子,平衡了算法的全局搜索能力和局部搜索能力。另外,引入基于概率的t分布随机游走策略应用于算法的搜索过程,避免了算法陷入局部最优。

模式识别阶段中另外一项重要内容是SVM参数的启发式自主寻优,利用IGWO对惩罚系数C和核函数参数γ寻优。最后将CMP降维后的敏感特征矩阵输入到优化后的SVM中,即可实现故障类型的准确识别。

2 理论方法

2.1 中心修正投影算法

传统LPP方法有效的保留非线性数据局部特征,但是算法未考虑全局结构特征,容易造成部分信息损失。而经典的PCA方法将数据投影到方差最大的方向,忽略了局部信息,未能充分利用原始变量空间的信息。本文兼顾了降维过程中保持局部流形特征与保存样本分布全局特征,提出了一种新的降维算法CMP算法,旨在提高降维过程中的特征信息保留能力和聚类效果。假设原始高维空间m个样本矩阵为X={x1,x2,…,xm}∈Rm×n,CMP算法的目的是寻找一个投影矩阵W∈Rn×d(d

(1)

式中,sij为局部权值系数,而全局关系目标函数为

(2)

2.1.1 局部保留投影

根据式(1)局部保留投影方法目标函数,假设原始空间变量为X,J(W)local优化目标是寻找d个投影向量ω1,ω2,…,ωd,构成投影矩阵W,使低维空间Y和X有相似的局部结构。目标函数简化为

2WTX(Dlocal-S)XTW=

2WTXLlocalXTW

(3)

式中:Llocal=Dlocal-S为局部信息的拉普拉斯矩阵;Dlocal为对角矩阵,矩阵Dlocal提供了数据点的自然度量,即Dii越大,说明yi越重要;S为对称权值矩阵,其中的每一个元素sij为xi和xj的近邻关系,sij元素值计算式如下

(4)

式中,η为热核参数。

2.1.2 全局中心信息保持

(5)

(6)

2WTU(Dglobal-V)UTW=

2WTULglobalUTW

(7)

式中:Lglobal=Dglobal-V为全局信息的拉普拉斯矩阵;Dglobal为对角矩阵;V为全局信息对称矩阵;vij元素值按式(4)计算。

2.1.3 计算投影矩阵

按CMP投影思想,保持投影前后局部样本关系和全局修正中心具有相似的结构,CMP目标函数标准以最小化为约束

(8)

根据式(3)和式(7),式(8)可转化为

J(W)cmp=WTXLlocalXTW+WTULglobalUTW

(9)

为消除全局Dii自然缩放影响,施加如下约束

WTUDUTW=1

(10)

则式(9)和式(10)构建拉格朗日函数得

L(W)=WT(XLlocalXT+ULglobalUT)W+
λ(1-WTUDUTW)

(11)

对W求偏导得

(12)

则CMP算法求解如下广义特征值问题

(XLlocalXT+ULglobalUT)W=λUDUTW

(13)

将所得的特征向量按特征值大小排序,选取前d个最大特征值对应的特征向量构成投影矩阵。相比于传统LPP法,CMP法构建了包含邻域信息和全局信息的图,以样本近邻关系和修正全局中心关系为基础,最优的保留了局部和全局信息。

2.1.4 CMP降维过程

输入n维空间m个样本数据集为X={x1,x2,…,xm}∈Rn×m,目标维数为d(d

输出投影转换矩阵W,低维特征向量Y。

步骤1归一化样本集X,设定局部近邻点个数k0,利用欧氏距离计算样本邻域信息,并通过式(4)赋权值构造对称权值矩阵S,保留局部信息拉普拉斯矩阵Llocal。

步骤2按步骤1中局部近邻点个数k0,结合式(6)计算每个样本得全局修正中心,构造修正中心矩阵U。

步骤3设定修正中心近邻数k,利用欧氏距离计算修正中心的邻域信息,并通过式(4)赋权值构造对称权值矩阵V,构造对角矩阵Dglobal,保留全局信息的拉普拉斯矩阵Lglobal。

步骤4将得到的Llocal,Lglobal,U和Dglobal代入式(13)所示的广义特征方程求解,得到前d个最大特征值所对应的特征向量构成投影矩阵W

步骤5根据Y=WTX,得到低维数据Y。

2.2 改进灰狼优化算法

2.2.1优化收敛因子

灰狼优化算法是一种新型的群智能优化算法,其灵感来源于自然环境中狼群等级制度和捕食过程,该方法中,狼群按照社会等级从高到低依次标记为α,β,δ,ω,下级行为需服从上级领导,并展开群体狩猎行动。其优化步骤如下:

首先,根据个体适应度对狼群进行社会等级分层,挑选最好的3头狼为α,β,δ,其余为ω。

其次,模拟狼群搜索、包围和接近猎物,该行为的数学模型如下

D=CXp(t)-X(t)
X(t+1)=Xp(t)-AD
A=2ar1-a
C=2r2

(14)

式中:t为当前迭代次数;A和C为协同系数向量;Xp(t)为猎物的位置向量;X(t)为当前灰狼的位置向量;在整个迭代过程中a由2线性降到0;r1和r2为[0,1]中的随机向量。

式(14)中,原始GWO算法收敛因子a从2线性递减至0,容易使算法过早收敛,陷入局部最优。为避免算法早熟,袁宪锋等用余弦曲线代替线性收敛因子,使算法在迭代前期具有缓慢的收敛速度,增强算法全局搜索能力,在迭代后期快速下降的收敛算子能有效的提升算法的收敛速度。但是后期快速收敛会导致算法收敛不精确的问题,因此本文采用基于正态分布的钟形曲线,钟形曲线具有前期后期下降平缓,中期下降快的特点。钟形收敛曲线用式(15)表示

(15)

式中:g为当前迭代代数;G为总迭代代数;N为种群数目;c为形状参数,c值越大,曲线前期平缓阶段越长。以最大迭代次数为500,收敛因子取值从2递减至0为例,收敛因子曲线对比结果如图2所示。

图2 收敛因子趋势Fig.2 Convergence factor trend

最后,模拟狼群狩猎猎物,每次迭代过程,更新上层狼α,β,δ,然后根据它们的位置信息更新其他狼位置。该行为的数学模型可表示如下

Dα=C1Xα-X,Dβ=C2Xβ-X,Dδ=C3Xδ-X,

X1=Xα-A1Dα,X2=Xβ-A2Dβ,X3=Xδ-A3Dδ,

(16)

式中:Xα,Xβ,Xδ分别为当前种群中α,β,δ的位置向量;X为灰狼的位置向量;Dα,Dβ,Dδ分别为当前候选灰狼与最优3头狼之间的距离。

2.2.2 优化搜索模型

GWO算法中狼群分散与集中搜索行为很大程度上依赖协同向量A的取值,当|A|>1时,狼群分散很容易使算法收敛能力变差。因此,改善算法搜索模型,引入更有效的游走策略是有必要的。本文通过细化种群行为,减小了狼群分散的概率,同时引入t分布随机游走策略,避免算法陷入局部最优。

(1)种群半数个体主要执行前进式搜索,减小狼群发散概率,应用t分布游走策略,扩大猎物搜寻范围,避免算法陷入局部最优。其数学模型表示如下

(17)

(2)另外半数个体主要执行包围式搜索,减小个体随机游走范围,精细化搜索过程,提高搜索精度。其数学模型表示如下

(18)

式中:k为常数,取0.2;R1,R2为[0,1]的随机数;Rt为服从t分布的随机向量,其密度函数为

(19)

2.3 IGWO优化SVM

SVM是一种有效的非线性模型预测法。但是SVM训练器性能很大程度上依赖惩罚系数C以及核函数参数γ的选择。

为了训练较好的分类模型,本文以训练集最小错误率为指标,应用IGWO优化SVM模型参数组合,具体步骤如下:

步骤1初始化IGWO参数,设定参数维度、参数取值范围、种群规模和最大迭代代数。

步骤2确定灰狼种群初始位置,即初始化SVM参数[C,γ]初始值;

步骤3以训练集SVM分类错误率为适应度函数,比较种群中每个个体的适应度值,适应度函数值最小的个体作为最优个体保留。

步骤4根据适应度值划分种群等级,确定α,β,δ狼位置。

步骤5每一代种群进行前进式和包围式搜索,并根据α,β,δ位置更新其他搜索个体位置。

步骤6更新新一代α,β,δ狼。

步骤7若迭代代数超过最大迭代代数,跳出循环,输出最优参数组合。否则返回步骤3。

3 试验分析

为了验证本文提出的CMP算法的降维性能,IGWO收敛能力和IGWO对SVM参数自主寻优效果,以及CMP-IGWO-SVM滚动轴承故障分类法的优越性,本文从算法降维性能和故障分类精度两个维度对基于CMP和IGWO-SVM的滚动轴承故障分类方法进行验证分析。首先,应用5种不同的降维算法处理东南大学故障轴承数据集,验证CMP方法对振动信号中高维数据的全局和局部特征的保持效果;其次,通过测试函数验证IGWO算法全局与局部搜索能力;再次,将美国西储大学轴承数据用5种算法处理后,应用IGWO-SVM进行模型训练和故障识别,验证CMP结合IGWO-SVM的滚动轴承故障分类方法的优越性;然后对比GWO-SVM,IGWO-SVM和CMP-IGWO-SVM 3种方法的故障分类结果,验证IGWO结合SVM的必要性以及CMP-IGWO-SVM方法的有效性;最后将本文方法对比其他文献方法,证明了本文方法的优越性。

3.1 CMP降维性能分析

本文选取10种东南大学轴承数据,其数据如表1所示。

表1 东南大学滚动轴承试验数据表Tab.1 Southeast University rolling bearing test data sheet

首先对故障信号进行分段处理,每个样本有4 000个数据点,对每个样本提取故障特征,每种轴承故障共提取100个样本特征构成特征矩阵,提取的时域和频域特征指标如表2所示。

表2 特征参数表Tab.2 Characteristic parameter table

分别利用PCA,LPP,KPCA,ISOMAP,CMP共5种算法对10种类别的高维特征矩阵进行二次提取,设置LPP算法近邻数为k=3,热核参数η=1。CMP算法修正中心近邻数为k=3,局部近邻数为k0=3,热核参数η=1。各种方法降至2维进行可视化,结果如图3所示。图3中图例数据标签与表1中标签对应。

图3 5种算法降维结果Fig.3 Dimensionality reduction results of 5 algorithms

由图3可知,10类样本CMP方法降维结果边界最清晰,聚类效果最好,其次为ISOMAP流形学习方法。图3(a)中高维特征矩阵经PCA方法处理的结果标签为2和5的样本重合,这是由于线性降维方法对非线性数据特征提取具有局限性,未能考虑样本局部关系;图3(b)中LPP方法考虑样本间近邻关系,将故障特征集归于同一近似流行中进行线性降维,有效的提升了算法的聚类能力,但LPP方法未保留样本全局分布信息,造成了图3(b)中标签为2和10的样本边界不清晰;KPCA方法可以实现数据整体方差最大化,在提取数据集全局结构信息有较大优势,但对局部结构信息提取存在较大的缺陷,因此图3(c)中仍然存在样本边界不清晰现象;ISOMAP方法通过样本点之间的距离进行低维映射,有效的增加了部分故障样本的辨识性,但ISOMAP降维需要计算大量样本的高维拓扑结构,导致计算时间过长,同时ISOMAP方法属于流形学习方法,不具备投影矩阵求解能力,无法有效的评估新测试点。CMP方法兼顾高维特征的全局与局部信息,各故障之间有较为明显的分界线,能有效的提取非线性高维数据敏感特征,得到较好的聚类效果。

3.2 IGWO算法测试

按图1所示故障分类流程,CMP特征降维后的低维敏感矩阵需要输入到IGWO-SVM中进行训练。为了证明IGWO算法的有效性,本文采用多峰函数Rastrigin分别对IGWO,GWO,PSO 3种算法进行了测试。

Rastrigin函数公式为

(20)

定义维度取30,自变量取值范围为[-5.12,5.12],最小值为0。多峰函数图像如图4所示。

图4 多峰函数Rastrigin 图像Fig.4 Rastrigin image

按照文献[16]参数设置:种群规模30,最大迭代代数500,PSO算法学习因子为2,惯性权重由0.9线性递减至0.3。PSO,GWO和IGWO算法的测试结果如图5所示。

图5 测试结果Fig.5 The test results

由图5可知,IGWO算法的收敛精度远高于原始GWO以及PSO算法,验证了通过引入非线性钟形收敛因子,改善并细化种群搜索模型,并应用t分布随机游走策略对算法搜索能力提升的有效性。IGWO算法能兼顾全局与局部搜索,算法的收敛速度以及收敛精度得到了显著的提升,为应用IGWO实现SVM参数自主寻优奠定了基础。

3.3 故障分类

本文选取凯斯西储大学10组轴承驱动端信号数据,试验数据如表3所示。

表3 凯斯西储大学滚动轴承试验数据表Tab.3 CWRU rolling bearing test data sheet

从10组故障数据中提取表2特征,每个样本有1 200个数据点,共100个样本,构成特征矩阵。设置CMP算法修正中心近邻数为k=3,局部近邻数为k0=3,热核参数η=1。设置IGWO狼群数量为10,最大迭代代数为100,核函数参数γ和惩罚因子C的取值范围为[0.01,100.00]。SVM识别过程以每个类别70个样本为训练集,30个样本为测试集。CMP算法降维维数和故障识别准确率关系,如图6所示。

图6 故障分类识别曲线Fig.6 Fault classification and identification curve

由图6可知,在降维数为5,6和13时,故障识别率最高,并且随着维度增加,故障识别率受冗余成分影响逐渐增大,识别准确率不稳定。因此,本文CMP方法降维维度设置为5维。

为进一步证明CMP方法的有效性,对10种故障信号添加1 dB的随机噪声,按3.1节所述5种算法提取特征集输入到IGWO-SVM中进行分类。降维维度设置5维。设置LPP算法近邻数为3,热核参数η=1。为了减小偶然因素的影响,每种方法计算10次,其模式识别结果如图7所示。

图7 5种算法降至不同维度的平均准确率Fig.7 Five algorithms dimension-average accuracy chart

由图7可知,CMP-IGWO-SVM的10次识别准确率基本保持着较高水平,验证了CMP方法的有效性。为了更直观体现本文算法的优势,统计了上述5种算法的平均训练时长以及平均识别准确率,统计结果如图8所示。

图8 降维算法对比Fig.8 Comparison of dimensionality reduction algorithms

由图8可知,CMP算法平均准确率最高,识别准确率达到97.01%,较其他方法高2.6%~6.0%。CMP方法10次准确率计算平均训练时长较小,仅高于LPP方法,但故障识别准确率优于LPP方法,证明了CMP算法具有较好的稳定性以及优秀的降维效果,能够有效地保持样本全局结构和类别的局部关系,降低冗余特征的影响,较其他降维方法具有更优秀的信息保留能力。

为进一步验证CMP和IGWO-SVM算法结合的必要性,将未降维的高维特征矩阵输入到IGWO-SVM中进行故障分类,统计10次识别结果的平均值,并与图7中CMP-IGWO-SVM方法的平均准确率进行对比,对比结果如表4所示。

表4 不同方法的正确识别率Tab.4 Different methods correctly identify rates

由表4可知,第2组的准确率高于第1组,模型训练时间少于第1组。这表明经IGWO方法进行参数寻优后的SVM分类器能够有效提升故障分类的准确率,并缩短SVM模型训练时间。而第3组试验较其他两组具有更高的准确率和更少的模型训练时间,这说明高维数据经CMP方法二次特征提取后能够有效减弱冗余特征对分类辨识的影响,叠加SVM分类器参数优化的效果。

为进一步验证本文算法在不同数据集以及复合故障条件下的有效性,选取表1东南大学的轴承数据进行试验,对10种信号添加1 dB的随机噪声,每个样本有4 000个数据点,共100个样本,设置CMP算法修正中心近邻数为k=3,局部近邻数为k0=3,热核参数η=1。设置IGWO狼群数量为10,最大迭代代数为100,核函数参数γ和惩罚因子C的取值范围为[0.01,100.00]。SVM识别过程以每个类别70个样本为训练集,30个样本为测试集,降维维度设置为5维。采用PCA,LPP,KPCA,ISOMAP,CMP共5种方法进行降维,为了减小偶然因素的影响,每种方法计算10次,其模式识别结果如图9所示。

图9 降维算法对比Fig.9 Comparison of dimensionality reduction algorithms

由图9可知,在非单一故障的条件下,采用CMP算法降维的识别结果仍然是最高的,其平均时长略高于LPP算法,CMP算法的表现结果与图8的分析结果一致,验证了CMP具有较好的稳定性以及CMP-IGWO-SVM在复合故障条件下的有效性。

3.4 对比试验

为了进一步验证本文所提方法的优越性,对比了文献[17]提出的集成KPCA与t分布随机邻域嵌入(t-distributed stochastic neighbor embedding, t-SNE)滚动轴承故障分类方法。试验数据选取表3数据,两种方法识别结果如图10所示。

图10 其他方法对比Fig.10 Comparison of other methods

如图10可知,CMP-IGWO-SVM滚动轴承故障分类方法准确率高于王望望等所提方法,识别准确率提升了1.6%。上述试验表明本文方法在维数约简过程中能有效提取出敏感特征并较好的保留高维样本分布信息,有效地提高了各类样本的辨识度。

4 结 论

针对滚动轴承故障分类中全局信息损失和模态识别精度低的问题,提出一种CMP-IGWO-SVM的滚动轴承故障分类方法。试验结果表明,该方法具有较快的模型训练速度和较好的类别辨识能力,具体结论如下:

(1)本文针对高维特征信息保留问题,首次提出一种新型投影算法--CMP,CMP算法能较好的保留样本高维空间分布信息,融合样本高维空间全局分布信息和样本局部信息,实现了高维特征数据集中低维敏感特征矩阵的有效提取。

(2)通过引入正态分布的钟形收敛因子以及前进式搜索和包围式搜索模式实现了GWO算法的优化,利用IGWO算法实现了SVM参数的自主寻优。多组试验结果表明,经过优化的SVM有效的提高了故障识别率和模型的训练速度。

(3)CMP-IGWO-SVM的滚动轴承故障分类方法充分结合了CMP强大的特征二次提取能力和SVM优秀的小样本分类性能,有效地弱化了特征冗余成分对诊断结果的影响,实现了滚动轴承更高精度的故障分类。

猜你喜欢

降维全局局部
混动成为降维打击的实力 东风风神皓极
Cahn-Hilliard-Brinkman系统的全局吸引子
量子Navier-Stokes方程弱解的全局存在性
局部分解 巧妙求值
非局部AB-NLS方程的双线性Bäcklund和Darboux变换与非线性波
降维打击
落子山东,意在全局
局部遮光器
吴观真漆画作品选
新思路:牵一发动全局