APP下载

一种基于概率盒—HGWO优化SVM的滚动轴承故障诊断方法

2021-12-02路小娟石成基

振动与冲击 2021年22期
关键词:灰狼特征提取故障诊断

路小娟,石成基

(兰州交通大学 自动化与电气工程学院,兰州 730070)

滚动轴承作为旋转机械设备的重要组成部分,在长期大负荷、高强度的复杂工况下,极易产生各种故障,导致机械设备工作性能恶化,直接影响了生产系统的安全稳定运行。采用单一的智能检测方法已经很难得到准确的诊断结果。如何融合多种数据源,实施对目标轴承进行快速、可靠的检测,使其诊断结果具有准确性和稳定性成为研究的热点和难点,具有一定的研究价值和实际的应用需求。

故障诊断问题的多维化和复杂化致使基于信号处理的诊断技术愈加繁琐。近年来,随着机器学习技术的快速发展,使得数据驱动的智能化故障检测和诊断技术受到广大学者的广泛关注。文献[1]利用深度神经网络与浅层学习机相结合的方法构建混合智能故障诊断模型,达到了轴承故障诊断的目的。文献[2]中,金棋等人提出一种基于深度学习特征提取的行星齿轮箱故障的方法,利用多个堆栈降噪自编码器提取故障特征来实现对齿轮箱的故障诊断。文献[3]利用基于多小波系数的故障特征提取的方法,提取机械振动信号多小波系数的最大值、最小值以及均值等统计特征用于故障诊断。文献[4]利用深度置信网络对齿轮系统的振动信号进行特征提取,然后利用DBNS强大的映射表征能力进行故障辨识。文献[5]是通过局部均值分解算法对故障信号进行自适应分解,然后利用峭度准则及切片双谱分析来提取故障特征的频率信息。文献[6]提出在不同噪声强度背景下的振动信号进行故障特征提取,采用优化广义S变换的滚动轴承故障特征提取方法并取得了一定的效果。

滚动轴承的振动信号是一种非平稳、非线性的信号,如何进行信号处理是特征提取的关键,特征提取的优劣直接影响到智能故障诊断系统对故障诊断结果的准确性。现有做法通常是从振动信号等检测数据中提取包络谱特征[7]、时频特征[8]和小波特征[9]等故障特征,进而用于朴素Bayes[10]分类器等智能检测模型进行故障诊断。但多数研究在信息融合时都要对原始信号进行特征提取,导致了原始信号大量信息的丢失,致使信息融合不完善。概率盒(probability-box,p-box)理论是用来表征不确定数组成的偶然不确定性和认知不确定性,在定量不确定性建模方面有着天然的优势。本文利用p-box建模将诸多不确定性问题考虑在内进行信息融合,可以有效防止传统特征提取所造成的大量有用概率信息丢失的问题。支持向量机(support vector machine,SVM)是一种建立在统计学习理论上和VC维结构理论的模式识别方法,在其核函数σ和惩罚因子C选择的过程中利用混合改进的灰狼算法(hybrid improved grey wolf optimization,HGWO)进行优化,以提高在处理小样本、非线性问题上的泛化能力,增强其模式识别的能力。

本文提出基于p-box和HGWO-SVM的滚动轴承诊断方法。首先利用概率盒进行多源信息融合,然后提取故障特征,以解决信息不确定的问题,提高诊断精度。最后利用HGWO-SVM诊断模型进行故障诊断,得出诊断结果。经试验验证,该方法具有较高的故障辨识能力和诊断效率。

1 概率盒理论

概率盒是将指标数据放在一个界限范围内,对其概率界限进行分析,并根据界限提取数据的特征向量用于故障诊断,能更好的解决在机械故障诊断过程中各数据特征的不确定性、信息源的未知性和测量不确定性等问题。

1.1 概率盒及D-S结构

概率盒的下边界

(1)

概率盒的上边界

(2)

概率盒的示意图如图1所示。

图1 p-box示意图

p-box的核心是D-S结构体(dempster-shafer structures,DSS)。DSS是基于D-S证据理论[11]提出来的,是多个焦元构成的集合,而每个焦元包含一个区间和一个信度。DSS的基本结构形式可表示为

{([x1,y1],m1),([x2,y2],m2),…,([xn,yn],mn)}

(3)

其中,m称为概率片,应满足∑mi=1,xi≤yi,且当xi=yi时,yi≠yj,i=1,2,3,…,n。

p-box与DSS之间可以理解为整体与部分的关系,p-box的左边界可由DSS的每个小区间左界累积得到,即

(4)

同理,p-box的右边界可由DSS的每个小区间右界累积得到,即

(5)

两条折线所包含的就是概率盒,两虚线围成的矩形区域是DSS焦元,横坐标表示区间,矩形的高表示焦元的mass值,如图2所示。

图2 DSS转换为p-box示意图

同样,p-box间的卷积运算需要将其离散化,这里将p-box分解为等信度的DSS,如图3所示,每两条虚线间为DSS焦元,每个焦元对应的mass值相等。

图3 p-box等信度离散化

1.2 概率盒建模

概率盒的来源有很多种,包括卷积建模方法、鲁棒贝叶斯方法、专家估计方法和试验测量方法等。为了保留原始数据丰富的概率统计信息,本文在概率盒试验测量建模的基础上,采用根据原始数据直接建立概率盒的方法[12],称为概率盒直接建模方法(the p-box modeling method based on raw data,RDPMM)。RDPMM的优势在于其不用验证数据的概率分布类型,可直接根据原始数据进行建模,因此应用范围较广。p-box直接建模得到的p-box的边界是最窄的,即紧致性最高。

RDPMM建模方法的算法是将原始数据按采样频率转换成m行n列的数组,m为采样次数,n为采样频率;将每次采样的数据按递增顺序排序,得到新的数组,然后计算各自排列熵值,找到每组的最小值和最大值的行向量;最后累加最小值行向量和最大值行向量得到概率盒的下边界和上边界。故障信号p-box的建模流程如图4所示。

图4 p-box建模流程图

1.3 概率盒的信息融合与特征提取

在不同的条件下,或者采用不同的方法可以得到多个不同概率盒,为了能够进一步得到信息相对一致、完整的概率盒,就需要将不同的概率盒进行融合。概率盒融合的常用方法包括:贝叶斯融合、交集融合、包络、DS证据体融合以及均值融合等。本文采用包络的方法对不同的概率盒进行数据的融合,其融合的基本原理如下:

定义有n个概率盒

它们的包络定义为

则有如下表示

将含有不同信息的概率盒进行融合之后再提取其特征量可以有效的增加故障诊断的准确度。本文采用累积不确定测量方法实现p-box的特征提取,用于后期SVM的故障识别。结合相关文献对融合后的概率盒进行其6个特征向量的提取,所提取特征向量为:①累积宽度;②对数累积宽度;③累积区间边界值;④边界值;⑤矛盾区间统计;⑥置信区间。

2 基于HGWO-SVM的故障诊断

2.1 灰狼算法

2014年澳大利亚学者Mirjalili等[13]根据大自然中灰狼种群的等级制度和狼群种族集体围攻、狩猎的过程提出了一种群智能优化算法——灰狼算法(grey wolf optimization,GWO)。灰狼种群的的等级结构如图5所示。

图5 灰狼种群等级结构图

GWO在每一次的优化过程中,取得最优解的三只狼的位置以此标记为α,β,δ,其余狼的位置标记为ω。由每一代种群的最优解的三只狼的位置α,β,δ指导ω完成[14],其算法模型如图6所示[15]。

图6 灰狼种群算法模型

在GWO算法寻求猎物(最优解)的过程中,全局最优灰狼的位置即为猎物的位置,位置标记为ω的狼跟随着位置前三优α,β,δ狼的位置进行更新,其位置更新过程表示为

D=|CXP(t)-X(t)|

(6)

X(t+1)=XP(t)-AD

(7)

式中,t为迭代次数;D为狼群中个体狼与猎物之间的近距离;XP为猎物位置;X为灰狼位置;A和C为随机向量且计算公式为

A=2ar1-a

(8)

C=2r2

(9)

|a|=2(1-t/T)

(10)

式中:a为收敛因子,其值从2~0线性递减;t为当前迭代次数;T为最大迭代次数;r1,r2∈[0,1]为随机值。当|A|>1时,狼群扩大围捕猎物的范围,实现全局寻优;当|A|<1时,狼群将围捕猎物的范围缩小,实现局部寻优。

A,C值的变化可反映灰狼群从各个方向向猎物靠近,通过式(6)可计算出α,β,δ狼与猎物之间的距离Dα,Dβ,Dδ,以引导ω狼共同捕食猎物,从而达到更新灰狼位置的目的,其数学表达为

(11)

X(t+1)=(X1+X2+X3)/3

(12)

式中,X1,X2,X3为狼群ω被α,β,δ三只狼指导过后更新的位置。

2.2 改进的灰狼算法

2.2.1 优化收敛因子a

由于参数A直接影响了算法的全局搜索能力和局部的探索能力,而收敛因子a决定了A的取值。原灰狼算法中收敛因子a的值从2~0线性递减,容易使算法收敛过早,陷入局部最优[16]。为避免算法早熟,引入非线性余弦收敛因子,表达式为

(13)

式(13)定义的余弦因子与原线性收敛因子的收敛趋势,如图7所示。由图7可知,余弦收敛因子在迭代前期有着收敛速度缓慢,有利于增加灰狼种群的多样性,便于寻求全局最优解,而在迭代后期,余弦收敛因子的下降速度加快,更有利于提升算法的收敛速度。

图7 收敛因子收敛趋势

2.2.2 引入莱维飞行策略

为进一步弥补GWO过早收敛以及收敛精度低的不足,在优化收敛因子a的基础上引入莱维(Levy)飞行策略[17]。Levy飞行策略具有随机游走的特性,可以增加算法中种群的多样性,有效的跳出局部最优,更好的平衡全局和局部的搜索能力。基于Levy飞行策略改进灰狼位置更新公式为

X(t+1)=X(t)+κ⊕Levy(γ)

(14)

式中:X(t)为当代灰狼在t迭代的位置;κ为步长控制量,一般取0.01;⊕为点对点乘法;Levy(γ)为随机搜索路径,计算为

Levy(γ)=Sstep·(X(t)-Xm(t))·Rrandn

(15)

(16)

式中:γ为[0,2]之间的常数,文中取γ=1.5;Sstep为随机步长;X(t)为灰狼种群更新后的位置;Xm(t)为t次迭代时α,β,δ三只灰狼的位置;Rrandn为服从正态分布的随机数;μ和ν服从的正态分布如下所示

(17)

(18)

式中,Γ为伽马函数。

在灰狼种群位置更新公式的基础上引入Levy飞行策略扩大其搜索范围,对其位置进行进一步更新,再代入式(6)~式(9)分析灰狼个体与猎物间的位置关系。灰狼算法位置更新公式引入Levy飞行策略后,可以有效地提升整体搜索的性能,加强算法的灵活性。

2.2.3 算法测试

为验证采用非线性余弦收敛因子和Levy飞行策略的混合方法对传统灰狼算法改进后的优越性,利用多峰函数Rastrigin[18]对HGWO、GWO、PSO和GA 4种算法进行测试。其中Rastrigin函数为

(19)

式中:定义维度为30;范围为[-5.12,5.12];最优最小值为0。

参数设置:种群维度30,最大迭代次数为500,学习因子均为2,定义惯性权重由0.9~0.3线性递减。Rastrigin函数图像及其测试算法收敛结果,如图8所示。

图8 测试结果

由图8可知,在求解有局部最优的多峰函数Rastrigin时,相较于GWO算法,HGWO算法在寻求理论最优0值,且在收敛速度和收敛精度上都具有更加明显的优势。这充分说明了采用非线性余弦收敛因子和Levy飞行策略更有利于算法权衡全局搜索和局部开发的能力。

2.3 HGWO对SVM参数优化

SVM模型对故障分类的能力主要取决于其惩罚因子C与核函数参数σ。以训练集的平均故障准确识别率为优化目标,在数次迭代过程中保留最优解。本文将全局搜索性能较好的HGWO算法应用于SVM的参数寻优中,其具体步骤如下:

步骤1初始化SVM的参数C,σ以及HGWO中狼群的规模和最大迭代次数;

步骤2对灰狼种群进行初始化,确认其个体的位置向量,即C,σ的初始值;

步骤3以SVM当前的识别准确率作为适应度函数,学习和训练初始的训练样本,再计算得出灰狼个体的适应度值;

步骤4根据适应度值对灰狼种群进行登记划分,然后根据位置公式对灰狼个体的位置信息进行更新;

步骤5根据α,β,δ的位置信息更新其他搜索个体的位置;

步骤6更新a,A,C,确定新的Xα,Xβ和Xδ。

步骤7若迭代超过最大迭代次数,则训练结束,输出全局最优位置,即SVM中的C,σ。否则跳至步骤5;

步骤8用HGWO算法输出的最佳参数构建SVM模型,实现对滚动轴承的故障诊断。

2.4 基于HGWO-SVM的故障诊断

本文所提智能故障诊断模型的核心在于利用概率盒理论对滚动轴承的原始振动信号进行直接建模,避免了原数据中有效概率信息的丢失。将原始信号先转换为p-box,再实现其融合,使得信息融合时的时空配准问题得到有效解决,最后利用p-box特征提取的方法对融合后的p-box进行特征提取,获得其有效特征向量。而其关键在于利用非线性余弦收敛因子和Levy飞行策略的混合方法改进过后的灰狼算法对SVM的参数进行优化训练,使其减小分类误差,实现对滚动轴承故障类型的准确识别。故障诊断方法整体设计示意图,如图9所示。

图9 故障诊断方法整体设计流程

3 试验分析

3.1 数据集介绍

为验证本文所提智能故障诊断模型的有效性,将滚动轴承故障振动信号作为具体的研究对象,采用目前基于振动信号轴承故障诊断研究常用的公开数据集——美国凯斯西储大学提供的数据作为试验数据。滚动轴承试验状态有正常、内圈故障、外圈故障和滚动体故障4种。转速为1 750 r/min,采样频率为12 kHz,故障损伤直径为0.1 778 mm,轴承在4种状态下振动信号的时域波形图,如图10所示。1组正常数据和3组故障数据共计1 200组样本,每组包含2 048个采样点。滚动轴承每种运行状态有300组数据,随机将数据按2∶1划分为训练集和测试集,这样保证了数据的均衡性,有助于提高模型的诊断精度。轴承数据样本组合如表1所示。

图10 滚动轴承振动信号时域波形图

表1 滚动轴承试验数据表

3.2 基于p-box和HGWO-SVM的故障诊断

通过概率盒直接建模的方法得到4个概率盒,分别对应着滚动轴承的4种状态:正常状态、内圈故障、外圈故障和滚动体故障。在获取滚动轴承振动信号的过程中,由于传感器分布的位置不同,会导致在轴承相同的运行状态下的数据存在信息的冗余和互补。因此需要将得到的概率盒进行融合来实现进一步优化,以便后续的模式识别。采用包络的方法对不同的概率盒进行数据的融合,融合结果如图11所示。

图11 p-box融合结果

采用累积不确定测量方法对图11中4个p-box进行特征提取,提取结果如表2所示。

表2 p-box特征向量数据表示

根据试验数据,分别获得每种轴承状态下300组概率盒特征向量,200组用于训练SVM模型,100组用于模型性能测试。

SVM的分类性能受其参数影响较大,这里采用HGWO算法对SVM进行参数寻优,HGWO算法以及SVM参数寻优范围,如表3所示。

表3 HGWO-SVM参数设置

SVM参数优化适应度曲线,如图12所示。在经历约3次迭代后适应度达到最佳,而在约22次迭代后,平均适应度曲线趋向稳定。对于人工随机选取参数而言,利用HGWO进行参数寻优有助于节约时间,更能提高准确率。

图12 HGWO-SVM参数优化适应度曲线

利用滚动轴承4种状态的概率盒特征向量测试集对HGWO-SVM模型进行测试,得到模型测试集分类结果如图13所示。图中:“○”表示实际类别;“*”表示预测类别;纵坐标“1”、“2”、“3”和“4”编号分别表示表1中轴承的4种状态。从分类结果可以直观的看出基于p-box和HGWO-SVM的诊断模型仅出现个别分类错误,其他测试数据均取得正确的分类结果。由图13可知,故障分类诊断率约为98.8%。可见,本文所提出的诊断方法具有较高的预测精度,对滚动轴承故障类别能作出准确分类。

图13 HGWO-SVM分类结果

3.3 对比试验

为进一步验证本文所提方法在滚动轴承故障诊断方面的优越性,下面给出两种常用的故障诊断方法与之对比:

①基于小波包特征提取和粒子群优化算法(partucle swarm optimization,PSO)的支持向量机的故障诊断模型(PSO-SVM);

②基于卷积神经网络(convolutional neural networks,CNN)特征提取和遗传优化算法(genetic algorithm,GA)和支持向量机的故障诊断模型(GA-SVM)。

在融合后p-box特征提取的基础上,分别使用HGWO、PSO和GA算法对SVM的参数进行优化,迭代次数均设置为100,得到其适应度曲线如图14所示。有图14可知3种算法在SVM参数寻优的过程中均有良好的收敛性,最终都可以得到最优参数。但相比较而言,HGWO在寻优过程中所用的时间更少,对SVM的优化效果更佳。

图14 3种算法的适应度曲线对比图

由于群智优化算法在每次试验中的收敛结果都会存在一些偏差,所以用多次试验所得的平均识别率进行对比。在不改变试验条件的情况下,利用同一数据集在本文所用模型与两个对比模型中分别独立重复进行10次试验。模型①通过对原始信号进行小波包变换,得到不同频段的特征分量,进而计算得到4种状态下的小波能量分布,最后将其作为特征向量输入PSO-SVM来实现故障分类。模型②是用经过预处理后的原始信号数据训练CNN,然后把数据代入训练好的模型来获得特征向量,最后将其输入GA-SVM进行故障分类。

各重复10次试验后,得到诊断次数与识别准确率的关系,如图15所示。受特征提取方法和故障分类模型性能的综合影响,由图15可知,基于p-box-HGWO-SVM的诊断方法的故障识别率普遍较高,明显优于其他两种方法。

图15 不同模型识别率对比图

SVM参数寻优时间和故障诊断识别率是衡量诊断模型优劣的关键指标,通过以上对比试验表明,本文所用p-box-HGWO-SVM模型在故障的分类速度和分类准确度上都明显优于小波包-PSO-SVM模型和CNN-GA-SVM。因此,p-box-HGWO-SVM模型在滚动轴承的故障诊断中具有较强的实用性。

4 结 论

(1)充分利用了概率盒直接建模的方法获得紧致性最高的概率盒,发挥其在处理不确定问题和信息融合上的优势,有效地防止了大量概率信息的丢失。利用累计不确定性测量方法对概率盒进行特征提取,获得具有较强稳定性的特征向量用于故障诊断。

(2)采用非线性余弦收敛因子和Levy飞行策略对灰狼算法进行改进,使其具有良好全局搜索能力和局部探索能力,且全局收敛能力良好,结构简单,可以较大概率快速找到最优解。

(3)引入HGWO算法对SVM的参数进行优化,加强了SVM参数的优化效率。HGWO-SVM诊断模型具有较强的故障诊断准确率,可有效实现滚动轴承的故障辨识。

猜你喜欢

灰狼特征提取故障诊断
基于包络解调原理的低转速滚动轴承故障诊断
谷谷鸡和小灰狼
基于Daubechies(dbN)的飞行器音频特征提取
灰狼的大大喷嚏
Bagging RCSP脑电特征提取算法
灰狼和老虎
因果图定性分析法及其在故障诊断中的应用
灰狼的幸福
基于MED和循环域解调的多故障特征提取
基于LCD和排列熵的滚动轴承故障诊断