APP下载

采用自适应基因粒子群算法优化隐马尔科夫模型的方法及应用

2018-08-14张西宁雷威杨雨薇张雯雯

西安交通大学学报 2018年8期
关键词:降维适应度轴承

张西宁, 雷威, 杨雨薇, 张雯雯

(西安交通大学机械制造系统工程国家重点实验室, 710049, 西安)

自Baum等人建立隐马尔科夫(HMM)理论基础以来[1],HMM首先在语音识别领域得到广泛应用[2-4]。由于HMM具有严谨的数据结构、可靠的计算性能以及良好的可解释性,其应用扩展到人脸检测[5]、手语识别[6]、车牌识别[7]、机械设备监测以及故障诊断等领域[8]。但是,解决HMM参数学习问题的Baum-Welch算法是一种局部择优的爬山算法,易陷入局部最优解[9]。

由于智能优化算法对目标函数有无解析表达式不作要求,对计算中数据的不确定性也有很强的适应能力[10]。因此,一些专家学者将智能优化算法应用到HMM模型的参数优化中。Zheng等人采用遗传算法对HMM进行参数优化估计,并将改进后的HMM用于光伏逆变器故障的识别和诊断中[11]。Liao等人使用粒子群算法优化HMM的参数,并应用于滚动轴承的故障诊断中[12]。李荣等人提出了一种采用改进遗传退火算法优化HMM参数的Web抽取方法,实验表明该方法能有效提高抽取准确率和寻优性能[13]。

优化算法多种多样,每种方法都有优缺点[14]。如遗传算法具有较强的全局寻优性能,但存在早熟、局部寻优能力差的问题;粒子群算法收敛速度快、参数少,但存在易陷入局部最优、搜索精度不高的问题;模拟退火算法通用性强,但收敛速度较慢。单一优化算法都有应用的优势与不足,不存在占绝对优势的优化算法。融合不同的优化算法或引入其他算法的思想,可充分发挥他们各自优势,提高算法的局部和全局寻优能力[15],如基因粒子群算法(GAPSO)[16]、遗传退火算法(GAA)[13]等。

本文提出一种采用自适应的基因粒子群算法优化隐HMM模型的方法。利用遗传算法与粒子群算法之间的互补性,将这两种算法相结合,改进了其遗传操作。在此基础上,使用了一种自适应调整的优化方法,对基因粒子群算法主要参数的设置方法进行改进,并应用于滚动轴承的故障诊断中,验证该方法的有效性。

1 理论基础

1.1 特征提取及数据降维

滚动轴承的振动信号中包含着丰富的状态信息。当滚动轴承的运行状态发生变化时,其时域信号的概率分布以及幅值信息会发生变化,频域中的主能量谱峰的位置以及不同频率的能量也会发生相应的变化,同时时频能量也会发生变化。不同的指标表征的信息是不一致的,单域或者单一的特征难以全面地刻画出滚动轴承的运行状态。

本文通过提取滚动轴承振动信号的时域、频域、时频域特征构造混合域的故障特征集。其中,时域特征包括均方值、方差、方根幅值等14个指标[17];频域特征包括13个频谱指标[18]和7个功率谱密度函数指标[19],时频特征可以通过提取振动信号的连续小波尺度能量谱构造,表达式如下

(1)

式中:Wf(a,b)是小波变换的幅值;E(a)是信号在尺度为a时的能量值,称为小波能谱。

连续小波能量谱能够同时反映信号在时域和频域上的能量分布特性。

使用不同方法提取出来的特征存在较大的差别,并不是特征维数越多越好。在提取的故障特征中可能存在不敏感特征,甚至是干扰特征,因此需要对提取的故障特征集进行降维。主分量分析(PCA)是一种基于特征融合的降维方法,不仅能够有效地提取信号中的信息,而且降维后的数据各维度之间不存在冗余,在数据降维和特征压缩方面应用广泛。本文采用PCA对故障特征集进行降维。

1.2 基因粒子群算法

在粒子群算法(PSO)[20]中引入遗传算法中的杂交和变异步骤,并改进了其遗传操作,得到一种整体性能更优的基因粒子群算法。新算法既保留了粒子群算法快速收敛的优点,同时又融合了遗传算法的全局搜索性能。

在每一代中,首先计算出每个个体的适应度值,对其位置以及速度进行更新。然后按照适应度值从小到大进行排序。选择出排名靠前的保留数个体作为优秀样本保留到下一代;从种群中选择交叉数和变异数个体进行杂交以及变异操作,后代作为下一代的组成部分。下一代种群便由保留个体、杂交产生的个体以及变异产生的个体组成。

GAPSO算法选择了基于局部竞争机制[21]的选择方法,主要是由于其计算量小,对群体规模没有要求。杂交操作是把两个父代个体进行重组进而生成新个体的操作,体现了不同个体间的信息交换,实现算法在全局范围的搜索。变异操作的主要作用在于维持种群的多样性,防止早熟收敛,采用施加随机扰动的策略对选择的粒子进行变异操作。

2 HMM初始参数的优化

2.1 隐马尔科夫模型

隐马尔科夫模型是在马尔科夫链的基础之上发展起来的。由于实际问题比马尔科夫链模型所描述的更为复杂,观察到的事件并不是与状态一一对应的,而是通过一组概率分布相联系,这样的模型称为HMM。HMM是一个双重随机过程:马尔科夫链和一般随机过程,其中马尔科夫链用于描述状态之间的转移,一般随机过程描述状态和观测变量之间的统计关系[22]。

将HMM应用于工程实践中需要解决3个问题:评估问题,解码问题和学习问题。伴随着3个问题的解决逐渐形成了3个基本算法:前-后向算法,Viterbi算法和Baum-Welch算法。

解决HMM参数学习问题的Baum-Welch算法是通过迭代逐步近似极大化似然函数的下界实现的,因此只能保证收敛到对数似然函数序列的局部极值点,而非全局极值点。在HMM理论中,由训练数据集得到HMM参数时,选取不同的初始模型参数将得到不同的训练结果,选取较好的初始模型,使最后求出的局部极大值和全局最大值接近[8]。初始状态矩阵和状态转移矩阵的初值选取对HMM的训练结果影响不大,可以随机选取,但混淆矩阵的初值对训练结果有较大影响,使用优化算法对HMM初值的选取进行优化。

2.2 自适应GAPSO算法优化HMM初始参数

为提高GAPSO算法的优化性能,使用了一种自适应调整的优化方法[23],对算法中主要参数的设置进行改进,具体公式如下

C(t)=D(t)/max(D(t))

(4)

c1=2C;c2=2-c1

(5)

w=C(t)=D(t)/max(D(t))

(6)

式中:c1、c2表示自适应的加速系数;w表示自适应的惯性权重;D(t)表示各粒子到全局最优点的平均距离;C(t)表示各粒子到全局最优点的平均距离与平均距离最大值的比值。

根据上述分析,本文提出了基于自适应GAPSO算法优化HMM初始参数的滚动轴承故障诊断方法。HMM初始参数优化及模型训练流程如图1所示,具体步骤如下:

(1)首先提取滚动轴承训练信号故障特征,构造故障特征集;

(2)使用主成分分析(PCA)技术对提取出的故障特征集进行维数约简,并对降维后的故障特征集进行标量量化;

(3)将量化后的特征作为训练参数输入到参数优化环节,参数优化过程以前-后向算法作为适应度函数;

(4)将各种故障模式下的特征数据以及优化后的初始参数作为Baum-Welch算法的输入,训练各种故障模式下的HMM,建立模型库。

图1 HMM初始参数优化及模型训练流程

图2 待诊断信号的处理流程

待诊断信号的处理流程如图2所示,其步骤如下:

(1)提取待诊断信号的故障特征,构造故障特征集;

(2)对故障特征集进行降维与标量量化,降维与量化方法与优化训练流程相同;

(3)将量化后的待诊断特征输入到训练好的模型中,使用前-后向算法计算各个模型输出的对数似然概率值,似然概率值最大的那个模型对应待诊断轴承的故障模式。

3 自适应GAPSO算法的优化性能分析

3.1 GAPSO算法的性能分析

以某次滚动轴承的隐马尔科夫模型的初始参数优化为例来分析GAPSO算法的性能。

从图3中可以看到,标准PSO算法的适应度值很快收敛于86.04,而GAPSO算法则在多次跳变之后收敛于69.28。对比标准PSO算法与GAPSO算法的适应度值收敛结果,可以推测是杂交和变异的操作使得GAPSO算法跳出局部最优,从而找出更加优越的空间位置。

图3 标准PSO算法和GAPSO算法的收敛曲线

下面,分析粒子跳出局部最优的具体过程。以GAPSO算法中第45代到第46代为例,最优适应度值从80.88降到78.72。

从图4可以看到,在第45代到第46代,第35号粒子跳出先前的局部最优位置,成为适应度值最低的粒子。

在算法中下一代的构成包括保留粒子、杂交后代、变异后代。在参数设置时,种群规模为40,保留数为20,杂交数为14,变异数为6,并且每次更新按照保留粒子、杂交后代、变异后代的顺序存放,因此第35号粒子为变异粒子。进而证明了该次跳出局部最优是由于变异操作导致的。

(a)第45代

(b)第46代图4 第45代和第46代群体最优粒子的适应度值

3.2 自适应GAPSO算法的性能分析

图5是GAPSO算法和自适应GAPSO算法的适应度值收敛曲线,从图中可以看出,自适应GAPSO算法比GAPSO算法的收敛速度要快。

图5 GAPSO算法和自适应GAPSO算法的收敛曲线

图6 惯性权重系数随迭代次数的变化情况

图6是自适应GAPSO算法中惯性权重系数随迭代次数变化曲线。在0~72步时,由于粒子处于刚开始搜索的阶段,各粒子距离全局最优均很远,因此,D(t)与max(D(t))很接近,w接近于1。此时粒子适应度值的收敛速度较快,全局搜索能力较强。随着迭代的进行,粒子逐渐靠近全局最优值,D(t)与max(D(t))的比值也逐渐减小。在第72步之后,当惯性权重接近于0时,说明粒子已经聚拢在全局最优值的附近,此时粒子以前速度对当前速度没有影响,粒子则在全局最优附近搜索更加优越的位置,此时粒子的局部搜索能力较强。因此,这种自适应的控制惯性权重的方法能够在迭代收敛的过程中,平衡全局和局部搜索能力,有效地减少迭代步数,从而提高收敛速度。

4 实验结果

4.1 滚动轴承实验及特征提取

本文实验台如图7所示,包括直流电机、滚动轴承安装架、加载装置和滚动轴承等部分。实验轴承选用了4种6308深沟球轴承,分别是正常、内圈剥落、外圈剥落和滚动体剥落状态。实验时,轴承内圈转速为1 050 r/min,传感器为龙科测控公司的LK111-03加速度传感器,数采卡为ART 2000型USB数据采集卡。采样频率为10 kHz,采样时间持续4 s。

图7 滚动轴承实验台

本文实验每种状态采集10组数据,共40组数据。数据处理时,首先将每组数据分成10帧,每帧4 096点数据,对每段数据提取混合域故障特征,并使用主分量分析对提取的混合域故障特征集进行降维。使用PCA对混合域特征集进行降维处理得到的特征,其2维特征累积贡献率就达到88.90%,如图8所示。

图8 降维后的2维特征

4.2 HMM初始参数的优化

初始状态矩阵和状态转移矩阵的初值选取对HMM的训练结果影响不大,可以随机选取。但混淆矩阵的初值对训练结果有较大影响,这里对其进行优化。选取上节降维后的2维特征,并将每组的前10帧作为优化混淆矩阵时的训练数据。算法对4种状态的HMM模型初始参数优化过程如图9所示,这里将3种算法的优化过程放在一起作对比。

(a)正常轴承模型

(b)内圈故障模型

(c)外圈故障模型

从4种状态的HMM初始参数的优化过程可以看到,GAPSO和自适应GAPSO算法优化的适应度收敛值远低于标准PSO算法,说明这两种方法的全局寻优能力要优于标准PSO算法。自适应GAPSO算法与GAPSO算法的适应度值的收敛值相差不大,但是自适应GAPSO算法的收敛速度要优于GAPSO算法。

(d)滚动体故障模型图9 4种轴承状态HMM初始参数的优化过程

4.3 HMM模型的训练以及诊断结果

选取每种状态的前10帧作为训练数据,HMM的状态数设为4,量化级数设为30,并将最大迭代步数设为20。将优化的结果作为Baum_Welch算法的初始参数,分别训练4种状态下的HMM模型。

将降维后每种状态的特征集后90帧作为测试集,每10帧作为一组输入到训练好的模型中作测试用。由于自适应GAPSO算法与GAPSO算法适应度值收敛结果相差不大,这里仅对比标准PSO算法优化4种HMM模型初始参数(PSO-HMM),以及自适应GAPSO算法优化4种HMM模型初始参数(自适应GAPSO-HMM)的测试结果。PSO-HMM以及自适应GAPSO-HMM的输出结果如图10和图11所示。

表1对比了PSO-HMM与自适应GAPSO-HMM分类正确率。从中可以看到,自适应GAPSO-HMM的分类正确率要优于PSO-HMM,其中内圈故障数据的分类正确率提高了12.5%,滚动体故障数据的分类正确率提高了28.57%。

表1 PSO-HMM与自适应GAPSO-HMM

(a)正常轴承

(b)内圈故障轴承

(c)外圈故障轴承

为了充分对比自适应GAPSO-HMM与PSO-HMM的分类效果和可靠性。定义了描述分类可靠性的量分类离散度[24]

(d)滚动体故障轴承图10 4种轴承状态PSO-HMM的诊断结果

式中:λi为第i种模式下的HMM模型参数;logPmax(O|λi)、logPmax′(O|λi)、logPmin(O|λi)分别为在该模型下的最大、次大、最小对数似然概率值。分类离散度越接近100,说明分类效果越好;分类离散度越接近0,说明分类效果越差。

(a)正常轴承

(b)内圈故障轴承

(c)外圈故障轴承

(d)滚动体故障轴承图11 4种轴承状态自适应GAPSO-HMM的诊断结果

从表2中可以看到,自适应GAPSO-HMM的分类效果要优于PSO-HMM。其中内圈故障数据的分类离散度提高了206.75%,外圈故障数据的分类离散度提高了0.54%,滚动体故障数据的分类正确率提高了268.58%。

表2 4种轴承状态下PSO-HMM与自适应GAPSO-的HMM分类离散度

5 结 论

本文提出了一种自适应GAPSO算法优化HMM模型初始参数的方法,给出了操作流程和改进方法。为验证所提方法的有效性,在滚动轴承的故障诊断实验中,将自适应GAPSO-HMM与PSO-HMM作对比,得到结论如下。

(1)自适应GAPSO算法中的杂交以及变异操作使算法具有较强的全局寻优能力。

(2)自适应GAPSO算法具有优于GAPSO算法的收敛速度。

(3)自适应GAPSO-HMM的分类效果优于PSO-HMM,最高将分类准确率提高了28.57%,分类离散度提高了268.5%。

猜你喜欢

降维适应度轴承
改进的自适应复制、交叉和突变遗传算法
混动成为降维打击的实力 东风风神皓极
轴承知识
轴承知识
轴承知识
轴承知识
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
降维打击
一种基于改进适应度的多机器人协作策略
基于空调导风板成型工艺的Kriging模型适应度研究