APP下载

基于遗传算法与SOM网络的轴承故障诊断方法

2023-12-26曹永华

机械设计与制造 2023年12期
关键词:父代遗传算法种群

黄 磊,马 圣,曹永华

(1.江苏航空职业技术学院航空工程学院,江苏 镇江 212134;2.成都芯米科技有限公司技术研发部,四川 成都 610213)

1 引言

轴承是旋转机械中承载工作载荷的核心部件,由于轴承寿命离散度较大,其性能的好坏能够决定旋转机械是否能保持既定性能进行工作[1]。但,轴承通常被安装在旋转机械内部,无法从外部直接接触,使得其监测效果较差,若诊断不及时会造成不必要的经济损失。

在传统的事后油液分析中,容易引入较多的不可控因素,如检验员经验差异引起的人为因素。随后转子动力学的兴起,使得可以通过旋转机械的振动信号对零部件进行分析[2]。除了基于振动信号频谱分析的诊断方法外,国内外逐渐兴起基于振动数据驱动的人工智能诊断方法。大多数人工智能诊断方法均基于监督式导师学习[3-4],需要事先对故障数据样本进行大量学习。但在实际工程中,突发故障信息难以被完全统计,而被记录的故障信息库常常是有限的。对于机载采集的新振动数据,若故障信息被涵盖在故障数据库中,则能被有效识别,否则会出现一定的误检现象。对于故障库数据信息有限的情况下,基于振动数据的无监督式学习人工智能诊断方法不断兴起。

自组织特征映射神经网络(Self-Organizing Feature Map,SOM)是一种典型的无监督式学习算法,无需对输入样本进行分类标记,便可完成对输入样本数据的学习和分类操作[5]。文献[6]提出一种基于距离保持的自组织神经网络诊断方法,将应用于齿轮、轴承等故障检测与分类中,并取得较好结果;文献[7]构建轴承故障与振动信号之间的关系,利用SOM网络进行故障识别;文献[8]提出一种基于局部特征尺度分解、模糊熵和SOM网络的故障诊断方法,实现液压泵故障的诊断;文献[9]引入免疫遗传算法优化SOM网络,实现对优化SOM网络在滚动轴承故障诊断中的运用。

综上所述,对于轴承故障诊断大多采用监督式学习方法外,非监督式SOM网络也被应用于轴承故障诊断中。但大多数文献中,仅简单对结果进行描述,并未详细明如何根据SOM网络诊断结果实现故障识别。因此,从轴承故障数据采集出发,提取时频域统计特征参数,并引入遗传算法对参数进行降维,用于SOM网络诊断。基于故障统计规则,实现对SOM网络激活神经元进行划分,实现故障结果分析。

2 遗传算法与SOM网络基本理论

2.1 SOM网络

文献[10]在1981年提出一种由全连接层的神经元阵列组成的无监督式学习网络—SOM网络。网络拓扑结构,如图1所示。由输入层和竞争层(输出层)组成。SOM网络基本流程详见参考文献[10],此处不再累述。

图1 SOM网络拓扑结构Fig.1 SOM Neural Network Topology

2.2 遗传算法

遗传算法基于生物进化而衍生的一种全局优化概率搜索算法,经过种群间交叉、变异等操作实现种群的进化与选择,经常被运用在求解NP问题、超参数优化等领域[11]。遗传算法种群间迭代循环过程主要包括:个体编码、种群初始化、交叉、变异、选择、适应度函数,而这些基本理论在相关文献[4]中已有描述,此处不再累述。在本研究中,遗传算法并不作为网络参数优化问题,而是基于遗传算法实现最优特征变量的筛选,这部分详细描述将在3.3节“基于遗传算法最优特征信号选取”中详细描述。

3 SOM诊断网络的建立

利用SOM网络实现轴承故障诊断,需要保证SOM诊断网络的健全性,即从数据输入到结果输出。因此,在SOM诊断网络的建立包括数据采集、故障特征集构建、SOM网络训练和诊断,其流程示意,如图2所示。其中内容将依次按照下小节进行描述。

图2 基于SOM网络的轴承诊断流程图Fig.2 Flow Chart of Bearing Diagnosis Based on SOM Neural Network

3.1 轴承信号采集

滚动轴承振动实验平台,如图3所示。实验中采用307型滚动轴承,转子转速为988r/min,每周期传感器采样1024个点,每次实验采集16个周期。振动信号模拟工况包括:正常、内环故障、外环故障、滚动体故障四种工况的轴承。滚动轴承部分故障信号呈现冲击形式,而疲劳剥落、腐蚀故障均会导致冲击信号的产生,为方便故障类型制备,在滚动轴承未进行淬火时采用机械冲击方式制成刮痕故障,用以模拟滚动轴承的疲劳剥落,模拟故障尺寸均为0.25mm。

图3 滚动轴承实验装置Fig.3 The Test Rig of the Rolling Element Bearing

3.2 时频域特征提取

基于数据驱动的轴承故障诊断,通常需要提取一些时频域上的指标[4],如:平均值、绝对值、峰峰值、均方根值、标准差、偏度、峭度、脉冲因子、波形因子、波峰因子、变异系数、方差等指标[4]。研究中,主要提取11个时域统计特征和15个频域统计特征,504组样本。

3.3 基于遗传算法的最优特征选取

避免时/频域中的部分特征因子存在共线性和耦合性给SOM网络诊断带来的影响,采用具有如下特征的遗传算法选取最优特征因子。

个体编码。假设A为n个变量ai(i=1,2,…,n)的集合;每一种可能的解S j(即个体)被编码为一个n维的二进制向量,在个体S j中,0表示变量ai未被选择,1表示变量ai被选择,则个体编码,如图4所示。

图4 个体编码Fig.4 Individual Encoding

初始化种群。种群被编码成一个j(j=1,2,…,N)行i(i=1,2,…,n)列的二进制矩阵M,矩阵M的每一行均为一个个体S j,每个种群中包含20个个体。

适应度函数。种群的适应度是基于BP网络分类结果的F1得分,F1得分是分类准确率和召回率的加权平均。这些参数可以通过混淆矩阵获得,混淆矩阵反映分类结果的真正例、假正例、假负例和真负例,关F1得分计算可参考文献[12]。

父代选择。将种群中的个体按照适应度大小进行排列,并按照式(1)计算新的适应度f:

式中:r—个体的排序;N—种群的规模;p—选择压力概率,其取值范围为[1.0~2.0]。在此过程中,个体随机选择模式被应用,其方式如下:

基于每个个体的f值,按照式(2)计算累积概率qi(注:式(2)中,当i=1时,q0=0)

选择根据式(3)遍历种群中所有个体,选择满足条件的k个父代。

交叉与变异操作。种群中20%个体通过变异获得子代,父代中每个基因变异概率为0.08;种群中80%的个体通过父代交叉获得子代,父代交叉点采用随机方式执行,其步骤如下:(1)选择父代1和父代2;(2)随机生成一个N维的二进制向量v,vi=0 或vi=1;(3)当vi=1时,父代1中的基因i被保留;当vi=0时,父代1中的基因i被父代2中基因i替换。

种群替换。保留种群中10%的精英个体,剩下的则由交叉、变异获得的个体替换,组成的新种群用于接下来的迭代计算。

由于四类故障共计504组样本集,随机选择380组数据集作为BP网络训练样本集,另随机不重复选择54组数据集作为校验集数据,剩下的74组数据作为测试集样本数据。由于BP网络随机初始值导致的不可复现问题,因此筛选变量时需在相同条件下重复试验25,选择出现概率大于0.6的特征参数,及出现频次大于15次的特征参量作为最优特征。根据25次重复试验共计选择9个特征,时域特征包括:方差、变异系数、标准偏差、绝对平均值;频域特征包括:绝对平均值、均方根、最小值、偏度、峭度。

3.4 SOM网络设计

从轴承4类故障共计504组样本中,随机选取424组样本对SOM网络训练,剩余80组作为测试数据。SOM网络竞争层采用(20×20)维400个神经元、距离函数采用boxdist()函数、采用hextop()六角结构网络;由于样本数量较大,对不同收敛步数进行分析并观察其网络权值变化,其变化,如图5所示。

图5 SOM网络权值分布Fig.5 SOM Neural Network Weight Distribution

由图5可以看出,当迭代步数达到500时,权值变化浮动不大,神经元训练趋于稳定,因此,SOM网络迭代步数设置500。

3.5 基于SOM网络的轴承故障诊断步骤

应用SOM网络对轴承故障样本进行诊断,其方式与监督式学习网络存在区别,需要根据输出神经元位置进行判断,其步骤如下:(1)选取标准故障样本;(2)对每一种标准故障样本进行训练,训练结束后对具有最大输出的神经元标以该故障标签;(3)将待检验样本输入到SOM神经网络中;(4)若输出神经元在输出层的位置与标准故障样本的位置相同,则待检验样本发生了相应的故障;若输出神经元在输出层的位置介于很多标准故障之间,则这几种故障均有可能发生,发生的概率由该位置与相应标准故障样本位置的欧式距离定。

4 SOM网络诊断结果分析

每类轴承故障样本126组,4类故障样本累积504组,网络结构如3.4节所述。随机不重复的从每类故障样本数据集中选择106组,共计424组用于SOM网络训练,剩余80组用于网络测试。

4种故障轴承样本在SOM网络模型中的反馈情况,如图6所示。正常轴承状况下的SOM网络被重复激活的神经较为分散,而内环、外环故障下被重复激活的神经元相对靠于边缘。四种状态下获得的激活神经元图没有较为明显的差异趋势,因此将不同故障下反馈神经元节点统计,由于神经元节点多达400个,因此仅统计每类故障激活次数达到两次以上的神经元,其统计结果,如表1所示。

表1 训练集下SOM网络神经元激活次数Tab.1 SOM Network Neuron Activation Times in the Training Set

图6 不同故障的神经元反馈云图Fig.6 Feedback Cloud Map of Neurons Under Different Fault

记录剩下80组测试集样本的故障类别,并将测试样本导入已训练的SOM 网络中,测试集下SOM 网络临近神经元之间距离,如图7所示。基于表1中各类故障激活神经元情况,对测试集下SOM网络激活神经元进行归类。在神经元归类过程中,其规则描述如下:若相同神经元同时出现在几种故障集中,按照激活次数最多的故障定类,否则均有可能发生;若测试集中SOM 激活神经元不在表1 中,则根据临近神经元定类。统计结果,如表2所示。表中标注结果表示多种故障均可能发生,黑色加粗标注表示误分类。

表2 测试集下SOM神经元分类情况Tab.2 SOM Neuron Classification in the Test Set

图7 临近神经元之间的距离情况Fig.7 Distance Between Neighboring Neurons

对表2结果进行分类统计,如表3所示。可以发现:正常、外环故障诊断效果达到100%,而内环、滚动体故障诊断结果50%左右,其累计故障诊断准确率达到73.75%。结合表1神经元激活情况,分析SOM网络对测试集诊断结果,可以发现:表2中,正常、外环故障下统计的激活神经元数量远比滚动体、内环故障下的激活神经元数量较多,正常、外环故障统计精确到激活两次的神经元,而滚动体、内环故障仅统计到激活三次的神经元,因此可以推断,若所有故障均统计到激活两次的神经元,其诊断结果会得到改善。由于滚动体、内环故障下,激活两次的神经元较多,且为保证四种故障均能选出激活次数排名前三的神经元,因此会出现表3中统计结果,从而降低SOM的准确率。

表3 SOM网络诊断结果Tab.3 SOM Network Diagnosis Result

5 总结

针对滚动轴承故障诊断难度较大,且以往诊断均借助于监督式学习网络,对故障样本依赖性较大,因此研究无监督式学习网络在滚动轴承故障诊断中的运用。

通过对振动信号进行时频域变换,提取故障特征参数,并采用遗传算法对故障特征样本进行降维处理,选取最优特征作为SOM网络的输入。实验仿真表明,这里研究方法能够有效对轴承故障进行诊断;这里采用的激活神经元统计方法,人为的降低SOM网络的诊断效果,属于保守式诊断,通过对神经激活次数的精确统计,能够提升网络的诊断效果。

猜你喜欢

父代遗传算法种群
中国高等教育的代际传递及其内在机制:“学二代”现象存在吗?
延迟退休决策对居民家庭代际收入流动性的影响分析
——基于人力资本传递机制
山西省发现刺五加种群分布
中华蜂种群急剧萎缩的生态人类学探讨
父代收入对子代收入不平等的影响
基于自适应遗传算法的CSAMT一维反演
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于遗传算法和LS-SVM的财务危机预测
男孩偏好激励父代挣取更多收入了吗?
——基于子女数量基本确定的情形
基于改进的遗传算法的模糊聚类算法