APP下载

基于ECAProNet 模型的小样本变工况轴承故障诊断

2024-01-10吴东升王笑臣

沈阳理工大学学报 2024年1期
关键词:原型特征提取故障诊断

王 勉,吴东升,王笑臣

(沈阳理工大学自动化与电气工程学院,沈阳 110159)

滚动轴承是广泛应用于各类机械设备中的重要基础部件,在设备的稳定可靠运行中发挥重要作用。 滚动轴承在使用过程中易发生碎片剥落、磨损产生裂纹及凹坑,造成机械设备无法正常运行[1],甚至引起安全事故。 因此,对滚动轴承进行故障诊断具有重要的实际意义。

传统机器学习故障诊断方法只适用于某一类机械,更换到另一类机械后不再有良好的诊断能力[2-3]。 近些年,深度学习算法被广泛应用于轴承的故障诊断[4-6],其可通过深度神经网络(deep nueral network,DNN)自动完成特征提取,但深度学习具有十分严重的数据依赖性,数据不足会导致训练过程中发生过拟合现象,而实际生产中往往难以提供大量数据来满足深度学习的要求。 由此,人们提出了小样本分类方法。

Snell 等[7]于2017 年首次提出基于度量的原型网络,并将其用于图像的少样本分类。 该网络将带标签样本与待识别样本映射至同一空间,将同类样本均值作为类原型,通过衡量待识别样本与各类原型间的欧氏距离进行分类。 由于其泛化能力出色且易与其他模型相结合,诸多学者将其应用于少样本轴承故障诊断中。 Chen 等[8]提出将轴承振动信号通过快速傅里叶变换(FFT)转变为频域信号,使用马哈拉诺比斯距离代替欧氏距离,提高了诊断准确率。 乔春阳[9]提出基于金字塔分割注意力的半监督原型网络,使用未标记样本对初始原型进行调整,减少了构建网络模型时对标记样本的依赖。 华超等[10]提出基于密度加权的原型网络,对每个样本赋予不同的权值,对代表性大的样本赋予更大权值,对代表性小的样本赋予更小的权值,以此缓解样本代表性不足的问题。 Wang 等[11]提出原型孪生网络,在孪生网络中增加了一个原型模块,以学习每个类的高质量原型表示,在少样本学习实验中表现出较好的性能。

上述方法均在小样本学习领域取得了较好的效果,但文献[8]提出的网络模型需要构建一个卷积神经网络(CNN)作为特征提取网络,再应用另一CNN 作为方差预测网络,一定程度上增加了模型的复杂程度,加大了训练的工作量。 文献[9]提出的模型中每个类别需要3 ~10 个标记样本,以满足训练阶段的要求,无法应对特殊情况下仅有某类别且仅存在唯一样本的变工况轴承故障诊断。 文献[10]提出的改进原型网络在进行50 次迭代后,准确率才有明显提升,时间成本较高。 文献[11]提出的网络模型在1-shot 情况下的分类准确率过低,仅为48.7%。

针对上述问题,本文在原型网络(ProNet)的基础上,提出在预学习阶段引入高效通道注意力机制(ECA)[12],对样本的特征进行充分挖掘,增强对具有代表性特征的关注度,提高模型分类准确率,同时不增加模型的复杂程度。 本文提出的故障诊断方法简称为ECAProNet。

1 原型网络

1.1 数据集的划分

ProNet 采用元学习的训练方法进行小样本训练,可通过极少数的样本确定类原型,通过衡量待识别样本与类原型间的欧氏距离,采用近邻策略进行识别分类,其分类原理如图1 所示。 ProNet算法采用基于episodes 的训练策略,将数据集划分为元训练集Dtrain和元测试集Dtest,且训练集与测试集样本空间不相交,以使训练过程中优化好的网络模型能够泛化到测试环境。

图1 原型网络分类原理图Fig.1 Prototypical network classification schematic diagram

元训练数据集Dtrain分为支持集S和查询集Q,支持集表示为,查询集表示为。 其中:xi和分别为支持集和查询集样本,xi∈RD,,D为样本特征向量的维数;yi和分别表示xi和对应类别的标签;ns为每类支持样本数;nq为每类查询样本数。 若在支持集S中包含了N个类别且每个类别中包含了K个样本,则将此类问题称为N-wayK-shot 问题。

1.2 原型计算与分类

支持集经过特征提取网络后,N个类别中每一个样本从D维空间映射到M维空间(M为原型特征向量的维数),并得到特征向量,在M维空间中通过计算支持集样本特征向量的平均值得到原型。 原型计算式为

式中:Lc表示第c类的原型,Lc∈RM;K为支持集中c类别中抽取的样本数量;fφ(·)表示具有可学习参数φ的嵌入函数。

计算出查询集中样本与各类原型间的欧氏距离,利用softmax 分类器得到查询集样本属于第c类别的概率Pφ,具体计算式为

式中d(·,·)为距离函数。

1.3 损失函数的计算

为使分类概率最大化,利用损失函数使网络不断迭代更新自身参数,取得最小损失,损失函数J计算式为

2 ECAProNet 算法

2.1 ECANet 算法

ECA 使用不降维的局部跨通道交互策略,解决了降维造成的通道注意力学习能力差的问题。该方法涉及参数少且效果显著,一定程度上降低了模型的复杂程度。

ECA 网络结构如图2 所示。 图中:χ为输入特征;为带有注意力的特征;W、H、C分别为卷积块的宽度、高度及通道维数。 ECA 模型使用全局平均池化(GAP)不降维聚合卷积特征,确定卷积核大小q,进行一维卷积,通过Sigmoid 函数学习通道注意力,得到通道的权重,处理通道权重与输入特征后即可得到带注意力的特征。

图2 ECA 网络结构Fig.2 ECA network structure

ECA 通过大小为q(其大小决定局部跨通道交互的覆盖范围)的卷积核快速卷积,实现跨通道交互。q与通道维数C成正比,映射关系为

式中:|t|odd表示距离t最近的奇数;γ和b为自定义参数,本文分别设置为2 和1。

2.2 ECAProNet 算法

本文采用ResNet[13]作为特征提取网络,将ECA 引入ResNet 网络中。 通过特征提取网络(ECA-ResNet)将样本从D维空间映射至M维空间,依据式(1)计算出类原型,通过衡量查询集样本与类原型之间的欧氏距离,采用softmax 函数计算查询集样本属于各类原型的概率,计算出查询集样本的负对数概率,得到损失函数,将损失函数反馈到特征提取网络中,优化自身参数,达到网络的迭代更新。 ECAProNet 算法框图如图3 所示。

图3 ECAProNet 算法框图Fig.3 ECAProNet algorithm block diagram

ResNet 引入残差块并采用跳跃连接将输入数据直接传递到后续层,增强信息流动性,提高训练精度。 基于残差网络的特性[13],在残差块中插入ECA 模块,在不增加模型复杂度的前提下,能够在少量数据中提取到更具代表性的特征;将带有ECA 模块的ResNet 作为原型网络的特征提取网络,在有限样本数据中提取更有用的滚动轴承特征信息。

2.3 基于ECAProNet 的变工况诊断流程

本文提出的基于ECAProNet 的诊断流程如图4 所示,具体步骤如下。

图4 ECAProNet 故障诊断流程框图Fig.4 Block diagram of ECAProNet fault diagnosis process

步骤1将采集到的一维振动信号转变为灰度图像,以便采集到更多有用信息。

步骤2在预训练阶段,于采样频率12 kHz下进行采样,共分为4 种工况,每种工况包含5 个故障类型,在20 类故障类型中随机选取N类样本,并从N类样本中随机抽取K个样本构成支持集S,再从每类样本中随机抽取样本构成查询集Q,作为特征提取网络的输入。

步骤3由ECA-ResNet 特征提取网络将支持集S和查询集Q中的样本映射到统一特征度量空间,得到支持集S与查询集Q中各样本的特征向量。

步骤4由式(1)计算出支持集S中每类样本的平均向量作为类原型,计算查询集Q中各样本的特征向量与类原型间的欧氏距离后输入softmax 函数;由式(2)得到查询集中样本属于每类原型的概率;通过式(3)计算得到损失函数并反馈到特征提取网络,对其进行训练,完成模型的迭代更新,优化自身参数。

步骤5在测试阶段,经基于episodes 训练策略优化好的特征提取网络将Dtest中含有带标签信号的支持集和查询集作为输入,映射到度量空间,确定查询集中无标签样本的调制样式,确定轴承故障分类,得到变工况故障诊断结果。

3 实验验证

3.1 环境配置

本文实验在Pytorch 框架下进行搭建,硬件设施为Intel Core i7-8700CPU、NVIDIA GTX1080ti显卡的计算机。

3.2 数据集

本实验采用的数据集为凯斯西储大学(CRWU)的开放轴承数据库[14],选用12 kHz 采样频率下的轴承振动信号作为训练数据集,选用48 kHz 采样频率下的轴承振动信号作为测试数据集,验证模型在不同工况下的故障诊断效果。 设置4 种工况(A、B、C、D)及5 种轴承故障类型,如表1 和表2 所示。

表1 CRWU 轴承的4 种工况Table 1 Four kinds of working conditions of CRWU bearings

表2 CRWU 的故障类型Table 2 Fault types of CRWU

3.3 模型对比实验及结果分析

将ECAProNet 与其他四种小样本诊断方法进行对比,分别为ProNet、与模型无关的元学习模型(MAML)[15]、基准模型(Baseline)、多任务学习模型(MTL)[16],对比实验结果如表3 和表4 所示。 为得到较为稳定、客观的诊断准确率,将5-way 5-shot 实验与5-way 1-shot 实验分别在训练阶段进行15 次迭代,在测试阶段进行10 轮测试,取平均准确率作为实验结果。 对比表3 和表4 可以看出,在5-way 5-shot 样本抽取下的变工况轴承故障诊断准确率绝大多数高于5-way 1-shot。 原型网络中支持集样本数据的增加可为特征提取网络提供更多的特征信息,提高诊断的准确率,5-way 1-shot 的实验结果恰恰是样本数据不足所造成的过拟合现象。

表3 5-way 5-shot 变工况轴承故障诊断结果Table 3 5-way 5-shot variable working conditions bearing fault diagnosis results

与ProNet 模型相比,加入注意力机制的ECAProNet 在诊断性能方面有着明显提升;与其他三种模型相比,ECAProNet 的诊断性能亦表现较佳。 ECA 模块的加入使改进后的特征提取网络能够关注到更多有用信息,在提升性能的同时并不增加模型的复杂程度,一定程度上保证了整体模型不会因为复杂度过高造成过拟合现象。

观察5-way 1-shot 实验结果可以发现,ProNet模型的诊断准确率低于其他四种模型,这是因为每类样本数据只有1 组,导致度量空间中样本特征向量的平均值即是抽样样本的特征向量,某工况下训练好的故障分类模型无法准确对不同工况下测试样本进行故障分类,在加入ECA 模块后,诊断准确率则有明显的提升。

4 结论

针对小样本环境下的变工况轴承故障诊断,基于元学习和度量学习的思想提出了ECAProNet诊断算法。 通过加入ECA 模块提升网络模型的特征提取能力,得出更具代表性的类原型,提升诊断准确率。 在CWRU 轴承数据集上的实验结果表明:在小样本环境下,网络模型存在过拟合问题;相较于原始的ProNet 算法,本文提出的ECAProNet 算法故障诊断准确率提升较为明显,同时提高了模型在训练时的泛化能力。

猜你喜欢

原型特征提取故障诊断
包裹的一切
基于Daubechies(dbN)的飞行器音频特征提取
《哈姆雷特》的《圣经》叙事原型考证
Bagging RCSP脑电特征提取算法
论《西藏隐秘岁月》的原型复现
原型理论分析“门”
因果图定性分析法及其在故障诊断中的应用
基于MED和循环域解调的多故障特征提取
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断