APP下载

小样本下基于元学习的跨机械部件故障诊断*

2022-11-09颜丙生刘兆亮刘自然

组合机床与自动化加工技术 2022年10期
关键词:故障诊断准确率轴承

颜丙生,刘兆亮,刘自然

(河南工业大学机电工程学院,郑州 450001)

0 引言

旋转机械在现代工业领域中应用广泛[1]。滚动轴承与齿轮作为旋转机械的关键部件,一旦发生故障,可能会带来巨大的经济损失甚至人员伤亡[2]。因此,对于滚动轴承与齿轮箱的故障诊断具有重要的意义。

近年来,深度学习在故障诊断领域的应用取得了快速的进步[3]。然而,基于深度学习故障诊断的成功依赖于两个条件,一是模型训练需要大量的标记样本,二是训练数据和测试数据要具有相同的类别空间[4-5]。目前研究者更多关注的是小样本下的机械故障诊断,主要包括数据扩充、迁移学习。毕略等[6]将数据扩充方法应用于故障诊断来增加训练样本的数量,提高了模型的诊断性能。李奇等[7]提出了一种基于迁移学习的故障诊断模型,解决了数据不平衡的问题,具有很好的前景。上述方法虽然可以解决小样本下的故障诊断问题,但对于跨机械部件的故障诊断,即用一个机械部件的故障数据训练模型,用其他部件故障数据进行故障诊断时,还没有相关研究。

近年来,元学习方法受到广泛关注,它可以提高模型对不同分类任务的泛化能力,更适用于小样本下的分类问题。典型模型是FINN等[8]提出的模型不可知元学习(MAML),其目标是寻找对任务变化敏感的初始模型参数,实现用少量的标记数据就能使模型参数更新到最优的目的。LI等[9]提出一种基于MAML模型的元学习故障诊断方法,结果表明,该方法在复杂工况下解决小样本故障分类问题上具有一定优势。综上所述,基于元学习方法的故障诊断模型可以快速适应新的故障类别,具有很强的泛化能力,可以将其应用在跨机械部件的故障诊断问题上。

但基于MAML模型的元学习方法是将一维振动信号转换成二维形式再进行特征提取,在转换过程中原始序列中的空间相关性会遭到破坏而丢失一些与故障相关的有用信息,可能造成故障分类不准确[10]。针对上述问题,本文提出一种基于元学习的多通道一维卷积神经网络(MC-1DCNNML)的故障诊断方法。建立多通道一维卷积模型(MC-1DCNN),充分提取故障特征而且直接将一维振动信号输入到模型中保留了信号的真实性,将元学习方法应用到MC-1DCNN模型中,使模型可以快速适应新的故障类别,实现跨机械部件的故障诊断。

1 元学习理论

(1)

(2)

跨任务的元优化是通过随机梯度下降实现的。式(3)为初始模型参数更新θ的方法,其中β代表元学习率。

(3)

2 机械故障诊断方法

2.1 MC-1DCNNML方法故障诊断流程

图1为MC-1DCNNML方法的整体故障诊断流程图。分为数据采集、数据处理、数据集构建、模型的训练与测试4大部分。

图1 MC-1DCNNML故障诊断流程图

将综合故障实验台采集的故障数据预处理成四通道振动信号,并将其构成元训练集与元测试集;然后将元训练集分成支持集与测试集用来对MC-1DCNN模型的训练,元测试集也分成支持集与测试集用来对MC-1DCNN模型的优化与测试,最终实现故障诊断的目的。

2.2 数据预处理

将原始故障信号经CEEMDAN算法分解后得到多个固有模态分量(IMF),并利用峭度最大化原则,筛选出故障信息明显的IMF分量,构成多通道振动信号,图2为生成四通道信号流程图。根据试验结果,本文选取峭度值大小前四的IMF构成四通道信号,其包含了原始信号不同频率段的故障成分,可以更加全面挖掘振动信号的故障特征信息。

图2 生成四通道信号流程图

CEEMDAN算法是在经验模态分解算法(EMD)基础上改进的一种信号处理方法,它克服EMD算法模态混叠与端点效应,在故障诊断方向具有一定优势。因此,得到的多通道信号并不是传统意义上的多传感信号,而是将信号经CEEMDAN分解并筛选得到的多通道振动信号。

2.3 MC-1DCNN模型

图3所示为创建的MC-1DCNN模型,它由多通道输入层、一维卷积层、一维池化层、全连接层和分类层构成。

多通道输入层:该层的输入为原始振动信号经CEEMDAN算法分解后筛选得到的四通道信号,相比于单通道一维卷积模型(1DCNN),多通道输入可以更加全面挖掘振动信号的故障特征信息。

图3 MC-1DCNN模型

一维卷积层:第一层卷积层有24个大小为32×1的卷积核,第二层卷积层有48个大小为3×1的卷积核,第三层卷积层有96个大小为3×1的卷积核,第四层卷积层有96个大小为3×1的卷积核。图4为MC-1DCNN的卷积过程。卷积层的输入特征为四通道信号,各通道信号单独进行卷积操作提取特征信息,随后将各通道得到的特征进行融合,得到该位置的一维卷积输出信号,一维卷积层有效地实现了四通道信号特征提取与特征融合。

图4 多通道卷积过程

一维池化层:采用最大池化方法,式(4)为采样函数。

pi,m=maxqi,(m-1)s+n

(4)

式中,pi,m为第i个振动信号Pi中第m个单元所对应的采样数值;qi,(m-1)s+n为卷积层中第i个卷积特征中的第(m-1)s+n个单元的数值;s为相邻采样窗口重叠部分的大小。

全连接层:将之前卷积和池化层提取的特征重新排成一列,式(5)为全连接层输出结果。

δi=f(wipi+bi)

(5)

式中,i=1,2,…,k;δi为第i个输出,共有k个输出;wi和bi分别为第i个神经元的权值和间值;f(x)为激活函数。

分类器层:选取Softmax分类器,可以直接完成多分类任务。

(6)

式中,p(i)为每一个输出的概率,所有的p(i)之和为1;K为多分类问题的类别数。

2.4 MC-1DCNNML

在MC-1DCNNML模型中,将元学习策略引入到所提出的MC-1DCNN模型中来解决小样本问题。目的是让模型可以在几次训练迭代下,用很少的数据快速适应新的故障诊断任务。采用C-Way K-Shot方法对模型的性能进行评估,具体来说,选择C个类别,每个类别有K个不同实例用于模型的训练,然后用新的实例来测试与评估。

图5 元学习过程

图5为提出的MC-1DCNNML元学习过程。具体来说,该过程包括训练集任务Ti中支持集TrS与测试集TrQ两个阶段的优化。

(7)

(8)

根据式(7),在经过第m步更新之后,MC-1DCNNML模型参数更新至式(9)。

(9)

(10)

式中,LMC-1DCNNML为模型预测值和数据真实值之间的差距,优化的目标是通过最小化总损失LMC-1DCNNML来找到对于每个任务来说都适合的模型参数。式(11)表示用元学习率β更新初始化参数θ:

θ=θ-β▽θLMC-1DCNNML(θi,TrQ)

(11)

在模型测试阶段,通过测试集中的支持集对优化过的模型参数θ进行微调,找到能够在查询集上实现精确故障分类的最优模型参数θ′。

3 试验研究

3.1 数据集

使用凯斯西储大学(CWRU)轴承数据集和MFS实验台中采集的轴承振动数据和齿轮数据进行试验。

从CWRU数据库中选择采样频率为12 kHz的数据来构建数据集。选取了两种位置、3种载荷条件、5种故障类别、4种故障大小的不同轴承条件下的振动样本。选取CWRU轴承的120个故障类别和每个类别的100个样本来建立模型的训练集。轴承位置包含FE(风扇端)和DE(驱动端),故障类别包含BF(滚珠故障)、IF(内圈故障)、N(正常)、OF-3、OF-6、OF-12,其中OF-3表示故障点在轴承外圈3点钟方向,4种故障直径分别为0.007、0.014、0.021和0.028 in的单点故障轴承。

图7 MFS实验台

在测试阶段,用两种不同振动数据集来进行验证,一个是轴承故障数据,另一个是齿轮故障数据,两种振动数据集都是在如图7所示的MFS实验台上进行采集。

采集的轴承故障类别是正常(N)、滚珠故障(BF)、外环故障(OF)、内环故障(IF)以及由滚珠故障和外环故障(B和OF)组成的复合故障。采集的齿轮故障类别是裂纹、健康、缺失、断齿和磨损。表1为数据类型及规格。此外,为了确保实验结果的可靠性和准确性,通过五次随机分配的数据进行了5次实验来验证结果。

表1 测试集数据类型及规格

3.2 试验结果与分析

3.2.1 小样本下不同工况的故障诊断试验

机器工作中需要不同的工况条件,一个优秀的模型能够适应不同工况条件的变化,为了验证所提出的MC-1DCNNML方法在小样本下不同工况的模型诊断性能,进行了一系列试验。试验数据选取凯斯西储大学的驱动端轴承数据作为试验的训练集与测试集。表2为构建的轴承数据集A、B、C,为每个数据集选取50个样本。模型在一个工作条件下训练,在新的工作条件下进行测试,例如,A→B表示模型在数据集A上进行训练,在数据集B上进行测试。

表2 不同工况轴承数据集

所有试验都由C-Way K-Shot问题的分类任务展开。分别做5-Way1-Shot和5-Way5-Shot的不同工况试验,即为每个任务提取了5个不同类别的故障数据,每个故障类别包含1个或5个样本,图8为试验结果。

图8 1-Shot、5-Shot试验结果

由图8可知,在可变工况条件下的6个试验中,5-Shot的准确率全部优于1-Shot的准确率,这是因为每个故障类型5个样本包含的故障信息更加全面,可以为模型提供更多方位的故障信息,增强了模型的泛化能力。还可以看出,用数据集B训练,用数据集A进行测试的准确率最高,可以达到99.62%,这是因为数据集B与数据集A工况比较相似,且数据集B比数据集A更加复杂,用复杂的数据集训练可以增强模型的泛化能力;同理,用数据集A训练,用数据集C进行测试的准确率最低,这是因为用相对简单的数据集进行训练,模型学习不到更加全面的故障信息,使模型的泛化能力降低。

将MC-1DCNNML模型与基线一维卷积神经网络模型(1DCNN)进行对比试验,由图9可知,MC-1DCNNML方法的所有试验结果都明显优于1DCNN模型,且1DCNN模型准确率随工作条件的变化波动较大,尤其是在C→A实验中,MC-1DCNNML模型的准确率可以达到98.56%,比1DCNN模型高8.15%,可能是因为可变工况的数据分布不同,MC-1DCNNML是基于元学习理念的,可以从已知工况中获取一般轴承故障信息,并将其应用于新工况的故障诊断,但1DCNN模型结构简单且样本有限,提取的故障特征很少,难以正确分类新工况的不同故障。

图9 对比试验结果

3.2.2 小样本下跨机械部件的故障诊断试验

为了验证MC-1DCNNML模型在小样本下的泛化性能,进行跨机械部件的故障诊断试验。在训练阶段,用凯斯西储大学轴承数据集作为训练集训练模型,为每个任务选取5个不同类别的故障数据,每个故障类别包含1、3或5个样本。在每个任务中,每类故障样本为查询集提供16个验证数据,即对于每一个5-Way1-Shot任务,它包含5个支持样本和80个查询样本。

在测试阶段,用MFS实验台采集的轴承数据集和齿轮数据集进行验证,图10为试验结果。

图10 新故障类别下分类准确率

可以看出,当模型在轴承数据集上进行测试时,5-Way1-Shot、5-Way3-Shot和5-Way5-Shot的故障诊断准确率分别为83.24%、93.43%和95.12%。说明用较少的标记数据就可以训练出综合性能较高的模型,随着支持集样本的增多,模型性能逐渐提高;当测试集与训练集具有相同的类别空间和不同的概率分布时,MC-1DCNNML模型具有良好的泛化性能。

此外,当模型在齿轮数据集上进行测试时,5-Way1-Shot、5-Way3-Shot和5-Way5-Shot的故障分类准确率分别为81.36%、91.68%和93.48%。相比于轴承数据集上测试的结果,在齿轮数据集上进行测试准确率相对较低,这是因为齿轮测试集具有与训练集不同的类别空间和不同的概率分布,数据差异性相对较大,但准确率最高可以达到93.48%,说明MC-1DCNNML模型在小样本情况下可以实现对不同机械部件的故障诊断。

3.2.3 对比试验

将MC-1DCNNML方法与基于元学习理论的MAML模型、传统的1DCNN模型进行了性能比较。从MFS试验台上采集的数据集中选取10个、50个和100个标记的故障样本,用于对模型的训练与测试。图11为5-Way5-Shot试验分类结果。

图11 不同模型故障诊断结果

可以看出,MC-1DCNNML方法对比其他两种方法均具有较高的准确率,最高可以达到94.89%。当只有10个已知故障样本的情况下,1DCNN模型的分类准确率仅为37.25%,随着故障样本的增多,分类准确率逐渐提高;而基于元学习方法的两个模型在故障样本仅为10个的情况下,分类准确率可以达到78%以上,MC-1DCNNML模型在齿轮数据集上的故障分类准确率为81.27%,在轴承数据上的准确率为83.28%,说明MC-1DCNNML模型泛化能力更强,更适用于跨机械部件故障诊断问题。

为了更加直观的比较MAML和MC-1DCNNML两个模型迭代训练后的特征提取能力,选取齿轮集测试结果进行t-SNE特征可视化,对比图12a、图12b可以看出,MC-1DCNNML模型的特征分类更加集中,说明分类效果更好,可分性更强。对于齿轮磨损和裂纹两个故障类型,MAML模型的分类效果不如MC-1DCNNML模型好。

(a) MAML模型 (b) MC-1DCNNML模型

4 结论

针对小样本情况下的变工况特别是跨机械部件的故障诊断问题,提出一种基于元学习的多通道一维卷积神经网络的MC-1DCNNML模型,结论如下:

(1)将原始故障信号处理为多通道一维信号直接输入到MC-1DCNN模型中,保证信号是真实的,且多通道信号包含了更多的故障信息成分,使模型可以学习到更多真实的故障信息,提高了模型的性能。

(2)通过使用3个不同成分的数据集,并与其他两种神经网络模型进行比较,结果表明,MC-1DCNNML模型具有更高的分类准确率和泛化能力,更适用于小样本情况下的变工况与跨机械部件的故障诊断问题。

猜你喜欢

故障诊断准确率轴承
轴承知识
轴承知识
轴承知识
轴承知识
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
高速公路车牌识别标识站准确率验证法
因果图定性分析法及其在故障诊断中的应用
基于LCD和排列熵的滚动轴承故障诊断