APP下载

基于infoGAN和CNN的轴承小样本故障诊断

2021-12-03陆见光唐向红盛晓静杨瑞恒

兵器装备工程学报 2021年11期
关键词:轴承准确率卷积

杨 青,陆见光,2,3,唐向红,2,3,顾 鑫,盛晓静,杨瑞恒

(1.贵州大学现代制造技术教育部重点实验室, 贵阳 550025; 2.贵州大学机械工程学院, 贵阳 550025;3.贵州大学公共大数据国家重点实验室, 贵阳 550025)

1 引言

一般来说,轴承是机械设备最重要的组成部分之一。由于复杂的结构和工作条件,轴承容易损坏,甚至造成人员伤亡[1-3]。为了保证安全,降低维护成本并避免灾难性事故,不允许机械设备在有故障的条件下运行,因此难以获取轴承大量故障数据集,在轴承故障诊断的过程中,常见的是故障数据的数据不足或数据分布不平衡[4-5]。轴承故障诊断领域长期以来一直是研究的热点。 除了一些传统的基于数学模型的故障诊断方法以外,在过去的几十年中,还广泛研究了各种基于数据的机器学习算法,例如K近邻(KNN)、主成分分析、支持向量机(SVM)、和随机森林等[6-8]。当给出有限的数据时,某些基于数据的算法将遭受分类精度低的问题,例如 SVM、KNN等[9]。当数据样本不足或不平衡时,难以准确学习识别不同的故障,因为数据样本少的类别容易被数据样本多的类别所忽略和淹没[10]。文献[11]提出了一种基于原始数据的新数据增强方法,该方法将单个样本分为多个单体,然后重组单体以增加数据样本的数量,这种方法可以大大增加样本数量,该方法在特征学习和分类上具有更好的性能。文献[12]提出了一种基于条件深度卷积生成对抗网络(C-DCGAN)生成模型的不平衡故障诊断方法,在C-DCGAN中,基于卷积网络的特征提取能力,通过结构优化,将条件辅助生成样本用作扩充数据,并应用于机器故障诊断,该模型可以提高小样本情况下故障诊断的准确性和分类器的泛化能力。文献[13]本文提出了一种基于WGAN的方法,以人工合成新的带标签的故障类型样本。更具体地说,该方法使用WGAN学习故障样本的分布并生成可用于训练深度网络的新样本。通过这种方法,训练数据集得以扩展和增强。一维卷积神经网络(1D-CNN)用于有效地提取分类特征,并从原始样本和生成的样本中训练模型该方法具有明显且令人满意的故障诊断效果。

为了解决轴承故障诊断中的小样本数据问题, 上述这些方法获得了良好的结果,但是它们仍然具有一些缺点:① 上述方法都是基于一维信号的故障诊断方法,不能充分学习GAN及其变种图像生成的能力,生成样本质量不高和多样性差;② 没有充分利用振动信号时域和频域的信息。本文针对小样本数据问题,提出一种基于信息生成对抗网络(infoGAN)和卷积神经网络(CNN)的小样本轴承故障诊断方法,采用一维振动信号作为原始信息,经过短时傅里叶变换(STFT)预处理后生成二维时频图像,以此作为infoGAN 的输入进行对抗训练增加训练集,并建立CNN轴承故障诊断模型,实验结果表明该方法具有良好的故障诊断能力。

2 短时傅里叶变换和infoGAN的原理及特点

2.1 短时傅里叶变换(STFT)

短时傅里叶变换(STFT)是针对突变、非平稳信号的一种联合时频分析方法。STFT将一维的轴承振动信号变换成包含了时域和频域信息的二维矩阵用于infoGAN模型。

STFT通过对非线性信号进行加窗处理,将时域信号截取为多段再进行傅里叶变换,得到频谱分析。通过窗函数在整个时间轴上的平移,最终变换得到每一时间段上局部频谱的集合,因此,STFT 是关于时间和频率的二维函数。基本运算公式如下:

(1)

式中:g(t-τ)为中心位于τ时刻的时间窗口,f(t)为时域信号。

2.2 infoGAN的原理及特点

infoGAN生成对抗网络主要由两个模块组成,如图1所示。infoGAN包括生成器G和辨别器D。生成器的主要任务是接收随机分布的噪声z,使自己输出的样本G(z)与真实样本分布一致;辨别器的主要任务是接收生成器的数据G(z)和真实样本数据x,并区分所接收数据的真假,理想情况下辨别器无法判断所接收的数据是来自生成数据数据还G(z)是还是真实数据x,模型达到最优时,判别器每次输出的概率值都是1/2,即辨别器和生成器交替训练达到纳什均衡,其loss为 :

(2)

原始GAN的生成器几乎没有约束,使得生成的数据过于自由,不能生成指定目标的图像。GAN可以学习到真实样本的分布,学到的特征混杂在一起,这些特征在数据空间中以一种复杂无序的方式进行编码,如果这些特征是可分解的,那么这些特征将具有更强的解释性,将更容易利用这些特征进行进行编码,文献[14-15]就在生成器中除了原先的噪声z还增加了一个隐含编码c,提出一个新的GAN模型-infoGAN,其中info代表互信息,它代表生成数据G(z)与隐含编码c之间关联程度的大小,为了使G(z)与c之间关系密切,需要最大化互信息的值,infoGAN的示意图如图1所示。如果(X,Y)~p(x,y)表示X,Y分别服从联合分布p(x,y)。I(X;Y)表示X和Y的互信息,即X,Y之间可能存在一种相互的关系,Y的变化会导致X的变化,或者说Y的变化会导致X的信息熵的变化,互信息的表达式为:

I(X;Y)=H(X)-H(X|Y)

(3)

这里H(X)表示X的信息熵,H(X|Y)表示Y确定的情况下X的信息熵。本文中c和G(z,c)之间的互信息为I(c;G(z,c)),infoGAN的优化目标为:

(4)

图1 infoGAN示意图

3 基于infoGAN和CNN的轴承故障诊断方法

针对小样本数据下的轴承故障问题,提出基于infoGAN和CNN的轴承小样本故障诊断方法,过程如下:首先对原始振动信号进行短时傅里叶变换,得到时频样本数据,然后再将其输入到infoGAN中进行训练,直至infoGAN达到纳什平衡,即网络达到收敛,将生成器生成的样本添加到原始样本中,并将混合后的样本数据输入CNN进行训练,把测试样本数据输入到训练好的CNN模型中进行故障分类并输出结果,整体方法流程如图2所示。

图2 整体方法流程框图

3.1 使用infoGAN生成样本数据

为了解决小样本数据下的轴承故障问题,本文通过使用infoGAN增加样本数据量来增加故障识别准确率。生成器的输入为随机噪声z和隐含编码c。z可以理解为不可压缩的噪声,而c可以理解为可解释的隐含编码。通过改变隐含编码c改变生成样本图像的变化,同时,c与生成器之间存在约束关系,即c和G(z,c)之间的互信息I(c;G(z,c)),所以infoGAN能控制图像生成,基于infoGAN的图像生成方法能增加生成图像质量,会使数据集样本特征更加丰富。

z符合正态且噪声维度为30,本文隐含编码c包括c1和c2其中c1使用十个离散数字进行编码,每个类别的概率都是0.1,c2连续编码,是0到1的均匀分布;生成器的输出为合成样本数据G(z,c),生成器的结构如图3所示。鉴别器的输入为真实样本数据x和合成样本数据G(z,c),输出为判别结果的真假和还原c之后的c′,鉴别器的结构如图4所示。生成器的输入数据先经过全连接层扩维,然后将数据重置为三维张量,最后通过三层反卷积生成时频样本。在生成器中各卷积层使用ReLU函数,但在输出层使用Tanh函数,数据重置层和前两层反卷积均采用批标准化。鉴别器D中一共3个卷积层和一个全连接层。为防止梯度稀疏,在鉴别器中使用LeakReLU函数代替ReLU函数,卷积层均采用批标准化。

图3 生成器结构示意图

图4 鉴别器结构示意图

3.2 CNN故障诊断

将经过短时傅里叶变换的时频样本图像输入CNN模型,CNN模型的结构为:输入层-卷积层1-池化层1-卷积层2-池化层2-全连接层-输出层,CNN模型如图5所示。

图5 CNN模型示意图

输入特征图的大小为65×65;第一卷积层和第二卷积层的卷积核个数分别为32和64,卷积核大小取为3×3,激活函数选择ReLU函数;池化层的池化方式选择最大池化,即对特征图求其p×p区域内的最大值,区域大小取2×2;全连接层的节点数为1 024;输出层输出层节点数为输入样本数的类别10,分类器选择softmax分类。

4 实验结果与分析

实验采用的是美国凯斯西储大学(Case Western Reserve University,CWRU)提供的公开电机轴承数据。使用电火花技术加工轴承的单点故障,根据损伤位置的不同分为3种故障类型,即故障分别布置在轴承的内圈、滚动体及外圈上,每种故障类型有3种损伤尺寸分别是0.007英寸、0.014英寸和0.021英寸。然后在负载1hp的情况下采集各种故障状态下的振动信号,采样频率为12 kHz。在本实验中本文将故障分为10类。设采样长度n为1 024,每种故障状态重复采样250次。把数据集按照80%和20%分为训练集和测试集。训练集的样本经STFT变换之后输入到infoGAN中进行对抗训练。表1展示了数据集的组成。

表1 数据集组成

4.1 infoGAN模型的训练和合成样本生成

图6展示了infoGAN中鉴别器的损失函数,从图中可以看出,刚开始时鉴别器损失值迅速下降,下降到一定值时,出现大幅震荡,说明鉴别器正处于学习阶段,迭代轮次到1 500时,损失值趋向于稳定,说明网络已经到达纳什平衡。

图6 鉴别器损失函数曲线

图7为轴承故障数据经短时傅里叶变换后的真实图和生成器生成的二维灰度图。从图中可以看出,生成的二维灰度图和真实的灰度图很相似,但并不是完全相同,说明infoGAN模型在学习过程中,既能学到有效特征的同时,同时又能保证生成样本的高质量和多样性。在原始样本不足的情况下,加入生成器生成的样本,会使数据集样本特征更加丰富,通过训练混合后的数据集,能提高模型的诊断能力。

图7 真实图和二维灰度图

4.2 生成样本数量与故障诊断准确率实验

表2为原始样本中添加不同生成样本数量作为训练集的诊断模型准确率,从表中可以看出,并非添加的非生成样本数量越多训练数据越好,因为生成器模型本身存在一定的误差,添加的生成样本的数量需适量,本实验中添加200个生成样本作为训练集的补充最适合,能够最大化提高故障诊断准确率[16-17]。

表2 不同样本训练CNN准确率

表3列出了准确率最高时(即添加200个生成样本作为训练集时)不同故障类别的精准率、召回率和F1指标。

表3 不同评价指标的值

续表(表3)

4.3 不同方法准确率

为进一步验证本文提出的基于infoGAN和CNN的轴承小样本故障诊断方法的可行性,进行对比实验。其中CNN方法是利用CNN提取特征并进行分类;STFT+CNN方法是STFT进行数据预处理,CNN提取特征并进行分类;GAN+CNN方法是利用GAN生成新的样本数据并添加到原始样本中作为训练集,CNN提取特征并进行分类;infoGAN+CNN方法(该方法与本文方法区别是,输入infoGAN的信号为原始振动信号,未经过SFTF处理)是利用infoGAN生成新的样本数据并添加到原始样本中作为训练集,CNN提取特征并进行分类。从表4可以看出本文方法诊断准确率最高。

表4 不同方法的诊断准确率

4.4 泛化性探究

为了进一步验证本文所提模型的有效性,选取CUT-2 轴承实验平台采集到的轴承实验数据,平台如图8所示。实验轴承型号为 6900ZZ,使用电火花加工技术在轴承外圈,滚珠,内圈加工直径为 0.2 mm和0.3 mm的故障,轴承故障位置如图9所示。使用加速度传感器采集轴承振动信号,采样频率2 kHz,轴承转速 2 000 r/min。设采样长度n为1 024,每种故障状态重复采样250次。把数据集按照80%和20%分为训练集和测试集。表5展示了数据集的组成。

图8 CUT-2轴承实验平台图

图9 轴承故障位置实物图

表5 数据集组成

进行不同诊断模型准确率对比,实验数据和诊断模型和表4保持一致,其中CNN准确率为91.25%,STFT+CNN准确率为92.13%,GAN+CNN准确率为93.42%,infoGAN+CNN准确率为95.82%,本文方法准确率为96.26%。实验结果表明,本文方法在其他数据集上依旧适用,具有较高的泛化性,可以很好的用于轴承的故障诊断。

5 结论

1) 提出了基于infoGAN和CNN的小样本故障诊断方法,并在CWRU轴承数据集下验证了该方法的可行性和优越性。

2) 振动信号经过短时傅里叶变换,更好地利用时域与频域的信息,并且提取的时频图像特征方便infoGAN处理,更好发挥图像的优势;

3) 基于infoGAN的图像生成方法能控制图像生成过程,提高生成图像质量,使数据集样本特征更加丰富;

4) 将混合后的图像样本数据输入到CNN中进行训练实现分类,本文方法有更高的诊断准确率且具有较高的泛化性,可实现轴承故障的有效分类。

猜你喜欢

轴承准确率卷积
基于全卷积神经网络的猪背膘厚快速准确测定
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
接触式密封在大功率半直驱永磁风力发电机应用探讨123
斯凯孚展示用于电动汽车的先进轴承产品