APP下载

改进数据增强方法在轴承故障诊断中的应用

2022-06-28润,蒋

软件导刊 2022年6期
关键词:分类器故障诊断准确率

马 润,蒋 全

(上海理工大学机械工程学院,上海 200093)

0 引言

电机轴承作为旋转机械设备最重要的部件之一,在工业生产中常持续工作于高负荷、变工况、高温以及高压环境,因此极易发生故障。相关统计表明[2],电机故障的30%由轴承故障引起。当电机发生故障时,不仅会影响生产效率,造成经济损失,而且甚至会造成伤亡事故。为保障电机正常安全运行,电机故障诊断起到了重要作用。

电机轴承的故障诊断方法主要包括基于模型、基于经验以及基于数据驱动3 种[3]。由于传感器技术的发展,基于数据驱动的故障诊断方法已经成为近年来研究的热门领域[4]。数据驱动方法无需建立复杂精确的数学模型,也无需对信号进行繁琐的分解分析。当输入新的信号数据时,数据驱动法能够准确地判断是否出现故障以及所属的故障类型。目前,数据驱动方法在电机故障诊断领域取得了诸多成果[5]。

数据驱动方法需要充足的历史数据才能训练模型。由于故障样本往往存在分布不均衡的现象,样本数量较多的故障类型的分类准确率会相对较高,而样本数量较低的故障类型的分类准确率往往较低,甚至无法分类[6-7]。在实际的工业生产中,由于电机一般都工作在正常状态,往往很难获得足够数量且分布均衡的电机故障数据。当数据不足时,会出现过拟合现象且分类效果远远低于预期。

针对数据样本不平衡问题,学者们提出对训练样本进行数据增强。传统的数据增强包括在原始信号中添加高斯噪声、掩蔽噪声、信号平移、振幅偏移以及时间拉伸等方法[8]。这些基于合成过采样的方法大多是通过数据差值生成样本,在反映实际图像的潜在分布上还存在不足,并不能完全学习到数据分布的特征。此外,传统的数据增强方法可能会造成过拟合现象,即传统的数据增强方法可以增加样本数量,但是无法自动学习到样本的分布特征。

生成式对抗网络(Generative Adversarial Network,GAN)[9]是解决数据分布不均衡问题的主流方法,被广泛应用于言语情感感知、计算机视觉以及超分辨率图像处理等多个领域[10]。很多学者致力于研究用改进GAN 生成高质量的故障样本以缓解故障样本数量不足的问题,并取得诸多成果。文献[11]将GAN 和堆叠去噪自动编码器(Stacked Denoise AutoEncoder,SDAE)相结合进一步优化判别器提取行星齿轮箱有效故障特征的能力,从而提高了生成样本质量和故障诊断能力;文献[12]针对标签含噪声干扰的分布不均衡的风机齿轮箱故障样本,提出一种改进的标签噪声鲁棒辅助分类生成式对抗网络结构(Label-Noise Robust Auxiliary Classifier GAN,RACGAN)以提升生成样本质量及在实际运行状态下多类别样本的分类准确率;文献[13]在ACGAN 的判别器中加入了注意力机制,提高了判别器提取样本特征的能力,解决了电压暂降数据样本分布不均衡问题;文献[14]用条件生成对抗神经网络(CGAN)生成电力系统中暂态失稳样本,并用极限学习机(ELM)分类器筛选出G-mean 值最高的生成样本。该方法能够学习原始数据分布特征从而提高暂态稳定评估的正确率。

上述提到的方法在电机轴承数据增强方面取得了一定成果,但是这些方法往往基于一维振动信号或者通过全连接层或者一维卷积操作产生新的数据样本,因此存在训练过程不稳定、训练时间过长或者训练过程繁琐等问题。

基于此,本文提出一种改进ACGAN 数据增强方法,对ACGAN 进行改进,融合了压缩激励机制(Squeeze and Exci⁃tation,SE),对不同通道的重要性进行建模,为较重要的通道赋予较大权重,从而提高GAN 的样本生成质量,最终达到提高故障诊断准确率的效果。本文将改进的ACGAN 和原有的ACGAN 进行对比,算例结果验证了模型的有效性和优越性。

1 生成式对抗网络

生成式对抗网络(GAN)是基于博弈论中的零和博弈理论而提出,由生成器(Generator,G)和判别器(Discrimi⁃nator,D)两部分构成。GAN 结构如图1 所示,输入随机噪声z,由生成器G 生成样本G(z),之后生成样本G(z)和真实样本x都输入到判别器D 中,由判别器判别图片是真实样本还是生成样本,并输出判别结果。

在训练过程中,生成器G 尽可能地捕获原始数据的分布特征,并生成相似的样本欺骗判别器D,使判别器无法区分真实样本和生成样本。生成器G 为了欺骗判别器,必须提升生成样本质量。而判别器为了更准确地区分原始数据和生成数据,不断提高自身判别能力。在生成器和判别器的博弈过程中,生成与原始样本分布越来越接近的样本,最终达到数据增强效果。GAN 的目标函数如式(1)所示。

其中,x表示真实样本,рdata(x)表示真实样本分布,z表示输入的噪声,рz(z)表示噪声的数据分布。D(G(z))表示生成样本输入判别器后的判别结果。D(x)表示真实样本输入判别器后的判别结果。

Fig.1 Structure of GAN图1 GAN结构

2 辅助分类生成式对抗网络

辅助分类生成式对抗网络(Auxiliary Classifier Genera⁃tive Adversarial Networks,ACGAN)在GAN 的基础上,将类别标签作为输入并指导样本生成,提高了生成样本质量。此外,ACGAN 的判别器添加了辅助分类器结构,即判别器不仅可以对输入样本进行真假判别,还可以输出样本的故障类别。在ACGAN 系统中,将样本的标签c~рc和随机噪声z融合并作为输入,由生成器生成样本Xfake=G(c,z)。判别器不仅对输入样本进行真假判别,还可以通过辅助分类器对输入样本所属故障类别进行判别,即判别器输出P(S|X),P(C|X)=D(X)。ACGAN 的目标函数如式(2)、式(3)所示。

其中,Ls为判别样本是来自真实样本还是生成样本的几率,Lc表示判断样本所属分类判断正确的几率,Xreal、Xfake分别表示真实样本和生成器G 生成的样本,P(S=real|Xreal)表示真实样本Xreal被判断为真实样本分布рdata(x)的概率,P(S=fake|Xfake)表示生成样本被判断为生成样本分布рz(z)的概率,P(C=c|Xreal)和P(C=c|Xfake)分别表示判别器对真实样本和生成样本的故障类型标签判断准确的概率。

判别器D 的目标在于既要准确判别样本是否是真实样本,又要分辨样本所属故障类别。因此,在训练过程中判别器尽量使得Ls+Lc达到最大。

而生成器G 在训练过程中,要尽可能生成与真实样本分布相同的样本,使得判别器无法判别是否为真实样本。因此在训练过程中G尽量使得Lc-Ls最大。ACGAN 将样本标签c作为输入,指导样本生成,提高了生成样本质量。ACGAN 的判别器增加了辅助分类结构,使得判别器在分别真假样本的同时,能够对样本进行精准分类。因此,AC⁃GAN 的生成样本质量相比GAN 更高,并且训练过程更稳定。ACGAN 的系统结构如图2所示。

Fig.2 Structure of ACGAN图2 ACGAN结构

3 改进ACGAN

GAN 作为数据增强的主流方法仍存在生成样本质量不高、训练过程不稳定以及容易出现模式坍塌等问题[16]。为进一步提升GAN 的性能,生成高质量的样本,本文将压缩激励机制(SE)融合到ACGAN 结构中[17],通过显式建模通道之间的相互依赖性,自适应地重新校准通道特性响应。

首先,对于输入X,通过变换Ftr将X映射到特征U,其中U∈RH×W×C;然后对U进行压缩操作Fsq,即跨空间维度(H×W)聚合要素图,产生尺寸为(1×1×C)的通道特征zc;再进行拓张操作Fex。Fex采用自选通道机制的形式,将通道特征zc作为输入,生成每个信道调制权重的集合sc。将这些权重应用于特征映射U以生成SE 块的输出,可以直接输入到网络的后续层。SE 结构如图3所示。

Fig.3 Structure of SE图3 SE结构

其中,Fsq表示使用全局平均池化操作对输入按通道进行压缩,输入样本U的维度为(H,W,C),H和W分别表示输入样本的长和宽,C表示通道数。对样本按通道进行压缩,求得每个通道的权重。Fsq操作表达式如式(4)所示。

通过Fsq对尺寸为(H,W,C)的映射集合U按通道进行压缩,得到每个通道的权重,输出为(1,1,C)的向量zc,之后将zc输入到Fex进行激励操作。Fex操作的表达式如式(5)所示。

其中,δ表示激活函数ReLU,σ表示激活函数Sigmoid。此外,并且。为了限制模型的复杂程度并增强通用性,压缩操作Fex用两层全连接层增强非线性。第一层全连接层以降维比率r对输入样本z进行降维,再由第二层全连接层进行维度扩张。经过Fex操作,得到通道的权重输出sc。之后,经过权重优化Fscale操作,可以得到通道特性响应校准后的样本分布xc。Fscale表示将输入uc与权重sc按通道相乘,Fscale表达式如式(6)所示。

本文在SE 结构上添加了残差结构(Residual Network,ResNet)[19],解决GAN 中容易出现的梯度消失和梯度爆炸问题,提高ACGAN 的稳定性。其中,残差结构中卷积操作的卷积核数量C与输入样本的通道数相同,并采用Padding操作,保证输入与输出形状相同。

将SE 结构融合到ACGAN 的判别器结构中,提高判别器特征提取能力,使得训练过程更加稳定从而提升生成样本质量。改进后的ACGAN 结构如图4所示。

4 仿真与实验

ACGAN 和ACGAN 均采用相同的RMSprop 方法,解决训练中的不稳定问题[20]。此外,本文引入IS(Inception Score)[21]和FID 距离(Fréchet Inception Distance)[22]以评价模型的生成样本质量及多样性。仿真实验采用的是凯斯西储大学(Case Western Reserve University,CWRU)提供的电机轴承数据,共有10 种故障类别,其中包括1 种正常状态以及外圈、内圈和滚珠3 种故障,每种故障分别包含0.18mm、0.36mm、0.54mm 3种故障尺寸。

4.1 改进ACGAN的生成样本能力评估

本文将改进后的ACGAN 和ACGAN 的生成器损失、判别器损失及故障类别分类准确率进行对比。当训练样本数量为1 000时仿真结果如图5——图7所示。

图5 为ACGAN 和改进后的ACGAN 生成器G 损失函数值的变化趋势对比图。改进后ACGAN 的生成器在训练10 000 次左右已经收敛并趋于稳定。而ACGAN 的生成器大概在训练25 000 次之后开始收敛。相比之下,改进后ACGAN 的生成器可以更快收敛,损失值较小并且训练过程更为稳定。

图6 为判别器D 损失函数值变化趋势对比图。改后的ACGAN 模型在开始训练之后,判别器D 的损失函数值迅速下降,并且在10 000 次之前就趋于稳定和收敛。而AC⁃GAN 模型的判别器D 在15 000 次之后才开始收敛。改进后的ACGAN 判别器D 损失函数值可以更快收敛并且收敛值更小。

图7 为辅助分类器故障分类准确率变化趋势对比图。改进后ACGAN 的辅助分类器的分类准确率比ACGAN 更高,并且在迭代训练10 000 次左右已经稳定,而ACGAN 需要训练15 000 次之后才能趋于稳定。改进后ACGAN 的辅助分类器收敛速度更快、准确率更高。

Fig.5 Comparison of generator loss function values图5 生成器损失函数值对比

由仿真结果可得,改进后的ACGAN 结构可以更快地收敛,生成器和判别器的损失函数稳定值更小,训练过程更稳定。此外,改进后ACGAN 辅助分类器在训练过程中的收敛速度、分类准确率更高。

4.2 改进ACGAN模型评价

本文使用IS 和FID 距离评价生成样本质量和多样性。IS 以生成样本x属于各类别的概率分布为依据量化生成样本质量。IS 参数计算公式如式(7)所示,相关参数如式(8)、式(9)所示。

Fig.6 Comparison of discriminator loss function图6 判别器损失函数对比

Fig.7 Comparison of classification accuracy of auxiliary classifier图7 辅助分类器分类准确率对比

其中,x表示生成样本,рg表示生成样本分布,y表示类别标签,P(y|x)表示生成样本x属于各类别的概率。P(y)表示生成样本x的边缘概率密度,计算公式如式(8)所示,DKL表示求散度,用以衡量两个概率密度分布之间的差距,DKL的表达式如式(9)所示。当GAN 性能较好时,生成样本所属类别的概率很大,而其他类别的概率很小,即概率密度分布图呈现尖峰状,而边缘概率密度P(y)与类别概率分布P(y|x)相反。当模型性能优良时,边缘概率密度P(y)趋向于平均。因此,当迭代次数不断增大时,IS 的值应不断增大。当数据样本为1 000 时,传统模型以及改进ACGAN的IS对比如图8所示。

由图8 可知,传统模型的ACGAN 在训练15 000 次训练之后IS 值开始收敛,而改进后的ACGAN 在训练10 000次时已经收敛,并且收敛值大于传统模型的IS值。

此外,引入FID 距离进一步衡量生成样本的多样性。当FID 越小时,生成样本与真实样本分布越接近;当FID 距离等于0 时,生成样本分布与真实样本相等。FID 相比于IS 对系统的噪声具有更好的鲁棒性。此外,FID 距离对于GAN 时常出现的模式坍塌问题更为敏感。当模型出现模式坍塌问题时,FID 距离的值会非常大。因此,FID 可以更好地评价生成样本的多样性。FID 距离的计算公式如式(10)所示。

Fig.8 Comparison of IS图8 IS指标对比

其中,μx和μg分别表示真实样本x和生成样本g的数学期望,covx和covg分别表示真实样本x和生成样本g的协方差矩阵,Tr 表示对矩阵求解,即对矩阵对角线上的所有数求和。此外,对两个协方差矩阵求乘积之后开平方,当结果出现复数时,只保留实数部分。当故障样本为1 000张时,ACGAN 和改进后ACGAN 的FID 距离如图9所示。

由图9 的FID 距离对比可知,改进后ACGAN 的FID 值与传统模型相比更稳定,并且FID 收敛值更小。由仿真结果可得,在ACGAN 结构中融入残差压缩激励机制可以使得系统更快收敛,提高了生成样本质量。

本文用不同数量的样本分别训练ACGAN 及改进后的ACGAN 算法,分别得到生成样本。对传统的ACGAN 和改进后ACGAN 的生成样本质量进行评估,评估结果如表1所示。可以看出,改进后ACGAN 的生成样本质量更优。表1 中,IACGAN 表示改进ACGAN(Improved ACGAN)。由表1 可知,当训练样本数量越多,ACGAN 和改进后ACGAN的生成样本的FID 值越小,IS 值越大,即生成样本质量更优。而在相同数量训练样本的前提下,改进后ACGAN 生成样本质量相比较传统ACGAN 表现更好。

Fig.9 Comparison of FID图9 FID指标对比

4.3 轴承故障诊断

为进一步验证改进ACGAN 的数据增强方法的优越性,本文分别用传统ACGAN 模型和改进后ACGAN 的生成样本扩充原始样本,并进行故障诊断分类。本文对不同数量等级进行数据增强,不同数据增强方法下故障诊断准确率如表2所示。

当原始样本数量一定时,生成样本数量越多,故障诊断准确率越高。但是,当生成样本增加到一定程度时,即当生成样本大于等于4 000 张时,准确率不再上升。由仿真结果可知,用改进的ACGAN 方法扩充原始数据集相比于传统的ACGAN 可以得到更高的故障诊断准确率。

Table 2 Comparison of fault diagnosis accuracy under different data enhancement表2 不同数据增强下的故障诊断准确率对比

5 结语

本文在ACGAN 结构基础上进行改进,在ACGAN 的判别器中融合了改进的残差压缩激励机制。改进后的AC⁃GAN 针对不同通道的重要性建模,自适应地重新校准通道特性响应,解决了GAN 训练过程中容易出现的梯度消失或者梯度爆炸问题,算法在训练过程中更加稳定。改进后的ACGAN 与传统模型相比,生成样本质量更好,其分布与真实样本分布更接近,电机轴承故障诊断准确率可达99.82%,为解决小样本轴承故障诊断分类准确率低的问题提供了思路。

虽然本文提出的数据增强方法能够提高故障诊断准确率,但是仍存在一些问题亟待解决:①着重于改进数据增强方法研究,在故障诊断分类方法上并未深入探讨,在后续研究中,将对不同分类方法进行仿真实验,进一步验证本文所提方法的可行性;②验证了所提出的数据增强方法在数据集数量有限情况下的优化效果,在后续研究工作中,将验证在数据集分布不均衡情况下的优化效果。

猜你喜欢

分类器故障诊断准确率
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
高速公路车牌识别标识站准确率验证法
BP-GA光照分类器在车道线识别中的应用
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
因果图定性分析法及其在故障诊断中的应用
基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断
高速泵的故障诊断