基于深度特征提取和对抗域适应网络的滚动轴承故障诊断*
2023-02-03张礼华陈景铭
陈 凯 张礼华 赵 恒 陈景铭
(江苏科技大学机械工程学院,江苏 镇江 212003)
根据对离心机及其他旋转机器的故障进行研究发现,轴承故障是旋转设备的高频常发故障,有案例表明45%~55%的设备故障都是由轴承引起的[1]。轴承故障会引发旋转设备的异常振动和其他一系列问题,甚至引发安全事故。
近几年随着计算机技术的发展,对轴承故障的诊断技术也在快速提升。基于深度学习的故障诊断方法能自适应提取特征,优于其他浅层诊断模型,在智能故障检测领域取得了重大进展[2]。宋霖等人采用卷积神经网络对轴承进行故障诊断,并获得了良好的诊断准确率[3]。但传统的卷积模型存在卷积核设置过小,无法将全部的故障波动噪波纳入感受野的问题,同时实际生产中大多情况下轴承都处于变工况的工作状态,普通的诊断模型在这种情况下的诊断效率不太理想。
在变工况故障诊断领域中,存在源域与目标域分布间的特征分布不一致,导致故障诊断准确率降低的问题。为解决这一问题,众多学者从深度迁移学习中域适应的角度提出了解决方法。Tzeng E等人采用最小化最大均值差异(maximum mean discrepancy, MMD)距离的方法,缩小源域与目标域之间的距离,达到跨域诊断的效果[4]。Sun B等人采用相关对齐(CORAL)作为一种度量,对齐多层特征故障分布的二阶统计量来减小源域与目标域之间的差异[5]。吴耀春等人提出了一种基于对抗域自适应卷积神经网络(ADACNN),首先构造了一个权值共享的CNN网络,其次在源域与目标之间引入MMD进行域自适应达到了较高的诊断准确率[6]。Yaroslav G等人提出对抗域适应网络模型(domain-adversarial training of neural networks,DANN)[7],用以解决源域与目标域分布不一致的问题。目前DANN在故障诊断中的应用主要集中在构建对抗域适应网络上,而对前期的特征提取部分关注较少,且通常会忽略振动信号中蕴含的时序信息。
基于上述分析,本文提出了一种基于深度特征提取和对抗域适应的变工况滚动轴承故障诊断方法。其主要内容如下:
(1)提出了一种基于深度特征提取网络与对抗域适应的变工况滚动轴承故障诊断方法,该方法基于首层采用宽卷积核的卷积神经网络与长短时记忆网络结合的深度特征提取网络,同时在源域与目标域之间引入DANN网络实现对抗域适应,解决了源域数据与目标域数据之间的特征分布偏移导致的诊断网络性能下降问题。
(2)提出了一种深度特征提取网络,对卷积神经网络进行改进,首层使用宽卷积核获取高频特征、截获所需的异常波动,使用多层小卷积核获取低频特征、使网络具有更强的深度学习能力,同时在网络中接入LSTM以提取信号中的时序信息。
(3)在DANN中的类别预测器与域分类器中,提出增加一层全局平均池化层,优化了网络模型,减少了模型参数,避免过拟合。
1 理论基础
1.1 卷积网络结构
卷积网络主要由卷积层、激活层和池化层等构成。CNN网络已广泛应用于文本图像的识别与分类。但传统的CNN网络,卷积核设置过小,处理轴承的一维振动信号时难以将轴承故障点的全部信号完全纳入感受范围,易出现特征提取不完全问题。针对这一问题,提出一种首层采用宽卷积核与多层小卷积核结合的卷积网络。其网络结构如表1所示。第一层采用宽卷积核,让所需的异常波动能够在卷积时被截获,同时也利于从高频噪声信号中提取振动信号的短时特征,其余的卷积层卷积核大小均采用小卷积核,以提取信号中的低频特征。以小卷积核进行多层卷积,有利于加深网络,抑制过拟合[8]。
表1 网络结构参数
卷积层的作用是通过卷积核对信号的局部区域进行卷积,输出相应的特征:
激活层的作用是在卷积运算后使用修正单元ReLU激活函数将原本线性不可分的多维特征映射到另一空间,增强网络的表达能力和学习能力。
式中:al(i,j)表示卷积层输出yl(i,j)的激活值。
池化层又称降采样层,使用最大池化将感知域中的最大值作为输出,以减少前一层神经元的特征和参数的空间大小。
式中:al(i,t)表示第l层第t个神经元的激活值。
1.2 LSTM网络结构
循环神经网络(recurrent neural network,RNN)能够有效地处理序列变化的数据。传统的RNN网络存在易产生梯度消失和爆炸的问题。这里引入RNN的一种变体长短时记忆网络(long short term memory network, LSTM)。
LSTM具有特殊的“门”结构,门单元选择性地让信息通过,决定着数据的更新与丢弃。如图1所示,一个LSTM网络具有输入门、遗忘门和输出门3个门单元。这样的网络结构让网络非常适合处理通过时间序列数据的分类问题。
图1 长短时神经网络
1.3 对抗域适应网络
在迁移学习中,引入域的概念。将数据集分为源域(source domain)数据集与目标域(target domain)数据集。源域数据是已知有标签的,目标域数据是未知需要实现分类的。源域与目标域之间分布不同,但存在一定联系。这里本文引入DANN的概念,构建一个域分类器和类别分类器。利用源域数据为源域建立一个分类器,但是由于目标域数据本身没有标记,无法通过常规方法为目标域构建分类器,这时候域适应就可以发挥作用了,在同一个特征空间中源域和目标域的分布不同,假设两者分布相同,那么就可以直接利用源域分类器对目标域数据进行分类。
DANN的网络结构如图2所示,其由3个部分组成,即特征提取器、类别预测器和域分类器。
图2 DANN(对抗域适应)网络模型
首先输入信号x会经过以 θf为权重的特征提取器,信号会被映射为一个D维的特征向量。其次DANN会分为以 θy为权重的类别预测网络Gy(x;θy)和以 θd为权重的域分类网络Gd(x;θd)。源域数据输入对应的特征向量会经过Gy(x;θy)的映射获得对应轴承的分类标签预测结果,同时不管是源域输入还是目标域输入的特征向量都会经过Gd(x;θd)得到每个输入的域分类结果。则类别预测网络的损失如式(4)所示。
域分类网络的损失为
在训练模型时要实现两个目标:第一个目标是能够准确的将源域数据进行分类,即使类别预测网络分类误差最小化;第二个目标则是让域分类器无法识别数据来自哪个域,即最大化域分类误差。在训练模型的过程中实现两个损失之间的相互平衡。则DANN的损失函数即可以定义成
式中:n为总样本数;ns为源域的样本数量;nt为目标域的样本数量。
DANN网络的任务是使分类误差最小化,即使得类别分类损失最小化。
另一个任务是使域分类损失最大化。
在训练器时,域分类器与类别预测器相互对抗,当训练完成时,实现两个损失之间的相互平衡。
对抗域适应网络在训练过程中,模型参数的梯度更新公式为
2 基于深度特征提取和对抗域适应网络的滚动轴承故障诊断方法
特征提取网络对轴承特征提取不够全面的情况下会降低诊断效率,现在常用的特征提取网络忽略了轴承振动信号中蕴含的时序信息。以及变工况情况下,相同的轴承故障,会出现故障特征相同但分布不同的情况,不同负载下的振动信号有较明显差异,这也导致了传统故障诊断方法诊断效率低的问题。
对此本文提出一种基于深度特征提取与对抗域适应结合的方法。在特征提取部分,提出一种基于首层采用宽卷积核的卷积网络,同时融入长短时记忆神经网络提取网络中被忽略的时序信息,确证能够充分提取到轴承振动信号的特征,供类别预测器使用,以完成高水平的分类任务。其网络结构参数如表2所示。
表2 特征提取网络结构参数
特征提取网络由4层卷积层、2个LSTM层,其中卷积层第一层是64×1的大卷积核,其余为3个3×1的小卷积核。
同时本方法针对不同负载下相同故障的振动信号分布存在差异的情况,引入域适应与域对抗的概念。将某一负载下已有标签的振动信号视为源域,将另一负载在未知标签的振动信号作为目标域。变工况情况下故障诊断效率低的原因为不同工况下振动信号的特征空间相同,但特征分布不同。假如两者分布相同,则可利用某一工况下的故障类别预测器对另一工况下的故障进行分类。故在网络中引入梯度反转层(gradient reversal layer,GRL),搭建对抗域适应网络,消除分布差异,以实现借助具有充足标记数据的源域信号,对无标记的目标域数据进行分类。其具体结构如图3所示。
图3 所提模型的结构图
类别预测器利用特征提取网络提取的信息对样本进行分类,域分类器判断数据来源。其中在类别预测器和域分类器中增加了一层全局平均池化层,这样减少了模型中的大量参数,避免模型过拟合。全局平均池化的计算过程为
式中:h()代表全连接运算函数,是全局平均池化层和全连接层之间的训练参数。
在输出层,Softmax分类器会输出每一个样本的标签概率,实现对源域数据的标签进行预测。
式中:ws和bs是全连接层和输出层之间的参数。
3 实验验证
3.1 数据选择
实验中选择的是西储大学的公开轴承数据集,该数据集是目前使用最为广泛的数据之一。数据集中包含0~3 hp不同负载下的4种轴承故障,每种负载下又包含内、外圈故障、滚子故障和正常状态4种不同健康状态,以及7、14和21密尔3种不同的故障级别,采样频率为12 kHz。因此每种负载下对应10种健康状态。
为对比添加了对抗域适应网络与未添加对抗域适应网络的区别,设置了分别以某一负载下的振动数据为源域数据,另一负载下的振动数据为目标域的迁移任务,本文采用随机组合的方式设置了如下的迁移任务,如表3所示。
表3 迁移任务
其中任务A为同域下的故障诊断,以测试同一域下网络的诊断能力。
对数据进行预处理,利用EEMD对轴承的原始信号进行分解与重构,在一定程度上消除噪声与谐波的干扰。每种健康状况中选取100个样本作为训练集、80个样本作为验证集,每个样本截取包含2 048个数据点的轴承振动信号。训练批次大小为40,通过贝叶斯优化算法,确定学习率为0.000 2,训练频次为70,权重衰减系数为0.000 5。
3.2 实验结果
为了表明深度特征提取网络在对轴承数据进行特征提取时良好效果,对第一层卷积层之后的特征和经过深度特征提取网络之后的特征,运用t-SNE进行特征可视化,其结果如图4、5所示,图中每一种图例代表一种故障类型,如0.007 RF表示损伤为0.007英寸的滚动体故障。
图4 特征提取前
由图5可以看出,一维的轴承振动数据在经过特征提取网络后很好地完成了10种故障信号的聚类。
图5 特征提取后
未进行对抗域适应时的故障诊断结果如表4所示。
表4 未进行对抗域适应时故障诊断结果
实验结果表明只在基于深度特征提取的分类模型下进行跨域的故障诊断效果不理想。在同一工况下,该网络的故障识别能达到98.5%的准确率,而当在用一个工况下训练的模型对另一工况下的轴承数据进行跨域诊断时,其准确率较低。
添加了对抗域适应后的故障诊断结果如表5所示。
表5 添加了对抗域适应后的故障诊断结果
实验结果表明,同一工况下故障诊断的准确率较好,能达到99.3%。不同工况下的跨域诊断也由之前不到90%的准确率,提升到了98%以上。以迁移任务B为例,未添加对抗域适应网络时以工况1(0 hp)训练的故障诊断模型对工况2(3 hp)的故障信号进行诊断时,诊断效率仅为80.2%,添加了对抗域适应后故障诊断率为98.6%。表明了本文所提方法有效地增强了跨域诊断能力,能够实现变工况下的故障诊断。
为进一步表明本文所提方法在对轴承变工况情况下故障诊断的有效性,分别将SVM、WDCNN、普通的DANN、BPNN与本文所提方法作比较,得出结果如图6所示。结果表明本文所提方法在变工况情况下对轴承故障的诊断准确率均高于实验对比的其他方法。
图6 不同模型准确率对比
为更直观地体现变工况情况下本文所提模型的诊断效果,选取0 hp作为源域,3 hp作为目标域这组实验,运用t-SNE进行可视化。特征可视化对比如图7、8所示。从图可以看出添加了对抗域适应算法后的源域和目标域相同的故障特征由之前的不聚合变成聚合,这表明在对抗域适应的作用下,本文所提方法能够有效提取到既适用于源域又适用于目标域的可迁移特征,源域的类别预测器也可用于目标域故障的分类。这也再次表明了,本文的模型可有效解决变工况下轴承故障诊断效率低的问题。
图7 未添加对抗域适应
图8 添加对抗域适应
4 结语
本文提出了基于深度特征提取和对抗域适应网络的变工况滚动轴承故障诊断方法,用于解决轴承的变工况智能诊断问题。
所述方法以轴承的一维振动信号作为输入,通过设计改进卷积神经网络和LSTM组成的深度特征提取器完成对振动信号的深层次挖掘,同时在类别预测器与域分类器之间添加梯度反转层实现对抗域适应。在数据集上验证了本文所提方法在特征提取与变工况情况下的轴承智能诊断的有效性。并基于对比实验的原则,将本文所提模型与其他浅层模型以及其他域适应模型作对比实验,结果表明本文所提方法更具有优越性。