基于1D-RSLBCNN的齿轮箱故障诊断*

2023-11-28高丙坤丁春阳

组合机床与自动化加工技术 2023年11期

高丙坤,丁春阳,孙双

(东北石油大学电气信息工程学院,大庆 163318)

0 引言

齿轮箱是一种被广泛应用于各种机械设备中的传动装置,在多个领域发挥着关键作用。然而由于其复杂的工作环境和长时间的负荷运转,齿轮箱常常会发生故障,造成巨大的经济损失。因此,对齿轮箱早起的故障进行诊断具有重要的意义,以便能够及时发现问题、排除故障,进而降低损失[1-2]。

随着机器学习的发展,对于齿轮箱故障诊断的研究也更加智能化,形成了人工特征提取与浅层学习分类相结合的故障诊断模式。在上述的诊断模式中,首先利用信号处理方法,如傅里叶变换(fourier transform,FT)[3]、经验模态分解(empirical mode decomposition,EMD)[4]、小波分解(wavelet transform)[5]、小波包分解(wavelet packet decomposition)[6]等,提取时域或时频域特征;然后,将这些统计参数输入机器学习算法中进行诊断,包括支持向量机(SVM)[7]、人工神经网络(artificial neural network,ANN)[8]、随机森林(random forest,RF)[9]、决策树(decision trees,DT)[10]等。PANG等[11]为验证机器学习在齿轮箱故障诊断中的可行性,实现了包括决策树、随机森林、支持向量机等在内的算法,以进行结果分类,实验表明决策树和随机森林在训练和测试样本的表现都更好。RAFIEE等[12]开发了一种基于ANN的故障诊断系统,可以识别出故障齿轮,该系统在齿轮箱故障诊断方面有着广泛的应用。虽然机器学习在机械故障诊断方面取得了不错的成就,但是人工提取时域、频域以及时频域特征在这些方法中具有依赖性,并且其浅层的网络结构很难学习到故障信号高维度、非线性的数据特征[13]。

近年来,深度学习方法[14-16],已经在机械故障诊断中广泛运用并发挥出优良性能。卷积神经网络(convolutional neural network,CNN)作为深度学习的代表,具有很强的特征提取和表达能力,被广泛的运用于机械故障诊断中。郭俊峰等[17]建立了基于一维卷积神经网络和动态路由相结合的故障诊断模型,该模型采用多个全连接层,导致模型的可学习参数多,训练时间和测试时间较长;叶壮等[18]提出了多通道卷积神经网络的故障诊断模型,虽然该方法能全面提取特征细节,训练精度相较于传统1D-CNN也有提升,但是该模型加深了网络宽度,导致训练时间长,运算效率低;姚齐水、 LIU等[19-20]根据目前的轻量化网络结构Inception、ShuffleNet搭建网络模型,但是为了达到理想的训练效果加深了网络深度,相对于传统CNN来说,模型轻量化并没有很明显。

针对传统故障诊断模型参数量大,训练、检测时间长的问题,本文提出了一种基于残差模块和局部二进制卷积的轻量化故障诊断方法(1D-RSLBCNN)。该方法利用局部二进制卷积搭建网络,在保证准确率的同时,减少了模型参数,加快了训练速度和收敛速度,并通过QPZZ-Ⅱ型故障模拟试验台的数据对模型进行了验证。实验结果表明,该模型可有效应用于齿轮箱故障诊断,具有较好的工程应用价值。

1 理论基础

如图1所示,所提出的1D-RSLBCNN架构由6个重要部分组成,即局部二进制卷积层(LBC)、两个残差模块、全局平均池化层(1D-GAP)、全连接(FC)层和log_softmax层。首先,局部二进制卷积层提取一维齿轮箱故障信号的低维特征;然后,两个残差模块依次对该低维特征向量进行嵌入和融合,得到深层特征,所提取的深层特征向量由1D-GAP层进行降维和维度变换等操作,利用FC层对提取的特征映射进行非线性拟合;最后,利用log_softmax层获得不同条件下的故障类别。

图1 1D-RSLBCNN模型结构

1.1 改进的一维残差模块

1.1.1 残差结构

如图2所示,残差连接允许获得齿轮箱故障信号中任何深层的特征信息。输出y为输入x和残差映射输出F(x)的叠加值。其中F(x)是通过对x进行卷积核激活运算所得,然后通过激活函数,形成整个一维残差块。

图2 残差模块图3 改进的残差模块

残差块可以表示为:

xl+1=xl+F(xl,wl)

(1)

式中:xl+1为第l+1层的输出,xl为第l层的输入,F(xl,wl)为第l层的残差。

为了减少模型参数,提高模型的训练效率,本文对残差模块进行改进。如图3所示,该残差模型有两个残差块,以局部二进制卷积层和传统的一维卷积层相结合构成残差模块主体,通过两次跳跃连接构成整个残差连接部分。局部二进制卷积将权重和激活都约束为二进制,因此利用改进的残差模块不仅能避免由于网络深度而引起的分类精度饱和问题[21-22],同时能减少模型参数,提高运行效率。

1.1.2 局部二进制卷积层(LBCNN)

在LBCNN层,以局部二进制模式(LBP)为基础,将LBP算法和一维卷积相结合来替代传统的卷积运算,提高了训练速度的同时,加快了收敛速度[23]。

LBP将相邻元素的强度与斑纹内中心元素的强度进行比较[24-26]。假设一个矩阵的元素分布如图4所示,与中心元素相比,具有较高强度值的相邻元素的值为1,否则为0。然后,按顺序读取这些二进制数,并通过由基数2构成的设计运算符将其转换为十进制数,例如预定义的权重向量v=[27,26,25,24,23,22,21,20]。最后的结果可以通过将这些矩阵的相应元素的乘积求和得到。此时,中心(xc,yc)的LBP特征提取可以表示为:

(a) 3×3原始矩阵 (b) LBP编码

(2)

式中:in表示第N个相邻元素的值,ic表示中心元素的值,N表示原始矩阵的大小,如果in≥ic,s(·)=1,否则,s(·)=0。

(3)

美国教育家约翰·杜威曾提出过“教育即生活”。口语交际的内容，即在日常生活。交际内容生活化，最好的口语交际内容就是在学生的日常生活中，在鲜活真实的情境中，孩子们才能感受言语者的意图。口语是我们日常生活中直接的沟通交流工具，将口语交际延伸到日常生活中的各个角落，让学生在生活中实践和体会口语交际的规律。

LBCNN层的可学习参数明显少于标准卷积层,卷积核的大小以及输入和输出维度的数量相同。假设卷积核没有偏置项,卷积层和LBCNN层中可学习参数的数量之比[23]为:

(P·H·W)/K

(4)

式中:H和W为卷积核的大小,P为输入通道的数量。

1.2 全局平均池化层

全局平均池化(global average pooling,GAP)[27]相对于传统卷积网络中的全连接层,直接实现了降维,极大的减少了网络的参数。并且为了防止过拟合,GAP对整个网络在结构上进行了正则化处理。具体计算过程为:

(5)

传统全连接层和全局平均池化层的详细说明如图5所示。全连接层将卷积层生成的特征映射压平(flatten)之后再对特征映射进行分类,而GAP直接将上述过程合二为一。设计1D-GAP层替代全连接层,减少了模型的可学习参数,有效的缩短了训练时间。

(a) 全连接层 (b) 全局平均池化层

2 齿轮箱故障诊断实验验证

2.1 实验环境

为了采集大量的齿轮下故障信号,搭建了如图6所示的实验台。

该实验台是由电机、齿轮箱、轴承座组成。实验中待诊断的齿轮箱内部分别有行星轮齿和太阳轮齿两种齿轮。其中太阳轮齿分别有正常、磨损和缺齿3种状态;行星轮齿分别为正常和磨损两种状态。具体齿轮故障如图7所示。

图6 齿轮箱故障信号采集实验台图7 齿轮箱故障

2.2 数据集简介

表1 实验数据集

图8 齿轮箱6类故障信号

2.3 模型参数

1D-RSLBCNN模型的详细参数如表2所示,该模型的总参数为2456。由表可知,传统一维卷积的可学习参数为784个,而局部二进制卷积层的可学习参数为262个。在这里,我们将输入通道设置为16,卷积核大小设置为3,一共产生16位映射,可知局部二进制的可学习参数为传统一维卷积的。

表2 1D-RSLBCNN 模型参数

2.4 故障诊断结果和分析

根据上述方法,将表1中数据输入1D-RSLBCNN模型中进行训练,本实验采用Adam优化器,对模型进行300次迭代训练,迭代训练精度和损失如图9所示。由图可见,10次迭代后训练精度接近85%,之后的训练模型准确率总体呈上升趋势,损失值也呈下降趋势。最终模型在45次迭代之后趋于稳定。由此可知,模型的诊断精度较高,同时具有较好的稳定性。

图9 训练过程曲线图10 测试结果的混淆矩阵

完成1D-LBCNN的训练后,进行网络测试,测试的混淆矩阵如图10所示,结果显示该方法在每一类故障上都获得很好的识别效果。

2.5 与其他模型对比

(1)配备不同优化器的1D-RSLBCNN模型的训练精度如图11所示。可以观察到,4个优化器实现了1D-RSLBCNN模型的优化。Adam优化器在迭代45次的时候,训练精度已经接近100%,并且趋于平稳。而其他3种优化器在迭代45次时最高的训练精度才接近80%,并且在后面的迭代中仍有上升或下降的趋势。由此可见,与其他优化器相比,Adam具有更快的收敛速度和训练效率。因此,在1D-RSLBCNN模型中采用Adam作为优化器。

图11 使用不同优化器的训练图12 相同网络结构对比

(2)ResNet网络作为一个经典的CNN网络,用来和提出的1D-RSLBCNN网络进行对比,其中ResNet中的残差块数量与本文模型相同。由图12可知,在迭代前50次的时候,1D-RSLBCNN的收敛速度比ResNet快。在迭代45次的时候,所提出的网络的结构的训练精度已经接近100%,而ResNet的训练精度为88%,这证明了1D-RSLBCNN的快速训练能力。通过详细比较两个网路的结构和参数,可以发现,ResNet中的卷积层中包含784个可学习参数,1D-LBCNN的LBC层中仅包含262个可学习参数。

(3)为了验证所提方法的优越性,使用不同深度学习和机器学习的方法,包括CNN(ResNet-18,LeNet-5)、文献[28]、SVM、KNN等进行对比。实验结果如表3所示,表3中的实验结果是迭代100次后的训练精度,与其他5种方法相比,所提出的方法实现了最高的准确率,这表明所提出1D-RSLBCNN比其他方法具有更好的诊断性能。此外,1D-RSLBCNN的模型训练时间为112 s,低于LeNet-5,ResNet-18以及文献[28](分别为470 s,272 s,630 s),可学习参数为2456,远低于LeNet-5,ResNet-18以及文献[28](分别为34372,14820,85540),图13也说明了所提网络具有更快的收敛速度和训练效率。同时,每类样本取50万个采样点进行预测,所提网络预测318次仅需0.28 s,而LeNet-5,ResNet-18以及文献[28]分别需要1 s,0.95 s以及1.56 s。