基于深度学习与电子听诊器的轴承故障诊断
2022-09-20雷高伟张清华苏乃权邵龙秋
雷高伟,张清华,苏乃权,邵龙秋
(广东石油化工学院,广东省石化装备故障诊断重点实验室,广东茂名 525000)
0 前言
旋转机械广泛应用于石化、冶金、钢铁以及轨道交通等领域,滚动轴承是旋转机械的关键部件之一,并且旋转机械45%~55%故障是由滚动轴承引起的,因此对滚动轴承进行状态监测和故障诊断有着重要的实际意义。
针对滚动轴承故障诊断,基于振动信号的故障监测也存在一定的缺陷,尤其对于大型复杂的设备,轴承的振动信号相对于设备其他部件如转轴、设备外壳等振动信号强度一般较弱,很容易被淹没,特别是在轴承早期轻微故障时,振动信号上并没有反应,利用听诊棒,却能听到轴承运行声音信号发生异常。另外,振动监测技术需要把振动传感器放到特定的位置才能得到较为准确有意义的数据,并且振动数据分布会随着传感器的位置不同而改变,而声传感器可以放在被监测器械外围方便的地方,且声学监测对故障信号比振动传感器更敏感。因此,与基于振动信号的监测方法相比,基于声学的监测方法具有一定的优势。听诊已被设备维护工程师使用多年,并被证明是用于检测轴承和机器运行状况变化的简单、有效的方法,几乎已普及至各工业领域。传统的听诊方法包括使用改锥、听棒(铜棒)等。现在,电子听诊器已成为企业设备巡检员/点检员、维护工程师使用的常见的基本检测仪器。听诊器探针传声质量高,与麦克风采集的声音信号相比,不容易被环境噪声污染,可以获得更高的信噪比。在实际中,设备管理检修人员对轴承进行巡检时,常常通过听轴承的运行声音是否有异来判断轴承状态的好坏以及故障类型,该方法简单易行,而且非常有效。但是该做法对人员要求高,而且不能实现自动化诊断。利用深度卷积神经网络进行滚动轴承故障诊断,具有“一体化”的特点,即将信号滤波、特征提取、特征分类以及故障识别所有过程集成化处理。因此,本文作者提出一种电子听诊器与深度学习相结合的故障诊断方法。
目前,深度学习被广泛应用于故障诊断领域,并且取得了显著的诊断效果。文成林、吕菲亚全面总结了深度学习在故障诊断研究中所使用的算法模型,并提出了“集成创新”、“数据+知识”和“多技术融合”等故障诊断思想。陈保家等利用DBN网络强大的自动提取特征能力获取故障信号的特征,然后对故障信号进行傅里叶变换,再利用DBNs进行故障诊断,获得高达99.7%的正确率。GAN等利用一种基于CNN的两层分层检测网络,检测轴承的故障类型和故障程度。曲建岭等提出一种“端到端”具有自适应能力的一维卷积神经网络故障诊断算法,所搭建的模型在美国凯斯西储大学(CWRU)滚动轴承数据库上能够达到99%以上的正确率,并具有良好的泛化能力识别未知故障情况,具有一定的实用性。HOANG、KANG利用基于二维的卷积神经网络在CWRU轴承数据集上识别振动图像,进行故障的检测和分类。孙文珺等提出一种将去噪自编码与稀疏自动编码器相结合的深度神经网络方法,并在训练过程中运用“dropout”函数防止过拟合,最终模型的故障诊断能力高于传统的BP神经网络。王崇宇等针对汽轮机转子不平衡与不对中故障,提出一种卷积神经网络的诊断方法,实现了故障类别、位置以及程度的诊断。EREN提出一种利用一维卷积神经网络(1D-CNNs)实现轴承故障快速准确检测的方法。在计算复杂度方面,1D-CNNs的实现使得系统更加高效,在不影响故障检测精度的前提下,降低了计算复杂度。将深度学习强大的特征提取能力与机械故障大数据的特点相结合,雷亚国等提出了一种新的机械装备健康监测方法,实现了变工况下不同故障位置不同故障类型的故障诊断问题。为了解决深度学习模型训练数据不平衡的问题,JIA等提出了一种深度归一化卷积神经网络,并在滚动轴承故障诊断中达到较高的准确率。李涛等人提出了一种基于粒子群优化(PSO)算法的自适应 CNN 故障诊断方法,解决了卷积神经网络(CNN)模型构建缺乏自适应性等问题。
1 一维深度卷积神经网络模型
深度卷积神经网络起源于图像处理,具有强大的图像处理能力,是一种二维卷积神经网络模型。由于声音信号属于一维信号,并不适用于直接处理,因此构建一维卷积神经网络模型,包括三部分,输入层、特征提取层以及输出层,其中特征提取层包括卷积层、池化层和全连接层。完整的一维卷积神经网络如图1所示。
图1 一维深度卷积神经网络模型
卷积层主要用来提取高维特征,对每个卷积中输出的logits值运用激活函数进行非线性变换。激活函数的作用是将原本线性不可分割的多维特征映射到另一个空间中,从而增强特征的线性可分性。采用ReLU函数作为激活函数,当输入变量大于零时,其导数恒为1,解决了梯度弥散问题。卷积运算及输出数学表达式为
(1)
其中:为卷积层输出;为卷积层输入;为权值;为偏置;为卷积核大小。
池化层采用降采样操作,用于提取主要特征和降低维度,可以防止过拟合以及降低计算量。
(2)
全连接层的每一个结点都与上一层的所有结点相连,用来把前边卷积层提取到的局部特征综合起来。其数学表达式如式(3):
(3)
Softmax激活函数又称归一化指数函数,它能将全连接层网络输出的最后一层神经元的每一个数值映射到0~1的一个实数空间,并且使得所有神经元的数值加起来为1,其数学表达式如式(4)所示:
(4)
其中:表示输出层第个神经元的值;为类别的个数。
2 数据集构建
文中的数据是利用瑞典斯凯孚公司的TMST3电子听诊器进行声音信号采集,轴承型号为6309深沟球轴承,运行在同样转速2 000 r/min、负载2×10N条件下的运行数据。一共包括5种状态,分别为正常状态、内圈损伤、外圈损伤、滚动体受损以及烟灰污染状态,画出它们的时域波形,如图2所示。
图2 5种不同状态的轴承声音信号波形
针对轴承5种不同的状态,在其稳定运行状态下,利用电子听诊器采集音频数据,每种状态音频时长为12 s,采样频率为32 kHz,把12 s音频数据以3∶1的比例分成两段,9 s作为训练数据,3 s作为模型测试数据,故障样本数据集见表1。其中训练数据集采用重叠采样的数据集增强方法进行处理,每个样本的长度按照轴承旋转周期进行截取,长度为960个数据点,重叠长度为480个数据点。测试数据集不采用重叠采样。重叠采样过程如图3所示。
表1 滚动轴承故障样本数据集
图3 重叠采样过程
3 实验过程及超参数调试
为了构建具有最佳性能的1D-CNN故障诊断模型,针对模型优化器类型、学习率、卷积层数目、卷积核大小以及每批次处理样本的数目等参数,通过反复试验的方法进行参数选择。
3.1 优化器及学习率
优化器是提高训练速度的一个重要因素。目前常用的最佳优化器为Adam,并且与B N联合使用在一定程度上防止过拟合作用。若选择的学习率过高,会导致损失函数振荡,难收敛到最优值;相反学习率过低,则训练效率低,达到收敛所需要的时间较长。在实验过程中设置Adam的学习率为0.1、0.01、0.001、0.001 2、0.000 1,在相同数据集下保持其他参数不变,进行200次迭代,得到的结果记录见表2。
表2 不同学习率下训练记录
从表2可以看出:学习率为0.1、0.01较高时,训练的正确率偏低,而且训练过程显示损失函数处于较高值,且反复振荡,200次迭代都没有收敛的趋势;而当学习率为0.000 1时,训练平均正确率能达到98.3%的高值,但是在训练过程中其正确率提升的速度较慢,并且可能会陷入局部最优的情况,因此综合考虑选择学习率为0.001 2。虽然0.001和0.001 2的正确率相差不远,速度也差不多,但是训练过程中发现0.001 2的训练正确率更稳定出现98.9%附近的数值,损失函数值的震荡更小。
3.2 卷积层数及卷积核数量与大小
严格来说卷积层数不属于超参数,但是对模型有着重要的影响,所以放在这里和超参数一起讨论。卷积层数决定了网络模型的深度,一定程度上模型深度越深越能充分地提取高维非线性特征,但是层数过多会导致参数过多影响训练的速度,同时增加过拟合的风险。另外,针对不同的对象及任务,卷积层数也不同,因此需要选择合适的卷积层数。卷积核的作用主要用来提取特征,一般来说核的数量越多,特征提取越充分,并且随着模型深度的增加,卷积核的数量倍增。而卷积核的大小则选择比较常用的两种3×1和5×1进行实验,实验结果见表3。
表3 不同卷积层数、卷积核个数实验记录
综合考虑此数据集训练得到的卷积层数、卷积核尺寸、准确率以及训练时间,最终的模型卷积层层数为4层,每层卷积核个数分别为16、32、64、128,卷积核尺寸为5×1。
3.3 Batch_Size大小的选择
Batch_Size的值太小,会造成模型训练时间长,收敛速度慢甚至无法收敛;若Batch_Size的值过大,首先显存可能无法支撑,其次会造成迭代次数变少而使得参数修正变得缓慢。通过设计不同大小的Batch_Size量来训练模型,并将结果记录在表4。
表4 批量处理量对模型判准率的影响
从表4可以看出:Batch_Size的值为16时,虽然正确率高,但训练模型所需要花费的时间太长;Batch_Size的值为512时,虽然训练时间短,但正确率低。综合训练时间效率以及性能方面考虑,确定1D-CNN故障诊断模型批量处理量为128。
3.4 1D-CNN模型实验结果
经过前面的实验,最终确定1D-CNN的模型参数如表5所示。
表5 1D-CNN故障诊断模型参数
确定最后模型之后,利用表1中的数据集进行模型测试,得到的准确率曲线如图4所示。
图4 1D-CNN模型训练正确率曲线
3.5 分类过程可视化
深度学习一直被说成是一个黑匣子。为了更直观地理解模型的工作过程,利用可视化工具t-SNE对分类过程进行可视化。t-SNE是在SNE(Stochastic Neighbor Embedding)的基础上发展而来,由Geoffrey HINTON等于2008年提出,是目前最理想的一种降维机器学习算法,可将高维数据降到2维或3维进行可视化,为实现可视化带来了极大的方便。分类过程可视化结果如图5所示。
从图5可以直观地看到:原始数据全部混和聚集在一起无法分开,随着不同类别的数据随着模型深度的增加,从不同卷积层输出的结果逐渐被分开,到全连接层输出的结果几乎完全分开,这说明了模型的有效性以及网络深度的必要性。
图5 1D-CNN分类过程可视化
4 结语
针对滚动轴承的故障诊断,提出一种基于电子听诊器与深度学习的故障诊断方法,利用深度卷积神经网络进行滚动轴承故障诊断,可以直接作用于时域信号,实现“端到端”的学习,具有“一体化”的特点,即将信号滤波、特征提取、特征分类以及故障识别所有过程集成化处理;和传统采集声音信号利用麦克风不同,采用的是电子听诊器,利用电子听诊器采集的声音信号不容易被周围噪声污染,得到的信号信噪比更高,不需要去噪处理。