基于改进DenseNet模型的滚动轴承变工况故障诊断*
2022-06-29杨嘉其董增寿
王 焜,刘 鑫,杨嘉其,董增寿
(太原科技大学电子信息工程学院,太原 030024)
0 引言
滚动轴承是旋转机械设备必不可少的零件,被广泛用于多个工业领域的重要设备上。由于滚动轴承经常工作在高温、变速且载荷多变等恶劣环境下,会使得轴承工作表面会出现不同程度的损伤,因此滚动轴承也是最容易导致旋转机械设备瘫痪的部件之一[1]。由滚动轴承的故障而造成旋转机械的事故发生率大约占30%[2]。因此,展开滚动轴承的故障诊断方法研究,实现运行状态的准确判别,对保障机械设备的安全运行具有极其重要的现实意义。
深度学习已成为了故障诊断和模式识别领域中的研究热点,卷积神经网络[3]可以自动从信号和图像中提取特征,有效的挖掘故障信息,因此在旋转机械故障诊断研究中获得了较多的关注。HOANG等[4]提出了一种基于卷积神经网络的轴承故障诊断方法。通过将原始一维信号处理为二维图像作输入,取得了较高的诊断精度,并且具有良好的泛化性和抗噪声能力。ZHANG等[5]提出了一种宽卷积核卷积神经网络(WDCNN)的诊断方法,通过在第一层使用宽卷积核来获取更大的感受野,以提高网络获取全局信息的能力,有效提高了诊断准确率。但是,该方法在特征提取过程中需要获得全局信息,增加了网络的计算量,并且在诊断过程容易受到无效特征的影响。谢天雨等[6]提出了一种基于CNN和ECA的改进轴承故障诊断方法,通过采用ECA模块来增强故障特征通道权重,降低了无关特征对模型的干扰。与传统故障诊断模型相比,卷积神经网络模型在诊断准确率上有显著提升,但是该网络模型仍存在不足:一是随着网络模型层数的增加会导致参数过多,并且还会导致部分有用信息丢失。二是浅层特征对振动信号故障信息表征能力不足,一些无关特征会影响到模型对轴承故障诊断准确率。因此,本文提出了一种以二维小波时频图为输入结合风格再校准模块[7](style-based recalibration module,SRM)和密集卷积神经网络[8](densely connected convolutional networks,DenseNet)的智能故障诊断模型。通过实验证明,该方法可以有效识别滚动轴承在变工况条件下的多种故障类型,具有较强的泛化能力和故障识别能力。
1 基础理论
1.1 风格再校准模块
风格再校准模块[7](SRM),通过利用中间特征图的风格自适应地重新校准特征图。 SRM首先通过风格池化从特征图的每个通道中提取风格信息,然后通过与通道无关的风格集成来估计每个通道的重新校准权重。通过将单个风格的相对重要性引入特征图,SRM有效地增强了网络的表示能力。SRM的总体结构如图1所示。
图1 SRM总体结构图
主要由两个部分组成:风格池化和风格集成。风格池化运算通过汇总跨空间维度的特征响应来从每个通道提取风格特征。随后通过风格集成运算,该运算通过基于通道的操作利用风格特征来生成特定的风格权重。风格权重最终重新校准特征图,以强调或隐藏其信息。
图2 SRM详细结构图
1.2 SRMDenseNet模型
DenseNet[8]主要由密集块和过渡层两部分组成。密集块用来定义输入与输出的关系,采用级联的方式将先前层的特征图都用作下一层的输入,通过特征重用充分结合图像上下文信息,提升网络模型的效率。过渡层用来控制通道数,由于密集块中每一层输入特征图随着层数增加,使得后面输入的特征图的维度变得很大。所以在过渡层中加入1×1的卷积进行降维,从而提升计算效率。网络结构如图3所示。目前,DenseNet网络在图像识别领域中取得了很好的效果。但是,DenseNet的密集块中的任意一层都会收到之前全部卷积层的输出特征图,这一过程只是将所有的输出特征图进行简单叠加,并没有考虑通道间的相关性,一些无关信息会影响模型做出准确的判断。本文针对上述缺点,对密集块进行改进,引入风格再校准模块,结构如图4所示,通过从每个通道中提取信息,然后估计每个通道的重新校准权重,增强通道间的相关性以获取更丰富的特征信息。
图3 网络结构图
图4 改进密集块结构图
2 基于SRMDenseNet的轴承故障诊断
本文所提出的基于SRMDenseNet的轴承故障诊断方法过程如下:首先利用连续小波变换[9](continue wavelet transform,CWT)获取时频特征。然后将二维时频图像输入到SRMDenseNet模型进行特征提取,利用特征复用来加强了有用特征的传播。最后通过所提取特征信息训练Softmax分类器,最终完成轴承的故障诊断。所提出方法的流程图如图5所示。其步骤如下:
图5 模型诊断流程图
步骤1:对原始振动信号预处理,首先将数据划分,并采用重叠采样的方法,然后利用CWT将数据转化为32×32的二维时频图像;
步骤2:将时频图像划分训练集和测试集;
步骤3:将训练集输入SRMDenseNet模型进行训练;
步骤4:将测试集输入到已经训练完成的模型中,最终得到滚动轴承故障诊断结果。
3 实验研究与分析
3.1 实验数据
本文实验数据采用某大学(case western reserve university,CWRU)的滚动轴承数据集,试验台主要部件包括电动机、扭矩传感器和测力计。实验利用电火花加工轴承SKF来模拟点蚀故障,故障直径为7 mil,14 mil和21 mil。通过加速度传感器采集1~3 hp(电动机转速为1730~1797 r/min),采样频率为12 kHz下的振动信号。然后按3种工况分别构建了数据集,每个数据集包括正常状态和每种故障类型分别在3种故障程度下的状态,共10种不同的状态类型。每种状态有800个训练样本和200个测试样本,并使用数据重叠采样来采集训练样本。每个样本的包含2048个数据点,并进行了归一化处理。在图6a~图6j中依次显示了10种轴承运行状况的小波时频图像。
(a) 类别1 (b) 类别2 (c) 类别3
3.2 恒定载荷工况故障诊断结果分析
使用数据集中训练样本训练模型,并用相同负载的测试样本来测试模型。以此验证SRMDenseNet在恒定载荷工况下的故障诊断能力。选用文献[10]中人工提取特征与SVM相结合的传统诊断方法以及CNN作为对照。恒定载荷工况下不同诊断方法诊断精度对比如表1所示。
表1 SRMDenseNet及其他诊断方法对比
从表1中可以看到,传统诊断方法和CNN的诊断准确率虽然取得了不错的效果,但是在诊断精度方面仍然有很大的提升空间。SRMDenseNet凭借出色的特征提取能力,在3种不同负载情况下的诊断准确率都分别达到了99.2%,99.2%,100%。
本文引入了多分类混淆矩阵来对SRMDenseNet模型在故障诊断过程中的错误分类情况进行分析,模型在“3 hp”情况下的混淆矩阵如图7所示。纵坐标表示真实样本,横坐标表示预测样本。从图中可知,模型对滚动轴承的10种故障类型的分类准确率都达到了100%。
图7 “3 hp”情况下的多分类混淆矩阵
3.3 变载荷工况故障诊断结果分析
实验利用训练样本来训练模型,然后使用另外两种负载下的测试样本来测试模型,以此验证SRMDensenet模型在变载荷工况下的故障诊断能力。同时,选用文献[11]中传统机器学习模型SVM、文献[5]中的WDCNN、文献[6]中的ECACNN以及DenseNet在CWRU数据集上的诊断精度作为对比。图8所示为SRMDenseNet模型与其他几种诊断模型在不同负载下的诊断结果。其中“1 hp~2 hp”代表用1 hp负载下的数据集训练,2 hp负载下的数据集测试,AVG代表所有变工况实验的平均识别率。
图8 变工况下各模型识别正确率对比
由图8可知,传统的故障诊断模型SVM的诊断准确率大幅低于其他深度学习网络模型,原因是人工提取的特征具有局限性,导致了模型对变工况情况下的故障诊断较差;WDCNN在第一层使用大卷积核来获取更大的感受野,以提高网络获取全局信息的能力,诊断准确率可以达到90.0%;ECACNN通过调整特征通道权重,挖掘更多数据间的联系,在实验中获得了94.8%的平均准确率;SRMDenseNet通过重新校准特征图,提取有用的特征并进行特征复用,有效增强了网络的表示能力,可以达到96.7%的平均诊断准确率。可以发现,SVM和WDCNN诊断模型在负载变化大时,即在“1 hp~3 hp”和“3 hp~1 hp”两种情况下,诊断准确率下降幅度较大,说明了负载变化越大,信号之间差别越大,所能提取的故障信息越有限。ECACNN通过有效挖掘通道间特征信息,有效解决了上述问题,但是在“3 hp~2 hp”情况下诊断准确率偏低,未能达到90%以上。本文所提模型SRMDenseNet在大部分的情况下都取得很好的效果,并且在6种情况下都达到了90%以上,平均诊断准确率也达到了96.7%,而其他四种方法的平均诊断准确率都未达到95%以上,证明了网络模型在变工况情况下具有很好的诊断稳定性。
本文所提网络模型在“3hp~2hp”情况下诊断结果的多分类混淆矩阵如图9所示。
图9 多分类混淆矩阵
由图9可知,SRMDenseNet模型在“3 hp~2 hp”情况下的诊断错误是将滚动体故障7 mil误诊为滚动体故障14 mil,可以发现,模型诊断错误只是出现在故障直径不同,其余9种类型诊断结果完全正确。
4 结论
本文提出了一种改进密集连接卷积神经网络的智能故障诊断模型,对密集块结合风格再校准模块,通过从每个通道中提取风格信息,估计每个通道的重新校准权重,增强通道间的相关性以获取更丰富的故障特征信息,减少无关信息的干扰,从而提升最终的诊断精度。采用某大学轴承实验台数据进行实验验证,结果表明,本文所提模型在单一工况和变工况条件下的诊断准确度均高于目前故障诊断领域中几种常见的诊断模型。所提方法为实际工程应用中旋转机械健康检测与维护提供了客观依据。下一步工作将针对实际工业环境下面临的样本不均衡问题进行研究,进一步提高网络模型的泛化性能。