高噪声下改进卷积神经网络轴承故障诊断
2024-01-16唐治尧李刚李德苍
唐治尧,李刚,2,3,李德苍,2,3
(1.兰州交通大学 机电技术研究所;2.甘肃省物流及运输装备信息化工程技术研究中心;3.甘肃省物流与运输装备行业技术中心,甘肃 兰州 730070)
1 前言
滚动轴承作为大型旋转机械设备的重要零件,被广泛地用于航空发动机、风力发电、铁路行业大型设备中,对旋转机械的稳定性起着重要作用。在强噪声背景下,滚动轴承引起的振动信号特征杂乱难以识别,导致故障发生的概率增大。因此,研究在强噪声背景下的轴承故障诊断有重要意义。
近年来,深度学习被广泛用于图像识别、图像分类、语义分割,并一直以来是研究的热点,深度卷积是近年来发展迅速的一种深度学习方法,利用深度卷积神经网络学习实现端到端滚动轴承故障诊断。陈伟等通过Dropout 对数据集进行预处理,“损坏”训练数据,通过不同扩张率空洞卷积进行扩充多尺度卷积,利用CNN模块进行特征提取。Chen 等将水平和垂直方向振动信号融合成二维矩阵,再利用深层卷积神经网络进行轴承故障诊断。
以上方法证明了卷积神经网络在轴承故障诊断方向的可行性,然而,以上方法都未考虑旋转机械在复杂环境中的强噪声问题,振动信号在强噪声的影响下所采集的振动信号在多个尺度上特征频率变化大,具有不确定性,耦合性复杂特性。针对高噪声下振动信号的特征具有复杂特性提出了改进卷积神经网络滚动轴承故障诊断方法,该方法在深度卷积神经网络的基础架构上嵌入了门控循环单元,解决了神经网络结构中梯度爆炸问题,利用深度卷积神经网络进行特征提取,将提取的数据集输入注意力机制和SVM 分类器中进行特征分类,通过实验验证所提神经网络架构中嵌入门控循环单元的优越性。
2 卷积神经网络架构及算法模型
2.1 卷积神经网络(CNN)的基本模型
卷积神经网络是一种有监督的深度学习模型。卷积神经网络有局部感受野、权值共享、时间或空间采样的重要特点,卷积神经网络主要有卷积层、批标准化层、激活层、池化层、全连接层、目标函数等几个部分。
卷积层的功能是利用权值矩阵(卷积核)对图像进行特征提取,通过卷积层中众多卷积核对输入信号的局部感受野以一定的步长进行卷积运算,提取相应的特征和表征,新特征的每个值即代表着卷积核所覆盖的一小片区域内数据的一个特征。卷积过程如式(1)所示。
2.2 门控循环单元(GRU)基本模型
门控循环单元(GRU)是为了缓解循环神经网络中长时记忆和反向传播中梯度爆炸的一种神经网络,如图1 所示,一个经典的门控循环单元由重置门rt,更新门zt,隐藏状态ht,σ 表示激活函数中的sigmoid 函数,sigmoid 函数用来控制信号的通断。
图1 神经网络模型架构
在时间步t时刻,重置门rt控制需要遗忘信息的程度,重置门rt计算过程如式(2)所示。
式中,Wr为权重矩阵;ht-1为上一时刻隐藏状态信息,Xt为输入信号特征。
更新门zt控制前一刻隐藏状态的信息和当前新信息的比例,更新门zt计算过程如式(3)所示。
式中,Wz为权重比重。
重置门rt通过整合过去的输出和当前输入判断过去信息的重要性,得到备选状态,备选过程计算过程如式(4)所示。
式中,Wh为权重比重。最后当前时刻输出的信息为ht,输出信息ht的计算过程如式(5)。
(3)益生素类产品还可以用于疾病,最大限度地发挥动物生产潜能,预防重于治疗。益生素类产品是一种微生物制剂,可以有效促进动物的生长,同时提升机体的抗病性,降低染病几率[3]。另外,可提高饲料利用率,改善饲养环境,提高养猪的经济效益。
2.3 注意力机制
注意力机制能够自动聚焦于输入中的相关信息,自动从若干特征中选出对当前任务有重要意义的权重。注意力机制中的权重矩阵是通过训练得到,可以提升网络的自适应性,降低超参数选择的难度。注意力机制的加权求和c 的计算过程如式(6)。
式中,ai为注意力权重分配;hi为隐藏层输出。
2.4 SVM 分类器
针对滚动轴承样本数量较少,引入小样本分类更加准确的SVM 分类器,SVM 是建立在统计学习理论和结构风险最小化原理基础上的机器学习算法,通过定义适当的核函数实现非线性变换将输入空间变换到线性可分的高维空间,最终找到高维空间的最优线性超平面。
3 改进卷积神经网络滚动轴承故障诊断
改进卷积神经网络模型架构设计。
针对1024 维滚动轴承故障时域信号,在特征提取模块,设计了三层卷积层和池化层来提取特征信息,为了增加感受野,在卷积层中引入空洞卷积;在分类器模块,引入了GRU 通路和注意力机制,GRU 擅长从时序信号中提取信息,但当时序信号超过200 时容易出现“遗忘”,因此,本文引入注意力机制,在对数据进行压缩的同时缓解GRU 过程中“遗忘”的问题;最后将处理好的数据输入到全连接层和SVM 分类器中,实现轴承故障的分类。神经网络模型架构如图1 所示。
对于整个CNN-GRU-A-SVM 模型,优化器采用Adam优化器,学习率为0.001,衰减率为0.9,每迭代1000次进行衰减。采用的损失函数为交叉熵损失函数,mini-batch=100,Dropout=0.75,最终选用10 次实验结果的平均值作为结果。
表1 网络模型参数
4 试验仿真和结果分析
4.1 实验环境
基于Python-Tensorflow 环境下搭建网络模型,实验设备为inter-i5-6300CPU,NVIDIA GTX 950M,inter-i5-6300CPU 图形处理器。
4.2 实验数据集及时域分析
实验的数据集来自美国凯斯西储大学轴承研究所采集的滚动轴承,验证模型的有效性和可行性,实验装置台由电机、扭矩传感器、加速度传感器和其他未显示的几部分构成。本实验所用的信号采集于电机驱动端轴承,驱动端轴承为深沟球轴承,轴承型号为SKF6205,采样率为12kHz、电机平均转速为1797rpm,负载为0 ~3hp 采用电火花加工,实验数据建模表如表2 所示。
表2 实验数据集
4.3 振动信号添加噪声
为了研究模型在高噪声下的自适应性,将信噪比不同的高斯白噪声添加到信号中。信噪比大小为信号的功率比噪声的功率,信噪比计算公式如式(7),信噪比的单位为分贝(dB):
式中,Psignal和PNoise分别指原始信号和噪声的平均功率。在真实环境中噪声不可避免,不仅工作环境中滚动轴承会受到噪声的污染,零件之间的相互碰撞和摩擦也会产生噪声,要检验一个算法的优劣性,也必须考虑噪声的影响。
4.4 实验结果及分析
为了客观地比较各种方法在高噪声下的自适应性,实验依次使用基于人工滤波的BPNN+EMD+Hilbert 包络谱方法和SVM+EMD+Hilbert 包络谱方法、FFT-DNN 网络、WDCNN 网络在不同信噪比下测试数据准确率进行比较。其中,基于人工滤波的方法采用EMD 算法分解所得的前5个本征模态函数的Hilbert 包络谱。
提出的算法和其他算法在CWRU 数据集数据不同信噪比测试数据的对比如图2 所示,从图中可以看出,所提算法明显优于其他算法。相比表现最好的WDCNN算法,所提算法的分类准确度的最大高于WDCNN 算法24.7%。基于人工滤波的BPNN+EMD+Hilbert 包络谱和SVM+EMD+Hilbert 包络谱由于自身端点问题,处理噪声能力不佳,随着噪声的增加,分类准确率急速下降,所提算法分类准确度最大高于两种算法分别为35.2%和37.6%。FFT-DNN 表现相对较差,当噪声水平较低时分类结果较高,当噪声增加到-4dB 后,算法的分类准确度几乎不变。
图2 不同方法在CWRU 数据集上不同信噪比测试数据对比
对比不同实验方法在数据集上不同信噪比下的测试数据,提出的算法中GRU 能够更好地利用卷积神经网络特征提取,从而大幅度提高分类准确度。
5 结语
(1)提出了一种改进卷积神经网络的对滚动轴承故障状态进行识别。
(2)引入注意力机制提高神经网络的自适应性。通过消融实验,在WDCNN 的基础上结合GRU 网络和SVM分类器,确定最终的轴承诊断的神经网络模型。
(3)改进卷积神经网络模型在不同噪声工况下显示出良好的识别准确率,所提算法识别准确率在不同程度的噪声下比WDCNN 算法、BPNN+EMD+Hilbert 包络谱、SVM+EMD+Hilbert 包络谱、FFT-DNN 有较大提升,对于高噪声下滚动轴承的诊断有一定的工程价值。