APP下载

基于改进深度卷积神经网络的轴承故障诊断

2023-10-16张彩华张英杰李明陆碧良李蒲德

计算技术与自动化 2023年3期
关键词:风电机组故障诊断轴承

张彩华 张英杰 李明 陆碧良 李蒲德

关键词:风电机组;轴承;故障诊断;深度卷积神经网络

滚动轴承已成为旋转机械和设备中使用最频繁和最核心的部件之一,广泛应用于风带电、航空航天、交通运输等工业领域。由于工作环境是一个复杂的高载荷、非线性、强耦合、不稳定的系统,滚动轴承容易发生故障。因此,有必要研究数据驱动的滚动轴承智能故障诊断方法。

从相关文献中可以看出,振动分析理论完善了工业系统的早期故障诊断方法,如油液分析、超声波探伤、噪声分析等。如Yin等利用傅里叶变换的相关理论,将时域信号转换为频域信号来描述设备的运行状态,然后从振动信号的频谱上对机械设备进行对比分析和研究。Cong等利用奇异值分解(SVD)提取模拟信号的相关特征并进行分析。仿真结果表明,该方法对单一软故障和灾难性多重故障都有较好的识别性能。Qian等提出了一种利用a稳定参数分布估计和人工神经网络(ANN)技术实现轴承故障定位智能诊断的轴承诊断方法。曾芸等利用小波包分解轴承故障信号特征后输入到径向基神经网络(RBF)中有效地对轴承故障进行智能分类。

实际上,时频域特征方法可以使用较少的参数,实现更高效、准确的故障分类。然而,基于時域特征的特征选择通常需要专家知识的参与,不能充分利用振动数据的隐藏信息。

近年来,卷积神经网络(CNN)在模式识别、计算机视觉等领域得到了广泛的应用,并取得了巨大的成功。CNN不需要人工提取特征,可以自动地从给定的信号和图像中挖掘和提取特征,从而降低了特征提取的难度。此外,它还可以通过抑制模型可能出现的过拟合现象来提高模型预测的准确性。因此涌现了许多基于CNN的智能故障诊断方法。Yuan等提出了一种基于快速傅里叶变换(FFT)和卷积神经网络(CNN)的滚动轴承故障诊断方法。丁承君等通过变分模态分解获取不同频率的限带本征模态分量,再利用卷积神经网络提取各模态数据特征,最后通过全连接分类在变工况下完成轴承故障分类。Lu等提出了一种多通道输入连续卷积神经网络支持向量机(CNN-SVM)早期故障诊断模型。Chen等提出了一种基于多个小波变换的一维卷积递归神经网络。虽然这些方法在滚动轴承数据集上取得了较好的诊断效果,但仍存在缺点:需要将时间序列信号通过FFT或小波变换转换成更明显的高维特征进行模型训练,不能直接挖掘代表性特征。

本文提出了一种基于改进深度卷积神经网络的直接时间序列特征提取方法用于滚动轴承故障诊断。旨在解决以下两个问题:一是特征学习方法具有自动化的特点,基于时域特征的特征选择通常需要专家知识的参与,该方法可以实现端到端的智能学习,无需人工参与。另一个问题与直接时间序列特征提取有关,传统的CNN通过FFT或小波变换将时间序列信号转换为更明显的高维特征进行模型训练,无法直接挖掘代表性特征。本文使用一种新型一维卷积神经网络直接提取原始振动信号的特征,最后通过分类器实现智能故障诊断,实现端到端的智能故障诊断过程,同时也避免了特征转换的代价。

1相关工作

滚动轴承是现代工业生产中最常用的机械部件之一。一般通过设计智能诊断方法对滚动轴承进行故障诊断,在本节中,简要描述了滚动轴承故障诊断的发展历史,以及卷积神经网络的基本概念和框架。

1.1滚动轴承故障诊断

随着现代工业日益复杂化和规模化,利用传感器获取的海量数据来识别不同故障状态,需要设计准确、高效的数据驱动故障诊断方法。近年来,机器学习和模式识别技术在数据驱动故障诊断中得到了广泛的应用,因为工业过程或机器中的不同故障本质上可以被视为不同的类别。常用的方法包括支持向量机(SVM)、随机森林、BP神经网络等。然而,基于机器学习的数据一驱动方法仍然存在不可忽视的缺点,它需要人类先验知识的参与。因此,基于深度学习的卷积神经网络故障诊断方法得到了发展,但早期的卷积神经网络主要集中在图像处理上,一维时间序列振动信号不能直接输入卷积神经网络进行智能故障诊断。因此,通过FFT或小波变换将振动信号转换成图像或频谱信号受到了人们的关注,并取得了良好的故障诊断效果。然而,使用图像或频谱信号进行模型训练无法获得底层数据信息,且容易受到环境干扰的影响。故有必要开发一种基于原始振动信号直接时间序列特征提取的智能故障诊断模型。

1.2卷积神经网络

卷积层:卷积运算部分是CNN中最重要的运算模块之一。通常使用多个卷积核对输入数据进行卷积运算,并对卷积后的输出进行处理。与不同的卷积核进行卷积后可以输出一个feature map,即从输入信号中提取的不同的特征。由于卷积运算在同一输入信号上实现了权值共享、部分连接和CNN权值共享的特性,因此与全连接层相比,卷积层可以提取更丰富的特征,使用更少的参数,使得最终训练出来的模型具有更强的泛化能力。卷积运算公式如下:

其中x代表输入的第i个数据,w为该卷积层中第k个卷积核参数,b为对应的偏置参数,g为第k个卷积核提取第i个样本的特征。

最大池化层:池化层有时也称为采样层,主要分为下采样层和上采样层。经过卷积运算后,得到很多不同的特征映射。虽然学习了许多不同的特征,但会导致向下一层传递的维数迅速增加。池化的主要作用是在尽量保留原有显著特征的情况下,降低特征图的输出维数,既减少了参数的数量,加快了模型的训练速度,又很好地提取了主要特征。最大池化是CNN中最常用的池化方法之一,它会在一定大小的区域内输出最大值。最大池化的数学表达式为:

其中,y表示当前层的第i个神经元的输出,max pooling()是一个下采样函数,该函数是在一定范围内取最大值的函数,Sscal。是池化的范围,是池化的步长大小。

全连接层:特征经过卷积层和池化层后,输入到全连接层。在全连接层中,对具有分类的深层特征信息进行整合,构建提取的特征与样本类型之间的映射关系。全连接层的最后一层称为输出层或分类层。最常用的分类器是Softmax分类器。数学公式可表示为:

2本文模型

基于一维卷积神经网络IDCNN模型设计了一个有效的智能诊断系统,并引入全局平均池化,增加正则化和Dropout模块,通过批归一化等方法优化卷积神经网络模型结构,研究了不同网络结构和超参数对滚动轴承故障诊断测试的影响。

2.1改进后的IDCNN

改进后的IDCNN网络结构如图1所示。它直接使用原始数据信号进行相关研究,并将数据分割作为模型的输入,最大限度地利用原始数据集的相关状态特征,减少了人为影响。本文提出一种使用多种相关训练技术对传统CNN进行优化的方法,使其能够更高效、准确地诊断故障类型。通过使用全局平均池化技术(global average pooling,GAP)代替全连接层部分,减少了模型的训练参数数量,加快了模型的训练速度。并使用L2正则化和Dropout技术减少模型的过拟合,从而提高模型的精度。由于该方法在整个故障诊断过程中不需要人工提取特征,因此可以将滚动轴承的原始振动数据直接输入到改进的CNN中,然后自动进行故障诊断并输出结果。综上所述,这是一种“端到端”的算法结构,具有极强的可操作性和优秀的通用性。的数据格式不能直接导入网络作为输入层,因此需要对数据进行预处理。

特征提取层主要实现对给定数据集的特征挖掘和提取。通过叠加多个卷积、激活和池化层来构建更深的层。在实验过程中,发现并不是层数越多越好。超过一定限度后,随着层数的增加,训练模型的精度反而会下降。选择合适的层数既可以节省训练时间,又可以提高准确率,达到优化神经网络结构的目的。最后,输出層对测试数据进行智能诊断,得到精确的诊断结果。

2.3网络结构和参数细节

IDCNN网络结构及参数详情如表1所示。同时引入全局平均池化(GAP)技术,代替了全连接层,对神经网络模型进行了优化,降低了网络需要训练的参数量。总体算法思想是对振动信号进行多层卷积运算后取全局平均值,并将GAP生成的值输入到Softmax激活函数中,即可得到所需的多类概率分布。

3仿真实验

该数据集由美国凯斯西储大学(Case WesternReserve University,CWRU)实验并发布。图3是实验平台的图片。由于驱动端采集到的轴承振动信号比风扇端采集到的振动信号受干扰小,因此实验中采用驱动端加速度传感器采集到的振动数据。

3.1数据描述

数据集包括4种载荷工况,0hp(1797r7min)、1hp (1772r/min)、2hp (1750r/min)和3hp(1730r/min)滚动轴承振动信号。在每种负载工况下,其数据集包括9种故障类型和1种正常状态数据。轴承的内圈、外圈和滚动体的故障直径分别为7mils(约0.18mm)、14mils(约0.36mm)和21mils(约0.53mm),均采用电火花加工完成。单点坑。实验中采集的数据集根据采样频率分为12kHz和48kHz。本文将采样频率为12kHz的振动信号数据集作为下一个实验的数据集。实验选取4种载荷工况(0hp、1hp、2hp、3hp),每种载荷工况选取10种滚动轴承状态数据,每种状态数据按相同数量、相同长度选取作为实验样本。表2显示了0hp负载和12kHz采样频率下的9种滚动轴承失效状态。

3.2实验结果

从驱动端的12kHz振动数据中分别按照四种负载工况选取10种轴承故障状态信息。从每种轴承故障类别随机提取200个样本,样本的采样点数为1024,每种负载下共有2000个样本,训练集和测试集划分比例为7:3,mini-batch的大小设置为128。针对不同负载下的故障样本进行训练,后续表中实验数据的迭代次数均为100,最终的结果为取五次实验结果的均值。

3.2.1对比实验

优化器的选择影响着整个模型的参数更新和收敛的速度,最终影响模型的诊断精度。因此选择目前最常用的几种优化器:SGD、Rprop、RM-Sprop、Adagrad、Adam作为对比实验。整个实验在Pytorch环境中完成,将优化器中的weight_de-cay设置为0.0001,学习率设置为0.001,以保证参数一致。实验结果见表3,SGD表现最差,在四种负载下的平均准确率只有26.99%;RMSprop和Adam优化器实验表现相当。

图4是以在2hp下进行200次迭代的实验数据绘制成的优化器的诊断精度对比图,从该图中可知RMSprop优化器初始准确率更高,但是在迭代过程中相比于Adam震荡较为明显。综合考虑,选取更适合的Adam算法作为本章模型的优化器。

此外实验选取了常见的分类模型:逻辑回归(Logistic Regression,LR)、支持向量机(SupportVector Machine,SVM)以及反向传播神经网络(Back Propagation Neural Network, BPNN)作为对比实验。实验结果如表4所示。

通过对比分析,机器学习技术受限于人工特征选择和浅层特征表征学习能力,LR和SVM的诊断精度低于基于深度网络的BPNN和IDCNN;但BPNN在不同负载下的诊断精度均低于IDCNN模型,最终的四种负载情况下的平均准确精度仅为92.44%,而IDCNN模型明显优于对比方法,最终的平均准确率达到了100%,这充分说明IDCNN模型在轴承故障诊断中特征提取以及分类能力的优异性。

3.2.2消融实验

在深度学习中模型网络层数的增加代表着其学习特征能力的增强,能避免欠拟合的出现,能更好地完成相应的任务,然而这也会造成训练资源的增加,甚至出现过拟合的现象。因此在故障诊断中,模型的层数的选择和诊断精度应当根据实际需要保持平衡,以达到既能实现高精度诊断的目标,又能保证模型结构简单、训练时间较短的目的。考虑到CNN的模型结构对特征提取能力有较大的影响,因此从不同网络模块是否增加批量归一化、Dropout以及全局平均池化GAP两种角度探讨了模型中特征提取器对轴承故障诊断的具体影响,而分类器的结构则保持不变。不同卷积模块下的故障诊断性能具体结果见表5。其中A模型去除特征提取器中的批量归一化、GAP以及Dropout代表优化前的模型,而B模型则是优化后的完整的特征提取器。

从结果得知,卷积模块对模型诊断精度影响最大,模型只有1组卷积模块时,优化前的A模型平均诊断精度只有78.24%,优化后的B模型平均诊断精度只有72.39%,卷积模块增加1组后两个模型的平均诊断精度分别上升了12.00%和20.87%。随着卷积模块的增加,诊断精度也逐渐提高。值得注意的是:在有3组卷积模块时,A模型的平均诊断精度就达到了最高92.10%,而B模型则是在有4组卷积模块时才达到最高100.00%。优化后的B模型受益于批量归一化、Dropout以及GAP技术,一方面提高了诊断精度,另一方面防止过拟合的发生。

图5和图6分别展示了在2hp负载时不同卷积模块下、模型优化前后的混淆矩阵图和准确率对比图。从图6中的准确率对比图可以看出优化后的B模型收敛更快更稳定。

4结论

针对滚动轴承系统故障的智能诊断问题,提出了基于IDCNN的故障诊断算法,它是一种“端到端”诊断方法,直接对原始振动信号数据进行处理,提取相邻时间点之间的信息特征,无需对原始数据进行任何人工特征提取和信号处理操作。它可以摆脱传统方法对人工特征提取的依赖,突破了传统方法依赖专家经验的局限性。最后在CWRU数据集上进行了对比实验和消融实验。对比实验主要包括优化器对比实验,从不同优化器的表现中选择了Adam作为模型优化器;进一步与经典算法进行对比,实验结果表明了IDCNN模型的优越性。消融实验则从模型的卷积模块角度设计了不同层数的卷积模型,从实验结果表明在有四组卷积模块时表现最佳,并且在实验中验证了批量归一化、Dropout以及GAP优化技术对模型准确率有明显的提升作用。

猜你喜欢

风电机组故障诊断轴承
轴承知识
轴承知识
轴承知识
轴承知识
因果图定性分析法及其在故障诊断中的应用
风力发电机组电气与控制系统快速检修思路探索
风电机组典型事故及预防措施分析
风电机组塔架优化设计系统分析
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断