APP下载

基于BN-1DCNN的旋转机械故障诊断研究

2021-10-18冯浩楠胥永刚

振动与冲击 2021年19期
关键词:池化故障诊断卷积

冯浩楠, 付 胜, 胥永刚

(1.北京工业大学 材料与制造学部,北京 100124;2.三亚学院 理工学院,海南 三亚 572022)

旋转机械广泛应用于电力、石化、采矿、汽车制造、航空航天等部门,一旦发生故障,轻者会影响使用造成经济损失,严重情况下会导致机器损坏甚至人员伤亡。旋转机械的主要故障有不平衡、轴不对中、松动、碰磨以及轴承故障,其中轴承故障又包含内圈、外圈、滚动体、保持架等故障类型。在旋转机械的故障中,基于振动信号的分析是最容易获取、研究更加成熟的一种方法。

对旋转机械故障的研究主要经历了以下3个过程:①旋转机械不同的故障类型通常伴随着不同的特征频率,通过传统的信号分析方法对旋转机械故障的特征频率进行分析来确定其故障类型,其中包括傅里叶变换[1]、奇异值分解[2]、多尺度模糊熵分析[3]、经验模态分解[4]等,但这些方法所提取的特征一般仅能部分表征轴承故障信息;②随着传统机器学习的发展,出现了一批基于传统机器学习的故障诊断方法,其中包括基于机器学习的支持向量机[5]、K 最近邻分类[6]等基于一个或综合多个故障特征进行故障识别,由于故障表征信息的不完备性,所以要根据特定的信号采取不同的特征提取方法,且故障诊断的正确率有待提高;③由Hinton等[7]提出的卷积神经网络(convolutional neural networks,CNN)的方法,作为机器学习领域的新方法,其具有强大的特征自提取能力,在图像识别、语音识别等领域取得了显著的效果[8-10]。近年来随着深度学习的发展,越来越多的方法被应用到旋转机械故障诊断中来,其中包括旋转机械一维深度卷积神经网络故障诊断研究[11],文献中提出基于一维深度卷积神经网络的故障诊断模型;基于短时傅里叶变换和卷积神经网络的轴承故障诊断方法[12],文献中提出了基于短时傅里叶变换和卷积神经网络的故障诊断方法,实现了端到端的故障模式识别;基于浅层多尺度卷积神经网络的轴承故障诊断研究[13],文献中提出一种适用于轴承故障诊断的浅层多尺度网络模型,并将一维振动信号转换为二维时频图,利用图像进行故障分类。这些深度学习的方法实现了智能故障诊断,诊断准确率有了不同程度的提高,但大部分方法准确率仍有提升空间,此外二维图像的方法虽然得到了较高的准确率但是转换为二维图像的过程本身就是一个特征选取的过程,并且具有很高的工作量,因此这种方法并不是真正意义上的智能故障诊断的解决方案。

针对以上问题,本文提出了基于批量归一化(batch normalization,BN)层的一维卷积神经网络模型(BN-1DCNN),对传统的卷积核进行改进将其变成一维卷积核,并在结构中加入BN层来防止一维情况下容易过拟合的问题,并基于HZXT-008小型转子实验台采集的数据验证了模型的有效性。

1 基本原理

1.1 CNN原理

卷积神经网络作为深度学习的代表之一,与传统机器学习最大的区别是实现了特征的自提取,用卷积的过程代替了传统机器学习中复杂繁琐的特征提取过程,实现了智能故障诊断。

卷积神经网络与传统机器学习在故障诊断中的区别,如图1所示。传统的机器学习方法特征的提取与故障诊断是两个分开的过程,而特征提取方法根据设备的不同以及测点的选择需要采取不同的方法,并且选择的特征对诊断结果有很大的影响。此外,选择的特征的质量往往取决于工程经验,这限制了该方法的广泛应用。而卷积神经网络的方法集特征提取与故障诊断于一体,通过卷积的方法代替了故障特征方法选择与故障特征提取的过程,实现了真正意义上的智能故障诊断。

(a) 传统机器学习

卷积神经网络主要包括卷积层、池化层和全连接层。卷积神经网络经典(Lenet-5),如图2所示。其中卷积层是卷积神经网络的核心基石。卷积神经网络的卷积层是使用卷积核对输入信号(或特征)的局部区域进行卷积运算,并产生相应的特征。卷积层最重要的特点是权值共享,即同一个卷积核将以固定的步长遍历一次输入。权值共享减少了卷积层的网络参数,避免了由于参数过多造成的过拟合,并且降低了系统所需内存。本文用到的一维卷积情况,对于两个离散信号f和g,卷积定义如式(1)。

图2 卷积神经网络经典模型

(1)

式中:n为待卷积离散信号的长度;m为卷积核的大小。

池化是卷积神经网络与普通神经网络最不同的地方,池化的概念本身并不属于一个具体操作,而是代表一种对统计信息的提取过程。在卷积神经网络中,在特征图上一个给定区域内求出一个能代表这个区域特点的值,在深度学习中较为常见的池化有最大值池化和平均值池化。对于一维卷积神经网络,池化过程如式(2)所示,最大池化即将池化窗口内最大值作为特征值输出,平均池化即将池化窗口内值的平均值作为输出。

(2)

式中:d为池化前的特征向量;d1为最大池化后的结果;d2为均值池化后的结果;池化大小2×2。

全连接层是将滤波级提取出的特征进行分类。具体做法是将整个网络的最后一层卷积层或池化层得到的特征图向量按行或按列排成一维特征向量作为全连接层。若整个网络用来做分类时,输出层为一个分类器,输出节点数与类别数一致,且每个节点的输出值代表输入样本属于对应类别的概率。文中所选用的是Softmax分类器,是一种多分类的分类器。

1.2 批量归一化层

BN的思想是由GoogLeNet网络的作者Christian Szegedy提出[14],对于提高深层神经网络的训练效率,增强网络的鲁棒性有着很好的作用。批量归一化是一种数据归一化方式,对于训练中的来自任何输出的一个Batch的数据,{x1,x2,…,xn}批零归一化操作如下所示。

计算每个维度的(每列)的均值。

(3)

计算每个维度的(每列)的方差。

(4)

对输入数据的每一维进行归一化。

(5)

(6)

式(3)~式(5)为数据的归一化过程。通过这一过程数据被规约到了一个中心区域,这可以很好的对抗梯度消失并且防止过拟合。如果这样的操作作用在网络的每一层上,就可以将数据的分布控制在随输入变化敏感的区域内,使其呈正态分布,相当于不用考虑数据分布的改变,这样训练的效率和准确率就被提高了。但是由于减均值除方差得到的不一定是最好的分布,比如本文中在一组试验中加入了噪声,这时通过式(6)中γ与β来控制正态分布的宽和高,使得每一层输出的数据始终呈现一种正态分布,来极大的改善模型的训练效率。

1.3 基于BN-1DCNN的卷积网络模型

Lenet-5作为卷积神经网络发展的基础,在数据简单、特征明显的样本中表现优秀,但是随着样本复杂度增加该模型的表现了会逐渐变差。基于BN-1DCNN的卷积网络模型是指在经典卷积网络模型的基础上进行优化,目的在于提高Lenet-5在复杂样本中的能力,而复杂样本一般表现为数据量庞大和噪声干扰较多,针对该问题主要的解决方案是在原始结构的基础上加入BN层以及Dropout层来提高模型处理数据的能力,主要操作步骤是在卷积层与池化层之间加入BN层,并对卷积核进行改进使之成为一维卷积核,这样做的目的是由于采集的振动信号为一维数据,并且该数据相比二维图像而言更为简单,冗余信息相对较少,但是这种情况下更容易导致模型训练过拟合,加入BN层能很好的避免模型过拟合。除此之外在两个全连接层中间加入一层Dropout层,进一步防止模型过拟合,使模型更优,改进后的模型,如图3所示。

图3 BN-1DCNN网络结构

2 试验过程与结果分析

本节基于HZXT-008小型转子实验台采集数据进行试验,并基于BN-1DCNN模型对故障类型进行分类,最后将分类结果与Lenet-5以及Huang等提出的浅层多尺度模型进行对比,来对模型进行客观的评价与分析。

2.1 试验数据集介绍

本次试验采用HZXT-008小型转子实验台,如图4所示。它由电机、联轴器、轴承、转盘、减速器等几部分构成,可模拟旋转机械的各种工作状态及故障。

图4 HZXT-008小型转子试验台结构

试验中采用PCI-4472采集卡搭配YD121型加速度传感器采集振动数据,采样频率为12 kHz,实验台转速为1 000 r/min,共采集正常状态、内圈故障、外圈故障、滚动体故障、保持架故障、基座松动、碰磨故障以及轴不对中故障、轴不平衡9种运行状态,图5列出了部分试验中设置故障类型的方法。其中每1 000个点为一组,共计采集8 640组故障数据,其中训练数据6 480组,测试数据2 160组,表1为本次试验采集的数据介绍及训练中所使用的标签。

(a) 轴承故障

表1 试验采集故障类型数据描述

2.2 网络结构及参数设置

本文构建的BN-1DCNN网络各层网络参数,如表2所示。它包含两个卷积层(C1,C2)、两个池化层(P1,P2)、两个BN层(B1,B2)以及两个全连接层(F1,F2)和一个Dropout层,训练过程使用如式(7)~式(8)所示的L2正则化以及如式(9)所示的滑动平均。

表2 BN-1DCNN网络各层参数描述

(7)

(8)

L2正则化实现对每一层的权重加以约束,保证权重系数在绝对值意义上足够小,使得噪声不容易被拟合。

vt=β·vt-1+(1-β)·θt

(9)

式中:变量υ在t时刻记为vt;θt为变量υ在t时刻的取值;β∈[0,1),相当于β=0相当于没有使用滑动平均,文中取β=0.99。

滑动平均用来估计变量的局部均值,使得变量的更新与一段时间内的历史取值有关,增强训练的稳定性。

2.3 试验结果及分析

训练的迭代过程总计10 000轮,通过每次的迭代对网络的权值进行更新,使得目标函数的值趋于最小,每50轮记录训练过程的损失值以及测试的准确率,采用Tensorboard实时观测损失值以及准确率,图6、图7为训练过程中损失值以及准确率的变化过程。

图6为训练过程中测试准确率的变化,图7为训练过程中预测值与真实值的差,即损失值的变化过程。可以看出基于BN-1DCNN的模型在训练过程中随着训练次数的增加,准确率和损失值都在朝着理想的方向增加,在3 000轮左右,训练模型趋于稳定,收敛于最终结果,并且准确率达到98.43%,损失值降到0.06,且达到稳定之后二者变化都趋于稳定。对最终的结果用混淆矩阵进行分析,如图8所示。可以看出:除了滚动体和保持架两类故障有部分混淆,其余故障类型判断准确率基本达到100%,这样的准确率应该能够满足实际需要。

图6 训练过程中准确率变化

图7 训练过程中损失值变化

图8 结果分析

为了进一步验证BN-1DCNN模型对于旋转机械故障诊断的效果,本文将其与Lenet-5以及Huang等提出的一种适用于轴承故障诊断的浅层多尺度卷积神经网络(multi-scale convolutional neural network,MSCNN)模型就行了试验对比。MSCNN网络模型的创新之处在于在第二层卷积层使用了4个不同尺寸的卷积核进行了卷积,这样做的目的是通过提取更多维度的信息来提高诊断的准确率,本文将此模型的卷积核进行了一维化处理,并加入了BN层来与BN-1DCNN模型进行对比,MSCNN网络模型如图9所示。3种模型训练过程的准确率以及损失值对比如图10、图11所示。

图9 MSCNN网络模型

图10 准确率对比

图11 损失值对比

图10和图11分别为训练过程中3种模型损失值以及准确率的变化过程,可以看出BN-1DCNN模型和MSCNN模型比Lenet-5具有更高的判断准确率以及更稳定的训练过程。由于Lenet-5并未加入BN层,因此在整个训练过程中损失函数存在较大的波动,准确率最终收敛于87.25%,而BN-1DCNN模型和MSCNN模型的准确率都达到了98%以上。而BN-1DCNN模型和MSCNN模型相比,可以看出在训练的前期,MSCNN由于提取了更多维度的信息准确率发生了一定程度的波动,可以理解为MSCNN在提取了更多信息的同时也提取了更多的干扰信号,这导致了模型对外来噪声比较敏感而导致模型发生另一种程度的过拟合,同时这种模型因为庞大的计算量也极大的增加了训练时间,表3为当利用tensorboard在训练过程达到3 550轮时的监测信息,可以看出当BN-1DCNN训练到3 550轮时只用了32 min 5 s,而MSCNN却用了1 h 48 min 24 s,这也体现了BN-1DCNN模型的优势。

表3 BN-1DCNN与MSCNN模型训练用时对比

上文提出噪声对MSCNN模型具有较大影响而BN-1DCNN更为稳定,为此进行了一组重复性试验。具体方法是再次采集相同故障的数据类型,在采集过程中通过敲击试验基座的方式加入噪声,用文中训练好的3种模型对再次采集的数据进行分类,本文将采集的信号进行了30次重复试验,得到的结果如图12所示。

图12 重复性试验准确率对比

图12为在这30轮重复性试验中3种模型的表现,BN-1DCNN模型在30组重复性试验中标准差为0.000 81,极差为0.003 6;MSCNN模型在30组重复性试验中标准差为0.013 081,极差为0.040 92。而Lenet-5在30组重复性试验中标准差为0.010 93,极差为0.038 89。可以看出加入一部分噪声确实影响了MSCNN的判断,因此在浅层网络的基础上加入多尺度的结构会一定程度上造成模型的过拟合。而本文所用的BN-1DCNN模型在30次重复性试验的过程中保持了较高准确率的同时也保持了较高的稳定性。

3 结 论

本文建立了基于BN层的一维卷积神经网络的旋转机械智能故障诊断算法模型,将卷积神经网络的应用领域拓展至一维振动信号分析与处理,并对该算法的有效性与稳定性进行了验证。本文所用到的卷积神经网络模型具有以下优点:

(1) 将特征提取与智能分类相结合,避免了手动选取特征提取方法的过程。

(2) 通过一维卷积核的方法避免了需要将一维振动信号二维化来使用卷积神经网络进行分类的过程,实现了真正意义上的智能故障诊断。

(3) 通过加入BN层的方法极大的改善了模型的稳定性,并取得了极高的准确率。

本文提出的BN-1DCNN模型仅在旋转机械故障诊断领域做出了验证,在其他领域的应用有待验证。另外本文中所使用的训练集与测试集的比例、卷积核的大小以及Dropout层的比例等数据均是多次训练试验的结果不是文章重点,所以并未做出具体说明。

猜你喜欢

池化故障诊断卷积
基于Sobel算子的池化算法设计
卷积神经网络中的自适应加权池化
基于包络解调原理的低转速滚动轴承故障诊断
设施蔬菜病害识别中的CNN池化选择
基于3D-Winograd的快速卷积算法设计及FPGA实现
从滤波器理解卷积
基于卷积神经网络和池化算法的表情识别研究
基于傅里叶域卷积表示的目标跟踪算法
因果图定性分析法及其在故障诊断中的应用
一种基于卷积神经网络的性别识别方法