APP下载

一种改进卷积神经网络的轴承故障诊断

2021-09-10王艺璇

科技研究 2021年6期
关键词:卷积神经网络深度学习

摘要:机械设备健康运转对生产加工起到至关重要的作用,如何快速地监测设备运行状态成为了重要的研究课题。其中机器轴承因长期负荷运转,易产生机械疲劳,因此轴承的质量检测仍占据重要地位。传统的故障识别效果较差,很大程度上依赖于专家经验和领域知识。本文提出了一种基于卷积神经网络的故障识别模型,该方法从两层卷积-池化层、全连接层组成的网络中准确提取振动信号特征,使用softmax分类器对不同故障的振动信息进行分类,其中在卷积层之间加入批标准化和ReLU函数,在全连接层进行Dropout操作。该实验诊断效率和精度方面均有较好表现,准确率可达到99.84%。

关键词:卷积神经网络;轴承故障检测、故障分类;深度学习

0 引言

改革开放以来,我国在现代机械制造方面已得到质的飞越。然而,现代机械设备运行的工况环境复杂多变,一旦发生机械故障,极易造成无法挽回的损失。轴承在现代制造业中占有极其重要地位,其质量直接关系着产品的安全性和可靠性。因此,对于轴承的状态监测及质量检测仍是当下研究的热点问题。

近年来,随着“大数据”的发展及其在工业方面的应用,基于深度学习的模型,如深度自编码网络(Deep Auto-Encoder Network,简称DAEN)、深度置信网络(Deep Belief Network,简称DBN)和卷积神经网络(Convolutional Neural Network,简称CNN)[1-5]发展迅速,引发越来越多研究者的关注。深度神经网络凭借其强大的数据分析和学习能力,能够主动从数据中学习到故障的潜在特征,被广泛运用于机械故障诊断并取得良好进展。文献[6]提出了一种批标准化(BN)的CNN和LSTM相结合的混合模型,无需对振动信号进行复杂预处理,也能在小样本中充分提取其内在特征,弥补了单一CNN的缺点,不仅提高诊断精度,还缩短了时间。文献[7]通过改进Relu函数和加入残差神经元,使模型能提取更深层次的故障纹理特征,具有高识别精度和分类效果。

本文提出一种基于卷积神经网络的故障识别方法,使用一维振动信号,可以避免人工信号处理,使其在含噪数据上(无需其他预处理),后通过调整模型参数,加入批标准化和Dropout操作,结合成一种新的CNN模型,解决梯度消失造成的准确率低的问题。并对数据进行多次实验分析,验证了方法的有效性。本文结构安排如下。第1節简要介绍CNN的理论;第2节表述故障诊断模型;第3节通过实验验证了方法的有效性;最后,在第4节得出结论。

1 基本理论

卷积神经网络CNN是深度学习代表算法之一,是一类仿造生物的视觉机制建立的前馈神经网络。因为其具有强大的特征学习能力及很强的容错性和鲁棒性,被广泛应用于计算机视觉、自然语言处理等任务中。

图1展示了一个典型CNN网络结果,其中,包含输入层、卷积层、池化层和全连接层。通常全连接层与Softmax或sigmoid等函数组成分类器,可以对故障信号进行有效诊断和识别。

1.1 卷积层

卷积层的核心是局部感受野和权值共享。利用卷积实现局部连接,然后输出数据里的每个神经元通过同一个卷积核(共享权重),卷积图像后再加上同一个偏置(共享偏置),最后得到输出特征图中的一个图,卷积操作的数学公式如下:

为第i层的输入特征图;表示卷积后第i+1层的特征图;表示卷积运算;为卷积核;为偏置。

在卷积运算之后,通常对特征图使用激活函数实现非线性线性变换,提高模型的表达能力,更好地解决复杂问题。式(1)中加入激活函数后的数学公式:

表示使用激活函数后输出的特征图;表示激活函数,近年来,线性整流函数(ReLU)由于比sigmoid和tanh函数更加有效的梯度下降及反向传播,避免了梯度爆炸和梯度消失的问题,并且有更快的训练速度而被广泛使用。

1.2 池化层

池化层是一种降采样操作,在卷积层之后对特征图进行压缩,减少参数计算量,简化网络计算复杂度,并且进行特征压缩,提取主要代表特征。通常采用的池化层分为最大池化层和平均池化层两种。其中最大池化层(max-pooling)使用最多,其方法是从对应区域内神经元的最大值作为代表值,数学表达式如下:

该表达式中,是区域中每个神经元的活性值。

1.3 全连接层

全连接层用于连接所有之前的特征映射,全连接层的作用是细化卷积层提取的特征。值得一提的是,在训练神经网络时,尤其是在训练数据集很小的情况下,通常使用Dropout层来防止模型过拟合,提升模型的泛化能力。此外,Dropout可以被认为是网络内模型集成的一种简单方式,以提高特征提取的能力。

2 构建故障诊断模型

目前,将卷积神经网络应用于轴承故障诊断任务中,CNN的结构和参数的选择没有明确的标准,所以,选择合适的网络结构可以降低网络的复杂性并且提高执行效率。

2.1 CNN模型结构

本文提到的一种轴承故障诊断的CNN网络模型结构,由图2可知,在该卷积神经网络模型中,以轴承原始一维振动信号为输入,使用两层卷积层和池化层交替连接,然后使用批标准化操作,让每一个输入有一个稳定的分布,最后使用两层全连接层及softmax分类。故障诊断基本流程图如图3所示。

实验中的部分网络结构参数如表1所示,卷积层和池化层的步长分别设置4和2。随后,为了进一步的特征检测,跟随全连接层。最后,利用softmax层进行故障识别和分类。值得注意的是,在第一层全连接层和第二层全连接层之间加入了Dropout操作,旨在避免过拟合,提高泛华能力。神经元的失活概率设置为0.5。

2.2 激活函数

激活函数对神经网络模型的学习、理解某些非线性函数来说具有重要作用。它将非线性的特征引入到我们的网络中,使网络可以完成非线性映射。如果不使用激活函数,无论网络有多少层,都只是线性组合而已,没有意义。加入激活函数,可以使它学习复杂的事物,使网络的表达能力增强。

2.3 优化模型

实验使用交叉熵损失函数作为目标函数,使得振动信号通过CNN模型的输出与其目标值具有一致性。交叉熵损失函数是现使用最多的损失函数,数学公式如下:

式中p(x)为目标的概率分布,q(x)为预测分布。

损失函数的梯度计算采用反向传播法,网络参数优化采用Mini-Batch梯度下降法,将模型收敛到全局最优点。对于每个时期,样本被随机分为多个小批量。本实验中,批量大小设置为75,加快参数更新速度。同时为解决局部最优解的问题,使模型达到更好效果,使用Adam算法,通过计算梯度为不同参数设计独立的自适应学习率,加快收敛速度。由于多次迭代更新后,各层参数在不停变化,面临内部斜变量偏移问题,为方便后续处理,使用批标准化(batch normalization,BN)对输入数据分布变换到均值为0,方差为1的正态分布,加速神经网络的收敛速度,不会造成梯度消失问题。该试验在卷积层之后均添加BN操作,用来规范数据分布,然后经过ReLU激活函数得到输出。同时在全连接层之间使用0.5的概率进行Dropout,防止过拟合。模型训练参数列于表2。

3 实验验证及分析

3.1 数据集

本文采用美国斯凯西储大学(Case Western Reserve University)的公开轴承数据集进行实验,CWRU轴承故障的采集试验台如图4所示

该实验模拟真实故障,共分为滚珠故障、内圈故障、外圈故障和正常四种健康状态,每种状态有三种不同受损程度,受损直径为:0.18mm、0.36mm和0.54mm,共十种故障状态。这些数据有四种不同负载状态:0hp、1hp、2hp和3hp。

本文对四种不同负载状态下的数据做实验,共有792个数据样本,每段信号由6000个按时间序列连续采样的振动信号构成。将样本以4:1比例随机划分为训练集和测试集,其中训练集和测试集的数据样本数量分别为633和159个。为了满足深度神经网络的训练要求,提高模型泛化性的目的。由于每种故障状态的样本数目不一样,因此对轴承的十种故障信号样本进行等额抽样,具体的数据集参数如表4所示:

3.2 结果

在本节中,主要检验所构建故障诊断网络的性能和结果。为了保证实验结果了客观性,对于每组实验均重复多次,以减少特殊性、偶然性和随机性的影响。在所构建的网络中,我们选取了CNN常用的激活函数,Sigmoid,Tanh和Relu函数作为对比使用。表3为迭代次数为50时,使用不同激活函数的准确率,结果表明该实验使用Relu函数的准确率最高,可见ReLU激活函数因其分段线性的特点,导致网络在前向传播和后向传导过程中都保持线性,网络更易学习优化,进而使网络模型保持收敛。

使用ReLU激活函数,在迭代次数设置为100次,并以步长为10次时,所构建轴承故障识别网络的结果,由图5所示,从第1次到第20次迭代的故障识别准确率在逐步上升,当迭代20次训练之后,慢慢趋于平稳,尤其是在迭代50到迭代60时达到收敛,分类的准确率达到了99.8%。结果表明,该模型识别故障准确率较高,可应用于轴承故障的精确识别。

为了较好观察每种故障的分类情况,得到详细分类信息和误分类信息,绘制如图6所示的混淆矩阵。由图6可知,每种故障的准确率都是100%,没有被错误分类,表明轴承故障被完全识别。

4、结论

相较于传统信号处理、支持向量机等机械故障诊断,本文改善了其准确率不高的问题,提出了一种有效的卷积神经网络,对振动信号进行特征提取,提高軸承故障诊断准确率,能够准确识别CWRU十种不同故障状态。结果表明,利用深度学习技术,尤其,使用一种卷积神经网络结构,可以较为准确对轴承故障进行诊断,为机械故障快速诊断提供了一种新的思路。

参考文献:

[1]童靳于,罗金,郑近德.基于增强深度自编码网络的滚动轴承故障诊断方法[J/OL].中国机械工程:1-10[2021-05-22].

[2]张星博.基于小波分析和机器学习的滚动轴承故障诊断方法研究[D].长春大学,2020.

[3]刘海龙.基于优化深度置信网络的电机轴承故障诊断方法研究[D].大连交通大学,2020.

[4]高佳豪,郭瑜,伍星.基于SANC和一维卷积神经网络的齿轮箱轴承故障诊断[J].振动与冲击,2020,39(19):204-209+257.

[5]吴定海,任国全,王怀光,张云强.基于卷积神经网络的机械故障诊断方法综述[J].机械强度,2020,42(05):1024-1032.

[6]沈涛,李舜酩.针对滚动轴承故障的批标准化CNN-LSTM诊断方法[J/OL].计算机集成制造系统:1-16[2021-05-22].

[7]庞俊,刘鑫,段敏霞,任海莉,侯鑫烨.基于改进卷积神经网络轴承故障诊断[J].组合机床与自动化加工技术,2021(03):66-69.

[8]齐爱玲,李琳,朱亦轩,张广明.基于融合特征的双通道CNN滚动轴承故障识别[J].机械与电子,2021,39(05):15-19.

[9]蔡文波,贾延,吴一鸣,李默,郭大志.基于卷积神经网络的轴承精细化诊断技术研究[J].机械工程与自动化,2021(02):135-137.

[10] Jinyang Jiao et al. A Multivariate Encoder Information based Convolutional Neural Network for Intelligent Fault Diagnosis of Planetary Gearboxes[J]. Knowledge-Based Systems, 2018.

作者简介:王艺璇(1999.08-),女,蒙古族,内蒙古自治区巴彦淖尔市人,呼和浩特市内蒙古师范大学2018级计算机科学与技术专业 本科生 研究方向:深度学习

内蒙古师范大学 内蒙古自治区 呼和浩特 011500

猜你喜欢

卷积神经网络深度学习
基于卷积神经网络温室智能大棚监控系统的研究
基于深度卷积神经网络的物体识别算法
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现
基于卷积神经网络的树叶识别的算法的研究