基于一维卷积神经网络的滚动轴承故障程度诊断
2021-07-21薛妍沈宁窦东阳
薛妍,沈宁,窦东阳
(1.中国矿业大学 化工学院,江苏 徐州 221116;2.宁夏煤业洗选中心,银川 750409)
滚动轴承是旋转机械设备的关键部件,其可靠性直接影响设备的正常运行和安全生产。滚动轴承从正常运转到完全失效要经历一系列不同的性能退化过程,因此,轴承故障退化程度的评估是开展视情维修的基础和重点[1]。
时域、频域及时频域分析是基于振动信号的传统故障诊断方法[2]。为更好地表征振动信号的局部特征,通常采用短时傅里叶变换[3]、小波变换[4]、经验模态分解[5]、局部均值分解[6]等时频处理方法提取轴承振动信号的故障特征,再通过丰富的经验知识分类故障特征,这些方法耗时费力且识别率较低。智能化的故障诊断方法则利用支持向量机[7]、k-邻近算法[8]、人工神经网络[9]等机器学习方法自动分类特征,降低依赖专家经验出错的概率,但准确率取决于人工提取的特征能否准确表达故障信息,仍存在较大的局限性。
轴承的失效是循序渐进的,文献[10-11]通过研究轴承的性能退化过程,证明RMS指标、熵特征可以用来表征轴承的性能退化;文献[12]运用支持向量机(SVM)对滚动轴承数据进行训练分类,文献[13]采用深度神经网络对轴承寿命数据进行识别,都实现了对轴承的性能退化趋势的监测。然而,相比于机器学习模型浅层的网络结构,深度学习模型具有更深的网络层,拥有较强的自适应特征学习和分类能力,不仅降低了对信号处理与诊断经验的依赖,更加适应工业大数据背景下海量监测数据的分析需求[14-15]。
上述文献处理的数据都是二维的,针对振动信号的一维特性,本文提出了基于一维卷积神经网络的滚动轴承性能退化评估方法,尝试直接将轴承振动信号输入一维卷积神经网络,提取振动信号相邻时间点的特征,避免人工信号处理和特征提取带来的误差。
1 一维卷积神经网络
一维卷积神经网络(1DCNN)是一种前向传导的人工神经网络,通过反向传播算法更新网络参数[16],其结构如图1所示。
图1 1DCNN网络模型示意图Fig.1 Model of 1DCNN
一维卷积神经网络用于轴承故障诊断包含了特征提取、特征分类和故障确定3个步骤,包括输入层、卷积层、池化层、全连接层和分类层。输入和卷积核依托卷积运算稀疏连接、权值共享的特性进行卷积运算得到特征图谱。滚动轴承振动信号的原始数据作为输入,每层卷积层均使用了多个不同尺度的卷积核。使用非限制性单元(Rectified Linear Unit,ReLU)作为激活函数,将卷积层的输出作为激活函数的输入获得输入信号的非线性表达,使学习到的特征更容易区分。
直接将卷积后的特征图输入到全连接层无疑会大大增加网络模型的参数,在每层卷积层后采用2×1最大池化层,通过池化操作降低卷积层输出的特征向量,减少参数;同时,采用均值池化保证信息的完整性,避免过拟合。使用softmax激活全连接层,并在全连接层之前添加防止过拟合的dropout层,系数为0.3。
2 故障诊断步骤
基于一维卷积神经网络的滚动轴承故障诊断算法流程如图2所示,具体步骤为:采集轴承的振动信号构建试验数据集,划分训练集和测试集;将训练集的信号样本提前做好对应标签(每一种故障信号对应一个故障标签),输入到1DCNN进行模型训练;输入测试样本,同时引进机器学习经典算法-混淆矩阵,得到直观、可视化的多标签分类准确率。
图2 1DCNN故障诊断流程图Fig.2 Fault diagnosis flowchart of 1DCNN
针对轴承振动信号非线性、非平稳的特点,同时为了保障原始振动信号的完整性以便提取时间序列信息,进行了一些针对性改进:
1)对于一维时间振动信号而言,小卷积核覆盖范围太小,很容易受到原始振动信号中高频噪声的干扰,无法准确提取有用信息,因此在模型的第1层就使用16个8×1的卷积核,增大感受野,学习时间信号的泛化特征,同时保证模型的运算速度。
2)在第1层卷积层之后引入3层小尺度卷积层,分别为64个4×1卷积,256个4×1卷积,256个2×1卷积,从而有效控制网络模型的参数,同时利用不同尺寸的小卷积核精确提取小范围的故障信息。
Keras[17]是一个基于Theano和TensorFlow等框架提供的底层运算而实现的高层框架,相比其他深度学习框架,采用Keras能以最短时间完成模型的搭建和训练。因此,利用python语言基于Keras框架实现模型建立、训练和诊断分析全过程。
3 不同故障程度滚动轴承故障诊断
3.1 试验数据
为验证本文的诊断方法,采用凯斯西储大学(CWRU)滚动轴承数据中心提供的试验数据[18]。对驱动端的6205轴承人为添加电火花侵蚀,产生不同位置及不同磨损程度的故障。使用12 kHz的采样频率进行样本采集,轴承健康状况分为钢球、内圈、外圈损伤三大类,每种故障依据损伤程度又分为0.178,0.356和0.533 mm这3种故障尺寸,总计10种轴承故障状态(表1)。在本文的试验中,使用数据集增强技术获取10 000个样本,划分为训练集、验证集和测试集,各占7 000,2 000和1 000个样本,每个样本长度为2 048。
表1 轴承试验数据集Tab.1 Experimental data set of bearing
3.2 数据增强
为避免数据集过小、需要训练的网络参数过多而导致模型过拟合的问题,采用数据增强技术对数据集的样本进行扩充。例如,对于一段有S个点的振动信号,用尺寸为M的采样窗以L个单位长度的步幅进行滑动取样,就能得到N个样本数据,其表达式为
(1)
每种轴承状态的数据长度S约为120 000,若单一训练样本长度M为2 048,则平均采样训练样本共有58个;采用数据增强技术,选定滑动步长L为28,可得训练样本N约为4 213,从中随机选取1 000个作为这种故障状态的样本进行划分。该方法大大增加了数据集的样本数量,保证了样本数据的连续性,有利于模型的训练和参数的更新,从而提高模型的诊断准确率。
3.3 结果分析
本次试验基于python-Keras搭建网络模型,1DCNN的一次训练过程如图3a所示。经过50次迭代后,使用训练好的模型对随机划分的1 000个测试集样本进行故障分类,结果达到了98.2%的准确率,损失函数仅为0.74×10-4,模型诊断精度非常高且收敛速度快。
图3 1DCNN的训练过程和混淆矩阵Fig.3 Training process and confusion matrix of 1DCNN
由故障分类混淆矩阵(图3b)可以看出,4%的2类故障被错误识别为1类故障,10%的2类故障被错误识别为3类故障,4%的8类故障被错误识别为3类故障,另外8种故障类型的识别率则达到了100%,说明该模型能够准确监测轴承的健康状态。
与其他故障分类方法的对比结果见表2,由表可知:基于1DCNN的诊断模型能够有效地提取故障特征并进行轴承的故障识别,具有较高的准确度,比SVM及深度神经网络(DNN)算法的诊断效果更好。
表2 故障识别算法对比Tab.2 Comparison of fault recognition algorithms
4 全寿命周期滚动轴承故障诊断
4.1 试验数据
实际工况中,轴承性能退化是一个循序渐进的过程,轴承所处的损伤阶段也会由轻微到严重演变,要想做到轴承的视情维修,还需准确地识别轴承性能退化阶段。因此,采用美国辛辛那提大学智能维护系统中心轴承疲劳寿命试验台数据[21]进行分析。试验台主轴上装有4套型号为Rexnord ZA-2115的双列圆柱滚子轴承,采样频率为20 kHz,间隔10 min采集一次数据,每次采集时间为1 s。每次试验有4套轴承,当某一套轴承损坏时,停止试验并保留试验数据。整个数据集描述的数据内容为轴承从健康运行到失效的整个试验中振动信号的变化过程。
4.2 数据处理
对外圈全寿命周期数据进行时域指标分析,轴承性能退化过程中的信号波动情况如图4所示,由图可知:峭度指标对冲击信号比较敏感,随着轴承性能退化,其值从初始的4以下逐渐升高到17左右,但在轴承损伤严重的后期,峭度曲线反而出现了短暂的下降趋势;均值指标呈现总体平稳的趋势,只在轴承外圈失效时出现波动;峰峰值前期平缓,后期冲击杂乱;无故障时标准差在0.1附近且曲线较平缓,当轴承最终损坏时标准差增加至0.7左右,表明标准差随着轴承损伤程度加深而逐渐升高,550点左右时标准差曲线出现上升趋势,暗示着故障的发生,可以较好地反映轴承性能退化过程;另外,均方根、方根的变化趋势与标准差相似,可以较好对应轴承性能退化过程;裕度指标、波形指标、脉冲指标和偏度指标则不能较好地反映轴承性能退化过程。
图4 轴承外圈全寿命周期数据的部分时域特征Fig.4 Some time-domain characteristics of bearing outer ring life cycle data
综上分析,选取标准差变化趋势作为分类依据,根据图4标准差曲线中的点A,B,C,D将轴承性能退化过程分为5个阶段:正常、外圈轻微退化、外圈中度退化、外圈严重退化、外圈失效。根据轴承退化过程标准差的变化趋势,掌握轴承失效的发展规律,为开展视情、适时维修做好基础。
轴承性能退化过程标准差曲线的局部特征如图5所示,由图可知:
图5 轴承性能退化过程标准差曲线的局部特征Fig.5 Local characteristics of standard deviation curve of bearing performance degradation process
1)A点之前,标准差基本不变,时域和包络波动较小,无明显故障特征幅值,轴承状态良好,在第520个样本(图6b)周围出现波动,包络幅值明显增加,且出现230.5 Hz(幅值为35.2 m/s2)的外圈故障特征频率,而在第519个样本(图6a)处的包络谱图上则没有出现故障频率,表明第520个样本时外圈损伤,可以初步判定A点故障已经发生。
2)A—B段,标准差一直在缓慢上升,直至B点(第699个样本点)突增,包络谱图(图6c)中出现明显的故障频率和倍频。
图6 轴承性能退化过程不同样本点的包络谱Fig.6 Envelope spectrum of different sample points during bearing performance degradation process
3)B—C段,标准差逐渐下降,直至C点(第786个样本)之后才缓慢上升,此时包络谱图(图6d)中几乎只出现了外圈故障频率及其倍频,且幅值(336.4 m/s2)有明显上升,但仍低于A—B段,这是由于冲击力作用使故障点逐渐被磨合,从而导致幅值有所降低。
4)D点(第936个样本)出现了更明显的冲击,包络谱图(图6e)中也几乎只出现外圈故障频率及其倍频,且幅值(2 531 m/s2)大幅度上升。
综上,将A点之前划分为正常阶段,A—B段为外圈轻微退化阶段,B—C段为外圈中度退化阶段,C—D段为外圈严重退化阶段,D点之后外圈完全失效。至此试验数据准备完毕,将样本分为正常、外圈轻微退化、外圈中度退化、外圈严重退化和外圈完全失效,分别对应标签0,1,2,3,4。与上一组试验类似,也是包含原始振动信号和划分好的故障程度,但此组故障程度包含渐变过程,更符合实际。
4.3 试验结果分析
基于python-Keras搭建网络模型,1DCNN的训练过程如图7a所示,由图可知:约经过15次迭代后陷入局部极值,表明该模型的分类效果较差;
图7 1DCNN对滚动轴承外圈故障程度的识别结果Fig.7 1DCNN identification result of outer ring fault degree of rolling bearing
但随着迭代次数的增加,该模型可以快速恢复可靠、良好的分类性能,因此将网络的迭代次数设置为50。使用训练好的模型对随机划分的测试集样本进行故障分类,平均准确率达到了93%,模型的诊断精度非常高。另外,模型训练速度和收敛速度都很快。
轴承外圈故障程度分类的混淆矩阵如图7b所示,由图可知:22%的1类(外圈早期故障)被模型错误识别为2类(外圈中度退化),29%的2类(中度退化)被模型错误识别为3类(外圈严重退化),模型对其他故障程度的识别率都达到了100%。由于轴承故障是缓慢形成的,划分的故障程度会有一定的重叠部分,因此模型识别存在一定的误差,但已经能够很好地对轴承的运行状态进行监测。
5 结束语
针对滚动轴承的故障退化程度问题提出了基于一维卷积神经网络的“端到端”诊断方法,分别进行了不同故障程度和全寿命周期滚动轴承数据的试验验证,取得了很高的正确率。
1DCNN方法能够直接处理原始振动信号,提取原始信号相邻时间点之间的信息,省去了大量耗时费力的人工特征提取过程,并能减少网络参数,加快网络模型的训练过程,拓宽并加深神经网络的结构;1DCNN可以学习到原始振动信号更加稳定的特征信息并保留原始振动信号的完整性,根据时域特征变化趋势建立轴承状态的不同阶段。通过深度学习对轴承振动信号原始数据进行有监督学习,能够实现对轴承的全寿命分析和状态预测。