基于1D-CNN的滚动轴承端到端故障诊断方法
2021-09-05陈志刚景腾飞
康 涛,王 书,陈志刚,刘 菲,景腾飞
(1.北京航天万源科技有限公司,北京 100176;2.北京航天拓扑高科技有限责任公司,北京 100176)
0 引言
旋转机械设备广泛应用在航天、交通、工业制造和风力发电等重要工程领域[1],其在重大工程中扮演着不可或缺的角色,设备发生故障或者停机可能造成严重后果。旋转机械设备中滚动轴承是其非常重要的零部件[2],同时滚动轴承在恶劣工况下容易出现磨损、裂纹、断裂等故障[3]。因此,采用故障诊断技术对滚动轴承状态的准确识别,可以有效防止轴承故障引起的意外事故。传统的故障诊断技术有:自回归滑动平均模型(Autoregressive moving average model,ARMA)[4]、变分模态分解(Variational Mode Decomposition,VMD)[5]、小波分析[6]、概率神经网络(Probabilistic Neural Network,PNN)[7]等得到了广泛的应用。随着大数据时代的到来,利用海量数据驱动轴承故障诊断算法成为近些年的研究热点。其中基于深度学习算法的轴承故障诊断成为现阶段的主流。主要手段如下:首先人为处理原始信号,然后将信号输入到深度学习算法中,再通过分类器对故障识别。
然而上述介绍的故障诊断方法将故障诊断分割为信号预处理、特征提取、故障分类三个孤立的部分,无法将各个部分形成有效的耦合关系,可能导致在数据传递的过程中出现故障特征损失的情况发生。针对此问题,提出一种端到端的滚动轴承故障诊断模型,将三个步骤直接整合到一个模型中,直接将原始振动信号输入模型中,经过模型计算、算法处理后得到轴承故障类型。提出了一种基于一维卷积神经网络的滚动轴承故障诊断模型。利用一维卷积神经网络强大的特征提取能力,对原始信号提取特征。然后将提取的特征输入到全连接,通过全连接层对特征分类得到故障识别。同时考虑到一维信号的特点,设计了大卷积核的诊断模型。减少了数据传递过程中故障特征损失。
1 一维卷积网络
卷积神经网络(Convolution Neural Networks,CNN)是共享权重、局部特征提取、特征池化的多层神经网络[8]。其中共享权重可以使其泛化能力增强,局部特征提取使卷积神经网络训练速度得到了很大提高,特征池化降低特征维度放大特征明显区域。卷积神经网络主要由前向传播算法和反向传播算法相结合,前向传播算法用于接收输入数据直至输出产生误差,反向传播算法是将减少输出层的误差并同时更新权重。
卷积神经网络根据输入类型不同,可以将其分为一维(1D)和二维(2D)卷积神经网络。本文采用一维卷积神经网络对原始一维振动信号处理,其中1D-CNN 包括隐含层、输出层及输入层,而隐含层包含一维卷积层(Convolutional Layers)、激活函数层(Activation Layers)以及池化层(Pooling Layers)等,隐含层主要用于接收输入层的输出并完成对数据特征的提取。
2 滚动轴承故障诊断模型实验分析
2.1 数据描述
为验证本文提出方法的有效性,试验选用来自美国凯斯西储大学的轴承数据集[9]。滚动轴承运行状态可以分成四种分别为:健康、内圈故障、外圈故障和滚珠故障,正常状态时域如图1 所示,内圈故障时域如图2 所示,外圈故障如图3 所示,滚珠故障如图4 所示,根据图片很难分辨出故障类型。每种故障状态包含三种故障尺寸:小(0.18 mm)、中(0.36 mm)和大(0.54 mm)。根据上述介绍轴承状态共有10 种情况。
图1 正常状态
图2 内圈故障
图3 外圈故障
图4 滚珠故障
2.2 构建数据集
提升模型对样本的泛化效果,试验采取重叠采样的操作对数据集进行增强,实现模型鲁棒性的提升。重叠采样如图5 所示。数据集具体信息见表1。
表1 数据集信息
图5 重叠采样
2.3 网络结构参数确定
为了使1D-CNN 诊断模型具有效果更佳的诊断效果,需对其模型结构进行设计。常见的二维卷积神经网络,比如ResNet[10]和VGGnet[11]采用堆叠式的3×3的卷积核,可以实现少参数大感受野的效果,从而防止过拟合现象。但是对于一维振动信号采用堆叠式3×1的卷积结构,以6 个权值为代价,只得到5×1的感受野,反而将上述优势变成了劣势。因此根据一维振动信号的特点,将1D-CNN 诊断模型的第一层设计为大卷积核,其作用提取短时特征。其余的卷积层为3×1的小卷积核,减少模型参数防止过拟合现象。
为了选择合适的第一层卷积核的参数,通过对比实验进行比较分析,设计三种1D-CNN 诊断模型。这三种模型的第一层卷积核分别为32×1、64×1、128×1,每个模型共有4 层卷积核池化层,除了第一层外,剩下的卷积核均为3×1,全连接层为10 个输出对应着轴承的10 种状态。模型对比实验结果见表2。
表2 模型对比实验
由表2 可以看出,随着卷积核尺寸的增加,模型在测试集中的准确率随之提高,当卷积核尺寸由32 增加到64 时,准确率由96.01%提升到99.33%,提高了3.46%,计算时间变化不大,当卷积核尺寸由64 增加到128 时,准确率提升不多,仅提升0.44%,但由于计算参数的增加,计算所消耗的时间增加了0.02 s,对网络准确率提升不高,却造成了比较多的资源消耗,因此选择64×1 作为第一层卷积核的尺寸。具体诊断网络模型参数见表3。
表3 故障诊断网络参数
2.4 实验结果
使用上述数据集,对比所确立的模型进行训练。训练过程中,全连接层使用Dropout 防止过拟合问题,Dropout 比率设置为0.2,Adam 算法的学习率为0.001。为了保证模型的可靠性,在训练工程中,每个数据集迭代60 次。为了直观地观察模型对每种故障的识别情况,采用混淆矩阵表示实验结果如图6 所示,图中行表示实际分类,列表示预测分类。其中在混淆矩阵中,0~9 分别代表不同的类别,具体混淆矩阵标识说明见表4。
表4 混淆矩阵标识说明
图6 故障诊断混淆矩阵
根据混淆矩阵图可以看出,所提出的基于1D-CNN的故障诊断网络,在美国凯斯西储大学数据集中所进行的实验,在同故障尺寸之间容易发生混淆,例如对于故障尺寸为0.36 mm 中内圈故障(标识4)和外圈故障(标识6)发生混淆。虽然发生了混淆,但是每种故障识别准确率都高于97%。并且模型的类间平均准确率为99.33%,可以满足对轴承故障的准确识别。
3 结束语
提出了一种基于一维卷积神经网络的端到端轴承故障诊断模型,直接将原始信号输入,减少了数据传递中特征损失。针对一维原始振动信号特点,在CNN 设计方法的基础上,设计了三种第一层大卷积核模型,通过实验数据集测试,确定了一种最优的CNN 网络模型。通过实验美国凯斯西储大学数据集验证,所提模型的类间平均准确率为99.33%,测试时间为0.03 s。实现了快速识别高准确率的诊断性能,证明了所提出方法的可行性,具有较好的技术应用前景。