基于多尺度卷积神经网络的轴承故障诊断研究
2021-01-20周永庆
周永庆
(长安大学工程机械学院,陕西 西安 710016)
0 引言
滚动轴承是现代机械设备中的关键零部件, 广泛应用于数控机床、船舶、航空发动机等各种设备中,起着不可或缺的作用[1]。 滚动轴承作为旋转机械中的核心支撑回转部件, 其运行精度和安全可靠性直接影响旋转机械的总体性能[2]。 在滚动轴承故障诊断的过程中,快速有效识别出轴承故障的类型, 对于机械设备的安全和维修成本具有至关重要的作用[3]。
近年来,随着深度学习和人工智能的快速发展[4],机械设备在检测、故障诊断和维护方面越来越智能化[5]。 传统的轴承故障诊断方法通常包含选择和提取原始信号的时频域特征,通过傅里叶变换[6]、小波变换[7]等方法,对轴承故障进行分类。 这些方法要求工作人员具备比较高的专业知识和经验,存在一定的局限性。 传统的智能轴承故障诊断方法主要包含三个部分:特征提取、特征选择和特征故障诊断。 目前常用的主要有支持向量机[8]、BP 神经网络[9]等,这些方法筛选出的特征比较单一,特征综合能力不强。
针对以上不足, 本文提出了一种基于多尺度卷积神经网络(Multiscale convolution neural network,MCNN)的轴承故障诊断方法, 以轴承运行时采集的故障信号为研究对象,使用多个尺寸的卷积核提取原始信号,使提取到的信号更加丰富,有效解决特征提取能力不强的问题,无需人工提取故障特征。 试验结果表明,该方法具有较高的轴承故障诊断准确率。
1 深度学习理论
卷积神经网络(Convolution neural network,CNN)在结构和功能上与视觉皮层相似, 具有强大的从原始数据中提取特征的能力,主要用于处理网状结构数据,它通过构建多个能够提取输入数据特征的滤波器, 并运用这些滤波器逐层提取隐藏在输入数据中的代表特征, 经过非线性变换输出判断结果。
1.1 卷积层
卷积层是CNN 的基本单元, 卷积核采用参数共享机制。 几个具有不同权重向量的过滤器在输入体积的宽度和高度上滑动,在每个位置提取多个特征。
式中:S 表示图像卷积后的结果,K 为卷积核,m,n 表示卷积核的尺寸宽和高,A 为图像的输入矩阵。
1.2 激活函数
在多层神经网络中,上层节点的输出和下层节点的输入之间具有一个函数关系,这个函数称为激活函数。 下面公式为网络模型中经常使用的激活函数。
上述公式(2)、(3)和(4)分别是Sigmoid 函数、tanh 函数和ReLu 函数的数学表达式, 其中ReLu 是CNN 经常使用的激活函数,ReLu 存在以下优势, 不存在梯度消失问题、收敛速度较快。在输入是负值的情况下,它会输出0,神经元就不会被激活, 同一时间只有部分神经元会被激活,从而使得网络很稀疏,进而对计算来说是非常有效率的。
1.3 网络模型设计
如图1 所示, 多尺度卷积神经网络模型主要有输入、特征提取模块、信息融合模块和分类模块等组成,其中特征提取层包含依次堆叠的卷积层、归一化层、池化层和激活函数层, 分类模块包含全连接层、Dropout 层和Softmax分类器层。
图1 多尺度卷积神经网络模型结构示意图
图2 中的网络模型是有多个特征提取模块和信息融合模块组成,将提取到的抽象特征经过分类模块最终输出轴承故障类型。 图2 左侧是特征提取模块的参数设计,特征提取模块一共有4 个通道, 第一个通道是名称Conv1,包含卷积层、归一化层和激活函数层,后面连接一个名称为Conv1_1 的小模块,以此类推,第二个和第三个通道和第一个类似,第四个通道是先经过最大池化,然后经过卷积、归一化和ReLu 激活函数,最终将这四个通道提取到的不同信息经过信息融合模块汇聚更加丰富的数据特征。 经过全连接层、Dropout 和Softmax 层输出预测结果。
1.4 数据增强技术
对于原始数据我们采用了数据增强( Data Augment)算法技术,如图2 所示,对原始数据进行重叠采样,从而增加训练样本数量,增强模型的泛化能力。
图2 数据增强技术
2 试验验证
2.1 实验数据集
滚动轴承多故障诊断实验的数据来源于凯斯西储大学(Case Western Reserve University,CWRU)数据中心公布的轴承试验故障数据,此数据在学术界被广泛应用,该轴承故障实验平台如图3 所示。
图3 轴承故障实验平台
本实验每次使用4 096 个数据点作为一个样本, 设置步长为20, 每种轴承故障类型取得样本数量为6 000,10种不同程度的状态共计60 000 个样本, 标签分别从0 到9 表示不同的轴承故障状态, 从每种故障状态随机取600个样本作为测试集, 余下的5 400 个样本作为训练集,测试集共6 000 个样本,样本划分详情如表1 所示。
表1 实验数据集划分详情
2.2 试验结果分析
在训练模型时, 以交叉熵作为损失函数; 首选采用Adam 优化器, 将学习率设置为0.001, 同时将训练轮数(Epochs)设置为100 轮。
由图4 可知,训练集输入到MCNN 模型,经过40 轮数训练后,模型基本达到稳定,准确率接近100%左右并且趋于稳定,损失趋近于0 左右;验证集在MCNN 模型的表现接近训练集,准确率也趋于100%,损失函数趋于0,说明该模型的性能表现良好,并无过拟合和欠拟合现象发生。
图4 MCNN 模型训练准确率和损失曲线图
2.3 试验对比
为了验证本文提出的MCNN 模型的有效性,本文使用了CNN 网络模型和BP 神经网络模型对了对比试验,试验结果如下表2 所示。
表2 不同模型故障识别准确率
由表2 可知,各个模型经过120 轮训练后,本文所提出的MCNN 网络模型的准确率达到了99.97%,比CNN 网络模型和BP 神经网络模型的准确率都高,说明该模型具有良好的轴承故障诊断性能。
3 结论
本文所提出的算法模型,通过应用于轴承的故障数据集进行诊断,验证了该方法的有效性与优越性,得到的结论如下:
1)MCNN 算法模型具有更好的轴承故障诊断准确率,通过应用于轴承的故障数据集诊断, 获得了高达99.97%的准确率,比CNN 模型和BP 神经网络模型准确率更高,说明该模型具有较好的准确性和有效性。
2)MCNN 模型能够通过不同的卷积核尺寸提取不同的原始信号特征,使提取到的抽象特征更加丰富。