基于GADF-TL-ResNeXt的滚动轴承故障诊断方法
2023-11-03侯东晓周子安程荣财
侯东晓, 周子安, 程荣财, 阎 爽
(1.东北大学秦皇岛分校 控制工程学院 河北 秦皇岛,066004;2.京能秦皇岛热电有限公司 河北 秦皇岛,066004)
1 引 言
在现代化设备制造业中,机械制造正朝着自动化、智能化的方向不断发展。其中,旋转机械结构更加精密、功能更为复杂,在各个生产领域发挥着重要作用[1]。滚动轴承作为旋转机械的代表零件之一,被用作支撑回转件、减小摩擦以及保证回转精度等,对机械设备的寿命与稳定起着决定性的影响。在实际工况下,轴承往往需要承受变速、变载等严苛的工作条件,导致故障也时常发生。因此,需要及时、高效地查明轴承的故障原因。
当前传统的轴承故障诊断方法有2种,一是以信号分析为主的诊断方法。Ye X等[2]将改进的经验模态分解(EMD)方法应用到轴承故障诊断中,对振动信号的微弱噪声和突发脉冲具有良好的识别效果。Hou J等[3]提出将基于聚类算法的集合经验模态分解(EEMD)应用到轴承故障诊断中,结果表明所提的方法能够获得较高的聚类指标。此方法的局限性是过分依赖人工参与,并且过程非常的耗费时力。另一种则是以数据驱动为主的机器学习方法。如Chen F F等[4]将预处理的振动信号直接输入到改进的支持向量机(SVM)中,用于轴承早期故障的识别,并取得了良好的效果。在文献[5]中,研究人员先将轴承一维振动信号进行预处理,再输入到一维卷积神经网络(1D-CNN)中完成故障的识别与分类。此方法能够自动提取特征,且准确率和鲁棒性也大大提高,因此近些年被广泛应用于故障诊断领域。CNN因其有强大的图像特征提取能力也受到了许多学者的青睐。Li G等[6]通过ST变换将振动信号直接变为二维矩阵并输入到CNN中进行分类。Yang J等[7]通过生成对抗网络来扩充小样本数据集,并转换为灰度图像输入到SE-CNN自动分类识别。Han T等[8]向二维图像中添加红色,将时域彩色特征图输入到CNN中以增强CNN的识别能力。但此类方法仍存在以下几个问题:1) 直接以原始信号输入模型中可能会导致部分特征提取不完整;2) 是随着网络模型的深度的加深,模型存在退化问题;3) 是模型需要成百上千次的训练才能达到一个好的效果。
基于以上问题,本文提出了格拉姆角场(Gramian angular field,GAF)、迁移学习(transfer learning, TL)、分组残差网络(ResNeXt)相结合的数据驱动故障诊断模型(GADF-TL-ResNeXt)。首先通过GAF将一维时序信号转换成二维特征图,再将这些特征图输入到与迁移学习结合的ResNeXt网络中进行自动的识别、分类。为了验证该方法的有效性,使用凯斯西储大学数据与其他方法进行对比,最后使用轧机模拟实验平台上收集的轴承故障数据进行变工况下的轴承故障分类。
2 数据到图像的转换方法
格拉姆角场,是一种将时序信号转换为二维图像的编码方式[9],它的原理是将时间序列信号在极坐标系统内进行编码,极坐标系统保留了绝对的时间关系,GAF图像编码将一维时间序列1个点对应的时间、幅度转换到极坐标系下的半径、角度,这样数据便从一维数据转换到二维空间上,保留了对时间的依赖性。GAF在编码时通过三角函数的和或差运算生成GASF/GADF编码图,相同的数据点下对应的图像如图1所示。
由图1可知,格拉姆角差场(GADF)相较于GASF在图像色彩、交叉边界以及细节刻画方面效果均更好[10]。因此采用GADF进行编码计算(见图2),假设有n个点的时间序列X={x1,x2,…,xn},GADF对此序列X转化成二维空间,具体步骤为:
图2 GADF图像编码流程Fig.2 GADF images encoding process
1) 对n个时间序列信号进行归一化处理,目的是将一维数据压缩至区间[-1,1],处理式
(1)
2) 将缩放后的序列数据转换到极坐标系,即将数值看作夹角余弦值,时间戳看作半径,从而在极坐标中表示重新调整的时间序列X,转换过程中,随着时间的增加,相应的数值在跨度圆上的不同角度点之间发生扭曲,从而得到极坐标系下的曲线,具体可定义为
(2)
式中:φ表示角余弦的极坐标;ti表示时间戳;N表示正则化极坐标系跨度的常数因子。
3) 缩放后的时间序列转换到极坐标系统后,对于存储时间信息的极坐标系统φ,通过计算系统中每个极坐标的三角函数差,可以很容易地进行角度视角来识别出不同时间间隔内的时间相关性。可将其编码到矩阵的几何结构中,定义为
AGADF=[sin(φi-φj)]
(3)
(4)
式中:I=[1,1,…,1],它是单位行向量;X′和X代表着不同行向量。
4) 最后将AGADF矩阵表示为二维GADF图像,并通过图像建立极坐标保持绝对时间关系。
3 网络结构及原理
3.1 残差神经网络(ResNet)
ResNet[11]属于CNN的一种,其引入的残差结构可将网络底层的特征通过捷径直接传递到高层,通过引入快捷连接来拟合残差映射函数,只学习输入和输出的差别。ResNet由许多残差块堆叠组成,不仅加拓宽了网络深度,还成功的解决了网络退化问题,提高了模型训练的稳定性,结构如图3所示。
图3 残差结构Fig.3 Residual structure
图3中x为残差块的输入;F(x)为残差映射函数;H(x)=F(x,{Wi})+x为恒等映射函数,{Wi}为输入经过残差块中第i个卷积层时获得的权重。
3.2 分组残差结构(GRS)
分组残差结构是在原有的残差模块的基础上引入了Inception[12]模块思想,将残差块由原来的瓶颈结构拆分成多分支结构,并且每条支路上都遵循相同的拓补结构,分别进行相同的卷积操作,最后再进行拼接求和汇总,具体可以定义为:
(5)
式中:X表示输入数据;Y表示输出数据;表示相同的拓补结构;G表示分支数,经实验验证,增加分组数量可以提高模型的精度,本文中G取32。
当残差块处于不同位置的时候,输出数据的维度也不同,需要作出调整,其主要结构分为2种:恒等映射图4(a)和投影映射图4(b)。当输入x与Conv3+BN层输出的数据维度相同时,二者可直接经过捷径(shortcut)相加。反之,则需要在捷径分支上加一层卷积操作调整输入数据x的维度以方便于Conv3+BN层输出数据相加。
图4 2种分组残差结构Fig.4 Two group residual structures
分组残差结构的优点是不增加参数复杂度的条件下提高模型的精确度,对于未进行分组操作的残差块,所提方法可以明显降低残差块的参数量。假设输入特征矩阵的通道数为C,卷积核大小为M×M,输出特征矩阵的通道数为N,分为G组。
未分组的残差块部分参数量Tw:
Tw=C×M×M×N
(6)
分组的残差块部分参数量Tf:
(7)
由式(6)和(7)可知,相比较未分组的残差块而言,分组以后的残差块部分参数量要减少G倍,对参数处理方面的误差会有一定的减小,图5为本文ResNeXt网络模型结构。
图5 ResNeXt网络框架结构Fig.5 ResNeXt network framework structure
3.3 迁移学习
迁移学习给定源域Ds、相应的原任务Ts及目标域Dt和目标任务Tt,其目的是使用Ds、Ts中的知识来改进Dt中的目标预测函数ft(·)。源域Ds、目标域Dt可定义为:Ds={X,P(X)}、Dt={Y,ft(·)}。X代表特征空间,P(X)代表边际概率分布。由此获得Ds={(xs1,ys1),(xs2,ys2),…,(xsn,ysn)},其中数据样本满足xsi∈Xs,相应的类标签满足ysi∈Ys,Dt可以由数据样本Xt和标签空间Yt表示。迁移学习还可以在相似或不同领域实施快速学习[13]。由于故障诊断中相对的特征样本量较少,ResNeXt模型很难在短时间内达到一个完美训练效果,所以可加入迁移学习方法。此外,训练模型参数具备较强的特征迁移能力,对其他数据集进行特征提取时可直接引入,有助强化模型性能,以学习特定的功能[14]。通过对初始模型在ImageNet数据集上先进行预训练,可得到具有提炼抽象特征的模型权重参数,即使加入样本量较少的数据集,也可以有较高的识别准确率。
4 基于GADF与TL-ResNeXt故障诊断流程
本文所用方法结合了GAF编码可以保留时间序列的相关性以及加入迁移学习模块的ResNeXt可以快速的识别时间序列特征能力的优点,提出了基于GADF-TL-ResNeXt的轴承故障诊断方法,具体流程如图6所示。模型训练部分引入了ImageNet数据集上预训练好的模型权重,训练过程中改变了softmax层的分类节点个数,以适用于轴承故障分类的几种情况,再将训练过程中模型准确率最大的权重文件引入到测试集模型中,最后进行准确率最高的故障分类,以达到最好的分类效果。
图6 基于GADF-TL-ResNeXt的故障诊断方法流程图Fig.6 Fault diagnosis process based on GADF-TL-ResNeXt
5 实验研究与分析
5.1 CWRU轴承数据库
5.1.1 数据划分
为了评估所建模型的性能,使用来自美国凯斯西储大学(Case Western Reserve University,CWRU)轴承数据库的数据与其他方法进行对比。以驱动端深沟球轴承SKF6205为例,轴承的损伤是用电火花加工的单点损伤。分别对轴承的外圈(3、6、12点钟方向)、内圈、滚动体设置0.17、0.35、0.53 mm 共3种故障类型损伤,在驱动端轴承座上放置加速度信号传感器,采样频率为12 kHz。实验中电机负载分为4类,选功率为0.75 kW,转速为1772 r/min的情况。分别选用内圈、外圈、滚动体(6点钟方向)3种类型的3种不同损伤直径作为故障数据样本。另设一种健康状态的数据样本,共10个类别,每种类别构造400份样本,按照9:1划分为训练集和验证集。使用表1数据,验证所提模型分类的有效性。
表1 故障类型样本Tab.1 Sample fault types
5.1.2 样本生成方法参数设置
一维时序信号通过GADF编码方法生成二维图像,采用滑动窗口在时序上进行平移滑动采集数据点,同时生成对应数据点下的二维图像,为了确定滑动窗口的大小,首先应该计算轴承在旋转一周内采样点的个数,由公式(8)确定:
(8)
式中:L代表轴承一个周期内采样点的个数;S代表轴承的转速;Fq代表采样频率。
为确保每个图片编码包含1个周期内的采样点,经过计算可知,轴承每转采样大约400个数据点,所以滑动窗口大小至少要为400,本文数据以最小的滑动窗口采样。滑动步长为滑动窗口每次平移采样的距离,当步长小于窗口时,样本之间存在重叠,相同数据点下可以获得更多的样本,为保证数据利用率及信号的完整性,实验数据样本处理方法为半额重叠采样。为保证输入图片的分辨率适中,每一个滑动窗口生成1张256×256的GADF二维编码图像,采样所生成的故障图如图7所示。
图7 不同故障类型GADF编码图Fig.7 GADF coding diagram of different fault types
5.1.3 实验结果与分析
为了验证模型的可行性与稳定性,对比了其它几类不同网络,分别是未加入迁移学习模块的ResNeXt、迁移学习但未分组处理的残差网络TL-ResNet以及浅层网络GoogLeNet、AlexNet。分别迭代140轮,由图8可知,本模型相比于其他模型而言,训练第一轮就有87%的准确率,在迭代到30轮时趋于稳定,最高验证准确率为99%,训练损失最低达到0.01。
图8 不同模型的准确率和损失曲线Fig.8 Accuracy and loss curves for different models
以上数据说明本模型相较于其他模型,鲁棒性比较强,并且趋于完全收敛,而其他未进行迁移学习处理以及浅层网络模型,很难在很少的轮数达到一个理想的效果,训练损失及稳定性要远远低于本模型。
5.1.4 模型评估指标
评估指标是判断诊断算法性能的标准,在数据分析中具有重要意义。在深度学习故障诊断领域,准确率Ac、精确率Pr、召回率Re、F1分数都是评判模型性能的标准,表达式如式(9)~式(12),通过实验验证,本模型对比了其他几种流行网络的这几个参数值,如表2所示。
表2 不同网络模型各个参数Tab.2 Parameters of different network models (%)
(9)
(10)
(11)
(12)
式中(假设分类器分类预测x、y共2种样本):TP为x样本被正确识别的数量;TN为y样本被正确识别的数量;FP为分类器预测结果是x样本,实际是y样本,即误报的y样本数量;FN为分类器预测结果是y样本,实际是x样本,即漏报的x样本数量。
为了更加直观地感受TL-ResNeXt的学习能力与分类效果,绘制了图9所示的分类混淆矩阵,横纵坐标每个标签代表一类故障类型,对角线上的元素代表正确标签和预测标签的重合度,以验证集为例,每类故障样本数为40,共计400份故障样本。由图可知,有4个误分类样本,分别为3个内圈0.35 mm数据误分成1个外圈0.35 mm数据和2个滚动体0.53 mm数据,1个滚动体0.53 mm数据被误分成外圈0.35 mm数据,其余种类均达到满分类效果,由此证明本模型是有效、可行的。
图9 轴承分类混淆矩阵Fig.9 Classification confusion matrix
5.2 与其他诊断算法对比
为进一步说明模型的优势,将GADF-TL-ResNeXt与一些常用的方法进行对比,结果如表3所示。与参考文献[15~17]方法相比,所提的GADF-TL-ResNeXt方法可识别更多的故障类型,且提高了分类准确度。
表3 不同算法准确率对比Tab.3 Comparison of accuracy of different algorithms
5.3 变工况条件下轴承故障诊断
5.3.1 实验平台介绍
实验数据来自轧钢机模拟实验平台,图10为轧机监控系统,包括轧机试验台、传感器采集系统和实验控制台。它们分别如图10中(Ⅰ)、(Ⅱ)、(Ⅲ)所示。2个加速计传感器位于上工作辊的轴向和径向位置,以收集轴承振动数据。加载驱动电机模拟轧机工作时轧辊所受到的载力(N0、N1、N2),由电机经过传动系统给到轧辊不同的驱动转速(W0—600 r/min、W1—1 200 r/min、W2—1 800 r/min)来模拟不同工况下轧辊的转速,采样时间设置为20 s,采样率为10 240 /s。
图10 轧钢机模拟实验平台Fig.10 Rolling mill simulation experimental platform
根据实验设计的故障场景,这些数据用于轧机轴承的不同健康状态;收集的数据文件标记为“正常”、“内圈故障”、“外圈故障”和“滚动体故障”;轴承故障如图11所示。
图11 轴承各类健康状态图Fig.11 Bearing health charts
5.3.2 数据处理及划分
采用控制变量法,即用固定转速下的不同载力以及相同载力下不同转速, 来模拟实际工况下的故障00000000000000000000000000000000000000000,考虑到采样频率为104/s,为了覆盖3种转速下轴承转一圈所采集到的点,根据式(8)可以将滑动窗口大小设置为1 024,再使用半额重叠采样法,制作相对应的GADF编码样本。
在转速相同(W0、W1、W2)的情况下,分别采用2种电机加载(N0、N1)的轴承径向振动数据制作相应的数据集,每类制作400份故障样本,同样按9:1划分为训练集和验证集,每种转速下包含6类故障状态和1类健康状态,共7种类别,在加载相同(N0、N1、N2)的情况下,分别采用2种转速(W1、W2)的轴承轴向振动数据制作相应的数据集,数据划分结果与转速相同情况下的结果保持一致,用来验证本模型的有效性。
5.3.3 模型实验结果
分别为相同转速下施加不同载力、相同加载下给出不同转速的2种情况,将振动信号经GADF编码成二维图像后,划分训练集和验证集,输入到TL-ResNeXt网络中,得到如图12所示的准确率、训练损失曲线,图13所示的分类混淆矩阵。
图12 验证准确率及损失曲线Fig.12 Verification accuracy and loss curve
图13 分类混淆矩阵Fig.13 Classification confusion matrix
由图12(a)~图12(c)可知,轴承在相同转速下施加不同载力,模型识别最高准确率分别为98.2%,98.6%,98.2%,平均准确率为98.3%;由图12(d)~图12(f)可知,轴承在施加相同载力,再给出不同转速的情况下,模型识别最高准确率分别为97.5%,97.5%,97.9%,平均准确率为97.6%;模型的总体平均准确率为97.95%。最低训练损失平均值为0.03,模型达到收敛,由此可得出本模型在变工况的条件下依然可以达到一个很好的分类效果。
图13清晰地展示了轴承各种情况下的分类效果,由图13(a)~图13(c)可知,仅有个别故障被误分为其他类别,其中轴承正常类型与轴承故障类型均被完全分开,由图13(d)~图13(f)可知,仅图13(e)的2类标签分类效果不佳,原因是2号标签与1号标签的某段振动数据较为相似;其余的情况仅个别数据发生误判,由此说明本模型在变工况下分类是有效的。
6 结 论
本研究提出了一种以数据驱动为主的CNN(TL-ResNeXt)轴承故障诊断方法,主要得出了以下几点结论:
1) 首先利用了一种振动信号到图像的转换方式-GAF编码,抛弃了以原始振动信号作为输入,既保留了信号时间序列的相关性,又可以充分提取轴承不同故障的特征,无需人工手动提取。
2) 利用了层级更深的残差网络作为模型主体,残差块部分采用分组卷积情况,通过更深的网络层和更好的特征提取层,ResNeXt将提高故障诊断的最终预测精度,并结合了迁移学习模块,在较少的训练轮数下模型可以达到更好的稳定性和准确率。
3) 在西储大学轴承数据集上对比了其他几种流行的网络模型,本方法表现的更好;在轧机模拟试验台上模拟轴承在变工况条件下情况,依然能达到一个良好的分类效果。在轴承给出相同转速下施加不同载力的情况下,模型识别平均准确率为98.3%,在施加相同载力下给出不同转速的情况下,模型识别平均准确率为97.6%,仅有个别类型发生误判,因此可见本模型在故障诊断领域有着良好的性能。