APP下载

基于小波变换和Involution卷积神经网络的滚动轴承故障诊断方法

2022-11-21王正文传博董逸凡

轴承 2022年11期
关键词:时频轴承准确率

王正,文传博,董逸凡

(上海电机学院 电气学院,上海 201306)

小波变换克服了短时傅里叶变换单一分辨率的缺点,可以同时提取信号的时域特征与频域特征并将其转换为蕴含着原始信号故障特征的二维时频图[1-3]。文献[4]提出一种基于多尺度小波变换和时频图的微波源故障检测方法,利用小波变换绘制残差信号的时频图,再对检测结果进行可视化分析,实现了微波源队列中故障微波位置以及故障发生时间的准确在线检测;文献[5]提出了一种基于卷积神经网络和迁移学习的电机轴承故障诊断方法,将原始振动信号通过小波变换转换为二维时频图,再通过神经网络模型进行故障分类;文献[6]提出了一种采用多种小波提取轴承健康状态特征的神经网络算法,并用全局最大池化替代卷积操作后的最大池化,明显提高了分类精度;文献[7]将原始轴承振动信号进行短时傅里叶变换转换为二维时频图像,再送入深度残差网络进行故障分类,分类准确率有了很大提升。由上述文献可知,将时频图作为神经网络的输入进行故障特征提取的研究仍存在较多问题:1)原始信号经小波变换转换为时频图后保留的原始故障特征是否充分;2)将卷积神经网络用于滚动轴承故障诊断中,存在梯度扩散、参数爆炸以及训练时间较长等缺点;3)卷积神经网络与其他网络模型的对比不够充分。

相对于常规Convolution,Involution有更少的参数,更快的计算速度和更强的特征提取能力[9];但其卷积操作并不能改变输入图像的通道数,连续使用可能会影响故障特征的提取。针对上述问题,本文提出了一种基于小波变换和Involution卷积神经网络的滚动轴承故障特征提取和分类方法,通过Convolution提取特征并扩展输入特征图的通道数[9-10],再通过Involution进一步提取输入图像的特征,从而在减少模型训练时间的同时获取更高的分类精度。

1 Involution

在深度学习中[11-13],卷积的目的是从输入中提取有用的特征,卷积核在空间维度和通道维度上有2大特性:1)空间不变性,即在特征图中所有的空间位置使用同一尺寸的卷积核,卷积核在所有位置都是共享的,可以有效节省模型参数,还可以让卷积操作维护平移的等变性,但由于卷积核只有一个,不可以根据输入特征灵活调整卷积核的参数,对特征图的特征提取能力不充分;2)通道特异性,即不同的通道中采用不同的卷积核进行卷积操作,从不同的通道提取各自的语义信息,但不同通道对应的卷积核可能会出现冗余。针对上述不足,提出了一种可以让卷积核在通道维度上有所减少而不会明显影响其表达能力的操作,即Involution,在保证计算高效的情况下,极大减少了网络参数量。

Involution与常规卷积操作具有反对称性,其具有空间特异性和通道不变性(将特征图的通道分为G个组,每个组内共享一个卷积核),Involution操作没有像常规卷积操作一样采用一个固定尺寸的权重作为可学习参数,而是基于特征图生成对应的卷积核,从而确定其卷积核尺寸与输入特征矩阵在空间维度上是可以对齐的。Involution算子为

Involution卷积核的通用形式为

Hi,j=φ(Xψi,j),

式中:ψi,j为坐标(i,j)邻域的一个集合,表示特征图上包含Xi,j的某个邻域。

核生成函数φ可以有多种形式,用一种类似于SENet的bottleneck结构进行试验,得到Involution卷积核生成的一种实例化,如图1所示。

常规Convolution操作所需参数量为Ci(输入通道)×Co(输出通道)×K×K,而Involution操作所需参数量为(C2+CGK2)/r,一般C会比G少很多,因此Involution的参数量也会少很多。

2 基于小波变换和Involution的卷积神经网络模型

2.1 网络模型结构

本文使用的框架为同时结合Conv2d卷积操作和Involution卷积操作的神经网络模型,包含4个卷积层、2个池化层和3个全连接层,模型结构见表1。

表1 网络模型结构

2.2 试验流程

试验流程如图4所示:将原始数据转换为小波时频图,按照7∶2∶1的比例划分为训练集,验证集以及测试集,经过数据预处理将时频图裁剪为64×64×3的大小送入神经网络,经过4个卷积层提取输入特征,再通过3个全连接层分类,最后绘制出准确率曲线以及网络模型损失曲线;然后,将测试集输入网络模型,计算得出混淆矩阵,观察各类故障的识别情况。

3 仿真分析

3.1 CWRU数据集

采用美国凯斯西储大学的轴承数据集进行仿真分析,试验轴承为6205,工况为0hp,采样频率为48 kHz,转速为1 797 r/min。轴承故障分为内圈故障(IR),外圈故障(OR)和滚动体故障(B),每种故障又分为轻度故障(07,故障直径0.178 mm),中度故障(014,故障直径0.356 mm)和重度故障(021,故障直径0.534 mm)3个类别。划分后每个样本的采样点为864,其中包含2个故障周期,每类故障各200个样本,按7∶2∶1划分为训练集,验证集,与测试集,具体数据见表2。各故障轴承振动信号经小波变换转换得到的时频图如图5所示。

表2 CWRU轴承数据集

3.2 网络结构分析

为分析Involution对网络模型的影响,在网络不同位置采用不同的卷积操作,建立不同的网络模型验证其对故障轴承的识别能力。将CWRU轴承数据集通过小波变换转换得到的二维时频图输入不同的神经网络模型,准确率和运行时间的对比结果见表3。其中,网络1为本文所建网络模型,括号内为该层所选用的卷积类型。由表3可知:

表3 不同网络结构性能对比

1)相对于采用4个常规卷积的网络2,网络1的训练集准确率提升了2.25%,验证集准确率提升了4.18%,运行时间缩短为原来的59.86%。

2)网络3将网络1的第2层卷积由Involution换为Convolution,参数增加了624,训练速度略有降低。

3)网络4的卷积层全部采用Involution,虽然大大降低了每个卷积层的参数量(由网络1的1 911下降为132,降低约93.1%),但由于Involution操作无法改变输入特征图的通道数(本试验取值为3),故其卷积层均生成3×3×3(K×K×G)的Involution卷积核;另外,为保证与其他网络的Involution操作一致,步长均为1,因此网络4并没有改变输入特征图的大小,导致其全连接层的参数量大大增加,训练时间也有所增长。

4)网络4和网络5的训练集准确率与验证集准确率差异较大,即出现了过拟合现象,这同样是由于Involution不可改变输入特征图的通道数,当网络中连续使用较多Involution操作时,通道间的内部信息交换受到一定程度的影响。

综上分析可知,网络1的分类准确率度最高,运行时间相对较短,对滚动轴承故障的识别性能最佳,验证了前文所提模型结构的合理性。

3.3 仿真结果分析

试验平台配置如下:CPU为Intel(R)Core(TM)i5-10400 CPU @ 2.90GHz,显卡为RTX2060,运行程序为PyCharm Community Edition 2020.3x64。网络模型参数设置如下:学习率为0.002,迭代次数为100,batchsize为64;由于输入图像尺寸较小(64×64×3),Involution的压缩率r和组数G均取为3。将CWRU轴承数据集经小波变换得到的二维时频图进行数据预处理,裁剪为64×64大小的图像送入模型进行训练,训练集和验证集的损失曲线和准确率曲线如图6所示,测试集输入训练完成模型得到的混淆矩阵如图7所示。

由图6可知,本文所建网络模型在迭代30次左右时达到收敛,训练集及验证集均达到了100%的准确率;由图7可知,在测试集中,仅有1个B021故障被错误识别为IR021,其他故障的识别率均达到了100%:说明该模型可以有效识别轴承故障。

4 试验验证

4.1 试验数据

为进一步验证本文所建模型在实际应用中的表现,在图8所示试验台上进行轴承试验,试验轴承型号为6206-2RS,转速为1 420 r/min,采样频率为10 kHz,在0负载的工况下,分别通过电动机驱动端的横向、径向以及轴向加速度传感器获取三通道的振动信号,通过MATLAB处理合并为1个数据,试验数据包括外圈故障、内圈故障、滚动体故障以及正常工况各500个样本(图9,内外圈故障均为机械挤压制成,故障深度为0.6 mm),每个样本的采样点数为864(包含2个故障周期),按7∶2∶1划分为训练集、验证集以及测试集,具体数据分布见表4。各故障轴承振动信号经小波变换转换得到的时频图如图10所示。

表4 试验轴承数据集

4.2 试验结果分析

通过小波变换将试验轴承数据转换为二维时频图,经过数据预处理后裁剪为64×64的图像输入模型,训练集和验证集的损失曲线和准确率曲线结果如图11所示,验证集的混淆矩阵如图12所示。分析可知:在20次迭代后,训练集和验证集的准确率分别达到100%和99.75%;测试集中也仅有1个正常轴承被误识别为内圈故障,总体分类准确率高达99.50%;充分验证了本文所建模型可以有效进行滚动轴承的故障识别,在面对不同工况下的故障轴承时具有很好的泛化能力。

4.3 网络模型对比分析

为进一步表现本文所提网络模型的性能优势,分别将CWRU轴承数据集和试验轴承数据集直接输入传统的DBN,SAE等网络模型,并将轴承数据经小波变换转换为时频图后输入AlexNet图像处理网络中,以及将轴承数据经短时傅里叶变换转换为时频图再送入深度残差网络(STFT-DRNN模型),各网络模型的对比结果如图13和表5所示(准确率及时间均取10次训练平均值)。

表5 不同网络模型性能对比表

上述5种网络模型对于CWRU轴承数据集的分类准确率均较高,但对于不同工况,不同试验条件下采集的试验轴承数据,小波+AlexNet以及 DBN,SAE网络模型的表现不佳,准确率并不高。本文所建模型以及STFT+DRNN模型在面对不同工况轴承数据时均表现良好,但本文所建模型使用Involution大大减小了网络模型的参数量,模型训练时间仅为STFT+DRNN模型的9.50%左右,更适用于工程应用中的在线故障检测。

5 结束语

建立了一种用于滚动轴承故障诊断的Involution卷积神经网络模型,小波变换得到的时频图可以很好地保留原始轴承振动信号的故障特征,将Involution引入常规卷积神经网络可以简化模型训练参数,提高模型训练速度,并通过自适应改变的卷积核提高模型的故障识别准确率以及面对不同工况时的泛化能力,相对于DBN,SAE,小波+AlexNet以及STFT+DRNN等模型,本文所建模型更适用于实际应用工况。

猜你喜欢

时频轴承准确率
异步立式感应电机轴承系统设计
高阶时频变换理论与应用
无轴承电机的结构设计
分数阶傅里叶变换改进算法在时频分析中的应用
泵用电机水润滑轴承选择与应用
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
高聚焦时频分析算法研究