APP下载

基于两种改进RedNet的滚动轴承故障诊断方法研究

2024-03-13郑直单思然曾魁魁王志军朱勇

机床与液压 2024年4期
关键词:网络结构故障诊断卷积

郑直,单思然,曾魁魁,王志军,朱勇

(1.华北理工大学机械工程学院,河北唐山 063210;2.江苏大学国家水泵及系统工程技术研究中心,江苏镇江 212013)

0 前言

在机械设备中,滚动轴承主要用于支承机械旋转体、减小轴系运转摩擦力,起到高精度回转传动作用[1],它已被广泛地应用在工程机械、航空航天、石油化工、船舶等重要国计民生领域。但其大多工作在高湿、高温、高速或重负载等恶劣环境,导致其故障率很高[2-4]。

目前,国内外很多学者利用卷积神经网络(Convolutional Neural Networks,CNN)对滚动轴承进行了故障诊断分析[5-11]。WANG等[5]提出了基于注意力机制的CNN任务诊断网络,并利用滚动轴承故障验证了方法的有效性。CAO等[6]提出了一种无监督域共享CNN,用于滚动轴承从恒转速到变转速的迁移学习故障诊断。SU等[7]提出了一种分层分支的CNN,在考虑噪声和工况变化条件下,实现了滚动轴承的故障诊断。XU等[8]为了有效地实时诊断滚动轴承故障,构建了一种基于在线传递的CNN诊断模型。CHEN等[9]为了提高滚动轴承故障诊断性能,提出了一种基于循环谱相干性二维映射表示和CNN相结合的故障诊断方法。PENG等[10]针对滚动轴承振动信号的高复杂性、强耦合性和低信噪比的特点,提出了一种新颖的多分支、多尺度的CNN。为了准确预测滚动轴承在不同失效行为下的剩余寿命,提出了一种可转移CNN来学习域不变特征[11]。

随着深度神经网络的深入研究,HOWARD等[12]在MobileNetV1基础上提出了MobileNetV3。MobileNetV3将CNN中的常规卷积替换为深度可分离卷积,大大减少了参数量;引入了线性瓶颈和反向残差结构,利用该结构处理后的低秩性质使层结构间的信息利用率更加高效。近期,国内外学者开始利用MobileNetV3对滚动轴承进行故障诊断[13-15]。针对提高滚动轴承故障特征的提取能力问题,YAO等[13]提出了一种基于蝴蝶变换的MobileNetV3故障诊断模型。YANG等[14]利用改进的MobileNetV3提取图像中裂纹的线性结构特征和灰度分布特征,并诊断它是否存在缺陷。针对滚动轴承的小样本问题,XUE等[15]提出了一种基于结构相似生成对抗网络和改进MobileNetv3的故障诊断方法。

2020年,LI等[16]提出了微分解卷积和新的动态激活函数,以此构建了MicroNet网络,并应用于图像分类、目标检测和人体姿态估计领域。它将卷积矩阵分解成低秩矩阵,以及将稀疏连通性整合到卷积中;通过最大化输入特征图和圆形通道位移之间的多次动态融合来提高非线性。由于其新颖性,国内外学者尚未将它应用于包括故障诊断等其他方面。

2021年,LI等[17]提出了Involution核,并基于此构建了RedNet网络,应用于图像识别领域。基于通道共享可使Involution核在不同空间位置共享权值,也不会导致参数量和计算量的显著增长;空间特异性能够在不同空间位置上保证信息共享和迁移。因此,Involution核相较卷积核能够获取更好的性能表现。由于此方法的新颖性,RedNet尚未得到其他方面的应用研究。

分析传统的RedNet应用于滚动轴承故障诊断,发现RedNet自带的余弦退火算法易陷入局部极小值,出现过拟合现象,导致诊断精度过低。

因此,本文作者利用MobileNetV3和MicroNet分别对RedNet进行改进处理,提出MobileNetV3-RedNet和MicroNet-RedNet新型网络。通过滚动轴承的内圈、外圈和滚动体实测故障实验验证所提方法的有效性。

1 RedNet网络

LI等[17]提出了Involution核,通过它替代ResNet网络的部分传统卷积,进而构建了RedNet网络。其通道特异性可使通道共享,减少大量参数、降低通道维度冗余;其空间特异性可动态调整核尺寸,自适应地提取更多特征信息。

1.1 Involution核

利用Involution核对输入进行处理,得到输出特征映射为

(1)

其中:(i,j)表示像素位置;k为通道编号;表示Involution卷积核,∈RH×W×K×K×G;X表示输入特征张量;H、W分别表示X的高度、宽度,K×K为卷积核大小;ΔK={-[K/2],…,[K/2]}×{-[K/2],…,[K/2]},为对像素进行卷积的邻域偏移量集合。

与传统卷积核不同,Involution核和输入特征张量X在空间维度上能够自动对齐。单个像素Xi,j基于核生成函数φ,经如下变换得到Involution核i,j:

(2)

其中:W0∈RC/r×C和W1∈R(K×K×G)×C/r代表2个线性变换矩阵;r为通道缩减比率;δ表示ReLU激活函数。

Involution核的形成过程(G=1)如图1所示。

图1 Involution核示意

在图1中,第一步,基于像素位置(i,j),运用核生成函数φ生成Involution核,之后进行通道到空间的重排列;第二步,Involution核的乘加运算分解为2个步骤,将(i,j)邻域的特征向量进行图1中的乘加运算得到特征图,⊗表示跨C个信道传播的乘法运算,⨁表示在空间邻域内聚合的求和运算。

1.2 基于Involution核的RedNet网络

为了构建具有Involution核的RedNet网络,通过堆叠剩余模块来模仿ResNet网络结构。在ResNet的所有瓶颈位置用Involution核替换掉原来的3×3卷核积,但保留所有1×1卷积核用于通道投影和融合。经过调整后,形成了一种新的高性能神经网络模型,称为RedNet网络。RedNet网络结构如图2所示。

图2 RedNet网络结构

在RedNet网络中,信道空间、空间单独和信道单独交互交替且独立地作用于信息传播流,协同促进网络架构的高效化,同时确保特征提取能力。

2 MicroNet网络

LI等[16]提出了微分解卷积核和Dynamic Shift-Max动态激活函数,并在此基础上构建了MicroNet网络。在不降低网络宽度的情况下,微分解卷积核可降低网络节点间的连通性,进而剔除冗余参数;Dynamic Shift-Max动态激活函数加强了由微分解卷积核创建的组之间的连接,可解决参数大幅度减少而导致的性能降低问题,进而提升精度。

2.1 微分解卷积核

微分解卷积核分为微分解逐点卷积核和微分解深度可分离卷积核。微分解卷积核将MobileNet系列网络中的逐点卷积核和深度可分离卷积核分解为低秩矩阵,从而使通道数和输入输出的连通性得到良好平衡。

微分解逐点卷积核:假设卷积核W具有相同的输入和输出通道数,它可分解为两组自适应卷积:

W=PΦQT

(3)

其中:组数G取决于通道C,W为C×C矩阵;Q为C×C/R矩阵,它将通道数压缩1/R;P为C×C/R矩阵,它将通道数扩展回C;Q和P均为包含G个块的对角矩阵;Φ为C/R×(C/R)排列矩阵。卷积示意如图3所示。

图3 Micro-Factorized pointwise convolution示意

微分解深度可分离卷积核:将k×k深度可分离卷积核分解为k×1传统卷积核与1×k传统卷积核,每个卷积核W大小为k×k,将其分解为k×1向量P和1×k向量QT,Φ为1的标量,如图4所示。

图4 Micro-Factorized depthwise convolution示意

2.2 Dynamic Shift-Max动态激活函数

和传统h-swish激活函数不同,Dynamic Shift-Max是动态激活函数,它通过最大化输入特征与其循环通道偏移之间的多重动态融合来增强非线性特征,且加强了微分解卷积创建的组之间的连接。

设输入x={xi}(i=1,…,C),将x分为G组,每组包含C/G维。x的循环偏移为xN(i)=x(i+N)modC,将维度循环偏移扩展到分组循环偏移,具体操作如下:

xC/G(i,j)=x(i+jC/G)modCj=0,…,G-1

(4)

其中:xC/G(i,j)对应第i维输入xi关于j分组的偏移,该激活函数将多个j分组偏移进行结合,遵循如下规则:

(5)

3 MobileNetV3网络

Google于2019年发布了新一代MobileNet系列网络的V3版本,即MobileNetV3。h-swish激活函数通常应用在网络结构的深层次处,且性能较ReLU激活函数优异,可降低应用成本、提升泛化能力;Squeeze-and-Excitation模块可将所有通道的全局空间信息压缩成一个通道描述符,之后完全捕获通道间依赖关系,进而可更好地了解全局特征,实现高质量特征提取[12]。

3.1 h-swish激活函数

为进一步提高网络精度,MobileNetV3引入了h-swish激活函数:

(6)

激活函数的改变会带来响应延迟,为此,仅在网络后半部分采用h-swish激活函数,前半部分仍采用ReLU激活函数。

3.2 Squeeze-and-Excitation模块

Squeeze-and-Excitation模块可将全局空间信息压缩到信道描述符中,进而捕获全局通道依赖性。

Squeeze操作:提出将全局空间信息压缩成一个通道信息。通过在空间维度W×H上收缩特征图U,可生成z∈RC,z的第c个元素可通过下式获得:

(7)

其中:uc(i,j)为U的局部特征图谱。

Excitation操作:利用Squeeze压缩后的通道信息,进行全局捕获通道依赖性。因此,执行一个简单的门机制,并使用Sigmoid函数激活:

s=Fex(z,W)=σ(g(z,W))=σ(W4δ(W3z))

(8)

其中:δ代表ReLU函数;W3∈RC/r×C和W4∈RC×C/r分别为降维层和升维层;r为降维系数。最终U通过激活函数的重新排列得到如下输出:

(9)

Squeeze-and-Excitation模块示意如图5所示。

图5 Squeeze-and-Excitation模块的示意

4 所提MicroNet-RedNet新型网络

RedNet网络自带余弦退火衰减算法用于动态调整学习率,易在训练中陷入局部最小值,出现过拟合现象,导致精度过低。

针对上述问题,文中利用MicroNet网络中的微分解卷积核和Dynamic Shift-Max动态激活函数对RedNet网络进行改进处理,提出MicroNet-RedNet新型网络。

具体改进步骤为:

(1)将图2中的第四堆叠层1×1卷积核替换为3×3卷积核,进而保证上述输出与微分解卷积的输入大小一致;

(2)在Involution核的表达式(2)中,利用W1与W0进行特征提取,激活函数δ用于非线性映射。为了进一步体现Involution核的思想,分别用微分解卷积代替实现W1和W0的功能,深度可分离卷积代替实现δ的功能。因此,加入微分解卷积层和深度可分离卷积层,从而可进一步剔除冗余参数、提高特征提取能力。

改进后,MicroNet-RedNet新型网络结构如图6所示。

图6 MicroNet-RedNet网络结构

5 所提MobileNetV3-RedNet新型网络

同样,针对RedNet网络存在的问题,文中也利用MobileNetV3网络中的h-swish激活函数和Squeeze-and-Excitation模块对RedNet网络进行改进处理,提出MobileNetV3-RedNet新型网络。

具体改进步骤为:

(1)将图2中第七堆叠层的ReLU激活函数替换为h-swish激活函数,进而可使h-swish激活函数在深层网络中发挥强提取能力。

(2)将图2中第六和七堆叠层之间,引入Squeeze-and-Excitation模块,可将全局空间信息压缩融合到一个通道中进行描述,完全捕获通道依赖关系,进而提升特征提取能力。

改进后,MobileNetV3-RedNet新型网络结构如图7所示。

图7 MobileNetV3-RedNet网络结构

6 滚动轴承实测故障诊断分析

6.1 实验台

文中基于凯斯西储大学的轴承故障诊断实验台进行实验验证。实验对象为SKF6250滚动轴承,故障形式为内圈故障、外圈故障和滚动体故障。电机转速为1 797 r/min,载荷为0 kW。用加速度传感器对电机驱动端进行数据采集,采样频率为48 kHz。

6.2 基于所提MicroNet-RedNet和所提MobileNetV3-RedNet的故障诊断分析

内圈、外圈和滚动体故障各有370个样本,其中每个样本的信号长度为324点。将70%样本作为训练集,剩余30%作为测试集。将预热率设为0.25、迭代终止次数设为300,在[1×10-5,7×10-5]内对学习率进行寻优,之后再以该最优学习率对预热率在[0.1,0.4]内进行细化寻优,进而保证找到各个网络的最优性能。寻优结果如图8—10所示。

图8 基于RedNet的故障诊断结果

图9 基于所提MobileNetV3-RedNet的故障诊断结果

图10 基于所提MicroNet-RedNet的故障诊断结果

基于图8—10的诊断结果,将其最优诊断结果在表1中进行展示,并将其和传统CNN进行了对比分析。

表1 最优诊断结果

由表1可知:

(1)所提MicroNet-RedNet和所提MobileNetV3-RedNet的最优诊断率分别为最高和次高,分别高达98.57%和93.81%;所提MicroNet-RedNet的最优诊断率分别较传统CNN、原算法RedNet、所提MobileNetV3-RedNet提高了34.6%、24.65%、5.07%;所提MobileNetV3-RedNet的最优诊断率分别较传统CNN、原算法RedNet提高了28.10%、18.63%;

(2)所提MicroNet-RedNet和所提MobileNetV3-RedNet达到最优诊断精度时,对应最优迭代步数分别为最少和次最少,分别低至93和242;所提MicroNet-RedNet的最优迭代步数分别较传统CNN、原算法RedNet、所提MobileNetV3-RedNet显著降低了67.82%、66.67%、61.57%。

7 结论

RedNet网络自带余弦退火衰减算法,在动态调整学习率时,容易陷入局部极小值,出现过拟合现象,导致诊断精度过低等。针对此问题,作者提出2种新型网络:(1)利用MicroNet网络的微分解卷积和Dynamic Shift-Max动态激活函数,对RedNet网络进行改进处理,提出MicroNet-RedNet新型网络;(2)利用MobileNetV3网络的h-swish激活函数和Squeeze-and-Excitation模块将RedNet网络进行改进处理,提出MobileNetV3-RedNet新型网络。通过分析滚动轴承实测故障,可得出如下结论:

(1)所提MicroNet-RedNet新型网络可有效诊断出滚动轴承故障,诊断精度高达98.57%,较传统CNN、原算法RedNet分别提高了34.6%、24.65%;

(2)同样,所提MobileNetV3-RedNet新型网络也可有效地诊断出滚动轴承故障,诊断精度高达93.81%,较传统CNN、原算法RedNet分别提高了28.10%、18.63%;

(3)所提MicroNet-RedNet新型网络相较所提MobileNetV3-RedNet新型网络更具有效性和优越性,前者最优诊断精度较后者高出5.07%;达到最优诊断精度时,前者的对应最优迭代步数较后者减少61.57%。

猜你喜欢

网络结构故障诊断卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
基于互信息的贝叶斯网络结构学习
知识网络结构维对于创新绩效的作用机制——远程创新搜寻的中介作用
沪港通下A+ H股票网络结构演化的实证分析
因果图定性分析法及其在故障诊断中的应用
复杂网络结构比对算法研究进展
一种基于卷积神经网络的性别识别方法
基于LCD和排列熵的滚动轴承故障诊断