APP下载

改进注意力机制的航空发动机试验转子系统智能故障诊断

2024-03-02伍济钢

振动与冲击 2024年4期
关键词:注意力故障诊断航空

伍济钢, 文 港, 杨 康

(湖南科技大学 机械设备健康维护湖南省重点实验室,湖南 湘潭 411201)

航空发动机是飞机的核心动力装置[1],但是航空发动机的转子系统长期处在高压、高温、高载的工作状态,容易出现转子不平衡、转静碰摩、轴承损伤等故障,最终可能造成巨大的经济损失甚至是严重的人员伤亡事故,因此研究综合性能高的故障诊断方法是十分必要的[2-3]。故障特征的提取是故障诊断的前提,然而,由于航空发动机转子系统是一种结构高度复杂的动力装备[4],各种零部件之间复杂的耦合运动以及强噪声的干扰导致振动信号的关键特征信息十分隐蔽且难以提取。传统的故障诊断方法如短时傅里叶变换、小波变换、经验模态分解(empirical mode decomposition,EMD)和变分模态分解(variational mode decomposition,VMD)等变换方法或分解方法需要人工提取关键特征,对专家经验过于依赖,特征提取的效率较低,难以满足航空发动机故障诊断对高效率高精度的要求。

近些年,深度学习的方法逐渐应用于故障诊断领域并获得了很好的结果,基于深度学习的航空发动机故障诊断方法已经进行了许多研究。为了提高航空发动机轴承故障的诊断准确率,王奉涛等[5]通过核函数和去噪自动编码器的深度神经网络方法取得了较高的中介轴承故障诊断的准确率。针对传统故障诊断方法在样本缺乏条件下容易出现过拟合并且强噪声下航空发动机微弱故障特征难以提取的问题,王月等[6]提出了孪生减元注意力网络的故障诊断方法,方法在实际应用上取得了有效的结果。考虑到航空发动机结构复杂、干扰因素多、叶片裂纹特征提取困难,黄鑫等[7]提出了一种改进深度置信网络的特征提取和诊断方法,取得了较好的检测精度。

以上方法都能取得一定的检测效果,但是随着深度学习的发展,卷积神经网络(convolutional neural network,CNN)相较于以上方法有着更强的特征提取能力,更容易提取出航空发动机转子系统故障的关键特征信息,能够实现高精度高效率的故障诊断。王奉涛等[8]考虑到航空发动机中介轴承振动信号的非平稳性和非线性的特点,将原始信号进行灰度变换后导入CNN中进行故障诊断,该方法没有对CNN进行进一步改进。针对当前基于深度学习的航空发动机滚动轴承故障诊断技术诊断任务单一的问题,康玉祥等[9]将振动加速度的时域信号转变未频谱图后输入残差网络进行多任务故障诊断,该方法并未加强网络的特征提取能力。以航空发动机转子轴承为对象,李宏宇等[10]将原始信号进行包络解调预处理输入双向循环神经网络中,该方法的重点在数据预处理,未对网络进行进一步改进。考虑到航空发动机轴承实际工作下存在故障样本远远小于健康样本的情况,韩淞宇等[11]提出了提升神经网络的航空发动机高速轴承的故障诊断方法,该方法针对的是样本数据的问题,并未针对振动信号本身问题进行改进。以上CNN方法的应用对象皆是航空发动机转子系统,但这些方法没有考虑到航空发动机转子系统长期处于强振动的工作环境,其故障振动信号噪声干扰严重且关键特征隐蔽,并且忽略了航空发动机转子系统故障振动信号作为时序信号存在时间多尺度特征[12]。现有的这些航空发动机转子系统故障诊断方法对振动信号的关键特征提取能力不足。因此,本文提出了改进注意力机制的航空发动机转子系统智能故障诊断方法,引入了注意力机制加强网络的特征提取能力,但不同于田科位等[13-14]直接引注意力机制进行应用,本文充分考虑航空发动机转子系统故障原始振动信号的复杂性对注意力机制进行调整和改进。

1 理论基础

1.1 卷积神经网络

卷积神经网络主要包括:输入层,卷积层,池化层,全连接层,输出层,其核心的操作为,对输入的数据进行不同大小的卷积核进行卷积以获取不同感受野下的局部信息,卷积操作的优势在于参数共享和稀疏连接,能够在保证提取有效特征信息的同时网络结构拥有较少的参数量,网络的前向传播的简易式如式(1)和式(2)所示

y′=φ(ω*x+b)

(1)

g=y-y′

(2)

式中:y′为卷积后的输出值;x为输入值;ω为权重参数;b为偏重参数;*为卷积操作;φ为非线性激活函数,一般为relu函数或者是sigmoid函数;y为x对应的实际标签值;g为实际与卷积输出的差,通过该函数的求导对权重参数和偏重参数进行大小调整。

由于卷积网络的强大的非线性拟合能力,因此常常会出现过拟合的现象,因此一般卷积网络中还会添加批归一化(batch normalization,BN)层以及Dropout层防止网络的过拟合。

1.2 注意力机制

注意力机制模拟人的目光,对于较为明显的地方会给予更大的注意力[15]。目前,注意力机制主要包括空间注意力机制[16-17]和通道注意力机制[18-19]并且在图像领域已经取得了不错的效果,其基本结构为压缩激励模块构成的SENet,在CVPR2018上通道注意力机制cSENet、空间注意力机制sSENet以及通道空间混合注意力机制csSENet三种SENet的变体模块被陆续提出[20],文献[21]提出了结合空间注意力机制和通道注意力机制的cbam。该机制相对csSENet的改进点在于引入了全局最大池化结合全局平均池化作为输入的压缩方法,能够进一步提高对关键信息的提取能力,一维的最大池化和平均池化分别如式(3)和式(4)。

(3)

(4)

2 注意力机制改进

2.1 改进cSE模块

通道注意力机制模块cSE模块的结构如图1所示,该模块主要由压缩、降维、激励三部分组成。

以C×H×W的值为输入,cSE是将输入的值通过全局平均池化压缩成C×1×1的值,通过全连接层进行降维,再通过sigmoid进行激励变为评分值与输入值进行相乘,获得了不同分值的通道。

目前cSE模块是通过Global Average Pooling进行空间压缩,再通过sigmoid进行激励获得不同通道的评分实现不同通道给予不同的注意力。直接通过Global Average Pooling空间压缩的通道评分机制设计之初是针对图像检测领域,直接应用于航空发动机转子系统故障数据却是不合适的。航空发动机转子系统故障原始振动信号数据包括许多与局部最大值相关的特征,比如峰值、峰峰值等时域特征以及裕度因子和脉冲因子等波形特征[22],然而直接应用Global Average Pooling进行特征压缩考虑不到这些局部特征。一些十分重要的局部特征会因为全局平均池化同大部分次要特征进行平均,使得该通道评分过低而导致关键特征提取不到位。针对上述问题,提出了改进通道注意力机制icSE,icSE模块的结构图如图2所示。

图2 改进通道注意力机制模块icSE

考虑到振动信号的时域特征主要体现在幅值、周期、相位等特性上,如峰峰值、裕度因子等关键的时域特征需要一个周期内的最大幅值进行计算,为此将池化核设置为一个周期的长度,步长设置为一个周期长度的1/4,对时域特征进行针对性提取。本文转子系统转子转速为1 000 r/min,而采样频率为4 096 Hz,通过计算可知246个采样数据点为转子的一个周期,因此图2中Maxpooling和Average pooling两个局部池化采用的都是池化核为246,步长为61。本文采用局部池化结合全局平均池化的方法,在全局平均池化前添加局部最大池化,考虑到噪声的干扰可能导致局部最大值为异常值,采用局部平均池化的方法提取到局部平均值,将二者以通道数进行组合后进行全局平均池化压缩,这样既能提取到时域特征重要的最大值,又能避免异常值的存在导致错误的过高评分,并且还能提取到局部关键特征。以上是对航空发动机转子系统故障时域特征和波形特征进行的针对性设定,从理论上分析icSE能够更好的提取到航空发动机转子系统故障的通道特征信息。

2.2 改进sSE模块

空间注意力机制模块sSE模块如图3所示,该模块主要由压缩、激励两部分组成。以C×H×W的值为输入,sSE是将输入的值通过1×1的卷积方式压缩成1×H×W的值,再通过sigmoid进行激励变为评分值,最后与输入值进行相乘获得了不同分值的空间。目前空间注意力机制采用的都是单评分机制,以一维输入数据为例,通过1×1的卷积核对输入数值进行通道压缩,本质上就是将W上的所有位置进行通道压缩方向的总和。

图3 空间注意力机制模块sSE

sSE模块是通过1×1卷积方式进行压缩再通过sigmoid进行激励获得不同空间特征的评分实现不同空间特征给予不同的注意力,直接通过1×1卷积通道压缩的空间特征评分方式设计之初是针对图像检测领域,直接应用于航空发动机转子系统故障数据却是不合适的,因为两者是存在一定差异的。图像检测主要是对输入数据的空间特征进行处理,数据之间的关联性很弱,但是航空发动机转子系统故障振动信号是时序信号,数据的前后关联性较强,并且振动信号存在时间多尺度的特性,不同特征的重要性会体现在不同的空间区域,仅用1×1的卷积核难以确定一个空间特征的评分值。针对上述问题,本文参照多尺度模块的思想[23],提出了多评分机制将sSE模块改进为isSE,构建了如图4的isSE模块。

图4 改进空间注意力机制模块isSE

如图4所示,多评分机制将卷积核的设置分为四个尺度,卷积核为1是为了保留原sSE模块的功能,剩下三个尺度都是以输入数据的长度W进行卷积核的设置,分别设置为W/4、W/8、W/16,不同卷积核的压缩模块能够加强不同区域内数据之间的联系,能够抓取一个空间特征在不同区域的重要性,并且较大的感受野能够更好的把握一个关键空间特征与其他空间特征的关联性,从而根据某一特征在不同区域内的重要性赋予不同的评分值。以上改进是对航空发动机转子系统故障数据关联性强的特点和振动信号时间多尺度特性进行的针对性设定,从理论上分析isSE能够更好地提取到航空发动机转子系统故障的空间特征信息。

2.3 改进csSE模块

cSE和sSE有较好的互补性,csSE将二者结合能够同时对不同通道上的不同空间上的数值进行评分,从而能够更全面地提取关键特征信息,二者评分后的值进行叠加,获得了不同通道下的不同空间的评分值,csSE模块的组成方式如图5所示,而本文提出的改进csSE模块(icsSE)的组合方式则需要进一步的验证,主要包括方式一:先isSE后icSE,方式二:先icSE后isSE,方式三:icSE与isSE同时完成后进行融合。

图5 通道空间注意力机制模块csSE

3 试验对比分析

3.1 试验平台

本文试验平台为航空涡轴发动机转子系统模拟试验平台,该试验平台包括了轴流式压气机、离心式压气机和燃气涡轮转子等与实际航空发动机转子系统相似的结构。该试验平台是基于临界转速和振型相似原则设计的,其前3阶模态的临界转速与实际系统的临界转速值最大误差为3.5%。因此,该模拟试验平台的试验所得数据是可靠的,与实际航空发动机转子系统的结构状态比较接近。

本文针对航空发动机转子系统的转静碰摩、转子不平衡、碰摩-不平衡复合故障、正常工作状态四种类型进行故障诊断,图6为航空发动机转子系统故障模拟试验平台。数据采集装置为高精度的bk加速度振动传感器和适配的数据采集卡,转子的运行速度为1 000 r/min,对应实际航空发动机5 000 r/min的高速运动,略低于实际航空发动机转子系统一阶临界转速。采样频率为4 096 Hz,采样时间为5 min,采集的数据经过数据增强以及数据分割后获得的数据集如表1所示,数据长度为2 048。

表1 发动机转子试验数据集

图6 航空发动机转子故障试验台

数据的计算分析平台为戴尔Precision5820系列服务器,操作系统:Ubuntu 18.04LTS,显卡:RTX3060Ti*2,CPU:i9-10920X,显存:16GB*2,深度学习框架搭建:Keras。

3.2 试验对比分析

试验一:icsSE模块的组合方式需要进行确定,因此以航空发动机转子系统故障试验数据集为对象,对icsSE模块的不同组合方式进行试验对比分析。为了避免网络层数对检测结果带来的干扰,仅选用一层卷积层网络进行对比分析,注意力机制模块的验证通过在一层卷积层后面添加模块进行对比试验,该单一卷积层的网络结构如图7所示,最终检测结果如表2所示。

表2 icsSE模块不同组合方式检测结果

图7 注意力机制试验网络结构

分析试验一结果表2,对比检测准确率可知,icsSE组合方式三所构成的网络比组合方式一和组合方式二分别高了3.09%和1.76%,从这一结果确定本文所icsSE模块选择方式三进行组合,所得icsSE模块如图8所示。

图8 改进通道和空间注意力机制模块icsSE

试验二:为了证明注意力机制模块改进的可行性,将改进后的模块与改进前的模块进行对比试验分析,选取试验一中的图8卷积网络结构作为框架,分别构建了cSENet,sSENet,csSENet,icSENet,isSENet,icsSENet,cbam-Net共8个网络,最终的检测结果如表3所示。

表3 网络检测结果

分析试验二的检测结果表3,对比检测结果可知,icSENet相较于cSENet的检测准确率和精确率平均高了4.21%和6.47%,试验数据表明本文以局部池化改进的icSENet相比原本的cSENet能够更好地提取通道特征信息。isSENet相较于sSENet的检测准确率和精确率平均高了8.26%和6.07%,表明本文以多评分机制改进的isSENet相比原本的cSENet能够更好的提取数据的空间特征信息。icsSENet相较于csSENet的检测准确率和精确率平均高了11.1%和1.13%,并且icsSENet相较于cbam-Net的检测准确率和精确率平均高了44.27%和8.97%。

综上试验,以多评分机制为改进的isSE能够更好地帮助CNN对不同空间的特征进行提取,证明了多评分机制改进sSE的合理性。以局部池化为改进的icSE能够更好的帮助CNN对不同通道中的特征进行提取,证明了通过局部池化改进cSE的合理性,以上两者结合的icsSENet相较于csSENet和cbam-Net获得了更好的检测性能,证明了本文改进方法优越的检测性能。

试验三:本文采用的航空发动机转子系统智能故障诊断方法的基本网络为一维卷积神经网络(1DCNN),搭建了四层的1DCNN网络框架,为了得到具有更好检测性能的1DCNN,对注意力机制的添加方式进行试验对比,注意力机制的添加位置为总的四层卷积层中后三层卷积层输出位置,添加方式的布置和检测结果如表4所示,其中序号代表第几层卷积层的输出位置。

表4 注意力机制不同位置的检测结果

试验三的结果表4表明,第四种注意力机制的添加方式相较于其他三种注意力机制的添加方式最终获得的检测准确率分别高了1.17%、3.35%、1.58%,因此第四种插入位置方式构建本文的icsSE-1DCNN,其结构如图9所示。

图9 一维卷积神经网络结构图

为了检测icsSE-1DCNN模型迭代过程中的性能,以航空发动机转子系统故障试验数据集为对象对其进行性能测试,该模型的各个性能检测指标随迭代次数的变化如图10所示,图中性能指标Accuracy,Precision,Recall在多次迭代后能够稳定在96%至100%,证明了以航空发动机转子系统故障为检测对象时,icsSENet-1DCNN优秀的检测性能。

图10 测试得模型迭代结果

试验四:为了证明icsSE-1DCNN相较于其他方法更加优秀的综合性能,将icsSE-1DCNN同csSE-1DCNN、1DCNN、文献[24]、文献[25]方法进行对比分析,其检测性能通过试验检测准确率分析,结果如表5所示。

表5 网络检测结果

由表5的准确率检测准确率对比分析可知,icsSE-1DCNN比csSE-1DCNN和1DCNN分别高了2.84%和3.35%,结果进一步证明了本文改进方法的可靠性。同时icsSE-1DCNN相较于应用cbam方法的文献[24]和文献[25]准确率分别高了10.66%和7.51%,这证明了在对航空发动机转子系统故障进行诊断时icsSE-1DCNN相较于其他网络优越的检测性能。

为了更直观地证明icsSE-1DCNN相较于其他算法优越的分类能力,对icsSE-1DCNN、Paper[24]、Paper[25]网络算法进行T-SNE可视化,结果如图11所示。

图11 T-SNE可视化结果

分析图11可知,经过icsSE-1DCNN的特征提取后,航空发动机转子系统不同的故障之间的分界线比较明显,不同故障之间的数据混淆十分稀少,而文献[24]和[25]算法特征提取后,各个故障之间的混淆依然十分的严重,这直观地证明了icsSE-1DCNN对航空发动机转子系统故障更优秀的分类能力。为了证明icsSE-1DCNN相较于其他算法优越的泛化性能,本文以近似泛化误差[26]作为网络模型泛化性评价指标,其结果如图12所示。

图12 网络模型的泛化误差迭代图

由图12可知,从图中能够明显的看出icsSE-1DCNN模型的泛化误差初始较高,但是随着迭代次数的增强,其泛化误差明显减少,最后稳定收敛逼近0,而文献[24]和文献[25]到迭代结束时仍存在较高的泛化误差,这一结果证明,在进行航空发动机转子系统故障诊断时本文构建的icsSE-1DCNN模型比其他方法网络模型有更强泛化性。

综上,通过试验四的算法对比分析,能够充分的证明在对航空发动机转子系统进行故障诊断时,本文icsSE-1DCNN相较于其他算法有更优秀的检测性能、分类能力以及泛化性能,因此本文算法的综合性能更强。

试验五:为了证明icsSE的引入能够一定程度上加强1DCNN的抗噪性能,往航空发动机转子系统故障数据集中添加不同程度信噪比的随机噪声,并将icsSE-1DCNN同1DCNN进行对比分析,其检测结果如表6所示。

表6 不同噪声下的测试准确率

分析试验五的结果表6,比较SNR0以及SNR2到SNR10的平均值Mean(SNR2~SNR10)可知1DCNN的检测准确率下降了2.91%,但icsSE-1DCNN的检测准确率仅下降了2.16%,这证明了本文改进方法能够提高网络的抗噪能力,并且添加了icsSE后的icsSE-1DCNN在不同程度的噪声干扰下都能获得较好的检测结果,该试验成功证明了本文改进的icsSE能有效提高1DCNN的抗噪性,并且在不同噪声下都能取得较好的检测结果。

试验六:为了进一步验证本文算法在转子系统上优秀的性能,本试验对转子系统上滚动轴承的故障进行诊断,选用美国凯斯西楚大学CWRU的滚动轴承故障数据集[27]和印度圣朗格瓦尔工程技术学院SLIET的滚动轴承故障数据集[28]进行icsSE-1DCNN的试验研究,其数据组成如表7所示。考虑到icSE池化核的设置,通过对采集到的数据集进行下采样保证其一个周期包含246个采样数据点。滚动轴承故障数据集的采样参数如表8所示,滚动轴承各故障的特征频率如表9所示。

表7 CWRU和SLIET数据集

表8 滚动轴承数据的采样参数

表9 滚动轴承故障信号频率

由表7可知,滚动轴承数据集包含四种故障类型,总共包含了十个故障标签。由表8可知,考虑到本文对卷积核大小的设计,需要将一个周期包含的数据点控制在246,而原来一个周期对应的数据点分别为365和2 049,因此需要对其进行下采样。下采样的频率由转子工作的基频和现采样数据点进行计算,最后确定的采样频率分别为8 085 Hz和8 405 Hz。综合表9对该采样频率大小进行可行性分析,由表9可知,各个故障特征频率最大为316.3 Hz,当采样频率大于其工作频率2倍即可很好的进行采集,现下采样频率达到了故障频率的十几倍,因此该下采样频率能很好地将轴承故障特征信号采样进来。

试验六中CWRU和SLIET的测试准确率分别为100%和99.73%,其训练的迭代过程如图13所示。

图13 数据集的训练过程图

由试验五的图13可知,本文的icsSE-1DCNN在应用于转子系统的滚动轴承故障诊断时同样能够实现快速的迭代收敛,在20次迭代之内准确率能够迅速逼近100%并且达到一个稳定收敛的程度,而最终在不同数据集下获得的100%以及99.73%的检测准确率,进一步证明了icsSE-1DCNN优秀的检测性能。

4 结 论

本文以航空发动机转子系统的不平衡和碰摩等故障为对象基于1DCNN方法进行智能诊断,为了加强网络的特征提取能力,针对航空发动机转子故障振动信号特点引入并改进了注意力机制模块,实现了准确的航空发动机故障分类,结论如下:

(1) 引入cSE模块到CNN进行故障诊断时,采用的全局平均池化,缺乏对航空发动机转子系统故障振动信号中与局部极值相关的时域特征和波形特征的考虑,导致模型对通道特征信息提取不足,最终检测结果欠佳,本文研究证明了局部池化的引入能够有效改善这一问题。

(2) 引入sSE模块到CNN进行故障诊断时,采用的单一尺度压缩模块进行了单一尺度的评分,缺乏对航空发动机转子系统故障振动信号作为时序信号存在时间多尺度特性的考虑,导致模型对空间特征信息的提取不足,最终检测效果欠佳,本文研究证明了将单一尺度压缩模块改成多尺度压缩模块实现多评分机制能够有效改善这一问题。

(3) 本文充分考虑了航空发动机转子系统故障振动信号的特点,提出了icsSE模块,研究了icSE模块和isSE模块最佳组合方式,最终构建了icsSE-1DCNN。

(4) 相比于现有算法,icsSE-1DCNN能够取得更高的检测准确率,并且在不同噪声的环境下检测性能更高,证明了其优秀的抗噪性能。通过泛化误差和T-SNE可视化还充分证明了其优秀的泛化性能和分类能力,最后通过不同数据集的验证进一步证明了icsSE-1DCNN优秀的综合性能。

(5) 综上,本文算法在进行航空发动机转子系统故障进行诊断时能够表现出更优秀的综合性能原因在于:当需要加强1DCNN对航空发动机转子系统故障关键特征的提取能力时,没有将现有csSE模块进行直接引入应用。而是充分地考虑航空发动机转子系统故障振动信号本身特点,对csSE模块进行改进和组合方式等研究,通过试验证明了csSE模块改进方法的合理性和可靠性。

本文方法考虑了航空发动机转子系统振动信号本身的特点和复杂性,对注意力机制进行了引入、调整、改进三个步骤,构建了能够准确对航空发动机转子系统进行智能故障诊断的icsSE-1DCNN,并进行了严谨的试验验证,对于航空发动机的故障诊断有着充足的实际应用价值,对于智能故障诊断方法起着重要的推进作用。

猜你喜欢

注意力故障诊断航空
让注意力“飞”回来
“闪电航空”来啦
“闪电航空”来啦
“扬眼”APP:让注意力“变现”
A Beautiful Way Of Looking At Things
因果图定性分析法及其在故障诊断中的应用
达美航空的重生之路
一战航空百年回眸
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断