APP下载

基于PEDCC性能退化指标及MCRNN的滚动轴承寿命状态识别方法

2023-01-03肖家丰董绍江汤宝平潘雪娇胡小林赵兴新

振动与冲击 2022年24期
关键词:轴承卷积样本

肖家丰, 董绍江,2, 汤宝平, 潘雪娇, 胡小林, 赵兴新

(1.重庆交通大学 机电与车辆工程学院,重庆 400074; 2.磁悬技术与磁浮列车教育部重点实验室,成都 610031;3.重庆大学 机械传动国家重点实验室,重庆 400044; 4.重庆工业大数据创新中心有限公司,重庆 404100;5.重庆长江轴承股份有限公式,重庆 401336)

滚动轴承是机械系统中的关键零部件之一,其运行状态对整个机械系统的安全性及可靠性具有决定性影响,一旦发生故障将造成难以估量的后果和损失。且其运行环境复杂,易受各种因素的影响,因此对滚动轴承进行状态检测和寿命识别研究极其重要。近年来对于轴承运行状态的检测和故障诊断主要通过数据驱动的方式,即对采集到的振动信号数据进行分析进而判断轴承的运行状态或者故障类型[1]。在轴承的状态检测或寿命识别领域中,主要面临着两大问题:①如何建立有效的性能退化指标;②如何建立有效的状态识别模型[2]。对于这两类问题,国内外学者都展开了不同程度的研究,并取得一定的成果。

Wang等[3]通过自组织映射得到原始特征的拓扑表示,即拓扑网络,然后利用拓扑网络的权值向量构建退化特征。Lü等[4]通过提取轴承的时域和频域指标,将其构成高维特征矩阵,之后对高维矩阵进行降维,将降维后的数据作为性能退化指标。Xu等[5]提出一种包络谐波噪声比(envelope harmonic-to-noise ratio, EHNR)的方法用于退化状态评估。Zhou等[6]提出一种小波包符号熵和支持向量数据描述的性能退化评估方法。Chegini等[7]利用数据经自相关函数运算后的极值点能量与熵结合提出一种自相关能量熵(energy-entropy auto-correlate function, EEACF)。然而这些方法大都需要对轴承的原始数据进行一定的频域、时频域、自适应分解等变换,这样的处理方式复杂,运算速度较慢,对于退化状态实时监测较为不利,且难以保证精度。传统时域指标,例如均方根、峰-峰值、裕度、峭度等虽然计算方便,速度快,但可能存在稳定性不足,容易造成提前报警等现象。

本文提出一种基于相空间欧式距离相关性(phase Euclidean distance cross-correlation, PEDCC)的方法用于检测滚动轴承的早期故障。首先根据相空间重构后数据间的距离差异性,计算欧式距离,并将其组成向量形式,之后计算样本间的向量相关性。由于只在原始信号中进行计算处理,方法便捷高效,且能有效监测早期故障点。

深度学习近些年被应用于各行各业,并且都取得一定成果,机械故障诊断及识别领域也不例外。对于轴承而言,无论是故障诊断还是状态识别,其本质问题都是对数据进行分类。目前对于大量数据的情况下,使用深度学习进行处理的方法备受关注。Che等[8]对于滚动轴承故障诊断,利用迁移学习中的域自适应方法,提出了一种域自适应深度置信网络。董绍江等[9]针对轴承运行状态中存在的噪声影响,提出了一种基于多层降噪技术和改进卷积神经网络的故障诊断法,可实现在噪声环境中进行故障识别。李恒等[10]提出了一种基于短时傅里叶变换和卷积神经网络的轴承故障诊断方法。

以上方法要么只在一个通道内对轴承特征进行提取,不能很好的反应出轴承的寿命状态;要么由于网络模型过深导致诊断速度较慢,不利于实时监测。因此本文提出一种多通道卷积长短时记忆网络(multichannel convolutional neural long short term memory network, MCRNN),只需要较浅的网络层就能有效识别轴承的寿命状态,并且具有较快的识别速度和较强的抗噪性能。

1 滚动轴承退化状态识别方法

1.1 性能退化评估

相空间重构可以将一维时间序列重构为多维时间序列,从多维序列中挖掘振动信号的非线性特征,在振动信号处理过程中发挥重要的作用[11]。对一维时间序列X=(x1,x2,x3,…,xn),将其重构为

(1)

式中,m,τ分别为重构维数和延迟时间,本文选择自相关函数法计算延迟时间,为提高指标计算速度,重构维数选一个较小值即可。重构相空间相点数N可以由式(2)计算。

N=n-(m-1)τ

(2)

两个n维向量(x11,x12,…,x1n), (x21,x22,…,x2n)之间的欧式距离可表示为

(3)

对一个时间序列样本重构后的N个时间序列分别计算相邻序列Xi,Xi+1的欧式距离di(i+1),并构成欧氏距离向量

D1=(d12,d23,…,d(N-1)N)

(4)

之后计算所有时间序列样本的欧式距离向量,并构成向量矩阵

(5)

互相关函数是描述两个不同时间序列X(t),Y(t)在不同时刻下t1,t2的取值之间的相关程度,其定义为

(6)

由于采集到的振动信号为离散数据,所以需要将式(6)转换为离散形式,即式(7),然后计算任一样本所构成的欧式距离向量Dk与正常样本构成的欧式距离向量Dz之间的相关性,将计算出的R值作为滚动轴承性能退化评估指标,记为PEDCC。

(7)

为了体现更一般性,取正常样本欧式距离向量的平均作为正常样本的欧式距离向量Dz。实际应用中正常样本数可以通过同工况和轴承型号的之前数据判断,或者观察早期样本的PEDCC指标,如果没有突变可以将其视为正常数据,本文选取前1/5样本为正常数据。在计算出所有样本的退化指标之后,需要通过设置阈值找到轴承初始退化起点。本文选取正常运行样本的平均值减去正常样本数据的k倍标准差作为阈值,如式(8)所示

γ=μ-kσ

(8)

切比雪夫不等式如式(9)所示。式中X为随机变量,可知当ε=3σ时,数据分布在平均数3个标准差范围内的概率为88.89%;当ε=5σ时,数据分布在平均数5个标准差范围内的概率为96%。可以将此范围内的数据视为正常数据,因此式(8)中的k一般可取3~5。

(9)

当PEDCC值低于γ时轴承已经开始退化或者出现早期故障。性能退化指标计算流程,如图1所示。

图1 PEDCC指标计算流程Fig.1 PEDCC indicator calculation process

1.2 状态识别模型

1.2.1 多通道卷积长短时记忆网络(MCRNN)

关于CNN(convolutional neural network)和LSTM(long short-term memory)网络的理论知识不再赘述,可参考文献[12]和文献[13]。本文在多通道卷积神经网络和长短时记忆网络基础上,提出一种新的多通道卷积长短时记忆网络模型(MCRNN),网络有3个并行的卷积层和LSTM层,两个全连接层和Softmax分类器组成,其模型结构如图2所示。首先用3个并行的卷积层分别对相同的数据进行特征提取,3个卷积层通道的激活函数分别为ReLU, LeakyReLU, ELU,并且每个通道内都采用不同尺寸的卷积核。然后将提取到的特征输入到LSTM进行进一步的时序特征提取。之后将3个通道提取到的特征进行融合,最后经全连接层后输入到分类器进行状态识别。

图2 MCRNN结构Fig.2 MCRNN structure

用3个并行的CNN和LSTM进行特征提取的主要原因是可以在每个卷积层通道中采用不同尺寸的卷积核和不同类型激活函数提取多种类特征,而3个LSTM层中采用不同数量的记忆体,可以提取出多种时序信息,便于后续的状态识别。

相比于She等[14]提出的多通道网络模型不同之处在于,MCRNN首先在各通道内输入相同数据,并在各卷积通道内使用不同激活函数,卷积核和池化核;其次引入了LSTM网络用于提取时序信息,最后在LSTM之后进行融合而不是在卷积层之后进行融合。

1.2.2 采用的激活函数

本文提出的网络模型采用3种激活函数,分别是ReLU,LeakyReLU和ELU。

常用的ReLU只要有一个阈值就可以得到激活值,函数式如式(10),由式(10)可知ReLU激活函数会有选择地屏蔽一定数量的神经元,可以使网络具有稀疏性,但同时也有可能造成神经元“坏死”现象,即某些有效数据的特征不能被提取。

(10)

LeakyReLU是对ReLU激活函数的一种改进,由式(11)可知,它相比于ReLU激活函数来说,避免了负半轴的死区现象,但同时也使得网络稀疏性降低,增加了参数之间的依赖性。

(11)

ELU的函数式如式(12)所示。同样,ELU激活函数相比于ReLU激活函数保留了负半轴的信息。

(12)

ReLU激活函数相比于其他两类激活函数,因为对于负半轴进行置零处理,所以保证了网络的稀疏性,防止了参数间的依赖性。LeakyReLU相比于ReLU避免了死区发生,相比于ELU具有更快的训练速度。ELU激活函数在负半轴上的形状与ReLU和LeakyReLU类似,同样能达到防止输出值方差过大时产生的梯度爆炸,最大的区别是前两者最大的区别是前两者负半轴都为线性,而ELU负半轴为非线性,因此会导致计算速度相比于前两者较慢。但是由于其是单侧饱和的,可以更好的收敛,并可以实现更高的准确性。

由分析可知3种激活函数各有其优势,在本文所提的MCRNN网络结构中,分别在3个通道内采用以上3种激活函数。

1.3 轴承性能退化状态识别过程

本文所提出的状态轴承状态寿命识别整体步骤主要有三部分。分别是计算退化指标、建立阈值进行状态划分和状态识别,如图3所示。其主要步骤如下:

步骤1对全寿命轴承数据依据式(1)~式(4)和式(7)分别计算出每个样本的性能退化指标。

步骤2依据式(8)计算轴承出现早期故障的阈值,以此来区分轴承是否为正常状态。并划分出轴承退化状态,然后对应到样本数据集。

步骤3将每种样本对应状态进行标签化,并将样本数据输入到MCRNN网络中进行模型训练,最后输入测试样本进行识别。

2 全寿命数据试验验证

本章分别选取了两类全寿命数据集,分别是由辛辛那提大学和西安交通大学[15]提供。利用这两类数据集验证所提轴承性能退化指标和所提状态识别网络的有效性和泛化性。

2.1 试验数据描述

(1)辛辛那提数据的采集试验台的一个轴上安装了4个轴承,采样频率为20 kHz,在轴承上施加了2721.55 kg的径向载荷。一共采集了3个试验数据集,每个试验数据集包含4个轴承的数据。采集第1次实验数据时轴承座上安装了两个加速度传感器,第2次试验数据集和第3次试验数据集的轴承只安装了一个加速度传感器。本文选用的数据为第2次实验的第1个轴承和第3次实验的第3个轴承。

图3 状态识别流程Fig.3 Status identification process

(2)西安交通大学全寿命数据集(XJTU-SY)采集过程分别设置了3种工况,每种工况下采集了5个轴承,一共15个,采样频率为25.6 kHz,采样间隔为1 min。分别在每个轴承的x轴和y轴安装加速度传感器,本文选用其中5个轴承的x轴数据。

2.2 性能退化指标(PEDCC)验证

选取辛辛那提第2次试验轴承1的数据和第3次试验轴承3的数据来对所提PEDCC指标进行验证及说明。用式(1)~式(4)和式(7)分别对两全寿命数据进行PEDCC指标计算,然后利用式(8)对计算的指标数据进行阈值划分,以确认退化起始点。其结果如图4和图5所示。内部为局部放大图。

图4 第2次试验轴承1的PEDCC指标Fig.4 PEDCC indicator of second test bearing 1

由图4可知第2次试验的轴承1从第533个样本处开始退化,在第533个样本之后,轴承PDECC曲线出现了不同程度的起伏,其原因主要在于轴承在出现轻微故障之后会发生自愈合现象,即当某一点出现微小缺陷之后,可能随着轴承的继续转动,其缺陷处会出现磨平现象。由图可知第2次试验的轴承1大致经历了5个阶段,分别是第1~第532个样本时的正常运行期、第533~第700个样本时的轻度退化期、第701~第825样本时的自愈合期、第826~第900个样本时的重度退化期和第900个样本之后的失效期。

图5 第3次试验轴承3的PDECC指标Fig.5 PEDCC indicator of third test bearing 3

由图5可知,第3次实验的轴承3大概可以分为4类运行状态,首先是第1~第5 966个样本的正常期;进入第5 967个样本之后曲线开始下降,期间有回升趋势,表明轴承发生了自愈合现象,在第6 071个样本之后,PEDCC曲线不再上升,所以可以将5 966~6 070划分为自愈合期;第6 071~6 162之间曲线在一定较低范围内,可划分为重度损坏期;第6 163样本之后曲线急剧下降,即已发生失效。

2.2.1 包络谱验证PEDCC指标有效性

包络谱分析相对于频谱分析,它在故障频率处的幅值更大,过滤不必要的频率干扰,对振动信号的冲击特征体现较为明显,尤其适用于轴承故障诊断领域,因此用包络谱分析来验证所提方法的有效性。辛辛那提两个轴承的包络谱分析结果,如图6和图7所示。

图6 第2次试验轴承1的包络谱分析Fig.6 Envelope spectrum analysis of second test bearing 1

图7 第3次试验轴承3的包络谱分析Fig.7 Envelope spectrum analysis of third test bearing 3

根据理论计算可得所测轴承的内外圈故障频率分别为296.9 Hz,236.4 Hz。由包络谱分析可知,第2次试验的轴承1在第532个样本的故障频率附近还没有峰值,而到了第533个样本的故障频率附近的231 Hz已经出现了明显的峰值。第700个样本时在其故障频率及2倍频,3倍频的峰值变得更加明显了,表明轴承已经发生了严重的故障。而第3次试验的轴承3在第5 966个样本的故障频率附近都没有明显的峰值。到了第5 967个样本,轴承在261 Hz已经出现了明显的峰值,表明轴承出现了早期的轻微故障,此时应为微小磨损,由于处于内外圈故障频率之间,故不能判断具体故障点。而在此之后由于PEDCC曲线出现了短暂的平稳期,说明此时轴承由于磨平出现了自愈合现象。对进入重度损坏期的第6 071个样本进行包络谱分析,此时在外圈故障频率附近的231 Hz,及其2倍频,3倍频已经出现了峰值,此时轴承已经重度损坏。之后对进入失效期的第6 162个样本的包络谱分析,可以看出,其故障频率的1倍频、2倍频、3倍频处有特别明显的峰值了,因此判断为重度失效期,分析结果与曲线吻合。

2.2.2 PEDCC指标与常用指标对比

为验证本文所提PEDCC指标有效性,将其与常用指标均方根、峭度、排列熵以及EHNR, EEACF等指标进行对比,将在正常运行时采集的数据判断为开始出现早期故障数据的行为称为提前报警,选用试验三轴承3的数据对以上指标进行验证对比,试验结果如表1所示。

表1 6种指标对比

由表1可知,均方根虽然能精准检测出早期故障点,但是却会出现误判行为,而排列熵虽然无误判行为,但是不能较早的检测出早期故障。其余指标不仅不能较早检测出故障,还会有误判行为,只有PEDCC指标不但能精准检测出早期故障,且不出现误判行为。

2.2.3 PEDCC指标泛化性能验证

选用XJTU-SY的5个轴承进行泛化性能验证,分别是第1类工况下的第2个和第5个轴承,第2类工况下的第1个轴承和第4个轴承,第3类工况下的第1个轴承,如图8所示。

图8 XJTU-SY的PEDCC指标曲线Fig.8 PEDCC indicator of XJTU-SY

由图8可知,第1类工况下轴承2的退化点在第36个样本,轴承5在第34个样本。第2类工况下轴承1的退化点在第451个样本,轴承4在第30个样本。第3类工况轴承1在第2 338个样本。且PEDCC曲线均在逐步下降,没有大幅度上下波动,表明随着运行时间增加,采集到的数据与正常数据的相关性越来越低,即是随着轴承运行,故障越来越严重,符合实际情况。以上试验证明了PEDCC指标在XJTU-SY数据中也能识别出轴承的早期故障,具有很好的泛化性。

2.3 状态识别网络(MRCNN)验证

为验证本文所提网络有效性,对辛辛那提第2次试验的轴承1进行退化状态划分,由2.2节可知,它的运行状态可分别划分为5种。为扩充故障样本数量以及防止样本间不平衡,采用重叠采样方式对试验二轴承1的每类状态分别在第1~第533,第534~第700,第701~第825,第826~第900,第901~第984样本中进行采样,如图9所示。每种状态采集700个样本,每类样本4 096个数据点,其中每个原始样本数据可采集为9~10个的网络输入样本数据。实际工程中可以根据已有的同工况下同类型轴承的全寿命数据计算出指标后划分状态,然后训练网络模型,最后利用训练好的模型对工程中实时采集到的数据进行寿命状态识别。

图9 寿命状态数据划分Fig.9 Lifestatedata division

所用模型参数,如表2所示。其中CNN部分采用VGG模块,每个VGG模块含有一个卷积层,一个池化层,一个激活层和一个Dropout层,卷积层及池化层大致参数参考Dong等的研究,并进行一定修改,第1个卷积核设置为较大尺寸能起到抗干扰作用[16]。与原始VGG相比不含有批标准化,因为对于轴承信号,将批标准化加入网络层,则会削弱冲击特征,对于提取故障特征不利。

表2 模型参数

表3 模型状态识别率

2.3.1 模型对比试验

为验证本文所提模型采用的多通道,多种类激活函数的优异型,将模型分别与单通道CNN,多通道相同激活函数进行对比。其中单通道CNN网络参数与通道一CNN层参数相同,多通道网络参数与表2相同,分别用1.2节所提的3种激活函数,试验结果如表4所示。其中模型A为单通道CNN,模型B为多通道ReLU激活函数模型,模型C为多通道LeakyReLU激活函数,模型D为多通道ELU激活函数。

表4 其他模型状态识别率

由表4可知,单通道CNN和多通道相同激活函数的网络模型状态识别率都比本文所提网络识别率低,在6种噪声环境下平均识别率相比于以上4个模型提高1~3个百分点,证明了MCRNN具有很好的性能。其中多通道相同激活函数网络相比于单通道CNN在不同噪声环境下都具有更高的识别率,表明使用不同卷积核提取特征对于轴承状态识别有益,因为单通道CNN只能提取出某一类特征,而不同卷积核能提取到更多的状态特征。并且单通道CNN和多通道单一激活函数网络随着噪声的加强,识别率下降速度更快,而本文所提MCRNN则下降较为缓慢,表明MCRNN具有一定的抗噪能力。MCRNN相比于单通道CNN和多通道网络在6种噪声环境下平均识别率上升2.53%和1.22%,尤其是在信噪比为0及以下的3种噪声环境中,识别率分别上升3.87%和1.53%。

最后再对多通道模型所选通道数的数量进行试验对比,分别加入2通道和4通道模型进行验证,其中2通道模型的参数选择3通道模型的前两个通道参数,4通道模型的第4个通道沿用第3个通道的参数,在第2次试验轴承1的数据中进行对比验证,选择信噪比为0的噪声环境。选择识别准确率及所用时间进行对比,试验环境为Intel(R) Core(TM) i5-5200U CPU,RAM-8G,操作系统Windows10。结果如表5所示。

表5 通道数对比试验

由表5可知,如果采用2个通道模型效果较差,4个通道最后识别率虽然和3通道模型相差不大,但是运行时间差距较大,因此实际工程中选择3个通道效果最好。

2.3.2 模型泛化性验证

为验证模型泛化性,将2.2节所提的剩余轴承试验数据进行状态划分。其中辛辛那提试验三轴承3划分为4种状态类型,每类状态同样采集700个样本,具体退化状态如2.2节所划分,记为数据集1。其次对于XJTU-SY数据集,由退化曲线可知测试样本与正常样本的相关性都是先保持一定范围内的平稳性后便一直下降,所以其状态都可划分为正常和故障两种状态,其划分方式及每个轴承采集的样本总量如表6所示。

表6 XJTU-SY数据集划分

为保证样本之间的平衡,对于每类样本仍使用的是重叠采样方式,分别对正常数据和故障数据采样相同数量的样本,其中每类样本数量是4 096个数据点。将轴承1-2, 1-5, 2-1, 2-4和3-1采集的样本数据依次记为数据集2~数据集6,按8 ∶2的比例随机划分为训练集和测试集,之后分别将其输入至MCRNN模型进行状态识别,并测试了不同噪声环境中的识别效果,试验结果如表7所示。

表7 其他数据集识别率

由表7可知,模型除了数据集1情况下识别率略低,在其他数据集都能较准确地识别出轴承状态,且在低信噪比下也依然具有很好的性能。值得注意的是由于XJTU-SY数据状态都划分为故障和正常两种状态,相当于二分类问题,此时MCRNN在信噪比为0时基本都可以达到100%的准确率。以上试验验证了MCRNN在不同数据集的泛化性和抗噪性能。

3 结 论

本文提出了一种新的滚动轴承寿命状态识别方法。主要有PEDCC指标和MCRNN模型两部分,用PEDCC指标对轴承运行状态进行评估,MCRNN对寿命状态进行识别。

(1) PEDCC指标可以直接提取原始数据特征,不需要进行频域,时频域变换。能够很好的检测出轴承的早期故障,相比于均方根,排列熵, EHNR, EEACF等指标具有更好的稳定性,并通过在其他数据集的试验证明了具有较强泛化性。

(2) MCRNN网络在状态识别上不仅具有较高的识别率,且具有较强的抗噪能力。验证结果表明不同尺寸卷积核和多种类型激活函数,相比于同尺寸卷积核和单类型激活函数具有较好特征提取能力。并验证了MCRNN网络具有较强的泛化能力。

(3)本文所提的网络模型是在同工况同类型轴承下进行状态识别,实际工程应用中需要预先知道同工况下同类型轴承的全寿命数据,而实际中可能存在此全寿命数据获取不便的情况,因此之后将增加对跨工况跨类型轴承的寿命状态识别研究。

猜你喜欢

轴承卷积样本
轴承知识
轴承知识
基于3D-Winograd的快速卷积算法设计及FPGA实现
轴承知识
轴承知识
用样本估计总体复习点拨
卷积神经网络的分析与设计
从滤波器理解卷积
规划·样本
基于傅里叶域卷积表示的目标跟踪算法