APP下载

基于BAS优化堆栈稀疏自编码器的轴承故障诊断

2023-01-05孙太华曹昆明

关键词:惩罚轴承故障诊断

张 磊, 陈 剑, 孙太华, 曹昆明, 阚 东, 程 明

(1.合肥工业大学 噪声振动工程研究所,安徽 合肥 230009; 2.安徽省汽车NVH技术研究中心,安徽 合肥 230009)

滚动轴承在工业领域应用广泛,是旋转机械中极易损坏的关键部件之一,在高速重载长时间恶劣的工作环境下容易发生疲劳和故障,从而影响整个设备的安全稳定运行[1]。相关调查资料表明,约30%的旋转机械设备故障是由滚动轴承损坏产生的。一旦发生故障,轻则影响工业正常生产,重则造成巨大的经济损失甚至人员伤亡。因此,对滚动轴承进行准确、高效的故障诊断具有极其重要的意义[2]。

振动信号是机械设备运行状态的重要载体,如何从复杂的振动信号中提取有价值的特征信息用来评估设备的健康状况一直是故障诊断领域研究的重点。随着人工智能的兴起,智能故障诊断算法在故障诊断领域起着越来越重要的作用。智能故障诊断具有自学习功能、自动获取特征信息、对故障进行实时诊断的能力,并以灵活的诊断策略对监测对象的运行状态和故障做出智能判断和决策[3]。文献[4]将振动信号进行集合经验模态分解,以固有模态函数(intrinsic mode function,IMF)的置换熵作为特征输入,利用特征空间中簇间距离优化的支持向量机(support vector machine,SVM)实现对轴承的故障诊断分类;文献[5]使用经验模态分解对齿轮减速器振动信号进行人工特征提取,训练多类换能器SVM实现对齿轮减速器的故障诊断;文献[6]对轴承振动信号进行精细复合多尺度散布熵的多尺度分析,以精细复合多尺度散布熵值为特征向量,利用SVM实现对滚动轴承的诊断。上述机器学习方法虽然能够根据人工提取的特征识别轴承故障类型,但是浅层结构存在一定的局限性,限制了从输入中学习更高级、更抽象信息的能力。文献[7]提出深度学习理论,对原型自编码器网络进行改进,解决了深层神经网络的训练难题,使其能够从原始数据中获取更为本质、更加抽象的特征[8]。作为一种典型的深度学习网络模型,堆栈稀疏自编码器(stacked sparse autoencoder,SSAE)在故障诊断领域取得良好的识别效果。文献[9]将S变换时频分析提取的特征输入到SSAE网络,实现了对轴承不同部位、不同损伤程度的故障诊断;文献[10]利用Teager能量算子将信号解调后的TCO频谱作为稀疏自编码器(sparse autoencoder, SAE)的预处理方法,对在变转速和变载荷情况下的轴承进行故障诊断;文献[11]使用Dropout技术对深层SAE网络加以改进优化,实现了对电子电路故障模式的自动识别分类;文献[12]提出一种基于总体平均经验模态分解和SSAE的方法,用于滚动轴承故障的诊断。上述方法虽然可以起到较好的故障诊断效果,但都需要经过繁琐的手工调参和对比分析工作才能确定网络超参数,既增加了工作量,又难以确定最优神经网络模型所需要的最优参数。

本文提出一种基于天牛须搜索(beetle antennae search,BAS)优化SSAE的可自适应选取网络稀疏惩罚因子的深度学习分类模型故障诊断方法用于轴承故障诊断分类。首先,将滚动轴承声振信号时域、频域和变分模态分解(variational mode decomposition,VMD)得到的IMF特征作为神经网络的输入,同时引入BAS算法对神经网络的稀疏惩罚因子进行自适应选取以获得理想的分类模型;其次,通过Softmax分类层实现对滚动轴承的故障诊断分类。实验结果表明,该深度学习方法具有很好的轴承诊断分类效果。

1 基本理论

1.1 自编码器

自编码器(autoencoder,AE)[13]是一种简单的3层无监督学习神经网络,其结构如图1所示,它由输入层、隐藏层和输出层组成。

图1 自编码器网络结构

数据从输入层到隐藏层的映射过程称为编码,从隐藏层映射到输出层的过程称为解码。在编解码过程中,利用重构误差函数使得输出层数据等于输入层数据。

假设给定输入数据X=(x1,x2,…,xN),其中N为样本个数,将输入数据通过非线性激活函数s()映射到隐含层,即

(1)

(2)

其中:x为原始数据的特征表达;W1、W2为权重;b1、b2为偏置。激活函数s()均采用sigmoid函数,定义为:

(3)

采用均方差函数(mean square error,MSE)作为自编码器的损失函数,则重构误差定义为:

(4)

为防止特征过多导致过拟合问题,在损失函数中加入L2正则化项以提高模型的泛化性能,则总损失函数定义为:

(5)

1.2 SAE

稀疏自编码器SAE[14]是基于AE在隐含层神经元加入系数约束,即在自编码器的目标函数上加上稀疏惩罚项。SAE可以学习原始数据中更抽象和更有代表性的压缩特征,它提高了传统自编码器的性能,并显示出更实际的应用价值。

(6)

选择KL(Kullback-Leibler)散度对网络进行稀疏限制,惩罚因子可以定义为:

(7)

其中:D为隐藏层神经元的个数;ρ为稀疏性系数,是人工给定的接近0的值。SAE总的损失函数为:

Jsparse(W,b)=J(W,b)+βKL(ρ||ρk)

(8)

其中,β为稀疏惩罚因子,用于控制第1个重构项与第2个惩罚项之间的相对性。

1.3 SSAE

堆栈稀疏自编码器SSAE是由多个SAE串联堆叠而成。作为一种典型的深度学习模型,SSAE能有效地解决特征冗余、高维特征的问题,同时SSAE还具有非线性表达能力强和泛化能力强等优点[15]。

SSAE通过多个非线性隐含层对输入特征重新学习获得高级特征,使用反向传播算法最小化损失函数来挖掘更深层、更具代表性的特征,最后通过连接在顶层的Softmax分类层实现故障的分类。

1.4 深度神经网络的构建

本文提出一种3层SAE和Softmax分类层来构建SSAE深度神经网络分类模型。通过逐层贪婪无监督学习的方式对网络进行预训练,即先预训练SAE1,将其隐藏层输出的特征作为SAE2的输入数据;然后对SAE2进行预训练,将SAE2隐藏层输出的特征作为SAE3的输入数据;最后将SAE3隐藏层的输出特征作为Softmax分类层的输入来实现故障分类。深度神经网络的结构如图2所示。

图2 SSAE-softmax深度神经网络结构

由(8)式SAE总的损失函数可知,SSAE网络的输出主要取决于训练样本和稀疏惩罚因子β,则SSAE神经网络的输出向量可表示为:

Y=f(X,βn)

(9)

其中:X为给定的输入向量;βn(n=1,2,3)为每一层SAE的稀疏惩罚因子β1、β2、β3。

经过逐层贪婪预训练后,此时分类模型输出向量Pi为:

(10)

其中,Pi为输入向量X隶属于类别i(i=1,2,…,K)的概率。

为找到SSAE网络最优的稀疏惩罚因子βn,将验证集的预测输出和对应的类别标签之间的均方误差值(EMS)作为评价模型分类效果的指标。

(11)

其中:N为验证集中数据的个数;K为类别数;P(βn)为在给定参数βn下验证集的预测输出;l为验证集的类别标签。

以P(βn)为自变量,EMS为目标函数,建立SSAE分类模型参数寻优数学模型。该数学模型的数学表达式为:

(12)

其中:约束条件为给定的自变量取值范围。数学模型的本质是求解目标函数在最小值处对应的自变量的值。

1.5 BAS优化算法

天牛须搜索BAS[16]又名甲壳虫须搜索,是一种高效的智能优化算法,可用于多目标函数优化等问题,具有计算参数少、运算量小、收敛速度快、全局寻优等特点。其算法原理为:天牛在觅食时,会根据左、右两须接收食物气味的强弱来判断食物的位置;如果左须接收的食物气味大于右须,那么天牛便会向左移动,反之向右移动。根据这一简单的原理,天牛便可获得食物。这里食物气味的强弱可作为适应度函数f(x)。

BAS算法具体步骤如下:

假设天牛在第t次搜索食物后质心空间位置为xt;天牛左、右两须之间的距离d与天牛步长s之比为一常数c,即d=cs;天牛在每一次搜索后头的朝向都是随机的,用随机向量r=rands(n,1)来表示,其中,n为位置x的维度,并用下式对r做归一化处理,即

(13)

天牛左、右两须质点空间位置分别用xl、xr表示:

(14)

(15)

开始搜索时,为避免落入局部最优值点,天牛步长s的值应大一些,随着搜索次数的增加,s的值应逐渐减小,以保证能获得最优解。

根据适用度函数计算出天牛左、右两须接收食物的气味浓度f(xr)、f(xl),通过下式迭代更新天牛的质心空间位置,即

xt+1=xt+sthsign(f(xr)-f(xl))

(16)

其中:sign()为符号函数;s的值随着迭代次数的增加而逐渐减小,即

st=0.98st-1

(17)

1.6 BAS算法优化深度神经网络分类模型

使用BAS优化算法对深度神经网络故障分类模型稀疏惩罚因子进行寻优。具体过程如下:

(1)建立深度神经网络数学模型。

(3)通过归一化随机搜索方向h计算天牛左、右两须质心的空间坐标xl和xr,其中xl=(β1l,β2l,β3l),xr=(β1r,β2r,β3r)。

(4)以(11)式的结果作为BAS优化算法的适应度值,即fitness值为EMS。将上一步计算得到的xl、xr作为SSAE的稀疏惩罚因子,同时使用训练集对深度神经网络模型进行训练,并用验证集计算BAS优化算法的fitness。

(5)根据(16)式、(17)式对天牛的位置x进行更新。

(6)重复步骤(3)~步骤(5),迭代循环20次,搜寻SSAE的最优稀疏惩罚因子。

(7)以最优稀疏惩罚因子建立深度神经网络分类模型。

2 试验验证

2.1 轴承数据采集

采用合肥工业大学航空发动机主轴轴承试验机对不同类别故障轴承进行试验。试验平台的布置如图3所示。

图3 轴承信号采集试验装置

试验使用PCB三向加速度传感器,通过LMS Test.Lab软件中的Signature Acquisition模块对故障轴承振动信号进行数据采集,采样频率设置为20 480 Hz。

为得到滚动轴承不同的故障类型数据,对轴承进行不同损伤点的加工:内圈采用激光加工;外圈和滚子采用线切割加工。加工出的轴承不同位置故障实际效果图如图4所示。其中,图4c和图4d中的轴承类型分别为NU1010EM型和N1010EM型。

图4 轴承不同位置故障实际效果图

根据轴承损伤位置和损伤程度的不同,现将轴承试验数据分为9类故障类型。采用one-hot编码构建不同故障种类的类别标签。9类轴承故障具体参数描述见表1所列。

表1 滚动轴承故障类型及参数

根据轴承转速和施加载荷的不同,将采集到的轴承振动信号分为8种工况,各工况的描述见表2所列。

表2 工况参数

2.2 数据集构建

按上述8种工况类别划分并构建样本集:将PCB三向加速度传感器y通道采集的轴承数据划分为300个样本,每个样本2 048个采样点。将样本集分别进行时域、频域和变分模态分解VMD[17]后的IMF特征提取。

作为一种自适应信号处理方法,VMD在信号分解精度和噪声鲁棒性方面具有明显的优势[18]。对原始振动信号采用VMD进行自适应分解,得到多个IMF。通过计算各IMF的谱相关系数来确定分解层数k,具体方法如下:计算各IMF的谱相关系数ρ1,ρ2,…,ρk,其中,ρi(1

(17)

其中:|Pk|为原始信号傅里叶变换的模;|Q|为第k个IMF分量的傅里叶变换的模。

按照以下步骤构建数据集:

(1)统计滚动轴承各故障类别样本的10个时域特征,即均值、均方根值、方差、峰值、波峰因子、裕度因子、脉冲系数、形状系数、偏度和峭度。

(2)统计滚动轴承各故障类别样本的4个频域特征,即平均频率、重心频率、频率均方根、频率标准差。

(3)对滚动轴承各故障种类的样本进行VMD分解,分解层数k均为3,统计每个IMF的均值、均方根值、方差、峰值、波峰因子、裕度因子、脉冲系数、形状系数、偏度和峭度,得到由VMD分解的30个IMF分量特征。

(4)将上述获得的44个特征进行z-score标准化处理后作为深度神经网络模型的输入向量。

按照上述步骤依次对采集到的样本集数据进行处理,并将各工况下的数据集划分为训练集、验证集和测试集。

2.3 数据集的选取

随机抽取工况1、3、5、7中每种故障类型数据的70%作为训练集,20%作为验证集,10%作为测试集(记为测试集0)。训练集、验证集和测试集中的数据均不重复。分别随机抽取工况2、4、6、8中每种故障类型数据的10%、20%、30%、40%、50%、60%、70%、80%、90%、100%的数据构建10个不同样本量的测试集,将其分别记为测试集1~测试集10,用来验证构造的深度神经网络模型在不同载荷以及不同测试样本量下的故障诊断能力。

2.4 SSAE网络超参数的选取

本文提出一种3层SAE和Softmax分类层来构建深度神经网络分类模型。SSAE深度网络结构的参数设置见表3所列。SEA1、SEA2和SEA3的稀疏惩罚因子由BAS算法自适应选取。

表3 深度神经网络结构参数设置

2.5 试验结果

使用BAS算法对SSAE稀疏惩罚因子进行自适应选取,其迭代次数与模型验证误差的关系如图5所示。

由图5可知,迭代至15次时,模型验证误差便降到一个较低值,此时获得的稀疏惩罚因子最优组合为(4.17,4.13,6.46)。将得到的稀疏惩罚因子最优组合值代入神经网络中,用不同的测试集验证模型的故障诊断分类能力。

图5 验证误差与迭代次数的关系

用测试集0验证使用BAS算法自适应选取网络稀疏惩罚因子后得到的最优深度神经网络模型的故障诊断分类能力,结果如图6所示。

观察图6混淆矩阵可知,模型的预测准确率为98.9%,仅存在少量的第5类故障数据被划分到第8类故障类型中,这是由于第5类和第8类故障中都包含外圈故障点数据,在特征分类过程中出现少量的错误分类现象。上述结果表明:在平稳载荷下,该深度神经网络模型具有很好的故障诊断分类能力。

图6 平稳载荷下模型故障分类结果

使用测试集1~测试集10验证构造的深度神经网络模型在不同载荷以及不同测试样本量下故障诊断能力,结果如图7所示。

由图7可知,在不同载荷情况下,不同测试样本量的测试集分类准确率均高于98.0%,测试集2的分类准确率高达99.6%,测试集3和测试集5的分类准确率高达99.4%。该数据表明,通过BAS算法优化的深度神经网络模型在不同载荷和不同测试数据量下具有良好的故障诊断能力。

图7 不同测试集分类准确率

2.6 方法对比

为了验证使用BAS算法优化的深度神经网络模型的有效性,将提出的算法与随机参数SSAE模型、SAE模型以及传统智能诊断方法K最近邻(K-nearest neighbor,KNN)和SVM进行对比。使用训练集对上述网络进行训练,分别用测试集1~测试集10对训练好的模型进行验证。随机参数SSAE模型中除了稀疏惩罚因子使用随机参数外,其他参数设置均与本文所提出的模型一致。SAE模型的参数设置如下:隐藏层神经元数量设置为9,最大迭代次数设置为150次,L2正则化系数设置为0.002,稀疏性系数设置为0.3,系数惩罚因子采用随机参数,Softmax分类层最大迭代次数设置为100次;KNN中K值设置为2;SVM采用径向基函数(radial basis function,RBF)作为其核函数,核函数参数设置为0.3,惩罚因子设置为1.2。

故障分类结果如图10所示。10种测试集的平均分类准确率见表4所列。

表4 测试集平均分类准确率

由图8、表4可知,5种模型的分类准确率均在90%以上,其中最高分类准确率为99.6%(参数优化SSAE模型),最低分类准确率为90.2%(SAE模型),这表明本文提出的在时域、频域和IMF下特征提取方法有效,即通过以上特征提取方法可以很好地提取不同故障类型的特征。通过对比5种模型的分类准确率可知,深度神经网络模型(参数优化SSAE模型和随机参数SSAE模型)的故障分类准确率要高于其他浅层网络模型(SAE、KNN、SVM),但由于随机参数SSAE模型和SAE模型的稀疏惩罚因子均采用随机参数,导致2个模型在不同测试集下的分类准确率有一定的波动。

图8 不同算法分类准确率

综上说明,本文提出的采用BAS算法优化的深度神经网络模型在不同载荷以及不同测试数据量下具有良好的故障诊断能力。

3 结 论

本文提出了一种基于BAS优化SSAE的轴承故障诊断方法。通过试验分析和对比试验结果可知:

(1)利用时域、频域和IMF方法对轴承原始信号进行特征提取,可以保留原始数据中丰富的故障信息。

(2)通过BAS算法自适应地选取SSAE的稀疏惩罚因子,使建立的深度神经网络模型具有良好的轴承故障诊断分类效果。

(3)该模型不仅在平稳载荷下对滚动轴承具有很好的故障诊断分类能力,而且在时变非平稳性载荷以及不同测试数据量下仍具有较好的故障分类效果。

(4)相较于随机参数SSAE模型、SAE模型以及传统智能诊断方法KNN和SVM,本文所提方法在滚动轴承故障诊断方面具有更高的分类准确率。

猜你喜欢

惩罚轴承故障诊断
轴承知识
轴承知识
基于包络解调原理的低转速滚动轴承故障诊断
轴承知识
轴承知识
神的惩罚
Jokes笑话
数控机床电气系统的故障诊断与维修
基于量子万有引力搜索的SVM自驾故障诊断
真正的惩罚等