基于深度置信网络的旋转机械迁移故障诊断*

2022-02-28廖玉波李伟生刘文峰曹西鹤

机电工程 2022年2期

廖玉波,俞啸,李伟生,刘文峰,曹西鹤,董飞

(1.山东能源淄博矿业集团有限责任公司装备环保部,山东淄博 255000;2.中国矿业大学物联网(感知矿山)研究中心,江苏徐州 221008;3.内蒙古黄陶勒盖煤炭有限责任公司,内蒙古自治区鄂尔多斯市 017312)

0 引言

当前,旋转机械正朝着高复杂度和集成化的方向发展[1]。由于旋转机械通常在复杂恶劣的工况(如可变重载、高温、强冲击等)下运行,一旦其中部件发生故障,将造成巨大的经济损失。因此,研究面向实际工业场景的智能故障诊断模型具有重要意义[2,3]。

近年来,基于人工智能的故障诊断方法逐渐成为研究热点。通常,用于机械故障诊断的方法有基于传统机器学习的方法、基于深度学习和基于迁移学习的方法[4]。然而,采用基于传统机器学习方法和深度学习的方法,对旋转机械进行故障诊断时,存在2个问题[5]1-2:(1)旋转机械的变工况会导致实际运行过程中的信号样本,与诊断模型的训练样本存在分布差异,造成不同工况下模型的诊断效果不理想;(2)缺少足量不同工况下的旋转机械故障数据,即带标签的故障样本。

基于上述原因,迁移学习方法近年来逐渐得到了研究人员的关注。迁移学习能够利用已有源域的知识,解决不同目标域的问题[6]1-2。在进行机械故障诊断时,将已有工况下的带标签故障样本数据作为源域,而其他工况下无标签故障数据作为目标域,采用基于迁移学习的方法,能够利用源域和目标域样本训练跨域故障诊断模型,对无标签目标域数据的故障进行识别和分类。

由于深度学习方法具有强大的隐藏特征挖掘能力,近年来,许多研究人员对深度迁移学习方法开展了研究,并成功将其应用于旋转机械跨域故障诊断。

张西宁等人[5]1-2提出了一种改进的卷积神经网络(convolutional neural network, CNN),采用预训练-微调的迁移学习方法,将由源域数据预训练得到的深度网络迁移至目标域,用以解决实际轴承故障诊断应用中缺少训练样本的问题。针对轴承在实际运行过程中的信号样本与故障诊断模型的训练样本存在分布差异的问题,康守强等人[6]1-2构建了一种深度在线迁移模型,利用源域样本预训练CNN-ISVM模型,再将模型参数迁移至目标域模型,针对目标域新增数据,能实现快速分类识别;实验结果表明,该深度在线迁移模型具有较好的稳定性和诊断精度。陈仁祥等人[7]基于深度置信网络(DBN),提出了一种深度迁移方法,用于对不同工况下行星齿轮箱故障诊断。HE Zhi-yi等人[8]提出了一种深度迁移模型,用于对跨设备的轴承故障进行诊断;在该模型中,通过修改损失函数,来增强深度自解码器(deep Auto-encoder, DAE)的重构性能,利用足量源域有标签数据训练DAE模型,将模型参数迁移至目标域,对跨设备的轴承故障进行了诊断。HE Zhi-yi等人[9]提出了一种新的DAE模型,即深度迁移多小波自编码器;该模型通过从少量的训练样本中学习重要特征,来训练深度迁移模型,对齿轮箱进行了跨域故障诊断。JANG G B等人[10]1-2基于有标签源域数据和目标域中正常状态数据,采用了具有注意力机制的深度CNN进行故障特征提取;并设计了一种域变换算法,对旋转机械跨域故障进行了诊断。

虽然上述文献均研究并完成了深度迁移学习方法在旋转机械中的应用,但其主要关注的是深度模型的迁移,而未考虑特征的域不变性和判别性能对深度模型迁移后的故障分类影响。

对此,笔者提出一种新的旋转机械故障诊断方法,即首先对基于最大重叠离散小波包变换(maximal overlap discrete wavelet packet transform, MODWPT)[11]的原始振动信号进行分析与特征提取,然后对面向迁移学习的特征进行选取,基于有标签源域特征数据和目标域中正常状态下的特征数据,对统计特征的故障类别判别性能和域不变性能进行量化评估,选取判别性能和域不变性能高的特征用于后续的迁移模型训练;利用特征选取后的源域特征子集和目标域正常状态下的特征子集,训练迁移深度置信网络模型;最后利用训练好的迁移深度置信网络对目标域无标签特征数据进行分类,实现不同工况下的故障诊断。

1 面向迁移学习的特征选取

1.1 Fisher Score(FS)

Fisher Score(FS)是一种由Fisher判别分析[12]衍生出的有监督特征选取方法,它属于过滤式选取方法[13]。FS是从特征数据的类间与类内散度两方面对特征进行评价,以选取类内散度小,且类间散度大的特征,提高分类器的精度[14,15]。该算法的主要部分描述如下:

(1)

特征样本的类内散度定义如下:

(2)

基于式(1,2),对于某一特征而言,其K类样本的类间散度越大,类内散度越小,表示该特征对K类样本的可分性越好[16]。

有Fisher Score的定义如下:

(3)

当FS(fm)的值越大时,则该特征越有利于分类。

1.2 最大均值差异

最大均值差异(maximum mean discrepancy, MMD)[17]常被用于迁移学习过程。它是一种基于再生核Hilbert空间(reproducing kernel Hilbert space, RKHS)的,用于度量不同域数据集之间分布差异的指标。

给定源域特征集DS={x1,x2,…,xnS}和目标域特征集DT={y1,y2,…,ynT};nS和nT分别为源域和目标域的样本数,2个数据集具有不同的概率分布,即PS(DS)≠PT(DT)。

这2个数据集间的最大均值差异如下:

(4)

式中:H—RKHS;φ—H中的非线性映射函数。

1.3 基于FS与域间最大均值差异的特征选取

由于原始特征集维度高,存在干扰和冗余特征,影响故障诊断精度;同时,由于源域与目标域数据集之间存在分布差异,导致跨域故障诊断效果不佳。针对这两个问题[18],笔者提出了一种面向迁移学习的特征选取方法,即基于FS与域间最大均值差异的特征选取(FSFM)方法。

该方法是从原始特征集中选取判别性能高,且域不变性能好的特征来构建特征子集,进而提高经迁移学习后模型的跨域故障诊断性能。

FSFM从两个角度评价特征样本:(1)FS值高的特征更有利于分类(利用FS评价特征的判别性能);(2)在源域和目标域之间,同一特征的MMD值越小,则认为其域不变性能越好(利用MMD度量源域和目标域中,正常状态下特征样本的分布差异)。

基于特征的FS值与MMD值,就可以构建新的特征选取指标RFM。

FSFM特征选取的详细步骤如下:

(5)

根据式(3),分别计算各特征样本的FS值,得到包含M个特征FS值的序列:

FS={fs(1),fs(2),…,fs(M)}

(6)

(2)基于MMD的特征域不变性度量。基于源域和目标域数据集中正常状态特征样本,利用式(4),计算各特征在源域和目标域间的MMD值,用于表征其域不变性能,得到M个特征的MMD值序列:

MMD={mmd(1),mmd(2),…,mmd(M)}

(7)

(3)构建特征选取指标RFM。为综合考虑特征的判别性能和域不变性能,笔者提出一种特征评价指标RFM,其表达式如下:

(8)

由此,可得到包含M个特征的RFM值的序列,即:

RFM={rfm(1),rfm(2),…,rfm(M)}

(9)

特征的RFM值越大,其可选择性越好,选择RFM值大的特征构建特征子集,更有利于提高迁移学习效果和模型跨域诊断的性能。

最后,基于降序排列后的RFM值序列,选取对应的特征构建特征子集,训练跨域故障诊断模型。

2 迁移深度置信网络

2.1 深度置信网络

深度置信网络(DBN)[19]是一种深度学习方法。它通过训练多层神经元间权重值,根据概率最大值来生成训练数据,是一种典型的生成模型。

DBN实质上是由多层的受限玻尔兹曼机(restricted Boltzmann machine, RBM)和一层反向传播网络堆叠而成的多隐含层神经网络,常被用于模式识别与分类,以及数据的生成。DBN中的显性神经元和隐性神经元分别用于接受输入和提取特征。

采用3层RBM构建的DBN模型结构[10]3-4如图1所示。

图1 三层RBM的DBN结构

RBM的能量表达式为:

(10)

式中:vi—第i个可视层神经元状态;bi—相应的偏置;hj—第j个隐含层神经元状态;cj—相应的偏置;m—可视层神经元个数;n—隐含层神经元个数;Wij—连接这两个层神经元的权重;θ—参数集，θ={W,b,c}。

DBN的学习过程包括正向预训练和反向微调。其具体过程为:(1)基于无标签输入数据和网络初始参数,进行逐层RBM训练,每一层RBM的隐含层作为下一层RBM的可视层,多层RBM预训练完成后,获得网络连接参数θ;(2)基于有标签训练数据,结合分类器采用反向误差传播法,对DBN进行参数微调,微调后的DBN网络用于对无标签测试样本进行分类。

2.2 迁移深度置信网络

在深度置信网络的基础上,笔者构建了迁移深度置信网络(transferred deep belief networks, TDBN),来此来对旋转机械进行跨域故障诊断。给定工况1和2下的故障数据分为源域和目标域。

TDBN的构建过程如下:

(1)设置网络初始参数、RBM数量、神经元数量、初始化权重等,选用激活函数sigmoid函数;

(2)首先利用无标签源域数据预训练DBN模型,根据RBM数量进行逐层训练,各RBM的输出(隐含层)作为下一个RBN的输入(可视层);然后利用有标签源域数据,对预训练DBN模型进行微调,更新网络参数;

(3)基于第2步获得的DBN模型参数,将其迁移至目标域DBN模型(其分类层采用SoftMax分类器),将最后1层RBM的输出作为SoftMax分类器的输入;再利用目标域中少量有标签特征数据,采用反向误差传播算法,对目标域DBN模型进行有监督的微调,微调后的DBN模型用于对无标签目标域数据进行分类。

上述TDBN模型的构建流程如图2所示。

图2 TDBN模型的构建流程

3 迁移故障诊断流程

针对实际工况下的旋转机械故障诊断,基于故障振动信号,笔者提出了一种基于深度置信网络的旋转机械迁移故障诊断流程框架,即FSFM-TDBN。

该流程框架如图3所示。

图3 基于深度置信网络的旋转机械迁移故障诊断流程框架

该流程框架共分为4个步骤:

(1)基于MODWPT的原始振动信号分析与特征提取。即采集自工况1和2下的原始振动信号,分别设定为源域和目标域,先采用MODWPT对信号进行分解,然后结合统计参数,提取统计特征;

(2)面向迁移学习的特征选取。即基于有标签源域特征数据和目标域中正常状态下的特征数据,利用基于Fisher Score与域间最大均值差异的特征选取方法,评价统计特征故障类别的判别性能和域不变性能,获得特征可选性指标RFM,再对各特征的RFM值进行降序排列,选取相应的统计特征构建特征子集,以用于迁移模型训练;

(3)迁移深度置信网络。即基于第2步中获得的源域和目标域特征子集,根据图2中的TDBN训练步骤,先利用源域的特征子集训练源域DBN模型,然后将源域DBN模型的网络参数迁移至目标域DBN模型,再利用目标域中正常状态下的特征集,对目标域DBN模型进行微调,以获得TDBN模型;

(4)获得迁移故障诊断结果。即利用获得的TDBN模型,对目标域无标签特征数据进行模式识别与分类,最后输出迁移故障的诊断结果。

4 实验验证

笔者基于SQI-MFS机械故障模拟试验台采集轴承和电机故障振动信号,验证所提出的迁移故障诊断框架FSFM-TDBN的有效性与适应性。

SQI-MFS试验台如图4所示。

图4 SQI-MFS机械故障模拟实验台

4.1 不同工况下的轴承故障诊断

4.1.1 实验设置

为验证FSFM-TDBN模型在不同工况下的轴承故障诊断性能,笔者采集转速在1 200 r/min和1 600 r/min下的轴承故障振动信号。其中,设置的故障类型有内圈、外圈和滚珠故障,故障轴承型号为SER205。

352个特征的RFM值如图5所示。

图5 352个特征的RFM值

每种故障下设置0.05 mm, 0.1 mm和0.2 mm故障尺寸;再加上正常状态下的轴承,因此笔者采集的轴承振动信号共包含10种状态。每种状态下的振动信号均采集90组信号样本,各样本包含5 000个连续采样数据点,信号采样频率为16 kHz。

基于采集的信号样本,笔者设置两个跨域故障诊断任务:任务1中,1 200 r/min和1 600 r/min下的故障样本分别作为源域和目标域;任务2中,1 600 r/min和1 200 r/min下的故障样本分别作为源域和目标域。

轴承故障数据集的具体描述如表1所示(其中,各轴承状态下的源域和目标域样本分别为30和60,均是从90组信号样本中随机分配)。

表1 SQI-MFS轴承故障数据集

4.1.2 实验结果分析

根据FSFM-TDBN的步骤,笔者首先将原始轴承故障振动信号经MODWPT进行4层分解(母小波选用“db5”);再将分解得到的16个小波包终端节点进行单支重构,基于这些重构信号及其相应的Hilbert包络谱,计算11种统计参数[20,21](平均值、极差、峰度、标准差、能量、偏度、波峰因子、能量熵、形状因子、脉冲因子和纬度因子)[22]60-61,共生成352个统计特征。

基于生成的352个统计特征,笔者构建原始特征集(original characteristic set, OCS),即利用FSFM特征选取方法,对352个特征进行判别性能和域不变性能的评估,获得各特征的可选性指标RFM;以任务1的数据为例,源域的有标签样本和目标域的正常状态样本用于计算RFM值;根据这352个特征的RFM值的降序排列,选取前k个RFM值对应的统计特征用于后续的迁移诊断模型训练;

经特征选取后,利用源域无标签特征子集和目标域正常状态下特征子集进行TDBN模型的训练,TDBN的隐含层神经元个数设置为140,100和30,分类层为SoftMax分类器,故障类别为10,学习率为0.01;最后,将目标域无标签特征数据输入训练得到的TDBN网络,输出故障诊断结果。

为凸显该方法的优势,笔者选用一些经典机器学习方法和常用迁移学习来进行对比,选用的方法有:支持向量机(SVM)、K最近邻(KNN)、卷积神经网络(CNN)、深度自编码器(DAE)、随机森林(RF)、迁移成分分析(TCA)和联合分布适应(JDA)。

构建的对比模型如表2所示。

表2 对比故障诊断模型

轴承故障诊断结果对比如图6所示(其中的故障诊断准确率为10种故障状态的平均准确率)。

图6 轴承故障诊断结果对比

由图6可知:基于FSFM-TDBN模型的故障诊断性能优于其他模型,在任务1和任务2下的最大故障诊断准确率分别可达90.83%(特征选取数为170)和89.33%(特征选取数为150);

其他对比模型的最大故障诊断准确率分别为:OCS-SVM、OCS-KNN、OCS-CNN、OCS-RF、OCS-DAE、OCS-TCA和OCS-JDA模型,在任务1下的诊断准确率分别为:77.17%、65.17%、61.17%、71.67%、62.83%、69.50%和65.50%;在任务2下的诊断准确率分别为:72.33%、58.83%、56.33%、68.33%、58.33%、73.00%和78.33%。

面向迁移学习的特征选取方法FSFM与迁移学习方法TCA、JDA和TDBN相结合的模型故障诊断结果,如表3所示。

表3 轴承故障诊断结果

根据表3结果可知:当选取一定数量的特征时,模型的故障诊断准确率可以有明显提高;OCS-FSFM-TCA模型在任务1下,选取150个特征时,故障诊断准确率可达81.67%,比未使用FSFM方法时提高了12.17%;OCS-FSFM-JDA模型在任务1下,选取170个特征时,故障诊断准确率可达84.83%,比未使用FSFM方法时提高了19.33%;FSFM-TDBN模型在任务1下,选取170个特征时,故障诊断准确率可达90.83%,比未使用FSFM方法时提高了8.83%;在任务2下,FSFM方法对故障诊断结果的提高作用也非常明显。

综合分析上述实验结果可知:

(1)基于FSFM-TDBN模型的方法能够有效实现不同工况下的故障诊断,最大的故障诊断准确率明显高于其他对比模型;

(2)面向迁移学习的特征选取方法FSFM能够有效提高基于迁移学习故障诊断模型的性能;当选取适当数量的特征构建子集,用于迁移学习故障诊断模型训练,模型的故障诊断结果将明显提升,表明FSFM方法能够从原始特征集中选取判别性能和域不变性能高的特征,构建的特征子集更有利于迁移学习,增强模型的域适应能力,提高故障诊断准确率。

4.2 不同工况下的电机故障诊断

4.2.1 实验设置

为进一步验证FSFM-TDBN模型对跨域故障诊断的有效性与适应性,笔者采集转速在1 200 r/min和1 600 r/min下的电机故障振动信号。电机的故障类型共有4种:转子断条故障、绕组故障、转子弯曲故障、单相电压不平衡故障。

此处采用和SQI-MFS试验台配套的故障电机,如图7所示。

图7 故障电机

电机相关参数如表4所示[22]70-72。

表4 电机的主要参数

加上正常状态电机,笔者采集的电机振动信号共包含5种状态。每种状态下的振动信号均采集90组信号样本,各样本包含5 000个连续采样数据点,信号采样频率为16 kHz。基于采集的信号样本,设置2个跨域故障诊断任务:任务1中,1 200 r/min和1 600 r/min下的故障样本分别作为源域和目标域;任务2中,1 600 r/min和1 200 r/min下的故障样本分别作为源域和目标域。

电机故障数据集的具体描述如表5所示。

表5 SQI-MFS电机故障数据集

表5中,各电机状态下的源域和目标域样本分别为30和60,均为90组信号样本中的随机分配。

4.2.2 实验结果分析

接下来,基于FSFM-TDBN框架,笔者开展不同工况下的电机故障诊断实验分析(实验步骤同上)。

首先,利用MODWPT对电机振动信号进行分解,结合11种统计参数,共提取出352个统计特征作为原始特征集;再利用FSFM特征选取方法对该352个特征评估,获得对应的RFM值,如图8所示。

图8 352个特征的RFM值

经特征选取后,利用源域无标签特征子集和目标域正常状态下特征子集进行TDBN模型的训练,TDBN的隐含层神经元个数设置为200,150和50,分类层为SoftMax分类器,故障类别为5,学习率为0.03。

表2中对比模型的故障诊断结果如图9所示。

图9 电机故障诊断结果对比

图9中的对比结果与轴承故障诊断结果相似,FSFM-TDBN模型的故障诊断性能明显优于其他模型,在任务1和任务2下的最大故障诊断准确率[23]分别可达86.83%(特征选取数为140)和81.33%(特征选取数为160);

其他对比模型的最大故障诊断准确率分别为:OCS-SVM、OCS-KNN、OCS-CNN、OCS-RF、OCS-DAE、OCS-TCA和OCS-JDA模型,在任务1下的诊断准确率分别为:54.00%、53.67%、69.67%、56.33%、46.33%、65.00%和71.83%;在任务2下的诊断准确率分别为:67.00%、44.33%、64.33%、64.67%、63.33%、61.67%和68.33%。OCS-FSFM-TCA和OCS-FSFM-JDA模型在任务1下的最大故障诊断准确率分别为71.67%和73.00%,在任务2下的最大故障诊断准确率分别为76.67%和77.17%。

上述实验结果也表明,基于FSFM特征的选取方法能够明显提升迁移学习故障诊断[24]的性能。

综上所述,基于FSFM-TDBN的模型在不同工况下故障诊断的有效性与适应性得到了验证,在选取合适的特征数量时,其故障诊断的性能明显优于其他对比模型。

5 结束语

笔者提出了一种基于深度置信网络的旋转机械迁移故障诊断方法FSFM-TDBN,首先利用时频分析方法MODWPT对旋转机械振动信号进行处理,提取统计特征;其次,用特征选取方法FSFM,对各统计特征的判别性能和域不变性进行量化评估,构建新的特征选取指标RFM;然后,选取RFM值高的特征构建子集用于训练迁移深度置信网络模型;最后,利用训练好的迁移深度置信网络,对不同工况下的无标签特征样本进行故障识别与分类。

笔者采用MFS-SQI机械故障模拟试验台的轴承和电机故障数据,开展了不同工况下的故障诊断实验,结果表明:

(1)基于FSFM-TDBN的模型能够有效地对不同工况下的故障进行诊断,最大的故障诊断准确率明显高于其他对比模型;

(2)面向迁移学习的特征选取方法FSFM能够有效提高基于迁移学习故障诊断模型的性能;当选取适当数量的特征构建子集用于迁移学习故障诊断模型训练,模型的故障诊断结果将明显提升,表明FSFM方法能够从原始特征集中选取判别性能和域不变性能高的特征,构建的特征子集更有利于迁移学习,增强模型的域适应能力,提高故障诊断准确率。

综合实验验证了基于FSFM-TDBN的方法在面向不同工况下旋转机械故障诊断的有效性、适应性和优势;证明该方法具有应用于实际工业场景下故障诊断的潜力。

在该研究内容的基础上,后续笔者将基于迁移故障诊断模型开展进一步研究,主要内容包括:(1)进一步提高迁移学习模型的诊断准确率;(2)研究迁移学习故障诊断模型在更复杂的场景下的应用,比如跨多变工况和跨设备的故障诊断。