基于多隐层小波卷积极限学习神经网络的滚动轴承故障识别

2021-06-02黄重谦

工矿自动化 2021年5期

黄重谦

(广西科技师范学院机械与电气工程学院，广西来宾 546199)

0 引言

滚动轴承是煤矿旋转机械的重要部件，其工作状态直接影响着整机的工作性能。因此，及时对煤矿旋转机械滚动轴承进行状态监测与故障识别，具有重要意义[1]。煤矿旋转机械工作环境恶劣，实际采集到的滚动轴承振动信号受环境噪声干扰明显，且由于传递路径比较复杂，信号呈现出明显的非线性和非平稳性，导致轴承故障特征提取较困难。

多隐层自动编码网络[2]能自动地从滚动轴承振动信号中学习有价值的特征，克服了传统基于“人工特征提取+模式识别”方法受主观影响大的缺陷[3]，在滚动轴承故障识别领域取得了较大突破。文献[4]在缺少滚动轴承故障信息的情况下，利用多隐层玻尔兹曼网络取得了较高的识别准确率；文献[5]提出的融合多隐层自动编码网络能更有效、更稳健地对滚动轴承的多种故障进行识别。自动编码网络[6]不需要标记数据，其训练过程为非监督过程，因此，可将自动编码网络的思想应用到极限学习网络[7]，得到极限学习自动编码器(Extreme Learning Auto-Encoder，ELAE)。利用ELAE的特征表达能力，将其作为多隐层极限学习自动编码神经网络的基本单元[8]。但ELAE为全连接网络，需要学习的参数众多，训练时间较长，学习到的信号特征的平移不变性较差，受噪声影响较大，且标准ELAE使用sigmoid激活函数，泛化能力较弱[9]。针对上述问题，本文提出一种基于多隐层小波卷积极限学习神经网络(Multi Hidden Layers Wavelet Convolution Extreme Learning Neural Network，MHLWCELNN)的滚动轴承故障识别方法，实验结果表明该方法具有较高的可行性和有效性。

1 多隐层小波卷积极限学习神经网络

1.1 一维卷积神经网络

一维卷积神经网络(1D-CNN)[10]具有局部连接和权值共享特性，可有效降低网络过拟合风险，其工作原理如图1所示。

图1 1D-CNN工作原理Fig.1 The working principle of 1D-CNN

以卷积层为例，设输入的轴承振动信号为x，则卷积层输出为

Ccn=f(x*Wcn+bcn)

(1)

式中：Ccn为输出特征图；f为激活函数；“*”为卷积符号；Wcn为滤波器权重；bcn为偏置向量。

1.2 自动编码器

1D-CNN为有监督模型，需要大量的带标签样本，而实际工业应用中轴承振动信号无标签样本多。自动编码器(Auto-Encoder，AE)为无监督模型，训练过程只需要无标签样本，AE结构如图2所示，包括输入层、隐层和输出层,其单元个数分别为m,L,m。

图2 AE结构Fig.2 The structure of AE

AE隐层的输出h为

h=sigmoid(W·x+b)

(2)

式中：W为隐层的权重；b为隐层的偏置。

AE输出层的输出y为

y=sigmoid(W′·h+b′)

(3)

式中：W′为输出层的权重；b′为输出层的偏置。

AE的损失函数E一般为

(4)

AE的参数更新策略为

(5)

式中：R为AE训练时的迭代次数；η为AE的学习率。

AE为全连接网络，训练参数较多，且其激活函数为sigmoid函数，泛化能力较弱，另外，AE的参数训练采用BP算法，很容易陷入局部最优。

1.3 小波卷积极限学习神经网络

极限学习机(Extreme Learning Machine，ELM)是一种单隐层神经网络，通过求解矩阵的Moore-Penrose广义逆，进而确定输出权重，训练速度较快。因此，综合1D-CNN，AE，ELM和小波函数的优势，构造小波卷积极限学习神经网络(Wavelet Convolution Extreme Learning Neural Network，WCELNN)。

(1) 将AE和ELM结合，构造ELAE。ELAE为3层无监督网络，其结构与图2类似。ELAE隐层的输出与AE隐层的输出相同，ELAE输出层的输出为

y=hT·β

(6)

式中β为隐层到输出层的输出权重向量。

ELAE的优化函数为

(7)

(8)

式中：I为单位矩阵；A为常数；H为隐层矩阵。

(2) 将ELAE和1D-CNN结合，构造卷积极限学习神经网络(Convolution Extreme Learning Neural Network，CELNN)，其结构如图3所示。

CELNN隐层第k个节点的输出hk为

hk=sigmoid(Wk*x+bk)

(9)

式中：Wk为隐层第k个节点的卷积核权重矩阵；bk为隐层第k个节点的偏置。

(3) 将CELNN和小波函数结合，构造WCELNN。由于高斯小波函数在时域、频域均具有良好的分辨率，故激活函数使用高斯小波函数：

(10)

图3 CELNN结构Fig.3 The structure of CELNN

式中t为时间。

WCELNN隐层第k个节点的输出hk为

hk=ψ[(x*Wk-ck)./ak]

(11)

式中：ak和ck分别为小波节点的尺度向量和平移向量；“./”表示按元素相除。

WCELNN输出层的输出为

(12)

根据ELM训练方法，WCELNN的优化函数可表示为

(13)

(14)

WCELNN不使用BP算法，其输出权重计算较为简单，运算速度较快。

2 基于MHLWCELNN的滚动轴承故障识别

MHLWCELNN堆叠多个WCELNN，能进一步提高网络学习到的特征的质量。利用无标签的滚动轴承振动信号样本训练第1层WCELNN，得到第1隐层特征；将第1隐层特征输入第2层WCELNN，得到第2隐层特征；依此类推。MHLWCELNN结构如图4所示。

图4 MHLWCELNN结构Fig.4 The structure of MHLWCELNN

基于MHLWCELNN滚动轴承故障识别步骤如下：① 采集不同工况下的滚动轴承振动信号并进行样本划分。② 将训练样本输入MHLWCELNN进行训练。③ 使用测试样本对训练好的网络进行测试。

3 实验验证：基于XJTU-SY数据集

3.1 实验数据描述

为验证MHLWCELNN的有效性，以XJTU-SY滚动轴承数据集[11]为对象进行实验。实验轴承为LDK UER204滚动轴承。限于计算资源，在XJTU-SY数据集中选取9种不同的轴承工况数据：正常(a，b)、内圈轻微故障(c)、内圈中度故障(d)、内圈重度故障(e)、外圈轻微故障(f)、外圈中度故障(g)、外圈重度故障(h)、滚珠轻微故障(i)、滚珠中度故障(j)，最后得到每种工况下的8 000个样本，随机选取70%作为训练样本，其余作为测试样本，每个样本1 024个采样点，即1 024维。

各种工况下的轴承时域信号如图5所示，可见振动信号受噪声干扰严重，难以进行有效区分。

(a) 工况a

(e) 工况e

(g) 工况g

(i) 工况i

3.2 故障识别与分析

为验证MHLWCELNN的优势，采用多隐层自动编码神经网络(Multi Hidden Layers Auto Encoder Neural Network，MHLAENN)、多隐层稀疏自动编码神经网络[12](Multi Hidden Layers Sparse Auto Encoder Neural Network，MHLSAENN)、多隐层降噪自动编码神经网络[13](Multi Hidden Layers Denoising Auto Encoder Neural Network，MHLDAENN)、多隐层收缩自动编码神经网络[14](Multi Hidden Layers Contractive Auto Encoder Neural Network，MHLCAENN)和多隐层极限学习自动编码神经网络(Multi Hidden Layers Extreme Learning Auto Encoder Neural Network，MHLELAENN)等方法进行对比分析，输入均为1 024维信号样本，各网络结构均为1 024-512-256-128-64-32-10。共进行10次试验，不同方法的识别结果见表1。

表1 不同方法的识别结果(基于XJTU-SY数据集)Table 1 Identification results of different methods (based on XJTU-SY data set)

由表2可知，MHLWCELNN具有更高的识别准确率和更小的标准差，能较为稳定地识别出滚动轴承的故障类型。这几种方法中，MHLAENN方法的故障识别率最低，仅81.13%；MHLSAENN加入了稀疏项限制，可捕捉输入数据中较重要的信息；MHLDAENN加入了降噪机制，一定程度上提高了网络对噪声的鲁棒性；MHLCAENN加入了收缩项限制，使网络对输入信号的小扰动具有一定的抗干扰性。MHLSAENN，MHLDAENN和MHLCAENN较MHLAENN都取得了更高的故障识别率。MHLELAENN 利用ELAE优秀的特征表达能力和快速的网络收敛能力，故障识别率达到了95.62%，训练时间仅129.19 s。本文提出的MHLWCELNN采用局部连接和权值共享机制，大大减少了需要学习的参数，故训练时间较短，受噪声影响较小，且使用小波激活函数，具备一定的时频聚焦特性，能有效学习轴承振动信号的时频特征，故障识别率高于其他方法。

3.3 基于不平衡数据集的故障识别率

为验证MHLWCELNN对不平衡故障样本的有效性，设计了一种不平衡数据集,正常与故障工况的训练样本比例为8 000∶4 000，实验共进行10次，采用MHLCAENN,MHLELAENN方法作为对比。

准确率、召回率、F1值作为评估指标，经常被用到分类效果的评测上。其中F1值可在准确率和召回率之间取得平衡，让两者同时达到最高。因此，采用F1值定量评价3种方法基于不平衡数据集的分类效果,F1值计算公式为

(15)

式中：F1值在[0，1]之间，0代表最差，1代表最好；P为准确率；Q为召回率。

不同方法的F1值见表2。

表2 不同方法的F1值Table 2 F1 values of different methods

由表2可知，MHLWCELNN的F1值较高，验证了MHLWCELNN对不平衡数据集的有效性。

3.4 激活函数对MHLWCELNN识别率的影响

激活函数对MHLWCELNN的故障识别率有一定影响，采用不同激活函数时MHLWCELNN的识别率见表3。从表3可知，高斯小波、Morlet小波和Mexican hat小波的故障识别效果好于其他激活函数，高斯小波在时域、频域均有较高的分辨率。

表3 不同激活函数对MHLWCELNN识别率的影响Table 3 Effects of different activation functions on identification accuracy of MHLWCELNN

4 实验验证：基于西储大学数据集

4.1 实验数据描述

以西储大学轴承数据集为对象，在测试轴承上通过电火花加工形成不同故障尺度的凹坑，限于计算资源，从西储大学轴承数据集中选取7种不同的轴承故障工况数据：正常(A)、内圈轻微故障(B)、内圈中度故障(C)、外圈轻微故障(D)、外圈中度故障(E)、滚动体轻微故障(F)、滚动体中度故障(G)，每种工况的样本数量为8 000。7种轴承故障工况下的时域信号及相应的频域信号如图6所示。从图6可知，故障信号受噪声干扰严重，难以直接从时域图中对滚动轴承的故障类型及程度进行有效区分。

(a) 工况A,时域信号

(e) 工况C,时域信号

(g) 工况D,时域信号

(i) 工况E,时域信号

(k) 工况F,时域信号

(m) 工况G,时域信号

4.2 故障识别与分析

采用MHLWCELNN等6种方法进行对比实验，结果见表4。

从表4可知，MHLWCELNN具有更高的识别准确率和更小的标准差，能较为稳定地识别出滚动轴承的不同故障类型，进一步验证了MHLWCELNN的优越性。

表4 不同方法的识别结果(基于西储大学数据集)Table 4 Identification results of different methods (based on the data set of Western Reserve University)

4.3 训练集占比对故障识别准确率的影响

训练集和测试集的样本比例对MHLWCELNN的轴承故障识别准确率有一定影响。若训练集样本比例过低，会引起MHLWCELNN欠拟合；若训练集样本比例过高，则会引起MHLWCELNN过拟合。欠拟合和过拟合均会影响网络的识别准确率。训练集样本占比为60%～90%时，MHLWCELNN的故障识别率如图7所示。