APP下载

改进Alexnet的滚动轴承变工况故障诊断方法*

2020-08-06赵小强张青青

振动、测试与诊断 2020年3期
关键词:故障诊断卷积精度

赵小强, 张青青

(1.兰州理工大学电气工程与信息工程学院 兰州,730050) (2.甘肃省工业过程先进控制重点实验室 兰州,730050)(3.兰州理工大学国家级电气与控制工程实验教学中心 兰州,730050)

引 言

滚动轴承是旋转机械设备中的关键部件,因其承受冲击的能力较差,以致每年约30%的机械故障是由滚动轴承故障引起[1]。因此,对滚动轴承进行更精确、更智能的故障诊断,对进一步保证旋转机械设备的可靠运行有极其重要的作用。国内外80%的滚动轴承故障诊断方法是基于滚动轴承的振动信号[2],但其采集的振动信号均有非平稳、非线性的特性[3]。另外,仅从时域或者频域人工提取的特征难以全面地表征滚动轴承的故障特性,故学者们又利用从时频域提取的故障特征进行滚动轴承的故障诊断,常有小波分解[4]、经验模态分解[5](empirical mode decomposition, 简称EMD)及共振稀疏分解[6]等时频域特征提取方法。其中,小波分解方法由于自身缺乏自适应性,其光芒逐步被具有自适应性的EMD方法所遮盖。但是EMD方法存在着模态混叠和边缘效应的问题,虽然集成经验模态[7](ensemble empirical mode decomposition, 简称EEMD)方法对其进行了一定的改进,但是EEMD在分解过程中因受到分解次数和加入噪声幅值的影响以及筛选条件和分解层数的限制,使其分解结果中存在虚假分量,且会使计算量急剧增加。共振稀疏分解方法由于存在参数的最优选择、抗噪性不强及多成分分离等问题,还有待进一步优化改进。随着人工智能技术的发展,学者们也逐渐利用反向传播神经网络[8](back propagation neural network, 简称BPNN)、支持向量机[9](support vector machine, 简称SVM)及隐马尔科夫[10]等方法进行滚动轴承的故障诊断,虽然它们具有一定的非线性拟合能力,但因过于简单的结构而使它们的自学习能力非常有限,所以还需要人工提取的故障特征作为支撑。

深度学习的概念是特征提取以及模式识别领域一次质的飞跃,可以获得深层次的特征表示,免除了人工选取特征的繁复冗杂和高维数据的维度灾难问题[11]。有学者尝试使用深度神经网络进行滚动轴承的故障诊断研究[12],但因未充分发挥深度学习的潜力,在一定程度上仍不能摆脱复杂信号处理技术的干涉[13],现仍处于起步阶段[14]。在滚动轴承故障诊断中,有深度置信网络[15](deep belief network, 简称DBN)、深度自编码[16](deep auto encoder, 简称DAE)、卷积神经网络[17-18](convolutional neural network, 简称CNN)和循环神经网络[19](recurrent neural network, 简称RNN)等深度神经网络。其中,CNN作为第1个较完整意义上的深度神经网络,具有局部感受野、权值共享和次采样三大特性,解决了深度神经网络计算量大、计算耗时的问题。Janssens等[20]利用旋转机械振动信号的频谱和3层CNN实现了旋转机械的轴承外环故障、轴承润滑油缺失、转子不平衡和轴承正常4种状态的诊断,其诊断精度高于传统的基于特征学习的方法。Guo等[13]提出了一种学习率自适应的5层卷积神经网络ADCNN,对滚动轴承不同位置和不同损伤程度的10类故障进行诊断,但是诊断过程分步进行,且需要训练多个不同的ADCNN才能实现,致使训练过程繁杂。Chen等[18]利用改进的5层CNN和不同负荷下振动信号的时频特征实现了对不同负荷下的滚动轴承不同位置和不同损伤程度的10类故障的诊断。虽然上述文献均表明了CNN在滚动轴承故障诊断中的可行性,但因其使用易使深度神经网络发生梯度弥散现象的sigmoid作为激活函数,且没有涉及如何提升其方法泛化能力和防止过拟合等问题,因此所提出的滚动轴承故障诊断方法并没有极大地发挥出深度神经网络的功效。

基于此,笔者提出一种改进Alexnet的滚动轴承变工况故障诊断方法。在不依靠复杂信号处理技术的前提下,直接通过从原始振动信号中自动提取深层特征来实现对强噪声、变负荷下滚动轴承的故障诊断,并通过真实的滚动轴承状态数据验证了本研究方法的有效性。结果表明,本方法较传统方法具有更强的鲁棒性和更高的诊断精度。

1 Alexnet模型

1.1 Alexnet模型结构

Alexnet相对于5层CNN,具有更深的网络结构,已用于图像识别、图像检索及语音识别等领域,它的结构参数可根据待解决问题的难易程度进行调整精简。相对于具有1 000类别的ILSVRC图片集,十几个类别的滚动轴承故障诊断属于低类别的辨识,故可以在避开需要百万级数据样本和多个GPU并行运行的要求下,通过将Alexnet的深层网络结构精简及运用它所囊括的部分新技术来解决滚动轴承故障诊断问题。图1是一个由5层卷积层、3层池化层、3层全连接层构成单处理器结构的Alexnet模型结构图。其中,输入层是二维的拓扑结构,输出层为单层神经元,维度为待分类类别的数目。Ci(i=1,2,…,5)为第i卷积层,Si(i=1,2,5)为第i池化层,FCi(i=6,7,8)为第i全连接层,并且FCi均为单层神经元映射结构。长方体的长代表卷积层的卷积核个数,宽×高代表经卷积操作所得的特征图尺寸,锥体的底面长×宽代表卷积核尺寸。

图1 AlexNet模型结构图Fig.1 AlexNet model structure diagram

1.2 softmax分类器

(1)

softmax分类器根据由softmax函数所映射的softmax值的大小完成多分类的任务。

2 改进Alexnet的滚动轴承变工况故障诊断方法

笔者针对滚动轴承的复杂工况,结合改进Alexnet强大的自学习能力,自动从滚动轴承的原始振动信号中提取深层特征,实现对强噪声、变负荷下滚动轴承的状态辨识,克服了传统方法中特征提取和模式识别的不足。

2.1 拓扑结构的输入

本研究表征滚动轴承状态的振动信号是随着时间变化的一维数据,为满足滚动轴承故障诊断模型的输入需求,文献[18]提出将一维振动信号按纵向插样构建为满足滚动轴承故障诊断模型输入的二维特征图,但是忽略了滚动轴承的振动信号具有时序性的问题。有学者通过时频变换得到二维频谱作为输入,但其丢失了卷积运算时时域信号的关联性。针对上述不足,笔者将一维振动信号按横向插样构建为二维特征图,以400点的一维振动信号为例,数据点的值为某时刻振动信号的幅值,400点的振动信号按顺序依次插入20行20列的二维矩阵中,进而形成满足滚动轴承故障诊断模型输入的特征图。

图2代表按不同插样方法构建的特征图。假设卷积核的尺寸为3,移动步长为1,对比图2(a)和(b)可以看到,在卷积核沿图中所标注的不同颜色的局部感受野横向滑动的过程中,图2(a)中的特征图的序号差更小,更能凸显滚动轴承振动信号的时序性,并且在特征从第5层的池化层转移到全连接层时会对特征图重构。相对于图2(b)中蓝色区域是乱序的,图2(a)中蓝色区域是整序排列的,这对于及时诊断出滚动轴承的故障状态极为有利。

图2 两种特征图Fig.2 Two kinds of feature maps

2.2 卷积层

本研究采用互相关函数代替卷积运算,可避免卷积核K和输入I的翻转,但不影响计算结果,即

(2)

(3)

(4)

其中:f(·)为Relu激活函数。

2.3 卷积层的功能层

CNN在特征提取和特征映射过程中,为减少数据运算量,增加网络泛化能力,通常会在部分卷积层之后添加池化层及不同的归一化层等,这里将其统称为卷积层的功能层。笔者对Alexnet卷积层的功能层进行改进调整,将先局部归一化再池化的步骤,调整为先池化再局部归一化。

(is≤i′≤is+wc-1;js≤j′≤js+wc-1)

(5)

其中:s为池化移动步长;wc为池化区的宽度,且wc>s。

(6)

其中:k,α,β,m为超参数,可依次取值为2,0.75,10-4,5;N为第l卷积层卷积核总数。

如此改进有两大优点:①在池化后局部归一化既可以增强本方法的泛化能力和防止过拟合现象发生,又能极大地缩减训练时间;②文献[21]虽然提到了使池化区的宽度大于池化移动步长的重叠池化方法,但效果甚微,而本研究在局部归一化前进行重叠池化,不仅可以使池化过程中保留更多的故障信息并弱化冗余信息,而且会加速滚动轴承故障诊断模型训练过程的收敛速率和进一步增强本方法的泛化能力,凸显出重叠池化较以往池化法的优越性。

2.4 全连接层

将式(5)中l为5时的所有特征图重构为一个高维单层神经元结构C5,则第6全连接层第i个神经元的输入为

(7)

(10)

根据式(1)可得出第8全连接层第i个神经元的输出qi为

(11)

2.5 基于Adam的权值参数优化

随机梯度下降算法因学习率固定,导致在训练过程中损失函数常会高度敏感于某些方向而不敏感于其他方向。为了改善这个问题,笔者采用学习率自适应的Adam进行权值参数优化。

对式(11)得到的样本I(k)的softmax值qk与实际标签y(k)的值pk求取交叉熵,作本研究的损失函数L

(12)

(13)

(14)

(15)

(16)

(17)

(20)

(21)

其中:(im,jm)为正向池化操作时池化区特征值最大的特征点。

(24)

(25)

(26)

(27)

更新后的权值θ为

(28)

其中:ε为学习步长;ρ1,ρ2为矩估计的指数衰减速率(默认值为0.9和0.999);δ为用于数值稳定的小常数(默认值为10-8)。

2.6 本研究方法的步骤

本研究方法的具体步骤如下:

1) 采集滚动轴承在某一负荷的不同状态下的振动信号XTR;

2) 将所有一维振动信号分别按横向插样构建为二维特征图集I;

3) 设置小批量尺寸b,并将二维特征图集I化分为一系列含有b个样本的小批量样本组{(I(1),y(1)),(I(2),y(2)),…,(I(b),y(b))};

4) 设置故障诊断模型的结构参数、学习步长ε及弃权值dp,并训练基于Alexnet的滚动轴承变负荷故障诊断模型;

5) 从截断的正态分布中选取参数值来初始化权值,并初始化一阶矩变量s、二阶矩变量r及时间步t均为0;

6) 选择一批滚动轴承的小批量样本{(I(1),y(1)),(I(2),y(2)),…,(I(b),y(b))};

7) 根据式(3)~(11),依照l值从1~8,计算最终的softmax输出值;

8) 根据式(12)计算损伤函数;

9) 根据式(13)~(28),依照l值从8~1进行权值更新;

10) 若训练结束则退出训练,反之t=t+1,并返回步骤6继续训练;

11) 若模型具有较好的训练精度和收敛性能,则保留此时的小批量尺寸b,反之返回步骤3;

12) 若模型具有较好的训练精度和收敛性能,则保留此时的模型结构参数和学习率ε,反之返回步骤4;

13) 选取弃权值dp;

14) 采集不同负荷的不同状态下的滚动轴承振动信号XV,将其按步骤2的方式转换为二维特征图IV;

15) 利用IV测试弃权值为dp时训练模型的泛化能力;

16) 若模型具有较好的泛化性能,则保留此时的dp,反之返回步骤4;

17) 使用最终完成训练的模型进行强噪声、变负荷下的滚动轴承的故障诊断。

3 实验与分析

3.1 实验数据集

本实验选用美国西储凯斯大学轴承研究所提供的数据作为实验数据[22]。实验装置台如图3所示,由1.470kW电机、扭矩传感器/译码器和测功机组成,此外还包括在图中并未显示的电子控制器。电机驱动端深沟球轴承型号为SKF6205,使用电火花放电的方式分别在轴承的外圈、内圈和滚动体上加工单点损伤,损伤直径分为0.018,0.036,0.053和0.071 cm。其中,轴承外圈的损伤点在3点钟、6点钟、12点钟3个不同位置进行设置。电动机驱动端的轴承座上方放置一个加速度传感器用来检测轴承的振动加速度信号,振动信号由16通道数据记录仪采集得到,采样频率为12 kHz,电机所载负荷分别为0,0.746,1.492和2.238 kW。

图3 实验装置台Fig.3 Experimental device table

实验是在大噪声环境中,对不同负荷下的滚动轴承处于正常、内圈故障、外圈故障、滚动体故障以及分别有不同故障损伤程度的12类状态进行诊断。其中,记正常状态为N,内圈损伤直径为0.018 cm的状态为I007,外圈损伤直径为0.036 cm的状态为O014,滚动体损伤直径为0.053 cm的状态为B021,其他状态依此类推,损伤点位置不同的外圈损伤状态按损伤直径归为同一状态,电机的载荷记为负荷0、负荷1、负荷2和负荷3。每个小样本含784点,每种负荷下的样本数均按照75%的样本用于训练、25%的样本用于测试的规则划分,具体各负荷下的训练样本和测试样本数目如表1所列,样本间乱序排列。

表1 实验数据集

3.2 本研究方法的模型结构参数选取

在实验过程中,分别使用一种负荷下的样本按小批量训练的方式进行改进Alexnet的滚动轴承变负荷故障诊断模型的训练,完成模型训练之后,再分别使用4种负荷下的测试样本测试模型的性能。所有的样本训练及测试过程均是在inter的5核CPU的pycharm平台上利用python语言实现,使用的深度学习框架是谷歌的tensorflow。其中,改进Alexnet的滚动轴承变负荷故障诊断模型的结构参数等是根据多次实验的训练精度或测试精度综合收敛速率所得。笔者分别以Adam的学习步长、批尺寸、卷积核1的尺寸及弃权值的选择过程为例进行说明,各参数值的选择过程遵循单一变量原则,在取不同参数值时,其训练精度或测试精度的变化趋势如图4所示。

图4 不同参数的变化趋势图Fig.4 The variable trend graph of different parameters

由图4(a)可以看到,当小批量的样本数为64时,其训练精度远高于小批量的样本数为100时的训练精度,并且训练精度的收敛趋势相对于小批量的样本数为50时更加快稳。由图4(b)可以看到,当Adam的学习步长为0.001时,其训练精度的收敛速度最快,收敛趋势更为平稳,并且在相同的迭代批数下的训练精度最高。图4(c)反映的是在相同的迭代批数下,以负荷2的训练样本进行模型训练,当卷积核1的尺寸选为5×5时的训练精度最高,另外在实验过程中还发现,训练时间随着卷积核尺寸的增加而增加。图4(d)反映的是以负荷2的训练样本进行模型训练,以负荷1的测试样本进行变负荷测试,当选择不同弃权值时测试精度的变化趋势,可以看到当弃权值为0.85时,测试精度收敛的速度最快,收敛趋势较弃权值为0.9时更为稳定,并且最终的测试精度值最高。由此可知,为尽可能获得满意的训练精度和测试精度,需将Adam的学习步长选为0.01,批尺寸选为64,卷积核1的尺寸选为5×5,训练过程的弃权值选为0.85。本研究其他的结构参数也按照上述方法所得,其中本研究方法的模型结构参数如表2所示。为使利用本方法在对强噪声、变负荷下的滚动轴承进行故障诊断时的综合效果最佳,笔者将训练过程的迭代批数设为3 125。

表2 本研究方法的模型结构参数

3.3 滚动轴承故障诊断性能的对比分析

为进一步验证本研究方法的诊断性能,选择BPNN+EMD,SVM+EMD和Lenet-5进行对比分析。为了避免实验结果的偶然性,对10次实验结果求取平均值。由于BPNN和SVM属于浅层的分类器,很难依靠自身解决复杂的非线性问题,故笔者从采用EMD算法分解的本征模态函数集(intrinsic mode functions, 简称IMFs)中,根据相关系数的大小,选取4个最敏感的IMFs,并分别计算出便于滚动轴承故障诊断的特征,包括7个时域特征和16个频域特征[23],共计92个特征,将其分别与BPNN和SVM结合,实现对不同负荷下滚动轴承的故障诊断。另外,根据多次实验的效果可知:当BPNN的网络结构为92-200-12、学习率为0.000 01、迭代次数为30 000时诊断效果最佳;SVM选择92输入12输出的一对多分类方式,因SVM在小样本训练时的训练性能更佳,且在实验中发现将各训练样本的样本数目依次选为42,42,21,27时诊断效果最佳;Lenet-5的弃权值为0.5,学习率为0.001,3层卷积层的卷积核大小均为5×5,各层卷积核个数分别为32,64和128,池化区宽度为2×2,池化移动步长为2,全连接层的神经元数目分别为6 272和1 024,批尺寸为64,此时的实验效果最佳。为了进一步保证对比实验结果的权威性,Lenet-5也采用小批量训练的训练方式,训练批数同样为3 125。基于4种方法对变负荷下的滚动轴承故障诊断准确率如表3所示。

表3 不同方法的故障诊断准确率

由表3可以得到,在没有噪声的情况下,基于BPNN+EMD和基于SVM+EMD的人工特征提取方法的测试准确率的平均值分别为37.3%,21.3%左右,大大低于基于Lenet-5和本研究方的测试准确率的平均值91.0%和93.5%。另外,在实验初始,笔者利用EEMD进行信号的特征提取,但发现其运算时间是EMD的100多倍,这对及时诊断出滚动轴承的故障状态是极不利的。

表4 不同方法对XTE的诊断准确率

由表4的对比数据可以看到,当信噪比为6时,无论采用何种负荷进行样本训练,利用本方法均可以使其测试精度达到87%以上。以负荷1为训练样本为例,随着信噪比的减小,基于Lenet-5的诊断精确度从92.40%依次下降为88.52%,84.92%和78.10%,而本研究方法的诊断精确度从95.16%依次下降为93.04%,88.86%和83.47%,但仍较前者鲁棒性更强。

为进一步观察在强噪声、变负荷工况下两种方法的性能,笔者以信噪比为6的情况为例进行对比实验,实验结果直方图如图5所示。图5反映的是在用某一种负荷的训练样本进行训练、用4种不同负荷下的测试样本进行测试时各自的测试精度的直方图,直方柱的高度为测试精度值的大小。对比图5(a)和(b)可知,当信噪比为6时,后者的直方柱的高度整体高于前者,并且较前者更加平稳,进一步说明本研究方法的诊断精度更高,鲁棒性更强。

图5 两种方法在不同训练样本下的测试结果直方图Fig.5 The histogram of test results under different training samples with two different methods

为进一步明确在强噪声、变负荷情况下,运用本研究方法对滚动轴承各状态进行诊断的情况。在信噪比为6时,以负荷2的训练样本进行训练,分别对4种负荷的测试样本的测试结果做了混淆矩阵图。其中:横向坐标为诊断的滚动轴承状态;纵向坐标为滚动轴承实际的状态;右侧条形棒是某种真实状态被诊断为某种状态时的概率值所对应的颜色,概率值越大,颜色越深。现以测试样本为负荷1的混淆矩阵图为例,可以清楚地看到,除将41%的B021被误诊为B007,其他状态均有较高的诊断精度,见图6。

图6 本研究方法的测试结果混淆矩阵图Fig.6 The confusion matrix diagram of test results for the proposed method

4 结束语

笔者开展了改进Alexnet的滚动轴承变工况故障诊断方法研究,通过新的数据处理思路在一维时域振动信号处理为二维特征图时保留了振动信号的时序性和关联性,并对CNN第2代网络模型Alexnet加以改进。该方法既可以缓解在人工特征提取过程中,因复杂的信号分解和特征筛选等过程造成信息的不必要丢失而对滚动轴承变工况故障诊断产生累加误差的问题,又可使以往方法中直接使用原始时域振动信号进行滚动轴承变工况故障诊断性能不稳定的问题得到改善。通过可视图和直观的实验数据表明,在强噪声、变负荷的复杂工况下,本研究方法较以往方法对多状态的滚动轴承故障的诊断精度更高,鲁棒性更强。

猜你喜欢

故障诊断卷积精度
热连轧机组粗轧机精度控制
基于包络解调原理的低转速滚动轴承故障诊断
基于3D-Winograd的快速卷积算法设计及FPGA实现
卷积神经网络的分析与设计
超高精度计时器——原子钟
从滤波器理解卷积
分析误差提精度
基于DSPIC33F微处理器的采集精度的提高
数控机床电气系统的故障诊断与维修
基于傅里叶域卷积表示的目标跟踪算法