基于CEEMDAN-VSSLMS的滚动轴承故障诊断
2024-04-10向世召
江 莉,向世召
(西安建筑科技大学 信息与控制工程学院,陕西 西安 710055)
0 引言
滚动轴承是旋转机械系统的核心部件之一,其运行状态直接影响着整个旋转机械系统的性能与安全,而旋转机械系统内部结构复杂、工作环境恶劣导致滚动轴承极易发生故障[1-2]。因此,对滚动轴承的工作环境进行安全监测、对运行状态进行故障诊断,特别是对滚动轴承的故障类型进行判断具有重要意义[3]。现阶段滚动轴承故障诊断研究大多面临两方面难题:①在滚动轴承故障数据采集过程中,由于机械系统的工作环境复杂多变,易产生干扰噪声,直接影响诊断结果的准确性;②故障信号的特征提取不彻底或是不明显,造成诊断结果的准确率下降。滚动轴承故障诊断的方法大致可分为3类,包括基于解析模型的方法、基于信号处理的方法和基于机器学习的方法。基于解析模型的方法主要利用滚动轴承工作数据的统计学特征进行状态参数估计,再结合以往的估计经验判断故障状态,该方法能够快速诊断简单故障类型,但多种故障类型同时发生时诊断困难,且需要明确诊断对象的数学模型。基于信号处理的方法通常利用信号模型,如相关函数、傅里叶变换(Fourier Transform,FT)、经验模态分解(Empirical Mode Decomposition,EMD)[4]、小波变换等[5],直接分析滚动轴承振动信号,提取如幅值、频谱、时频谱等特征值,从而检测出故障类型,该方法有足够的理论模型支撑,特征值提取稳定,但轴承振动信号具有非线性、非平稳性,单一特征指标难以有效判断其故障状态。基于机器学习的方法包括支持向量机(Support Vector Machine,SVM)算法[6]、迁移学习(Transfer Learning,TL)、卷积神经网络(Convolutional Neural Networks,CNN)模型[7]等,此类方法能实现多故障特征的智能诊断,但如何提升特征提取能力是一个长期存在的问题。
基于CNN的故障诊断模型利用其强大的学习能力成为应用最广泛的一种高效方法。CNN是深度学习(Deep Learning,DL)的代表算法之一,它利用多个滤波器和特殊卷积计算等组成具有深度结构的前馈神经网络,拥有自适应进行信号特征提取和分类的能力,因此被广泛应用于机械轴承故障诊断中[8-9]。陈起磊等[10]提出一种基于时频图与改进图卷积神经网络(Graph Convolutional Network with Structure Learning,GCN-SL)的异步电机故障诊断方法,先使用小波分析将电机振动信号转换为时频图,再使用超像素分割法处理时频图产生超像素块,根据纹理、距离特征获得图结构数据,最后使用改进网络训练,实现故障诊断。吴晨芳等[11]提出一种基于改进LeNet-5模型的滚动轴承故障诊断方法,将二维灰度图作为模型输入,通过卷积操作自适应提取特征,引入批归一化操作提高模型泛化能力,再使用Softmax分类器实现故障分类识别。杨淑莹等[12]基于GoogLeNet网络模型提出一种小波分解和1D-GoogLeN结合的分类算法,该算法首先利用Db6小波对ECG信号进行8级分解,得到既含时域信息又有频域信息的多维数据,再将分解的样本输入简化Inception结构后的GoogLeNet模型进行训练,最终实现图像分类。虽然这些算法都具有不错的分类识别能力,但由于忽略了信号中噪声的干扰,使得算法的特征提取效率下降,最终影响识别诊断结果。
本文考虑滚动轴承故障诊断存在噪声干扰和特征提取不明显的问题,提出一种两阶段的滚动轴承故障诊断方法。第一阶段对轴承振动信号预处理,去除由于滚动轴承工作环境产生的噪声干扰,避免出现噪声影响故障识别准确率的问题;第二阶段通过图像处理过程凸显故障特征,提高特征提取能力,增加故障识别精度。为验证本文方法的可行性,选用美国凯斯西储大学(Case Western Reserve University, CWRU)公开的轴承振动测试数据集实验表明,本文所提的诊断方法不但能有效去除噪声干扰,而且在噪声背景下依然有很好的故障识别准确率。
1 基本原理及网络模型
1.1 噪声自适应安全经验模态分解算法
EMD是由黄锷等提出的一种新型自适应信号时频处理方法,特别适用于非线性非平稳信号的分析处理,它能根据本身的时间尺度进行信号分解,得到不同幅度的本征模函数(Intrinsic Mode Function,IMF),不需要预先设定基函数,但是分解时会存在模态混叠现象[13]。针对上述不足,WU等[14]在EMD算法的基础上提出EEMD(ensemble EMD),通过多次叠加白噪声改变信号极值特性,再对多次分解得到的IMF分量进行总体平均消除白噪声,在一定程度上抑制了模态混叠的产生,但加入的白噪声会造成信号重构困难。而CEEMD通过向信号中加入互为相反数的正负白噪声,不但消除EEMD方法分解后重构信号当中残留的多余白噪声,同时具有更好的模态混叠分离效果。
对比上述方法,本文采用噪声自适应完全经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN),它不仅能够兼顾CEEMD的优点,还能自适应地添加噪声,避免了信号重构后出现多余白噪声的干扰。CEEMDAN算法步骤如下[15]:
(1) 将服从N(0,1)的高斯白噪声Wi(n)加入原始信号X(n)。
(1)
(2)
(3)
(4)
(5)
(5) 重复步骤(2)和步骤(3)逐次分解,直到残差信号为单调函数为止。分解完成后,原信号可以表示为
(6)
1.2 固定步长LMS算法
最小均方算法是自适应滤波中性能最稳定、应用最广泛的一种算法,它是在维纳滤波理论的基础上,运用梯度下降算法优化后得到的。LMS算法的基本思想是:根据最小均方误差准则,沿着每一时刻均方误差性能曲面负梯度方向进行迭代更新,搜索误差性能曲面的最小值,最终实现期望信号与滤波器实际输出之间的平方期望值达到最小。如图1所示为自适应滤波算法流程图。
图1 自适应滤波算法框图
LMS算法的基本原理如下[16-17]:
假设n时刻系统输入信号向量为:
V(n)=[v(n),v(n-1),...,v(n-N+1)]T。
(7)
式中:N表示滤波器的阶数,一般根据实际需要确定;T为转置。则系统输出信号可表示为:
(8)
式中:W(n)=[w0(n),w1(n),...,wN-1(n)]T为滤波器权系数矢量,0≤i≤N-1,wi(n)表示第i个滤波器权向量。
系统在n时刻期望信号d(n)与实际输出y(n)之间的误差信号e(n)可表示为:
e(n)=d(n)-y(n)=d(n)-WT(n)V(n)。
(9)
将误差平方的均值作为性能函数,自适应过程就是搜索性能函数的最小值过程,即寻找合适的权向量使得性能函数达到最小,因此对性能函数的权向量求偏导,得到梯度的估计值为:
(10)
最后根据梯度下降法,沿着负梯度方向不断调整权系数,即权系数更新公式可表示为:
W(n+1)=W(n)+μ(-∇(n))=
W(n)-2μe(n)V(n)。
(11)
对于固定步长LMS算法,当步长较小时,能获得较小的稳态误差,提高滤波精度,但收敛速度慢;当步长较大时,收敛速度加快,但稳态误差较大,滤波精度下降,因此固定步长LMS算法难以同时兼顾稳态误差和收敛速度。针对以上不足,本文提出一种新的变步长函数,在收敛速度和稳态误差上取得平衡,同时结合CEEMDAN算法,能够很好地滤除轴承振动信号中的噪声干扰。
1.3 GoogLeNet网络模型
CNN主要由输入层、卷积层、激活层、池化层和全连接层组成[18]。数据集由输入层传递到CNN网络;卷积层是构建CNN的核心层,通过若干个卷积单元提取输入图像的局部特征;激活层将卷积层输出的局部特征进行非线性映射,得到新的特征图像;池化层用于降低特征图的维度,减少计算量;全连接层将最后一层卷积得到的特征图展开成一维向量,为分类器提供输入。CNN网络的特征提取能力能随着网络深度的增加而增强,但随着CNN深度的增加,网络出现过拟合和梯度弥散等问题的概率也越来越大。因此,本文选择基于Inception模块的GoogLeNet网络模型,并进行了相应的改进,Inception模块一般结构如图2所示。
图2 Inception模块结构
GoogLeNet是一种预训练卷积神经网络结构,主要包括输入层、卷积层、激活层、池化层、全连接层、Softmax层和分类输出层,它在增加网络深度和宽度的同时,大大减少了网络结构参数,从而大量节省了时间。GoogLeNet网络模型主要由9个Inception特殊模块串联而成,Inception结构在相同的计算量下能够提取到更多的参数信息,可以充分利用计算机资源,它主要由4个1×1的卷积核、1个3×3的卷积核、1个5×5的卷积核和1个3×3的最大池化组成。其主要思想是通过多种不同尺度的卷积核分别提取图像不同尺度的特征信息,然后进行融合,从而获得更高的特征提取效率。如图3所示为基于Inception模块的22层GoogLeNet网络结构框图。
图3 基于Inception模块的GoogLeNet网络结构
2 基于CEEMDAN-VSSLMS和改进GoogLeNet网络的滚动轴承故障诊断流程
2.1 CEEMDAN及相关系数法
本文首先对滚动轴承振动信号进行CEEMDAN分解,分解到的IMF分量通过相关系数判断并去除虚假分量,剩下的有用分量则通过VSSLMS滤波算法进行处理,最后将滤波后的IMF分量重构,得到滤波之后的信号。
(12)
CEEMDAN将含噪信号分解为若干个相关分量,分解完成后,含噪信号可表示为多个信号分量及残差信号之和。计算原始信号X(n)与各相关分量IMFi(n)的相关系数C:
(13)
式中:L为信号长度,IMFi(n)表示第i个分量。一般而言,若C>0.1,则认为该分量是有用分量;若C≤0.1,则判定为虚假分量进行剔除。图4a为含噪滚动轴承故障信号;图4b为含噪滚动轴承故障信号CEEMDAN分解后各IMF分量。
图4 含噪滚动轴承故障信号及CEEMDAN分解
2.2 改进变步长LMS算法
固定步长LMS难以同时满足低稳态误差和较快收敛速度,因此,需要根据算法的迭代次数动态地调节步长参数取值,由此提出了变步长LMS(VSSLMS)算法。文献[19]提出一种对数Sigmoid变步长LMS(LG-SVSLMS)算法,其变步长因子函数为:
μ(n)=βlg(2-exp(-α|e(n)|m))。
(14)
式中:α影响步长因子曲线的整体形状,m与曲线底部趋势有关,β调节曲线幅值。该变步长函数在使用Sigmoid函数调节步长因子的同时,利用对数函数更大程度上降低稳态误差,但其使用对数函数,在e(n)→0时,步长因子μ(n)无法收敛,导致步长因子函数稳态范围小,易产生振荡。
文献[20]基于Sigmoid函数提出一种变步长LMS算法,其变步长函数为:
μ(n)=b(1-exp(-a|e(n)|2))。
(15)
式中:a控制步长函数整体形状,b用于调节曲线取值范围。该变步长函数的优点是收敛区间较大,能达到较低的稳态误差,并且步长函数形式简单,计算复杂度低。但是该方法在误差较大时,步长函数减小较慢,无法快速达到收敛状态,因此该算法有待进一步改进。
以上两种基于Sigmoid函数的变步长函数各有优势,因此综合考虑两种方法的变步长函数,当误差较大时,使用较大的步长以加快收敛;当误差较小时,使用较小的步长以降低稳态误差,从而提升算法性能。假设式(14)中参数α=1,β=1,式(15)中参数a=1,b=2,得到两种算法可变步长对比曲线如图5所示。
图5 两种变步长函数曲线对比
由图5可以看出,两种变步长函数各有优势,当误差较大时,文献[19]的变步长函数步长变化更快,随着误差逐渐变小,文献[20]的变步长函数变化愈发缓慢,变化更加平稳,因此综合考虑两种可变步长LMS算法的特点,在两种算法的基础上提出一种新的可变步长函数,在误差较大时,选择文献[19]的变步长函数以获得更快的收敛速度,而在误差变小进入稳态后,选择更加平稳的文献[20]的变步长函数。改进的可变步长函数为:
(16)
式中:α,β,a,b为可变步长控制系数,分别控制可变步长函数的形状和大小;th为可变步长的阈值,控制两条曲线交点处对应的误差值。显然,改进的可变步长函数是一个由5个参数共同调控的非线性函数,通过改变不同参数的取值可以改变可变步长函数的性能,其曲线如图6所示。
图6 改变参数得到不同的改进可变步长函数
2.3 改进GoogLeNet网络模型
虽然GoogLeNet网络模型在图像分类上有着不错的表现,但对于本文所研究的轴承故障诊断任务,由于数据集较小,且经图像处理操作后特征复杂度不高,特征提取容易,而原网络的深度太大,无法适用本文研究任务,因此本文在原GoogLeNet网络模型基础上进行简化,并在构建数据集前先对图像数据进行处理,使用图像像素增强和形态学处理方法将轴承故障主要特征凸显出来,同时弱化其他非主要特征,使得不需要太深的网络就能将图像中的故障特征提取出来,图像处理过程如图7所示。原网络要求原始输入图像像素尺度为227×227×3,本文通过小波变换将一维振动信号转换为二维图像后,再经过图像处理得到尺度为227×227×1的灰度图作为网络输入,使用1×1的卷积核,进行浅层特征提取,卷积核步长为1,卷积后经过ReLU池化层和大小为3×3、步长为1的max pooling层,随后是Inception模块。
图7 图像处理过程
原网络为了增加特征提取效率使用9个Inception结构串联,本文只使用1个Inception结构,降低网络深度的同时依旧能够保证有效的特征提取滤波,Inception模块是四分支结构,本文为了加快网络计算速度,将原Inception模块中的3×3和5×5的卷积核均改为1×1的卷积核,即由6个1×1的卷积核、6个3×3的ReLU层和1个3×3的max pooling层构成一个新的Inception结构。在此之后,只保留1个全连接层,再连接1个Softmax分类器进行分类,由此构成一个简单GoogLeNet网络模型,如图8所示。
图8 改进GoogLeNet网络结构
2.4 本文滚动轴承故障诊断流程
本文所提的基于CEEMDAN-VSSLMS和简单GoogLeNet网络的滚动轴承故障诊断方法(CVL-GoogLeNet)过程如下:首先对采集到的轴承故障信号进行CEEMDAN分解,使用相关系数去除虚假IMF分量;然后使用改进的VSSLMS滤波算法对剩余IMF分量进行处理,将滤波后的IMF分量进行重构,得到去噪后的信号;再将去噪后的一维信号通过DWT转换成二维时频谱,依次进行灰度化、图像增强、形态学处理,用处理后的特征图建立数据集;最后使用改进的GoogLeNet网络进行训练,并由Softmax分类器做相应的故障类型区分,实现故障诊断。整个过程将信号去噪预处理、图像处理、特征提取和分类相结合,最终实现滚动轴承的故障诊断。
本文方法具体流程如图9所示,具体步骤如下:
图9 基于CVL-GoogLeNet算法的轴承故障诊断流程图
(1) 对采集到的轴承故障信号进行CEEMDAN分解,并计算各分量与原信号的相关系数C,根据相关系数去除虚假分量,只保留有用分量。
(2) 将保留的IMF分量信号通过改进VSSLMS算法进行滤波处理,消除各分量中的噪声成分,再重构得到滤波后的信号。
(3) 使用DWT将滤波后的一维信号转变为二维时频谱。
(4) 对二维时频谱进行灰度化,得到灰度图像,并经过像素增强和形态学膨胀处理,获得需要的特征图,并构建数据集。形态学膨胀操作如下:
A⊕B={x,y|(B)xy∩A≠∅}。
(17)
式中:⊕为膨胀操作;A⊕B表示用图像B膨胀A;x,y为像素点。
(5) 初始化改进的GoogLeNet网络,将其中卷积核、池化层和全连接层权值等初始化为0或近似0的随机数,设置学习率、迭代次数等参数。
(6) 以批量方式将上述构建的数据集样本输入改进的GoogLeNet网络进行训练,获取故障类别,并计算期望输出与实际输出的误差。
(7) 根据训练得出的accuracy和loss调节网络参数。
(8) 重复步骤(6)和步骤(7),直到网络精度达到要求或样本完全训练完成,最终得到理想的GoogLeNet网络。
3 实验与分析
3.1 实验数据
为验证本文方法的可行性,选用CWRU公开的轴承振动测试数据集进行实验,一般认为该数据集是检验轴承故障诊断方法的基准,实验平台如图10所示[7]。待测滚动轴承型号为SKF6205,系统的采样频率为12 kHz,选用轴承驱动端的实验数据。该数据分别在轴承内圈、外圈和滚动体上人为制造单点故障缺陷,故障损伤直径分别为0.18 mm、0.36 mm、0.54 mm,负载为0 W(对应转速为1 797 r/min),共有9种故障类型,以轴承转动一周为一个采样周期,取每个样本长度为200,每个故障类别250个样本。
图10 CWRU数据库实验平台
本文旨在对驱动端轴承进行诊断,实验数据包括1类正常数据和9类故障数据,以此构建数据集,如表1所示。表中标签0表示正常数据类型,标签1~3表示不同损伤直径的内圈故障类型,标签4~6表示不同损伤直径的外圈故障类型,标签7~9表示不同损伤直径的滚动体故障类型,其中训练集、验证集和测试集样本比例为3:1∶1。每个原始样本数据都是1×200的一维数据集,而GoogLeNet网络要求的输入为二维图像,同时输入二维图像也能提高CNN卷积层的运算速度,因此通过离散小波变换将一维时序序列转变为二维图像数据,再经图像处理过程,最终的图像尺度为227×227×1。
表1 滚动轴承实验样本数据
3.2 信号预处理CEEMDAN-VSSLMS算法实验分析
(1)实验一:为了验证本文所提改进VSSLMS算法的有效性,选择轴承故障信号为原信号,信号长度为500,迭代次数为1 000,并添加信噪比SNR=10 dB的高斯白噪声,其中步长参数a=1,b=2,α=2,β=1,th=2.8,分别对含噪信号进行传统LMS算法、LG-SVSLMS方法[19]和本文改进VSSLMS方法去噪验证本文方法的有效性。最后比较改进VSSLMS算法与传统LMS和LG-SVSLMS算法在归一化均方偏差(NMSD)方面的差异,如图11所示。本实验使用的NMSD表达式如下:
(18)
图11 改进VSSLMS算法与其他算法间NMSD对比
通过分析本文算法与其他算法间归一化误差曲线,不难看出本文改进VSSLMS算法在精度和收敛速度方面都优于传统LMS算法和LG-SVSLMS算法。
(2)实验二:此前已经验证本文所提改进VSSLMS算法的有效性,下面再验证CEEMDAN分解对改进VSSLMS算法性能的影响,选择轴承故障信号为原信号,信号长度为500,并添加信噪比SNR=10dB的高斯白噪声,步长参数a=1,b=2,α=2,β=1,th=2.8,分别对含噪信号进行以下两组实验:第一组,对含噪信号直接使用改进VSSLMS算法滤波;第二组,使用CEEMDAN-VSSLMS算法滤波,实验结果如图12和表2所示。另外采用均方误差(MSE)和信噪比(SNR)评价两组实验,均方误差表示真值与观测值之间的偏差,其值越小,算法稳定性越高;而信噪比越大,表示信号中噪声含量越小,去噪性能越高。表达式如下:
(19)
表2 CEEMDAN对改进VSSLMS算法性能影响的比较
图12 CEEMDAN对VSSLMS算法滤波效果影响对比
(20)
图12a和图12b为原始信号和含噪信号,图12c是直接使用改进VSSLMS算法的滤波结果,12d是使用CEEMDAN-VSSLMS算法的滤波结果。 不难发现,直接使用改进VSSLMS算法滤波时,由于自适应滤波算法的本身特性,需要根据误差依次迭代,逐步提升算法性能,因此在迭代前期会出现算法失效甚至信号丢失的问题;而CEEMDAN能避免迭代前期信号丢失的情况,保证改进VSSLMS算法在迭代开始也有很好的滤波效果。表2是CEEMDAN对改进VSSLMS算法性能影响的比较,可以看出,使用CEEMDAN能提高改进VSSLMS算法滤波后的信噪比,且CEEMDAN-VSSLMS算法能获得更小的均方误差,提升算法性能。
3.3 故障识别实验分析
(1)实验一:为验证本文所提方法在滚动轴承故障诊断应用中的有效性,进行以下实验,将采集到的滚动轴承故障信号进行滤波之后,使用DWT将一维振动信号转换为二维时频谱,再通过灰度化、像素增强和形态学处理后,建立数据集,并将数据集输入改进的GoogLeNet网络进行训练,最后用Softmax分类器进行分类,实现滚动轴承故障诊断。实验数据集如表1所示,共2 500个实验样本,卷积神经网络的学习率为0.001,验证频率为3,迭代轮数为100,最大迭代次数为300。分别进行5次实验训练,最终训练accuracy和loss如图13所示。
图13 训练结果
图13a是3种故障数据集的识别准确率曲线,由图可知,使用本文所提方法进行故障诊断,内圈和滚动体故障识别效果接近,准确率能达到98.71%以上,外圈故障识别效果最差,但准确率也能达到96.66%以上;图13b是其对应的损失函数曲线,3种故障数据集训练所得损失函数最终都能稳定在0.1以下,其中内圈故障数据集和外圈故障数据集损失函数相近。
(2)实验二:本实验为验证在噪声的环境下,使用本文方法进行滚动轴承故障诊断的效果差异。将采集到的轴承故障数据添加信噪比SNR=10 dB的高斯白噪声,并进行以下两组实验:第一组,不做降噪处理,对含噪轴承振动信号直接使用DWT获得二维时频谱,再经图像处理过程,构建不降噪数据集,最后使用本文提出的改进GoogLeNet网络训练并分类;第二组,先使用本文提出的CEEMDAN-VSSLMS算法进行降噪处理,然后进行DWT得到二维时频谱,经图像处理过程后构建降噪数据集,最后使用改进GoogLeNet网络训练并分类。实验数据集如表1所示,训练参数不变。通过对比两个数据集训练精确度和损失函数,比较本文方法在有无噪声环境下的性能差异,如图14所示。
图14 故障识别效果对比曲线
如图14所示,对于有噪声的数据集,不使用本文所提的CEEMDAN-VSSLMS降噪算法进行预处理,由于噪声干扰特征提取能力,所得准确率曲线不够光滑,收敛速度较慢;而先使用本文所提降噪算法进行处理,能够避免噪声影响特征提取,获得的准确率曲线和损失函数曲线都更加光滑,收敛速度也更快。表3是在有无噪声的环境下,几种网络模型故障识别率对比情况。
表3 有无噪声环境下故障诊断方法效果比较
如表3所示,分别使用传统GoogLeNet模型、改进GCN-SL[10]、本文方法进行故障识别的结果对比。不难发现,本文方法不管是在无噪声环境下还是有噪声环境下,故障识别准确率都优于传统GoogLeNet模型与改进GCN-SL方法;另外,传统GoogLeNet模型、改进GCN-SL和本文方法3种方法,从无噪声环境到有噪声环境,其故障识别准确率分别降低了7.21%、4.63%和0.73%,说明本文方法的抗噪性能优于其他方法。
4 结束语
本文提出一种基于信号固有模式深度建模分析的滚动轴承故障诊断方法。首先提出一种改进的可变步长LMS算法,结合CEEMDAN分解完成对采集到的滚动轴承故障信号的滤波过程;然后使用DWT将一维时序序列转化为二维时频谱,并进行图像处理;最后用处理好的图像构建数据集,使用改进GoogLeNet网络训练,并经过Softmax分类器完成滚动轴承的故障诊断。实验结果表明:
(1)噪声会严重影响CNN网络模型的诊断精度,通过本文提出的CEEMDAN-VSSLMS滤波方法进行预处理,能够有效去除噪声干扰,提高模型的故障识别能力。
(2)与传统的GoogLeNet网络相比,本文先通过图像处理过程弱化不重要的特征,凸显重要特征,使得不需要太深的网络就能有效提取到故障特征,降低了模型的计算复杂度,提高了计算效率。实验表明,在噪声背景下内圈和滚动体故障识别准确率能达到98.71%以上,外圈故障识别率能达到96.66%以上。
在本研究中,使用CWRU公开的轴承振动测试数据集进行实验,该数据集是周期性一维数据,应有针对性的选取单一周期、完整性好、干扰频率少的数据段作为训练样本;此外,本文数据集为保证平衡性将各标签类型样本量统一,但实际上样本量不平衡也是影响诊断效果的因素,下一阶段将研究样本不平衡性及数据集大小对于轴承故障诊断效果的影响。