基于主成分分析的多域特征融合轴承故障诊断
2024-04-30周凌孟邓飞其张清华孙国玺苏乃权朱冠华
周凌孟,邓飞其,张清华,,孙国玺,苏乃权,朱冠华
(1.华南理工大学自动化科学与工程学院,广东广州 510000;2.广东石油化工学院,广东省石化装备故障诊断重点实验室,广东茂名 525000)
0 前言
随着科学技术的发展,机械结构日益复杂化且耦合程度逐渐增加,一旦某个零件发生故障将可能导致整个系统瘫痪甚至导致重大事故的发生。旋转机械轴承作为机械设备中最常见且故障发生率最高的零件之一,其故障诊断一直是研究热点[1-2]。
轴承的故障诊断本质是模式识别问题,主要分为信号采集、特征提取与选择、分类识别[3]。在信号采集方面,振动分析方法是当前分析轴承问题最多且最有效的方法之一[4],当滚动轴承发生故障时,零件工作面与故障区域会发生碰撞,轴承的振动信号将发生变化。研究发现提取轴承的振动信号用于分析轴承故障可取得较好的诊断效果[5]。在特征提取方面,通过时域、频域和时频域等振动特征可以分析轴承的运行状态并进行诊断与定位。戴邵武等[6]通过提取轴承时域特征与支持向量机结合实现了对轴承的寿命预测。通过信号分离思想对传统时域量纲一化特征进行改进后,新量纲一化特征也能取得较好的诊断效果[7]。通过经验模态分解(Empirical Mode Decomposition,EMD)方法提取轴承时频特征,可以消除信号噪声,对轴承实现了更加精确的诊断[8]。但是通过单域特征进行分类具有一定的局限性,复杂工况下旋转机械的状态特征在单域信号下有时很难体现,通过对多域特征进行选择与融合,可以将各优势特征互补、减少干扰数据并且增加分类模型的鲁棒性与诊断准确度。DING等[9]通过局部保持投影的特征融合方法对振动特征进行融合,融合后特征维数降低且对故障区分度更高。LI 等[10]则提出了一种加权多维特征融合方法,根据所选特征的灵敏度对多特征进行加权和融合。通过两步振动信号融合方法对振动信号和声音信号进行融合,大大改善了单信息源的识别效果[11]。通过特征选择反馈网络与证据理论结合的方法也能实现对多特征的选择与融合[12]。主成分分析方法(Principal Component Analysis,PCA)近年来快速发展并得到了广泛应用,在特征降维的基础上可以降低模型复杂性、增加诊断时间与准确率[13]。
对于滚动轴承的识别分类,贝叶斯、K-近邻算法、神经网络、支持向量机等有监督机器学习分类方法都得到了有效应用。石怀涛等[14]利用贝叶斯优化长短期记忆网络实现了早期轴承故障的检测。YAN等[15]利用堆叠稀疏自动编码网络进行特征降维后,使用K-近邻算法处理轴承的多分类问题。而卷积神经网络(Convolutional Neural Network,CNN)作为一种新的趋势今年来在轴承数据分类也取得了较好的效果[16],相比于其他的经典分类模型分类准确度更高。
目前轴承故障诊断的研究中,基本只提取了单域特征,但单域特征往往很难对运行在复杂环境下的旋转机械轴承非线性故障进行区分。针对单域特征描述故障状态的局限性,本文作者提取轴承时域、频域和时频域三域振动特征进行融合,将各域特征进行优势互补来增强模型的鲁棒性与分类准确性。针对多域特征融合后的冗余性,使用PCA对融合特征进行降维来降低模型的复杂性。最后结合卷积神经网络模型在轴承分类上的良好诊断性能实现对轴承故障的精确快速诊断。
1 轴承故障诊断相关知识
文中轴承的故障诊断流程主要分为3步:轴承振动数据的采集;轴承时域、频域和时频域三域特征的提取,并使用主成分分析方法对三域特征进行融合与降维;使用卷积神经网络对轴承状态分类识别。
1.1 特征提取
1.1.1 时域特征提取
当轴承部件发生故障时,其时域信号往往会随之变化,时域特征提取是对原始信号幅值域的数学统计方法,此方法直观简单且便于计算。文中在传统量纲一化特征的基础上,提取时域全新量纲一化特征指标。首先通过信号分离的思想将故障信号分离为故障信号、无故障信号与噪声信号,然后进一步构造出全新的量纲一化特征指标[7]。
观测到的振动信号的数学模型z(t)可以定义为
z(t)=y(t)+cs(t-τ)
(1)
其中:y(t)为故障信号与噪声信号的叠加;s(t)为无故障信号;τ为延迟时间;c为振动信号z(t)与延迟后的无故障信号s(t-τ)的相关系数。全新的量纲一化特征指标γys定义为
(2)
其中5个主要的新量纲一化特征如表1所示。
表1 五个新量纲一化特征
1.1.2 频域特征提取
当轴承发生故障时,往往会引起信号频域信息发生变化,而通过傅里叶变换的方法将时域信号变化到频域,再通过统计频域信息可得到此变化趋势。主要频域分析方法有功率谱分析、倒频谱分析与包络谱分析等。文中对信号的幅值谱进行分析提取频域特征,幅值谱定义为
(3)
频域特征指标主要有以下4个:
(1)均值频率:
(4)
(2)重心频率
(5)
(3)均方根频率
(6)
(4)标准差频率
(7)
其中:X(k)表示信号x(n)的幅值谱第k条谱线的幅值;fk表示功率谱第k条谱线的频率值。
1.1.3 时频域特征提取
频域分析方法虽然对平稳信号的分析效果较好,但它是整个时间域上的积分,不能体现局部时间内信号的频域特性。而EMD方法能够克服频域分析的缺点,将非平稳、非线性的时间信号分解成一系列频率从高到低的线性稳态内蕴模态函数(Intrinsic Mode Function,IMF),且每个IMF分量的频率成分随信号的变化而变化。
1.2 PCA特征融合
文中提出一种PCA的特征融合方法,用于融合三域特征并实现降维处理。PCA是一种基于多元统计技术的特征选择方法,通过统计特征的多维正交线性变换将特征数据集从原始空间降维到主成分空间,将原始空间中具有一定相关性的特征重新组合,形成一组彼此互不相关的全新特征指标。
首先通过相加的方式将三域特征映射到共享子空间中,融合后特征向量矩阵表示为Xn=[xn1,xn2,xn3,…,xnl]T,n表示样本总数,l表示融合特征个数。根据PCA方法利用方差贡献率取前m个主成分对特征向量矩阵实现降维,降维后Xn=[xn1,xn2,xn3,…,xnm]T。处理后样本特征维数降低,能有效降低数据分析难度和诊断模型的复杂度。
1.3 卷积神经网络
作为一个崭新领域,神经网络在目标检测、自然语言处理和机器视觉等方面都取得了很好的应用效果。CNN是其中一种较为经典且得到广泛应用的结构,卷积神经网络通过局部连接、权值共享和最大池化等策略能有效降低神经网络的模型复杂度,使模型具有更好的鲁棒性和容错能力。卷积神经网络的模型结构主要有输入层、特征提取层、全连接层以及输出层。其分类过程如图1所示。
图1 卷积神经网络分类过程
1.3.1 特征提取层
特征提取层又分为卷积层和池化层,卷积层与池化层一般有多个,通过一个卷积层连接一个池化层的方式设置模型。
(1)卷积层
卷积层是卷积神经网络的核心,主要作用是对输入层的数据进行特征提取。卷积层有多个特征面,每一个特征面含有多个神经元,每个神经元与输入特征面局部连接,通过卷积核的计算将局部加权结果传递给激活函数即可获得每个神经元的输出值。由于同个输入特征面与输出特征面卷积核相同,可实现权值共享,能大大减小模型复杂度。假设输入特征面神经元为xi,j,卷积核为wi,j,i和j表示第i行第j列,偏置为b,则输出特征面对应神经元y可表示为
(8)
卷积是一种线性、平移不变的运算,而真正的特征数据往往是非线性的,故需引入激活函数来实现非线性构造。常见的激活函数有tanh函数、Sigmoid函数和ReLU函数等。假设激活函数为f(y),则每个神经元通过激活函数的输出h可以表示为
h=f(y)
(9)
(2)池化层
池化层主要通过压缩卷积层特征来减小模型复杂度。最常使用的池化方式有平均池化和最大池化。池化层也需定义一个类似卷积核一样的滑动窗口来提取重要特征,但窗口本身并没有任何权值参数。池化层的输出特征面的每个神经元与卷积层的输出特征面进行局部连接,使用池化窗口计算进行输出。
1.3.2 全连接层与输出层
全连接层将经过特征提取层提取的特征进行扁平化处理再展开成特征向量,全连接层可以有多个,每个全连接层的神经元与前一层所有神经元全连接,通过激活函数输出。假设x为上层全连接层特征面,w为权值参数,b为偏置,下层全连接层的单个神经元输出y可以表示为
y=w·x+b
(10)
最后的全连接层输出值传递给输出层,输出层使用分类函数进行分类。一般使用Softmax函数进行分类,它能将全连接层网络输出的最后一层神经元的每一个数值映射到0~1的一个实数空间,并且使得所有神经元的数值加起来为1。假设yi表示输出层第i个神经元的值,n为类别的个数,则:
(11)
2 故障诊断流程
文中基于主成分分析的多域特征融合轴承故障诊断方法诊断过程主要分为三部分:特征提取部分、特征融合与选择部分、卷积神经网络诊断分类部分,诊断流程如图2所示。
图2 诊断流程
2.1 特征提取部分
通过传感器采集机组的振动信号,分别提取时域、频域与时频域特征数据。
2.1.1 时域特征提取
提取5个新量纲一化波形、峰值、脉冲、峭度、裕度特征,具体提取流程如图3所示。
图3 新量纲一化特征提取流程
(1)在机械设备的运行初期,通过振动传感器采集设备的振动信号,定义为无故障s(t)信号,对s(t)归一化并经过快速傅里叶变换得到无故障频域信号s(k)。
(2)采集机械设备实时振动时域信号z(t),对z(t)做快速傅里叶变换得到z(k)。
(3)对无故障频域信号s(k)取共轭得到s*(k),将z(k)与s*(k)相乘得到h(k),对h(k)做快速傅里叶逆变换得到z(k)与s*(k)的相关函数n(t)。|n(t)|的最大值所对应的时间点为实时振动信号z(t)与无故障信号s(t)的延迟时间τ,τ=argmax|n(t)|。
(4)计算实时振动信号z(t)与延迟后的无故障信号s(t-τ)的相关系数c,c=E[z(t)s(t-τ)]。
(5)混合振动信号y(t)=z(t)-cs(t-τ)。
(6)根据表1求得5个新量纲一化特征。
2.1.2 频域特征提取
首先通过式(3)求得振动信号的幅值谱X(k),然后通过式(4)—(7)分别提取信号的均值频率、重心频率、均方根频率、标准差频率4个频域特征。
2.1.3 时频域特征提取
通过EMD方法提取信号中能量占比最高的主要分量,然后通过Hilbert变换求出每个IMF分量的瞬时频率,取每个IMF分量得平均频率作为时频特征,具体步骤如下:
步骤1,对信号x(t)进行EMD分解,分解成多个IMF分量:
(1)确定信号x(t)的局部极值点,判断极值点是否大于2个,是则继续,否则结束判断,x(t)无法进行分解。
(2)通过信号序列的极大极小值数据,通过插值法求得上下包络线,取2条包络线的均值为m1。
(3)求信号x(t)与m1的差值h1,并判断h1是否符合IMF分量的判定条件。判定条件为:①在整个数据长度范围内,极值点和过零点的个数必须相同或者相差一个。②在任意数据点,其上下包络线的平均值为0。若h1不满足判定条件,则将h1作为原始数据,重复(1)(2)继续判定。若满足判定条件,则将h1作为第一个IMF分量。
(4)取x(t)与h1的差值作为新的数据,重复(2)(3)求新的IMF分量,直到新的函数极值点少于2个,则分解结束,最终所有的IMF分量记为ci(t)(i=1,2,…,k)。
步骤2,对主IMF分量运用Hilbert变换求时频谱图。
由于每个IMF分量对称且局部均值为0,满足瞬时频率计算对信号数据的约束条件,可以使用Hilbert变换求解每个IMF分量在时间域上的瞬时频率。
对每个IMF分量ci(t)做Hilbert变换,得
(12)
P为柯西主值,ci(t)与Hi(t)组成一个解析信号Zi(t):
Zi(t)=ci(t)+iHi(t)=αi(t)ejθi(t)
(13)
则瞬时频率为
(14)
均值频率为
(15)
取m主IMF分量的均值频率作为时频特征。
2.2 特征融合与选择部分
对特征提取部分的三域特征进行融合与选择,假设样本总数为n,则提取的时域、频域、时频域特征向量矩阵可以表示为:X1=[a1,a2,a3,…,an],X2=[b1,b2,b3,…,bn],X3=[c1,c2,c3,…,cn]。将X1、X2、X3以并联相加的方式融合成新的特征X,X=X1+X2+X3=[a1+b1+c1,a2+b2+c2,…,an+bn+cn]=[x1,x2,x3,…,xn]。使用PCA主成分分析方法将融合特征X降维到m维,具体步骤如下:
(1)将数据X平均化,即所有样本特征减去其均值。
(2)计算协方差矩阵A=1/nXXT。
(3)计算矩阵A的特征值与特征向量。
(4)依据方差贡献率将特征值从大到小排序,选择其中占比95%以上的m个特征值,将对应的特征向量作为行向量组成新的特征向量矩阵P。
(5)将数据转换到m个特征向量构建的新空间Y=PX。
2.3 卷积神经网络诊断分类部分
将特征融合与选择后的轴承特征数据使用卷积神经网络分类模型进行诊断分类,具体步骤如下:
(1)将n个m维特征数据样本分为训练集与测试集。
(2)搭建合适的卷积神经网络模型:①选择合适的卷积层、池化层数量与连接方式;②初始化卷积神经网络参数,如卷积核、迭代次数、激活函数、损失函数与优化函数等。
(3)以批量方式将训练集输出到卷积神经网络输入端,通过前向传播从输出端获得样本诊断类别并计算损失函数。
(4)使用误差反向传播算法与优化函数对神经网络模型的权值参数进行更新。
(5)重复步骤(3)(4)直到满足准确率或者达到迭代次数,完成模型训练。
(6)将测试集数据输入到训练好的模型中测试模型诊断效果。
具体步骤如图4所示。
图4 卷积神经网络诊断分类流程
3 轴承故障诊断实验分析
为验证基于主成分分析的多域特征融合轴承故障诊断方法的有效性,将其应用在石化大机组实验平台的轴承部件上进行验证。
3.1 实验平台与数据采集
石化大机组实验平台由广东省石化装备故障诊断重点实验室提供,平台主要由离心鼓风机、振动加速度传感器、固定架、不同状态滚动轴承故障件、数据采集器等组成,如图5所示。
图5 石化大机组实验平台
轴承状态有外圈故障、内圈故障、滚珠缺失和正常状态4种,可通过数据采集器采集设备振动信号。采样频率为1 000 Hz,转速为1 000 r/min,每种状态分别采集数据点500 000个,原始数据分布情况如图6所示。
图6 原始数据分布
3.2 特征提取
实验分别提取时域、频域和时频域的特征数据用于诊断分类。
3.2.1 时域特征提取
提取5个新量纲一化特征:波形、峰值、脉冲、峭度、裕度。每1 000个数据提取5个时域特征指标,每种时域特征指标数量为500个,对不同时域特征数据做归一化处理,不同时域特征在不同轴承状态的数据分布如图7所示。
图7 时域特征数据分布
3.2.2 频域特征提取
通过频域特征提取方法提取均方根频率、中心频率、均值频率和标准差频率4种频域特征,每个特征指标数量为500个,对不同频域特征数据做归一化处理,不同频域特征在不同轴承状态的数据分布如图8所示。
图8 频域特征数据分布
3.2.3 时频域特征提取
对4种轴承状态数据运用经验模态分解方法提取时频特征。以轴承正常状态中1 000个数据为例,可分解成7个IMF分量和1个残余分量,各IMF分量与Hilbert变换谱如图9所示。
图9 IMF分量(a)及其Hilbert变换(b)
图9中X1为轴承正常状态原始数据,c1-c7为运用EMD方法分解的7个IMF分量,r为残余分量,h(ci)为第i个IMF分量的瞬时频率。如图9所示,X1的能量基本集中在前4个IMF分量之中,故提取前4个IMF分量的瞬时频率的均值作为时频域特征指标ki(i=1,2,3,4)。
ki=mean(h(ci))i=1,2,3,4
(16)
各轴承状态原始数据中每1 000个数据提取4个时频域特征指标并进行归一化处理,时频域特征数据分布如图10所示。
图10 时频域特征数据分布
3.3 特征融合与选择
实验通过特征提取部分提取了时域、频域与时频域特征共13种特征,分别是5种时域特征x、4种频域特征y和4种时频域特征k,将三域特征融合成13维特征h,h=x+y+k。
运用主成分分析方法对13维特征数据h进行降维处理,提取主成分特征。降维后各主成分的方差值占总方差值的比例即方差贡献率如表2所示。
表2 各主成分方差贡献率
从表2中可知:前7个主成分主方差贡献率达到了98.4%,故选取前7个主成分作为降维后特征数据。
3.4 卷积神经网络诊断分类与分析
3.4.1 卷积神经网络诊断分类
文中实验卷积神经网络模型基本结构为:(1)2个卷积层,卷积层层数分别为5层和10层,卷积核大小都为3×3,使用的激活函数为ReLU函数,δpadding=1;(2)3个全连接层,长度分别为70、20和4,使用的激活函数为Sigmoid函数。网络中损失函数为交叉熵函数,优化函数为一阶Adagrad函数,定义学习率lr=1×10-3,正则化系数σweight_decay=1×10-4,迭代次数为300次,批量大小为32。
将7维融合特征数据打乱后分为训练集与测试集,测试集在卷积神经网络中的分类准确率为86%,迭代次数与诊断准确率结果如图11所示。
图11 卷积神经网络诊断结果
3.4.2 卷积神经网络与不同算法比较
在实验过程中,选取朴素贝叶斯分类方法、支持向量机分类方法、K-近邻分类方法、随机森林分类方法这几种具有代表性的机器学习分类模型与卷积神经网络分类模型进行比较,各模型对融合数据的诊断准确率如表3所示。
表3 不同分类算法诊断准确率
由表3可以看出:卷积神经网络分类模型相比其他分类模型的诊断效果更好,更适用于旋转机械轴承的故障诊断。
3.4.3 融合数据诊断分类
将单独的时域、频域、时频域特征数据和经过文中特征融合选择后的特征数据输入到卷积神经网络模型中进行分类,诊断分类的结果如表4所示。
表4 不同特征诊断效果
由表4可以看出:通过文中基于PCA多域特征融合的特征数据,相比单独的时域、频域与时频域特征指标的诊断准确率更高,并且相比未降维的特征数据诊断时间更短,证明文中方法在轴承故障诊断中的有效性。
4 结论
文中提出一种基于主成分分析的多域特征融合轴承故障诊断方法,并将它应用于石化大机组实验平台轴承故障诊断。诊断过程中提取了时域、频域和时频域三域特征,消除了单一特征在故障表达方面的不足,三域融合特征相比单域特征的诊断准确率更高,达到了86%。而主成分分析方法可以对三域融合特征进行降维,在保持原特征信息的前提下降低了模型的复杂性,减少了分类时间。卷积神经网络分类模型也能实现对融合特征数据的精确诊断,相比其他分类模型诊断准确率更高。