用于齿轮箱复合故障诊断的三阶段混合式特征选择方法研究*
2022-10-11章翔峰
章翔峰 刘 迪 姜 宏
(新疆大学机械工程学院,新疆乌鲁木齐 830046)
旋转机械在工业应用中扮演着极其重要的角色,而齿轮箱几乎是所有旋转机械中必不可少的组成部分[1]。因此,对齿轮箱进行故障诊断是维护旋转机械设备正常运行的必要手段。
目前,对齿轮箱中单部件和单故障类型的研究已经比较深入,周建民等[2]提取时域特征和能量熵特征,基于相关性、单调性和鲁棒性3种指标从中选择最佳的轴承退化特征;Zhang K等[3]结合了多种特征选择模型,提出了一种混合式特征选择算法,应用于选择轴承和定子绕组的特征频率。而对复合故障诊断的研究往往侧重于同一部件,如齿轮或轴承,胡爱军等[4]以最大相关峭度为依据优化变分模态分解(variational mode decomposition, VMD)参数,结合1.5维谱用以分离滚动轴承复合故障特征;张振海等[5]提取齿轮振动信号的小波包能量谱特征,通过多分类支持向量机(multi-class support vector machine,MSVM)进行诊断。然而,齿轮箱中往往存在不同部件故障同时发生,这种复合故障却很少被研究。
因此,研究不同部件故障同时发生的复合故障诊断方法成为故障诊断领域相关研究人员的一项重要任务。轴承和齿轮作为齿轮箱中最重要的部件,因受多元激励共同作用等恶劣环境影响,极易发生故障,且当轴承出现故障后,会影响齿轮的振动特性,反之亦然[6],加之复合故障特征之间发生耦合,使得齿轮-轴承复合故障的诊断变得极为困难。故障诊断通常由特征提取和模式识别两部分组成,获得一个优质的特征集是实现故障诊断的关键,然而,由于故障信息分散在多个域中且特征间相互耦合等影响,构造的特征集中往往存在着大量冗余和无关的特征。这些特征对分类器提供的信息有限,甚至会造成干扰[7],且特征集维数过大会导致分类器需要更长的训练时间。
为了克服上述问题,国内外学者通过特征选择技术从原始高维特征集中筛选出敏感特征,在提升分类准确率的同时尽可能减少特征集的维数。李帅位等[8]提出了一种利用Grassmann流形的多聚类特征选择方法,应用于滚动轴承故障数据集。Zhang X L等[9]提出了一种混合式算法应用于滚动轴承故障和转子故障,该方法可以在获得最优特征子集的同时优化支持向量机(support vector machine,SVM)的参数。Buchaiah S等[10]使用了一种嵌入式特征选择方法-随机森林来确定轴承故障特征集的最优子集,并在进一步使用降维技术进行融合后通过SVM进行分类,这些方法取得了较好的应用表现,但存在计算复杂,多个关键参数需要人为设定等问题。
特征选择算法已在故障诊断领域中得到广泛应用,但在复合故障诊断中的应用仍较为少见,基于以上分析,本文结合了多篇前人在故障诊断中开展的应用,提出了一种综合多种特征选择模型的三阶段混合式特征选择方法,用于齿轮箱中的齿轮-轴承复合故障诊断。首先通过从时域、频域及特征值域中提取故障特征以获取更全面的故障信息,然后在特征排序阶段中利用4种过滤式模型从3个测度对特征进行评价,接着在加权排序阶段中通过模型的评价结果在径向基(radial basisfunction,RBF)网络中表现出的分类精度,以加权的方式综合不同评价结果,对特征重新进行排序,然后在特征筛选阶段中使用RBF网络结合3种启发式搜索方法,按照排序结果迭代筛选出最优特征子集,最后通过RBF网络实现故障分类。
1 理论基础
1.1 特征选择模型
依照评价标准的不同,可将特征选择算法分为过滤式(filter)、封装式(wrapper)、嵌入式(embedded)和混合式(hybrid)算法[11]。其中过滤式算法依据评价准则对特征进行排序,计算效率高,但评估结果与后续分类器的性能偏差较大;而封装式算法依据识别准确率筛选特征,偏差小,但计算量大,不适合高维数据集;因此先使用过滤式算法对特征进行评价,再使用封装式算法按照评价结果精细筛选的混合式算法得到了广泛应用。
由于仅使用单一评价准则会造成选择后的子集中存在无关或冗余特征,且无法保证子集是最优的而非次优的,因此本文使用多种特征选择模型综合考虑不同评价准则,首先使用4种过滤式算法分别通过距离、信息和相关性测度对特征进行评价。
1.1.1 费舍尔分值法
在费舍尔分值(Fisher score,FS)法中,每个特征都是根据其Fisher标准分数独立选择的,Fisher得分越大,该特征的辨别力就越强。给定特征x,FS的计算公式如下[12]
其中:x+、x-分别表示正样本和负样本,l+、l-分别表 示正样本和负样本的个数,-表示均值。
1.1.2 距离评估技术
距 离 评 估 技 术(distance evaluation technique,DET)与FS同为基于距离测度对特征进行评价,文献[13]提出了一种改进DET算法,通过计算类间距离和类内距离的比值作为距离评估因子,得分越大,相应的特征越易于区分不同类。
1.1.3 信息增益
信息增益(information gain,IG)基于信息测度对特征进行评价,是对特征的先验不确定性和预期的后验不确定性之间差异的度量,特征的信息增益越大,判别能力越好。给定特征x和其对应的标签y,IG的计算公式如下:
其中:H() 表示信息熵,H(|)表示条件熵。
1.1.4 皮尔逊相关系数
皮尔逊相关系数(Pearson correlation coefficient,PCC)基于相关性测度对特征进行评价,它可以用来衡量特征和类之间的相关性。得分越高,特征区分不同类的能力越好。给定特征x和其对应的标签y,PCC的计算公式如下
其中:-表示均值。
然后在封装式算法中将采用3种随机搜索策略来调整子集以获得近似的最优子集。
1.1.5 二分查找
二分查找(binary search,BS)将候选特征集分为两部分:左子集和右子集。如果左子集的分类错误率低于阈值,则保留左子集以进行进一步搜索,并删除右子集,反之亦然。当下一个左子集和右子集的错误率都高于阈值时,迭代过程停止。
1.1.6 序列向前查找
序列向前查找(sequential forward search,SFS)的过程是在开始子集中一次增加1个特征。当分类精度没有随着特征的增加而提高时,迭代过程停止。
1.1.7 序列向后查找
序列向后查找(sequential backward search, SBS)的过程与SFS相反,在开始子集中一次减少1个特征。当分类精度没有随着特征的减少而提高时,迭代过程停止。
1.2 径向基网络
RBF网络是一种具有3层结构的前馈网络模型[14],凭借结构简单,收敛速度快等优点被广泛应用于故障诊断领域中,其基本结构如图1所示。本文中使用高斯函数作为RBF网络的激活函数,并通过最小化均方误差来训练网络,当误差达到目标或隐藏层神经元个数达到最大时结束训练。
图1 RBF网络结构
2 故障诊断流程
2.1 构造故障特征集
齿轮箱的振动信号中包含了丰富的故障信息,由于从单一尺度中提取故障特征很容易造成故障信息的丢失。因此为了更精细地捕捉隐藏在振动信号中的故障信息,本文首先使用经验模态分解(empirical mode decomposition,EMD)算法对原始振动信号进行分解,然后选取包含有用信息的前8个固有模态分量(intrinsic mode function,IMF),最后分别从原始振动信号和前8个IMF中提取时域、频域特征以及特征值域特征。特征值域特征[15]是通过将振动信号转化为图信号并变换到特征值域,从中提取的特征信息,它能够表征振动信号的变化特征。
最终构造的故障特征集中包括11个时域特征,13个频域特征[13]以及6个特征值域特征,共提取(11+13+6)×9=270个特征构造原始特征集。特征集中时域特征编号为1~99,频域特征编号为100~216,特征值域特征编号为217~270,特征参数的具体计算公式见表1。
表1中,时域特征参数T1和T3~T5反映时域振动幅值和能量大小,T2和T6~T11反映时域信号的时间序列分布情况;频域特征参数F1反映频域振动能量的大小,F2~F4,F6和F10~F13反映频谱的分散或集中程度,F5和F7~F9反映主频带位置的变化;特征值域特征参数P1~P6反映图信号在特征值域的幅值和能量以及波动情况的变化。
表1 特征参数
此外,为了消除奇异样本数据导致的不良影响,对特征集使用式(4)进行归一化处理。
其中:x表示原始数据,x′表示经归一化处理后的数据。
2.2 特征选择算法
本文提出的特征选择方法由3个阶段组成,分别为特征排序阶段、加权排序阶段以及特征筛选阶段,具体流程图如图2所示。
图2 特征选择流程图
特征排序阶段中,使用FS、DET、MI和Person相关系数这4种过滤式模型分别从距离测度、信息测度和相关性测度对故障特征进行评价,得到4组特征得分。
加权排序阶段中,首先按照特征得分对特征进行排序,选取排名最高的前n个特征输入RBF网络进行分类。然后将识别错误率作为权值,与每个特征排名的乘积作为对应特征的新得分。对4组特征得分重复上述操作后,每个特征均得到4个新得分,将新得分求和即为该特征的加权得分结果,加权机制如式(5)所示,最后按照由小到大的顺序重新排序。
其中:SNew表示某个特征的加权得分,EFS和RFS分别表示FS等模型的识别错误率和在对应模型的评价结果中该特征的排名。
重新排序后的特征,充分考虑了特征在不同评价准则中的表征能力,将冗余、无关特征和敏感特征以排名划分开。新的排序结果中,敏感特征排名靠前,而冗余和无关特征排名靠后,因此仅选择前几个特征便可以替代原始高维数据集,使特征集达到最高的识别准确率。
特征筛选阶段中,首先通过BS快速筛除排名靠后的冗余和无关特征,大致确定最优子集,然后以BS获得的子集为起点,分别使用SFS和SBS选择最优子集,最后比较两个子集,以其中识别准确率最高的一个为最优子集。
2.3 故障诊断流程
本文提出的齿轮箱复合故障诊断方法主要分为3个步骤:
(1)将样本集随机划分为测试样本和训练样本,然后从训练样本的原始振动信号中提取故障特征,构造高维故障特征集。
(2)对原始高维特征集使用本文提出的特征选择方法,得到最优特征子集,然后对测试样本仅提取筛选后的最优特征。
(3)使用训练样本的最优特征子集对RBF分类器进行训练,然后使用训练好的分类器对测试样本进行故障分类。
3 实验验证
为了验证本文方法的有效性,使用SQI公司的风电机组驱动系统故障诊断试验台,采集齿轮箱不同运行状态下的振动信号。试验台如图3所示,故障齿轮与故障轴承均安装在平行轴齿轮箱输入轴上,齿轮与轴承故障均通过人为加工,故障类型包括齿轮的磨损故障、裂纹故障、断齿故障以及轴承的内圈故障、外圈故障和滚动体故障。采集的样本类型包括正常状态、6种单故障状态和4种齿轮-轴承复合故障状态,详细描述如表2所示。
表2 样本类型
采集过程中,输入轴转速约为1 000 r/min,采样频率设置为20 480 Hz,对每种状态类型各采集200个样本,其中4种复合故障的时域图如图4所示,可以明显看出不同齿轮-轴承复合故障间的时域差异较小,难以直接区分。将故障样本集按照1∶3的比例划分为测试集和训练集,然后按照本文提出的诊断方法进行实验。
图4 不同齿轮-轴承复合故障的时域波形
首先将训练集中的270个特征分别通过4种过滤式模型按照判别能力由高到低排序,然后分别按照排序结果选取前20个特征输入RBF网络,当均方误差小于10-10或神经元达到200个时,训练停止。训练重复10次,取平均值作为4组次优子集的识别错误率,FS、DET、IG、PCC的识别错误率依次为2.18%、3.09%、6.82%和9.64%。将识别错误率作为权值,按照式(5)计算特征的新得分,以加权排序后排名最高的前两个特征为例:
第2个特征:24×0.021 8+58×0.030 9+5×0.068 2+14×0.096 4=4.006
第15个特征:25×0.021 8+63×0.030 9+4×0.068 2+15×0.096 4=4.210
将新得分之和按从低到高重新排序即为最终的加权排序结果,4种过滤式模型和加权排序的部分结果如表3所示。从表3中可以看出传统的时域、频域特征在信息和相关性测度中的表现要差于特征值域特征,但在距离测度中的表现更优,因此加权排序结果中排名靠前的特征中,时域、频域特征的占比要高于特征值域特征。
表3 排序结果
然后以经过加权排序后的新特征集为起点,首先使用BS将特征集均分为左子集和右子集,取其中识别准确率最高的一个为新起点,当新的左右子集的识别准确率均低于起点时停止迭代,此时由BS获取的最优子集包含17个特征。接着以这17个特征为起点,分别使用SBS和SFS各获取一个最优子集,分别包含17和18个特征,然后比较两个子集的识别准确率,取二者中最高的一个作为最优子集,本例中即是由SFS获取的包含18个特征的子集,具体筛选过程如图5所示,图中方框内为子集包含的特征,括号内为子集的识别准确率,并在括号前标注了子集内特征的个数。
图5 特征筛选阶段
最终测试集中仅提取经特征选择后的18个特征,使用经训练集训练后的RBF网络分类,得到的混淆矩阵如图6所示,11种故障状态均取得了较好的诊断结果,测试集的平均准确率达到了94.42%,然而状态9-齿轮磨损-轴承滚动体复合故障的识别准确率仅为85.33%,其误分类几乎都出现在状态7-轴承滚动体故障中,从图6中可以看出误分类大都发生在不同部件故障间以及复合故障和组成复合故障的单故障间,证明复合故障和单故障的特征相似度较高,因而降低了分类精度。
图6 测试集的混淆矩阵
为了验证本文提出的特征选择方法的优越性,设置了3组对照实验,从经加权排序阶段重新排序后的特征集中挑选特征子集,分别为:实验1,使用排名前20个特征;实验2,随机使用20个特征;实验3,使用排名后20个特征。3组实验均使用RBF网络作为分类器,网络参数保持一致,每组实验重复10次,取效果最优的1次作为结果,实验对比结果如表4所示。
表4 实验对比结果
相比于直接使用原始高维特征集,实验1的识别准确率提升了11.69%,实验2和实验3的识别准确率则分别降低了2.25%和64.49%。充分说明经加权排序阶段重新排序后,排名靠前的特征对不同故障类别的区分能力更好,而排名靠后的特征表征能力较差,无益于故障分类任务,甚至会影响特征集的分类能力。此外,当仅使用一种过滤式模型,将排序后的前18个特征作为最优子集时,同样将实验重复10次,取效果最优的1次作为结果,得到仅使用FS、DET、IG和PCC的测试集识别准确率,依次为:92.48%、92.42%、91.27%和87.45%,均低于本文方法,说明不同测度对于特征的评价能力不同,且单一测度获得的排序结果中存在冗余特征,而本文方法则筛除了冗余特征,在同样的特征维数下,取得了最高的识别准确率。
与直接使用原始高维特征集进行故障分类相比,可以发现在应用本文提出的特征选择方法后,在特征个数减少了93.3%,分类器训练时间缩短了52%的同时,提高了12.72%的识别准确率。证明本文方法可以筛除对故障类别不敏感的特征,仅保留判别能力最好的特征,可以在降低特征维数、缩短训练时间的同时,显著提高故障分类的准确率。
4 结语
本文针对齿轮箱中齿轮-轴承复合故障存在故障特征耦合,特征信息分散等问题,提出了一种综合多种特征选择模型的三阶段混合式特征选择方法。经由包含单故障和复合故障的试验样本集进行验证,试验结果表明本方法可以有效降低故障特征集的维数并提升分类能力。
(1)本文提出的特征选择算法综合了多种评价标准的优势,有效筛除了原始特征集中的冗余特征和无关特征,并通过启发式搜索策略迭代搜索获取最优特征子集。
(2)本文提出的特征选择方法能够从高维特征集中自动确定最优特征子集,从而在成功降低特征维数的同时取得最高的识别准确率。
(3)与直接使用原始高维特征集相比,应用本文提出的特征选择方法减少了93.3%的特征个数并提升了12.72%的识别准确率,同时也缩短了测试集故障特征的提取时间和分类器的训练时间。