APP下载

一种基于信号特征提取和组合分类的设备故障诊断方法

2021-02-25罗家文钱晓明屠嘉晨楼佩煌

机械设计与制造工程 2021年1期
关键词:分类器故障诊断权重

罗家文,钱晓明,屠嘉晨,楼佩煌

(南京航空航天大学机电学院,江苏 南京 210016)

设备故障诊断自工业生产出现以来就已存在,在经历了原始手工诊断和近代仪表诊断后,20世纪60年代现代故障诊断技术进入了基于传感器和计算机技术的诊断阶段,诊断设备逐步实现自动化,涌现出多种基于信息检测和数据处理的诊断方法。20世纪80年代,设备诊断技术进入智能化阶段,专家系统、人工神经网络、关联规则分析等多种人工智能和数据挖掘技术成果应用于设备诊断领域,形成了多种故障诊断、故障预测和健康管理系统,实现了具有自适应、自学习、自诊断能力的智能化诊断。

在故障诊断方法的研究和应用中,夏颖怡[1]提出了一种将双树复小波变换(DT-CWT)和经验模态分解相结合的轴承故障诊断方法,有效提取强背景噪声下的故障特征信号,并识别出轴承中的不同故障类型。唐立力等[2]提出了一种基于遗传算法的BP神经网络滚动轴承故障诊断方法, 利用遗传算法进行 BP 神经网络的权值和阈值优化,并用优化后的 BP 神经网络进行故障诊断。袁海文等[3]将RBF神经网络应用于故障诊断,提高了网络训练速度,克服了网络训练易陷入局部极小的缺点。程进军等[4]对神经网络算法进行了改进,在神经网络的权重学习中运用了改进遗传算法,从而提高了BP神经网络的计算精度。毕凤荣等[5]通过对小波包变换(WPT)、遗传算法(GA)、BP神经网络(BPNN)和支持向量机(SVM)的综合利用,提出了一种柴油机气门间隙故障诊断方法,其提出的特征分类算法准确度达到了100%。不同于以上方法,本文提出了一种基于多种基分类器的多分类改进Adaboost提升算法,该算法以BP神经网络、支持向量机和k-最近邻分类[6]3种算法作为基分类器,通过Adaboost提升算法来进行基分类器的组合,从而构建二分类的Adaboost组合分类器,再通过组合多个Adaboost组合分类器来实现多故障类型的故障诊断。

1 汽车总装输送装备故障诊断框架

汽车总装输送线上有众多设备,包括旋转台、叉式移载机、皮带提升机、侧顶机、轨道系统等。但是大多数设备都具有相同的关键零部件,如减速箱、电机、轴承等,而这些零部件能否正常工作往往决定了整个设备的性能。因此,对于汽车总装输送装备的故障诊断主要是基于对这些关键零部件的故障诊断。为了实现对主要零部件的故障诊断,建立了如图1所示的故障诊断框架。

图1 汽车总装输送装备零件故障诊断框架图

首先采集能够反映零件状态特征的传感器数据信号,然后通过对传感器数据信号的处理提取零件的信号特征,从而构成零件状态的特征参数。以特征参数作为输入,通过故障诊断算法对故障诊断模型进行训练。由于算法复杂,且需要花费一定时间,故将模型的训练做成离线式,这样有助于减轻在线系统的压力。

2 信号特征提取方法

信号特征提取方法的核心部分是将信号分解成稀疏的信号,其目的是剔除无用信息,构建一种将有用信号包含在内的正交基。将经验小波变换(empirical wavelet transform,EWT)和奇异值分解(singular value decomposition,SVD)两种方法相结合来提取信号的特征,为下一步故障分类作准备。

EWT[7]是由Gilles在2013年将小波变换的科学性与经验模式分解(EMD)[8]的自适应优势结合起来而提出的一种用于信号自适应的分析方法,该方法通过分割傅里叶频谱构造适当的正交小波滤波器组,通过Hilbert变换获取所有分信号的频谱特征。矩阵的奇异值分解是信号处理领域重要的工具之一,它把离散信号根据特定的排列方式构造成矩阵,然后再进行加工处理,从而通过与众不同的处理方法完成对复杂信号的有效分析。

首先对采集来的原始信号进行经验小波变换,将原信号分解为多个不同频率的模态分量。对于非平稳信号,通常得到的模态分量数量较多。为了方便后续处理,根据模态分量和原始信号的相关性,选取相关性最高的几个模态分量进行下一步的奇异值分解。由文献[9]可知,模态分量和原始信号之间的相关性与各模态分量相互之间的相关性有关,因此可以建立各模态分量与原始信号的相关系数,其衡量了各模态分量与原始信号的相关程度,相关系数公式如下:

(1)

式中:fk(t)为各模态分量;f(t)为原始信号;μfk,μf分别为时域各模态分量和原始信号的均值;σfk,σf分别为时域各模态分量和原始信号的标准差;E为期望;ρf,fk反映了EWT的模态分量与原始信号在时域中的相关性,其数值越大,表明分量与原始信号越相关,即自相关性越大。因此选相关性最大的多个模态作为经验小波变换的最优模态,然后对最优模态进行奇异值分解。

经过奇异值分解后,若干个最优模态都分解为了许多个特征值,为了把这些特征值作为特征属性代入分类器进行分类,还需要对特征属性降维,去掉相关性低的特征属性。通过采用主成分分析(PCA)对特征属性进行降维,然后对每个模态选取合适数量的特征属性,最终组成特征向量,作为故障分类器的输入。

3 一种基于多种基分类器的多分类改进Adaboost提升算法

BP神经网络、k-最近邻分类和支持向量机等均可以用于故障诊断,但是不同的分类算法对于不同的研究案例所得出的分类结果会有所差别。有的算法对于某一数据集A的分类结果较好,却对另一类数据集B的分类结果不好。为了提高分类准确率,引入了数据挖掘中的组合分类算法,以此来改善单一分类算法的不足,达到提升分类精度的目的。

Adaboost(adaptive boosting)算法是一种提升算法。对于数据集D,它包含d个类标记的数据组(X1,Y1),(X2,Y2),…,(Xd,Yd),其中Xi是数据组,Yi是类标号。Adaboost算法归纳如下。

输入:训练数据集D,分类器个数k。

输出:一个复合模型。

步骤:

1)将D中每个数据组的权重初始化为1/d;

2)fori=1 tokdo;

3)根据每个数据组的权重进行有放回抽样,抽样得到的数据形成训练集Di;

4)根据训练集Di得到基分类器Ti;

5)计算Ti的错误率error(Ti);

6)iferror(Ti)>0.5 then转步骤3;

7) end if;

8) forDi的每个被正确分类的数据组do;

9)数据组的权重乘error(Ti)/(1-error(Ti));

10)规范化每个数据组的权重;

11)end for。

组合分类器训练完成后,使用该组合分类器对数据x分类:

1)将每个类的权重初始化为0;

2)fori=1 tokdo;

3)计算基分类器Ti的表决权重wi;

4)c=Ti(x);

5)将wi加到类c的权重上;

6)end for;

7)返回具有最大权重的类。

模型Ti的错误率error(Ti)可以根据式(2)得到,即训练集Di中每个数据组xj误分类误差的加权和。

(2)

式中:err(xj)为数据组xj的误分类误差,如果xj被误分类,则err(xj)等于1,否则等于0。如果基分类器的性能太差,错误率超过0.5,则丢弃,并且重新产生新的训练集Di和基分类器Ti。

根据Ti的错误率来对训练数据的权重更新,对于被正确分类的数据组,其权重乘上error(Ti)/(1-error(Ti))。最后,当权重都更新完成后,还需要对所有数据组的权重进行规范化,使得所有数据组的和与之前相等。提升算法根据分类器的分类情况,赋予每个分类器投票权重,错误率越低的基分类器,准确性就越高,因此权重也越高。基分类器Ti的表决权重为

(3)

对于每个类别号,对将同一类别号分配给组合分类器的所有基分类器的权重求和,将具有最大权重和的类作为返回的预测值。

由于传统的Adaboost提升算法是针对二分类问题提出的,故而对于多分类问题,可将其转化为多个二分类问题来解决。假设一共有n类,首先挑选出1和2类的训练样本,训练1和2类的分类器,再将1和3类的样本挑选出来训练分类器,依次类推,一直到(n-1)和n类的样本。这样n类样本一共建立了n(n-1)/2个分类器,之后采取投票机制。对于所有样本,分别代入每个分类器,判断所属类别,然后进行投票。各个二分类器需要赋予不同的权重,该权重可以在一定程度上提升分类精度,由于某些故障类别之间往往相似度较高难以区分,因此对于分类精度差的二分类器,给予较低的投票权重。每个分类器的投票值w可以表示为:

(4)

4 滚动轴承故障分析

为了验证算法的有效性,使用汽车总装输送装备中典型的滚动轴承的加速度数据作为实验数据。滚动轴承的故障类型分为内圈故障、滚动体故障和外圈故障。振动实验故障数据类型见表1。

表1 振动实验故障数据类型 单位:cm

按故障位置与故障直径分为9种故障类型,加上正常状态一共10种类型。轴承数据来自于如图2所示的电动升降台,其中电机的功率为1.5 kW,轴承为深沟球轴承,转速为1 797 r/min,采样频率为12 kHz。正常状态选取120个样本,其余故障状态各取25个样本,每个样本有2 048个采样点。取60个正常状态数据和每种故障各15个数据作为训练样本,剩余的样本作为检验集。

图2 实验装置

通过信号特征提取方法可得到3个模态,每个模态可以得到1 024个特征值,经过降维运算得到3个模态的前6个属性的累计贡献率,见表2。

表2 PCA降维特征值的累计贡献率 %

从表中可以看出,当特征值取前5个时,累计贡献率已经超过了99%,即前5个主成分分析(principal components analysis,PCA)降维后的特征属性可以代表原来的1 024个特征值。因此,对每个模态提取经过PCA变换后的前5个特征属性,一共15个特征属性组成特征向量,作为故障分类器的输入。再将轴承的故障类别按照故障直径和故障类型分成9类,结合正常状态总共10个类别,得到150个数据集。通过基于多种基分类器的多分类改进Adaboost提升算法,对10种故障类别下的150个数据集的测试数据进行分类诊断,结果如图3所示。

图3 故障诊断分类结果

图中类别1表示正常状态;类别2~4表示内圈故障,直径分别为0.007,0.014,0.021 cm,类别5~7表示滚动体故障;类别8~10表示外圈故障。测试数据集一共150个,其中正确分类了140个数据点,分类正确率为93.3%,对于正常状态的分类正确率为100%。

将故障分为3类,即内圈故障、滚动体故障和外圈故障,包括正常状态一共4类,分别用BP神经网络、SVM、k-最近邻分类3种分类算法进行故障诊断分类。其中BP神经网络包含一个隐含层,包含3个神经元,支持向量机的核函数为高斯径向基核函数;k-最近邻分类的k值为2。得到如图4所示的分类结果,多分类Adaboost正确分类个数达到了147,高于其他单一分类器,表明利用组合分类器进行特征分类的准确率比单一分类器分类准确率高。

图4 4种分类器的分类结果

5 结束语

本文提出了一种汽车总装输送装备故障诊断框架,并在此基础上提出了EWT-SVD的信号特征提取方法与一种基于多种基分类器的多分类改进Adaboost提升算法。利用这两种方法,通过对滚动轴承的故障数据进行处理与分析,可知这两种算法对于故障诊断的分类精度明显高于单一分类器,可以显著提高故障诊断的正确率。

猜你喜欢

分类器故障诊断权重
基于包络解调原理的低转速滚动轴承故障诊断
权重常思“浮名轻”
为党督政勤履职 代民行权重担当
数控机床电气系统的故障诊断与维修
基于实例的强分类器快速集成方法
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
因果图定性分析法及其在故障诊断中的应用
基于局部权重k-近质心近邻算法
基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别