特征筛选与SVM结合的风机轴承故障诊断研究
2022-10-12常新宇
常新宇,李 琦
(1.沈阳工业大学化工过程自动化学院,辽宁 沈阳 110023;2.东北大学机械工程与自动化学院,辽宁 沈阳 110819)
1 引言
地铁风机是保障城市轨道交通安全运行的重要设备,滚动轴承是地铁风机装备中的必要部件,在实际运行过程中出现的故障率非常高。为了防止风机因轴承故障而停机,对滚动轴承的故障进行诊断至关重要[1]。近年来,模式识别、机器学习和深度学习等先进算法不断被应用到机械设备的故障诊断中,结合先进算法建立准确的地铁风机轴承故障诊断模型。
信号故障特征提取是故障诊断的关键步骤,其特征的可区分性直接影响诊断结果[2]。文献[3]利用均方根值、标准差等时域指标鉴定H-60A“黑鹰”直升机中行星齿轮箱故障。文献[4]利用时域同步平均方法对获取的振动信号进行预处理实现故障诊断。文献[5]将采集到的振动信号进行积分达到风机故障诊断的目的。文献[6]通过对比地铁风机振动信号的时域特征和频域特征找到能够区分故障类型的特征,实现故障诊断。
文献[7]利用α分布估计法对振动信号进行特征提取,然后通过ELM进行故障识别。文献[8]提取小波包能量熵特征作为故障诊断指标,并通过相关向量机进行识别。
上述方法虽然都实现了故障识别,但地铁风机轴承采集到的振动信号通常存在强大背景噪声,由于噪声的存在导致许多特征在不同故障间的差异性不大,这将会影响分类结果。可利用拉普拉斯评分来选择最重要特征,忽略那些差异性较小的特征,从而提高分类识别准确率。
2 算法研究
2.1 提出方法的流程
为诊断地铁风机轴承故障,提出基于特征筛选与支持向量机(Support Vector Machine,SVM)的诊断方法。首先,提取地铁风机滚动轴承运转时振动信息,按不同运行状态分别建立振动信号的特征数据库;然后,利用拉普拉斯评分对不同故障状态下与健康状态下的特征进行健康指标敏感程度打分,对敏感程度较高的健康指标赋予较小的权值,对敏感程度较低的健康指标赋予较大的权值,综合不同故障状态下的健康指标特征敏感程度评价结果,筛选出对于不同故障状态均较为敏感的三个故障特征,通过筛选出的敏感特征处理轴承处于正常状态和故障状态下的振动信号,验证筛选出的敏感指标的有效性;最后,运用SVM对筛选出的敏感特征进行故障识别获得诊断结果。
2.2 时、频域特征指标
假设采集到的振动信号为:
式中:N—信号的采样长度。
依据时域信号构造9个时域特征指标,如表1所示。
表1 时域特征指标Tab.1 Time Domain Characteristic Indexes
通过频谱分析,得到振动信号的频域信号S,其中:
依据频域信号构造12个频域特征指标,如表2所示。
表2 频域特征指标Tab.2 Frequency Domain Characteristic Indexes
2.3 幅值包络信号
为了全面反映故障状态信息,同样提取12个基于包络的特征指标,对采集到的轴承故障信号进行希尔伯特变换,希尔伯特变换相当于将一个信号X与1/πt做卷积,得到解析信号:
式中:P—柯西主分量。
则,瞬时频率ω(t)定义为:
2.4 拉普拉斯评分
基于时域、频域和包络方式提取的特征是高维的,其中一些特征与轴承故障有关,另一些特征则可能是多余的。为了获得更高的分类准确率,避免维数灾难,需要选取故障信息最多的特征,使用拉普拉斯评分(LS)来选择最重要的特征。给定m个数据样本,假设每个样本有n个特征。Lr定义特征中第r个元素(r=1,2,…,n)的拉普拉斯分值,fri定义第r个特征的第i个样本(i=1,2,…,m),LS算法的计算步骤为:
(1)构造一个有m个节点的最近邻图G。第i个节点对应第i个数据点xi,在节点i和节点j之间画一条线段,如果xi和xj是“近邻”,xi被认为是xj的K个最近邻之一,或者xj也是xi的K个最近邻之一,通常将K的值设为5。
(2)定义权重矩阵Sij为:
式中:t—一个常数。
(3)对于第r个特征定义为:
式中:I—维数为m的单位向量;L—邻接图G的拉普拉斯矩阵。
为避免邻图在某些维度上受数据较大变化的影响,对特征进行平均处理。
(4)第r个特征的拉普拉斯分值可以计算为:
式中:Var(fr)—第r个特征值的估计方差。
选择几个得分较低的特征来重建一个新的特征空间,因为一个特征的得分与它的可识别性成反比,利用最小二乘法将高维特征空间转化为低维特征空间。
2.5 支持向量机模型
与常用算法相比,SVM通常能够获得较好分类性能[9]。SVM在有限的样本下可以实现准确的状态识别,被广泛应用于故障诊断领域,SVM的基本模型为:
通过拉格朗日转化为下式:
求解上述函数,得到决策函数f(x):
3 滚动轴承故障诊断实验
3.1 轴承故障试验台
使用文献[10]中的凯斯西储大学(Case Western Reserve University,CWRU)的轴承数据信息进行比对,来验证所提出的故障诊断方法的性能。CWRU 数据包括四种健康状态数据,即正常(N)、外圈(ORF)、内圈(IRF)和滚轮(RF),采样频率为12000Hz,电机转速为1750转/分,采样点个数总计为2400个,每种运行状态设置50个样本。
3.2 轴承故障状态下敏感特征筛选
轴承故障信号信息见文献[10]。利用9个时域信号、12个频域信号和12个包络信号的监测指标处理加速度信号,得到轴承在内圈故障、外圈故障和滚动体故障下的50组监测数据对应的33个健康指标。
通过与轴承在正常状态下的50组监测数据对应的33个健康指标合并,经拉普拉斯评分处理,得到轴承不同故障下特征评价结果,如图1所示。
图1 轴承不同故障下特征评价结果Fig.1 Evaluation Results of Characteristics Under Different Faults
对33个健康指标按轴承不同故障下特征评分排序结果,如图2所示。
图2 轴承不同故障下特征评分排序Fig.2 Sort of Characteristics Scores Under Different Faults
选取三种故障状态中评分排名前三的特征指标,构建特征集,得到的轴承不同故障下排名前三的特征集,如表3所示。
表3 轴承不同故障下排名前三的特征集Tab.3 Top Three Characteristics of Bearing Under Different Faults
选取表3中风险评分最高的三个特征点及评分最低的三个特征点输入SVM分类器进行故障识别。
3.3 轴承故障诊断结果
通过敏感特征筛选,利用频域信号F8指标、频域信号F9指标、频域信号F11指标、频域信号F12指标、包络信号F11指标和包络信号F12指标构造特征向量集。针对每种运行状态各采集50组不同的数据,并将这些数据按组进行随机划分,随机选择30组数据作为训练样本,剩余的20组数据作为测试样本。
训练样本被用于训练SVM并使其获得最优的分类参数,然后通过测试样本验证分类模型的性能。两种方法预测分类,如图3所示。由图3可知,所提出的方法在测试样本中的正确识别样本个数为80个,其诊断准确率为100%。而没有进行敏感特征筛选时的正确识别样本个数为76个,其诊断准确率仅为95%。说明所提出的方法可以提高轴承故障诊断方法的诊断性能。
图3 两种方法预测分类Fig.3 Predictive Classification Charts of the Two Methods
为了更好地说明所提出方法的优越性,对两个故障诊断方法在不同训练样本数量下的诊断性能进行了分析,不同训练样本下的分类性能,如图4所示。
图4 不同训练样本下的分类性能Fig.4 Classification Performance Under Different Training Samples
由图4可以看出,所提出的方法在5个训练样本情况下,诊断准确率达到了96.25%。相比之下,没有进行特征筛选时的准确率为76.25%。当训练样本为20个的情况下,提出的方法的故障诊断准确率就达到了100%,而没有特征筛选方法的诊断准确率为92.5%。因此,可以说明所提出的方法对识别轴承故障具有较强的稳定性。
4 结束语
针对地铁风机轴承的故障诊断问题,提出了一种基于特征筛选与SVM的故障诊断方法。首先在实验数据中依次提取9个时域、12个频域和12个包络特征指标,然后采用拉普拉斯特征评分法获得轴承在不同故障模式下各指标的评价分值,经过对故障特征指标进行筛选,得到各故障模式下评分最高的前三个指标构成特征向量集,采用SVM对特征向量集进行分类,得到故障诊断结果。通过分析多组不同数量训练样本下两种方法的实验结果,验证了基于特征筛选与SVM的故障诊断方法的诊断性能,明显优于没有进行敏感特征筛选的故障诊断方法。