APP下载

外骨骼机器人柔性关节液压泵泄漏状态识别

2020-12-15殷时蓉

西南科技大学学报 2020年4期
关键词:液压泵梅尔决策树

范 磊 殷时蓉 陈 婕

(重庆交通大学机电与车辆工程学院 重庆 400074)

液压驱动器具有响应速度快、功重比大和柔顺性好的特点,被广泛应用于外骨骼机器人柔性关节[1]。液压泵作为外骨骼机器人柔性关节液压系统的关键工作元件,其工作状态关系整个液压系统的稳定性。外骨骼机器人柔性关节液压系统是高度复杂与非线性的系统,液压回路具有多种故障机理与失效形式,因此提取故障的有效特征存在难度[2-3]。研究液压信号有效特征的提取与高精度故障类别识别具有重要意义[4]。

液压信号通过传感器采集,是一种典型的机械振动信号,因此液压类的故障诊断方法与机械振动信号的信号处理方法相似[5-6]。其中,经典故障诊断的特征提取方法主要从信号的时域与频域两个方面进行特征提取,然后再进行状态识别[7-8]。希尔伯特变换、小波变换和信号分解等是应用于这类问题中最常用的方法[9]。唐宏宾等[10]对信号进行了经验模式分解,然后又对信号的包络谱进行分析,选取计算得到有效的故障特征,最终实现了液压泵状态的有效分类。曹斌等[11]先使用小波包对原始信号进行降噪,然后使用小波包分解并重构了降噪后的信号,最后将信号的频带能量作为特征,成功实现了液压信号的分类。韩可等[12]采用了变分模态分解和支持向量数据描述相结合的识别评估方法,完成了轴向柱塞泵故障的分析。王武[13]结合三层小波包分解与随机森林分类器实现了液压故障的分类。

梅尔倒谱系数(MFCC)是一种广泛运用于声音类信号特征提取的方法[14],对低频信号具有较好的敏感性,特征鲁棒性较好[15]。由于液压信号与声音信号具有相似性,本文提出将梅尔倒谱系数作为特征用于外骨骼机器人柔性关节液压泵的泄漏状态识别。本文提取样本液压信号的12个梅尔倒谱系数,再组合信号的12个时域特征作为样本的特征向量,然后采用随机森林作为分类器,对液压泵泄漏状态进行识别,并比较分析了梅尔倒谱系数结合随机森林分类器与小波特征加希尔伯特-黄特征结合随机森林分类器和支持向量机的分类识别效果,以验证方法的有效性。

1 基于梅尔倒谱系数的特征提取

梅尔倒谱系数是Davis和Mermelstein在1980年首先提出来的,是对信号的一种短时能量表示。梅尔频率倒谱系数的计算方式主要借鉴于人耳听觉系统对声音的感知方法。在计算过程中,通过线性余弦变换将信号的频谱映射到基于听觉系统的Mel非线性频谱中,最后再转换到倒谱上[16]。将普通频率变换为Mel刻度上的表示的公式为:

(1)

式中,f为信号频率,单位为Hz。

1.1 梅尔倒谱系数提取过程

设需要计算的液压信号为S(n),梅尔倒谱系数的提取过程如图1所示。

图1 梅尔倒谱系数的提取过程Fig.1 The extraction process of Mel cepstrum coefficients

(1)预加重:为了增强信号的高频部分,使得信号变得平滑,将信号通过高通滤波器。这样信号中高低频中的所有频带就可以使用相似的信噪比来求取频谱。

(2)分帧:液压信号为非平稳、非线性信号,具有时变特性,但在短时间内可以被看做是平稳信号。因此,将原始信号按N个采样点重新分段,形成新的信号波形单位,称为帧。同时,为了防止临近每帧信号之间变化过大,将相邻两帧之间进行部分重叠。

(3)汉明窗:将信号分成一帧一帧的信号后,帧之间存在不连续性,于是将信号的每一帧与汉明窗相乘。乘以汉明窗后的信号为:

S′(n)=S(n)×W(n), 0≤n≤N-1

(2)

(3)

式中,W(n)为使用的汉明窗。

(4)快速傅里叶变换(FFT):能量的分布反映着信号的特性,为了得到信号的能量谱,对每一帧信号进行快速傅里叶变换。

(4)

式中,N为原始信号的帧数。

(5)带通滤波器:使用一系列均匀重叠在梅尔频率轴上的三角窗对能量谱进行转换,得到一组系数。

(6)对数能量:对第五步中的每个滤波器组进行计算,然后取对数,所得结果即为对数能量,这样,就得到不同频带的对数功率谱。相应计算过程如下:

(5)

式中,s(m)即对数能量;Hm(k)为带通滤波器得到的一组系数;M为滤波器组中滤波器个数;m=1,2,3,…,M。

(7)离散余弦变换(DCT):对对数能量谱进行余弦变换,将频谱变换到时域上,就得到梅尔倒谱系数。计算过程如下:

(6)

式中,n和m分别是计算的信号的帧数与梅尔倒谱系数的个数,0≤n≤N,0≤m≤M。滤波器的个数M取12。

最后,由于滤波器个数为M,就可以得到12个梅尔倒谱系数,这12个系数就可以作为信号的12维特征向量用以表征信号。

1.2 时域特征

为了获得液压信号所包含的更多信息,除了梅尔倒谱系数特征,本文还计算了液压信号的方差、均值、方根幅值、均方根值和最大值,还包括信号的标准差、偏斜度和峭度,最后还有信号的峰值因子、裕度因子、波形因子、脉冲因子一共12个值,作为液压信号的时域特征来表征信号[17]。最后将12个梅尔倒谱系数特征与12个时域特征一共24特征组合,作为表征每条液压信号记录的特征向量。

2 随机森林

随机森林(RF)是一种将多棵决策树集成的分类器。其基本原理是LeoBreiman和Adele Cutler提出的随机森林算法。如图2所示,随机森林的基本思想就是将多个弱分类器集成为一个强的分类器,通过多棵决策树的平均结果来产生最终结果。在一个由L棵决策树集成的随机森林分类器中,每棵单独的决策树都是一个分类器,其中弱分类器为每个决策树的节点[18]。每个决策树都会有一个判别结果,所有决策树的分类结果的平均就是随机森林的最终分类结果。

当随机森林开始训练时,首先,每个决策树都会从全部样本中随机选择一个子样本集,然后,在每个节点上,决策树都会选择一个分类效果最好的弱分类器,最后,将所有的弱分类器组合成为最终的分类器[19]。

假设一个K类的分类任务,每个样本p在经过每个决策树分类器后,会输出K个置信度作为输出值。其中每个置信度分别表示该样本判别为某一类样本的概率[20]。最后,从所有决策树判别的平均结果中可以得到整个随机森林分类器的判别结果。表达式如下:

(7)

式中,p(n,p)(f(p)=c)表示样本p判别属于c类的概率。

图2 随机森林示意图Fig.2 Diagram of random forest

3 实验与分析

3.1 实验数据来源

本文所使用数据取自机器学习数据库平台(UCI Machine Learning Repository)2018年公布的液压监测数据集。该数据集是在周期性的负载试验台上测量获得,该试验台由一级工作和二级冷却-过滤回路组成(如图3所示),试验台的负载循环周期为60 s。本文所使用的每个样本数据有3个通道,这3个通道是来自压力传感器PS1,PS2,PS3的压力信号,压力传感器的采样周期为试验台的一个60 s 的负载周期,采样频率为1 000 Hz,数据长度为6 000个数据点。该数据集包含液压泵无泄漏、微弱泄漏、严重泄漏3种状态的样本数据,本文选取每种状态下的450个样本数据。

图3 液压系统图Fig.3 Hydraulic system diagram

3.2 数据处理

本文数据处理的具体步骤如下:

(1)提取每个样本的MFCC特征12个与时域特征12个,组合成为液压信号的特征向量。因选择了3个通道的压力信号,所以最后每个样本将会用1×72的特征向量表示。

(2)每类泄漏状态各有450个样本,随机选择每类状态的250个样本作为训练集,200个样本作为测试集,最后组成训练集样本量为750个,测试集样本量为600个。

(3)建立训练集与测试集对应标签,具体见表1。

(4)设置随机森林分类器树数目为500,使用训练集训练分类器。最后使用训练好的模型与测试集进行预测。

表1 液压泵样本数据Table 1 Sample data of hydraulic pump

3.3 实验结果

表2为梅尔倒谱系数结合随机森林的最终识别结果。由表2可知,液压泵状态识别的综合识别率达到了99.3%,无泄漏、弱微泄漏与严重泄漏3种状态的正确识别数量分别为199,197,200,识别率分别为99.5%,98.5%与100%。无泄漏、弱微泄漏和严重泄漏3种状态识别错误的样本数分别为1,3,0个。因此可以得出,本文提出的方法能够有效识别出液压泵3种不同的泄漏状态。

表2 梅尔倒谱系数结合随机森林的识别结果Table 2 Recognition results of random forest combined with Mel cepstrum coefficient

3.4 对比实验

为了说明梅尔倒谱系数在液压泵泄漏状态识别中的有效性,将小波特征加希尔伯特-黄特征与梅尔倒谱系数进行对比。采用希尔伯特-黄变换得到2个特征,再采用小波分解得到6个特征,融合这8个特征作为液压信号的特征,使用随机森林作为分类器进行对比实验。表3为小波分解、希尔伯特-黄变换结合随机森林的识别结果。由表3可以看出,小波分解、希尔伯特-黄变换结合随机森林的识别率为94.0%,低于梅尔倒谱系数结合随机森林的识别率(99.3%),说明梅尔倒谱系数在液压泵泄漏状态识别中具有更佳的特征提取效果。

表3 小波分解、希尔伯特-黄变换结合随机森林的识别结果Table 3 Recognition results of random forest combined with wavelet decomposition, Hilbert-Huang transform

本文进一步采用对比实验对提出的随机森林与MFCC加时域组合特征的液压泵泄漏状态识别方法进行验证。对比模型分别使用随机森林与支持向量机,使用相同的训练集与测试集分别进行10次独立重复实验。图4为对比实验分类识别率结果。从图4可以看出,对于使用MFCC加时域组合特征的液压泵泄漏状态的识别,随机森林(RF)具有较好的识别效果,识别率稳定在99%左右,最高达到99.3%;支持向量机的识别效果相对较差,识别率在95%左右,并且具有较大的波动性。通过对比实验,可以确定,随机森林在本文的识别任务中具有更好的识别率。

图4 实验结果对比Fig. 4 Comparison of experimental results

4 结论

本研究提出了基于梅尔倒谱系数(MFCC)与时域组合特征和随机森林分类器相结合的外骨骼机器人柔性关节液压泵泄漏状态识别方法。将梅尔倒谱系数特征引入液压泵状态的识别中,结合液压信号的时域特征,有效地完成了液压泵泄漏状态的分类识别。

本文的研究也证明了梅尔倒谱系数在机械振动信号的故障诊断的应用的可能性。未来,可继续探究梅尔倒谱系数特征在其他振动信号故障诊断中的应用,为其他类信号的故障诊断提供更多的解决方法。

猜你喜欢

液压泵梅尔决策树
一种气体自动充装系统及控制方法
江麓集团加入特种液压泵阀攻关创新联合体理事会
梅尔:我的追求塑造了梦
简述一种基于C4.5的随机决策树集成分类算法设计
梅尔维尔鲸
“熊”视眈眈
60MN卧式钢管热挤压机液压泵运行优化
液压传动系统中振动与噪声故障的原因分析及处理办法
决策树学习的剪枝方法
梦想是眼睛,第一个攀上珠峰的盲人探险家