基于IMIE、MCFS和SSA-ELM的离心泵故障诊断方法*
2023-09-22辜文娟
辜文娟,张 扬
(1.江西省商务学校,江西 南昌 330038;2.湖北工业大学 机械工程学院,湖北 武汉 430068)
0 引 言
离心泵是一种广泛应用于化工、电力等行业的流体机械设备。由于工作环境恶劣和运行时间较长,离心泵工作过程中易发生各类故障。又由于行业的特殊性,离心泵的损伤容易引发严重的生产事故。因此,研究离心泵的故障诊断方法对于确保安全稳定生产具有实际工程意义[1-5]。
离心泵的结构复杂,且因为受摩擦、湍流、阻尼等多种因素的影响,所以离心泵的振动信号或声信号表现为非线性,这增加了离心泵故障信号分析的难度[6,7]。目前,针对非线性信号的分析方法通常以样本熵、排列熵、模糊熵和散布熵为代表。其中,由于具备稳定且优异的特征提取性能,目前排列熵已被广泛应用于各种故障诊断领域。
高素杰等人[8]将排列熵用于齿轮箱的故障诊断,实现了齿轮箱故障准确识别的目的;然而排列熵忽略了时间序列的幅值信息。随后,吴新忠等人[9]利用加权排列熵代替排列熵,进行了滚动轴承的故障特征提取,结果证明,加权排列熵要优于排列熵;然而该方法只是进行了单一尺度的分析,特征描述不够完整[10]。
针对排列熵以及加权排列熵的多尺度化,学者们进行了大量的工作。
AZIZ W等人[11]提出了多尺度排列熵(multiscale permutation entropy,MPE),用于生理时间序列的分析;然而MPE仍然忽略了信号中的幅值信息[12]。为此,YUAN Xu-yi等人[13]提出了多尺度加权排列熵(multi scale weighted permutation entropy,MWPE)算法,用于泵的故障检测,结果证明了该算法是一种有效的复杂性测量指标;但是MWPE算法所采用的加权排列熵在分析某些幅值相同的时间序列的复杂性时,仍然无法实现准确的测量。针对MWPE仍然存在的信息丢失缺陷,LIU Xiao-feng等人[14]4-7提出了增长熵(increment entropy,IE)的概念,并将其用于生理时间序列的分析,结果证明其优于排列熵和样本熵;但是IE未进行多尺度分析。WANG Xue等人[15]进一步地提出了多尺度增长熵(multiscale increment entropy,MIE),用于处理医学时间序列,其证明了MIE的优越性;然而MIE的粗粒化处理存在较大的缺陷,使得熵值误差随着尺度的增加而增大,这降低了算法的有效性[16]。
在故障的分类识别方面,由于具有效率高、数据处理能力强等优点,极限学习机(ELM)被广泛应用于故障识别领域[17]。
姚峰林等人[18]使用ELM进行了滚动轴承的故障识别;然而其未对ELM的参数进行优化,使该模型不够稳定。随后,张玉学等人[19]采用粒子群算法(particle swarm optimization,PSO),对ELM进行了优化,准确地识别了齿轮箱的故障;然而PSO算法的优化性能较差。秦波等人[20]利用具有更好优化性能的蝙蝠算法,对ELM进行了优化,结果验证了该方法的优越性;然而蝙蝠算法的局部寻优能力仍然较差,因此需要采用具有更强寻优性能的算法对ELM进行优化。刘晓悦等人[21]129-130采用麻雀搜索算法(SSA),对ELM的权重和隐含层阈值进行了寻优,建立了SSA-ELM多故障分类器,实现了对齿轮箱的准确分类。
鉴于SSA-ELM的优异性能,笔者将使用SSA-ELM进行离心泵的故障识别。
针对上述研究提到的缺陷,笔者利用改进的粗粒化对时间序列进行处理,提出改进多尺度增长熵(IMIE),其既能改善MPE忽略信号幅值信息的缺陷,也能缓解MIE算法的粗粒化问题;在此基础上,提出一种基于IMIE、多聚类特征选择(MCFS)和麻雀搜索算法优化极限学习机(SSA-ELM)的离心泵故障诊断方法。
首先,基于IMIE提取离心泵振动信号的故障特征,表征离心泵的故障状态;随后,利用MCFS对原始特征进行优化,生成低维敏感的故障特征;最后,将故障特征输入至基于麻雀搜索算法优化的极限学习机中,进行离心泵故障的识别。
1 改进多尺度增长熵
1.1 多尺度增长熵
增长熵只进行了信号单一尺度的评估,忽略了其他尺度上有用的信息,因此其分析不够完整。为此,学者们提出了多尺度增长熵(其中,增长熵的理论可参考LIU Xiao-feng等人[14]3的研究)。
多尺度增长熵(MIE)的详细计算过程如下:
1)对于时间序列{x(k),k=1,…,N},进行粗粒化处理,得到粗粒化序列如下:
(1)
2)对粗粒化后的时间序列进行增长熵计算,得到多尺度增长熵MIE:
(2)
式中:m为嵌入维数;R为量化分辨率。
虽然MIE实现了信号的多尺度分析目的,但其依然存在缺陷[22]:
1)在进行粗粒化处理时,对每个数据点的处理存在不一致的情况,即MIE是不对称的,这会造成IE值突变。
例如,当尺度因子为3时,对应的粗粒化过程如图1所示。
图1 尺度因子为3时的MIE粗粒化处理
理想情况下,x3、x4与x2、x3处的计算应保持一致,但是根据图1的处理过程可知:x1,x2,x3与x4,x5,x6在x3处断开,导致x3和x4存在断点,这造成了IE值不够稳定;
2)计算IE值时,信号的数据长度越大则结果越稳定,然而MIE的粗粒化处理会显著减少数据的长度,导致熵值偏差不断增加,使得IE对系统复杂性的反映精度变低。
1.2 改进多尺度增长熵
为改善MIE的性能,笔者对粗粒化处理进行了改进,构造了改进多尺度增长熵(IMIE)。
此处仍然以尺度因子3为例,对应的改进粗粒化处理如图2所示。
图2 尺度因子为3时的IMIE改进粗粒化处理
与MIE不同,在同一尺度τ下,IMIE经过粗粒化处理后,能够生成τ组粗粒序列,有效避免了断点处的突变问题,而传统粗粒化处理只生成一组粗粒序列。
IMIE的计算过程如下:
1)对给定时间序列进行改进的粗粒化处理,其生成τ组粗粒序列:
(3)
(4)
1.3 IMIE和MIE算法对比分析
根据IMIE的定义可以知道,核心参数为时间序列的长度N,嵌入维数m,量化分辨率R和尺度因子τ。
通常而言,嵌入维数m的取值为[2,5],过小会造成信号重构时重构向量包含的元素太少,无法表征系统的动态特性;反之,过大会忽视系统的细节特征。笔者设置m=2。
量化分辨率R的取值会影响算法的抗噪性,R过大会对噪声过于敏感,笔者设置R=4。
时间序列的长度会影响增长熵的精度,数据越长则熵值的精度也就越高;但是太长的数据会极大地增加计算量,若数据过短则无法准确地反映系统的动态特征。笔者设置N=2 048。
尺度因子的设置一般不会影响算法的精度,但是尺度过小会造成特征数量较少,难以全面地反映系统的固有特性;反之,尺度过大会造成特征的冗余且降低计算效率。笔者设置τ=20。
为了验证IMIE方法的优点,笔者利用30组高斯白噪声和1/f噪声进行分析。
笔者采用IMIE和MIE方法分别计算两种噪声信号的增长熵值和标准差,如图3所示。
图3 高斯白噪声和1/f噪声的增长熵
由图3可以发现:随着尺度的增加,IMIE熵值的变化较MIE更加平滑,没有出现较大的突变,而且IMIE在各个尺度上的标准差也小于MIE,即对应的误差较小。因此,可以证明IMIE方法具有良好的稳定性,优于MIE。
2 基于IMIE、MCFS和SSA-ELM的诊断方法
2.1 多聚类特征选择
根据ZHANG Wei-bo等人[23]的研究,原始故障特征通常包含部分的冗余信息,没有必要将全部特征进行分类,有必要对其进行降维处理,以提高分类的效率和精度。
笔者引入基于MCFS的特征降维算法,依照各尺度特征的贡献度来对特性向量进行赋分,保留分数较高的特征,并剔除分数较低的特征,实现特征的降维目的(MCFS的理论可参照候晓丽等人[24]的研究)。
2.2 SSA-ELM
极限学习机模型(ELM)具有优异的分类性能,并且兼顾效率,但是其需要对参数进行优化设置,否则容易影响泛化性。刘晓悦等人[21]128-129采用麻雀搜索算法(SSA)对ELM的参数进行了优化,并将其与基于粒子群算法、灰狼算法优化的ELM模型进行了对比,结果验证了SSA-ELM的有效性。
为此,笔者引入了SSA-ELM分类器,用于离心泵的故障识别。
2.3 故障诊断流程
针对离心泵的故障特征提取和分类识别,笔者引入了增长熵这一具有优异性能的非线性动力学指标,并对其进行了改进,提出了改进多尺度增长熵;并结合多聚类特征选择和麻雀搜索算法优化极限学习机,提出了一种新的离心泵故障诊断方法。
该方法的具体流程如下:
1)采集离心泵在多种工况下的振动信号,以长度为2 048的窗口进行样本的截取,每个工况得到100组样本;
2)利用IMIE提取振动信号的熵值信息,构造故障特征样本;
3)利用MCFS对故障特征进行赋分,依据对分类的贡献度选择前15个特征,构造新的低维特征;
4)在新的特征向量中,随机抽取30个样本用于训练SSA-ELM分类器,剩余70个样本进行测试识别;
5)将测试样本输入到训练好的分类器中[25,26],进行分类,完成离心泵的故障检测任务。
3 离心泵故障诊断实验
3.1 实验数据介绍
该离心泵实验数据由KUMAR A等人[27]提供。
笔者利用振动传感器和麦克风设备采集了离心泵不同工况下的振动信号和声信号,并对振动信号进行了分析。
离心泵的实验平台如图4所示。
图4 离心泵实验平台
在该离心泵平台中,包含两个滚动轴承,靠近叶轮端的轴承标记为实验轴承,远离叶轮端的轴承标记为非实验轴承。
轴承的参数如表1所示。
表1 滚动轴承的指标参数
离心泵以一定的角速度运转,笔者针对叶轮损伤(S1)、叶轮堵塞(S2)、正常(S3)、轴承内圈故障(S4)和轴承外圈故障(S5)这5种工况进行了研究,并采用型号为PCB353 B34的单轴加速度计,以70 kHz的频率采集了振动信号。
笔者利用宽度2 048的窗口截取每种工况的样本共100组,其中,随机抽取30组样本作为训练样本,剩余70组样本作为测试样本。
样本的相关信息如表2所示。
表2 离心泵的样本信息
3.2 实验分析
在5种工况下离心泵的振动信号如图5所示。
图5 离心泵振动信号波形
由图5可以发现:直接分析振动信号的波形难以判断未知样本的故障类型,这证明了对信号进行分析的必要性。
笔者对5种状态的振动信号进行了IMIE分析。同时,为了验证IMIE的优越性,采用MIE、MPE和改进多尺度排列熵(improved multiscale permutation entropy,IMPE)进行了对比分析,其中,MPE和IMPE的参数设置为:嵌入维数m=5,时间延迟d=1。
每种类型的样本不同处理方法的熵均值标准差如图6所示。
图6 4种方法的熵均值标准差曲线
从图6可以发现:在大多数尺度上,IMIE和IMPE方法的熵值曲线表现为故障振动信号高于正常振动信号的特点,并且不同故障类型样本的复杂性也呈现出规律性的差异,因此,后续可以考虑将IMIE方法用于区分离心泵是否正常;
此外,IMIE和IMPE都能够较为有效地区分5种故障样本,且熵值具有较大的区分度。而MIE和MPE熵值曲线发生了明显的混叠,难以有效区分不同故障类型;同时IMIE和IMPE曲线的标准差显著小于MIE和MPE,两种现象均表明改进的粗粒化处理优于传统的粗粒化处理。但是仍然无法通过熵值曲线来判断增长熵优于排列熵,为此,需要进行更深层次的分析。
随后,为了减小原始特征中的冗余信息,提高特征的质量,笔者利用MCFS对IMIE特征进行了排序,如图7所示。
图7 经过MCFS排序后的新特征
从图7可以发现:原始特征在经过MCFS排序后,所生成的新特征具有更显著的区分度,这表明利用MCFS进行特征降维是必要的,其有助于提高故障特征的质量。笔者选择排序得分前15的特征,作为分类器的输入。
为了进一步对比4种方法的优劣性,同时识别离心泵的故障类型,笔者将IMIE、MIE、IMPE和MPE这4种方法提取的故障特征,采用MCFS降维,把生成的新特征输入至SSA-ELM分类器中,进行了故障识别,其结果如图8所示。
图8 基于不同故障诊断方法的SSA-ELM分类结果
详细的分类识别结果如表3所示。
表3 基于不同故障诊断方法的详细分类结果
从表3可以发现:基于IMIE的故障诊断方法取得了100%的识别准确率,完全准确地识别了离心泵的故障,证明了该方法能够有效地用于离心泵的故障诊断。而IMPE方法的分类准确率仅低于IMIE方法,达到了98.57%,这证明了改进多尺度分析方法能够从振动信号中提取出质量较高的特征,并实现对故障精准识别的目的。
MIE和MPE方法的分类准确率分别为72.86%和93.71%,这表明在与传统粗粒化相结合时,排列熵优于增长熵;而在与改进粗粒化相结合时,增长熵优于排列熵。此外,基于增长熵的方法具有非常高的效率,仅需要93.81 s即可完成故障特征提取任务。其特征提取的时间仅多于MIE方法所用时间,这表明改进的粗粒化处理方式增加了滑动的操作,因此,其效率低于传统的粗粒化处理。
此外,IMIE的效率是IMPE的10倍,这证明IMIE不仅可以提取高质量的故障特征,还具有非常可观的效率,优于其他3种方法。
为进一步比较IMIE方法和IMPE方法在特征提取中的优劣,笔者在输入不同数量的故障特征时,将2种方法的准确率进行比较,将经过MCFS排序后的前20个特征依次输入至SSA-ELM分类器中,进行故障识别。
当输入不同数量故障特征时,基于IMIE和IMPE的故障诊断方法的识别准确率变化曲线,如图9所示。
图9 输入不同数量特征时2种故障诊断方法的准确率对比
从图9可以发现:在输入不同数量的特征时,IMIE的准确率曲线大多数时候在上方,当输入的特征数量为13个时,IMIE方法的准确率已经达到了99.71%,而此时IMPE方法的准确率低于IMIE,证明输入13个特征时,基于IMIE的故障诊断方法已经能够取得非常精确的故障识别结果了。
综上可和,在大多数情况下,基于IMIE的故障诊断方法要优于IMPE方法,且IMIE方法的效率非常高。
最后,为了验证SSA-ELM分类模型在故障识别中的优越性,笔者对遗传算法(genetic algorithm,GA)、粒子群算法(particle swarm optimization,PSO)、灰狼算法(grey wolf optimization,GWO)和鲸鱼算法(whale optimization algorithm,WOA)进行对比。
对于每种优化算法,种群规模都设置为30,迭代次数设置为100,并将IMIE故障特征输入到5种分类器中,进行故障的识别;同时,为了确保性能评估的可靠性,分类重复20次。
20次实验下,5种分类器的识别结果如图10所示。
图10 20次实验下5种分类器的识别结果
5种分类器的详细识别结果如表4所示。
表4 5种分类器的详细识别结果
从表4可以发现:
1)5种分类器的平均识别准确率均达到了98%以上,证明不同优化算法都可以构建分类性能较强的ELM模型;
2)SSA-ELM的平均识别准确率达到了99.73%,高于其他4种分类模型,这验证了SSA在参数优化中优于另外4种算法;
3)就参数优化的表现而言,GWO算法优于WOA、GA和PSO,证明GWO具有较强的全局优化性能。
4 结束语
采用多尺度排列熵分析离心泵的振动信号,存在粗粒化处理存在不足等问题,导致离心泵的故障识别准确率不高,为此,笔者提出了一种基于IMIE、MCFS和SSA-ELM的离心泵故障诊断方法,利用离心泵振动信号故障数据对该方法进行了实验,验证了该方法的有效性,同时将该方法和其他方法进行了对比,验证了该方法的优越性。
研究结论如下:
1)仿真信号的分析结果表明:和基于传统粗粒化的MIE方法相比,IMIE方法能够更加准确和稳定地测量时间序列的复杂度,且偏差更小;
2)IMIE方法能够有效地提取高质量故障特征,基于IMIE的故障诊断方法取得了100%的识别准确率,且特征提取时间仅需要93.81 s,综合性能要优于IMPE、MPE和MIE方法;
3)SSA-ELM能够准确地识别离心泵的故障,平均识别准确率高达99.73%,高于GA-ELM、PSO-ELM、GWO-ELM和WOA-ELM分类器,其具有显著的优越性。
虽然所提方法取得了不错的效果,但需要人为设置参数,其是否适用于其他工业场景还有待于今后的检验。笔者后续将对该方法中的参数自适应设置进行研究。