基于复合多尺度交叉模糊熵的行星齿轮箱故障诊断
2023-10-31候双珊郑近德潘海洋童靳于刘庆运
候双珊, 郑近德, 潘海洋, 童靳于, 刘庆运
(安徽工业大学 机械工程学院,安徽 马鞍山 243032)
行星齿轮箱作为旋转机械重要的部件之一,由于质量小、传动比大、工作平稳等独特优点,在直升机、卡车和风力涡轮机等许多机器的传动系统中得到了广泛应用。行星齿轮箱在实际运行过程中由于工作环境恶劣且承受动态重载,导致齿轮经常发生断齿、点蚀、裂纹、磨损等故障。这些故障不仅威胁到设备的安全性和可靠性,严重时会造成重大经济损失、甚至人员伤亡。因此,深入研究行星齿轮箱故障诊断方法对于保证设备的稳定安全运行具有重要意义。
当齿轮发生故障时,振动信号的非线性动态特征不可避免地会发生变化,传统的线性分析方法受其固有特性的限制,不能有效地处理这类信号。随着非线性动力学理论的发展,许多非线性动力学分析方法,如分形维数[1]、近似熵(appropriate entropy,ApEn)[2]、样本熵(sample entropy,SampEn)[3]等被应用于故障诊断中。但ApEn和SampEn都只对单个序列进行复杂性测量,忽略了两个不同时间序列间模式的同步性、相似性与互预测性,且近似熵定义中为了避免ln(0)的出现,存在自身数据段的比较,导致出现自匹配的问题,存在偏差[4]。针对ApEn这一缺陷,文献[5]引入了交叉近似熵(cross appropriate entropy,CAE)来分析两个相关时间序列之间的异步程度。CAE在设计思路上与ApEn非常相似,其不同之处仅在于它比较了两个不同的时间序列,因此不会产生自匹配的偏差。Richman等[6]提出交叉样本熵(cross sample entropy,CSE)的概念,用于解决CAE对数据长度十分敏感和相对一致性差的问题。然而CSE会由于时间序列变短产生熵值突变,文献[7]选择适用于较短数据集的模糊熵(fuzzy entropy,FuzzyEn)代替SampEn,提出了交叉模糊熵(cross fuzzy entropy,CFE),结果表明CFE具有更好的稳定性和相对一致性。
研究表明,这些单一尺度的非线性动力学分析方法很难揭示真正的动态耦合。为了反映不同尺度上的动力学特性,Costa等提出了多尺度熵(multi-scale entropy,MSE)[8],用于心律变异性研究,文献[9-11]将MSE用于旋转机械的故障诊断。Yan等[12]结合粗粒化的多尺度方式将CSE扩展到多尺度,提出了多尺度交叉样本熵(multi-scale cross sample entropy,MCSE),MCSE解决了耦合系统的多尺度特征,提供了多个时间尺度上异步的非线性指数。受此启发,本文将CFE扩展到多尺度,同时文献[13]表明传统粗粒化过程缩短了时间序列的长度,可能会产生不精确的熵估计,针对传统粗粒化的缺陷,本文采用复合粗粒化的方式对时间序列进行多尺度分析,提出了复合多尺度交叉模糊熵(composite multi-scale cross fuzzy entropy,CMCFE),用来衡量两个时间序列的同步性、相似性和互预测性。
基于CMCFE在特征提取上的优势,同时采用萤火虫算法优化支持向量机(firefly algorithm optimization support vector machine,FA-SVM)[14]对故障类型进行识别,在此基础上,提出了一种基于CMCFE和FA-SVM的行星齿轮箱故障诊断方法。最后,通过试验数据验证了所提方法的有效性,结果表明,与基于MSE,多尺度模糊熵(multi-scale fuzzy entropy,MFE)和复合多尺度交叉样本熵(composite multi-scale cross sample entropy,CMCSE)的故障诊断方法相比,论文所提故障诊断方法具有较强的故障特征提取能力和较高的故障类型识别精度。
1 复合多尺度交叉模糊熵
1.1 交叉模糊熵
交叉模糊熵是由交叉样本熵推广而来,可以衡量时间序列之间的同步性。两时间序列越同步,其交叉模糊熵具有越小的取值[15],具体算法如下:
(1)
其中,
(2)
(3)
(4)
(5)
(6)
(7)
式中,r和n分别为指数函数边界的宽度和梯度。
(3) 定义函数
(8)
再将嵌入维数m扩展到m+1,得到
(9)
(4) 定义交叉模糊熵为
(10)
实际上,数据点的数量N是有限的,并且当数据长度为N的情况下,通过上述步骤得到的结果是CFE的估计值,可以记为
CFE(m,n,r,N)=lnφm(n,r)-lnφm+1(n,r)
(11)
1.2 复合多尺度交叉模糊熵
复合多尺度交叉模糊熵的计算方式如下:
将归一化时间序列复合粗粒化。对长度为N的归一化时间序列ui={u1,u2,…,uN}和vi={v1,v2,…,vN},预先给定嵌入维数m和相似容限r,依据归一化序列建立新的粗粒向量
(12)
(13)
(14)
在同一尺度下,计算粗粒化后的两个序列xk,j(τ)、yk,j(τ)的交叉模糊熵,再对τ个熵值求平均,即该尺度因子下的CMCFE,并将其视为尺度因子的函数,称之为CMCFE分析。其中在计算每两个粗粒序列的交叉模糊熵时,相似容限r不变,为0.1SD~0.25SD。(SD是原归一化数据的标准差)。
CMCFE是对两个不同时间序列之间同步性或相似性的量度,同时也是对相互交叉的两个时间序列自身复杂性的衡量,从几何的角度解释为:① 如果在大部分尺度上,两个时间序列X和Y的交叉模糊熵比X和V的交叉模糊熵小,那么就认为X和Y的同步性或相似性更高;② 对于互相交叉的两个时间序列而言,如果其CMCFE曲线随着尺度因子增大而减小,这意味着两者中至少存在一个时间序列仅在最小尺度上包含较多有用信息,如随机白噪声。
1.3 参数选择与模拟信号对比分析
CMCFE计算有三个参数,包括嵌入维数m、指数函数边界的宽度r及梯度n。参考文献[16]中对每个参数选择进行了详细探讨,本文取m= 2,n= 2,r= 0.15SD。
在单个时间序列分析方法中,白噪声的MSE曲线随着尺度因子增大而减小,而1/f噪声的MSE曲线随着尺度因子的变化而趋于平稳,且大部分尺度上熵值高于白噪声,这说明白噪声相较于1/f噪声所包含的信息较少,结构简单。因此,对于两个时间序列而言,白噪声序列与1/f噪声序列的同步性要低于两个白噪声序列之间的同步性,高于1/f噪声序列与1/f噪声序列的同步性,且CMCFE、CMCSE值的仿真结果与同步性成反比。为此仍采用常见随机白噪声和1/f噪声为模拟信号将CMCFE与CMCSE对比分析,来进行验证并解释两种方法的差异。根据交叉的两个噪声序列的不同组合情况分为三组:(a)白噪声与白噪声交叉;(b)白噪声与1/f噪声交叉;(c)1/f噪声与1/f噪声交叉。每种情况的仿真数据各采用40组样本进行交叉,每组样本中两序列长度均为2 048点。分别求其CMCSE和CMCFE的均值和标准差并绘制相应曲线。结果如图1所示。
图1 两个噪声序列的CMCSE和CMCFE
从图1可以看出,无论是CMCSE还是CMCFE,在大部分尺度上都有:(a)<(b)<(c),这与理论结果相符。这说明,CMCSE和CMCFE能有效的反映两个时间序列的同步性和复杂性。同时,两种方法对比还可以发现:图1(b)中三条CMCFE曲线相较于图1(a)中对应的三条CMCSE曲线有更小的标准差;图1(a)中白噪声序列与1/f噪声序列、两个1/f噪声序列的CMCSE曲线存在一定波动且有部分重叠。因此,CMCFE对于三种不同组合的区分效果要优于CMCSE。
2 基于复合多尺度交叉模糊熵的行星齿轮箱故障诊断
在获得特征向量后,需要一种计算效率高、泛化性能优越的分类器,定量区分不同工作状态下的故障特征。本文采用支持向量机对行星齿轮箱状态进行智能分类。然而SVM的性能在很大程度上取决于惩罚因子c和核函数g的选择,因此需要采用优化算法搜寻最优参数组合以实现最优的分类性能。萤火虫算法(firefly algorithm,FA)模拟了自然界中在夜间发光、传递信息、相互吸引的萤火虫,每只萤火虫在其邻域结构内根据同伴的亮度和吸引力进行移动更新,从而实现位置优化[17]。与遗传算法(genetic algorithm,GA)[18]、粒子群优化算法(particle swarm optimization,PSO)[19]等传统优化算法相比,FA在处理多模态函数以及寻找全局最优解方面具有更高的效率和成功率[20]。FA-SVM的整体流程如下:
步骤1初始化算法的基本参数,如萤火虫的数目、光吸收系数、最大吸引力、最大迭代次数和步长因子;
步骤2随机初始化萤火虫的位置,计算每个萤火虫所在位置处的目标函数值,确定其绝对亮度;
步骤3计算萤火虫之间的相对亮度和相对吸引力,根据相对吸引力确定萤火虫的运动方向;
步骤4更新萤火虫的空间位置;
步骤5更新目标函数值及萤火虫的绝对亮度;
步骤6若满足终止条件,则停止搜索;否则返回步骤3继续执行;
步骤7将最优位置的坐标分别赋值给惩罚因子c和核函数g,建立优化SVM模型。
基于此,提出一种基于复合多尺度交叉模糊熵和FA-SVM的行星齿轮箱故障诊断方法,诊断流程如图2所示。具体步骤如下:
图2 诊断流程图
步骤1针对行星齿轮箱不同工作状态下的振动信号,在每种状态下取长度为L的M个样本,计算各种状态与正常状态下振动信号的CMCFE,将20个尺度的特征值作为故障特征向量;
步骤2从每种状态计算出的CMCFE值中随机选取N组数据作为训练样本,剩余的M-N组数据作为测试样本;
步骤3将训练样本的故障特征向量输入到基于FA-SVM的多故障分类器进行训练;
步骤4利用测试样本验证上述经过训练的多分类器的分类精度,依据分类器输出结果实现行星齿轮箱的故障诊断。
为了检验所提故障诊断方法的实用性,将其应用于试验数据进行分析,同时,为了突出所提出方法的优越性,进行了一系列对比试验。试验采用的低速重载轴和轮系故障与全周期寿命预测模拟试验台结构如图3(a)所示。行星齿轮箱中,太阳轮,行星轮和齿圈齿数分别为21,31和84,行星轮数3,模数1.5。图3(b) ~ 图3(e)模拟了太阳轮断齿、点蚀、裂纹和磨损4种故障。振动信号通过安装在行星齿轮箱外壳上的加速度传感器进行采集。在采样频率为10 kHz,电机转速为900 r/min,负载为0的工作条件下,试验采集了太阳轮正常和四种故障状态下的振动加速度信号。五种状态对应的时域波形如图4所示。对于齿轮每种状态,选择长度为1 024的40个样本,共200个样本。
图3 低速重载轴和轮系故障与全周期寿命预测 模拟试验台及太阳轮故障类型
图4 时域波形
为了说明CMCFE分析方法的优越性,将其同MSE,MFE和CMCSE对齿轮正常、断齿、点蚀、裂纹和磨损五种状态的振动信号进行对比分析,由于MSE和MFE只对单个时间序列进行复杂性测量,因此仅采用单一状态的振动信号进行分析,而衡量两时间序列相似性的CMCSE和CMCFE方法均采用每种状态振动信号与正常状态振动信号进行交叉熵分析。MSE,MFE,CMCSE和CMCFE分析方法在齿轮不同状态下(每种状态40个样本)的熵均值与标准差曲线如图5所示,四种方法的参数选择均与上述1.3节中一致。
图5 不同状态齿轮的MSE,MFE,CMCSE和CMCFE
由图5可以看出:① 在大部分尺度上五种状态齿轮对应的熵均值从大到小排列依次为点蚀,磨损,断齿,裂纹和正常。这是因为:齿轮发生点蚀故障时,会以成块的形式发生剥落,造成齿面凹坑,严重地破坏了齿型的正确性,此时齿轮振动信号与正常齿轮振动信号的相似性大幅降低,熵值最高;正常齿轮振动信号主要成分以啮合频率及其高次谐波为主,当发生磨损故障时,齿轮振动信号主要成分仍以啮合频率及其高次谐波为主,各成分在频谱的幅值增强[21],但复杂性高,仍表现为较强的随机性,与正常齿轮振动信号的相似性不高;而当齿轮发生断齿和裂纹故障时,振动信号的周期性明显增强,复杂性降低,与正常齿轮振动信号的相似性高,熵值较低;最后,显然正常齿轮振动信号与正常齿轮振动信号的相似性最高,熵值最低;② MSE和CMCSE分析方法中太阳轮断齿与裂纹故障的熵均值曲线非常接近,难以区分,且CMCSE曲线中点蚀故障在尺度因子τ=20时出现由于样本长度过短导致熵值未定义的情况;③ MFE曲线中小尺度下的熵值交叉重叠严重,大尺度下断齿与裂纹故障熵值标准差也存在较大重叠,区分效果均不理想;④ CMCFE中五组曲线在大部分尺度上标准差重叠较小且曲线平滑,相较于其他三种方法,CMCFE的区分效果更好。
为了更精准地对行星齿轮箱的故障模式进行自动识别,构建了一种基于CMCFE和FA-SVM的新型多分类器,以提高决策效率。具体步骤如下:
步骤1对每种齿轮状态各取40个样本,每个样本长度为1 024,共得到200个样本。将每个样本数据进行归一化处理后,分别计算五种状态与正常状态下振动信号的CMCFE值,将20个尺度的熵值作为故障特征向量;
步骤2从每种状态计算出的CMCFE值中随机选取20个样本作为训练样本,剩余20个作为测试样本,五种状态共计训练样本和测试样本各100个;
步骤3将100个训练样本的故障特征向量输入到基于FA-SVM的多分类器中进行训练,为了方便,令1,2,3,4,5分别表示断齿、点蚀、裂纹、磨损故障和正常状态;
步骤4利用测试样本验证上述经过训练的多分类器的分类精度,最终输出故障诊断结果。
将上述步骤1、步骤2中的CMCFE分别换成CMCSE,MFE和MSE进行对比分析,图6显示了基于不同故障特征提取方法和FA-SVM的识别结果,由图中可以看出,基于CMCFE+FA-SVM方法的识别效果最好,齿轮五种状态的识别准确率高达100%,其中FA-SVM的参数c和g最优组合为34.19和3.14;而基于CMCSE+FA-SVM的方法识别准确率为97%,与本文所提方法对比验证了模糊熵的优越性;基于MFE+FA-SVM和MSE+FA-SVM的方法识别准确率分别为98%和97%,与本文所提方法对比验证了交叉熵的优越性。上述分析结果进一步说明了基于CMCFE和FA-SVM的方法在故障特征提取和故障类型诊断方面具有一定的优越性。
图6 基于不同故障特征提取方法和FA-SVM的识别结果
3 结 论
本文提出了CMCFE来衡量两个时间序列的同步性、相似性和互预测性。通过仿真信号与CMCSE进行对比,并将其应用于行星齿轮箱故障诊断,得到如下结论:
(1) CMCFE能有效的反映两个时间序列的同步性和复杂性,且表现出优于CMCSE的稳定性和可靠性。
(2) 提出了一种基于CMCFE和FA-SVM的行星齿轮箱故障诊断方法,通过分析处理行星齿轮箱试验数据,与MSE,MFE以及CMCSE进行对比,结果表明论文所提方法的故障特征提取能力更强,故障类型识别精度更高。