多尺度特征组合优化的航空液压管路故障诊断
2022-10-13薛政坤汪曦于晓光王宠刘思远张景博
薛政坤,汪曦,于晓光,王宠,刘思远,张景博
(辽宁科技大学机械工程与自动化学院,辽宁鞍山 114051)
0 前言
航空液压系统是航空机械设备重要的动力支持系统,其下的液压管路系统是航空液压系统中不可或缺的一部分,担负着能量传输的任务。液压管路长期服役于复杂的环境中,受高压环境下强烈振动的影响,导致管体自身疲劳以及过载和碰撞等问题出现,极易造成积累性的损伤故障,影响整个液压系统正常运作,甚至可能引发严重的安全事故。航空液压管路故障一直是影响航空液压系统可靠性的重要问题,因此开展航空液压管路故障诊断研究,对提高航空液压系统的可靠性具有重要的意义。
航空液压管路的振动机制具有一定复杂性,一方面泵源压力脉动频率与液压流体谐振频率接近时易引发耦合振动,另一方面泵源压力脉动频率与管路结构固有频率接近时易引发流固耦合振动,导致管路振动信号呈现非平稳和非线性等特点。从复杂的振动信号中提取出故障特征,是实现航空液压管路故障诊断的关键。李哲洙等将经验模态分解方法结合希伯尔特黄变换方法引入到航空液压管路的振动信号分析,实现管路裂纹故障的诊断。王立文等针对航空液压管路破裂泄漏等故障问题,利用仿真建模得到不同液压泄漏故障程度的管路的固有频率作为特征信息组成数据样本,利用概率神经网络模型实现故障识别。
为进一步提取信号中的特征信息,可以利用信号的信息熵作为特征指标来表示,它用于反映时域序列的随机性和复杂程度。ROSTAGHI和AZAMI提出一种用于衡量时间序列复杂度的指标散布熵(Dispersion Entropy,DE),与样本熵和排列熵相比具有更好的稳定性和较强的计算速度。
由于非线性非平稳振动信号的复杂性,仅从单一尺度衡量信号的复杂度,可能会遗漏其他尺度上的重要信息,难以全面反映特征信息。因此,多尺度信息熵作为判断不同尺度信号复杂程度的指标和特征参数,被用来表征不同类型的振动信号在不同尺度下的复杂性。例如多尺度样本熵、多尺度排列熵等多尺度信息熵作为表征信号信息的特征指标,并被引入故障诊断领域中。
为从振动信号中提取更具状态表征性的特征信息,本文作者采用能量比值法对变分模态分解的分解层数进行优化选取。根据模态分量信号与原信号的相关系数,选取最佳的模态分量信号进行模态信号重构作为分析信号。计算重构模态信号的优化多尺度散布熵(Multiscale Dispersion Entropy,MDE)作为多尺度特征指标,将其熵值组合成具有表征性的特征向量集。利用经麻雀搜索算法(Sparrow Search Algorithm,SSA)优化的极限学习机(Extreme Learning Machine,ELM)网络,对特征向量集进行识别和故障状态诊断,实现对航空液压管路的故障识别及诊断。
1 基本理论
1.1 变分模态分解
变分模态分解算法(Variational Mode Decomposition,VMD)是一种能够自适应复杂信号且能够将具有物理意义的本征模态分量分解出来的信号处理方法。其主要原理是通过对待处理信号进行受条件约束的变分模型构造,并采用迭代方式搜寻约束变分模型的最优解,从而获得每个本征模态函数分量的中心频率和带宽,进而实现对信号的最佳分解。其中变分模型构造是对待分解信号()进行分解,获得个模态分量信号()以及估计中心频率,并对各个模态分量信号进行希尔伯特变换求取解析信号,与估计中心频率混合,在满足各分量信号之和等于原信号的约束条件下,建立变分模型如式(1)所示:
(1)
在模型求解过程中,通过引入拉格朗日乘法算子和惩罚因子,将模型转换成不受条件约束的变分模型,如式(2)所示:
({},{},)=
(2)
利用交替方向乘法算子,通过迭代更新的方式得到变分模型的鞍点,即受约束变分模型最优解。
具体迭代更新过程如下:
(3)
(4)
(5)
(6)
1.2 麻雀搜索算法
麻雀搜索算法是一种模仿自然界中麻雀生活中觅食和躲避捕食者过程行为方式的群体寻找最优解的智能优化算法模型,在计算时不需要依赖复杂的梯度信息,仅需要对目标函数和适应度函数进行设定。在求解最优问题时,该算法具有很强的实用性和较好的鲁棒性等特点。具体工作流程如图1所示。
图1 麻雀搜索算法流程
1.3 优化多尺度特征提取
(7)
(8)
(9)
式中:均值和标准差取自时间序列。
(10)
式中:int为取整函数;为类别数。
(11)
式中:为嵌入维数;为时间延迟。
(12)
(13)
通过分析航空液压管路振动信号发现,传统的信号特征分析方法只从单一时间尺度方面考虑,所分析的信号特征信息不够全面,未能较好地表征出液压管路的状态。因此,从多个时间尺度进行信号的特征分析,能够找到更多隐藏的特征信息。
多尺度散布熵MDE能够描述信号序列在不同尺度因子下的熵值特征信息,MDE的函数表达式如式(14)所示:
(14)
优化多尺度散布熵IMDE是基于多尺度散布熵MDE的一种优化方法,它能够避免传统多尺度粗粒化过程中造成的邻近序列信息遗漏,同时起到抑制因时间尺度因子增大序列数减少而导致的熵值突变现象,在一定程度上能提升熵值计算的稳定性。通过分别计算优化粗粒序列在不同时间尺度因子下的散布熵值的均值,即可得到IMDE的函数表达式如(15)所示:
(15)
1.4 优化极限学习机
极限学习机ELM是一种单隐含层前馈神经网络的算法,通过设置隐含层神经元个数,同时随机初始化输入权值和隐含层阈值,就能够确定网络结构。与传统神经网络相比,ELM需要设置的参数少,在保证精度的前提下,ELM因具有良好的泛化性和学习的高效性被广泛应用于各个工程领域。
由于极限学习机神经网络的输入权值与隐含层阈值是随机产生的,且在训练过程中不发生改变,在一定程度上影响了性能,因此选择合适的参数是提升极限学习机网络性能的关键。
为提高极限学习机的性能,利用麻雀搜索算法,将样本训练集与测试集的分类误差率之和作为适应度函数,对极限学习机网络的输入权值和隐含层阈值参数进行优化选取,具体流程如图2所示。
图2 优化极限学习机流程
2 故障诊断流程
多尺度特征组合优化的航空液压管路故障诊断方法流程如图3所示,详细步骤如下:
图3 航空液压管路故障诊断流程
(1)按照一定的采样频率,分别采集航空液压管路正常状态、裂纹故障状态、凹坑故障状态的振动信号;
(2)分别对管路不同状态下的振动信号进行VMD分解,利用能量比值法确定适应该信号的VMD的最佳分解层数;
(3)根据最佳分解层数进行VMD分解,获得模态分量信号,分别计算每个模态分量信号与原信号的相关系数值,并根据相关系数值选取合适的模态分量信号进行重构;
(4)计算每种状态下重构信号的优化多尺度散布熵,选取合适时间尺度因子下的散布熵作为故障特征指标组成数据集;
(5)将故障特征数据集代入麻雀搜索算法优化后的极限学习机网络进行训练,得到故障诊断模型,实现管路故障识别分类。
3 信号分析处理
3.1 仿真信号分析
为验证所提方法的有效性,给出如式(16)所示的仿真信号模型:
(16)
其中:=50 Hz、=150 Hz、=250 Hz、=350 Hz;为高斯白噪声。采样频率为1 000 Hz;采样点数为1 000。生成的仿真信号时频域波形如图4所示。
图4 仿真信号时频域波形
首先,采用较通用的惩罚因子=2 000作为因子值,对仿真信号进行变分模态分解。分别计算出仿真信号在为2~7之间时各模态分量的能量比,结果如图5所示。可知:当由2变化到4时,能量比大幅度增大;当从4变化到5时,未发生大幅度增大且趋于稳定,说明当=4时达到最佳分解个数,如果继续增大会导致信号过度分解,造成模式混叠现象。
图5 仿真信号各模态分量能量比值曲线
通过中心频率观察法对能量比值法判别选取的正确性进行验证,计算仿真信号在不同下各个模态分量的模态中心频率并进行分析。分别计算为2~7时各模态分量的中心频率,结果如图6所示。可知:对比为2~3时的分解结果,能够发现各模态之间的中心频率差距过大,信号分解明显不足;当=5时,IMF4和IMF5模态分量的中心频率较为接近,由此推断信号分解过程中,出现模态混叠现象。为了防止过度分解出现模态混叠现象,综合考虑=4符合该信号模态的最佳分解个数。
图6 仿真信号各模态分量中心频率
3.2 管路实验
通过模拟航空液压管路工作环境,对不同状态类型的液压管路分别进行实验。采取人工植入的方式,分别对液压直管和弯管的管体表面设置裂纹和凹坑两种故障。
图7所示为航空液压管路实验平台示意,主要由电气控制系统、液压动力系统、实验台和信号采集系统组成。
图7 航空液压管路实验平台示意
实验中所涉及参数:液压系统压力为10 MPa,电动机转速为1 200 r/min,采样频率为7 680 Hz,使用加速度传感器采集振动数据,不同振动测试管路不同传感器布局位置如图8所示。
图8 液压管路振动实验
3.3 实验信号分析
通过实验获得了液压管路不同状态类型的振动信号,文中以直管裂纹故障状态类型的振动信号为例进行分析。利用变分模态分解算法处理振动信号,其中默认惩罚因子=2 000,利用能量比值法确定分解层数。图9所示为不同时直管裂纹故障状态振动信号的能量比值曲线,通过观察可以选取直管裂纹故障状态的振动信号分解层数=6。
图9 直管裂纹故障各模态分量能量比值曲线
对直管裂纹的振动信号进行分解,得到模态分量信号如图10所示。
图10 液压直管裂纹故障状态振动信号VMD分解结果
为尽可能消除干扰信号,获得信号中重要的信息成分,剔除与原信号相关性较低的分量,选取相关性较高的信号重构。计算直管裂纹故障状态下,分解后的各个模态分量信号IMF与原信号的相关系数,结果如表1所示。
表1 直管裂纹故障状态模态分量相关系数
模态分量信号的相关系数越大,说明它与原信号之间的相关性越高,分量信号中包含与原信号有关的信息越多。当相关系数小于1/时,表示相关性较差,因此选用与原信号相关性较高的模态分量IMF1和IMF2进行重构,得到的重构模态分量作为进一步多尺度特征分析的对象。
根据上述方法依次计算各项数据的重构模态分量,并分别计算其优化多尺度散布熵作为特征指标。其中,计算多尺度散布熵所涉及的参数嵌入维数=2、类别数=4、时间延迟=1、时间尺度=20。
标准差可以较好地衡量离散程度,散布熵的标准差曲线如图11所示。可知:直管无故障状态和直管裂纹故障状态数据集的散布熵标准差较低,说明重构信号随着时间尺度因子的增大,整体熵值较为平稳;直管凹坑故障状态数据集的散布熵标准差随着的增大而递增,说明信号整体较不稳定,在大于8的较高时间尺度时出现交叉疏散现象。弯管无故障状态和弯管裂纹故障状态以及弯管凹坑故障状态数据集的散布熵标准差曲线具有一定近似性,随着时间尺度因子的改变逐渐产生小幅度变化。在选择信号的特征指标时,特征数量太多会导致信息冗余,特征数量太少又不能完全反映信息。从整体角度观察其多尺度散布熵的标准差曲线,经综合考虑,选取为1~8的时间尺度的散布熵值作为特征指标。
图11 不同状态管路改进多尺度散布熵标准差曲线
3.4 状态识别分类
运用文中所述方法构建多尺度特征向量集,液压管路直管裂纹故障、直管凹坑故障、弯管裂纹故障、弯管凹坑故障的标签分别设置为a、b、c、d ,每种故障的振动信号各选取40组,共160组数据,每组数据的长度为11 520个点。从每种状态类型中随机选取25组数据作为训练样本,共计100组,每种状态类型剩余数据作为测试样本。将训练集样本输入到利用麻雀搜索算法优化的极限学习机网络模型进行训练,进而实现故障识别及诊断。经过多次尝试,选取优化算法的最佳参数为种群规模为50、最大迭代次数为100、警戒阈值为0.6。
为验证文中方法的优越性,探讨多尺度特征提取对识别效果的影响以及变分模态分解是否对管路状态的识别结果产生影响。选用排列熵PE作为特征指标和采用支持向量机SVM网络等方法作为识别模型,并选用相同振动信号数据进行对比分析,结果如表2所示。
由表2可知:选用传统多尺度散布熵MDE作为特征指标输入到ELM网络模型中的方法(VMD-MDE-ELM),分类准确率能达到95%,与单尺度特征的方法(VMD-DE-ELM)相比,分类准确率提高13.33%;利用传统多尺度散布熵MDE作为特征指标输入到极限学习机的方法(VMD-MDE-ELM),分类准确率低于优化多尺度IMDE,说明优化多尺度粗粒化过程能够提高网络模型分类准确率。
表2 不同方法识别结果
采用直接计算原始振动信号的排列熵PE为特征值的极限学习机方法(PE-ELM)分类准确率仅达到73.33%,利用散布熵DE作为特征指标时(DE-ELM)的分类效果准确率能达到80%,而经过变分模态分解处理的方法VMD-PE-ELM和VMD-DE-ELM的准确率分别能够达到76.67%和81.67%,说明特征指标选取散布熵与排列熵更具有优势,验证了变分模态分解处理对识别准确率具有一定影响。
分别将优化多尺度IMDE方法(VMD-IMDE- SVM)和传统多尺度MDE方法(VMD-MDE-SVM)输入到支持向量机网络模型,其分类准确率分别为96.67%和93.33%,而VMD-IMDE-ELM方法能够达到98.33%;与此同时,极限学习机网络整体上运行所需时间较少。说明相同特征指标下极限学习机网络比支持向量机网络在运行速度和识别准确率方面拥有更显著的优势。
将优化多尺度IMDE方法输入到经麻雀搜索算法优化的极限学习机网络模型中的方法VMD-IMDE-SSA-ELM的分类准确率能够达到100%,说明对极限学习机网络进行优化,能提高其识别的综合准确率。
4 结论
针对航空液压管路故障特征难以提取、故障诊断困难的问题,提出了多尺度特征组合优化的航空液压管路故障诊断方法。经过实验验证,所述方法能够准确有效地实现对不同类型航空液压管路的故障识别及诊断。主要结论如下:
(1)利用能量比值法能够对变分模态分解的分解层数进行优化选取;通过选取合适的分量信号进行重构并进行多尺度特征提取,能够提升网络模型的识别准确率。
(2)与传统多尺度特征提取方法相比,优化多尺度特征提取方法稳定性更好;选择散布熵作为特征指标具有更好的分类效果。
(3)与支持向量机网络相比,极限学习机网络需要设置的参数更少且在运行速度和分类识别方面较优;利用麻雀搜索算法优化后的极限学习机网络,识别准确率得到有效提升。