基于多尺度排列熵和正则化RVFL的高压隔膜泵单向阀故障诊断

2023-02-04范玉刚张由振

云南大学学报（自然科学版） 2023年1期

范玉刚，张由振

(1.昆明理工大学信息工程与自动化学院，云南昆明 650500；2.云南省矿物管道输送工程技术研究中心，云南昆明 650500)

大型往复式高压隔膜泵作为钢铁和采矿工业中矿浆管道运输的核心动力设备，机械结构复杂.单向阀作为高压隔膜泵中的关键零部件，长期工作在高压和高腐蚀的固液两相介质的矿浆环境中，导致了单向阀故障频生.采用振动信号分析方法，从单向阀振动信号中提取故障信息，识别单向阀故障类型，对维护高压隔膜泵的稳定运行，保障整条矿浆管道的输送效率有着重要的意义[1-3].

高压隔膜泵在复杂工况下运行，产生的振动信号具有非线性、非平稳特性，使用时域频域等振动信号分析方法难以有效提取单向阀故障特征[4].排列熵对非平稳序列的突变和冲击敏感，能够从振动信号的非线性角度描述信号特征，可以有效度量非线性信号的复杂性[5]，适用于复杂工况下单向阀故障信号的特征提取，然而仅使用单一尺度的排列熵难以全面提取信号中的突变和冲击信息[6].针对排列熵的不足，Aziz[7]提出多尺度排列熵，可用来检测振动序列信号在不同尺度下的复杂性和随机性.和排列熵相比，多尺度排列熵可以更加全面地提取单向阀的故障特征信息.

为了降低振动信号的噪声干扰，凸显单向阀振动信号的排列熵故障特征，潘震等[8]将变分模态分解（Variational Mode Decomposition，VMD）引入到单向阀振动信号的分解，计算各分解本征模态函数（Intrinsic Mode Function，IMF）分量的多尺度排列熵值.VMD对处理非线性非平稳信号有着较好的效果，有效弥补了经验模态分解（Empirical Mode Decomposition，EMD）、局部均值分解( Local Mean Decomposition，LMD）等信号分解方法中存在的模态混叠现象和端点效应等问题[9-11].

基于IMF分量的多尺度排列熵，建立高压隔膜泵运行状态识别模型，是单向阀故障诊断的关键.张建军等[12]使用反向传播（Back Propagation，BP）神经网络进行发动机故障的诊断.BP神经网络具备很强的非线性映射能力和柔性的网络结构[13]，但需要设置的网络训练参数较多、训练速度较慢且容易陷入局部最优.和BP神经网络相比，极限学习机（Extreme Learning Machine, ELM）具有单隐层的网络结构，且不需调整节点，避免了局部极值、复杂迭代问题，学习速率和泛化性能有所提升[14].张朝林等[15]使用ELM进行单向阀的机械故障诊断，取得较好的效果.随机向量函数链接（Random Vector Functional Link，RVFL）网络是同极限学习及相类似的一种单隐层前馈神经网络.与ELM不同的是，RVFL不仅利用隐含层增强原始数据的线性区分，还建立了输入层和输出层的直接关联，RVFL的直接连接设计更有利于提取输入数据的内部包含特征[16].由于RVFL网络模型本身的权值和偏置参数是随机生成的，这使得模型在稳定上存在缺陷，在训练时候易受到离群样本点干扰[17].为了提高模型的稳定性和泛化能力，本文提出了一种正则化RVFL模型，在兼顾经验风险最小的同时考虑了结构风险，有效避免了隐含层神经元个数过多带来的过拟合问题，进一步提高了模型的识别精度与泛化能力.

1 变分模态分解

VMD是一种自适应、完全非递归的模态变分的信号处理方法，延续了EMD的理念：将待分析信号看成若干本征模函数的线性叠加，有效避免了EMD存在的端点效应和模态混叠问题[18]，对非线性非平稳序列信号的处理效果较好.VMD将信号分解的过程转移到变分框架内，通过迭代搜寻变分模型最优解确定每个模态函数的频率中心及带宽，将信号自适应地分解为k个分量.

VMD算法主要分为两步：构造变分问题和迭代求解变分问题.在构造变分问题中，将输入的待处理信号分解成k个IMF分量，对每一个模态分量进行Hilbert变换得到其包络信号；经指数修正，与预估的中心频率 ωk(t)进行混合，并将单边频谱调制到相应的基频带；利用L2范式估计每个模态分量的带宽，使其带宽之和最小.在使各分量信号之和等于原始信号的约束条件下构造变分问题：

式中： {uk}={u1,u2,...,uK}为分解的各分量信号，{ωk}={ω1,ω2,···,ωk}为各模态分量的中心频率，为uk的希尔伯特变换.

这里对变分问题的求解是通过引入二次惩罚因子 α和拉格朗日乘法算子 λ (t)，将约束性变分问题转化为无约束变分问题，其表达式为：

通过交替方向乘子算法（Alternate Direction Method of Multipliers，ADMM）求解式（2）中的鞍点，交替更新当满足时停止迭代，此时求得的k个IMF分量即为此次求解变分问题的模态分量.这里使用VMD分解方法将原始复杂的单向阀振动信号分解成若干具有物理意义的本征模态函数，相比于直接使用原信号提取故障特征使用IMF分量提取的故障特征更为完备准确.

2 多尺度排列熵

2.1 排列熵算法信息熵可以用来度量信号的信息量、复杂度和不确定性.排列熵作为信息熵的一种，对非平稳信号的突变和冲击敏感，能够准确刻画复杂时间序列的变化情况.Bandt 等提出排列熵（Permutation Entropy，PE）[19]，将序列重构后再升序排列，通过排列模式出现概率计算熵值来度量复杂度.

排列熵算法的基本原理如下：对一个待度量分析的时间序列 {x(i),i=1,2,···,N}首先进行相空间重构，得到矩阵

式中：m为嵌入维数，τ为延迟时间，K为重构相空间中的向量个数，K=N-(m-1)τ.矩阵中的每一行均为一个重构分量，分别对式（1）中的k个重构分量的每一个分量元素按照数值大小做升序排列，取元素位置的列索引组成一组位置序列.例如矩阵中的第j行重构分量 {x(j),x(j+τ),···,x(j+(m-1)t)}按照升序排列为：

式中：j1,j2,···，jm为重构分量中各元素所在列的索引.若重构分量中存在元素大小相等的情况，则通过比较ja和jb的值确定排序位置，当ja

式中：l=1,2,···,k，且k≤m!.位置序列存在m!种排列的可能性，计算每一种位置序列在Y中出现的可能性 {P1,P2,···,Pk}根据熵值的计算公式，可得时间序列x(K)的排列熵公式为：

当Pi=m!时，Hpe为其最大值 ln(m!).对计算求得的排列熵做归一化处理，以便于对熵值进行比较.排列熵Hjpe归一化公式为：

高压隔膜泵中单向阀的振动信号是一种典型的时间序列，将排列熵用于单向阀故障特征的提取是检测单向阀故障的有效方法.

2.2 多尺度排列熵PE能够度量非线性非平稳信号的复杂性，可以用作对机械故障信号的特征提取.在复杂工况下，单向阀的振动信号受到矿浆特性的改变以及高压隔膜泵中多组件振动的影响，单尺度排列熵难以全面提取单向阀中微弱的故障特征.多尺度排列熵（Multiscale Permutation Entropy，MPE）能从多时间尺度表征信号的复杂性，可以较灵敏地反映动力学系统振动响应的微小突变行为，对复杂工况下微弱机械故障的特征提取有着较好的效果[8].

多尺度排列熵计算时间序列在不同尺度下的一组排列熵值.计算多尺度排列熵主要包括对原序列做粗粒化处理获得多尺度时间序列和计算每个粗粒化后的序列的排列熵值.具体算法如下：对一个时间序列X={x(i),i=1,2,···，N}进行粗粒化操作可得粗粒化序列 {yj(s)}为：

式中：j=1,2,···,非整数，则向下取整，s为比例因子，s=1,2,···,N.当s=1时，yj(1)为原序列，当 τ>1，可以得到序列长度不超过的s个粗粒化序列yj(s).

对每一个粗粒化得到的序列求其排列熵值，构造关于尺度因子s的函数，可得到多尺度排列熵

式中：x为待计算序列，τ为延迟时间，m为排列熵的嵌入维数.在算法中参数m和 τ的设置极大影响PE值的大小，对嵌入维数和延迟时间这两个参数的设置，在4.3节将详细论述.

MPE算法中序列需要粗粒化处理，尺度因子s=2的粗粒化过程和尺度因子s=3的粗粒化序列处理过程如图1、图2所示.

图1 s=2的粗粒化过程Fig.1 Coarsening process of s=2

图2 s=3的粗粒化过程Fig.2 Coarsening process of s=3

3 正则化RVFL

3.1 RVFL模型RVFL和极限学习机网络模型类似，都属于典型的单隐层前馈神经网络.与极限学习机不同的是，RVFL的网络结构中除了具有输入层、隐含层和输出层，还存在一种线性链接以直接连接输入层和输出层.这种直连的设计有利于模型对输入数据内部特征的提取.不同于常见的神经网络如BP神经网络需要通过迭代找到最佳网络参数，RVFL随机产生隐含层神经元的权值和偏重，通过矩阵运算求解出输出权值.

分析RVFL的网络模型结构可知，输入层输入了n个数据样本 (Xi,Yi)∈Rn×Rm，该训练样本遍历隐含层的L个激活函数结点，在隐含层进行非线性映射.h(X)为隐含层神经元的激活函数，ωi和bi为函数输入层连接权值矩阵和神经元隐含层偏差，其中每个神经元的连接权值 ωij的维数同每个输入样本xi的维数保持一致.RVFL模型的输出函数可以描述为：

式中：i=1,2,···，N，β为输出层连接权值.式（10）用矩阵可表示为：

式中

是隐含层各激活神经元输出值和输入层样本数据组合而成的矩阵.该RVFL网络模型需要求解的目标函数为：

这里在求解式（13）的最优参数时，不同于常用的网络模型，如BP神经网络使用梯度下降算法通过迭代的方式不断更新网络，而是通过解（13）式的最小值，求出网络参数的最优解：

网络参数 ω和b均是在输入训练样本数据后随机产生，因此，在为网络指定激活函数类型之后，式（12）中H矩阵即为已知量.RVFL网络的训练过程即为求解 β的最小二乘解 β*的过程.则输出权值矩阵为：

式中：H-1为H矩阵的广义Moore-Penrose逆矩阵.

式中：HT为H矩阵的转置矩阵.

可见RVFL网络的训练过程可以避开复杂的迭代运算.通过求解输出权值矩阵可以很快确定整个网络参数，继而确定整个网络模型.因此RVFL网络在机械故障诊断等数据维数不特高的模式识别任务中有着较大的优势.

3.2 正则化RVFLRVFL具有所需训练样本小、训练速度快、运算效果高等诸多优点，但是囿于网络部分参数随机生成，以及网络模型自身的结构风险，RVFL在有些情况下稳定性不强，存在一些不确定因素.在工况复杂多变的情况下，模型为了拟合一些离群的样本点，隐含层节点大大增多，会出现训练效果较好，但预测结果不佳等过拟合的情况.

RVFL网络模型通过最小二乘损失函数的构建求解输出权值，只考虑了经验风险最小化，没有考虑结构风险，容易出现过拟合，模型的泛化能力不强.因此标准的RVFL网络模型缺乏结构风险的评估，在工程实践的应用中需较大的改进.为了克服解决RVFL存在的不足，增强RVFL网络的泛化能力，本文提出了正则化RVFL，在标准RVFL基础上引入正则化系数，构建正则化RVFL模型.

正则化RVFL的目标函数为：

式中：λ为引入模型中的正则化系数，‖ ε‖2、 ‖ β‖2为模型的经验风险和结构风险，E为模型的风险总和，ε为训练误差，所求模型最优训练误差 εj可表示为：

为求解正则化RVFL模型算法，构造拉格朗日方程：

式中：α为拉格朗日算子.分别对（19）式中各变量求偏导，并使得各求得的偏导表达式结果为0.

输出权值矩阵最优为：

式中：I为单位矩阵.将 β*应用于（10）式中模型的构建，即可得到基于正则化RVFL的单向阀故障诊断识别模型：

由上述分析可知，这种正则化的RVFL兼顾了经验风险和结构风险，增强了模型的泛化性和抗干扰能力.整个模型的训练步骤为：

步骤 1由系统随机产生输入权值矩阵 ω以及偏置向量b.

步骤 2输入样本经过隐含层计算和直接链接得到输出矩阵H.

步骤 3解方程，由式（21）得出最优输出权值矩阵和直连链接矩阵 β∗.

步骤 4将求得的 β∗用于模型的构建，将测试样本代入式（22）的模型中，即可实现相应任务的识别分类或回归预测.

4 工程实验分析

4.1 实验数据采集本文的实验数据取自云南一铁精矿管道的运送系统中的一高压隔膜泵站.从高压隔膜泵站的历年维修记录可以发现，单向阀损坏及更换最为频繁，占据高压隔膜泵总故障的90%以上，而单向阀的故障多数是由粗颗粒造成的卡阀故障和单向阀高强度工作反复冲击导致单向阀严重磨损故障.高压隔膜泵的结构如图3所示.为验证所提方法在工程应用中的有效性，本文分别采集了单向阀在正常状态、卡阀故障状态以及磨损故障状态下工况运行的振动信号.

图3 高压隔膜泵结构模型Fig.3 The structure model of high pressure diaphragm pump

单向阀的进料阀和出料阀是匹配工作的，这里选择一组进出料的单向阀进行3种状态的振动信号的采集.振动加速度采集器固定于单向阀旁边的平台上，并在数据采集过程中保持其自身平稳.整个实验数据采集过程中所用到的实验数据采集设备及其型号如表1所示.数据的采样频率为2 560 Hz，3种状态的样本数据各采集60组，每个样本包含1 280个采样点数据.

记者了解到，钢栈桥所在的静兴高速，东起山西省忻州市静乐县丰润镇，与晋 S50 平临高速相连；西至山西省吕梁市兴县高家村镇黑峪口，黄河特大桥与陕西省神盘公路相接，全长93.86千米，是山西省“三纵十二横十二环十五条连接线”高速公路网规划中的第七条连接线。黄河特大桥钢栈桥的顺利合龙，打通了跨越晋、陕两省黄河两岸的施工便道，为确保黄河特大桥施工总工期目标的实现提供了有力保障。（记者李涛）

表1 信号采集系统设备及型号Tab.1 Signal acquisition system equipment and model

4.2 信号分解使用VMD对信号进行分解，首先需要对VMD算法的各相关参数进行设置，其中尺度参数k和惩罚因子 α的预设是使用VMD算法分解单向阀故障信号的关键所在.预设的k值决定着分解IMF分量的个数，k值过小会导致原始信号分解不充分，细节保留度不足，从而会遗失一些细节特征的提取；k值过大又会造成信号的过分解，出现模态频谱接近重合，存在多余模态分量.惩罚因子α决定着IMF分量带宽的宽度，惩罚因子 α越小，各IMF 分量的带宽越大，反之，IMF分量信号的带宽越小[20].工况下单向阀的振动信号复杂多变，本文的研究将根据现场实际单向阀工况下的振动数据来设定合适的参数k和α.

本文使用中心频率观察法，通过对现场数据的分解来确定参数k.原始信号经VMD分解后得到一系列中心频率由低到高的形式分布的IMF分量，合适的k值能够使得分解得到的各分量之间的中心频率分布较为合理，不会出现频率相近或混叠的现象.这里以单向阀的卡阀故障为例随机取卡阀故障信号进行VMD分解，得到各分量的中心频率.各不同分量及其中心频率如表2所示.

表2 不同分量下的中心频率Tab.2 The center frequency under different components

由表2可以看出，IMF分量为5时，分量4和分量5之间的中心频率较为接近，该信号明显存在过分解现象；而IMF分量为3时，存在原信号分解不足的问题.可以看出将模态个数预设为4，得到的分量中心频率分布较为分散合理，且无继续分解的必要，因此这里将分解模态个数k预设为4.

在惩罚因子 α的选取上，实验中使用逐步寻优的方法找出最优的α.信号在经过VMD分解后得到的分解信号内包含较多同故障特征相关的冲击成分，呈现较强的规则性和自相似性.模糊熵对非平稳信号复杂程度的评估有着较好的效果，这里选用模糊熵值作为惩罚因子的选取评价参数.当 α取得最优值，信号内的冲击成分、规则性和自相似性都应得到增强，分量信号的模糊熵值应为最小.在分解模态k取4的基础上对 α进行寻优，计算惩罚因子 α在不同取值下，分量信号的模糊熵值，经评估当 α取2 700时模糊熵值最小.

在确定了VMD算法的主要参数后对原始信号进行分解.图4为k取 4，α取2 700时，对单向阀一段卡阀故障序列信号进行VMD分解所得4个模态分量.

4.3 单向阀熵值特征提取在计算单向阀各分解分量信号的多尺度排列熵时需要设定几个重要的参数：时间序列的长度N，时间延迟τ，嵌入维数m，以及尺度因子s.这些参数会直接影响所计算各状态分量的多尺度排列熵值的大小.选取合适的参数可以提取到不同状态下的单向阀区分度更加明显的熵值特征.

图4 VMD分解分量图Fig.4 Diagram of VMD decomposition component

时间序列的长度N取较小会使计算结果失稳，序列数据过长时会出现信息冗余，导致运算成本增加，计算资源浪费.这里根据工况下单向阀的工作特性以及现场振动信号的采样频率，设定序列长度N为1 280，即在一段连续的采样数据中每1 280个数据截取为一个样本.

延迟因子 τ的选择受时间序列长度的影响，这里随机取20组单向阀某状态在序列长度为1 280的情况下，测试排列熵值受时延 τ的影响情况.如图5所示，不同 τ值在嵌入维数的变化下，排列熵值的变化.可以看出在各相同嵌入维数下 τ取不同值，序列的排列熵值几乎相同.这里直接将时延 τ取1.

图5 不同时延下的排列熵值Fig.5 Permutation entropy values with different time delays

对于嵌入维数m的选取，应该与序列长度N的大小相匹配，李永健等[21]提出m的取值应该满足N>5m!，建议m的取值在3～7.当嵌入维数较小时，重构的向量中包含的状态过少，不能准确反映序列信号的突变；当嵌入维数取值过大时，会使得原信号的相空间重构繁琐，计算复杂，并造成序列的均匀化，无法反映序列的细微变化.经评估，在样本序列长度为1 280，时延因子取1的情况下，嵌入维数预设为5效果较好.

在尺度因子s的选定上，若s取值过大，直接使得通过MPE计算出的特征矩阵维数较高，简单的分类模型难以识别这些高维特征.同时s取值过大时，在较大尺度处计算得到的熵值不稳定，容易产生较多的离群点.尺度因子s取值过小时只能在较少尺度范围检测信号的随机性和复杂度，难以全面提取故障的特征信息.Azami等[22]提出尺度因子s的选择应满足s

图6 不同尺度因子下的模型识别准确率Fig.6 The accuracy of model recognition under different scaling factors

4.4 正则化RVFL模型检测本文通过在算法层改进RVFL，规避原模型的结构风险，得到了正则化的RVFL结构模型.为了使正则化RVFL模型能够更好地应用在工况下高压隔膜泵单向阀的故障诊断，这里对模型中的可变因素隐含层激活函数的数量以及激活函数的类别进行了多组实验寻优.选择了常用的Sigmoid、SoftMax、MaxOut、ReLU等激活函数，随机选用多组单向阀3种状态下的熵特征数据进行测试寻优，计算其平均识别准确率，如图7所示，模型使用Sigmoid激活函数识别精准度相对较高.同时可以发现，激活函数的数目在20至25之间即可达到一个较高的识别精度.这里的正则化RVFL识别模型激活函数个数取20，激活函数选用Sigmoid.

图7 模型使用不同激活函数的测试精度Fig.7 The test accuracy of models in different activation functions

将从现场采集的单向阀3种状态的原始序列信号按照4.2和4.3节中的实验测试以及分析评估而预定的参数进行信号的分解处理和多尺度排列熵特征的提取.取“正常”、“卡阀”、“磨损击穿”3种状态单向阀振动信号，每种状态各60个样本数据，可以得到每个样本维数为40维特征的样本数据（VMD分解尺度参数k取4，多尺度排列熵尺度参数s取10）.单向阀3种状态分别标记为“1”，“2”，“3”.每种状态的样本数据随机生成训练样本和测试样本.每种状态取随机取30个样本作为测试集，使用正则化RVFL分类模型进行识别，识别结果如图8所示.

图8 正则化RVFL的单向阀故障识别结果Fig.8 The result of fault identification of valve in regularized RVFL

为了体现所提正则化RVFL模型对该故障识别任务的优越性，这里分别使用了调优后的BP神经网络、SVM、ELM和标准的RVFL等分类模型进行训练和测试.各种模型的测试识别结果如表3所示.由表3的各模型识别精度统计可以看出正则化RVFL的识别精准度明显高于其他的几种识别模型，相比于标准RVFL，本文所提正则化RVFL的识别精度也有较大的提升.