APP下载

基于VMD和多特征融合的管道信号特征提取方法

2022-02-17路敬祎李禹琦褚丽鑫宋南南胡仲瑞

压力容器 2022年11期
关键词:特征参数特征向量特征提取

路敬祎,李禹琦,褚丽鑫,宋南南,胡仲瑞

(1.东北石油大学 三亚海洋油气研究院,海南三亚 572024;2.东北石油大学 人工智能能源研究院,黑龙江大庆 163318; 3.东北石油大学 电气信息工程学院 黑龙江大庆 163318;4.黑龙江省网络化与智能控制重点实验室,黑龙江大庆 163318)

0 引言

在管道泄漏检测中,油气管道泄漏信号具有非平稳性以及信号混合性的特点,经验模态分解简称(Empirical Mode Decomposition,简称EMD) 算法和变分模态分解简称(Variational Mode Decomposition,简称VMD) 算法都适用于分析处理非平稳信号,并可对油气管道泄漏检测中所采集的信号进行处理[1-6]。为处理非线性平稳信号,变分模态分解(Variational Mode Decomposition,简称VMD) 由Dragomiretskiy等[7]提出,它是一种新的多分辨率变分模态分解(VMD)算法,也是一种完全非递归的自适应信号分解方法,它不仅对信号中的噪声具有良好的分离效果,而且可有效地抑制信号分解中的模态混叠,克服了EMD算法的局限性[8]。

在泄漏检测过程中,提取信号的特征信息对提高管道泄漏检测精度起着关键作用,因此,从管道信号中提取有效特征,对降低误报率具有重要意义。LU等[9]提出VMD-SVM的天然气管道泄漏检测方法,利用相关系数进行信号的预处理,提取信号的时频域特征和云特征熵作为特征向量组,输入到SVM中进行工况识别;马雯萍等[10]提出基于VMD的天然气管道泄漏信号特征提取与检测技术研究,通过云模型特征熵提取特征值,利用网格搜索法优化支持向量机(Support Vector Machines,简称SVM)的主要参数,提高工况识别的精度和准确度;杨洁等[11]针对雷达信号提出基于VMD和熵特征的辐射源信号识别,熵特征包括近似熵和范数熵,将该特征参数组合输入到经PSO优化的SVM中对辐射源信号进行识别;方超[12]针对泄漏声波特点以及传统小波阈值降噪的局限性特点,提出了一种变分模态分解和奇异谱分析(VMD-SSA)的联合降噪算法,并通过引入能量熵以及能量贡献率解决了VMD方法重构时模态数以及奇异谱重构时奇异值数难以确定的问题;鄢小安等[13]提出针对滚动轴承信号的复杂度分析方法-层次多尺度散布熵(HMDE),并利用鸟群优化算法优化HMDE的参数,最后输入到支持矩阵机(Support Matrix Machine,SMM)进行轴承故障诊断;戚元华等[14]根据管道动态压力信号在时域的幅值统计特性,提出一种基于时域统计特征的信号提取方法,实现对天然气管道的泄漏检测;孙洁娣等[15]提出了一种基于LMD的信号特征提取方法,首先采用LMD对信号进行分解及重构,然后采用小波包对重构信号进行处理,最后对处理后的数据进行包络谱分析,求取其包络谱熵构成特征向量,实现对信号特征的提取。通过以上对特征提取方法的现状进行分析,可以说明特征的提取是识别中的关键的步骤。

鉴于此,笔者提出一种基于VMD和多特征融合的管道信号特征提取方法,首先,将信号通过VMD算法进行预处理,在此过程中提出了一种WCC算法,利用加权的相关系数和余弦值指标来确定VMD分解层数K值,然后根据IMFs分量与原始信号相似程度确定特征模态分量,提取特征模态的特征参数,主要熵特征、波形参数和时频域特征中选择散布熵、裕度因子和标准差,将提取的特征参数构建成基于多特征融合的高维特征向量矩阵,最后,将特征向量输入到PNN中进行管道信号的工况识别。

1 相关理论

1.1 变分模态分解

VMD 适用于处理非线性信号,其分解过程实际就是一种对变分问题的求解过程,是将一个信号f分解成个K模态函数uk(t),使每个模态的估计带宽之和最小。其具体分解过程[16]如下。

(1)对每个模态函数uk(t)采用Hilbert变换计算相应的解析信号进而得其单侧频谱。

(1)

(2)对每一个模态函数uk(t),通过与其对应的中心频率的指数项混叠,将每个模态的频谱调制到相应的“基带”。

(2)

(3)由解调信号的高斯平滑法估计出各模态信号带宽,即梯度平方范数,进而求解带约束条件的变分问题,其约束变分表达式为:

(3)

(4)采用二次惩罚因子∂和拉格朗日乘法算子求式(3)的解,将约束性变分问题变为无约束问题,即:

L({uk},{ωK},λ)

(4)

式(1)~(4)中,{uk}={u1,…,uk}表示分解获得的K个IMF分量;*为卷积;{ωK}={ω1,…,ωK}表示各个IMF分量的中心频率;∂t表示对函数求时间t的导数;δ(t)为单位脉冲函数。

(5)采用交替方向乘子法解决以上变分问题,通过交替更新uk,ωk以及λn+1寻求扩展拉格朗日式的“鞍点”,此时变分问题的解为:

(5)

(6)同理,解得中心频率的更新方法为:

(6)

1.2 分解层数K值的确定

VMD在进行信号分解前需要提前设定分解层数K值,不同的K值会影响VMD的分解性能。如果K值设置过大,会存在过分解的现象,即同一个频率分量会出现在不同的模态中;如果K值设置过小,会存在欠分解的现象,即原始信号的频率分量未分解出来[16]。因此,在进行VMD分解前,设定合适的分解层数K值,可使VMD分解得到较好的分解结果。

本文提出了一种WCC算法,利用加权的相关系数和余弦值指标来确定VMD分解层数K值,设置不同的K值进行VMD分解,惩罚因子α的值默认为2000,计算不同K值下的相邻模态之间的WCC值。具体如式(7)所示。当相邻模态之间的WCC值越小,代表着两个模态之间的相似度越小;当相邻模态之间的WCC值越大,代表着两个模态之间的相似度越大,也代表着此刻VMD分解可能存在过分解。根据相关系数理论,相关系数为0.1~0.3之间为弱相关,0.3~0.8为中相关,0.8~1为强相关[17];依据相关系数理论以及大量试验证明,当WCC值大于0.8时,说明此时VMD分解为过分解,最佳的K值为K-1,由此可确定VMD分解的分解层数K值,具体的流程图如图1所示。

图1 基于WCC值确定最优参数K值流程Fig.1 Flow chart of determining the value of optimal parameter K based on WCC value

WCC=λCC+ηCD

(7)

其中:

式中,CC为相关系数;CD为余弦距离;λ,η为加权系数;φ1为相关系数的变异系数;φ2为余弦距离的变异系数;SCC为相关系数的标准差;μCC为相关系数的均值;SCD为余弦距离的标准差;μCD为余弦距离的均值。

1.3 特征参数的选择

在对管道信号的特征参数进行分析时,常用的特征参数大体上可以分为以下三类:时频域特征、熵特征及波形特征。

(1)时频域特征。

管道信号的波形特征可以通过分析管道信号的时频域特征来表示。如均值可以用来衡量管道数据的平均分布趋势;峰值是根据管道数据中的最大值与最小值之差得到的,可以用来反应信号的波动情况;均方根植可以求取管道数据的振动能量,其值影响着能量的大小;标准差可以衡量管道信号之间的离散程度[18],本文将选用标准差作为特征参数。

(2)熵特征。

熵特征参数根据管道数据具有非线性性、复杂性的特点,可以用来衡量管道数据的复杂程度,度量整个系统内部的随机性,因此熵特征参数可以作为衡量管道数据内部复杂性的特征指标[19],本文将选用散步熵作为特征参数。

(3)波形特征。

在采集管道信号的3种工况时,由于管道内的流速不同,会导致3种工况信号的波形差异性较大,因此波形特征能够反映不同的管道信号工况情况,并且特征为无量纲特征,不会因外界物理量的变化而变化。裕度因子能够反映出信号因剧变而产生不同的冲击特性,本文将选用裕度因子作为特征参数。

1.4 概率神经网络

概率神经网络(PNN)是由D.F.Specht 博士于1989年提出的一种新型神经网络。它是由Bayes最小风险标准的前提下发展出来的,它利用 Parzen 窗法估测率值密度,所以架构相对单一化,拥有分类辨析与督促的能效,因此被广泛的应用。PNN 网络强大的非线性分类功能使其在分类中发挥着重要的作用,其实质是利用样本映射能力,形成具有较强适应性和容错性的网络诊断系统[20]。

PNN网络是涵盖竞争层和径向基层的一类监督学习网络。在由一定数量的高斯函数组成的四层前向神经网络,该网络是以径向基神经网络为基础上发展而来的,主要由输入层、模式层、求和层和输出层组成,第一层为输入层,用于接收训练样本的特征向量;第二层为模式层,计算输入向量与训练样本之间的距离,距离结果表示输出向量与训练样本之间的接近度;第三层是求和层,连接第二层的输入向量,将神经网络的输出表示为概率向量;第四层是输出层,输出每个神经元对应的不同状态的信号[21],其常规框架如图2所示。

图2 PNN的网络结构Fig.2 Network structure of PNN

2 本文方法

在天然气管道泄漏检测之前,需要对传感器采集的管道信号进行特征提取,然而,声波信号包含较多的噪声而且具有非线性非平稳的特性,从而影响管道声波信号的特征提取。为了提高管道泄漏检测的准确性,特征向量的选择尤为重要。管道信号的单一特征组成的特征向量仅仅代表管道数据的某一方面特征,不能将管道数据的特征都体现出来,因此,利用多特征组成的特征向量是必要的。基于此,提出了基于 VMD 和多特征融合的特征提取方法(见图3),具体步骤如下:

图3 基于VMD和多特征融合的流程Fig.3 Flow chart based on VMD and multi-feature fusion

(1)通过声波传感器采集正常、敲击、泄漏3种管道信号,构建数据集;

(2)利用WCC值确定VMD算法中的参数K;

(3)管道信号经过VMD算法分解得到若干个IMFs,IMFs分量比原始信号更具规律性,信号特征更加明显;

(4)通过比较各模态分量与原始信号的相似程度,从而确定特征分量;

(5)计算特征分量的时频域特征、熵特征及波形特征,构成基于多特征融合的特征向量组;

(6)通过提取的特征向量组对 PNN进行模型建立,并进行识别分类。

3 试验分析与结果

文中用到的试验数据均来自某大学的实验室天然气管道泄漏检测模拟试验平台,试验模拟管道总长度为160 m,管径为DN50 mm,管道系统共有15个泄漏点,每个泄漏点通过四分球阀门进行连接,相邻两个泄漏点间的距离为10 m。本次试验管道内介质为空气,用其来模拟天然气管道的泄漏情况,整个试验过程由空气压缩机提供动力,压力为0.5 MPa,流速为 16 m/s,泄漏口径16 mm。利用声波传感器采集3种不同的管道样本信号,包括正常、泄漏和敲击信号,其中,正常信号为管道天然气正常输送的情况下采集到的信号;泄漏信号是通过快速切换四分球阀开关获得的,采样频率fs=3 KHz,截取采集信号长度为10 000的采样点。敲击信号是通过敲击管道来模拟的干扰信号。图4为3种管道的工况信号。

(a)正常信号

(b)泄漏信号

(c)敲击信号图4 试验采集的3种管道工况信号Fig.4 Three kinds of pipeline working condition signals collected in the experiment

3.1 VMD分解层数K的确定

将3种工况信号分别进行VMD分解,初始化分解层数K为3,惩罚因子α为默认值2 000,计算3种工况信号的经VMD分解后的相邻模态之间的WCC值,其数据如表1~3所示,根据表中数据可知,3种工况信号均在K=6时,IMF3和IMF4的WCC的值大于0.8,说明此时IMF3和IMF4的相似度极高,可能存在模态复制的现象。即当K=6时VMD存在过分解的现象。因此,可确定VMD的分解层数K值设为5,对原始信号进行VMD分解,分解结果如图5~7所示。

表1 敲击信号相邻模态的相似度值Tab.1 Similarity value of adjacent modes of knocking signal

表2 泄漏信号相邻模态的相似度值Tab.2 Similarity value of adjacent modes of leakage signal

表3 正常信号相邻模态的相似度值Tab.3 Similarity value of adjacent modes of normal signal

图5 敲击信号经VMD分解的结果Fig.5 Result of knock signal decomposed by VMD

图6 泄漏信号经VMD分解的结果Fig.6 Result of leakage signal decomposed by VMD

图7 正常信号经VMD分解的结果Fig.7 Result of normal signal decomposed by VMD

3.2 特征提取

由于泄漏信号和正常信号存在着相似的模态分量,为了很好地区分3种工况信号,需要确定特征模态分量,从VMD 分解的结果图中可以明显看出,分量IMF1的波形和原始信号最为接近,且能表现出信号的特征,因此本文确定IMF1为特征模态分量。

本文采集了3种信号各20组,分别计算正常、泄漏、敲击信号经 VMD 分解获得的IMF1 的特征参数,主要包含散布熵、标准差以及裕度因子。图8为3种工况信号的IMF1分量散布熵、裕度因子和标准差的拟合曲线,其中第一组代表着IMF1的3种工况信号的散布熵拟合曲线图,第二组代表着IMF1的3种工况信号的裕度因子拟合曲线图,第三组代表着IMF1的3种工况信号的标准差拟合曲线图;将3种特征进行融合构建成多特征融合的向量组,输入到PNN中能实现天然气管道信号的泄漏检测。

图8 3种工况信号的IMF1分量散布熵、裕度因子和标准差的拟合曲线Fig.8 Fitting curves of IMF1 component dispersion entropy,margin factor and standard deviation of signals under three working conditions

3.3 PNN工况识别

为了进一步说明本文提出的方法的有效性,采用 PNN 对提取的特征参数进行分类识别。在试验中,通过管道泄漏检测平台分别采集了泄漏信号、敲击信号、正常信号各60组样本用于试验,180组信号样本类别标签分别设置为1,2,3,此外,试验中设计每种管道信号各40组作为训练样本对PNN进行训练,其余各20组作为测试样本输入到训练好的PNN进行预测,具体管道样本分配及标签设置如表4所示。图9为本文所提方法的分类结果图,信号分类的准确率为100%,在60组测试信号中,将一组敲击信号识别为泄漏信号,整体的识别效果还是可观的。

表4 管道样本分配及标签设置Tab.4 Allocation and label setting of pipe samples

图9 基于VMD和多特征融合的分类结果Fig.9 Classification results based on VMD and multi-feature fusion

为了验证本文提出的基于VMD和多特征融合的特征提取方法的有效性与优越性,本文分别选取了5种不同的单一特征与VMD相结合进行分类识别,主要包括VMD-散布熵、VMD-排列熵、VMD-能量熵、VMD-标准差以及VMD-波形因子5种特征提取的方法,图10示出了对比方法的分类结果图。

图10 5种对比方法的分类结果Fig.10 Classification results of five comparison methods

表5是测试集的识别准确率,本文所提方法的准确率最高为100%,其次是VMD-标准差,VMD-能量熵的识别准确率最低,通过以上几种方法的对比可知,单一特征构成的向量组只能表现信号某一方面特征,并不具有广泛性,因此信号分类识别的效果偏低,由此可知,本文提出的多特征融合的特征提取方法能够提取信号多方面的特征,无论从分类图里还是从分类效果的准确率中都能证实该方法的有效性及优越性。

表5 基于不同方法的PNN工况识别结果对比Tab.5 Comparison of PNN working condition identification results based on different methods

4 结论

在天然气管道泄漏检测过程中,选取有效的特征参数影响泄漏检测的准确性。为了提高泄漏检测的准确率,本文提出一种VMD和多特征融合的管道信号特征提取方法。通过对实验室管道采集到的声波信号进行试验分析,得出以下结论。

(1)基于VMD算法对管道声波信号进行了预处理,提出了一种WCC算法,利用加权的相关系数和余弦相似度法确定了参数K值,VMD 分解后通过评估各IMF分量与原信号的相似程度,确定特征分量。

(2)提取特征分量的多特征参数,构建成高维特征向量矩阵,输入到PNN中进行工况识别,识别准确率为100%。

(3)为了证明本文提出方法的优越性,与VMD-散布熵、VMD-排列熵、VMD-能量熵、VMD-标准差以及VMD-波形因子特征提取方法进行对比,可证明本文方法在特征提取上的可行性与准确性。

猜你喜欢

特征参数特征向量特征提取
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
冕洞特征参数与地磁暴强度及发生时间统计
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于交通特征参数预测的高速公路新型车检器布设方案研究
基于Daubechies(dbN)的飞行器音频特征提取
一类特殊矩阵特征向量的求法
基于PSO-VMD的齿轮特征参数提取方法研究
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
基于视频的车辆特征参数算法研究