APP下载

天然气管道泄漏声学检测及定位方法

2021-10-22韩宝坤何景涛王金瑞赵明明李念冲

噪声与振动控制 2021年5期
关键词:孔径滤波准确率

韩宝坤,何景涛,王金瑞,张 凯,赵明明,李念冲

(1.山东科技大学 机械电子工程学院,山东 青岛266590;2.青特集团有限公司,山东 青岛266000)

由于管道运输独特的优势,管道在液体、气体运输等工程领域中发挥着越来越重要的作用。随着时间的推移,管道老化,不可避免的腐蚀磨损[1-2],发生管道泄漏的风险不断增加,尤其是孔径微小的泄漏对天然气管道的安全运行具有极大的潜在威胁[3]。由于泄漏口施加的压力和且管道表面的损伤都较不明显,很难准确检测和定位这类泄漏[4]。不同孔径燃气管道泄漏造成的危险程度不同,需要采取不同的应对措施。及时识别泄漏孔径对维持正常运行至关重要。因此,开发一种快速、准确地识别泄漏孔径的有效方法至关重要。

目前管道泄漏检测的研究越来越受到关注,通常采用基于控制理论和信号处理的检测方法,如负压波检测方法[5-6],压力梯度法,瞬态模型法[7]和局部均值分解等[8-9],这些方法广泛应用于管道泄漏检测领域,但是每种方法各有自身的特点或缺陷。管道泄漏测得信号通常是非平稳的且具有非线性噪声,去噪不理想会影响负压波方法检测和定位准确性。局部均值分解存在模态混淆现象,会降低信号的准确性,对于直径2 mm的泄漏孔径识别精度较低。同时随着管道规模的不断扩张,数据采集量呈指数级增长,使得天然气管道泄漏监测进入大数据的时代[10]。如何从管道海量数据中有效提取特征,实现自动、高效、准确识别管道的故障状况,已成为管道大数据智能检测面临的新问题。

深度学习理论作为大数据处理的一种有前景的工具,有效地克服了传统方法的依赖性和繁琐性,能够快速有效地处理采集到的海量信号,提供准确的状态诊断结果。深度学习已经在图像、语音、自然语言处理、CTR(Click through rate)预估、大数据特征提取等方面获得广泛的应用[11-13]。雷亚国等[14]提出了利用深度学习原理,通过堆叠自编码(Stacked autoencoders,SAE)深度神经网络对复杂数据进行自适应特征提取,实现了较为显著的检测效果。Cody等[15]提出了基于卷积神经网络(Convolutional neural network,CNN)与变分自编码器(Variational autoencoder,VAE)相结合的管道泄漏检测方法。Zhou等[16]提出了一种利用卷积神经网络进行泄漏检测的图像识别方法,更好地解决不同泄漏孔径或不同泄漏位置特征高度相似问题。Bae 等[17]提出了一种基于深度学习(Deep learn,DL)的管道泄漏检测技术,该方法在复杂的噪声环境下仍能获得可靠的检测性能。

针对天然气管道泄漏检测正在向大数据分析发展的趋势,本文提出一种通过深度学习方法获取采集信号特征并识别的智能天然气管道泄漏检测方法。在深度神经网络的学习中,为抑制过拟合现象和提高网络的泛化能力,通常采用权值衰减的方法加入正则化项对大的权重值进行惩罚,初始取值不好对网络学习率要求比较苛刻,必须要选取非常小的学习率进行更新,但学习率本身是需要调节自身大小来选取较适合的值使网络训练得更好。权重矩阵的初始值非常重要,设定的好坏关系到网络学习能否成功,网络中存在梯度消失和表现力受限等问题,避免在某一层的正向传播和反向传播进入饱和区域,拖慢网络训练进程。本文在深度稀疏滤波网络训练中引入He初始值[18],同时在各层稀疏滤波间插入批标准化[19]来调整各层激活值分布使其拥有适当的广度,加快深度稀疏滤波的收敛。本文首先根据管道泄漏监测信息提取出泄漏的频域信号,然后将其输入到批标准化的He初始值深度稀疏滤波中进行训练,最后通过Softmax回归[20]作为分类器实现不同泄漏口径的准确快速识别。通过设计两组管道泄漏试验验证提出方法的有效性。

1 理论背景

选用无监督特征学习的稀疏滤波算法进行逐层训练构成深度神经网络,Softmax回归判别作为分类层,在权重初始值设定引入He初始值,向每层稀疏滤波和激活函数之间插入对数据分布进行正规化的批标准化层,建立识别泄漏孔径的深度稀疏滤波。

1.1 He初始值深度稀疏滤波

深度稀疏滤波的基本组成单元是稀疏滤波结构,稀疏滤波的工作原理是优化一个简单的代价函数—L2范数,来进行直接分析优化特征分布,其特征分布主要满足以下3个特征属性:种群稀疏、存在稀疏和高分散性。即稀疏滤波算法就是根据这3个特征属性去分辨和学习训练样本中的特征。

稀疏滤波的结构如图1 所示。输入为采集样本,输出为学习到的特征,在输入的样本集中,xi∈RN×1表示为有N个数据点的样本,M为样本总数,为了更好地训练网络,权重矩阵W初始值设定时引入He初始值,选用均值为0,标准差为的高斯分布作为初始值,网络可以通过权重矩阵W∈RL×N学习到对应的特征集其中f i∈RL×1表示学习了L个特征向量。进一步可以将输入样本集写成矩阵xi∈RN×M。具体映射关系为:

图1 稀疏滤

首先由特征值组成的特征矩阵f∈RL×M,将所有样本中f的每一行通过L2范数进行归一化:

其中:fl表示特征矩阵f的第l行特征向量,‖ · ‖2为L2范数。然后的每一列通过L2范数进行归一化,即:

最后,通过L1范数惩罚最小化目标函数,得到优化的权重矩阵W,目标函数为:

通过稀疏滤波训练得到一个单层的归一化特征,以它当成下一层的输入去训练第二层,如图2所示。将He初始值稀疏滤波逐层训练传播,由此构成深度稀疏滤波,Softmax 回归分类器与标签数据结合,通过BP算法进行权重矩阵更新和参数微调。

图2 深度稀疏滤波结构

1.2 批标准化

批标准化的思路是调整各层的激活值(激活函数输出的值)分布使其拥有适当的广度,让每一层传递的数据更具多样性,使得网络进行高效的学习。从训练数据中按批尺寸单位随机选择一部分数据B={x1,x2,…,xm}进行正规化,使输入数据转变为均值为0、方差为1的数据:

其中:μB表示每一单元的均值为方差,ε是一个微小值,选取为10-8,为了防止出现分母为零的情况,然后批标准化层对正规化后的数据进行缩放和平移的变换:

其中:γ和β分别表示缩放和平移参数,初始γ=1,β=0,然后再通过反向传播更新调整合适的值。梯度损失ℓ在批标准化训练中反向传播公式:

批标准化将上层提取特征引入到激活函数中,激活后传递到下层,确保每层稀疏滤波都能有效的对输入分布进行学习,通过批标准化对激活值进行平移缩放,强制性地调整激活值分布使其拥有适当的广度,增强网络的表现力[21],可以增大学习率,使学习快速进行。本文选取可以减轻训练中产生梯度消失问题的ReLU函数作为激活函数。

2 改进稀疏滤波的泄漏孔径识别方法

选用针对输气管道泄漏口识别检测,提出采用改进的稀疏滤波网络来处理泄漏孔径识别问题,该方法的流程图如图3所示,

图3 提出方案框架

具体步骤如下所述:

(1)采用原始泄漏信号的频谱作为训练样本,分别设定每一层稀疏滤波的输入维数为Nin,输出维数为Nout,组成训练样本集,其中M是样本个数,x1∈ℜNin×1是第i个样本,li是样本xi的健康标签;

(2)通过批标准化的深度稀疏滤波建立神经网络,单独采用训练集中原始频域样本数据对深度稀疏滤波网络进行无监督训练;

(3)利用样本标签li通过Softmax 回归对网络训练结果计算损失,然后由BP反向传播算法通过随机梯度下降法对权重更新和参数微调,最小化Softmax损失函数的误差;

(4)通过测试样本集验证识别准确率。

3 试验验证

本文试验所使用的输气管道泄漏试验台包含空气压缩机、缓冲罐、管道、数据采集系统等,如图4所示。信号采集是通过泄漏孔附近的声波传感器检测到泄漏声波,并将声波传递给检测系统。在输气管道泄漏过程模拟试验中,因天然气易燃爆炸,故使用空气替换天然气进行泄漏模拟试验,将采集到的泄漏信号导入MATLAB软件,对网络进行训练。

图4 管道泄漏检测试验平台

3.1 案例分析:输气管道泄漏口径识别

模拟设置了四种泄漏孔径:直径2 mm、3 mm 、5 mm的圆形泄漏孔,边长15×4 mm长方形泄漏孔,四种泄漏孔径分别如图5 中(a)、图5(b)、图5(c)、图5(d)所示。采样频率为12.8 kHz,共采集4.8×105个数据,将其分为不同泄漏口径数据点个数为1 200的单个样本。选用频域信号可以避免时移特性的干扰,通过快速傅里叶变换(Fast fourier transform,FFT)将时域信号转变为频域600 个傅里叶系数,频域数据输入到网络中进行训练的同时,信号长度比时域信号尺寸减少了一半,缩短了网络计算时间。

图5 管道泄漏不同形状设计孔径

深度稀疏滤波网络结构设置共4 层,每层输入维数分别为:600、400、200、100,最后一层输出为50。为核验框架的鲁棒性,试验随机选取全部样本中10%的数据作为训练样本,对剩余90%进行测试。试验重复进行20次以减少随机因素的影响,每层稀疏滤波迭代次数为10次,学习率为0.1,批尺寸为5。

识别结果如图6所示。可以看到在训测比为1:9 的情况下,20 次试验的训练准确率保持在100%,测试阶段针对不同泄漏孔径识别的平均准确率也达到99.78%,因此足以说明提出的方法能够快速准确识别管道的4种不同泄漏孔径。为了验证提出方法的性能,使用以下两种方法进行比较。

图6 提出方法20次试验识别准确率

(1)对比方法1:采用标准稀疏滤波进行特征提取,权重矩阵初始值设定为均值为0,方差为1 的高斯分布,为保持迭代次数一致,对数据特征进行充分提取,迭代选取为40。

(2)对比方法2:未加批标准化的深度稀疏滤波网络,参数设置与提出方法相同。

同样进行20次试验,如表1所示。3种方法平均训练准确率都是100%,但测试准确率平均结果存在较明显的差别,稳定性也亦有不同,提出方法标准差为0.193,稳定性较好。对比方法1 存在过拟合现象,在处理训练样本和测试样本时,平均测试准确率为76.25%,与训练准确率有较大差异,且稳定性较差。本文提出的权重矩阵选取He初始值较好地改善了网络隐层间激活值的传递,使每层网络传递更稳定,同时也减小了权重参数值,起到了抑制过拟合的作用。对比方法2 的平均测试准确率达到了93.69%,相比提出方法,批标准化可以强制性地调整激活值的分布使其拥有适当的广度,增强网络的表现力进而可以更好地进行训练。同时不同方法试验使用的计算时间也有所不同,相比使用标准稀疏滤波对数据进行特征提取并分类的方法用时5.778 s,提出方法的平均计算时长为4.298 s,选取He初始值可以更好地调节深度稀疏滤波中学习率的大小,选取较大的学习率使网络更快地收敛。为了直观地看到四层He初始值稀疏滤波对数据自适应特征提取的情况,提取网络各隐层中学习到的特征进行观察,如图7(a)、图7(b)、图7(c)、图7(d)所示。每种泄漏孔径各10 个样本,横坐标为训练样本总数,纵坐标为各层改进稀疏滤波的输出维数,可以看到随着层数的加深,不同大小形状孔径的特征识别度越发清晰,使得网络能够对特征进行更好地提取并分类。

表1 20次试验的识别准确率统计

图7 提出方法各隐层学习到的特征

为了验证提出方法的特征提取能力,通过t-SNE[22]技术将提取特征可视化,将网络训练学习到的高维特征向量映射成二维特征向量,如图8(a)所示,可以看到不同的泄漏孔径都明显地得到了分离,泄漏孔径样本较为聚集,泄漏孔径的数值为图例中颜色标识所对应。图8(b)所示对比方法1中,不同的泄漏孔径样本都较为分散,各孔径样本散点存在混叠,降维效果较差。图8(c)所示为对比方法2,相比对比方法1,各泄漏孔径样本较为聚集,直径2 mm泄漏孔径分别与直径3 mm 圆孔、边长15×4 mm 方形泄漏孔径存在混叠。两种对比方法较提出方法在对泄漏孔径的特征提取能力上存在不足。

图8 特征降维散点图

为了进一步说明He初始值在深度稀疏滤波网络中起到的作用,我们单独设计两组深度神经网络进行针对性对比,将每层稀疏滤波间隐层的激活值提取出来进行观察。第一组设计为四层标准稀疏滤波的深度神经网络,输入为随机高斯分布数据,权重矩阵初始值为均值0,方差1 的高斯分布,第二组输入数据与第一组相同,各调节参数相同,不同于第一组的是选用He初始值作为权重矩阵的初始条件,将每层之间的激活值提取出来进行比较,如图9(a)和图9(b)所示,横轴表示激活值,纵轴表示相同激活值的个数,对比可以明确地看出He初始值很好地改善了激活值分布偏向问题,激活值分布愈靠近0值,网络传递的表现力愈差,同时也存在梯度消失的风险,使得反向传播时权重的梯度同样很小,导致网络无法顺利学习,网络层数越多,激活值偏向问题越发的明显。同样针对批标准化进行设计比较,第一组设计为4 层未加批标准化的深度稀疏滤网络,输入为直径2 mm 泄漏孔径样本,第二组为本文提出的方法,各参数相同。将两组深度网络隐层的激活值提取出来进行比较,如图9(c)和图9(d)所示,相比未加批标准化的深度稀疏滤波,本文提出的深度神经网络隐层激活值分布更加均匀,批标准化通过学习调整合适的参数值γ、β,对数据进行缩放和平移,即使增加网络的层数,激活值数据的广度也能保持不变,起到强制性调整各层激活值分布的作用,让各隐层激活值拥有更好的广度,使网络进行顺利地学习且进度更快。

图9 各隐层中激活值分布

3.2 案例分析:输气管道泄漏定位检测

为了验证提出深度稀疏滤波网络的鲁棒性,使用提出方法对泄漏位置进行定位。同样通过试验台对直径2 mm泄漏孔径进行检测,分别在6个不同的监控位置采集泄漏声信号,距离泄漏位置分别为10 cm、20 cm、30 cm、40 cm、50 cm、100 cm,为避免参数不同带来的影响,采样频率、采集数据量以及样本数据点个数与孔径识别试验保持一致,单组样本泄漏信息的时域信号和通过FFT 后的频域信号如图10所示。每个泄漏位置10%的样本用来训练网络,其余样本进行测试。为了减少试验随机因素的影响,共进行20 次试验得到结果如图11 所示。可以看出训练准确率稳定的保持在100%,平均测试准确率达到了98.76%,每次试验的计算时间也较为稳定,平均计算用时为4.82 s,说明网络能够快速准确地对泄漏位置进行定位且具有较高的鲁棒性。

图10 FFT变换前后的样本数据

图11 试验测试准确率和计算时间

同样为验证提出方法的性能,使用以下两种对比方法进行试验比较:

(1)对比方法1:采用时域信号作为输入,建立深度稀疏滤波进行特征提取,权重矩阵初始值设定为均值为0,方差为1 的高斯分布,学习率及迭代次数均与提出方法保持一致。

(2)对比方法2:未加批标准化的深度稀疏滤波网络,参数设置与提出方法相同。

每种方法各进行20 次试验,3 种方法的训练准确率都是100%,测试准确率如图12 所示。通过观察可以较为直观地看出测试准确率的差别,对比方法1的稳定性较差,由于输入样本为时域信号,无法避免时移特性的干扰,网络训练时间较为冗长且特征学习效果较差,平均测试准确率为66.45%,平均计算时间为7.527 s。利用He初始值的对比方法2平均计算时间与提出方法较为接近,平均测试准确率为91.62%,标准差为4.107,表现一般。以上结果表明:提出方法的管道泄漏定位检测能力与泛化能力相比于两种对比方法有较明显优势。

图12 3种方法的测试准确率

最后通过t-SNE对高维特征降维,如图13所示。各泄漏位置样本特征分类较好,泄漏口的距离数值为图例中颜色标识所对应,提出方法在输气管道泄漏定位检测试验中也能获得较高的准确率。

图13 特征降维散点图

4 结语

(1)提出的批标准化深度稀疏滤波方法能够通过多层网络更快更有效地提取数据特征,实现快速准确地识别泄漏孔径和定位检测。两组设计试验验证了提出方法的有效性和鲁棒性。

(2)He初始值能够抑制稀疏滤波学习中的过拟合现象,较好地改善隐层中激活值分布偏向问题,泄漏信号通过FFT 将数据量减少一半,可在提供有效信息的同时降低网络计算成本。

(3)批标准化技术通过对激活值平移缩放,减小数据分布偏向,强制性地调整激活值分布使其拥有适当的广度,增强网络的表现力,使深度稀疏滤波可以更快更有效地进行学习。

猜你喜欢

孔径滤波准确率
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
高速公路车牌识别标识站准确率验证法
不同渗透率岩芯孔径分布与可动流体研究
分布式孔径相参合成雷达技术
基于子孔径斜率离散采样的波前重构
RTS平滑滤波在事后姿态确定中的应用
基于线性正则变换的 LMS 自适应滤波
大孔径浅台阶控制爆破在重庆地区的应用