一种改进的支持向量回归三轴管道漏磁缺陷量化方法
2021-12-22胡家铖焦晓亮刘思娇
胡家铖,焦晓亮,郑 莉,刚 蓓,刘思娇
(北京华航无线电测量研究所,北京 100010)
由于油气管道内壁与石油、天然气等介质长时间接触,会产生腐蚀、凹槽、裂纹、点蚀等缺陷,所以管道泄漏等安全性问题也越来越受重视,管道的无损漏磁检测成为油气管道检测最主要的手段之一,在无损漏磁内检测的过程中,管道缺陷的量化是管道故障检测的最终目标[1]。速度更快,精度更高的管道漏磁内检测的缺陷量化技术,对油气管道后续的缺陷诊断以及管线维修具有重要意义。
蹇清平[2]将支持向量机应用于管道漏磁缺陷的分类中,他设计了一种基于粒子群优化算法支持向量机(PSO-SVM)的智能分类模型,该模型能够利用缺陷的漏磁信号特征去判断缺陷的位于管壁的内外位置,但是对缺陷只进行了定性分析,未能满足后续计算管道的剩余强度,以及对管道进行安全性评估的要求。崔凯[3]利用libsvm工具箱对管道缺陷数据进行了多分类研究,他将缺陷分为大面积腐蚀、周向划痕、周向狭缝、腐蚀斑、针眼、轴向划痕、轴向狭缝等7类,多分类缺陷量化研究较二分类研究更加符合工程实际需求,但是仅使用了6个特征量不能完全还原缺陷的信息。张少轩[4]利用支持向量回归算法对漏磁缺陷进行了量化研究,使用了更多的缺陷信号域特征,量化的缺陷尺寸精度更高。但是网格搜索法时间复杂度高并且不能很好地寻找到支持向量回归算法的最优参数。因此,为了利用更少的时间获得更高精度地缺陷尺寸量化结果,笔者基于三轴漏磁内检测技术提取了缺陷漏磁信号的三轴特征,并针对提取出的三轴特征库设计了一种基于近邻成分分析的特征选取方法,最后结合蝙蝠群智能算法,改进了支持向量回归算法,有效地减少了漏磁管道内检测缺陷的量化时间,提高了量化的精度。
1 三轴漏磁内检测技术原理
漏磁检测原理如图1所示。油气运输管壁在外加磁场的作用下被磁化,当管壁表面不存在缺陷时,磁力线将封闭于金属管壁之内,呈均匀分布,磁通平行于金属管壁表面[5];当管壁中存在缺陷时,即出现了金属损失时,金属管壁缺陷处的磁导率远小于金属管壁的磁导率,磁阻很大。这些原因导致磁通路变窄,磁力线出现变形,其中一部分磁力线能直接穿过缺陷或在金属管壁内部绕过缺陷,还有一部分的磁力线会离开金属管壁表面,通过空气绕过缺陷再重新进入到金属管壁中,然后在金属管壁表面缺陷处形成漏磁场。内检测器的传感器能够检测到扩散出的漏磁信号,并能够将该漏磁信号转化为电信号,利用采集到的信号,就能定位管壁的缺陷[6]。
图1 漏磁检测原理示意
金属损失产生的漏磁场是空间三维矢量场。受传感技术、数字信号处理能力和存储介质容量的限制,以前的大部分检测器只能记录三维漏磁场的一个或两个分量[7]。随着漏磁检测对缺陷类型和尺寸精度要求的不断提高,三轴漏磁内检测应运而生,三轴漏磁内检测记录了漏磁场的多个分量,利用不同方向的分量能够识别不同类型的缺陷并精确回归缺陷的尺寸。
三轴漏磁内检测器的工作原理与传统单轴漏磁内检测器基本相同,其区别在于三轴漏磁内检测器在一个传感器内轴向正交布置了三个霍尔传感器,分别用于测量管道轴向、周向及径向的磁通量变化情况,管道内三轴内检测原理如图2所示。这种多维数据综合反应了管道内部缺陷的尺寸特征,提高了不同类型缺陷的探测能力和缺陷尺寸的测量精度[8]。
图2 管道内三轴内检测原理示意
2 特征提取方法设计
在缺陷区域三轴内检测器采集到的漏磁信号反映了对应缺陷的三维漏磁场变化。原始漏磁信号蕴含了缺陷尺寸等重要信息,但是机器学习算法很难直接从原始漏磁信号提取出内部的隐含信息,因此设计了一种特征提取器,可准确地提取漏磁信号特征信息是缺陷尺寸量化必不可缺的步骤,笔者设计的基于三轴磁场采样数据的特征提取方法,可在充分接收轴向、径向和周向等3个方向上的特征信息后,建立三轴漏磁缺陷特征库,为后续量化算法提供数据基础与决策基础。
2.1 缺陷三轴漏磁信号
缺陷三轴漏磁信号如图3所示。由图3(a)可知,缺陷轴向信号由两个较小负峰以及一个较大正峰组成,负峰在沿着内检测器运行方向上以正峰峰值点为中心对称;由图3(b)可知,缺陷径向信号由一个负峰以及一个正峰组成,两峰在正峰与负峰峰值点中轴呈轴对称分布;如图3(c)可知,缺陷周向信号由两个负峰以及两个正峰组成,以两正峰值点连线与两负峰值点连线交点为假设原点,以内检测器运行方向为x轴,传感器排布方向为y轴,两正峰位于第一、三象限,两负峰位于第二、四象限。
图3 缺陷三轴漏磁信号
2.2 三轴漏磁数据特征提取方法设计
2.2.1 缺陷最大通道曲线
缺陷轴向最大通道曲线如图4所示。缺陷最大通道指的是在缺陷区域内,信号变化幅值最大的传感器采样通道,最大通道传感器最接近缺陷的中心,反映了在内检测器运行方向上漏磁场的变化情况。
图4 缺陷轴向最大通道曲线
2.2.2 缺陷峰谷值曲线
缺陷区域所影响到的所有传感器采样通道的周向峰谷值曲线如图5所示,该曲线反映了缺陷区域漏磁场影响传感器通道的范围以及在垂直内检测器运行方向上漏磁场的变化情况。峰谷值能够减少由于内检测器检测环境不同导致信号基线不同的影响,提高缺陷量化分析的可靠性和准确性。
图5 缺陷周向峰谷值曲线
2.2.3 缺陷轴向中心信号曲线
缺陷轴向中心信号曲线(见图6)指的是缺陷区域内在缺陷中心采样点所有采样通道采集信号曲线,其反应了缺陷中心采样点处沿传感器排布方向的漏磁场变化。
图6 缺陷轴向中心信号曲线
2.2.4 缺陷最大通道一次微分曲线
缺陷径向最大通道如图7所示,缺陷最大通道信号进行一次微分后,可以相对强化高频部分,同时反映出漏磁场的变化率。
图7 缺陷径向最大通道曲线
上述信号曲线能够反映出缺陷漏磁场的变化信息,而缺陷的尺寸与外加磁场后缺陷的漏磁场息息相关,因此笔者基于以上信号曲线,提取信号曲线上的谷谷间距、峰峰间距、峰谷间距、拐点间距、特殊点间距、峰谷差值、体积、表面积、面能量等轴向、径向以及周向三轴信号共53个主要特征。其中特殊点的计算方法如式(1)所示。
(1)
式中:α为特殊点系数;Dpv_left,Dpv_rightt为双边峰谷差值;Yv_left,Yv_right为双边谷值;Ydi_left,Ydi_right为双边特殊点值。
3 基于近邻成分分析的特征选择方法
在对实际问题进行研究的过程中,为了能够全面准确地反映出事物的特征和发展规律,往往需要尽可能多地考虑有关事物的多项数据指标,避免遗漏重要的信息[6]。但是对于管道缺陷尺寸量化来说,长度、宽度与深度等不同的学习任务所需要的特征不尽相同,对于某一个特定的学习任务,在特征全集中,对当前学习任务起决定性作用的属性称为“相关特征”,无关的属性称为“无关特征”。无关特征对于当前任务来说增加了计算量,却无法提高量化的准确性。因此,针对不同尺寸的量化任务需要从特征全集中选择出对指定任务有益的特征序列。笔者基于近邻成分分析对于上一节提取的缺陷三轴特征全集进行特征选择,以量化准确率最高为目标,通过1阶近邻的方式得到特征全集对缺陷尺寸不同尺寸量化任务的权重系数,从而选取出对不同尺寸量化任务最有效的特征属性。
近邻成分分析(Neighbourhood Components Analysis,NCA)是Goldberger等[9]在2004年提出的一种监督距离测度学习算法[10]。NCA随机选择近邻,将留一法(Leave-one-out,LOO)的交叉验证结果最大化。2012年,Yang等基于NCA算法提出了一种新型特征选择方法,其基本思想是通过添加一个正则项,寻找使得LOO分类正确率最大的权重向量[10]。
如式(2)所示,假设样本集T={(X1,Y1),(X2,Y2),…,(XN,YN)},其中F={X1,X2,…,XN}dXN为d维的样本特征集,Y={Y1,Y2,…,YN}1XN为样本标签集,dw(Xi,Xj)为对于样本集T中Xi,Xj两个样本的度量距离,其中wm为第m个特征的特征权重。
(2)
(3)
式中:pij为Xi选择Xj的概率,σ为核宽度参数。
针对整个分类的平均准确率f(ω)如式(4)所示,其中N为样本的个数,当正确分类,即yi=yj时,yij=1;当错误分类时yij=0;特征选择目标函数F(ω)在f(ω)中加λ正则化项,如式(5)所示,其中λ为正则化参数。
(4)
(5)
不同尺度及不同l下均方根误差曲线如图8所示。利用均方根误差来寻找最优的λ值,针对不同的尺度学习任务,最优λ值是不同的。在不同尺寸学习任务对应最优λ处,基于NCA算法给出的不同任务的特征选择序列柱状图如图9所示,由图9可知,相比于长度、宽度,深度方向上会受到更多的特征影响。特征权重越小的特征对当前尺寸学习量化任务的作用就越小,将NCA选取出特征权重大于阈值(长度阈值选取为0.8,宽度阈值选取为0.5,深度阈值选取为0.1)的特征作为下章支持向量回归的输入特征。
图8 不同尺度及不同λ下均方根误差曲线
4 基于支持向量回归的缺陷尺寸量化方法
支持向量机(SVM)是一种基于统计学习理论的机器学习方法,支持向量回归(SVR) 是支持向量机重要的应用分支,是一种逼近精度高、泛化能力强的非线性回归算法。
4.1 基于蝙蝠算法的参数寻优方法
在SVR的核函数选择中,应用最多的核函数为径向基函数,其优点在于可以无限次地提升特征空间的维数,在维数越高的情况下,其线性反演的可能性越大[4]。径向基核函数的核函数系数r与惩罚系数C的选择是决定SVR回归精度的关键。在参数寻优的方法中,常见的方法有网格搜索法、遗传算法、粒子群算法等。
剑桥大学的YANG于2010年提出的蝙蝠算法(BA)是一种通过种群的随机性(即通过模仿蝙蝠利用回声来进行定位的行为)来实现寻优的全局优化算法,可实现在求解空间的寻优搜索。笔者利用随机变异改进经典的BA算法,使其能够跳出局部最优的限制,有更好的全局寻优能力,对SVR算法进行参数寻优,RVBA-SVR(随机变异蝙蝠-支持向量回归)算法的流程如图10所示。
图10 RVBA-SVR算法流程图
4.2 试验验证
以610个三轴高清内检测器在环路试验中检测到的缺陷数据作为样本集,以试验工况模拟真实工况。使用MATLAB软件对算法进行性能验证和分析。
为了验证RVBA算法的效果,与基于PSO寻优的SVR算法进行对比,并将第三节基于NCA的特征选择算法后特征集与原始特征集对算法性能的改变进行比较。迭代次数设置为70次,不同算法训练效果比较如图11所示,图中横坐标为训练次数,纵坐标为10折交叉训练的均方根误差值。由图11可知,在不同尺寸量化任务中,经过NCA特征选择后的RVBA-SVR算法的均方根误差最小,准确度最高。随着训练次数的增加,4种算法都会趋于收敛,但是随机变异改进的BA算法能够有效跳出局部最优,收敛于一个更优的值,加入NCA特征选择的两种算法在整个训练过程中都会更优于未经过特征选择的量化算法,未进行NCA特征选择的特征全集由于含有不能有效表征缺陷信息的无关特征,反而会使SVR量化算法效果更差。
长度以10 mm作为指标,宽度以15 mm作为指标,深度以15%检测管道壁厚作为指标,将样本集中460个作为训练集,剩下的150个作为测试集,满足指标的量化准确率如表2所示。表1展示了3个不同尺寸任务在训练次数为70次过程中寻到最优参数在测试集中的均方根误差,由表1,表2可知,在测试集的不同尺寸量化任务中,经过NCA特征选择后的RVBA-SVR算法的均方根误差最小,精度最高。相比于PSO-SVR算法,NCA-RVBA-SVR算法在长度量化上均方根误差减小了4.21%,准确度提高了2.66%;在宽度量化上均方根误差减小了1.72%,准确度提高了0.67%;在深度量化上均方根误差减小了2.10%,准确度提高了6.33%。
表1 不同算法最优均方根误差 mm
表2 不同算法量化准确率 %
不同算法时间复杂度比较如图12所示,表3描述了4种算法在量化缺陷长、宽以及深尺寸上所花费的时间总和,由表3可知,相对于PSO参数寻优算法,RVBA参数寻优算法能够有效降低量化的时间复杂度;NCA特征选择算法也能够减小量化算法的时间。试验结果表明,NCA-RVBA-SVR算法在量化缺陷的尺寸方面有着更好的性能。
图12 算法时间复杂度比较
表3 不同算法花费总时间 s
5 结语
基于管道检测中三轴漏磁内检测器采集到的漏磁数据,设计了一系列针对缺陷区域的管道3个不同子方向数据的特征提取方法,建立了漏磁缺陷特征样本库,为后续缺陷尺寸的量化提供了数据支持。在基于机器学习的管道尺寸量化算法中,将近邻成分分析特征提取方法、改进蝙蝠算法以及支持向量回归方法相结合,能够有效地降低量化花费的时间,在一定程度上提高了管道缺陷量化精度,为后续油气管道的缺陷诊断提供参考。