一种基于人工提取缺陷块的边界搜索方法
2020-08-21马天航胡家铖刘思娇
马天航,胡家铖,郑 莉,刚 蓓,刘思娇
(1.西北工业大学 航天学院,西安 710082;2.北京华航无线电测量研究所,北京 100010)
当今,管道运输作为油气运输最主要的运输方式,其安全问题也越来越受到重视。管道检测是发现隐患和保障油气管道运行安全可靠的重要措施,内检测是未来油气管道定期检验的主要手段和验证管道本体完整性的有效手段,常见的管道内检测方法有涡流检测、超声检测和无损漏磁检测等。无损漏磁内检测技术以其高效性与经济性成为当今应用广泛的油气管道检测技术。在无损漏磁内检测的过程中,管道缺陷的量化是检测的最终目标[1],漏磁缺陷特征库的建立是缺陷量化的数据基础,而对缺陷区域的精确定位是漏磁缺陷特征提取的决策基础,也是缺陷反演量化必不可缺的过程。
赵重阳[2]将幅值差分法用于管道漏磁检测中,结合判断单通道上缺陷数据幅值以及与相邻离散点差值,对单通道上里程边界进行了定位,但是对于缺陷区域的通道边界未提出搜索方法。苏铭[3]研究了基于图像域的金属板缺陷的边缘检测,提出了一种基于PCA(主成分分析)处理的TPCA(两次PCA)边缘检测算法,对缺陷的边界进行了定位。刘金海等[4]将漏磁数据转换成灰度图,然后利用二值化处理以及形态学运算去识别缺陷相关区域。图像域的边缘检测对边界定位有一定的帮助,但定位后在信号域上的特征提取效果不佳。为了减少特征提取的时间复杂度,提高特征提取的准确性,增加缺陷量化的精度,笔者提出了一种针对人工提取缺陷块里程边界和通道数边界的搜索方法,能够对缺陷的边界进行精确的定位。
1 问题重述
在管道漏磁检测中,缺陷尺寸的量化是必不可缺的步骤,只有估计出缺陷的尺寸才能计算缺陷失效压力,对管道进行安全性评估。现行漏磁缺陷的量化方法中,应用最广泛的有基于智能算法的迭代反演量化方法与基于机器学习的缺陷反演量化方法。
基于智能算法的迭代反演量化方法是先利用漏磁场原理构建一个物理模型,常见的有二维、三维的磁偶极子模型、基于动态似稳模型的磁多极子模型以及基于数值分析的有限元模型,再利用粒子群算法、BP神经网络、模拟退火算法[5]、遗传算法[6]、蚁群算法等智能算法去修正模型与实际缺陷的误差,从而获得更优的反演量化效果。基于机器学习的缺陷反演量化方法凭借优越的性能越来越受到关注,其通过建立提取特征量与尺寸的非线性映射关系,利用数据的推动去反演缺陷的尺寸,常见的机器学习缺陷量化方法有决策树算法、神经网络、支持向量机、朴素贝叶斯分类器[7]以及基于多个学习器的随机森林法。
基于机器学习的缺陷反演量化方法首先对缺陷块的漏磁数据进行特征提取,提取出与缺陷尺寸信息相关的特征,再利用缺陷特征和缺陷尺寸建立隐函数关系,最后估计出缺陷的相关尺寸,建立有效的漏磁缺陷特征库是高精度量化的数据基础。在现行缺陷特征库的建立过程中,国内大多数方法都旨在提高提取的特征数量,而在如何提高缺陷提取的准确性以及缺陷块边界的定位上,相关研究还不够完善。只有准确定位缺陷块的边界,才能减少特征提取的时间,增加提取特征的准确度,提高缺陷量化的精度。
2 一种基于人工提取缺陷块的边界搜索方法
特征提取的准确度取决于缺陷定位的精度,人工提取的缺陷块能够定位到缺陷信号的位置,但是实施人员存在主观性,无法精确地选取缺陷区域的边界。 缺陷块区域分为两个方向,分别是里程方向与通道方向。里程方向即为传感器通过时的采样方向,其边界指的是传感器采集到异常信号的起始点与终止点;通道指的是受到缺陷区域漏磁场影响的传感器,处于漏磁场边缘的传感器通道即为通道边界。为了准确切割人工提取缺陷块的范围,文章综合了里程边界搜索算法和通道边界搜索算法,设计一种基于人工提取缺陷块的边界搜索方法,其流程如图1所示。
图1 边界搜索总流程
2.1 里程边界搜索算法
图2 里程边界搜索算法流程
文章基于损失函数最小化的边界搜索策略,设计了一种利用步长系数、结合边界与左右谷点的里程距离和幅值大小的边界搜索算法(流程见图2),其着眼于挖掘缺陷数据的本质特征,有助于有效漏磁缺陷特征库的建立,并能够减少后续漏磁缺陷特征提取的时间复杂度。里程边界选取前、后的缺陷三维图如图3,4所示。算法的具体实现步骤如下所述。
图3 里程边界选取前缺陷三维图(红线为里程边界切割示意线)
图4 里程边界选取后缺陷三维图
(1) 选取基准线ly。在所选取最大峰谷值的通道中,设计损失函数为区域块所有的点到ly的距离之和。
(2) 寻找左右谷点。左右谷点选取条件为:① 在峰值点左右两边的极小值点; ② 一阶导数为零的点。
(3) 以左右谷点为起始点,向两侧寻找边界xboundary_left,xboundary_right,设计损失函数为边界点值与基准线ly的距离和边界点位置与左右谷点位置距离之和。需要找到一个位置尽可能离左右谷点近,里程值也尽可能离基准线近的点。
2.2 通道边界搜索算法
实际应用中,只选取峰谷值最小点的通道边界选取方法并不能准确选取通道边界,只有准确地选取缺陷块通道的边界,定位到受缺陷影响的传感器条数,才能为后续的缺陷特征提取以及磁化模型的反演提供准确的决策支持。
根据漏磁检测原理,受缺陷影响的传感器随着传感器与缺陷距离的增大,其信号幅值会逐渐减小。为了解决实际工程应用中,缺陷形状的不规则导致磁场的不规则化,设计一种结合幅值阈值法和峰谷差分阈值法寻找通道边界的边界搜索方法。边界搜索算法的流程如图5所示,通道边界选取前、后的缺陷三维图如图6,7所示。具体实施步骤如下所述。
图5 通道边界搜索算法流程
图6 通道边界选取前缺陷三维图(红线为通道边界切割示意线)
图7 通道边界选取后缺陷三维图
(1) 在所选取的最大通道中寻找最大峰值点(fx,fy),其中fx为通道数即传感器。
(2) 判断该通道是否为单峰,计算该通道峰谷差Vi。
(3) 判断Vi是否大于阈值T1,大于则转至下一个通道执行步骤(2)~(3),小于则执行步骤(4)。
(4) 在第i+1通道中(fxi-5,fxi+5)范围内寻找最大幅值fyi+1。
(5) 判断fyi+1是否大于阈值T2,大于则转至下一个通道执行步骤(4),小于则执行步骤(6)。
(6) 记录i+1为通道边界。
3 试验验证
3.1 特征提取方法设计
在基于机器学习的缺陷尺寸量化计算中,建立漏磁缺陷特征库,提取准确的信号特征信息是最为关键的一步。由于轴向数据比径向信号能量高、抗噪声性能强,分辨率更高,故为了在缺陷信号中获取准确的特征信息,文章针对实际缺陷的轴向数据,设计了几种能表现缺陷特征的特征量的提取方法。
3.1.1 缺陷块的峰谷值
缺陷块轴向漏磁检测数据的峰谷值是缺陷的主要特征之一。由于缺陷漏磁信号受到内检测器检测环境等多种因素的影响,数据的基准值波动较大。选取缺陷数据的峰谷值作为特征量能够减少信号基线的影响,提高缺陷量化分析的可靠性和准确性[7]。
3.1.2 缺陷块的谷谷间距
缺陷块的谷谷间距能够反映出缺陷信号在轴向上的分布情况。
3.1.3 缺陷块的最大通道面积
缺陷块最大通道是指在轴向漏磁信号中信号波动最大的传感器的曲线,其面积反映了信号的一阶中心矩。缺陷块最大通道波形的面积特征是一个综合量,缺陷数据波形面积既与缺陷数据的峰谷值有关,又与缺陷数据的谷谷间距有关,所以缺陷面积这一特征同时受到缺陷的长度和深度的影响。最大通道面积特征提取流程及其提取示意如图8,9所示。
图8 最大通道面积特征提取流程
图9 最大通道特征提取示意
3.1.4 缺陷块的最大通道能量
缺陷块最大通道数据曲线波形的能量实际上表示的是漏磁信号的二阶中心矩,如式(1)所示,反映了在一定空间内漏磁信号波动部分的能量或信号的离散程度。缺陷块的最大通道面能量特征提取流程如图10所示,缺陷三维能量如图11所示。
(1)
式中:ai为采集到的第i条通道的漏磁信号;N1为里程左谷;Nend为里程右谷。
图10 最大通道面能量特征提取流程
图11 缺陷三维能量图
3.1.5 缺陷块的表面积和体积
缺陷块的表面积和体积是一个综合缺陷长度、宽度以及深度的特征量。表面积与体积还与缺陷的变化率以及变化程度有关,这两个特征量是最能综合表现出缺陷块所有特性的特征量。因此,缺陷块的表面积和体积的提取有重要意义,其特征提取流程如图12,13所示。
图12 缺陷块表面积特征提取流程
3.2 时间有效性验证试验
所提出的边界搜索方法对内检测漏磁三轴数据均有效,受篇幅限制,以轴向漏磁数据为例,不把径向与周向的验证放在文章讨论范围内。为了验证该方法的效果,选取了152个直径为10 in.(1 in.=25.4 mm)的管道在环路试验中实际检测出的缺陷轴向漏磁数据,其分类示意如图14所示。将缺陷按照不同类型划分,其中规则缺陷68个,平底孔缺陷49个,非规则缺陷35个。
边界搜索算法能够根据管道缺陷漏磁数据特性自寻找缺陷的里程边界与通道边界,经过边界搜索算法后,人工提取的缺陷块能够剪裁掉在漏磁信号缺陷范围外的非异常数据,减少了特征提取的数据处理量,能够大大减少特征提取的时间。为了分析边界搜索算法前后的时间复杂度变化,提取了上述152个真实缺陷中涉及的6个相关特征量,如表1所示。
图14 真实检测缺陷分类示意
表1 提取的缺陷特征量
如图15所示,152个缺陷中有98.03%的缺陷在采用边界搜索算法后时间复杂度降低,0.017%的缺陷在边界提取后时间复杂度增加。1.97%的时间复杂度增加的缺陷,是由于人工圈取的范围完全精确,多运行了边界提取算法。所有缺陷花费的特征提取总时间由51.161 642 s降低至25.113 57 s,即有效地减少了时间复杂度,大大提高了特征提取的效率。
图15 特征提取时间复杂度对比图
3.3 提取特征准确性验证试验
当真实缺陷的尺寸变化时,在检测中该缺陷区域内漏磁场也会发生变化,在漏磁数据信号域中,缺陷的体积以及表面积也会随之改变,因此真实缺陷的体积与漏磁数据信号域上体积以及表面积呈非线性隐式关系。
为了分析该方法对提取特征的改进作用,固定缺陷形状和类别,建立表面积以及体积两个特征量的变化趋势图。如表2所示,选取一组形状规则类型为外部,缺陷长度为12.7 mm,宽度为38.1 mm,深度递增的缺陷,将数据归一化后比较缺陷真实体积与表面积、未使用边界搜索算法体积与表面积,以及使用文章设计的边界搜索算法后体积与表面积的变化趋势,计算归一化后体积和表面积的误差平方和,比较趋势相似程度,截取前体积与真实缺陷体积误差平方和为0.099 163,截取后误差平方和为0.011 546,下降了8.7617%。截取前表面积与真实缺陷表面积误差平方和为0.073 772,截取后误差平方和为0.007 368,下降了6.6403%。由图16,17(分别为归一化体积,表面积变化趋势图,其纵坐标上数值为归一化后的数值,无量纲)以及其误差平方和可知,未使用边界搜索算法前,体积、表面积两特征量与真实缺陷变化趋势不一致,使用边界搜索算法后趋势一致,符合预期效果。
表2 特征准确性验证试验数据
图16 归一化体积变化趋势图
图17 归一化表面积变化趋势图
3.4 缺陷量化准确性验证试验
为了验证边界搜索方法对缺陷量化的改善,利用机器学习中随机森林回归树和梯度回归树对152个缺陷进行量化试验对照。将输入设为缺陷的长度、宽度、提取的表面积、体积、谷谷间距、峰谷均值、最大通道面积和最大通道面能量,输出设为缺陷的深度,如表3所示。然后利用五折交叉法进行对照试验,并设计了一种利用均值残差和的精度评判分数,如式(2),(3)所示。
(2)
式中:u为预测值与真实值的残差和;v为真实值的方差。
(3)
式中:yt为缺陷深度的实际值;yp为缺陷深度的预测值;mean为均值函数。
图18 随机森林回归树测试集深度拟合曲线
在随机森林回归树漏磁缺陷量化算法中,如图18,19所示,输入为边界搜索算法后提取的表面积、体积比输入为边界搜索算法前提取的表面积、体积的量化精度提高了0.047,同样,在梯度回归树漏磁缺陷量化算法中,量化精度分数提高了0.073。
表3 缺陷量化特征表
图19 梯度回归树测试集深度拟合曲线
4 结语
提出了一种基于人工提取缺陷块的边界搜索方法,该方法有效地提高了人工提取缺陷块的边界精确度,降低了漏磁缺陷特征库建立中后续特征提取的时间复杂度,能够降低缺陷圈取人员的主观相关性,有助于挖掘数据的本质特征,增加特征提取的准确性,为完善后续漏磁缺陷特征库,提高缺陷量化精度提供了决策支持和数据支持。