APP下载

基于遗传算法SVM的海洋环境腐蚀速率预测

2018-11-01

中国海洋平台 2018年5期
关键词:钢材遗传算法速率

, , , , ,

(1.天津大学 水利工程仿真与安全国家重点实验室, 天津 300072;2.高新船舶与深海开发装备协同创新中心, 上海 200240)

0 引 言

深海海底管道通常处在极为复杂恶劣的运营环境中,在整个深海油气输送系统中管道如同人体的血管,处于极为重要的地位,一旦管道出现结构破坏或失效,会造成极大的经济损失[1]。据PARLOC 2001统计,海底管道立管失效事件中由腐蚀造成的事故超过40%。

随着海洋油气技术的不断发展,海底管道和海洋平台的数量不断增加,建立海洋环境腐蚀速率预测模型可以减少潜在的结构性失效[2]。但是钢材的腐蚀是一个复杂的过程,至今为止没有完整的理论可以进行钢材的腐蚀速率计算。基于电化学腐蚀数据建立合理的机器学习模型,可以有效地进行腐蚀速率预测,能够为海洋结构物腐蚀失效预测提供可靠的腐蚀缺陷几何参数数据。

针对钢材腐蚀行为,国内外专家已经做了许多研究工作。HAQUE等[3]通过建立神经网络模型预测DP钢材的腐蚀行为;KAMRUNNAHAR等[4]将神经网络作为挖掘工具,预测钢材腐蚀行为;SHI等[5]针对氯化物等腐蚀物对混凝土钢材点腐蚀行为进行定量研究,通过试验测试腐蚀电位和点腐蚀电位,探究其与氯化物浓度、pH和溶氧量之间的关系,并通过性能测试模型得到测定系数为0.8741;刘威等[6]建立灰色神经网络腐蚀速率预测模型;胡松青等[7]建立BP神经网络对输油管线内腐蚀行为进行预测;汪川等[8]利用统计学方法进行钢材腐蚀速率预测;邓志安等[9]将模糊算法用于改进人工神经网络腐蚀速率预测模型。

国内外学者针对钢材腐蚀行为多研究腐蚀影响因素对腐蚀速率的影响,或者采用人工神经网络或数学统计方法对腐蚀速率进行预测,但是深海管道风险评估需要更为精确地预测钢材在海洋环境条件下的腐蚀速率。

人工神经网络作为一种机器学习纠偏方法,被广泛应用于模式识别、数据预测等方面。但是,神经网络学习参数的选择通常需要设计人员的经验,同时也需要大量的训练数据才可以得到较为理想的预测结果。由于海洋腐蚀速率试验数据样本容量小,人工神经网络预测结果无法满足管道腐蚀失效风险预警体系的要求。

VAPNIK[10]和KAVEH等[11]提出了支持向量机(Support Vector Machine, SVM)理论。SVM最初应用于分类问题。SPECHT[12]提出SVM回归方法,用于数据预测。SVM能够在小样本条件下根据数据样本的统计特性,进行更为准确的数据预测。在SVM预测模型中,选择合理的参数对预测精确度至关重要。SVM预测模型结合遗传优化算法可以得到精确的腐蚀速率预测数据,为海底管道腐蚀失效计算提供更为可靠的腐蚀缺陷几何数据。

1 SVM原理

SVM是统计理论在机器学习方面的延伸,能够在少量样本条件下寻找样本数据的统计特性,提高回归分析的准确度。传统的机器学习算法存在过拟合、局部领域取值过大或过小以及样本特征向量增加、计算量成倍递增等缺点,而SVM能够很好地克服这些缺陷,因此得到了广泛应用[13]。

给定样本集D={(xi,yi)|i=1,2,…,l},其中:xi∈Rn,yi∈R。SVM数据预测模型通过引进松弛变量约束ξ和ξ*,并且引进从输入空间Rn到Hilbert空间H的变换φ,将数据样本集(xi,yi),i=1,2,…,l,xi∈Rn,yi∈R映射为f(φ(xi),yi,b)=0,i=1,2,…,l,原始的回归问题转化为优化函数:

(1)

式中:w为权重向量;C为惩罚因子,且C>0。优化函数的约束条件为

(2)

式中:b为映射的参数;ε为损失函数,且ε>0。

若对应的变换φ的核函数为K(xi,xj),上述问题转化为

式中:α为拉格朗日乘子。最终得到优化后的回归函数

,xi)+b(5)

SVM回归的核函数主要包括几种:

线性核函数形式

K(xi,xj)=xixj(6)

多项式函数形式

K(xi,xj)=(γxixj+fcoe)d(7)

径向核函数(Radial Basis Function, RBF)形式

K(xi,xj)=exp(-γ|xi-xj|2)(8)

Sigmoid核函数形式

K(xi,xj)=tanh(γxixj+fcoe)(9)

在非线性回归预测问题中通常选用后3种核函数。式(7)~式(9)中:d为幂参数,可取任意值;γ、fcoe为核函数的常量参数,取值需大于零。

2 遗传算法基本原理

遗传算法是按照生物进化论的思维并以遗传变异作为理论基础,实现数值优化的。20世纪60年代HOLLAND[14]首次利用生物进化机制解决简单的生物适应性问题,开创新的优化方法。

染色体编码有多种形式,常用的有实数编码和二进制编码。实数编码是将染色基因值用1个实数表示,由于实数具有连续性,可以很好地解决连续性参数优化问题,但是易于陷入局部最小问题。二进制编码是将基因值用二进制符号0和1表示,可以进行全局搜索,并且变异和交叉易于实现,可以避免局部最小问题。

3 遗传算法SVM实现过程

SVM的关键参数主要包括惩罚因子C、核函数类型、γ值和损失函数ε。采用遗传算法进行参数优化时,需要选择合适的参数范围。遗传算法首先会初始化生成一个种群,将种群中各个体进行解码生成SVM初始参数,建立SVM模型得到腐蚀速率预测结果,根据优化目标函数选择适当的适应度函数计算各个体的适应度值,按照适应度遴选种群中的个体,种群个体基于编码接着进行交叉及变异产生新的种群个体,经过反编码得到SVM的新参数,输入到SVM中进行预测,得到预测结果。迭代往复,最终在迭代数次后可得到满足要求的参数优化结果。其流程如图1所示。

4 海洋环境中钢材腐蚀速率预测模型

4.1 腐蚀预测模型数据

以Q 235钢材海洋挂片腐蚀试验数据作为样本,建立腐蚀速率预测模型。腐蚀试验数据见表1。预测模型中需要对数据进行归一化处理,避免不同变量之间的数量级不同或者出现函数不饱和区域,导致数值问题的产生。

图1 遗传算法SVM实现过程

序号温度/℃含氧量/(mg·L-1)含盐量/(103mg·L-1)pH值腐蚀速率/(μA·cm-2)124.270.8032.568.102.55227.452.6035.377.9610.96327.234.2031.947.8912.00428.726.8032.218.0013.33528.528.4032.108.0117.31628.459.9031.957.9322.48723.957.619.178.048.13824.956.8016.297.829.07924.607.5224.427.5710.741027.323.1229.318.2013.591124.007.9530.208.1012.891227.786.3531.387.2013.611327.976.0531.946.6014.601430.707.1531.746.5015.00

续表1 海洋环境腐蚀速率试验数据

图2 钢材腐蚀图

通过海洋挂片的失重质量计算Q235钢材在海洋环境中的腐蚀速率。钢材腐蚀情况如图2所示。

4.2 选取训练样本和测试样本

在选择训练样本时要包含各变量的最大、最小值,避免测试样本变量数值大于训练样本,无法得到理想的预测模型。通过归一化将变量和输出值转化至范围内。选取测试样本的样本号及归一化后数据见表2。

表2 测试样本数据

图3 适应度值变化图

4.3 SVM模型预测结果

经过优化,SVM模型得到准确度更高的预测结果,遗传算法也表现出较好的收敛性。平均适应度随着迭代次数的变化如图3所示。遗传算法中选择测试样本与试验值的误差绝对值的平均值,其倒数作为适应度函数(误差绝对值按照100%计算),适应度值为1.118 2,误差绝对值的平均值为0.89%。

利用遗传算法对SVM进行参数优化得到的优化结果见表3,其中惩罚因子C小于10,避免了SVM回归预测由于惩罚因子C过大导致的过拟合问题。

表3 遗传算法优化参数结果

图4 模型预测值和腐蚀速率试验值对比

表4为SVM模型预测结果与试验值对比表,样本4号和12号误差分别为-0.147 8%和-0.450 3%。由图4可以看出预测值几乎接近实际试验值。3组预测结果误差均小于3%,说明基于遗传算法的SVM腐蚀速率预测模型可以提供可靠的数据预测结果。

表4 模型预测值和试验值对比

图5 GA-SVM模型和BP神经网络预测结果误差对比

在BP神经网络预测模型中,测试样本误差绝对值的平均值为7.23%。由图5可以看出,相对于人工神经网络预测模型,通过遗传算法给出优化的惩罚因子C、γ值参数的SVM模型的精确度也达到了较高的水平。基于遗传算法的SVM预测模型可以有效降低预测误差,能够为风险预警体系中腐蚀失效预测提供可靠的腐蚀速率预测结果。同时也证明,基于遗传算法的SVM海洋环境腐蚀速率预测模型切实可行。

除此之外,利用遗传算法对SVM参数进行优化时,不同的取值范围会导致不同优化结果,见表5。因此,在利用遗传算法优化时,要尝试不同的取值范围,以便能够得到更为合理的SVM参数。

表5 参数取值范围对最优适应度的影响

5 结 论

本文基于MATLAB开发平台,以腐蚀预测SVM模型的预测结果与试验值的误差最小作为优化目标函数,编写遗传算法优化程序进行参数优化。通过海洋腐蚀挂片试验数据验证模型预测结果得到以下结论:

(1) 根据海洋挂片腐蚀试验数据,建立SVM模型,利用遗传算法进行参数优化,可以得到精确的腐蚀速率结果。因此,基于遗传算法的SVM模型可以用作海洋环境腐蚀速率预测模型,为深海油气输送系统中处于海洋水环境的立管、平台等结构的风险预警体系提供精确的数据参考。

(2) SVM可以解决海洋腐蚀速率试验样本数据较少的规律预测问题,能够在小样本条件下给出比BP神经网络预测模型更可靠的腐蚀速率预测结果。

(3) 利用遗传算法进行参数优化时需要设置适当的参数范围。不合适的参数范围通常无法得到合理的惩罚因子C、核函数类型、γ值和损失函数ε,同时在参数优化过程中考虑到惩罚因子C过大导致的过拟合化的问题,因此在利用遗传算法进行参数优化时,须慎重选择关键参数的取值范围。

猜你喜欢

钢材遗传算法速率
2022年11月我国出口钢材559万吨
化学反应的速率和限度考点分析
钢材集中采购管理思考探究
“化学反应的速率与限度”知识与能力提升
基于遗传算法的智能交通灯控制研究
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于改进的遗传算法的模糊聚类算法
基于改进多岛遗传算法的动力总成悬置系统优化设计
中国首次成钢材净出口国
莲心超微粉碎提高有效成分的溶出速率