基于GWO-LSSVM算法的海底管道腐蚀预测模型研究
2022-04-20金龙曾德智孟可雨肖国清谭四周张昇
金龙 曾德智 孟可雨 肖国清 谭四周 张昇
1.油气藏及地质开发工程国家重点实验室·西南石油大学 2.中海石油(中国)中国有限公司深圳分公司3.中国石油天然气股份有限公司东北销售分公司
腐蚀失效一直以来是油气行业亟需解决的难题之一[1-2],腐蚀造成的管道、井筒、套管等油气装备损坏现象严重影响油气田的生产安全[3-5]。在大数据分析与人工智能快速发展的今天,大数据驱动的人工智能方法开始在腐蚀科学领域得以运用。从非线性系统角度来看,腐蚀速率受多种因素共同影响,影响因素之间存在信息叠加与相互耦合,造成传统预测模型不准。目前,引入以神经网络为代表的人工智能方法对腐蚀速率进行预测取得了良好的效果。粒子群优化支持向量机、粒子群优化广义回归神经网络、主成分分析支持向量机、随机森林、集成式学习等一批方法在腐蚀预测方面都得到了广泛的应用[6-11]。此外还包括多种方法的联合运用,例如S. B. Peng等[12]提出了一种混合智能算法来预测多相流管道的腐蚀速率,该模型结合了支持向量回归、主成分分析和混沌粒子群算法,并利用该模型对管道多相流腐蚀速率进行预测,取得了良好的效果;田源等[13]将半经验腐蚀速率预测模型与BP神经网络结合开发了含硫气田集输管道预测软件,软件预测结果与腐蚀挂片数据吻合度较好。
从前人研究成果来看,研究重点为提高预测精度和减低预测耗时等方面。笔者在大数据腐蚀预测研究中发现,最小二乘支持向量机(LSSVM)作为支持向量机算法的提升版,属于学习效率高,泛化性能强,结构性能稳健的预测模型,其在腐蚀预测方面鲜有文献报道。本研究将LSSVM模型与群智能优化算法—灰狼优化(GWO)算法相结合,形成GWO-LSSVM预测模型,旨在探索开发一种新型高效率、高精度的多元非线性腐蚀速率预测模型。将该模型应用于海洋油气管道的外腐蚀速率预测中,是对大数据腐蚀预测方法的探索与丰富,具有一定的重要意义与应用价值。
1 海水腐蚀影响因素
海水内部溶质种类较多,属于天然电解质,为电化学腐蚀创造了天然有利条件,容易造成海洋油气装备的腐蚀失效。图1为某海洋管道受海水腐蚀破坏的宏观与微观形貌[14]。海水中影响金属腐蚀的因素主要包括海水温度、氧溶解量、盐含量、pH值、氧化还原电位、管道材质、海水流速[15-16]。
海水温度在不同纬度、不同季节与不同海洋深度下均有不同的变化。温度升高会加快海水腐蚀金属的速率,但是温度升高又会降低海水的氧溶解量,而氧溶解量又决定了吸氧腐蚀进行的快慢。其阴极反应方程式如式(1)所示。
O2+2H2O+4e-→4OH-
(1)
同时,盐含量也会影响海水导电率和氧含量。盐含量增加会使得海水电导率增加,但是会导致海水氧溶解量降低。因此,盐含量对海水腐蚀的作用机理较为复杂。海水的pH值相对稳定,一般为7.2~8.6,呈现出中性或弱碱性,与前面3个影响因素相比,pH值主要影响海水中的含铁盐水垢沉积过程,其对腐蚀的影响作用相对较弱。海水作为一种腐蚀性电解质,其内部存在诸多氧化剂与还原剂,故用氧化还原电位表示海水氧化还原程度的强弱。由于不同材料的耐蚀性不同,因此,也应当考虑材料对腐蚀速率的影响。海水流速也会影响腐蚀过程的传质作用,同时流速还会影响海水含氧量的变化,因此,海水腐蚀影响因素还需考虑流速。图2为本实验构建的海底管道腐蚀速率预测指标体系。
2 最小二乘支持向量机
1995年,C. Cortes[17]在研究有限小样本推测大样本的算法模型时,从VC维与结构风险最小原则出发,提出一种通用有效机器学习模型-支持向量机(support vector machine,SVM)模型。该模型具有出色的学习能力以及强大的泛化性能,尤其擅长对小样本数据的机器学习。LSSVM模型是对传统支持向量机的简化改进[18-19],改变了问题的求解类型,将二次规划不等式求解转化为等式求解,进而提升了算法的求解效率。
LSSVM模型的数学表述为:假设存在一组样本D={(xi,yi)|i=1,2,…,N}作为训练集,其中xi作为输入值,yi作为输出值。则对于任意的非线性回归问题,LSSVM模型可以进行如式(2)的表示。
y(x)=ωTφ(xi)+b+ei
(2)
式中:ω为权重向量;φ(xi)为非线性映射函数;b为偏置值;ei为拟合误差,是训练集样本的实际输出值与预测输出值之间的误差。
式(2)中,ω与b可以通过结构风险最小原则获取,表达式如下:
(3)
式(2)的约束函数表达式可以写成如下形式:
yi=ωTφ(xi)+b+ei,i=1,2,3,…,N
(4)
如果在式(3)中引Lagrange乘子L,其表达式如式(5)所示。
(5)
式中:αi为拉格朗日乘子;γ为惩罚因子,用于平衡yi与训练误差。
根据KKT(Karush-Kuhn-Tucker)优化条件,利用式(5)可分别获取ω、b、e和α的极大似然估计,如式(6)所示。
(6)
则LSSVM多元非线性回归方程如式(7)所示,该方程为多维空间中的曲线。
(7)
式中:K(x,xi)为核函数;x为训练集样本的输入向量;α,b为式(5)的求解结果。
核函数K(x,xi)的选取有多种函数,本研究选取稳健性较强的RBF函数作为核函数,其表达式如式(8)所示。
(8)
式中:σ为核参数。
惩罚因子γ与核参数σ为影响LSSVM模型精度的主要参数,也是构建高精度LSSVM机器学习预测模型的关键。因此,需要从全局最优的角度出发选取γ与σ,而全局最优则需要依靠智能优化算法来实现。
3 灰狼优化算法
3.1 算法原理
灰狼优化算法与粒子群优化算法(particle swarm optimization,PSO)均为生物种群仿真算法,算法的原理有所不同。有关粒子群优化最小二乘支持向量机的PSO-LSSVM模型的计算流程参见文献[20-22]。2014年,Mirjalili等学者从灰狼种群捕食行为中提出一种新型生物种群启发式算法称为灰狼优化算法(GWO)。与其他生物种群启发式算法不同,该算法的核心是抽象模拟灰狼种群捕食规律,GWO算法的原理如图3所示。在图3的种群社会等级金字塔中,α狼位于金字塔的顶端,α狼的主要任务是负责觅食和领导其他灰狼。β狼位于种群等级金字塔的第二层,其任务主要是协助α狼管理狼群,并将其他灰狼个体信息反馈给狼α。δ狼位于种群等级金字塔的第三层,其任务主要是执行α狼与β狼的决定。W狼位于种群等级金字塔的最底层,其任务是负责实际猎物捕捉。灰狼优化算法寻找待解决问题的全局最优问题时,α狼领导其他灰狼进行搜寻,狼群在α狼领导下采用包围、跟踪、攻击等方式捕食猎物。
图3的GWO算法原理图表明在K维搜索空间中,产生一组由N只狼组成的狼群,狼群会包围住猎物。在此过程中,猎物与狼群之间的距离函数关系如式(9)所示。
(9)
与其他生物种群启发式算法相同,灰狼也必须采用随机搜索的方式逐步逼近全局最优解,在灰狼优化算法中,狼只的随机搜索控制函数如式(10)所示。
(10)
α狼、β狼、δ狼在算法中表现为每次迭代中所保留的3个暂时拥有全局优解的灰狼,赋予其对狼群的领导能力,其他灰狼会根据α狼、β狼和δ狼的召唤更新自身的位置,但是每一次迭代更新都会产生新的α狼、β狼和δ狼,如此往复迭代直到最底层W灰狼抵达全局最优位置。狼群召唤更新位置过程的数学表达式如式(11)所示。
(11)
由于惩罚因子γ与核参数σ2是影响LSSVM模型预测精度的关键参数,将惩罚因子γ与核参数σ2视为猎物,应用GWO算法对目标函数LSSVM的核函数的γ与σ2进行全局寻优,GWO-LSSVM模型计算流程如图4所示。
3.2 预测模型精度评价
为了评价模型的预测精度,引入MAE、RMSE、MSE和R24个预测误差评估函数对预测模型精度进行综合评估。MAE反映预测值的真实误差,RMSE用于反映预测值和真实值之间的偏离程度,MSE反映真实值与预测值之间的差异,MAE、RMSE和MSE越接近零,表示预测精度越高[17],R2衡量的是预测值与真实值之间的拟合程度,其值越接近1,表示拟合程度越好,4个预测误差评估函数表达式如式(12)所示。
(12)
4 模型验证
4.1 数据来源
数据源引文献[15]中海水挂片实验的50组数据,腐蚀速率采用阳极电流密度表示。文献[15]利用灰色关联分析法对指标进行了降维,同时将管材与海水流速设为独立值,即不受其他指标影响,单独统一赋值,经过该处理方式后指标降为五维。从50组数据中随机选出10组数据作为测试集样本,剩余的40组数据作为训练集样本供预测模型学习。训练集样本见表1,测试集样本见表2。由于海洋油气管道外腐蚀影响指标的量纲与数值不同,为了提高预测算法精度和消除不同量纲数据对算法精度的影响,数据集经过无量纲与归一化处理,处理公式如式(13)所示。
(13)
式中:x为变量的具体数值;xmin和xmax分别为该组变量中的最小值与最大值。
表1 训练集样本数据序号温度/℃氧溶解量/(mg·L-1)盐含量/(103 mg·L-1)pH值氧化还原电位/mV腐蚀电流密度/(μA·cm-2)125.906.7130.105.1037816.40229.356.0929.006.3040016.90327.906.1831.507.0036315.57424.007.9530.208.1032413.65527.323.2129.318.2028112.91627.876.5531.687.2035614.06…………………3724.316.4240.677.882508.753824.116.3841.007.982288.993917.457.4834.088.1013517.054021.958.2834.647.9511317.34
表2 测试集样本数据序号温度/℃氧溶解量/(mg·L-1)盐含量/(103 mg·L-1)pH值氧化还原电位/mV腐蚀电流密度/(μA·cm-2)128.005.0531.409.2024013.34229.376.8230.126.2041417.11328.756.8032.228.0034011.43424.607.5224.427.5721011.83525.576.7032.198.0932511.87628.726.8032.218.0032513.33724.607.5224.427.5721010.74830.707.1531.746.5040115.00925.556.6731.008.0932012.491027.194.9133.507.9927515.48
4.2 计算结果分析
此处将对比分析粒子群优化最小二乘支持向量机PSO-LSSVM、灰狼优化最小二乘支持向量机GWO-LSSVM、传统最小二乘支持向量机LSSVM这3种模型的预测结果。PSO速度更新系数c1取1.5,c2取1.7,种群规模为20,迭代次数为100,个体和速度的取值区间分别为[1,1 00 0]和[0.001,100]。经过PSO后的最小二乘支持向量机核函数σ为1.435,惩罚因子γ为1.808 9。GWO对LSSVM的核函数σ、惩罚因子γ的寻优范围分别为[0.001,500]与[0.001,100],搜索狼群单位数量为20,迭代步数为50次。经过GWO寻优迭代后的最小二乘支持向量机核函数σ为7.465、惩罚因子γ为0.288 3。两种算法均在相同的16核工作站上完成,分别用时5.6 s和3.5 s。
图5是3种预测模型的预测结果。由图5(b)可看出:传统LSSVM的相对误差波动较大,其最大相对误差达到1.64%,高于PASO-LSSVM与GWO-LSSVM的预测结果。PSO-LSSVM预测结果的最大相对误差为0.44%,GWO-LSSVM预测结果的最大相对误差为0.16%;GWO-LSSVM算法误差波动小,算法稳健。同时,利用预测结果计算3种模型的MAE、MSE和RMES,可以看出GWO-LSSVM的MAE、MSE和RMES最小,最接近于零,分析结果见图6。图7是真实值与预测值的线性回归拟合分析。由图7可以看出,GWO-LSSVM的决定系数R2为0.997 8,与1最接近,拟合程度最好。综合来看,GWO-LSSVM的预测精度高于PSO-LSSVM及LSSVM,且计算时间也相对较短。
5 结论
(1) 从系统工程出发,根据海底管道的腐蚀机理,筛选出包括海水温度、氧溶解量、盐含量、pH值、氧化还原电位、管道材质、海水流速7个因素作为海底管道腐蚀预测因子,构建了海底管道外腐蚀预测指标体系。
(2) 引入灰狼优化算法对最小二乘支持向量机进行参数寻优,形成GWO-LSSVM预测模型,与传统最小二乘支持向量机、粒子群优化最小二乘支持向量机相比,GWO-LSSVM预测模型的误差波动最小,算法稳健性和预测精度更高。