APP下载

基于机器学习的高含水油田剩余油预测方法

2022-07-30卜亚辉

油气地质与采收率 2022年4期
关键词:等值线高含水含油

卜亚辉

(中国石化胜利油田分公司勘探开发研究院,山东东营 257015)

中国东部老油田已普遍进入高含水开发阶段,生产历史复杂,剩余油分布零散,开发效益逐年变差。在低油价及成本上涨的双重压力下,亟待建立更加准确、高效的油藏生产数据分析方法。大数据及人工智能技术的出现可为传统方法的升级提供全新解决途径。目前智能学习算法在油藏工程领域的研究正处于快速发展阶段,研究方向主要包括:流场聚类算法识别水驱油藏流场[1],卷积神经网络自动试井解释[2],智能算法加速数值模拟历史拟合[3]及闪蒸分离相平衡计算[4],使用代理模型数值模拟历史拟合及方案优化[5-6],通过机器学习量化评价多井分层注水效果、分析注水调整方向[7-8],预测产量递减及裂缝发育[9-11],储层流体分级识别[12],页岩油产能预测[13]等。

将机器学习应用于剩余油预测仍处于起步研究阶段,面临的挑战包括:第一,影响剩余油分布的参数众多,如何筛选提取特征参数;第二,如何用更少的参数描述剩余油空间分布特征。为此,笔者提出了基于数值模拟正演的样本构建方法,首先从数值模拟结果中提取含油饱和度等值线进行拟合,然后通过人工神经网络(ANN)建立拟合参数随时间和空间的变化关系,最后根据拟合参数重构含油饱和度场。该方法可快速评价剩余油潜力区,为开发调整政策的制定提供参考。

1 方法概述

高含水油田虽然采出程度较高,但仍蕴藏较大开发潜力,取心及矿场动态资料显示,剩余油呈整体分散、局部富集的特点[14-16],有效驱替仅发生在注采井组间局部范围,注采主流线之外依然存在剩余油富集区。矿场实践表明,改变注采方向、注采强度等流场调控手段可实现高含水油田采收率的进一步提高[17-21]。针对高含水期剩余油及其开发特点,设计了基于机器学习的剩余油预测方法(图1),具体步骤包括:①方案设计及模拟计算。影响注采井组间剩余油分布的主要因素包括井距、厚度、渗透率、相对渗透率和地层倾角等,设计多组概念模型调用数值模拟器获得不同时刻及层位的含油饱和度场。②含油饱和度场提取及拟合。对每个时间步及模拟层含油饱和度作等值线,提取等值线对应数据点,选用多种曲线方程拟合,记录每种拟合方法的参数及拟合精度。③样本库构建及学习训练。将各影响因素及对应拟合参数关联建立样本库,通过神经网络模型拟合训练样本,形成含油饱和度等值线预测模型。④注采井组划分及开发指标标定。根据开发历史及动态数据,对各开发阶段每个井组间的流动方向、采液量和含水率进行标定。⑤注采井组间含油饱和度预测。调用训练好的模型,预测各注采井组间含油饱和度等值线拟合参数。⑥含油饱和度场叠加及验证。将多阶段多注采井组含油饱和度场叠加,通过插值获得整个研究区预测结果。将预测结果与矿场动态进行对比,当误差较大时,调整参数重新计算;当误差较小时,将验证后的参数值样本保存入库,随着应用区块的积累逐步建立矿场样本库。

图1 基于机器学习的剩余油预测方法技术路线Fig.1 Roadmap of remaining oil prediction method based on machine learning

2 注采井组间含油饱和度表征

高含水期注采井组间含油饱和度场特征的表征是该方法的关键,需要满足形态保真且数据量小的要求。油藏工程及矿场实践表明高含水期注采井组间含油饱和度分布形态受储层物性、注水井、采油井位置及工作制度等参数影响,通过数值模拟正演可建立各种剩余油模式。针对中-高渗透均质概念模型,设置模型尺寸为1 000 m×1 000 m×10 m,网格数为50×50×5,渗透率为300 mD。在一注一采条件下,采油井的含水率分别为10%和80%时,纵向上选取模型顶部(第1 层)、中部(第3 层)、底部(第5 层)3 个位置进行数值模拟。由图2 可知,含油饱和度形态呈近似的曲线带,随着含水率升高,水驱波及范围不断扩大。其中蓝色代表强驱替区,红色代表未波及区,蓝色至红色之间代表过渡区。过渡区分布范围虽较小,但含油饱和度变化最快。此外受重力作用影响,储层底部较顶部水驱波及范围更大。

图2 含油饱和度数值模拟结果Fig.2 Numerical simulation results of oil saturation

含油饱和度场图虽然能够全面表征其空间特点,但数据量较大,且以整个场数据为样本进行学习训练难度较大。为此,可提取少量含油饱和度等值线,降低数据量及学习难度。编写模块自动读取各时刻开发指标与含油饱和度场数据,绘制并提取指定含油饱和度等值线,获取每条等值线对应的点集坐标。在含油饱和度为0.5 的条件下,绘制模型第5层的不同时刻含油饱和度等值线(图3),可以看出当初始时刻的含水率为2%时,注入水波及范围较小,受模拟网格影响含油饱和度等值线近似四边形;当含水率为5%时,含油饱和度等值线呈水舌形向采油井推进;当含水率为30%~70%时,含油饱和度等值线逐渐过渡到椭圆形,随着含水率升高,椭圆长短轴的差异不断缩小;当含水率为90%时,含油饱和度等值线接近圆形。

根据以上分析,含油饱和度随时间变化规律可用一组特征曲线表示,由此设计采用多项式方法进行拟合。在注采井距为400 m、油藏厚度为5 m、垂向位置为0.5 m、采液量为104 m3的条件下,获得3条含油饱和度等值线(图4a)。以含油饱和度为0.45的等值线为例,其是由若干等值点组成的(图4b),以注水井为坐标原点(0,0),定义注水井到采油井连线方向为x轴正方向,垂直x轴作y轴,等值点整体呈对称分布,仅使用y轴正半轴数据进行拟合。采用三次多项式进行回归计算,其表达式为:

图4 含油饱和度等值线多项式拟合结果Fig.4 Polynomial fitting results of oil saturation isolines

采用判定系数R2评价多项式拟合质量,R2值越接近1,表示拟合质量越好,其表达式为:

由含油饱和度等值线的多项式拟合参数及判定系数(表1)可以看出,R2值均大于0.9,说明该方法具有较高的拟合精度。每一条含油饱和度等值线的空间分布特征用4 个拟合参数(a,b,c,d)表示,而原网格数据至少需要20 个横纵坐标点值,对等值点开展多项式拟合后只需要保留坐标原点值和拟合参数值,数据量下降至原来的10%以内。

表1 含油饱和度等值线的多项式拟合参数及判定系数Table1 Fitting parameters and determination coefficient of oil saturation isolines

3 样本构建及学习训练

参考中-高渗透油藏物性及井网特征设置方案,通过数值模拟获得训练样本数据集。模型尺寸为2 000 m×2 000 m,较大的平面尺寸是为了消除边界对等值线形态的影响,网格数为100×100×5,地层压力为20 MPa,原油黏度为10 mPa·s,体积系数为1.2,平均渗透率为300 mD。

考虑注采井距(50,200,250,300,350,400 和450 m)、油藏厚度(2,3,5 和9 m)、渗透率(200,400,600 和800 mD)3 个参数,共组合112 个方案。每个方案提取第1 层、第3 层、第5 层含油饱和度等值线(So=0.3,0.5,0.7)的拟合数据,获得原始样本数据9 072 组,采用随机方式划分为训练集(80%)和测试集(20%)。

学习训练采用TensorFlow 搭建人工神经网络模型(图5),其结构为1 个输入层、若干个隐藏层、1 个输出层[22-25]。输入层包含6 个神经元,分别为注采井距、油藏厚度、渗透率、垂向位置、采液量和含油饱和度;隐藏层数及隐藏层包含神经元个数Hij是需要优化的参数,隐藏层数越多,神经元个数越多,其对非线性数据的拟合能力越强;输出层神经元有4个参数。

图5 人工神经网络模型示意Fig.5 Schematic diagram of artificial neural network model

为了提高人工神经网络模型的非线性拟合能力,测试多种激活函数的预测效果,本方案备选的激活函数包括Sigmoid,Tanh 和Relu 三种非线性函数,表达式分别为:

模型质量的评价指标采用均方根误差,其表达式为:

初始采用5 个隐藏层,每层10 个神经元的网络模型,对比150 个训练轮次,测试Sigmoid,Tanh 和Relu 激活函数的均方根误差,其值分别为96,119和82 m,故选用Relu 作为所有神经元的激活函数,从而使模型的预测能力达到最强。对隐藏层数和神经元个数开展敏感性分析,对比测试3~8个隐藏层、5~20个神经元的网络模型,结果显示5个隐藏层,每层8~16 个神经元模型能获得较好的预测效果。以该模型为基础,继续增加训练轮次,提高模型的训练精度。

由训练集学习曲线(图6)可以看出,500个训练轮次内,前20 个训练轮次均方根误差快速下降,等值线各点位置的均方根误差由75 m下降至20 m,即该模型预测等值线点的空间距离偏差在20 m 以内;第20~270 个训练轮次,精度缓慢下降,均方根误差由20 m 下降至9.8 m;第270 个训练轮次后,均方根误差基本稳定在8.9 m。由测试集预测结果(图7)可以看出,数据点整体集中于45°线,离45°线距离较远的数据点来自中低含水期的样本,预测精度较低;离45°线距离较近的数据点来自高含水期的样本,整体预测精度较高。

图6 训练集学习曲线Fig.6 Learning curve of training set

图7 测试集预测结果Fig.7 Prediction results of test set

4 实例应用

测试区块为某封闭断块油藏,该油藏被5 条断层(F1—F5)包围,其中F1 断层位于油藏的高部位,F5 断层位于低部位,砂体厚度为7.1 m,平均孔隙度为0.26,平均渗透率为460 mD,地层原油密度为0.897 g/cm3,原油黏度为9 mPa·s,属于中-高孔、中-高渗透、常压、稀油油藏,经过30多年的开发采出程度为46.9%,含水率为96%。除天然能量开采阶段外,主要生产阶段采用两注两采方式(注水井为Inj1,Inj2;采油井为Prod1,Prod2)。开发动态响应显示注采对应关系明确,Inj1—Prod1 和Inj2—Prod2是主见效方向,采液量分别为6.78×104,4.68×104m3,Inj1—Prod2 是次见效方向,采液量为3.56×104m3。将注采数据代入训练模型,获得含油饱和度等值线拟合参数,并根据该参数重构含油饱和度场,对于井组间的重叠部分取其最大值,从而获得整个区块的剩余油分布。

对比含油饱和度数值模拟和机器学习预测结果(图8),新方法对该区块整体的剩余油分布特征预测较好。可以看出F1 断层附近的高部位及F2 和F3 断层附近的断边带剩余油描述最清晰,说明该学习模型对水驱波及的外部边界描述差异较小,其次是2 口注水井之间存在剩余油富集区(图8b),该区域预测能力主要受到注采井距和采液量影响,当注采井距越大且采液量越小时描述越准确,以上剩余油分布位置均符合矿场认识。然而该方法的不足之处主要表现在Prod1 和Prod2 井间剩余油边界描述不精准,对井间滞留区的刻画能力较弱,其原因是学习样本来自单个注采井组的含油饱和度,未考虑多注多采条件下流场相互干扰作用。为此,下一步研究将整个注采井网结构作为输入代入神经网络,描述含油饱和度分布从简单的多项式函数变为多种组合函数,不断提高注采井组间含油饱和度分布的预测能力。

图8 含油饱和度数值模拟和机器学习预测结果Fig.8 Results of oil saturation by machine learning and numerical simulation

5 结论

建立了一种基于机器学习的剩余油预测方法,通过数值模拟建立考虑不同因素影响下的含油饱和度等值线拟合参数样本,采用神经网络算法建立预测模型,并针对高含水油田开展应用测试。预测结果显示新方法在复杂井间联动关系的条件下,依然能较高质量描述高含水油田平面及纵向剩余油分布形态特征,同时计算效率得到大幅度提高。所提出的含油饱和度等值线多项式拟合样本预处理方法,克服了直接采用含油饱和度场作为学习样本时参数多、训练慢的缺点,训练后获得的预测模型具有更灵活、高效的特点。该方法可实现剩余油的快速预测分析,指导新井方案及注采调控方案设计。针对目前方法存在的缺陷提出了改进方向,未来随着考虑因素及样本数据量的扩充,预测精度将进一步提高,具有很大的发展潜力。

符号解释

a,b,c,d——三次多项式系数,无量纲;

f(x)——拟合函数,无量纲;

h——油藏厚度,m;

Hij——隐藏层第i层第j个神经元;

K——渗透率,mD;

label——样本值,无量纲;

L——注采井距,m;

Ly——垂向位置,m;

N——等值点总数;

Nl——采液量,m3;

i——等值点序号;

predicted——预测值,无量纲;

R2——判定系数,无量纲;

RMSE——均方根误差,无量纲;

So——含油饱和度,无量纲;

xi——第i个等值点横坐标;

yi——第i个等值点纵坐标;

——等值点纵坐标平均值;

X,Y——空间位置,m。

猜你喜欢

等值线高含水含油
海上高含水原油新型静电聚结脱水器试验应用
油田含油污泥综合利用污染控制标准分析
含油污泥及热解残渣在建筑领域中的应用概述
HD高含水油田水平井适应性评价研究
芳烃抽提装置含油污水的减量化实践
页岩气田钻井含油危废旋转炉处理的优化与应用研究
高含水水平井控水效果量化评价方法与应用
高含水油田聚合物驱注入工艺全要素评价分析
基于规则预计格网的开采沉陷等值线生成算法*
基于IDW插值的测量数据等值线生成方法*