APP下载

基于数据挖掘的底水油藏开发预测新方法

2021-07-15孙恩慧杨东东

石油化工高等学校学报 2021年3期
关键词:底水油藏数据挖掘

张 东,孙恩慧,杨东东,谭 捷

(中海石油(中国)有限公司 天津分公司,天津300459)

截止目前,渤海X油田单井含水率大于90%的井已占全油田的83%,含水率95%以上的井占比74%,综合含水率96%,为渤海综合含水率最高的油田之一。在底水油藏开发过程中,由于受强底水、油柱高度低、地层原油黏度大、储层非均质性强、隔夹层分布复杂等多因素影响,底水油藏水平井开发效果差异大。在底水油藏开发预测研究方面,传统方法通常借助于已生产井的静动态资料,通过类比、水驱曲线、数值模拟等方法分析油柱高度、黏度、隔夹层等单因素对技术可采储量的影响规律[1-5],主要存在的问题是类比法中参数需求较多,且许多参数不易求取,导致类比法存在偏差;水驱曲线法适用于水驱油田特定的开发阶段,对于底水油藏特高含水期可采储量预测偏保守;常用数模方法所需数据量大,工作量大[6-12]。

此外,在研究过程中底水油藏水平井开发界限图版仅限于一维表征,规律性不强,导致以上所述方法在应用过程中存在一定局限性。分析其原因为:生产井投产后影响因素较多,如图1所示,单因素无法精确表征生产井的实际生产规律,在开发界限研究过程中需要考虑各因素对技术可采储量的综合影响。因此本文借助数据挖掘相关方法及技术,开展了基于多因素影响的底水油藏水平井开发预测模型的建立及应用研究。

图1 不同黏度条件下避水高度与技术可采储量关系Fig.1 The relationship between water repellent height and r ecover able r eser ves under differ ent viscosity conditions

1 数据挖掘方法

基于BP神经网络的数据挖掘方法,是一种使用现有井的生产数据建立全油藏范围生产预测模型的方法,该方法无需事先确定输入输出之间映射关系的数学方程,仅通过自身的训练,学习某种规则,在给定输入值时得到最接近期望输出值的结果。该方法不仅克服了其他方法所需多因素数据分析量大、应用局限性大、耗时费力等缺点,而且不受油田开发阶段、开发方式等方面的限制,操作性、实用性更强,应用范围更广。

数据挖掘方法流程如图2所示。根据地质油藏的静动态认识,通过专业数据分析后形成预测前的数据集,通过BP神经网络算法可将油藏人员的开发经验转变为数学模型,即基于数据挖掘的单井可采储量预测模型,通过该模型可以实现多因素条件下的技术可采储量预测及开发界限的有效表征,以快速、便捷地应用于油藏的开发决策中。该过程实现了从抽象到具体、从繁琐到简单的水平井方案设计快速决策过程。

图2 数据挖掘方法流程Fig.2 The method of data mining

1.1 BP神经网络数据挖掘原理

BP神经网络是多层感知器中最常用的方法,单隐层神经网络一般分为输入层、隐层、输出层。X=(x1,x2,…,x i,…,x n)T为输入向量,训练之前为了引入隐 层 神 经 元 的 阀 值,令x0=ˉ1;Y=(y1,y2,…,yj,…,ym)T为隐层输出向量,为了引入输出层神经元的阈值,令y0=ˉ1;O=(o1,o2,…,ok,…,ol)T为输出层向量,D=(d1,d2,…,d k,…,d l)T为期望输出值。输入层到隐层、隐层到输出层的权值矩阵分别记为V和W,V=(V1,V2,…,V j,…,V m),W=(W1,W2,…,W k,…,W l),其中隐层中与第j个神经元相对的向量记为V j,输出层中与第k个神经元相对的向量记为W k,V j和W k都是权向量。各层的信号相互流动,其关系分析如下。

输出层的关系有:

隐层的关系有:

式(1)、(3)中,f(x)变换函数,其表达式如下:

单极性变化函数f(x)既连续又可导,有如下表述:

由于需要不同,变换函数也可不同,如双极性函数Sigmoid,表示如下:

通过式(1)到式(7),推导即可得到三层感知器网络的理论模型。

1.2 数据集的建立

数据集包含目标油藏及生产井的相关数据,可分为:油藏静态数据、生产井动态数据、流体测试数据等。在数据集建立过程中,不仅要求数据量足够大,而且要确保数据的准确性及合理性。当数据集拥有足够多的数据样本时,就可以用这些数据样本训练和建立神经网络。

1.3 神经网络的建立

神经网络模型的建立主要由反向传播算法计算完成。将数据集样本分成三部分:第一部分最重要,是用来训练神经网络的基础样本;第二部分是预测误差最小的样本,用来对神经网络训练过程中的样本进行校正,防止训练中出现不收敛或计算量过大的问题;第三部分用来对神经网络进行验证,以上各部分的数据所占比例一般为70%、15%、15%。通过对神经网络训练、校正和验证,当结果符合误差较小时,上述建立的神经网络即可应用于油藏多因素预测。

2 方法适用性分析

为分析数据挖掘算法在“大数据”的学习预测应用中的可靠性,针对底水油藏主控因素,建立机理模型,分析BP神经网络数据挖掘方法的适用性。为准确描述底水油藏中各因素对底水油藏开发规律的影响,通过抽屉实际油藏中的油柱高度、储层物性、PVT数据、相渗数据、初始化设置等参数,建立符合开发实际的数值模拟机理模型,如图3所示。

图3 底水油藏概念模型设计Fig.3 The par ameter design of conceptual design model for bottom water reservoir

油藏开发由多种因素共同决定,考虑油层厚度、渗透率、产液速度、原油黏度、避水高度五种因素,在选定因素水平的试验数值之后,进行了相应的正交试验设计。机理模型参数设计如表1所示。通过建立底水油藏概念数值模型,可预测油井在不同参数条件下的技术可采储量。

表1 模型重点参数Table 1 The key par ameter s of the model

以五种因素参数的取值为输入值X,以数模预测的技术可采储量为输出值Y,通过运用BP神经网络的数据挖掘方法,结合Matlab编程,计算得到了该模型的单井可采储量神经网络预测模型,结果如图4所示。从图4中可以看出,训练数据、测试数据、验证数据均得到了较好的拟合效果,相关系数在0.99以上。

图4 BP神经网络预测精度分析Fig.4 The precision analysis of BP neur al net pr ediction model

为进一步验证该数据挖掘方法的可靠性,重新设计一口生产井的静动态数据,通过数值模拟计算了该生产井的技术可采储量,并与以上网络模型预测结果进行对比,结果如图5所示。从图5中可以看出,数据误差在5%以内。因此,通过输入已知油藏及生产井的静动态参数,运用神经网络数据挖掘方法预测可采储量的方法合理可行。

图5 BP神经数据挖掘方法验证Fig.5 The validation of BP neural net prediction model

3 底水油藏水平井可采储量预测模型建立

3.1 底水油藏单井可采储量影响因素分析及优化

在BP神经网络的数据挖掘方法中,因变量个数越多,收敛速度越慢,计算时间越长,因此在方法运用过程中需要尽可能减少因变量个数。根据文献调研,在分析了底水油藏可采储量主控因素的基础上,选择影响单井技术可采储量的隔夹层厚度、地层原油黏度、水平井长度、油层厚度、避水高度五种静态参数作为主要影响因素,通过数模法或水驱曲线法综合确定实际油井的单井技术可采储量,选取样本井42口。

在仅考虑静态因素的条件下,通过BP神经网络预测结果显示训练数据、测试数据、验证数据误差均较大,拟合效果差。结合生产井的实际静动态资料,分析拟合较差的原因主要是,影响油井可采储量的因素考虑不全,需要进一步结合油藏工程方法提高生产井的动态认识,以改善拟合效果。大数据分析中,学习样本的准确性及合理性是模型建立的前提。针对底水油藏单井可采储量的影响因素,不仅要考虑静态因素影响,还要综合考虑生产井的动态因素。为此,开展“一井一策”单井建档达标参数工作,确保单井油藏特征参数的数据化和规范化,以样本中的5口油井为例,本次除考虑生产井静态因素以外,还纳入初期日产油、生产压差、含水率及水淹厚度等动态因素,如表2所示。

表2 底水油藏动静态因素下技术可采储量影响因素Table 2 The static and dynamic factors influencing recoverable reserve in bottom water reservoirs

动静态因素条件下神经网络模型预测结果如图6所示。从图6中可以看出,底水油藏动静态参数优化后,通过BP神经网络数据挖掘方法计算训练数据、测试数据、验证数据的拟合效果较好,整体数据拟合相关系数R2=0.947。因此,通过各影响因素等相关参数分析优化后建立的神经网络模型,可进一步应用于底水油藏水平井开发的可采储量预测及开发界限研究中。

图6 动静态因素条件下神经网络模型预测结果Fig.6 The result of BP neural net prediction model under static and dynamic factors

3.2 底水油藏单井开发界限定量表征

通过该模型,在静动态因素一定的条件下,可分析单因素对底水油藏开发效果的影响规律,也可分析主控因素油柱高度和地层原油黏度对生产井可采储量的多因素影响规律,结果如图7所示。图7中红色网格线平面为经济极限技术可采储量4万m3,根据该平面可直观地给出底水油藏不同地层原油黏度条件下的油柱高度下限值,有效指导不同油柱高度、流体性质下的调整井优化设计及部署。如图8所示,以30 mPa·s为例,单井可采储量4万m3时的底水油藏油柱高度下限值为6.0 m。利用上述数据挖掘方法建立的BP神经网络预测模型,可以得到任意单因素或多因素下的单井技术可采储量,实现了水平井开发底水油藏的影响因素和技术参数界限的定量分析。

图7 底水油藏技术可采储量三维立体表征Fig.7 The three-dimensional characterization of recoverable reserves in bottom-water reservoirs

图8 不同原油黏度下的油柱高度下限值Fig.8 The lower limit of oil column height under different viscosity of cr ude oil

4 应用效果

以明下段797砂体为例,结合底水油藏水脊形态及水淹厚度油藏工程、数值模拟等研究手段,特高含水老井A 63H井附近130 m位置为潜力井位A 50H2,通过分析该区域的静态参数,同时参考周边井的动态参数(参数选取如表3所示),结合上述建立的BP神经网络预测模型,预测该区域可采储量5.1万m3,与数值模拟方法预测结果相比,误差在8%左右,该潜力区域开发可行。2018年9月,该井实施后初期日产油65 m3/d,初期含水率55%,在综合含水率96%的明上段797砂体上成功实施一口高产调整井。

表3 调整井A 50H2静动态参数选取Table 3 The selected Static and dynamic parameters of adjustment well A 50H2

5 结 论

(1)利用BP神经网络的数据挖掘方法,克服常规方法中参数设置较多、多因素数据分析量大、应用局限性大等缺点,提出了基于数据挖掘方法的多因素影响下底水油藏水平井开发预测新方法。

(2)从机理模型出发,通过数值模拟计算了该生产井的技术可采储量,并与网络模型预测结果进行对比,误差在5%以内,验证了该数据挖掘方法的可靠性。

(3)利用数据挖掘方法建立的BP神经网络预测模型,可以得到任意影响因素下的单井技术可采储量,实现了水平井开发底水油藏的影响因素和技术参数界限的定量分析,该方法可对潜力区域进行快速评价,可进一步应用于底水油藏水平井生产动态、开发界限、井位设计等方面的研究。

猜你喜欢

底水油藏数据挖掘
改进支持向量机在特征数据挖掘中的智能应用
底水厚度影响下的水平井开发规律研究
块状底水油藏开发后期剩余油分布研究
页岩油藏提高采收率技术及展望
复杂断块油藏三维地质模型的多级定量评价
镇北油田某油藏延长低含水采油期技术研究
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
无夹层底水油藏注水开发图版建立与应用
曙古潜山空气驱试验研究