APP下载

KS油田高含水后期调剖堵水选井

2022-02-16王桂芳王硕亮许学健雷燕康波

新疆石油地质 2022年1期
关键词:水井聚类油田

王桂芳,王硕亮,许学健,雷燕,康波

(1.中国石油 吐哈油田分公司 勘探开发研究院,新疆 哈密 839009;2.中国地质大学 能源学院,北京 100083)

KS 油田位于哈萨克斯坦南图尔盖盆地Aryskum坳陷Ashisai 凸起,构造顶部发育小断层,油藏内部断裂不发育[1-4]。主要目的层为白垩系和上侏罗统,发现MⅠ、MⅡ、JⅠ、JⅡ、JⅢ和JⅣ共6套含油层系。储集层物性较好,为中—高孔、中—高渗储集层,其中白垩系储集层平均孔隙度为28.7%,平均渗透率为2 288 mD;侏罗系储集层平均孔隙度为23.8%,平均渗透率为625 mD。油藏原油性质较好,具有低密度和低黏度的特点。该油田已进入开发后期,含水率高达98.2%[5-8],采出程度达90.9%,多数采油井处于高含水率、低产油量的状态。KS 油田储集层砂岩强亲水,在均质砂岩中水驱效率很高,注入高效驱油剂后采收率提高幅度有限;在非均质砂岩中,注入水易沿高渗层窜流,波及体积小[9]。因此,亟需开展注水井调剖,但该油田调剖堵水经验欠缺,调剖堵水选井决策时的具体界限难以界定。

调剖堵水常用的选井选层方法有PI 决策[10-13]和RE 决策,对于中—高渗储集层,PI决策中的压力指数决策方法虽然不能保证调剖效果,但能够指导调剖措施的实施,因为压力指数能反映中—高渗储集层的渗透率,高渗通道可使渗透率增大,储集层非均质性增强[14-17],但是仅通过注水井井口压降测试数据来判断注水井是否应该调剖,没有考虑采油井的生产状况,不能充分体现油藏的整体开发规律。RE 决策的指标选取较PI 决策更加全面,但是各指标的界限和权重难以确定,不同类型油藏的不同开发阶段对调剖选井决策的指标界限和权重影响较大,人为干扰因素过多。

本文提出调剖选井模糊聚类方法,根据KS 油田地质特征和生产特征,构建基于多项式核函数、径向基核函数和Sigmoid 核函数[18]的新型核函数,提高调剖选井的样本集识别率和检测集识别率。将该方法应用于KS 油田,筛选出3 口注水井调剖,都取得较好的降水增油效果。

1 调剖选井模糊聚类方法

首先,更新划分矩阵U=[μij]:

更新聚类中心:

根据所选择的指标体系与最终结果的逻辑关系,确定聚类类别的物理意义和对应措施。

从计算过程可以看出,模糊聚类分析是一个爬坡过程,以类间距离最大和类内距离最小为准则,不断进行迭代计算,直至得到最优解。因此,此计算过程对距离的表达式要求很高,不同的指标集合、不同的数据形式,所对应的最优距离表达式不同,目前常用5种距离表达式(表1)。

表1 模糊聚类类间最优距离计算方法Table 1.Calculation methods of the optimal distance between fuzzy clusters

在聚类分析过程中,利用不同的距离表达式,识别出来的各类模式结果也不相同,这主要取决于目标数据体的分布形式。例如,欧氏距离(欧几里德距离)可以识别出圆形的数据形式,如果研究目标是圆形的分布模式,利用欧氏距离可较准确识别;若研究目标是矩形或三角形的分布模式,则误差较大。

以KS 油田的实际数据为基础,分别利用欧氏距离和曼哈坦距离公式进行模糊聚类计算。利用欧氏距离识别出的3 个类中心坐标分别为(1.065,0.006),(2.998,0.041),(4.940,0.018);利用曼哈坦距离识别出的3个类中心坐标分别为(1.056,0.017),(3.102,-0.029),(4.911,0.001)。采用不同表达式计算的距离具有差异,因此明确数据的分布规律十分必要。在调剖选井决策中,如果没有明确研究目标的数据分布模式,在距离表达式的选取上,必然存在一定的盲目性。直接用某一种距离计算方法对油水井进行分类,容易产生较大的误差。

考虑到核函数具有将空间非线性样本映射到高维空间呈线性分布的特征,将核函数引入模糊聚类计算,以解决油田动态数据分布特征不稳定的问题。常用的核函数有多项式核函数、径向基核函数和Sigmoid核函数(表2)。

表2 常用核函数的表达式和特征Table 2.Expressions and characteristics of commonly used kernel functions

由于以上核函数均存在一定不足,本文将以上3种核函数进行多元线性组合,构建了一种新型核函数。新型核函数中存在n1、n2和n3共3个待定系数,代表3种核函数对新型核函数的影响程度,可通过模糊聚类学习样本进行机器学习和训练时确定具体数值。构建的新型核函数为:

由于KS 油田调剖样品数量较少,选用与KS 油田相邻的KN 油田的调剖堵水数据,作为学习和检测的样本。KN 油田累计实施调剖堵水达100 余井次,将调剖后增油量超过300 t 的单井作为急需调剖的学习样本;将调剖后见效但增油量小于300 t 的单井作为密切观察的学习样本;将无需调剖的单井作为正常生产的学习样本,分别采用多项式核函数、径向基核函数、Sigmoid 核函数和本文构建的新型核函数进行学习和验证。由计算结果可知,新型核函数的样本集识别率和检测集识别率比其他几种核函数更高(表3),说明新型核函数对于调剖堵水选井决策指标体系的数据具有较好的学习和预测能力。因此,选用新型核函数对KS油田的基础数据进行空间转换。

表3 各类核函数样本识别结果Table 3.Recognition results of various kernel function samples

2 KS油田调剖选井模糊聚类方法应用

根据KS 油田的生产特点,确定了注水井调剖模糊聚类方法的指标体系选取原则:①数据多,模糊聚类方法对具有一定规模和分布规律的数据有较好的识别效果;②时间长,能够反映长期高强度注水开发后储集层孔隙结构的变化;③成本低,要求决策过程费用低、周期短、不影响生产;④时效性好,要求指标体系能够较准确反映目前实际生产状况和变化趋势;⑤独立性强,指标体系之间不能存在共轭性。根据以上原则,最终确定了4 个静态指标(有效厚度、渗透率、渗透率突进系数、渗透率变异系数)、4个注水井指标(日注水量、注水油压、视吸水指数、单位厚度累计注水量)、4 个采油井指标(日产液量变化率、含水率、视产液指数变化率、单位厚度累计产液量)和2 个井间指标(油水井关联性、关联性变化率)。该指标体系的数值越大,越需要调剖,因此,类中心数值最大的一类对应的选井决策结果是急需调剖[19-20],类中心数值最小的一类对应的选井决策结果是正常生产。

本文提出的基于新型核函数的调剖选井模糊聚类方法主要包括4 个步骤,分别是数据标准化、数据特征降维、聚类计算和归类分析。

(1)数据标准化 为了使影响资料质量的各种系统误差降到最低,需要对数据进行标准化处理。假设由原始数据构成的矩阵经标准化后形成矩阵Sj为第j个变量的标准差。相关公式如下:

(2)数据特征降维 由于单井描述特征较多,数据可读性差,特征多重共线性严重,算法的搜索难度大,计算成本高,需要将数据进行特征降维,将高维模型投影到低维模型上。假设Rn为某个数据集,可得一组有序的正交基向量,对任意X∈Rn,降维之后的向量可表示为:

(3)聚类计算 基于新型核函数的模糊聚类算法,可以根据实际情况,产生最合适的类的数目,半径和最小密度阈值均为全局参数。

(4)归类分析 基于新型核函数的模糊聚类算法可以根据实际情况产生最佳分类数,可以通过调试最小密度阈值得到规定分类数。

对KS 油田22 口注水井进行模糊聚类计算,结果表明,急需调剖的井有3 口,密切观察和正常生产的井分别为13口和6口(表4)。

表4 KS油田注水井调剖选井结果Table 4.Results of water injection well selection for profile control in KS oilfield

对这3 口注水井实施调剖,均取得了较好的降水增油效果(表5)。从采油井2717 井的生产曲线可以看出,注水井2716井调剖后,对应采油井2717井含水率明显下降,产油量显著上升,表明注水井调剖选井工作较为成功(图1)。

表5 KS油田典型注水井调剖效果统计Table 5.Statistics of profile control effects for typical water injection wells in KS oilfield

3 结论

(1)针对KS油田的地质和生产特点,对传统的调剖注水井选井决策方法进行了改进,采用多元线性组合的方式构建了一种新型核函数,建立了新型的模糊聚类算法,选择需要调剖的井,能够达到较高的拟合精度和预测精度。

(2)新型注水井调剖选井决策方法应用于KS油田,从22口注水井中优选出3口进行调剖,取得了较好的增油降水效果。

符 号 注 释

A——协方差矩阵;

b——聚类中心迭代次数;

c,v——Sigmoid核函数参数;

d——距离,m;

g——加权指数;

h——样本数最大值;

i,j——元素序号;

k——样品指标数;

K(xi,xj)——核函数;

m,n——i,j的最大值;

n1、n2、n3——待定系数;

p——样品指标数最大值;

q——阶数;

Rn——数据集;

Sj——第j个变量的标准差;

U——矩阵;

vi——行聚类中心;

vk——列聚类中心;

Vb——第b个聚类中心;

Vb+1——第b+1个聚类中心;

x′——标准化矩阵;

xi——第i行数据;

xik——第i行第k列数据;

xij——第i行第j列数据;

——标准化矩阵第i行第j列数据;

xj——第j列数据;

xjk——第j行第k列数据;

X——降维后向量;

yn——降维前第n个向量;

ε——模糊聚类精度要求;

μij——模糊聚类划分矩阵;

σ——函数宽度参数;

φi——第i个正交基向量;

φn——第n个正交基向量。

猜你喜欢

水井聚类油田
一种傅里叶域海量数据高速谱聚类方法
山西发现一口2000余年前的大型木构水井
一种改进K-means聚类的近邻传播最大最小距离算法
水井的自述
油田工人
凡水井处皆听单田芳
一滴油的后面
改进K均值聚类算法
中小型油田修井机效率提升改造及应用
乌龟与水井