二分类logistic回归建立油井热洗效果预测模型
2015-10-31卢丽,夏彪
卢 丽,夏 彪
(1.中国石化华北分公司,陕西 咸阳 712000;2.中国石化华北分公司第四采油厂,陕西 宜君 727200)
二分类logistic回归建立油井热洗效果预测模型
卢 丽1,夏 彪2
(1.中国石化华北分公司,陕西 咸阳 712000;2.中国石化华北分公司第四采油厂,陕西 宜君 727200)
热洗作为最简单、经济、有效的清蜡、解堵工艺,在我国各油田普遍采用,热洗效果和多因素有关:油井的产液量、动液面、泵挂深度、含水率、地质因素等等,如何对热洗效果进行预测,目前还没有学者在这方面进行理论研究,为此提出引用二分类logistic回归法建立油井热洗预测模型的思路,利用模型进行油井热洗效果的预测,将应用于医学的预测方法引入油田开采工艺中。在鄂尔多斯三叠系长8层的典型低渗稠油M油藏,利用油田已知的热洗数据推导出该油田的预测模型,对该油藏油井热洗效果进行预测,发现该理论能有效指导现场作业。
低渗透 稠油油藏 热洗 二分类logistic回归
现实中很多现象可以划分为两种可能,或者归结为两种状态,这两种状态分别用0和1表示。如果我们采用多个因素对0-1表示的某种现象进行因果关系解释,就可应用logistic回归。Logistic回归分为二值logistic回归和多值logistic回归两类[1]。
logistic回归几乎成了流行病学和医学中最常用的分析方法[2],用来预测在不同的自变量情况下,发生某病或某种情况的概率。本文将该方法运用到油田热洗工艺中,与流行病学预测类似,热洗效果也是模糊概念,涉及到很多方面,如恢复周期、原油损失、载荷变化、电流变化、动液面变化等,将热洗效果发生的结果划分为两种可能,效果好和效果不好,分别用0和1表示,探讨不同因素作用下,热洗后效果不好的可能性。
1 logistic回归模型结构
设X1,X2,…,Xk为一组自变量,Y为应变量。当Y是阳性反应时,记为Y=1;当Y是阴性反应时,记为Y=0。用P表示发生阳性反应的概率;用Q表示发生阴性反应的概率,显然P+Q=1。
Logistic回归模型为:
logit(P)=β0+β1x1+…+βmxm
(1)
(2)
同时可以写成:
(3)
式中β0是常数项;βj(j=1,2,…,k)是与研究因素Xj有关的参数,称为偏回归系数。
事件发生的概率P与βx之间呈曲线关系,当βx在(-∞,∞)之间变化时,P或Q在(0,1)之间变化。
若有n例观察对象,第i名观察对象在自变量Xi1,Xi2,…,Xik作用下的应变量为Yi,阳性反应记为Yi=1,否则Yi=0。相应地用Pi表示其发生阳性反应的概率;用Qi表示其发生阴性反应的概率,仍然有Pi+Qi=1。Pi和Qi的计算如下:
(4)
(5)
这样,第i个观察对象的发病概率比数(odds)为Pi/Qi,第l个观察对象的发病概率比数为Pi/Qi,而这两个观察对象的发病概率比数之比值便称为比数比OR(Odds Ratio)。对比数比取自然对数得到关系式:
(6)
等式左边是比数比的自然对数,等式右边的(Xij-Xlj)(j=1,2,…,k)是同一因素Xi的不同暴露水平Xij与Xlj之差。βj的意义是在其它自变量固定不变的情况下,自变量Xj的暴露水平每改变一个测量单位时所引起的比数比的自然对数改变量。或者说,在其他自变量固定不变的情况下,当自变量Xj的水平每增加一个测量单位时所引起的比数比为增加前的eβj倍。同多元线性回归一样,在比较暴露因素对反应变量相对贡献的大小时,由于各自变量的取值单位不同,也不能用偏回归系数的大小作比较,而用标准化偏回归系数来做比较。标准化偏回归系数值的大小,直接反映其相应的暴露因素对应变量的相对贡献的大小。
对于热洗作业来说,设Xk作为一组自变量,可以为热洗井含水率、产液量、动液面、沉没度等等,Y为应变量则为热洗效果。
2 方法介绍
M油田是我国低孔、超低渗裂缝性油藏,工区含蜡量高、油稠,目前主要靠油套环空注高温地层污水的热洗工艺进行清蜡解堵、改善原油流动性。投产以来,工区各井热洗情况统计见表1。
这样支撑背后的压力和心酸,我也有过切身体会。他坦言,也有撑不住的时候。2014到2015年间,因为太过忙碌,他一度感觉到崩溃。“有段时间我喝什么酒都没味道,喝什么酒都不开心,再好的酒也觉得提不起来兴奋点,身边的人能明显感受到。那段时间该做的工作还是在做,该进行的课也还在讲。很多东西比较得心应手了,不会做得太差,但当时状态是不好的。明显感觉到自己学习状态不够好,精神不够集中,喝酒也有点食肉不知其味那种感觉。”幸好,他都撑过来了。不对!可以说,你发现所有厉害的牛人,在赢得掌声之后,永远都还觉得自己不够努力。他们把这归结为不够上进,其实是谦逊使然。
表1 工区热洗情况统计
续表
日期油井产液量/m3油井含水率,%原油损失/t恢复周期/d沉没度/m热洗前动液面/m热洗后动液面/m2013-08-161041.262392106110082013-11-147.0287.69848110511162014-03-255.81121.922464108911352013-05-049.181510.767192842532013-04-239.7210211361743622013-09-0711.4716.4139613493382013-07-250.271301610134110392013-09-040.68500.72567525997442014-03-0918.7713.8258472232252014-03-118.374036863153152014-03-218.248086043973572014-04-0119.9874.583750339353
首先,进行变量定义:X1,表示油井产液量;X2表示含水率;X3表示沉没度;Y=1表示热洗效果不好(定义为热洗后产油量损失大于单次修井作业费用:热洗恢复周期大于5 d或热洗原油损失大于5 t),其余情况为Y=0表示热洗效果好(表2、表3)。
表2 案例处理汇总
表3 因变量编码
表4 初始方程中的变量
表5 方程中的变量
Score检验是一种初始检验,在建模之初根据变量之间的结构关系判断自变量与因变量之间的密切程度。Score检验值的计算公式为
(7)
从以上自变量可以看出,与热洗效果相关性最大的为油井产液量,其次为沉没度,相关性最差的为含水率(表6)。
表6 方程中的变量
将式(2)变化为:
(8)
设Z=β0+β1X1+β2X2+…+βkXk,则式(7)转化为:
(9)
由回归方程中得到的偏回归系数,可知Z=7.422-0.313×油井产液量+0.044×油井含水率-0.006*沉没度,因此(9)式为:
Py=1=
(1+e0.313×油井产液量-0.044×油井含水率+0.006×沉没度-7.422)-1
(10)
式(10),就是热洗效果不好发生概率的最终预测公式,利用油井的基础数据,就能对热洗效果进行预测。利用式(10),根据油井的生产数据对热洗效果进行拟合。
表7 分类表a
3 实例计算
该区块7口井的基础数据及热洗效果预测见表8。
表8 热洗前各井数据及热洗效果预测
分别对这两口井按常规的热洗程序进行作业,热洗后检测动态生产数据(表9)。
表9 热洗后生产数据统计
由表9可见,Logistic回归的模型能准确预测现场热洗效果。同样的,用该模型还能对热洗产油量损失和其它变量进行预测。
4 结论
(1)二分类logistic回归法预测油井热洗效果,该方法操作简单,在实际发生的热洗资料上进行回归的模型具有可靠性,实例验证能指导现场作业。
(2)因变量可根据油田自身情况而定,本文只是介绍方法,热洗效果不好定义为恢复周期大于5d或热洗原油损失大于5 t,该标准适用M油田,仅供参考,其他油田可根据需要作调整。
[1] 陈彦光.研究生地理数学方法[M].北京:科学出版社,2010:100-103
[2] 陶长琪.计量经济学[M].大连:东北财经大学出版社,2011:212-216
(编辑 吴一华)
Thermal well washing effect forecasting by usingtwo-category logistic regression
Lu Li1,Xia Biao2
(1.NorthChinaCompany,SINOPEC,Xianyang712000,China;2.TheForthOilProductionPlantofNorthChinaCompany,SINOPEC,Yijun727200,China)
As the most simple,economic and effective wax,plugging removal technology,the thermal washing used in various fields of our country.The hot washing effect is related to many factors such as: liquid production,oil well dynamic liquid level,the pump setting depth,water content,the geological factors and so on.How to forecast the heat cleaning effect?There is no theoretical research at present.This paper puts forward the thought of using two-category logistic regression to establish the prediction model of thermal well washing,i.e.the traditional forecasting methods applied in the medicine is used into the oil extraction process.M reservoir is a typical heavy,low permeability oilfield of Chang 8 layer of Erdos Triassic.The reservoir prediction model was derived by using the known thermal washing data of the field.Through the thermal washing effect forecast of the reservoir,it is found that the theory can effectively guide the field work.
low permeability;heavy oil reservoir;thermal washing;two-category logistic regression
TE357
A
10.16181/j.cnki.fzyqc.2015.01.020
2014-08-14;改回日期2014-12-20。
收稿日期:卢丽(1986—)女,硕士,现从事油气田开发研究工作。电话:13540413620,E-mail:yaya61226@126.com。
十二五国家重大专项:水驱过程岩石渗流物理特征动态变化实验研究(2011ZX05010-002)