基于知识驱动数据挖掘技术在复杂储层评价中的应用
2022-09-21郭素杰李景卫于伟高吕江萍姜维寨戴广阔胡琳
郭素杰 李景卫 于伟高 吕江萍 姜维寨 戴广阔 胡琳
1.中国石油渤海钻探工程有限公司第二录井分公司;2.中国石油渤海钻探工程有限公司井下作业分公司;3.中国石油天然气股份有限公司华北油田分公司勘探部
油气层评价是油气勘探领域中具有挑战性的学科之一,目前的评价手段主要是基于录井以及测井资料,其中录井发展了气测、热解、定量荧光等数十项技术,检测不同的井筒信息[1],测井则基于声学、电学等基础理论形成了多项技术,两大领域均对各单项技术开展了较为深入的研究,能对大部分的储层流体性质做出合理的解释,但均对复杂油气层的识别效果较差[2]。将能够充分应用数据信息的数据挖掘技术应用于油气层评价成为必然趋势。
数据挖掘技术能从海量的数据中提取出有效信息,广泛应用于商业、金融等领域,近年来逐渐引入石油勘探开发领域,如张鹏等[3]应用BP神经网络法预测碳酸盐岩储层的应力敏感程度,解决了深层碳酸盐岩储层由于取心困难导致无法支撑实验的难题;陶彬等[4]引入大数据思想寻找深层无实验样品预测井壁稳定主控因素,为深层油气开发过程中控制井壁稳定提供了一种方法;黄知娟等[5]将大数据用于分析单井试采产液量骤降的原因;王茜等[6]形成了基于钻井模型与人工智能相耦合的实时智能钻井监测技术;檀朝东等[7]基于强化学习建立了煤层气井螺杆泵排采参数智能决策技术。具体到储层评价领域,许长福等[8]、朱丽萍等[9]分别开展了基于数据驱动和模型驱动的低阻油层识别方法;张鑫[10]基于测井技术将数据挖掘应用于储层评价。但常规意义的数据挖掘方法仅从数据本身的角度完成挖掘,因此,该技术在常规油气层评价领域预测效果较好,而在复杂储层的评价中缺乏指导意义,且数据未加筛选,较多的无效参数在增加了数据计算量的同时还可能会导致计算精度的下降。针对该问题,笔者在前期研究成果及数据描述的基础上进行参数优选之后,再针对研究区内的生物降解油、重稠油、多油源油气藏,应用因子分析、多元判别、灰色关联等多种技术,构建基于知识驱动的多参数量化模型进行油气层评价,从而最大程度减少数据冗余并保证模型的稳定性。
1 数据挖掘技术原理
随着海量井筒数据的不断涌现,蕴涵在其中的油气规律并未完全被发现,仅录井轻烃分析就能检测C1~C9共103个单体烃的组分含量,再加上各项派生参数则数不胜数。目前的油气水层解释一般都是靠专家经验分析特征参数,大量表征地质信息的数据或相互关系并没有被充分利用,而数据挖掘技术的发展使该项难题可能得到解决。
数据挖掘技术能够从大量的数据中,提取具有潜在价值的信息。而基于知识驱动的数据挖掘技术在常规的数据驱动的基础上引入前期研究的规律,在减少数据冗余的同时能够使模型的效果更突出。
应用基于知识驱动的数据挖掘技术评价油气层首先要对各类特殊油气藏的录井参数响应特点进行分析,例如,生物降解油表现为高气测全烃值、高甲烷相对百分含量、高实物显示级别的三高特征[11];重稠油的评价需要引入原油密度的评价参数[12];而多油源油层由于每种油源特征的参数不一致,模型中需要纳入反映油源的参数[13]。笔者在研究区应用因子分析评价生物降解油、针对重稠油应用判别分析的方法进行多参数综合评价、应用灰色关联分析评价多油源油层取得了较好的应用效果。
1.1 因子分析
因子分析的基本思想是降维,用较少的新指标尽可能多地反映原参数的信息[14],若样品的2个指标x1与x2有一定的相关性,就可以将其拟合成1个指标F代表原来2个指标的信息,从而达到降维的目的,在实际工作中往往用二维坐标来代表原来更多的参数信息。
1.2 判别分析
判别分析是一种用于判别和分类的多元统计方法[15]。将多维参数投影到一维,以达到降维的目的,以类间距离最大而类内距离最小原则建立判别函数,应用已知结果的大量数据确定判别函数各变量的系数,将待解释层数据代入到判别函数判定待解释层的归属。本文用两个函数代替原来的多个参数的信息构建图版投点用于油气层评价。
1.3 灰色关联分析
灰色关联分析可根据曲线的几何形状的相似度确定两个参数的联系是否紧密,曲线形态相似,则关联度大,反之则小[16]。这种方法的优点是对样本量多寡和数据分布规律没有要求,用于研究“小样本,贫信息”的不确定性问题。在油气层评价中主要用于求取参数权重。
2 应用实例
冀中坳陷饶阳凹陷勘探面积达5 280 km2,共包括16个抬升幅度较大的正向构造和10个沉降幅度明显的沉积洼槽。区内分布有生物降解油、重稠油、多油源油气藏等多种复杂油气藏,复杂的构造背景和油气藏类型造成录井参数响应特征差异大,增加了油气层评价难度。
2.1 因子分析评价生物降解油层
生物降解油层主要分布在南马庄构造带浅层,由于地质构造的特征,油气层埋藏较浅,受多次运移、生物降解、氧化等作用的破坏,导致地层油气原有物理性质发生改变,原油当中轻质烃类及正构烷烃的含量减少,不可分辨物增多,油质变差,密度、黏度增大,形成了特殊类型的油气藏。在录井资料上表现为“三高一无”的特征。“三高”指:高气测全烃、高甲烷相对含量、高实物显示级别,“一无”指热解气相色谱无烷烃峰。由于录井资料表现储层流体性质的差异,造成该特殊类型油气层解释评价难度增大。
2.1.1 数据分析
以南马庄构造带已试油的沙一段46个层的资料为基础进行分析。依据前人研究成果选择了6个指标对生物降解油层进行综合评价[17],分别为全烃值Tg(钻井过程中的岩石破碎气、扩散气、压差气和溶解气,成分为C1~C5的烃类组分)、甲烷含量C1(气测甲烷相对百分含量)、产烃潜量Pg(90~600℃区间的总烃含量)、定量荧光相当油含量N(单位样品中荧光物质折算的含油浓度,反映被测样品中的含油气丰度)、孔隙度 φ(核磁共振或测井数据,孔隙度决定地层中流体的多少)、渗透率k(核磁共振或测井数据,反映地层孔隙的可流通性)。
应用SPSS进行因子分析,特征根大于1的因子有2个,共贡献原有6个参数的75.124%(表1)。因子表达式为
表1 因子分析结果Table 1 Factor analysis results
式中,下标z表示标准化后的数据。
2.1.2 图版建立
以F1、F2为横、纵坐标,将该区46个试油层的数据计算结果进行投点,建立该区因子分析解释图版,可以看出不同类型储层分区明显(见图1)。
2.1.3 新井应用
X6-26X井是南马庄构造带的一口评价井,8号层 (1 295~1 298 m)岩性为油迹细砂岩,气测全烃值为10.01%,C1相对含量95.63%,C2相对含量1.42%,有效孔隙度为 21.1%,渗透率为 114.49×10−3μm2,产烃潜量为12.83 mg/g,依据常规解释标准,一般解释油层,但是气相色谱谱图(图2)以不可分辨物为主,无烷烃峰,资料反映为典型的“三高一无”,为生物降解油特征,在图版上位于油水同层区(图1),经试油证实日产油 5.31 m3/d,日产水 1.64 m3/d,与图版解释一致。
图2 X6-26X井气相色谱图Fig.2 Gas chromatogram for Well X6-26X
2.2 判别分析评价重稠油层
重稠油因实物显示级别一般为油迹或油斑以上导致偏高解释,而试油往往产水。饶阳凹陷以中质原油为主,但马西地区油质偏重,多在0.9 g/cm3以上,单一参数正确认识地层流体关系困难。通过判别分析实现了多角度对油气层的有效评价[18],在马西洼槽共应用14口井,解释符合率77.8%。
2.2.1 数据分析
在马西洼槽收集了经试油验证的32口井的60 个重稠油层气测 (全烃Tg、C1、C2、C3、iC4、nC4、iC5、nC5)、热解 (S0、S1、S2、TPI)、定量荧光 (相当油含量N、油性指数M)及测井参数(声波时差Δt、孔隙度 φ、泥质含量C、渗透率k)共计20个参数,这些参数分别反映地层含油性、物性及原油性质。
通过前期研究挖掘出较为敏感的参数包括Tg、C1、S2、 φ、k,应用SPSS软件对60个试油层数据进行判别分析,形成了4个判别函数(表2),其中前2个函数的贡献率达到了90.1%,因此应用前2个非标准化判别函数建立解释模型。
表2 典型判别式函数系数及特征值Table 2 Function coefficients and eigenvalues for typical discriminants
2.2.2 图版建立
将60个试油层的参数 (Tg、C1、S2、 φ、k)分别代入到F1和F2,得到了区域多参数重稠油解释图版 (图3)。
图3 马西洼槽函数判别解释图版Fig.3 Functional discriminant chart for the Maxi sag
2.2.3 新井应用
J40x 井 24 号层 2 313~2 318 m,岩屑录井为油迹细砂岩,井壁取心为油浸细砂岩1颗,气测全烃10.91%,产烃潜量Pg为 16.92 mg/g,表现为油层特征,但是总产率指数TPI仅0.504,重稠油特征明显,判别分析图版投点落在油层区。采用射流泵对该段试油,日产油为 33.99 t/d,水 12.57 m3,与解释结论相符。
2.3 灰色关联分析评价多油源油藏
饶阳凹陷杨武寨构造带有3套生油层系,分别为沙四+孔店组、沙三段、沙一下段,其中以沙三段暗色泥岩、沙一下段特殊岩性为主。由于生油母质类型和埋深的差异,生成的原油物理性质差别较大,本区发育的断层,对原油的运移提供了主要通道,因此,纵向上含油段长且不同类型原油交叉成藏,甚至存在混源油藏,导致流体性质评价困难。且该区由于有3种油源,每种油源数据有限难以单独建模,因此采用了对样本量要求不大的灰色关联分析方法进行综合建立模型,分别求取含油气丰度指数和物性指数,再引入能够反映油源的Ph/C18,构建三维立体解释图版。
2.3.1 数据分析
选用的评价模型为
式中,Q为油气丰度指数;W为物性指数;xiz、yiz为标准化后的评价参数;ai、bi为评价参数的权系数,采用灰色联分析方法求取;n为评价参数的数量。
根据前期研究成果,在油气丰度方面气测全烃、相当油含量、产烃潜量3项较为敏感,而在物性评价中声波时差、孔隙度、渗透率(测井)3项资料最为有效。因此以该区29口井92个试油层为数据源计算得到了各参数的权系数,物性指数与油气丰度指数计算公式为
2.3.2 图版建立
以92个试油层为数据源,以含油气丰度指数为X坐标,以物性指数为Y坐标,以反映油源的Ph/C18为Z坐标,构建杨武寨构造带灰色关联分析三维解释图版见图4。
2.3.3 新井应用
Q164x 井 2 号层 2 489~2 495 m,岩性为荧光细砂岩,气测全烃为3.14%,井壁取心2颗,为油斑细砂岩,Pg值为16.98 mg/g。从气相色谱图看为沙一沙三混源油源(图5),Ph/C18为1.21,也表现为混源,三维图版上位于油层区域。经抽汲试油证实该段日产油45.74 m3/d,与图版解释结论一致。
图5 Q164x井气相色谱图Fig.5 Gas chromatogram for Well Q164x
3 结论
(1)通过引入基于知识驱动的数据挖掘技术,将数学理论与专家经验相结合,综合录井、测井、试油等多项资料,组合形成优势参数,用较少的参数分别从储层含油气丰度、物性以及组分特征等多个角度评价油气层,解决了复杂油气藏储层流体性质评价难点。
(2)数据挖掘技术在油气层评价中的成功探索展示了其广阔的应用范围,随着油田信息化进程的推进,数据标准化程度的提升,该技术将能够在工程安全、井位部署等领域发挥更为重要的作用。