靖西地区马家沟组高阻水层影响因素分析与识别方法
2022-07-28黎瑶张占松张超谟周雪晴
黎瑶, 张占松*, 张超谟, 周雪晴
(1.长江大学地球物理与石油资源学院, 武汉 430100; 2.油气资源与勘探技术教育部重点实验室(长江大学), 武汉 430100)
随着鄂尔多斯盆地下古生界勘探开发的不断深入,诸如高阻出水等常规测井解释手段难以解决的问题不断出现[1],准确识别高阻水层成为勘探开采的关键环节。靖西地区54口井试气资料显示水层共65层,其中40层存在高阻出水现象,占比高达61.5%。水层高阻现象给现场测井解释工作带来误导,解释符合率远远不能满足生产要求。
文献[2-6]针对印度尼西亚纳土纳盆地、塔中4油田、长庆油田、尼日尔三角洲油田等的高阻水层现象给出了合理解释,提出了包括储层致密、沥青、黏土矿物、地层水低矿化度以及储层所处构造等可能因素。吴应忠等[2]在分析长81储层岩性后,发现储层含有大量粉末状填隙物,填隙物堵塞了孔隙喉道,连通孔隙被孤立,使得储层电阻率增加。张志升等[3]在总结了华庆地区延长组储层发育特点后,认为延长组高阻水层储层亲油,发育的绿泥石膜及沥青填充了孔隙,导致当油气富集程度低时储层会表现出高阻水层现象。Mode等[4]在研究尼日尔三角洲区块E3油藏时发现发育的砂页岩薄互层增大了储层电阻率测量值,在没有高分辨率测井手段的情况下采用Thomas-Stieber模型来校正油气对测井的响应能够有效提高对储层的评价准确度。综上所述,高阻水层成因复杂多样,不同地质背景条件下高阻水层的主控因素也具有差异。目前,针对高阻水层问题比较流行的流体判别方法主要分为传统交会图版法[7]、剥层法、数理统计法[8]和机器学习类方法[9-10]。其中图版法等传统方法简单高效,但是当储层非均质性强,引起测井响应特征非线性变化时,传统方法很难区分出不同流体性质的差异。高阻水层成因多元化以成趋势,传统解释方法已经开始满足不了实际生产需求。随着机器学习方法的不断发展,具有不易过拟合、预测精度高、容错率高等优点的随机森林(random forests, RF)算法成为生产与研究工作中的热点领域,越来越多的行业引进了这一算法[11]。随机森林是一种基于多决策树进行回归预测和分类预测的算法。随机森林通过随机重复采样技术和节点随机分裂技术组建多棵决策树[12],汇总大量决策树的预测结果并将其作为一个整体输出。相较于支持向量机、K邻近、神经网络等方法,随机森林模型泛化能力更强、预测精度更高,对异常值也有很好的容忍性,在油气预测方向也取得了较好的效果:秦敏等[13]在研究东方X油田的高温、高压储层流体时对比了不同机器学习算法的优劣,结果显示随机森林算法识别高温高压环境下的流体效果更好。冯明刚等[14]为解决页岩气总有机碳含量预测难的问题,提出了基于随机森林回归算法的预测方法,发现预测结果较其他方法更为准确合理。郭建宏等[15]分析出与煤层气含量敏感的测井参数,将斜率关联度法与随机森林算法相结合,准确预测出非夹矸段煤层气含量,为煤层气产能评价与预测提供了新方法。
结合上述内容,高阻水层的影响因素众多,包括地质条件与储层孔隙结构,这为研究提供了一定的指导方向。现根据已有的测井、薄片、扫描电镜、压汞等资料,详细分析靖西地区马家沟组气藏不同流体类型的测井响应特征,并探究储层孔隙结构和广泛发育的薄互层对水层电阻率测井响应特征的影响规律。在明确成因的基础上如何选择合理方法识别出正确流体类型成为另一难题。分析高阻水层识别的难点,引入随机森林分类算法到靖西地区高阻水层流体识别这类高维分类问题中,建立常规地球物理测井与电成像测井资料相结合的随机森林流体识别方法,并将建立模型应用于盲井以验证模型的准确性与泛化性。
1 高阻水层及其测井响应特征
高阻水层在地球物理测井资料响应上与正常水层具有明显差异,但与高含气层的响应特征具有很高的相似度,这造成了实际生产中对高阻类型的水层错判误判。详细整理分析了靖西地区马家沟组高阻水层的储层特征和地球物理测井响应特征。
1.1 高阻水层
结合生产需要与水层电阻率值分布差异,把日产水大于4 m3,日产气小于1 000 m3且电阻率高于200 Ω·m的具有一定储集能力的储层定义为高阻水层。高阻水层主要发育两类岩性,分别为海侵时期形成的致密粗粉晶-细晶白云岩与海退时期形成的致密泥晶-细粉晶白云岩。高阻水层岩性较纯,含泥较少,泥质含量分布在0.5%~4.5%,平均泥质含量1.95%。高阻水层孔隙类型多样,主要包含晶间孔、晶间溶孔等6种不同类型(图1),孔隙度主要分布在2.14%~6.09%,平均孔隙度为4.53%,正常水层孔隙度主要分布在3.69%~9.50%,平均孔隙度为5.87%。高阻水层具有一定的储集能力,但是物性较正常水层差;裂缝不发育,渗透性取决于孔隙发育情况。
图1 不同类型孔隙铸体薄片Fig.1 Casting thin sections of different types of pores
1.2 高阻水层测井响应特征
表1、表2分别为高阻水层与正常水层的地球物理测井响应特征,表3为气层的测井响应特征,可以看出,高阻水层地球物理测井曲线响应表现出“两高三低”的特征。高阻水层深侧向电阻率(214.0~834.5 Ω·m,平均值467.5 Ω·m)、测井密度(2.69~2.82 g/cm3,平均值2.74 g/cm3)均为高值,测井声波时差(151.84~181.23 μs/m,平均值164.14 μs/m)、自然伽马(7.98~24.79 API,平均值17.30 API)、中子孔隙度(1.64%~9.56%,平均值6.45%)为低值。测井响应特征可以总结如下:①从岩性来看,高阻水层整体自然伽马值分布与气层、正常水层存在差异,虽然同为碳酸盐岩储层,但是高阻水层泥质含量低,气层泥质含量相对高;②从物性[声波(AC)、密度(DEN)、中子(CNL)]来看,高阻水层物性最差,三孔隙度曲线测井响应为低孔趋势,岩性致密;③从电阻率变化特征来看,高阻水层电性响应分布广,整体电阻率值分布在中高值范围,与气层测井响应范围重合度高。
不同曲线测井响应对不同流体类型具有不同程度的区分能力,但是仅依据常规测井曲线响应差异难以实现流体类型准确划分。建立Fisher机器学习模型后发现判别正确率仅为76.6%,且未能准确识别出高阻水层。因此解决这类具有高阻水层的流体识别问题需要进一步分析高阻成因,深度挖掘流体响应的敏感信息进行识别分类。
表1 高阻水层测井响应汇总表Table 1 Summary of logging response for high-resistivity water layers
表2 水层测井响应汇总表
表3 气层测井响应汇总表
图2 不同类型水层岩心结构图Fig.2 Core structure diagrams of different types of water layers
2 高阻水层成因分析
考虑到高阻水层与正常水层测井响应特征和物性差异,重点分析了水层的孔隙结构与层内发育特征对储层电阻率变化特征的影响,确定了复杂的孔隙结构和广泛发育的薄互层是靖西地区水层高阻的主要原因。
2.1 孔隙结构特征
孔隙结构与储层发育的孔隙和吼道的几何形状、半径大小、空间分布以及孔隙之间连通情况有关[16],孔隙与喉道的配置关系也决定着孔隙流体的物理性质[17]。如图2(a)、图2(d)所示, 从宏观看来,具有高阻现象的水层与正常水层在岩心照片上呈现出明显区别,前者岩心照片上孔隙显示为肉眼不易观测的孔隙形态,孔径不一,以小孔为主。在微观上,扫描电镜图显示高阻水层[图2(b)]受后期改造作用明显,颗粒之间胶结紧密,大部分孔隙被挤压填充改造,孔隙半径主要分布在10~100 μm;CT扫描[图2(c)]发现高阻水层孔隙连通通道主要为缩颈型吼道,相比正常水层[图2(f)]孔隙弯曲程度更复杂,难以见到成规模的有效沟通路径。压汞资料更加直观地揭示了高阻水层的孔隙结构特征。压汞岩样(高阻水层6块、正常水层4块)统计数据如图3所示,其中高阻水层岩心电阻率分布在273.9~730.9 Ω·m,平均电阻率为507.2 Ω·m。统计结果表明高阻水层具有以下特征:①细喉道,高阻水层平均中值半径仅为0.19 μm,较正常水层孔喉中值半径平均值小一个数量级,平均歪度(偏态)为0.093,孔喉分布均匀,这表明高阻水层孔喉类型主要为细孔喉;②差渗流能力,较平均排驱压力为0.646 MPa的正常水层,高阻水层平均排驱压力为正常水层的2倍,流体难以流动,渗流性相对较差,孔隙通道连通性不强;③强非均质性,高阻水层平均变异系数(相对分选系数)高,为正常水层的2.7倍,表明高阻水层整体孔隙大小分布不均匀,非均质性强。
图3 不同类型水层岩心压汞参数直方图Fig.3 Histogram of core mercury injection parameters for different types of water layers
2.2 薄互层发育特征
受中央古隆起控制,靖西地区马家沟组沉积相呈环带状分布,白云岩厚度整体呈“西厚东薄”的特点。位于盆地西部的台坪相带和蒸发期的含膏云坪相储层单体厚度一般在50~250 cm,其中发育薄互层井数占比25.4%。以发育薄互层的四口井为例,由井位分布图[图(4)]可知,薄互层发育于沉积盆地环形边缘西部。地质上,盆地边缘水体较浅,受海平面快速升降的影响,盆地边缘水动力变化剧烈。随着高盐度卤水中石膏和其他盐类矿物沉淀与后期溶蚀作用易形成薄互层晶间孔型与膏溶孔型白云岩[18]。由此推测薄互层发育程度受沉积环境与后期改造作用影响。从测井响应上分析,以B12井3 741.5~3 742.5 m、3 744.3~3 745.3 m、3 747.3~3 748.8 m为例,三层合试结果日产水12.0 m3,日产气1 246.9 m3。试气层物性较好,但是深侧向电阻率值分别高达259.5、293.6、216.7 Ω·m,为典型的高阻水层。B12井储层中发育薄互层,层内各向异性强,其测井响应图(图5)倒数第二道红色为深侧向测井曲线RLLD,曲线仅显示了地层电阻率整体起伏变化情况,未能有效地反映薄层电阻变化特征。测井响应图右侧第二道主峰电阻率曲线PEAKBIN(主峰电阻率曲线,为某一深度下统计的电阻率频率分布直方图中峰值所对应的横坐标电阻率值)明显地区分出储层段与非储层段的差异:储层显示低值,非储层显示高值,大小存在明显差异。图5右侧H2井试气层为正常水层,储层厚度大,深侧向测井曲线能够真实地反映储层流体电阻率特征。鉴于双侧向纵向分辨率一般为60 cm,而电成像测井纵向分辨率为0.5 cm,这证明薄互层对不同分辨率测量仪器的测量精度具有很大影响。
图4 靖西地区薄层井井位分布图Fig.4 Distribution of thin-layer wells in Jingxi area
PHIT_AVE为孔隙度谱均值;PEAKBIN为主峰电阻率曲线;XRMI_DYN为增强型微电阻率成像测井图像图5 薄厚层测井响应图Fig.5 Logging response graph of thin and thick reservoirs
2.3 综合成因分析
靖西地区马家沟组高阻水层孔隙结构复杂,层内非均质性强。储层发育多种类型孔隙,颗粒之间胶结紧密,孔隙半径小,主要集中于10~100 μm,孔隙连通通道以缩颈型喉道为主,孔隙喉道细且连通性差,使得水层电阻率增高[19-21]。部分储层发育的薄互层使层内各向异性得到增强,影响了整个储层的电性特征。综上所述,储层孔隙结构复杂、薄互层广泛发育是致使水层地球物理测井响应表现为高阻特征的主要因素。
3 流体识别模型建立与分析
根据上述高阻水层形成原因,采用了常规地球物理测井资料与电成像测井资料相结合的思路,建立了随机森林判别模型对储层流体进行识别,识别效果良好。
3.1 曲线优选
在复杂地质条件下,单一的常规地球物理测井方法很难解决实际问题,具有高分辨率、高信息量的成像测井不仅可以弥补常规测井纵向分辨率不足的问题,而且也因为孔隙度谱与电阻率谱包含大量孔隙结构信息使得模型更能反映真实储层性质[22-24]。选取了常规地球物理测井曲线以及电成像曲线作为模型训练数据。
在建模之前为验证曲线选择的正确性,对曲线进行单参数分析。如图6所示,电成像测井中PEAKBIN曲线对判别结果具有很高的贡献,φSDEV曲线对识别结果同样贡献较大,二者单参数正确率分别可以达到44.4%与38.9%。这证明曲线的选择方向与成因分析结果保持一致。
图6 单参数流体判别正确率统计图Fig.6 Histogram of single parameter fluid identification’s accuracy
模型数据中常规曲线包括自然伽马(GR)、声波时差(AC)、密度(DEN)、补偿中子(CNL)、深浅侧向电阻率(RLLD、RLLS),电成像测井曲线分别为孔隙度谱均值φAVE、孔隙度谱方差φSDEV、主峰电阻率曲线(PEAKBIN)、分选系数(SORT)。所使用的电成像测井曲线的计算公式如下。
孔隙度谱均值φAVE计算公式为
(1)
式(1)中:φi为图像窗口中第i个像素点(即第i个电极)的视孔隙度,v/v;Pφi为对应的视孔隙度频率。孔隙度谱均值表示孔隙度谱主峰偏离基线的程度,均值越大,储层性能越好,高阻水层物性较差,孔隙度谱均值相对正常水层偏小。
孔隙度谱方差φSDEV计算公式为
(2)
孔隙度谱方差表示孔隙度谱的分布离散程度,方差越大,储层非均质性越强。高阻水层由于具有强非均质性,所以整体孔隙度谱方差小于正常水层。
主峰电阻率曲线(PEAKBIN)为某一深度下统计的井壁微电阻率频率分布直方图中峰值所对应的横坐标数值。经过归一化处理的主峰电阻率曲线为无量纲参数,曲线数值越大,储层相对电阻率越大。
电阻率谱分选系数[25-26]计算公式为
(3)
式(3)中:R70、R50、R30分别为电阻率直方图上频率分布占70%、50%以及30%所对应的频数。电阻率谱分选系数表征地层均质性强弱,分选系数越大,储层井壁微电阻率分布集中程度越高。由于高阻水层井壁电阻率分布较为集中,分选系数较正常水层小。
3.2 数据样本建立
为提高储层流体识别准确度,选取了16口井33个试气层段共10条曲线20 658个数据点作为建模训练集,4 535样本点作为测试集。为保证模型的正确性,测试集为随机抽取组成。训练数据分为气层、气水同层、含气水层、水层、高阻水层、差气层以及干层7类,每类样本数量2 098~4 135个,数据均衡,使模型对不同流体的识别能力趋近一致。
3.3 判别模型选择及参数寻优
模型所用训练数据所涉及的参数数量多、流体类型多,且不同流体类型测井响应交会图(图7)表明不同流体类型测井响应差异微弱,没有明显的线性关系。在众多机器学习算法中,随机森林算法在面对维数多、体量大、类间差异小的样本数据时表现出的准确性、鲁棒性、泛化性上优于K邻近、支持向量机、Fisher等机器学习算法。随机森林用bootstrap方法[27]生成m个训练集,然后用每个训练集构造一棵决策树,获得m个弱分类器,通过组合多个弱分类器进行投票得到结果,使得模型具有较高的精确度与泛化性能。
图7 不同类型流体的测井响应交会图Fig.7 Conventional logging crossplots of different types of fluids
图8 不同参数模型袋外误差图Fig.8 Out-of-bag error diagram of different parameter models
随机森林算法采用Python语言实现,环境为Python 3.8,随机森林分类核心算法使用了sklearn.ensemble库。由于随机森林模型性能受参数选取的影响较大,为避免人为因素对模型造成误差,故模型采用5折交叉验证网格寻优方法确定超参数。寻参结果如图8所示,当最大特征数max_feature与决策树最大深度max_depth一定时,决策树数量为150 棵时模型袋外误差已经收敛至最低值;当决策树棵树与最大深度一定时,最大特征数为4个的模型袋外误差为最低值。随着决策树最大深度的增加,袋外误差随之减小,但是不限制决策树最大深度容易造成过拟合现象,经过验证决策树最大深度设为9层比较合适。使用最优参数获得的模型对测试盲井进行识别,整体判别正确率达到了84.1%,高阻水层识别率为80.2%,这表明模型具有很好的正确率与泛化性。测试集预测结果分别如表4所示,由于验证数据有限,模型缺乏对干层、差气层、含气水层这三类流体类型判别效果的检验,后期需要加以验证。
表4 测试集判别结果
图9 D1井随机森林识别结果Fig.9 Fluid identification results of random forest model in well D1
3.4 模型验证与实例分析
图9为验证井D1井在3 016.0~3 018.0 m和3632.0~3 634.0 m的随机森林模型流体识别结果图。D1井为双层试气,日产水197.0 m3,日产气量500.0 m3,为典型高阻水层。由图9可知,71、72号层电阻率分别为421.1 Ω·m和228.9 Ω·m,常规测井解释(图9右侧第二道)结果为差气层、水层,这与试气结论不符。图9最右侧为随机森林模型给出的结果:水层、水层,模型判别结果与试气结论相符。这表明基于随机森林建立的模型具有很好的准确率和适用性。分析岩心物性资料发现该层平均孔隙度3.14%,平均渗透率0.178 mD,储层物性较好。铸体薄片[图10(a)]表明储层颗粒胶结紧密,无明显裂缝发育,主要为小孔隙且分布不均,压汞曲线[图10(b)]表现出小斜率的线性增长形态,高排驱压力1.851 MPa,高变异系数9.191,表明试气层段非均质性极强。由此表明,复杂的孔隙结构是D1井水层高电阻率的主要原因,建立的模型可以很好地识别复杂孔隙结构造成的高阻水层。
图11为E1井测井解释成果图,该井在3 681.0~3 685.0 m日产水4.2 m3,未见产气,测井响应为高阻特征。测井解释中仅利用常规测井资料难以正确解释这一水层,在借助成像资料后发现试气段发育薄互层,储层主要厚度分布在10~30 cm范围内。图11右侧第三道电成像动态图XRMI_DYN显示储层孔隙发育良好,电成像图像呈现为暗黑色条纹状,主峰电阻率曲线PEAKABIN(图11右侧图第二道红色曲线)呈现剧烈波动,反映高阻地层中发育低厚度储层。储层厚度过小导致了层间各向异性强,深侧向电阻率值未能反映真实储集空间电性特征,整体电阻率值偏高,表现出高阻水层特征。
图10 高阻水层岩心测试资料Fig.10 Core test data of high-resistivity water layers
图11 E1井测井解释成果图Fig.11 Logging interpretation results of well E1
4 结论
(1)高阻水层的成因分析对于油气藏流体精细评价工作具有十分重要的意义,不同地区的高阻水层成因是复杂多样的。通过对地球物理测井与岩心实验等资料分析认为靖西地区高阻水层的成因是由多重因素共同导致的,储层孔隙结构复杂、薄互层广泛发育是致使水层地球物理测井响应表现为高阻特征的主要因素。这种宏观与微观成因相结合的高阻水层成因分析思路为储层流体评价提供了新思路。
(2)提出的将常规地球物理测井曲线与特殊电成像测井曲线相结合建立的随机森林判别模型可以在保持高识别精度的前提下有效识别高阻水层,实现流体类型的正确判别。这证明随机森林算法在流体识别应用中的可行性与有效性,对油气评价新方法具有很好的参考价值。但仍然涉及众多关键参数的调节,相信在未来技术革新的推动下算法将不断被完善,稳定性与复杂度会得以改善。
(3)由于高阻水层的特殊性和复杂性,油气精细评价还有诸多难题需要解决。因此,对于油气评价不能仅限于常规手段,数字时代带来的新技术也可以为油气评价带来新方法新途径。