基于径向基—多层感知器神经网络联合的复杂岩相智能识别与表征
2022-10-15姜世一孙盼科贾浪波何太洪徐怀民艾贝贝张何锋饶华文
姜世一 孙盼科 张 林 贾浪波 何太洪徐怀民 艾贝贝 张何锋 饶华文 丁 遥
1.中国石油大学(北京)地球科学学院 2.“油气资源与探测”国家重点实验室·中国石油大学(北京)
3.中国石油西部钻探工程有限公司 4.中国石油长庆油田公司勘探开发研究院
5.中国石油塔里木油田公司 6.中国石油西南油气田公司燃气分公司
0 引言
鄂尔多斯盆地苏里格气田致密砂岩气藏的天然气储量规模和年产气量目前均位居全国第一,勘探面积近5×104km2[1]。截至2020年底,苏里格气田开发区内已有探明储量(含基本探明储量)约4×1012m3,其中,作为主力开发含气段之一的上古生界石盒子组盒8段(以下简称盒8段)探明储量约占总探明储量的60%,开发潜力巨大[1-5]。然而,盒8段河流相致密砂岩储层内部结构复杂、非均质性强,不同河流类型之间沉积、储层特征差异大,导致了研究区目前面临单井产能逐年降低、甜点储层优选难等关键技术难题,而解决这些问题的关键是开展储层结构(岩相及其组合)及非均质性特征的精细解剖研究。
岩相,作为特定水动力条件下的基础沉积单元,是开展储层结构研究的核心,岩相类型及其组合对致密砂岩储层非均质性特征及储层质量具有重要的控制作用。岩相的概念最早由Miall在1978年提出[6],他认为岩相是在一定沉积环境中形成的岩石或岩石组合,是沉积相的主要组成部分[6,7-11]。目前,岩相的测井识别与表征主要有两种方法:其一是常规测井识别方法,包括交会图法、构造特征参数法、曲线重叠法等[12-14],但这些方法依赖解释人员的经验和知识较多,普遍准确率较低;其二是特殊测井识别方法,包括利用地层倾角测井与成像测井对岩相进行识别[15-16],但这些方法由于费用昂贵,难以广泛应用。随着计算机科学的迅速发展,神经网络、决策树、支持向量机等人工智能算法已被应用于测井解释研究[17-21],并取得了一定的成效,但这些方法在样本数量有限、处理流程不完善和自我调节能力较差等因素制约下[22],对复杂岩相的识别精度仍有待提高。多数学者在使用人工智能算法进行测井解释时缺乏考虑地质特征、地质特征约束下的测井响应特征与算法原理之间的契合性,进而导致所使用的方法缺乏合理性论证或机理上的认识。
针对目前苏里格气田东二区北部盒8段开发中存在的关键技术难题,本文通过岩心的观察、描述,对盒8段发育的岩相类型及其组合进行识别与划分;在此基础上,通过分析盒8段不同河型储层的岩相特征及其约束下各类岩相测井响应特征,优选、建立了径向基神经网络(Radial Basis Function Neural Network,缩写为RBFNN)与多层感知器神经网络(Multi-layer Perceptron Neural Networks,缩写为MLPNN)联合岩相识别模型。该方法克服了现有岩相识别方法准确率低且难以推广的缺陷,为致密砂岩储层结构及非均质性研究奠定基础。
1 地质概况
研究区位于苏里格气田东二区北部,构造上位于伊盟隆起—伊陕斜坡过渡带[23-24](图1)。上古生界自下而上发育石炭系本溪组,二叠系太原组、山西组、下石盒子组、上石盒子组和石千峰组等地层,其中下石盒子组盒8段为该区主力产气层段之一[25-27]。盒8段沉积期,盆地北部构造活动强烈,物源供给充分,自下而上经历了由辫状河(盒8下亚段)到曲流河(盒8上亚段)的沉积演化[28-29](图1)。砂岩储层孔隙度介于4%~14%,平均孔隙度为7%,渗透率介于0.1~2 mD,平均渗透率为0.7 mD,属典型的低孔、低渗致密砂岩储层[30-33]。
图1 研究区构造位置及地层综合柱状图
2 岩相类型及其组合特征
2.1 岩相类型及特征
本次研究关于岩相的划分命名参考了Miall的方法,通过对50口取心井岩心岩性及层理的观察描述,共划分了8种岩相类型(表1),分别为块状层理砾岩相、槽状交错层理粗砂岩相、板状交错层理粗砂岩相、板状交错层理中砂岩相、平行层理中砂岩相、交错层理细砂岩相、波状层理粉砂岩相、块状层理泥岩相。
表1 苏里格气田东二区岩相类型划分表
块状层理砾岩相主要为灰白色砾岩,分选较差,磨圆较好,主要发育于辫状河/曲流河河道底部冲刷面之上、点坝/心滩坝底部;槽状/板状交错层理粗砂岩相主要为灰色粗砂岩,多发育在河道下部、点坝/心滩坝底部,发育厚度相对较小;板状交错层理中砂岩相主要为灰白色中砂岩,多发育在河道、心滩、点坝中下部,其中辫状河心滩坝微相发育厚度规模较大,曲流河点坝微相发育厚度规模相对较小。平行层理中砂岩相主要为灰白色中砂岩,多发育在曲流河及辫状河河道中部,指示强水动力沉积环境;交错层理细砂岩相主要为灰白色细砂岩,主要发育在河道、心滩、点坝上部,表示水动力减弱;波状层理粉砂岩相主要为灰黑色粉砂岩,主要发育于河道、心滩、点坝顶部,沉积环境水动力弱;块状泥岩相主要为灰黑色泥岩,主要发育于泛滥平原和河道、心滩、点坝顶部或点坝、心滩坝内部夹层。
2.2 岩相组合特征
岩相作为特定水动力条件下的基本沉积单元,其不同的组合特征使不同沉积微相呈现不同的结构非均质性(表2)。
表2 苏里格气田东二区沉积微相与岩相组合对应特征表
辫状河环境主要发育辫状河道和心滩坝2种沉积微相。其中,辫状河道一般自下而上发育块状层理砾岩相、槽状/板状交错层理粗砂岩相、平行层理中砂岩相、交错层理细砂岩相、波状层理粉砂岩相、块状层理泥岩相。河床底部受到冲刷导致沉积杂乱,中部沉积水动力较强多发育厚度较大的槽状/板状交错层理及平行层理,顶部水动力减弱发育较薄的波状层理粉砂岩相及块状层理泥岩相。心滩坝一般自下而上发育块状层理砾岩相、中大型槽状/板状交错层理粗砂岩相、中大型板状交错层理中砂岩相、交错层理细砂岩相、波状层理粉砂岩相、块状层理泥岩相。底部砾岩厚度较河道减薄,中部多发育厚度较大、层理角度较高的板状交错层理,平行层理发育较少,顶部发育薄层波状层理粉砂岩相及块状层理泥岩相。心滩坝内部偶有泥质落淤层发育,表示整体水动力较强。
曲流河环境主要发育曲流河河道和点坝2种沉积微相。其中,曲流河河道微相一般自下而上发育块状层理砾岩相、槽状/板状交错层理中粗砂岩相、小型平行层理/板状交错层理中细砂岩相、波状层理粉砂岩相、块状层理泥岩相。总体而言,曲流河河道较辫状河河道沉积粒度变细、泥质含量增加,下部由于水动力变化频繁导致各类岩相厚度相对变小且变化更为频繁,上部由于水动力条件减弱导致块状层理泥岩相厚度较辫状河增大。点坝侧向加积作用明显,一般自下而上发育块状层理砾岩相、槽状交错层理中粗砂岩相、板状交错层理中砂岩相、水平层理泥岩相、板状交错层理细砂岩相、波状层理粉砂岩相、块状层理泥岩相。底部砾岩厚度较小,中部发育层薄多期、层理角度较低的板状交错层理,顶部发育较厚层波状层理粉砂岩相及块状层理泥岩相。
2.3 岩相分布规律
为了定量表征研究区盒8段辫状河相、曲流河相储层岩相结构特征差异,本次研究参考“夹层密度”和“夹层频率”的概念引入了“岩相密度”和“岩相频率”这两个概念。“岩相密度”定义为单一岩相厚度占岩相组合厚度的比例,“岩相频率”定义为单一岩相组合内部的某一类岩相出现个数。通过统计岩心岩相密度及岩相频率(图2、3)可以发现,盒8下亚段辫状河相储层整体岩相密度偏大,除块状层理砾岩相、波状层理粉砂岩相、块状层理泥岩相外,其余岩相密度均大于25%;岩相频率偏低,除泥岩相频率略大于1.3外,其余岩相频率均小于1.3。盒8上亚段曲流河相储层整体岩相密度偏小,所有岩相密度均小于25%;岩相频率偏高,除块状层理砾岩相、板状交错层理粗砂岩相、槽状交错层理粗砂岩相外,其余岩相频率均大于1.3。由此分析可知,研究区辫状河相储层单一岩相厚度相对较大,垂向岩相变化相对不频繁,而曲流河相储层单一岩相厚度较小,垂向岩相变化频繁。
图2 苏里格气田东二区盒8段曲河相及辫状河相储层岩相密度统计图
图3 苏里格气田东二区盒8段曲河相及辫状河相储层岩相频率统计图
3 岩相约束下的测井响应特征
对于不同岩相单元而言,由于其厚度差异导致其测井响应受围岩影响程度各不相同[34]。为了分析岩相约束下的测井数据分布特征,且考虑不同测井数据的数值大小及单位差异,本文利用离差标准化法对测井数据进行了无量纲化处理[35],具体处理公式如下:
式中:x1表示归一化后测井数据;x表示原始测井数据;xmax表示测井数据最大值;xmin表示测井数据最小值。
利用处理后的测井数据,分别统计了盒8段两类河型不同岩相测井数据,结果表明盒8上亚段曲流河相储层各类岩相测井数据分布较零散,盒8下亚段辫状河相储层的各类岩相测井数据分布相对较集中。由上可知,岩相密度和岩相频率确实对不同河型不同岩相的测井数据分布具有一定影响:单一岩相厚度、岩相密度较小,岩相频率较大的曲流河相储层,各类岩相受邻近岩相影响较大,导致各类岩相测井数据分布较零散;而单一岩相厚度、岩相密度较大、岩相频率较小的辫状河相储层,各类岩相受邻近岩相影响较小,由此导致各类岩相测井数据分布相对较集中。
4 基于数据分布特征的智能化岩相识别方法
针对不同河型不同岩相测井数据特征分布的差异,本文优选了径向基神经网络(RBFNN)和多层感知器神经网络(MLPNN)进行复杂岩相的智能化识别与表征。
4.1 径向基神经网络(RBFNN)与多层感知器神经网络(MLPNN)原理
4.1.1 径向基神经网络(RBFNN)原理
径向基神经网络(RBFNN)是一种基于高斯核局部逼近的神经网络,其包括输入层、隐藏层和输出层三层结构(图4)。输入层仅起到数据信息的传递作用,而输出层通过对隐藏层神经元输出信息进行线性加权后输出整个神经网络的结果。隐藏层作为整个神经网络的核心,其可对输入矢量进行变换,将低维的模式输入数据变换到高维空间内,使得在低维空间内的线性不可分问题在高维空间内线性可分[36-37]。而作为隐藏层神经元核函数的高斯函数对于数据分布较为集中的样本具有较强的学习能力,且学习模型预测精度较高,而对于数据分布相对较零散的样本,其学习率和后期的预测准确率就会明显下降[38-42]。
图4 径向基神经网络结构示意图
4.1.2 多层感知器神经网络(MLPNN)原理
多层感知器神经网络(MLPNN)也叫人工神经网络(ANN),是一种全局逼近的由一组并行的多个感知器构成的神经网络[43],其可以为单层或多层结构(图5)。网络结构中最左侧是输入层,中间是隐藏层,最后是输出层,其中输入层神经元个数由输入数据的向量元素个数决定。MLPNN的基本思想是全局逼近,利用单层感知器解决线性可分问题,构建多层感知器将线性边界组合成非线性边界以解决非线性可分问题,具有高度的非线性全局作用。该方法面对数据分布较零散的样本,可通过非线性方法对其进行分类识别,学习速率及预测准确率较高,而对于样本数据分布较集中的情况,反而使其容易陷入局部极值导致学习速率及预测准确率下降的问题[44-46]。
图5 多层感知器神经网络结构示意图
4.2 径向基—多层感知器神经网络(RBF—MLPNN)联合模型建立
针对研究区盒8段曲流河相、辫状河相不同岩相测井数据分布特征的差异以及RBFNN、MLPNN模型面对不同分布特征数据样本的适用性,并且为了使识别模型学习效率及预测准确性达到最优,本次研究以不同的岩相密度为分界,优选、建立了径向基—多层感知器神经网络(RBF—MLPNN)联合模型(以下简称联合模型)(图6),分类分方法进行了复杂储层岩相智能化识别与表征。
图6 RBF—MLPNN模型建立流程图
4.2.1 测井参数的优选及标签的建立
复杂储层岩相智能化识别与表征的第一步就是建立训练的样品库。本次研究通过岩心岩相标定无量纲化处理的常规测井数据进行了不同岩相类型敏感测井参数优选(图7)。根据蛛网图结果表明,GR、PE、AC、CNL、DEN、LLD这六类测井曲线数据分布区间重叠范围小,且不同岩相对应同种测井数据之间差别大,因此优选这六类测井数据建立不同岩相类型智能化识别样本数据库。
图7 不同岩相测井曲线敏感性分析蜘蛛图
4.2.2 RBF-MLPNN联合模型训练及效果分析
在智能化识别样本库中,选取70%的数据作为训练数据,以不同的岩相密度作为两类岩相数据分布特征的分界,分别对联合识别模型中不同的模型进行训练,并且以剩余30%的数据检验准确率。据试验集检验结果表明,当岩相密度为25%时,联合模型识别效果最优,综合平均准确率达到89.06%(图8),对盒8上亚段曲流河相储层岩相识别平均准确率达到90.95%(表3),对盒8下亚段辫状河相储层岩相识别平均准确率达到87.16%(表3)。进一步对比联合模型与单独使用某一模型的效果可知(表3),联合模型针对各类岩相的综合识别准确率均高于单一的神经网络模型。除此之外还可以发现,RBFNN模型对岩相密度大于25%的岩相预测准确率更高,而MLPNN模型对岩相密度小于25%的岩相预测准确率更高,结合之前的分析亦可证明岩相密度等于25%作为联合模型选用不同神经网络进行岩相识别的特征判别标准是可靠的。
图8 不同岩相密度为界限下RBF—MLPNN联合模型综合准确率曲线图
表3 三种神经网络模型准确率对比表
5 与常规方法效果对比分析
为了进一步论证基于数据分布特征的智能化岩相识别方法的优势,本次研究在RBF—MLPNN联合模型识别的基础上,又分别采用了交会图法、主成分分析法和决策树法对盒8段进行了岩相识别,并对其识别效果进行了对比分析。
5.1 交会图法
本次研究利用优选参数分段建立了GR-AC交会图、DEN-LLD交会图(图9)。分析表明,GR可以很好区分泥岩岩相与砂岩岩相,但无论是盒8上亚段还是盒8下亚段,每种砂岩岩相的测井响应都具有较多的重叠部分,因此会导致岩相识别精度降低。
图9 盒8段不同岩相GR—AC、DEN—LLD交会图
5.2 主成分分析法
主成分分析法是考察多个变量间相关性的一种多元统计方法,能够提取变量信息、保留原始变量信息、减少分析维度,从而使问题更简单直观[47]。本次研究,利用之前优选出的GR、PE、AC、CNL、DEN、LLD这六类测井数据,分别对盒8上、下亚段各构建了两个主成分建立交会图(图10)。结果表明,相比于交会图法其效果明显提升,但由于每种岩相的测井响应特征过于接近,导致仍有很多的重叠部分,无法准确划分每种岩相判别界限,解释精度过低。
图10 盒8段不同岩相F1—F2主成分交会图
5.3 决策树法
决策树是机器学习最常见的算法之一,是一种树状结构的分类预测模型[48],在有标记的训练集中学习分类规则,以预测待识别目标的类型为目标[49],可总结为上而下“分而治之”[50]。根据识别结果表明(表4),盒8上亚段训练样本平均正确率为29.93%,检验样本平均正确率为31.45%,盒8下亚段训练样本平均正确率为30.84%,检验样本平均正确率为29.16%,整体准确率偏低。
表4 盒8段不同岩相决策树模型准确率数据表
5.4 单井识别效果分析
对比不同方法岩相识别结果可知(表5,图11),RBF—MLPNN联合模型岩相识别平均准确率达到89.06%,相比于交会图、主成分分析、决策树模型识别准确率有显著的提高。根据单井岩相识别结果可以看出,RBF—MLPNN联合模型识别效果最佳,识别的岩相垂向组合更加符合沉积规律。
图11 研究区召51井岩相解释成果对比图(1 in=25.4 mm)
表5 不同岩相识别方法综合准确率数据表
6 讨论
6.1 储层结构特征与人工智能算法的优选
通过本次研究可以发现,在进行复杂储层岩相识别与表征的过程中,需要考虑储层内部不同的储层结构特征,不同储层结构特征约束下的测井数据特征以及这些特征与人工智能算法模型之间的契合性,而不是盲目使用模型,从而导致识别精度较低。例如本次研究区盒8上亚段的曲流河储层,由于其岩相密度小,垂向变化频繁,测井采集数据受周围其他岩相的影响较大,从而导致同一岩相对应的测井数据分布较分散。因此,在选择模型时,应选择适用于区分分散数据的全局逼近MLPNN模型,通过将线性边界组合成非线性边界而区分分散数据。而对于研究区盒8下亚段辫状河储层而言,由于其岩相密度大且变化不频繁,测井采集数据受周围岩相的影响小,从而导致测井数据分布相对较集中。因此,在选择模型时,选择与之适应的适用于相对集中数据的局部逼近RBFNN模型效果更好。此外,对于交汇图法、主成分分析法、决策树法等方法,由于未考虑数据的分布特征,从而使其相比于可以解决非线性可分问题的神经网络模型,对河流相致密砂岩储层复杂岩相的识别准确率明显降低。
6.2 岩相识别与表征对致密砂岩储层非均质性研究的重要性
对于致密砂岩储层而言,储层岩相结构特征对储层非均质性研究及甜点储层的表征具有重要的指导意义。在单井岩相识别的基础上,通过统计不同岩相的物性、含气性及压裂后单井产能特征(注:单井产能Ⅰ类无阻流量大于10×104m3/d,产能好;单井产能Ⅱ类无阻流量(4~10)×104m3/d,产能中等;单井产能Ⅲ类无阻流量小于4×104m3/d,产能差)[51]可以发现(图12),板状交错层理粗砂岩相和槽状交错层理粗砂岩相物性、含气性最好,单井产能Ⅰ类中占比最高,产能最好,其中槽状交错层理粗砂岩相物性略好于板状交错层理粗砂岩相,但含气性及产能略差于板状交错层理粗砂岩相;块状层理砾岩相物性、含气性较好,三类单井产能占比较低,产能略差;板状交错/平行层理中砂岩相物性、含气性略差于块状层理砾岩相,单井Ⅱ、Ⅲ类占比高,产能差于槽状交错层理/板状交错层理粗砂岩相,其中平行层理中砂岩相好于板状交错层理中砂岩相;交错层理细砂岩物性、含气性较差,单井产能Ⅲ类占比最高,产能差;波状层理粉砂岩物性、含气性最差,三类单井产能几乎无占比,产能最差。综上分析可知,不同的岩相结构特征具有不同的物性、含气性及产能特征差异,因此,开展致密砂岩储层岩相识别与表征对该类储层高效开发具有重要的意义。
图12 盒8段不同岩相物性、含气性及产能特征图
7 结论
1)研究区盒8段共发育8种岩相类型、6种岩相组合模式。其中,盒8上亚段曲流河相储层整体岩相密度偏小、岩相频率偏高、对应测井数据分布较分散,而盒8下亚段辫状河相储层整体岩相密度偏大、岩相频率偏低、对应测井数据分布较集中。
2)本次研究从地质特征、地质特征约束下的测井数据特征与人工智能算法原理之间的契合性出发,优选岩相密度等于25%作为联合模型选用不同神经网络进行岩相识别的特征判别标准,建立了径向基—多层感知器神经网络联合模型,综合识别准确率可达89.06%,相较于单一神经网络模型、交会图、主成分分析和决策树等方法识别准确率明显提高。
3)不同岩相类型具有不同的物性、含气性及压裂产能特征,因此,致密砂岩储层岩相的识别与表征意义重大。但是,在实际的识别、表征过程中,需选用原理与数据分布特征相适应的人工智能算法,才能使识别效果达到最优。