APP下载

基于神经网络的测井曲线砂体解释与应用研究

2015-05-09刘烨郭超马微程国建

测井技术 2015年5期
关键词:气层砂体测井

刘烨, 郭超, 马微, 程国建

(1.西安石油大学计算机学院, 陕西 西安 710065; 2.陕西延长石油(集团)有限责任公司研究院, 陕西 西安 710075; 3.西安理工大学图书馆, 陕西 西安 710048)

0 引 言

传统测井曲线砂体解释工作依赖主观经验基础由人工手动完成,使得砂体解释包含大量重复性工作,极大增加其具体实现的繁琐性,解释结果也受主观因素影响而带来额外误差。

司马立强等[1]利用BP神经网络技术对取心井储层流动单元进行学习训练,提高了测井解释精度。王绍忠等[2]应用BP神经网络储层预测图进行该区块砂体追踪和解释,取得了良好的效果。石玉江等[3]基于自组织神经网络技术建立了孔隙结构测井自动判别和分类渗透率计算模型,有效提高渗透率计算精度。张绍红[4]提出了一种由多测井和多地震属性参数组成的概率神经网络方法进行非均质性较强的油气储层预测。徐刚等[5]应用人工神经网络方法,通过统计分析确定各种类型典型样本圈闭不同地质因素的权重,并对50个圈闭进行了地质评价。孙志华等[6]利用神经网络技术对地震相进行了自动识别。

本文利用人工神经网络技术,针对砂体自动识别方法开展研究,提出一种基于神经网络的数值方法,将测井曲线砂体的各物性特征参数作为输入,输出为相对应的砂体解释类别,以此进行测井曲线砂体的自动解释工作。

1 影响因素

鄂尔多斯盆地气田测井曲线砂体的解释类别主要有气层、含气层、气水同层、含气水层、水层和干层等。实际应用中,通常较为关注气层、含气层和干层这3类地层。气层砂体的孔隙度渗透率等物性参数较好,是气藏开发的主力层位,定为Ⅰ类;含气层是物性介于干层与气层之间的砂体,定为Ⅱ类;干层指的是不渗透的砂层,本身无生气能力,在气藏中干层的作用与泥岩接近,不具有工业开发价值,定为Ⅲ类。

鄂尔多斯盆地气田开发的测井数据中,与各砂体类别的主要因素有孔隙度、渗透率、含气饱和度、砂厚、泥质含量与深度等,测井解释能够在对代表该类影响因素的测井数据综合分析基础上,对砂体进行细致解释工作。本文收集到鄂尔多斯盆地某气田140余口开发井或探井的测井曲线数据,其中每口井的砂体数量约为10组,通过数据清洗与筛选,最终用于神经网络方法研究砂体解释的数据样本为1 310组,每组砂体数据中包含已确定的砂体类型,以及相对应的6个影响因素。

1.1 孔隙度

实验使用1 310组砂体的孔隙度分布情况见图1。图1中,砂体样本编号第1~163组是Ⅰ类砂体,第164~435组是Ⅱ类砂体,第436~1 310组是Ⅲ类砂体,图2至图6中出现的样本编号与之相同。从图1可以看出,Ⅰ类砂体的孔隙度多分布在8%~14%;Ⅱ类的多分布在6%~13%;Ⅲ类的分布范围多在3%~9%。1 310组砂体样本的孔隙度分布表明,3类砂体的渗透率具有较大差别,其中Ⅰ类与Ⅲ类的差别较为明显,并且第Ⅲ类砂体的孔隙度分布范围更为广泛。

图1 孔隙度分布

1.2 渗透率

1 310组砂体的渗透率分布情况如图2所示。从图2可见,Ⅰ类砂体的渗透率多分布在0.3~2 mD*非法定计量单位,1 mD=9.87×10-4 μm2,下同;Ⅱ类砂体的多分布在0.1~0.6 mD;Ⅲ类的多分布在0.01~0.2 mD。1 310组砂体样本的渗透率分布表明,Ⅰ类砂体的渗透率值最大,Ⅱ类砂体与Ⅲ类砂体的渗透率值均较小,特别是第Ⅲ类砂体渗透率值与Ⅰ类砂体的差别在一个数量级上。

图2 有效渗透率分布

1.3 含气饱和度

1 310组砂体的含气饱和度分布情况见图3。从图3可见,Ⅰ类砂体的含气饱和度多分布在50%~80%;Ⅱ类砂体的多分布在30%~60%;Ⅲ类的多分布在5%~55%。1 310组砂体样本的含气饱和度分布表明,3类砂体的含气饱和度分别有不同程度的差别,Ⅰ类砂体的含气饱和度最高,而Ⅲ类砂体的含气饱和度分布范围最广。

图3 含气饱和度分布

1.4 泥质含量

1 310组砂体的厚度分布情况见图4。从图4可见,Ⅰ类砂体的泥质含量多分布在3%~15%;Ⅱ类砂体的多分布在5%~22%;Ⅲ类的多分布在12%~35%。1 310组砂体样本的泥质含量分布表明,3类砂体的泥质含量具有明显的分异性,Ⅰ类砂体的泥质含量最低,而第Ⅲ类砂体的泥质含量最高,并且其分布范围最广。

图4 泥质含量分布

1.5 砂厚

砂厚指各单砂体的厚度,计算公式为

砂厚=砂底深度-砂顶深度

(1)

1 310组砂体的厚度分布情况见图5。

图5 砂厚分布

从图5可见,Ⅰ类与Ⅱ类砂体的砂厚多分布在2~5 m;Ⅲ类多分布在1~9 m。1 310组砂体样本的砂厚分布表明,3类砂体的砂厚差别比较小,样本值在整体上多分布于2~6 m。

1.6 深度

深度指各砂体所处的深度,计算公式为

深度=(砂顶深度+砂底深度)/2

(2)

1 310组砂体的深度分布情况见图6。可以看出3类砂体的深度分布差别并不明显,多分布于2.8 m~3.1 km。

图6 深度分布

通过对上述影响砂体类别的6个影响因素分析得知,单纯依据其中某一个参数无法较好地进行砂体解释工作,而多种影响因素之间的关系又无法利用数学方法进行描述。因此,本文采用人工神经网络技术,将6个影响因素综合起来建立砂体类型相应的特征空间,实现基于测井曲线的自动砂体解释方法。

2 方 法

通过已解释的测井曲线砂体统计数据建立用于神经网络训练的特定数据集对神经网络进行训练,目的是使训练完成后的神经网络能够以未解释测井数据作为输入进行自动砂体解释分类。神经网络的输出则是输入参数所对应的3类砂岩解释类型结果的概率,最终通过概率对比能够将输入样本进行自动分类,实现测井曲线的自动解释工作[7]。

实验通过Matlab软件及神经网络模式识别工具箱执行,主要步骤为数据采集、特征选择、特征归一化、神经网络训练、数据测试、推广应用。

2.1 特征归一化

各砂体的特征数据具有一定数量级差别,为了防止单一数据异常值影响其他变量,并为获得能够进行广泛对比的取值范围,对所有统计数据进行归一化处理。数据归一化将所有数据都转化为[0,1]之间的数,取消了各维数据间的数量级差别,避免因为输入输出数据的数量级差别较大而造成网络预测误差。数据归一化采用最大最小方法,函数形式为

xk=(xk-xmin)/(xmax-xmin)

(3)

式中,xmin为数据序列中的最小数;xmax为数据序列中的最大数。实验采用Matlab中的mapminmax函数进行归一化处理。

2.2 神经网络训练与模型

神经网络可以实现高维的输入/输出映射,通常用于分类与回归等问题求解中。分类问题是通过一组特征将对象分配至一个预定义的类别,它是使用非线性函数进行特征空间到分类空间的映射,而神经网络可以实现若干维空间的任意函数映射。为设计神经网络获得较好的映射效果,需要分别选择神经网络模型、神经元的激励函数、误差函数和训练算法。

应用神经网络模式识别工具箱进行砂体分类研究。该神经网络是一个3层前馈网络,神经元分为输入层、输出层和隐层,其拓扑结构见图7。根据选择的6个特征参数,输入层有6个神经元;输出层有3个神经元对应每个砂体类别;隐层有7个神经元,其数量通过多次实验后确定。

图7 神经网络的拓扑结构

隐层神经元和输出神经元均使用Sigmoid函数,神经网络的每个输出值的范围在[0,1]。对于每个砂体样本,取3个输出中最大值所对应的类别作为分类结果。神经网络使用交叉熵误差函数和拟牛顿最小化误差函数。

在神经网络的训练过程中,必须对训练样本使用监督训练,神经网络训练采用误差反向传播方法:给定输入神经元初始模式,神经网络给出输出值,如果其不等于期望的输出,则计算两者的差值(均方差),进行权值修改以降低误差。在每次训练中重复上述操作,直至误差最小[8]。

将1 310组砂体样本随机分成训练集、验证集和测试集3个部分,分别占70%(916组)、15%(197组)和15%(197组)。神经网络的训练过程中初始权重矩阵由小随机数值组成。当网络验证集的均方差开始增加时,即神经网络的泛化效果停止提高时,网络训练会自动停止。神经网络训练过程的训练和验证误差曲线见图8。在第56次训练结束时,网络拟合获得最佳效果,此时验证集的均方差为0.046。

图8 训练误差

3 模型检验

测井曲线砂体训练集与验证集的样本数量分别为916组与197组,神经网络对这2组砂体的分类正确率分别是86.4%和91.4%,表示916组砂体样本训练集中有791组得到正确分类,197组验证集中有180组得到正确分类。上述结果表明神经网络对测井曲线砂体分类的拟合效果良好,同时选用未参与神经网络训练的测试集对其性能进行测试。

测试集由197组砂体样本组成,3类砂体的样本数量分别为28(Ⅰ类)、36(Ⅱ类)和133(Ⅲ类),用于测试神经网络的最终分类性能。这里应用混合矩阵(Confusion Matrix)表示神经网络对测井曲线砂体类别的识别效果。混合矩阵将所有正确和错误的分类信息都归到一个表里,其中列表示真实的分类,行表示神经网络分类[8]。

神经网络对3类测井曲线砂体的整体分类效果较好。其中,第Ⅰ类砂体的识别正确率达85.7%,有4组砂体被错误分类为第Ⅱ类;第Ⅱ类砂体的识别效果较差一些,分类正确率为77.8%,其中有7组砂体被错误识别为第Ⅲ类,1组砂体被错误识别为第Ⅰ类;而第Ⅲ类砂体的识别效果最佳,仅有3组砂体被错误识别为第Ⅱ类。测试集中共计正确分类182组砂体(92.4%),错误分类15组(7.6%)。在错误分类中,神经网络选择的分类与正确类别临近,并且没有发生干层砂体被识别为气层砂体。仅考虑气层砂体(即气层砂体和含气层砂体)和干层砂体这2个类别,则识别的正确率分别是89.1%和97.7%。误差产生的一个原因可能是采集到的样本中各类别砂体数据量不均一所导致,这使得神经网络在训练过程中受到限制。

4 应用效果分析

为探讨上述神经网络砂体识别模型的推广应用能力,使用第2组测井曲线砂体样本数据集进行神经网络模型的测试研究。第2组测试集选择的是鄂尔多斯盆地中另一区块东南部的61口开发井或探井的测井数据,共计得到649组测井曲线砂体数据:78组气层砂体(测试集的12.0%),125组含气层砂体(19.3%)和446组干层砂体(68.7%)。通过训练好的神经网络对第2组测试集进行自动识别,测井曲线砂体的识别正确率达到89.8%,这表明649组砂体样本中有583组得到正确分类。

第2组测试集的混合矩阵中,第Ⅰ类和第Ⅱ类砂体的分类效果均一般,部分Ⅰ类与Ⅱ类砂体分别被错误识别为Ⅱ类与Ⅲ类;而第Ⅲ类砂体的分类效果最佳,正确率达96.2%,仅有少量砂体被神经网络识别为第Ⅱ类等。如果考虑气层砂体(气层砂体和含气层砂体)和干层砂体这2个类别,则分类的正确率分别是88.7%和96.2%,总正确率达到93.8%。神经网络对测井曲线砂体解释的推广应用效果较好,特别是对干层砂体的有效分类,而气层砂体与含气层砂体的识别精度相对低一些,可能是由于区块地质因素和测试样本中类别数量不均一所致。

5 结 论

(1) 提出基于测井曲线中砂体统计参数的数值方法用于自动解释砂体类别。使用砂体的统计参数作为神经网络输入,输出是对应砂体的解释结果。

(2) 分别选择2组不同的砂体数据测试神经网络的自动解释及其推广应用效果。结果表明基于神经网络的自动解释测井曲线砂体的正确率分别是92.4%和89.8%,这一精度满足测井分析砂体解释的初步要求,可以协助砂体识别工作。

(3) 产生识别误差的一个原因可能是采集到的样本中各类别砂体数据量不均一所导致,这使得神经网络在训练过程中无法更好地完成网络训练。

参考文献:

[1] 司马立强, 肖华, 袁龙, 等. 基于BP神经网络技术的储层流动单元研究 [J]. 测井技术, 2012, 36(4): 421-425.

[2] 王绍忠, 周红科. 埕岛油田东斜坡层序约束下的储层预测技术 [J]. 石油地球物理勘探, 2012, 47(1): 142-149.

[3] 石玉江, 时卓, 张海涛, 等. 苏里格气田致密气层测井精细建模方法 [J]. 西南石油大学学报: 自然科学版, 2012, 34(5): 71-77.

[4] 张绍红. 概率神经网络技术在非均质地层岩性反演中的应用 [J]. 石油学报, 2008, 29(4): 549-552.

[5] 徐刚, 张建宁, 谭明友. BP人工神经网络在济阳拗陷圈闭地质评价中的应用 [J]. 石油地球物理勘探, 2004, 39(5): 565-569.

[6] 孙志华, 郑俊茂, 甘嫦华, 等. 地震解释技术在N50井区的应用 [J]. 石油地球物理勘探, 2003, 38(6): 687-689.

[7] Marmo R, Amodio S, Tagliaferri R. et al. Textural Identification of Carbonate Rocks by Image Processing and Neural Network: Methodology Proposal and Examples [J]. Computers & Geosciences, 2005, 31(5): 649-659.

[8] 史峰, 王小川, 郁磊, 等. MATLAB神经网络30个案例分析 [M]. 北京: 北京航空航天大学出版社, 2010: 1-10, 282-283.

猜你喜欢

气层砂体测井
本期广告索引
曲流河复合点坝砂体构型表征及流体运移机理
CSAMT法在柴北缘砂岩型铀矿勘查砂体探测中的应用
基于孔、裂隙理论评价致密气层
涪陵页岩气层构造变形量化研究获新进展
井震结合砂体识别与含气评价技术在致密气井挖潜中的应用
船底凹槽气层流动特征及影响因素研究
渤海湾盆地Q油田明化镇组复合砂体内部结构表征
基于测井响应评价煤岩结构特征
随钻电阻率测井的固定探测深度合成方法