基于交叉验证的地震多属性概率神经网络(PNN)反演在识别热瓦普地区火成岩中的应用
2015-06-15谢会文许永忠郑多明高宏亮李国会叶茂林王双双
谢会文,许永忠,郑多明,高宏亮,李国会,叶茂林,王双双
(1.中国石油天然气股份有限公司塔里木油田分公司勘探开发研究院,新疆 库尔勒 841000;2.中国矿业大学资源与地球科学学院,江苏 徐州 221116;3.中国科学院地质与地球物理研究所油气资源研究重点实验室,北京 100029)
基于交叉验证的地震多属性概率神经网络(PNN)反演在识别热瓦普地区火成岩中的应用
谢会文1,许永忠2,3,郑多明1,高宏亮1,李国会1,叶茂林1,王双双2
(1.中国石油天然气股份有限公司塔里木油田分公司勘探开发研究院,新疆 库尔勒 841000;2.中国矿业大学资源与地球科学学院,江苏 徐州 221116;3.中国科学院地质与地球物理研究所油气资源研究重点实验室,北京 100029)
新疆塔北地区发育巨厚二叠系火成岩,速度差异较大,而且火山喷发模式难确定,给其下伏低幅度碎屑岩圈闭和岩性圈闭落实带来困难。本文对二叠系火成岩利用概率神经网络反演等方法进行精细的速度场研究。概率神经网络反演是一种典型的非线性反演方法,相比于稀疏脉冲反演,在地震反演过程的非线性问题,具有更好的分辨率。通过逐步回归和交叉验证优选使验证误差最小的属性组合,使反演结果与测井属性有更好的相关性。建立的速度场经验证,更符合火成岩分布与速度变化规律。
PNN神经网络反演;交叉验证;岩性识别;火成岩
地震反演技术是岩性地震勘探中十分重要的手段之一,它在油气地震勘探中已经作为一种成熟的技术被广泛应用,非线性反演作为研究热门也越来越被更多的实际生产中[1-4]。夏步余等应用层位标定、地震属性描述及测井约束反演等地震技术,对火成岩分布规律进行了深入研究[5]。张传林应用波阻抗反演技术来预测火成岩的厚度[6]。石胜群等应用测井约束反演方法对火成岩进行识别,预测火成岩的厚度与孔隙度[7]。杨晓兰等采用曲线重构反演预测了苏北盆地海安凹陷四灶地区阜宁组火成岩储层[8]。范洪军等应用波阻抗反演及地震属性聚类分析方法,预测了火成岩的喷发期次和平面分布形态[9]。
PNN神经网络反演方法突破了常规地震反演方法的限制,主要表现在以下几个方面:①直接得到测井属性而不是波阻抗,和从反演的波阻抗信息中得到的属性是有区别的;②参与预测的是从地震数据中得到的属性信息而不是常规的叠后地震数据,且地震属性包括叠前数据或者叠后数据的非线性转换,从而提高了预测能力;③通过对井位处的数据进行训练,寻找测井数据和地震数据之间的统计学关系,而不是假设某一特定的地质模型,且这种关系可以是线性的或者非线性的;④应用交叉验证的思想来检验二者关系的可靠性[10]。
1 反演原理
基于交叉验证的PNN神经网络反演是用地震数据体中的属性信息直接预测井数据的一种方法。在数据分析之前,可对测井数据进行带通滤波,以提高测井数据与地震数据的匹配程度。采用逐步回归法将属性的预测效果排序,借助交叉验证的思想确定褶积因子,参与运算的地震属性的类型和个数,并通过概率神经网络方法,建立多种地震属性与测井值之间的关系。将预测结果用于全区可得到火成岩速度体[11-13]。
1.1 概率神经网络
概率神经网络(Probabilistic Neural Network,简称PNN)是一种利用神经网络结构来完成数学上拟合的方法。其所使用的训练数据包括一系列不同类型的属性值(训练样本),训练样本的表示方法如式(1)所示。
(1)
式中,A为属性,每种属性有 个采样点,即 个样本值, 是每个采样点的实际测井值。
概率神经网络方法假设每一个输出的新的测井值都可以看成训练样本中测井值的线性组合。数据样本的属性值可以写成式(2)。
(2)
新的测井值可通过式(3)、式(4)来估算。
(3)
(4)
1.2 逐步回归法确定属性类型
用于预测的属性类型是反演过程中相当重要的环节,采用逐步回归法确定类型。假设最优的种属性的组合已知,那么种属性的组合就是在这种属性的基础上再寻找一种属性,并重新计算权重。首先用穷举法找出最优的某一种属性:对每一种属性(比如振幅加权相位、平均频率、视极性等),解出最优系数并计算预测误差,选择误差最小的属性作为第一种属性,从剩余属性中寻找第二种属性,使二者组合对的预测误差最小,并以此类推。但逐步回归法不能确保最终获得的解是最优的,每加入的属性,预测误差小于或等于之前的预测误差,一般的多属性转换可定义为一组不同类型的属性组合,按一定的规则,转化为期望的测井值。
1.3 交叉验证
每一种属性都对应一个权重,由于测井数据的采样间隔要远远小于地震数据的采样间隔,而地震属性的采样间隔和地震数据的采样间隔一致,所以实际测井数据的频率要比地震属性的频率高得多,因此单纯地将实际测井值和属性值点对点地关联起来是不恰当的,忽略了测井数据很多的变化细节。可假设目标测井值的每一个采样点与地震属性一组相邻的采样点是有一定关系的。
以三种属性为例,对每一个采样点,目标测井值通过下面的式子计算得出L(t)为预测的采样点处的测井值,w为各井的权重值,A(t)为采样点处的属性值,计算过程见式(5)。
(5)
利用逐步回归确定属性个数时,参与运算的属性越多,则预测误差越小。当使用较多的属性时,预测数据与训练数据之间的吻合程度在不断地增加,但是对于不包括在训练样本内的数据可能使效果变得差,导致过度训练[2]。
交叉验证用于预测的属性个数。其原理是把整个训练数据分成两部分,一部分是训练数据组,另一部分是验证数据组。选择训练数据组来参与概率神经网络的运算,得到拟合结果,而验证数据组代入拟合关系,计算最终的预测误差。
2 应用实例
2.1 工区概况
哈拉哈塘地区位于塔北隆起,东面是轮南低凸起,西面是英买力低凸起,南接满加尔凹陷,北接轮台低凸起。研究区奥陶系、石炭系砂砾岩油藏均有突破性发现,且多为低幅构造,均有良好的油气勘探前景。
工区二叠系火山熔岩主要为基性喷出的玄武岩和介于中性和酸性之间喷出的英安岩,以及过渡类型的凝灰质英安岩,安山质英安岩,局部出现少量的安山岩和流纹岩。火山活动大致分为三个期次,第一期次岩性主要为凝灰岩和碎屑岩,第二期次以玄武岩为主,第三期次以英安岩和英安质凝灰岩为主[3]。
2.2 反演属性优选
进行地震反演前,进行多属性分析,要建立多种地震属性与P波速度之间的关系。在这个过程中需要解决两个问题:①敏感属性组合和褶积因子的选取,选取的每一种敏感属性都应该对应一个权重,并且保证这些属性组合起来的预测误差最小;②确定参与运算的属性个数。
采用逐步回归法选取属性,在确定褶积因子和属性个数后,将利用交叉验证的思想确定褶积长度。先假定每个采样点的数值由附近相邻的10个采样点来确定,总共参与运算的属性个数为8个。褶积因子的验证误差如图1所示,当褶积长度不超过9点时,随着点数的增加,验证误差逐渐降低,当点数超过9个时,验证误差不但没有降低,反而误差变差。选择褶积长度为9点。
图2表示褶积长度为9点,属性个数为8时的预测误差和验证误差。从图中可以看出,参与预测的属性个数越多,预测误差越小,但是验证误差却和
预测误差的变化趋势不同。当属性个数不超过5时,验证误差随着属性个数的增加而降低,当属性个数为5时,验证误差取最小值,当属性个数大于5时,验证误差反而随着属性个数的增加而上升。即当属性个数大于5时,出现了过度训练,即训练的样本增加,训练效果反而有所下降。因此,选择前5种属性用于预测。8种属性及不同的属性个数对应的训练误差和验证误差见表1。
图1 褶积因子的验证误差
图2 褶积因子为9时的预测误差与验证误差
表1 多属性预测结果
属性个数目标最终属性训练误差预测误差1P-wave(inversionimpedance)**2223.109442228.7252772P-waveCosineInstantaneousPhase212.251285218.4145923P-waveFilter45/50-55/60210.029851217.4380654P-waveFilter5/10-15/20208.090230217.4970735P-waveFilter25/30-35/40206.879246217.3671736P-waveApparentPolarity205.738557217.9803397P-waveFilter35/40-45/50205.203506219.0837428P-waveIntegratedAbsoluteAmplitude204.631039220.266730
3 误差分析
建立多种属性与测井信息之间的关系可通过概率神经网络分析。概率神经网络是一种非线性方法,它的预测精度要比线性回归的预测精确度高,但是计算量比线性回归大。图3、图4分别为多元线性回归的预测结果和概率神经网络的预测结果。图5为将速度误差大于400m/s的RP1和RP12井剔除后,概率神经网络重新预测的结果,其中横坐标为实测的P波速度,纵坐标为三种情况预测的P波速度。图5中,线性关系较差的点表示将被删除,即在
图3 线性回归预测结果与实测结果交会图
图4 概率神经网络预测结果与实测结果交会图
图5 修改后概率神经网络预测结果与实测结果交会图
训练时不作为样本数据,这些点的波阻抗值偏低,与其它点之间异常明显。拟合斜线为预测结果与实测结果的之间的最佳拟合。
从表2中可以看出,相同的训练样本数据,概率神经网络的预测误差要比多元线性回归的预测误差小,相关度达到0.911,相应的速度误差也小。但是神经网络的交叉验证误差比线性回归的大。当剔除误差较大的井后,概率神经网络的预测精度进一步提高,预测结果的相关度达到0.921,速度误差反而降至147.047m/s。验证误差也随着减小。因此,将第三种情况得出的预测数据与实测数据的关系应用于全区,通过神经网络反演得到的速度体。图6、图7分别为道号1659的神经网络反演速度剖面和约束稀疏脉冲反演速度剖面。从图中明显看出,神经网络反演得到的数据体的分辨率明显高于稀疏脉冲反演,反演剖面中蓝色的区域为高速区,稀疏脉冲反演的高速区内部无明显的细分,分辨率较差,其反演本质仍为基于褶积模型的反演,受制于地震记录频带以及子波等因素的影响。前者作为一种典型的非线性反演方法,在纵向分辨上,对于高速火成岩的刻画较为细致,也更符合真实的地质情况。
4 结论
概率神经网络及地震属性反演方法是一种典型的非线性算法,采用逐步回归法将属性的预测效果排序,借助交叉验证的思想确定褶积因子、参与运算的地震属性的类型和个数,通过线性回归分析和概率神经网络方法,建立多种地震属性与测井值之间的关系,使概率神经网络的预测结果达到最优。
表2 三种情况下的预测结果
图6 1659道概率神经网络速度反演剖面
图7 1659道约束稀疏脉冲速度反演剖面
相对于约束稀疏脉冲反演等传统反演方法,概率神经网络反演具有更好的分辨率,能够较好的逼近真实值,对工区内的火成岩进行有效的识别。将预测结果用于全区并得到火成岩速度体。该方法在该工区内切实可行,有效的提高了火成岩的识别精度。
概率神经网络在井的数量上有一定的要求,而且属性种类与个数的选择与波阻抗值应该具有较好的相关性,这是反演过程中需要充分考虑的,需要进一步的深入研究。
[1] 曾富英,罗霞,肖红平,等.松辽盆地深层火山岩体的地震综合识别及预测[J].勘探地球物理进展,2009,32(4):270-274.
[2] 冉启全,周雪峰,胡永乐.基于神经网络的多属性火成岩岩性反演技术[J].西南石油学院学报,2006,28(1):5-8.
[3] 张昆,刘永福,许永忠,等.基于D-S证据理论的多参数反演的火成岩识别-以塔里木哈拉哈塘地区为例[J].东北石油大学学报,2013,37(1):51-57.
[4] 汤浩哲,许永忠,刘永福,等.多属性分析在哈拉哈塘断裂及裂缝中的应用[J].中国矿业,2013,22(4):51-54.
[5] 夏步余,谌廷姗.地震技术在火成岩发育区开发中的应用[J].石油物探,2002,41(4):461-465.
[6] 张传林.塔里木盆地塔中地区火成岩体识别与预测技术[J].石油实验地质,2003,25(5):513-516.
[7] 石胜群,杨德洲,张秀萍,等.苏北海中地区火成岩储层预测及其应用[J].沉积与特提斯地质,2004,24(3):108-112.
[8] 杨晓兰,刘小平,赵锡桥.曲线重构反演在火成岩储层预测中的应用[J].西安石油大学学报:自然科学版,2007,22(6):32-35.[9] 范洪军,徐春雨,王云雷.歧口凹陷北部火成岩地震预测方法研究[J].内蒙古石油化工,2008(5):124-126.
[10] YANG Haijun,LIU Yongfu,XIE Huiwen,et al.Integrative method in lithofacies characteristics and 3D velocity volume of the Permian igneous rocks in H area,Tarim Basin[J].International Journal of Mining Science and Technology,2013,23(2):167-172.
[11] Xu Yongzhong,Yang Haijun,Liu Yongfu,et al.Application of seismic facies and attributes analysis on the identification of Permian igneous rock[J].International Journal of Mining Science and Technology,2012,22(4):471-475.
[12] XU Yongzhong,CHEN Tongjun,CHEN Shizhong,et al.Comparison between several seismic inversion methods and their application in mountainous coal fields of western China[J].International Journal of Mining Science and Technology,2010,20(4):585-591.
[13] XU Yong-zhong,CUI Ruo-fei,HUANG Wei-chuan,et al.Reflectivity forward modeling and a CSSI method seismic inversion study of igneous intrusive area,coked area,and gas-enriched area located within a coal seam[J].Mining Science and Technology,2009,19(4):57-462.
Multi-attribute probabilistic neural network inversion applicated in identifying igneous in RWP area based on cross-validation
XIE Hui-wen1,XU Yong-zhong2,3,ZHENG Duo-ming1,GAO Hong-liang1,LI Guo-hui1,YE Mao-lin1,WANG Shuang-shuang2
(1.Research Institute of Petroleum Exploration and Development,Tarim Oilfield Branch Company,China National Petroleum Corp,Korla 841000,China; 2.School of Resource and Earth Science,China University of Mining and Technology,Xuzhou 221116,China; 3.Key Laboratory of Petroleum Resource Research,Institute of Geology and Geophysics,Chinese Academy of Sciences,Beijing 100029,China)
There developed huge thick Permian Igneous in Tabei area of Xinjiang.The Permian igneous rocks with sharp variation of velocity,affects the process of oil and gas exploration seriously,and makes trap-confirming more difficult.For solving this problem,this paper use Probabilistic Neural Network inversion method to establish igneous velocity field.Compared with CSSI,PNN inversion is a typical nonlinear inversion with its high resolution.At first,a group of attributes was selected by using Stepwise regression and cross-validation for analyzing and error minimum,to make inversion results have better correlation with log properties.The inversion velocity field was testified to conform the distribution of igneous and velocity changes.
probabilistic neural network inversion;cross-validation;identifying-lithology;igneous rocks
2014-03-07
谢会文(1967-),男,重庆万州人,高级工程师,矿产普查与勘探专业,现从事油气勘探方面的研究工作。E-mail:xiehw-tlm@petrochina.com.cn。
许永忠(1969-),男,福建莆田人,博士,副教授,从事地球物理勘探与反演方面的研究工作。E-mail:xuyongzhong2004@126.com
P361.4
A
1004-4051(2015)02-0154-05