基于偏最小二乘回归法的储层厚度预测
2015-10-31王世龙王开燕
王世龙,周 妍,王开燕
(1.中国海油油田服务股份有限公司,天津 300452;2.东北石油大学地球科学学院,大庆 黑龙江 163318)
基于偏最小二乘回归法的储层厚度预测
王世龙1,周 妍2,王开燕2
(1.中国海油油田服务股份有限公司,天津 300452;2.东北石油大学地球科学学院,大庆 黑龙江 163318)
首次采用偏最小二乘回归法进行储层厚度预测,推导其数学算法,总结其优势,建立正演模型分析其可行性。针对靶区的地震数据进行地震属性的提取,优选出可以较好地描述砂体分布情况的5种属性,分别为波峰数、平均振幅、平均瞬时相位、振幅立方差和能量半衰时。利用这5种属性分别对靶区应用主成分分析法、神经网络法和偏最小二乘回归法,得到井点处的砂体厚度预测值。根据各自绝对误差和相对误差,推断应用最小二乘回归法预测砂体厚度值更为准确。根据建立的回归方程,对靶区进行砂体厚度预测,得到砂体厚度分布情况。
地震属性 储层厚度预测 偏最小二乘回归法 主成分分析法 神经网络法
目前,预测储层厚度方法多种多样。陈晓东将地震相分析法应用于飞仙关组[1],验证其可行性,地震相分析法可以直接与地质因素联系在一起,对储层预测起着重要作用。但是,其缺点是间接推断,有多解性,纵向分辨率差。杨立强采用随机反演方法进行砂体预测[2],能有效提高地震资料的分辨率,但仍然存在多解性问题。地震波阻抗反演的应用也很广泛,如许名文的稀疏脉冲波阻抗反演[3],但此方法受地震固有频宽的限制,分辨率低。多元回归法应用也比较广泛,如张娟的多元线性回归法[4],在使用这种方法时要需要井和孔隙分布均匀的工区,不具有广泛性。人工神经网络法,是目前应用广泛、效果较好的砂体厚度预测的方法,李飞[5]和王婷[6]都利用BP神经网络预测储层参数,但由于人工神经网络法的本质是梯度下降法,若目标函数非常复杂,必然会出现“锯齿形现象”,影响了该方法的效果。
地震属性技术是目前的热点问题,地震属性中蕴含着地层岩性、储层物性、流体类型和断裂等信息,在不同的条件下其分类结果也不同,虽然利用地震属性进行储层预测是可行的,但Liu Jianlei利用峰值瞬时频率进行薄层厚度预测,只使用单一属性,结果不是十分精确。
多属性结合的方法当下应用比较广泛,利用转换方法将地震属性信息转换为储层信息,从而进行储层预测[7],采取何种方法进行转换是一个重要问题。1983年Wold S和Albano C提出偏最小二乘回归算法,它将多元线性回归、主成分分析和典型相关分析的优点集于一身,因此偏最小二乘回归法具有更大的优势。罗批、Randall D和张忠诚分别就偏最小二乘回归建模[8]、偏最小二乘回归概述、偏最小二乘回归分析的成分数据预测模型[9]等方面进行了研究,董玉才则将此方法运用到油田产量预测方面,并且取得了不错的效果[10]。
综上所述,采用多属性分析,利用偏最小二乘回归法进行储层砂体厚度预测,将预测结果与主成分分析法、神经网络法预测的结果进行对比,从而验证偏最小二乘回归法在砂体厚度预测方面的优势。
1 偏最小二乘回归方法
首先在自变量集中提出第一成分t1(t1是{x1,x2,x3…xm}的线性组合,且尽可能多地提取原自变量集中的变异信息);同时,在因变量集中也提取第一成分u1,并要求t1与u1相关程度达到最大。然后建立因变量y1,y2,y3…yp与t1的回归,如果回归方程已达到满意的精度,则算法中止。否则继续第二对成分的提取,直到能达到满意的精度为止。若最终对自变量集提取r个成分t1,t2,t3…tr,偏最小二乘回归将通过建立y1,y2,y3…yp与t1,t2,t3…tr的回归式,然后再表示为y1,y2,y3…yp与原自变量的回归方程式,即偏最小二乘回归方程式。
2 偏最小二乘回归法优势
(1)偏最小二乘回归法是一种新型的多元统计数据分析方法,当各个变量内部线性相关程度比较大时,采用偏最小二乘回归建模分析,比针对逐个因变量做多元回归更加有效,其整体性更强。
(2)偏最小二乘回归法集主成分分析、典型相关分析和多元线性回归分析3种分析方法的功能于一身,可以实现多种数据分析方法的综合应用,即:偏最小二乘回归≈多元线性回归分析+典型相关分析+主成分分析。
(3)普通多元线性回归应用时,常常会受到许多限制,如自变量之间的多重相关性和样本点数过少等问题,而偏最小二乘回归法则可以很好地解决这些问题。
3 偏最小二乘回归法步骤
目前可以从地震数据体中提取出近百种属性,这些属性和每种储层参数之间的相关程度不同,选择合适的地震属性进行回归建模,可以得到对应的储层参数预测值。采用的主要步骤如下。
(1)针对靶区的地震数据体进行地震属性的提取,得到多种地震属性。
(2)对提取出的地震属性进行标准化处理,使各个属性值范围都在0~1之间。
(3)对地震属性进行初步优选。
(4)将初步选择出的属性和储层厚度值进行相关分析,再次进行选择,优选出与储层厚度相关性较大的地震属性。
(5)采用主成分分析法、神经网络法和偏最小二乘回归法进行储层参数的转换,得到井点处的储层厚度预测值。
(6)分别求取预测值与已知值的误差和平均误差。
(7)优选误差较小的回归方法,进行全区范围内的砂体厚度预测,得到砂体厚度分布情况。
4 可行性分析
为了验证偏最小二乘回归法在预测砂体厚度方面的可行性,建立一个楔形模型,使所建立的楔形模型更接近实际,对所选参数与研究区域的实际资料相结合,研究区域平均单井钻遇砂岩厚度7.66 m,有效厚度一般为6~15 m,平均有效渗透率为0.503×10-3μm2,平均渗透率为26.8%,研究区域构造比较平缓,地层倾角大约为3 °,地面海拔平均高度150 m左右,横向的采样点数为50,步长为10,纵向的采样点数为20,步长为10。楔形模型的最大厚度为20 m,从上到下速度分别为1 415 m/s、1 800 m/s、1 470 m/s,子波选用Ricker,频率为38 Hz,然后在这个速度模型的基础上生成正演地震数据,生成的地震响应如图1所示。
提取楔形层段的地震属性,根据上述主要步骤依次进行操作,分别利用逐步回归法、偏最小二乘回归法和神经网络法进行储层厚度预测,得到逐步回归法预测的厚度为9.82 m,偏最小二乘回归法预测的厚度为9.35 m,神经网络法预测的厚度为11.66 m,根据楔形模型的调谐厚度为子波的波长的1/4可得其厚度为9 m,通过比较可以看到利用偏最小二乘回归法预测的厚度误差相对最小。
图1 楔形正演模型的地震响应
5 实际算例分析
针对靶区中的S1-S2层段进行砂体厚度预测。对其地震数据体进行地震属性的提取,经过标准化处理之后,优选出对预测储层厚度有利的属性,分别为波峰数、平均振幅、平均瞬时相位、振幅立方差和能量半衰时。
优选出地震属性之后,要进行储层参数预测时,需要将地震属性向储层参数转换,转换的方法多种多样,本文采用主成分分析、神经网络法和偏最小二乘回归法三种方法进行储层砂体厚度预测,利用井点处的地震属性值和储层砂体厚度建立起响应的回归方程,通过建立的回归方程进行全区预测。回归方程方程如下所示:
S1-S2层段主成分分析回归方程:
Y=19.97+0.29x1-16.83x2+5.88x3-
10.41x4+3.44x5
(1)
式中:Y-砂体厚度;x1-波峰数;x2-平均振幅;x3-平均瞬时相位;x4-振幅立方差;x5-能量半衰时。
S1-S2层段偏最小二乘回归方程:
Y=10.53+3.69x1-5.96x2+4.74x3-
7.36x4+4.29x5
(2)
式中:Y-砂体厚度;x1-波峰数;x2-平均振幅;x3-平均瞬时相位;x4-振幅立方差;x5-能量半衰时。
选择靶区内的10口井,采用建立的回归方程进行井点处的储层砂体厚度值预测,和已知的储层砂体厚度值进行比较,求取各自绝对误差,如表1所示。
表1 S1-S2层段井点处已知砂体厚度与预测砂体厚度的对比
选择靶区内的30口井,将已知值和预测值之间的绝对误差分别用柱状图(图2)表示出来,可以直观地观察出不同方法预测结果的精度范围。
从表1和图2可以看出,在三种方法中,S1-S2层段使用偏最小二乘回归法效果最好,大部分预测结果和已知值误差均较小,误差厚度主要集中在4 m之下,误差最大为5.09 m。
图2 砂体厚度绝对误差统计柱状图
图3 S1-S2层段砂体厚度
因此,使用偏最小二乘回归对靶区非井点处砂体厚度值进行预测,得到目的层段的全区砂体厚度分布图(图3),可以看出,目的层段砂体较发育,分布也比较均匀。综上,利用偏最小二乘回归法进行砂体厚度预测是可行的。
6 结论
(1)用神经网络法、逐步回归法和偏最小二乘回归法进行研究区砂体厚度预测,S1-S2层段预测结果与已知值比较,偏最小二乘回归法预测的结果较为准确,误差大部分在4 m之下,最大误差为5.09 m。
(2)根据偏最小二乘回归方程预测靶区的砂体厚度范围在0~15m之间。
(3)偏最小二乘回归法,在自变量相关程度比较大的情况下计算误差较小,整体性强,且具有预测功能,可以应用于地震数据的砂体厚度预测。
[1] 陈晓东.川东南北部飞仙关组地震相分析及储层预测研究[D].成都理工大学,2012.
[2] 杨立强,邬长武,董宁.基于模拟退火算法的随机反演技术在砂体预测中的应用[J].地球物理学进展,2013,28(1):0287-0292.
[3] 许名文,姜瑞波,雷新华,等.稀疏脉冲波阻抗反演技术在储层预测中的应用[J].油气地球物理,2011,9(2):24-27.
[4] 张娟.基于多元线性回归分析的薄储层预测技术在胜利探区的研究与应用[J].工程地球物理学报,2013,10(1):91-94.
[5] 李飞,张萍,王赛英.BP神经网络在计算储层参数中的应用[J].中国西部科技,2013,1:38-40.
[6] 王婷,,杨斌,杨勇,等.利用BP神经网络预测储层参数[J].辽宁化工,2013,42(2):160-163.
[7] 陈冬.地震多属性分析及其在储层预测中的应用研究[D].中国地质大学(北京),2008.
[8] 罗批,郭继昌,李锵,等.基于偏最小二乘回归建模的探讨[J].天津大学学报,2002,35(6):783-786.
[9] 张忠诚.一类基于偏最小二乘回归分析的成分数据预测模型[J].华中师范大学学报(自然科学版),2006,40(2):161-163.
[10] 董玉才,李红燕,朱连军,等.基于偏最小二乘回归的油田产量预测[J].信息系统工程,2009,10:1-7.
(编辑 曹征远)
Reservoir thickness prediction based on partial least-squares regression method
Wang Shilong1,Zhou Yan2,Wang Kaiyan2
(1.ChinaOilfieldServicesLimited,Tianjin300452,China;2.GeoscienceCollegeofNortheastUniversityofPetroleumInstitute,Daqing163318,China)
On the basis of deducing the mathematical algorithm and summarizing the advantages,the feasibility of the partial least square regression method,to be the first in predicting reservoir thickness,was analyzed by building up the forward model.According to the seismic data of target areas,five kinds of seismic attributes,which can describe the sand body distribution well,were extracted.The five kinds of seismic attributes include the number of peaks,mean amplitude,average instantaneous phase,amplitude variance and energy half-life.Based on the five kinds of seismic attributes,the sandbody thicknesses of some wells in the study area were respectively predicted by adopting the principal component analysis method,the neural network method,and the partial least squares regression method.It was found in the comparison of the corresponding absolute and relative errors that the value predicted by the least squares regression method was more accurate.Based on the established regression equation,the sandbody thickness in the target area can be forecasted to obtain the sandbody thickness distribution.
seismic attributes;reservoir thickness prediction;partial least squares regression method;principal component analysis method;neural network method
TE122.2
A
10.16181/j.cnki.fzyqc.2015.01.002
2014-07-03;改回日期2014-10-08。
收稿日期:王世龙(1988—),初级工程地质工程师,主要从事海洋工程地质方向工作。电话:13332063235,E-mail:wangshl14@cosl.com.cn。
国家杰出青年基金项目(41125015);黑龙江省教育厅科学技术研究基金项目(12511018)资助。