基于多元线性回归分析的页岩气有利区评价新方法
——以上扬子地区五峰组—龙马溪组海相页岩为例
2021-10-14周业鑫赵安坤雷子慧
周业鑫,赵安坤,余 谦,张 娣,张 茜,雷子慧
(1.中国地质调查局成都地质调查中心,四川 成都 610081;2.自然资源部沉积盆地与油气资源重点实验室,四川 成都 610081;3.四川大学文学与新闻学院,四川 成都 610064)
当前我国页岩气有利区评价与优选,主要是以页岩气评价参数的综合分析来实现的(潘仁芳等,2009;王世谦等,2013;董大忠等,2016;潘仁芳等,2016;解习农等,2017;翟刚毅等,2017;汪正江等,2018;陈孔全等,2020)。随着页岩气勘探研究的不断深入,尤其是在四川盆地周缘或盆外的复杂构造区,页岩气的富集受构造改造作用明显(王世谦,2017;门玉澎等,2018;郭彤楼,2019;聂海宽等,2019;余谦等,2020;戴金星等,2020;姜振学等,2020;聂海宽等,2020;王红岩等,2020;赵文智等,2020;邹才能等,2020),各评价参数对页岩含气性的影响存在差异性或多解性,采用当前较为常规的页岩气地质参数综合叠加法,显然未考虑制约页岩含气性的参数权重问题,所形成的有利区综合评价成果图,既无法准确判断页岩气有利区之间资源潜力的差异,也无法刻画有利区内页岩气资源潜力的变化趋势,还加大了有利区勘探的风险性。为解决评价参数权重以及参数间可能存在内在联系的问题,一些数学统计方法逐步应用在页岩气评价工作(聂海宽等,2012;曹晓萌等,2014;王汉青等,2016;陈祖庆等,2016)。聂海宽等(2012)尝试通过对各个参数的多元线性回归分析,获取了主控因素和含气量计算公式,其预测结果与实测值吻合良好,而且还揭示回归分析的参数越多,预测越准确;王汉青(2016)利用该方法构建了综合地质甜点和工程甜点双重指标的可压性指数模型,成功指导了四川威远地区某页岩气井储层压裂设计与施工;这表明多元线性回归分析,将能够有效解决各评价参数与页岩含气性之间的定量关系及权重问题。本文拟通过量化各评价参数,运用基于多元线性回归分析的多元计算模型,进行页岩气有利区定量优选对比与评价,以期探索建立一套适用于复杂构造区页岩气有利区定量预测方法,切实提高复杂构造区页岩气勘探成功率。
1 上扬子地区五峰组—龙马溪组沉积背景
晚奥陶—早志留世,上扬子地区呈现康滇古陆、黔中隆起、雪峰隆起及川中隆起等隆起分割围限,总体处于被古隆起环绕的局限滞留浅海盆地的格局,沉积了五峰组—龙马溪组页岩,沉降中心主要位于川南、川东南及大巴山前缘地区,形成了富含笔石的黑色富有机质页岩(何江林等,2017;包汉勇等,2019;郭旭升等,2020;聂海宽等,2020;邱振等,2020)。其分布面积较大,埋深适中,是中国南方页岩气主要的勘探开发层系。
五峰组—龙马溪组纵向上依据岩性变化特征,可划分为上、下两段,下段形成于局限、缺氧的深水陆棚环境,发育黑色富笔石碳质页岩、黑色硅质泥页岩夹泥质粉砂岩组合,有机质丰度高,笔石富集;上段为浅水陆棚沉积,岩性为浅灰色钙质粉砂质泥岩夹石英砂岩。垂向上,砂质钙质含量增加在,碳质硅质含量减少,颜色变浅。总体上,五峰组—龙马溪组沉积相带地展布受古隆起控制(图1),深水陆棚主要发育于川东鄂西、川东北、川西南一带,浅水陆棚发育于古隆起边缘。在遵义—石阡—铜仁一线之南为隆起剥蚀区,沿隆起向外逐渐过渡为局限浅海相带。隆起的边缘及黔中隆起和雪峰山隆起所围限的区域主要为潮坪相,主要以灰—灰黑色粉砂质页岩和钙质/白云质粉砂岩为主,底部多见薄层的暗色粉砂质页岩(汪正江等,2018;门玉澎等,2020)。
图1 上扬子地区五峰组—龙马溪组岩相古地理图Fig.1 The lithofacies and palaeogeography map of Wufeng-Longmaxi Formations in Upper Yangtze Region
2 页岩气地质参数分析
2.1 富有机质页岩厚度与埋深
上扬子地区五峰组—龙马溪组富有机质页岩(TOC>2%)厚度主要介于20~100m。研究表明,该页岩沉积中心主要位于古隆起(陆)之间的川南、渝东鄂西地区,以宜宾—泸州、道真—黔江—利川—城口等地区厚度最大。其中,长宁地区达到96 m,而川东南綦江区块富有机质页岩厚度为10~60m,涪陵东南部区块富有机质泥页岩厚度为40~100m,川东北南江区块暗色泥页岩厚度为10~40m,正安区块富有机质页岩厚度为10~40m。总体上,上扬子地区五峰组—龙马溪组富有机质泥页岩厚度较大,分布范围较广。
根据现残留地层的分布特点,上扬子地区五峰组—龙马溪组埋藏深度总体在1000~3000m(图2)。其中,四川盆地内埋深较大,尤其以川北、川东北地区最深,埋深普遍大于4000m,其中以巴中—广元地区的埋深最大,大于5500m;而川南如宜宾西、习水等仅部分区域埋深大于5000m。盆地东南缘,位于达州—重庆—泸州一线为NE-SW走向的坳陷区,五峰组—龙马溪组埋深可达4000~4500m,向西、西南埋深逐渐变浅。而盆外受构造隆升剥蚀的影响,五峰组—龙马溪组埋深相对较浅,埋深普遍为1000~2000m,其中在部分三叠系—侏罗系覆盖区,五峰组—龙马溪组页岩埋深可达3000m;而雪峰隆起和湘黔隆起之间的区域大面积缺失。综上所述,五峰组—龙马溪组富有机质页岩埋深条件最有利的是川南和川东高陡构造,以及盆山过渡的盆缘带,其次就是鄂西—渝东地区及过渡带,上述区域五峰组—龙马溪组具有沉积厚度大、埋深适中、分布范围广的特点,页岩气勘探开发较为有利。
图2 上扬子地区五峰组—龙马溪组埋深图Fig.2 The isometric distribution of burial depth of Wufeng-Longmaxi Formations in Upper Yangtze Region
2.2 有机地化特征
2.2.1 有机质丰度
上扬子地区五峰组—龙马溪组页岩有机碳含量(TOC)较高,介于1%~4%,具有较好的生烃潜力。TOC分布受沉积相带控制,由古陆向深水陆棚其TOC逐渐增加。区域上,以川南—渝东南、渝东北地区为TOC高值区,TOC>4.0%;鄂西(宜昌—恩施—鹤峰)、黔北(正安—道真)、川南(泸州—双河)及川北(广元以北)TOC均大于2%,而向古陆(隆起)边缘方向有机碳含量逐渐降低,TOC<1%(图3)。
图3 上扬子地区五峰组—龙马溪组富TOC分布图Fig.3 The distribution of total organic carbon of Wufeng-Longmaxi Formations in Upper Yangtze Region
2.2.2 有机质成熟度
上扬子地区五峰组—龙马溪组页岩有机质成熟度总体较高,RO均大于2%,属高-过成熟演化阶段(图4)。四川盆地内以川东北达州—万州地区成熟度演化程度最高,RO值大于3.4%,向盆地边缘方向逐渐减小。盆地南缘长宁—涪陵一带为热演化相对高值区,RO值大于3.0%。除此之外,南江区块RO值在1.74%~2.83%;涪陵东南部区块RO值在2.8%~3.2%之间,綦江区块RO值在2.2%~3.0%,均处于高-过成熟阶段,总体热演化程度较高,具备一定的生气能力。
图4 上扬子地区五峰组—龙马溪组RO分布图Fig.4 The distribution of maturity of organic matter(RO)of Wufeng-Longmaxi Formations in Upper Yangtze Region
2.3 储层物性
孔隙度既可能受矿物组分、有机质生排烃、成岩压实作用强度等因素的影响,还可能受构造应力差异的影响。通过对上扬子地区五峰组—龙马溪组页岩孔隙度对比分析,五峰组—龙马溪组页岩孔隙度总体介于2.11%~12.46%,其中靠近川中隆起的孔隙度较高,川中古陆西南缘威远—华蓥一带、川南长宁及焦石坝地区页岩孔隙度均超过5%,其中威远地区超过7%。结合前人资料揭示,四川盆地五峰组—龙马溪组页岩的孔隙度总体略高于盆外复杂区(刘树根等,2014),总体表现为由盆内往盆外方向,孔隙度呈总体降低的趋势(图5)。而渗透率相对稳定,集中分布于0.0014~0.5200mD。分析表明,中上扬子地区五峰组—龙马溪组页岩具有低孔隙度、超低渗透率的物性特征。
图5 上扬子地区五峰组—龙马溪组孔隙度分布图Fig.5 The distribution of porosity of Wufeng-Longmaxi Formation in Upper Yangtze Region
2.4 脆性矿物
通过对上扬子地区五峰组—龙马溪组页岩矿物组分的分析,四川盆地五峰组—龙马溪组页岩脆性矿物含量普遍较高,均大于40%,其中长宁、威远、黔江等地可达60%,而由盆内沿南东、南西向盆外,其脆性矿物含量逐渐降低,至攀西、湘鄂西等地脆性矿物含量降至40%左右(图6)。
图6 上扬子地区五峰组—龙马溪组脆性指数展布图Fig.6 The distribution of brittle minerals of Wufeng-Longmaxi Formations in Upper Yangtze Region
2.5 压力系数
上扬子地区页岩气勘探实践表明,四川盆地内页岩储层压力系数大于盆外复杂构造区页岩压力系数(图7)。盆内除部分五峰组—龙马溪组页岩出露区附近压力系数较低外,其余深埋藏地区页岩储层普遍表现为异常高压—超高压,压力系数介于1.5~2.5,尤其以盆内威远、内江、涪陵和富顺-永川等地区压力系数高为特征,压力系数超过2.0,为异常超高压-高压地层区;川东高陡带背斜区压力系数稍低,如广安、邻水、垫江等地,压力系数介于1~1.5,为常压-次高压地层区,显示受构造作用影响,页岩气保存条件相对次有利。研究表明,盆内构造稳定区页岩气保存条件总体较好,而盆外复杂构造区,受差异性改造作用的影响,页岩气保存条件差异化明显,以雪峰山西侧复杂构造区为例,其受控于多期构造叠加变形改造的影响,龙马溪组地层较盆内埋深浅、隆升剥蚀作用强,地层压力系数一般小于1.2,为常压或者低压,显示总体保存条件较差。
3 多元线性回归分析模型
3.1 多元线性回归分析基本原理
多元线性回归分析是一种基于自变量与因变量相关关系的数学分析方法(郑庆玉等,2002;唐万梅,2006)。本文以各地质参数为自变量,以含气量为因变量,运用该方法进行回归分析。假设因变量y与i个预测变量相关,多元回归模型的通式为:
式中:y为因变量,x1、x2…xi,为自变量;β0,β1,β2,…βi为回归系数,ε为随机误差,服从正态分布N(0,σ2)。
对含气量y及各地质参数x1,x2,…,xi进行n组抽样观察,将观察结果代入式(1)。假设回归系数β0,β1,…βi的估算值为b0,b1,…,bi,计算回归估算值与真实值间的差值(又称为残差),根据最小二乘原理,使残差平方和达到最优化,从而求解出b0,b1,…,bi,即为回归系数,将该值代入式(1)得出回归方程。
多元线性回归方程可通过对回归系数及回归方程的显著性检验,来验证变量间是否存在线性联系。若β0,β1,…βi不全为零,则表明各变量间线性显著,若全为零,表明线性不显著。同时,给定检验水平α,通过查表获取Fα(p,n-p-1)并对比F大小关系,检验回归方程效果显著程度(式2)。
回归方程显著性检验公式:
3.2 多元线性回归模型构建
根据前文页岩气有利区主要地质参数,在排除自相关自变量后选定的自变量为埋深、TOC、RO、孔隙度、渗透率、脆性矿物及压力系数,因变量为含气量。受各自变量不在同一数量级的影响,其对因变量的影响程度存在巨大差异,因此,本文首先对各自变量数据进行无量纲化处理,避免因原始数据的原因造成对模型应用的误差。
本文原始数据按式(3)进行归一化处理,x'为归一化处理后数据;x为原始数据;xmin为原始数据中最小值;xmax为原始数据中最大值。
通过归一化数据建立样本集后,结合多元线性回归模型进行回归分析,并对页岩气有利区优选地质参数进行拟合分析,以揭示每个自变量实际值与拟合值之间的拟合度(表1)。得到回归方程后,分别进行回归方程和回归系数的显著性检验(表2、3)。
表1中标准误差用来衡量拟合程度的大小,标准误差为0.122591,说明拟合程度好。Multiple R(复相关系数R)为自变量与因变量的相关系数,用来衡量含气量与各地质参数的相关程度。本例R=0.884992,说明页岩含气量与各地质参数间呈显著正相关关系。R Square(R2)为复测定系数,用来指示自变量对因变量y的可解释程度,以测定因变量y的拟合效果。本例R2=0.78321,表明用自变量可解释因变量变化的78.32%。
表1 多元线性回归模型回归统计表Table1 Statistical table of multiple linear regression model
表2中F显著性统计量(Significance F)值为2.33×10-12,远小于显著性水平0.05,且参数常数不为0,说明该回归方程回归效果显著,用线性回归分析含气量与地质参数可信。
表2 多元线性回归模型方差分析表Table2 Variance analysis table of multiple linear regression model
表3中相关系数为各地质参数在多元线性回归模型(式1)中的常数项(即b1~b7的值),据此可得出估算的回归方程。P-value为回归系数t统计量的P值。其中埋深、TOC、脆性矿物和压力系数的t统计量的P值小于显著性水平0.05,说明他们与含气量显著线性相关。RO和渗透率的t统计量的P值为0.05529和0.081462,稍大于显著性水平0.05,说明该参数与含气量的线性相关性较弱。而孔隙度的t统计量的P值远大于0.05,说明其回归系数不显著,揭示孔隙度与含气量线性关系不明显。页岩气勘探实践表明,孔隙度和渗透率是沉积条件、储集条件、保存条件的综合反映,揭示页岩储层的连通性能。保存条件较好的区域,孔隙度和渗透率与含气性存在弱的正相关性,孔渗条件好可促进游离气地汇聚;而保存条件较差的地区,较高的孔隙度和渗透率将加快游离气逸散,使页岩含气性降低。由此表明,孔隙度、渗透率与页岩含气性没有明显的正相关性,与多元线性回归模型分析结果相符。
表3 多元线性回归模型参数方差分析表Table3 Analysis table of parameter variance of multiple linear regression model
3.3 页岩气有利区量化优选公式
根据回归方程中各参数的相关系数,通过拟合公式(2)进行拟合计算,得出各参数与页岩气有利区的多元线性回归拟合公式为:
4 新方法试验及应用
4.1 试验步骤
本文运用克里格法对各地质参数等值线图进行网格化处理,同时综合参考有利区优选标准、页岩气生气门限、低孔低渗界定标准等各个评价指标因素范围,确定各因素的标准化取值范围与方式。在此基础上,基于Sufer软件Grid Math功能,对各网格图件数据体进行标准化处理和加权叠加(图8),再通过对栅格数据结构的图层叠加,最终获得基于多元线性分析的页岩气有利区分布(图9)。
图8 基于Sufer数据化后的部分页岩气地质参数平面分布图Fig.8 The quantitative plane distribution of shale gas geological parameters based on Sufer
4.2 有利区评价
通过对页岩气地质参数的多元线性回归分析和加权叠加,其成果图件对于上扬子页岩气有利区分布特征展现得更为清晰(图9)。图中所示红色为有利区,黄绿色为较有利区,蓝色为一般区域。其中,有利区分布主要集中在四川盆地内部,包括威远—自贡一线、宜宾—泸州—涪陵一线和川东区域为主。其分布区域均处于深水陆棚相带,富有机质泥岩厚度20~80m,TOC为2.0%~6.0%,孔隙度3.0%~7.5%,脆性矿物含量高,总体大于40%,局部超过80%,埋深均超过3000m,局部超过5000m,RO为2.0%~4.0%,压力系数总体大于2,部分埋深较浅区域压力系数在1~1.5之间。盆外有利区压力系数迅速降低,相对有利区集中在各向斜核部,如昭通、金沙、道真和黔江区域,其余区域页岩气勘探潜力低。
对比四川盆地页岩气有利区实际勘探图发现(董大忠等,2016;Dazhong et al.,2016),经多元线性回归分析量化计算形成的有利区范围及分布,与之吻合性较好(图9和图10)。前人研究主要根据经验对各地质参数进行人为排序,再通过简单叠加划定有利区,该方法仅能显示有利区范围及分布,无法直观地对各有利区之间和有利区范围内的资源潜力作出比较;而运用本量化优选方法,通过定量评价各参数权重并进行加权叠加,最终定量评价有利区的空间分布。其成果图件不仅通过区分颜色就能清晰、直观、快捷地辨别各有利区分布,还能通过颜色深浅精细刻画有利区内资源潜力的变化趋势,这将更加有力地指导页岩气勘探部署。
图9 基于多元线性回归方法的页岩气有利区分布图Fig.9 The distribution of favorable areas for shale gas based on multi-linear regression analysis
图10 四川盆地页岩气田分布(据Dong et al.,2016修改)Fig.10 Distribution of shale gas fields in the Sichuan Basin(modified from Dong et al.,2016)
5 结论
(1)以页岩埋深、TOC、RO、孔隙度、渗透率、脆性矿物及压力系数等参数为自变量,含气量为因变量,对上述参数进行标准化处理并统计分析,得到的相关权重排序为:埋深、TOC、脆性矿物和压力系数、RO、孔隙度、渗透率,代表对有利区含气量的影响作用由大至小。
(2)基于多元线性回归分析量化评价的页岩气有利区,可清晰、直观地精细刻画有利区范围间和范围内的有利程度,精准指导页岩气勘探部署,有效降低勘探的风险性;其拟合性好,可靠性高,尤其针对参数较多的预测模型,其结果更为准确。多元线性回归分析强调单纯的数学统计,未加入任何地质意义,故对使用人员的地质经验要求不高,但正因为其数学统计的属性,故需要一定量的地质数据,因此该方法更适合具有一定页岩气地质资料的区域开展工作。