基于最小二乘支持向量机测井识别火山岩类型:以辽河盆地中基性火山岩为例
2015-07-03王祝文黄玉龙周大鹏
牟 丹,王祝文,黄玉龙,许 石,周大鹏
1.吉林大学地球探测科学与技术学院,长春 130026 2.吉林大学地球科学学院,长春 130061
基于最小二乘支持向量机测井识别火山岩类型:以辽河盆地中基性火山岩为例
牟 丹1,王祝文1,黄玉龙2,许 石1,周大鹏1
1.吉林大学地球探测科学与技术学院,长春 130026 2.吉林大学地球科学学院,长春 130061
最小二乘支持向量机是在统计学习理论基础上发展起来的模式识别方法。与传统统计学相比,它能有效解决有限样本、非线性、高维数模型的建立问题,而且建立的模型具有很好的预测性能。岩性识别本质是解决分类问题,本文基于最小二乘支持向量机解决分类问题的优势,首先用GR、CNL、DEN、AC、RLLD等常规测井曲线数据建立样本空间;然后通过耦合模拟退火和交叉验证的方法寻找最佳参数,优化最小二乘支持向量机分类器;最后建立了最小二乘支持向量机岩性识别模型。通过取心段岩心描述和岩心/岩屑薄片鉴定,确定辽河盆地40口井315 m井段2 520个岩性样品作为训练样本,建立岩性识别标准。对8口井13 866 m井段110 928个火山岩数据采样点进行测井识别,可识别致密玄武岩、气孔玄武岩、粗面岩等8种主要火山岩类型。识别结果与8口测试井中316个有取心段岩心描述和岩心/岩屑薄片的精确岩矿定名对比,符合率达到75.2%,与以往测井识别复杂火山岩岩性相比,在识别准确率和效率上都有明显提高。
最小二乘支持向量机; 辽河东部坳陷; 火山岩; 岩性分类
0 引言
支持向量机(support vector machines,SVM)是20世纪90年代在统计学习理论的结构风险最小化原则基础上发展起来的[1],它根据有限样本信息在模型的复杂性和学习能力之间寻求最佳折衷,使其成为一个强有力的非线性估计工具。最小二乘支持向量机(LS-SVM)是一种特殊形式的SVM[2-3]。它是以二次损失函数为经验风险,以等式约束代替不等式约束,从而使得SVM的求解问题转化成了求解一个线性方程组的问题。在LS-SVM训练过程中, 正则化因子和核参数的选择对模型精度、复杂度、变量存储空间和计算量都有很大影响。常见的参数优化方法有:K重交叉验证法、遗传算法、粒子群算法、贝叶斯证据框架、模拟退火等[4-6]。随着LS-SVM性能的提升,其应用领域越来越广,目前已应用于模式识别、软测量、控制、故障诊断等方面,涉及化工、食品、医药、金融、电子等多个领域。
辽河盆地火山岩广泛发育,不同的火成岩类型在储层特征、成藏方面都表现出明显差异,因而岩性识别是火成岩及其储层和油气藏研究的基础。利用测井方法进行岩性识别,常用的交会图法[7]实质上是测井响应方程的图解形式,具有简便、直观的优点。判别分析法、聚类分析法、主成分分析法等[8]多元统计分析技术使测井识别进入了自动识别阶段。成像测井技术[9-10]相比于常规测井方法能直观地反映岩石的结构和构造特征。地层元素测井[11-13]通过测量地层中各种元素的含量进行岩性识别,可以有效地识别过渡性岩性。模式识别中的神经网络方法[14]具有自组织、自学习、高度非线性和容错能力强的特点,该方法广泛应用于岩性识别。以上岩性识别方法各有优势,但针对辽河盆地火山岩成分复杂、种类繁多,以常规测井方法为主,研究区识别井段数量多等现实问题,却存在着诸多局限性,致使本区测井-火山岩岩性识别一直是技术难题。
SVM的训练样本中只有支持向量对分类有意义,因此SVM在训练样本数量有限的条件下,就可以实现分类的目标;它通过核函数把样本空间映射到高维的特征空间,解决了低维空间线性不可分的问题。基于SVM以上两点优势,国内学者把SVM应用在测井岩性识别领域,利用研究区内对岩性敏感的测井曲线建立样本空间,有效地识别了沉积岩和火山岩岩性[15-17]。LS-SVM作为SVM的一种扩展,它将模型的优化问题转化成求解线性方程组,使得模型的训练速度更快,参数确定更简便,目前也有学者将LS-SVM应用于沉积岩岩性识别[18]。笔者在前人研究成果的基础上,采用基于LS-SVM[19]岩性测井识别方法识别辽河盆地中基性火山岩。过程如下:首先,用常规测井曲线自然伽马(GR)、中子(CNL)、密度(DEN)、声波时差(AC)、电阻率(RLLD)数据建立样本空间,对LS-SVM模型进行训练,使模型达到最优;然后,对8口测试井进行岩性识别,识别结果与有取心段岩心描述和岩心/岩薄片的火山岩岩性样品对比,计算符合率;最后,结合地质学知识对识别结果分析和讨论。
1 LS-SVM的基本原理
SVM在有限样本的机器学习问题上建立了一套较完整的理论体系。这一理论方法在解决模式识别小样本、非线性及高维数的识别问题中具有良好的应用前景。SVM是从线性分类的最优分类超平面发展起来的[20-22]。在特征空间Rd中,设训练样本为 (xi,yi),其中i=1, 2, …,n,yi∈{1, -1},yi=1和yi=-1分别代表两个不同的类别。线性分类模型可以用{yi|yi=ω·xi+b}表示。线性方程ω·xi+b=0,对应于特征空间Rd中的一个超平面,其中ω是超平面的法向量,b是超平面的截距。这个超平面将特征空间划分为两个部分,位于两部分的点(特征向量)分别被分为正负两类。分类间隔用M表示,我们的目标是使分类间隔最大化。从图1可以看出,分类间隔M2>M1,当分类间隔是M2时,分类效果更好。图2为SVM解决两分类问题的具体流程。
图1 二维线性可分向量空间的最优分类线Fig.1 Optimal hyper plane of separable feature space
图2 SVM解决两分类问题的流程Fig.2 Two types process of SVM
对于线性不可分问题,SVM建模的主要思想是:首先,用事先确定的核函数定义的非线性映射φ(x)将样本映射到高维特征空间;然后,在这个高维特征空间中构造最优分类面,使得在高维特征空间中有可能对训练数据实现超平面的分割,避免了在原输入空间中进行非线性曲面分割的计算。如图3所示[23]。
图3 低维向量空间线性不可分映射到高维向量空间线性可分Fig.3 From nonlinear separable in low dimensions to Linear classification in higher dimensions after projection
通过非线性映射,样本映射到高维空间之后,能够线性分隔的概率增加,但是对于某些情况仍然很难处理。比如数据有噪音。图4中用黑圈圈起来的那个点偏离了半空间,如果去除此点,分类间隔会由M1变为M2。 针对这种情况,SVM允许数据点在一定程度上偏离超平面,数据点xi允许偏离超平面的量εi称为松弛变量。
图4 松弛变量的存在使最大分类间隔减小示意图Fig.4 Outlier make maximum margin classifier smaller
LS-SVM是松弛变量为二次的SVM,可以等效为求解以下优化问题:
(1)
其中:γ是正则化参数,用于控制目标函数中两项之间的权重。用Lagrange方法求解这个优化问题:
(2)
其中,α=[α1,α2,…,αn]是Lagrange乘子。根据优化条件
可得
(3)
合成线性方程组如下:
(4)
定义核函数:
(5)
本文选择径向基核函数
(6)
作为核函数。方程组中正则化参数γ和径向基核函数的宽度参数σ通过耦合模拟退火算法和交叉验证的方法优化[24-25]。通过求解方程组(4),可以确定决策函数:
(7)
2 LS-SVM用于辽河盆地中基性火山岩岩性识别
本文研究范围主要为辽河盆地东部坳陷。结合勘探中火山岩储层研究的实际需求和测井识别的可行性,根据火成岩岩性三级分类原则[26-27],按岩石成岩方式(强调冷凝或压实固结两种成岩方式)将本区火成岩划分六大类:火山熔岩类、火山碎屑熔岩类、火山碎屑岩类、沉火山碎屑岩类、浅成岩和次火山岩、深成岩;参考IUGS的TAS分类方案,主要针对本区新生代火山岩岩性分布特点,兼顾中生代,按岩石常量元素化学成分将本区火成岩划分为基性、中性两大类;按矿物成分、特征结构、火山碎屑粒级及其比例将本区的火山岩确定为15种基本岩石类型(表1)。
像CRISPR、锌指和TALENs这样的新技术也面临着同样的文化阻力,或者像第一代转基因生物一样,也要面临各种繁文缛节。不过,美国农业部于2018年3月宣布,不再对基因编辑技术导致突变的农作物进行监管,因为这类突变类似传统育种过程,只要没有远距离引入遗传物质,就可不用监管。
表1 辽河东部坳陷地区火成岩分类表
Table 1 Classification of volcanic rocks in the Eastern sag of Liaohe basin
结构大类成分大类基本岩石类型火山熔岩类基性致密玄武岩、气孔玄武岩、角砾化玄武岩中性安山岩、粗安岩、粗面岩、角砾化粗面岩火山碎屑熔岩类中性粗面质角砾熔岩火山碎屑岩类基性玄武质角砾岩、玄武质角砾凝灰岩中性粗面质角砾岩沉火山碎屑岩类基性玄武质沉凝灰岩中性粗面质沉凝灰岩浅成岩和次火山岩基性辉绿岩深成岩基性辉长岩
2.1 区分火成岩与非火成岩岩性
根据研究区火成岩分布特点,选取本区40口井315 m井段2 520个岩性样品作为训练样本(xi,yi),i=1, 2, …,n,则y=1代表火成岩分类,y=-1代表非火成岩分类。训练样本分为两类:一类为火成岩标准数据,包括15种火成岩岩性,共1 660个数据采样点;另一类为非火成岩标准数据,共860个数据采样点。对训练样本进行LS-SVM模型训练,样本训练的精度取决于LS-SVM模型中的参数确定过程,确定LS-SVM岩性识别模型。
选取具有较好井眼条件、有岩心分析数据并且常规5种测井曲线参数齐全的8口测试井的13 866 m井段110 928个火成岩数据采样点作为测试样本,用火成岩与非火成岩LS-SVM分类模型区分火成岩与非火成岩岩性,提取火成岩数据,结果如表2所示。将测试结果与岩心数据进行对比,经验证,LS-SVM火成岩与非火成岩样本训练的精度达到99%以上。该程序是在matlab2012年版本下实现的。LS-SVM进行岩性识别的具体流程如图5所示。
表2 8口测试井提取的火山岩个数统计表
Table 2 Statistics showing the number of volcanic rocks in 8 testing wells
井名测试数火成岩样本数H23148054742D29196104399K3799202420K3894431845J26184993542O41131142618O4481721327H95173652765
图5 LS-SVM岩性识别流程Fig.5 Lithology identification process of LS-SVM
2.2 识别15种火成岩岩性
分别运行LS-SVM识别第i种岩性与非第i种岩性的程序15次,则识别出测试井中所有的火成岩种类。将测试结果与岩心数据进行对比,经验证,火成岩岩性识别模型的样本训练的精度均在97%以上。识别结果既为第i种岩性,又为第j种岩性的地层,称为识别结果的多解性。校正多解性地层的岩性,以岩矿鉴定的结果为标准。识别结果与取心段岩心描述和岩心/岩屑薄片鉴定结果不符,称为识别结果的误判。误判地层的岩性,根据辽河东部坳陷火山岩测井响应众值范围及响应特征(表3)进行岩性校正。实际地层对应点的测井响应的读取是按照通用的取值方法进行的,即在岩性稳定层段采集测井曲线样本数据值。
3 结果与讨论
3.1 LS-SVM岩性测井识别的准确性
将取心段岩心描述和岩心/岩屑薄片鉴定结果作为岩性定名的标准,薄片已经做深度归位,将地质取样和测井数据做深度对应处理,并且薄片的选取都是来自岩性稳定的岩性段。本文将LS-SVM岩性测井识别与岩矿鉴定结果对比计算其符合率,以此检验LS-SVM岩性测井识别的准确性。8口测试井共316个有取心段岩心描述和岩心/岩屑薄片的火成岩岩性样品,LS-SVM岩性测井识别结果与这些岩性样品的对比(表4)表明,各口井及井段的符合率有所差别,最高85.3%,最低67.2%,平均为75.2%。本文的火山岩岩性测井识别符合率比原始录井和测井综合定名结果符合率有明显提高。
辽河盆地火山岩的分类复杂多样,利用测井响应特征的差异区分岩性。岩性的变化主要是指岩石中矿物成分的变化,没有考虑到岩石的结构构造。因此,矿物成分类似但结构、构造不同岩石的物理性质反映呈交叉现象,导致LS-SVM岩性测井识别结果出现多解性或者误判。对8口测试井LS-SVM岩性测井识别结果中易出现多解性的岩石类型进行总结,结果如表5所示。岩性识别结果表明,LS-SVM可准确识别致密玄武岩、气孔玄武岩、角砾化玄武岩、安山岩、粗安岩、粗面岩、角砾化粗面岩、粗面质沉凝灰岩8种主要火山岩类型。识别结果的多解性是LS-SVM岩性测井识别与岩矿岩性识别结果符合率低的主要原因,当识别结果出现多解性时,需要将测井信息同地质信息结合起来才能对地层剖面做出准确的刻画。
表3 辽河东部坳陷火山岩测井响应众值范围及响应特征统计表
注:英尺(ft)为非法定计量单位,1 ft=0.304 8 m,下同。
表4 LS-SVM岩性测井识别符合率统计表
以J26井3 677~3 753 m为例,结合测井及岩矿识别结果综合分析(图6)。深度为3 680~3 688 m的地层,LS-SVM岩性测井识别的结果为辉绿岩/辉长岩, 辉长岩是一种基性深层侵入岩石, 辉绿岩成分相当于辉长岩的浅成岩,两者矿物成分类似导致测井响应差别不大,因此测井识别的结果出现多解性。岩矿岩性识别可以区分结构不同的辉绿岩和辉长岩,识别结果为辉绿岩。
图6 J26井3 677~3 753 m岩性识别结果Fig.6 Identification results of well J26, 3 677-3 753 m
图7 H23井3 498~3 552 m岩性识别结果Fig.7 Identification results of well H23, 3 498-3 552 m
3.3 LS-SVM岩性测井识别的针对性和适用性
辽河盆地火山岩广泛发育,按照火山岩的成因、矿物成分、结构的差异分为15种基本岩石类型。研究区共需要识别的完钻井310口,这310口井常规测井曲线齐全,但成像测井资料、元素测井资料有限,针对辽河盆地火山岩成分复杂、种类繁多、常规测井系列为主、识别井段数量多的特点,笔者采用对岩性敏感的GR、CNL、DEN、AC、RLLD常规5条测井曲线建立LS-SVM岩性识别模式,实现了全井段快速自动识别。
表5 LS-SVM岩性测井识别多解性的岩石类型
Table 5 Multiplicity for the types of rock in LS-SVM lithology logging identification
多解性分类岩石类型组合1玄武质角砾岩、玄武质角砾凝灰岩、玄武质沉凝灰岩2粗面质角砾岩、粗面质角砾熔岩3辉绿岩、辉长岩
以H23井3 498~3 552 m为例,综合录井、薄片定名、岩矿鉴定岩性识别结果分析LS-SVM岩性测井识别的适用性(图7):1)根据测井响应特征的差异,岩性测井识别与原始录井相比岩性分界面的划分更为准确;2)深度为3 521~3 540 m的地层, 岩性测井识别结果与薄片定名一致,均为玄武岩(包括致密玄武岩、气孔玄武岩、角砾化玄武岩);3)深度为3 521~3 540 m的地层, 岩性测井识别与岩矿鉴定岩性识别结果一致,均为玄武岩。气孔玄武岩气孔构造的发育使得密度减小,根据密度的变化可以把气孔玄武岩从玄武岩中区分出来。
4 结论
1)本文在辽河东部凹陷地区火成岩分类方案的基础上,以地质取心薄片定名的岩性数据为标准,建立了LS-SVM的火山岩岩性识别模型,并对区内8口测试井进行岩性识别,可准确识别致密玄武岩、气孔玄武岩、角砾化玄武岩、安山岩、粗安岩、粗面岩、角砾化粗面岩、粗面质沉凝灰岩8种主要火山岩类型。
2)LS-SVM火山岩岩性识别模型通过核函数把样本空间映射到高维的特征空间,将模型的优化问题转化成求解线性方程组,提高了识别的准确率和效率。
3)该方法不仅能有效确定不同岩性地层的厚度和分界线,而且可将岩性的分类更加细化,识别模型操作简单,可进行全井段自动识别,识别结果平均正确率达到75%以上。
[1] Vapnik V N. An Overview of Statistical Learning Theory[J]. IEEE Trans Neural Network, 1999, 10(5): 988-999.
[2] Suykens J A K, Vandewalle J. Least Squares Support Vector Machine Classifiers[J]. Neural Processing Letters , 1999, 9(3): 293-300.
[3] Suykens J A K, De Brabanter J, Lukas L, et al. Weighted Least Squares Support Vector Machines: Robustness and Sparse Approximation[J]. Neurocomputing, 2002, 48: 85-105.
[4] 李锋, 汤宝平, 章国稳. 基于舍一交叉验证优化最小二乘支持向量机的故障诊断模型[J]. 振动与冲击, 2010, 29(9): 170-174. Li Feng, Tang Baoping, Zhang Guowen. Fault Diagnosis Model Based on Least Square Support Vector Machine Optimized by Leave-One-Out Cross-Validation[J]. Journal of Vibration and Shock , 2010, 29(9): 170-174.
[5] 陈刚, 王宏琦, 孙显. 基于核函数原型和自适应遗传算法的SVM 模型选择方法[J]. 中国科学院研究生院学报, 2012, 29(1): 62-69. Chen Gang, Wang Hongqi, Sun Xian. Model Selection for SVM Classification Based on Kernel Prototype and Adaptive Genetic Algorithm[J]. Journal of Graduate University of Chinese Academy of Sciences, 2012, 29(1): 62-69.
[6] 刘鲭洁, 陈桂明, 刘小方, 等. 基于遗传算法的 SVM 参数组合优化[J]. 计算机应用与软件, 2012, 29(4): 94-100. Liu Qingjie, Chen Guiming, Liu Xiaofang, et al. Genetic Algorithm Based on SVM Parameter Composition Optimization[J]. Computer Applications and Software, 2012, 29(4) : 94-100.
[7] 王璞珺,衣健,陈崇阳, 等. 火山地层学与火山架构:以长白山火山为例[J]. 吉林大学学报:地球科学版,2013, 43(2): 319-336. Wang Pujun, Yi Jian, Chen Chongyang, et al. Volcanostratigraphy and Volcanic Architecture of the Changbaishan Volcanos, NE, China[J]. Journal of Jilin University: Earth Science Edition, 2013, 43(2): 319-336.
[8] 王淑盛, 徐正光, 刘黄伟, 等. 改进的K近邻方法在岩性识别中的应用[J]. 地球物理学进展, 2004, 19(2): 478-480. Wang Shusheng, Xu Zhengguang, Liu Huangwei, et al. The Advanced K-Nearest Neighborhood Method Used in the Recognition of Lithology[J]. Progress in Geophysics, 2004, 19(2): 478-480.
[9] 周波, 李舟波, 潘保芝, 等. 火山岩岩性识别方法研究[J]. 吉林大学学报:地球科学版,2005, 35(3): 394-397. Zhou Bo, Li Zhoubo, Pan Baozhi, et al. A Study on Lithology Identification Methods for Volcanic Rocks[J]. Journal of Jilin University: Earth Science Edition, 2005, 35(3): 394-397.
[10] 王军, 杨长春, 许大华,等. 微电阻率扫描成像测井方法应用及发展前景[J]. 地球物理学进展, 2005, 20(2): 357-364. Wang Jun, Yang Changchun, Xu Dahua, et al.Application and Prospect of the Formation Micro Resistivity Image Well Logging[J]. Progress in Geophysics, 2005, 20(2): 357-364.
[11] 李舟波, 王祝文. 科学钻探中的元素测井技术[J]. 地学前缘, 1998, 5(1/2): 119-130. Li Zhoubo, Wang Zhuwen. Technique of Elemental Logging in Scientific Drilling Project[J]. Earth Science Frontiers, 1998, 5(1/2): 119-130.
[12] 程希, 任战利. 利用地球化学元素与矿物关系识别GS油田下干柴沟组地层岩性[J]. 地球物理学进展, 2008, 23(6): 1903-1908. Cheng Xi, Ren Zhanli, Identification of Ganchaigou Group Rock Lithology in the GS Oilfield by Relationship Between Elements and Minerals Using Geochemical Logging Technology[J]. Progress in Geophys, 2008, 23(6): 1903-1908.
[13] 袁祖贵, 成晓宁, 孙娟. 地层元素测井(ECS):一种全面评价储层的测井新技术[J]. 原子能科学技术, 2004, 38(增刊): 208-213. Yuan Zugui, Cheng Xiaoning, Sun Juan. ECS: New Well-Logging Technique for Completely Evaluating the Reservior[J]. Atomic Energy Science and Technology, 2004, 38(Sup. ): 208-213.
[14] 张治国, 杨毅恒, 夏立显. 自组织特征映射神经网络在测井岩性识别中的应用[J]. 地球物理学进展, 2005, 20(2): 332-336. Zhang Zhiguo, Yang Yiheng, Xia Lixian. The Application of Self-Organizing Feature Map Neural Network to Logging Lithological Identification[J]. Progress in Geophysics, 2005, 20(2): 332-336.
[15] 于代国, 孙建孟, 王焕增, 等. 测井识别岩性新方法:支持向量机方法[J]. 大庆石油地质与开发, 2005, 24(5): 93-96. Yu Daiguo, Sun Jianmeng, Wang Huanzeng, et al. A New Method for Logging Lithology Identification: SVM[J]. Petroleum Geology & Oilfield Development in Daqing, 2005, 24(5): 93-96.
[16] 朱怡翔, 石广仁. 火山岩岩性的支持向量机识别[J]. 石油学报, 2013, 34(2): 312-322. Zhu Yixiang, Shi Guangren. Identification of Litho-logic Characteristics of Volcanic Rocks by Support Vector Machine[J]. Acta Petrolei Sinica, 2013, 34(2): 312-322.
[17] 张莹, 潘保芝. 支持向量机与微电阻率成像测井识别火山岩岩性[J]. 物探与化探, 2011, 35(5): 634-642. Zhang Ying, Pan Baozhi. The Application of SVM and FMI to the Lithologic Identification of Volcanic Rocks[J]. Geophysical & Geochemical Exploration, 2011, 35(5): 634-642.
[18] 韩学辉, 卢时林, 支乐菲, 等. 应用最小二乘支持向量机识别J13井区杜家台油层岩性[J]. 特种油气藏, 2011, 18(6): 18-21. Han Xuehui, Lu Shilin, Zhi Lefei, et al. Identification of the Lithology of Dujiatai Formation in J13 Well Block with Least Squares Support Vector Machine[J]. Special Oil and Gas Reservoirs, 2011, (18)6: 18-21.
[19] 张学工. 关于统计学习理论与支持向量机[J]. 自动化学报, 2000, 26(1): 32-42. Zhang Xuegong. Introduction to Statistical Learning Theory and Support Vector Machines[J]. Acta Automatica Sinica, 2000, 26(1): 32-42.
[20] 阎威武, 邵惠鹤. 支持向量机和最小二乘支持向量机的比较及应用研究[J]. 控制与决策, 2003, 18(3): 358-360. Yan Weiwu, Shao Huihe. Application of Support Vector Machines and Least Squares Support Vector Machines to Heart Disease Diagnoses[J]. Control and Decision, 2003, 18(3): 358-360.
[21] 阎辉, 张学工, 李衍达. 支持向量机与最小二乘法的关系研究[J]. 清华大学学报:自然科学版, 2001, 41(9): 77-80. Yan Hui, Zhang Xuegong, Li Yanda. Relation Between a Support Vector Machine and the Least Square Method[J]. Journal of Tsinghua Univetsity: Science &Technology, 2001, 41(9): 77-80.
[22] 顾燕萍, 赵文杰, 吴占松. 最小二乘支持向量机的算法研究[J]. 清华大学学报:自然科学版 , 2010, 50(7): 1063-1066. Gu Yanping, Zhao Wenjie, Wu Zhansong. Least Squares Support Vector Machine Algorithm[J]. Journal of Tsinghua University: Science & Technology, 2010, 50(7): 1063-1066.
[23] Maysam A, Gholam H N, Abbas B. Support Vector Machine for Multi-Classification of Mineral Prospectivity Areas[J]. Computers & Geosciences, 2012, 46: 272-283.
[24] 郭辉, 刘贺平, 王玲. 最小二乘支持向量机参数选择方法及其应用研究[J]. 系统仿真学报, 2006, 18(7): 2033-2036. Guo Hui, Liu Heping, Wang Ling. Method for Selecting Parameters of Least Squares Support Vector Machines and Application[J]. Journal of System Simulation, 2006, 18(7): 2033-2036.
[25] 王健峰, 张磊, 陈国兴, 等. 基于改进的网格搜索法的SVM参数优化[J]. 应用科技, 2012, 39(3): 28-31. Wang Jianfeng, Zhang Lei, Chen Guoxing, et al. A Parameter Optimization Method for an SVM Based on Improved Grid Search Algorithm[J]. Applied Science and Technology, 2012, 39(3): 28-31.
[26] 黄玉龙, 王璞珺, 舒萍, 等. 松辽盆地营城组中基性火山岩储层特征及成储机理[J]. 岩石学报, 2010, 26(1):82-92. Huang Yulong, Wang Pujun, Shu Ping,et al.Characteristics and Formation Mechanism of the Cretaceous Intermediate and Mafic Volcanic Reservoirs in Songliao Basin[J]. Acta Petrologica Sinica, 2010, 26(1):82-92.
[27] 王璞珺,郑常青,舒萍, 等. 松辽盆地深层火山岩岩性分类方案[J]. 大庆石油地质与开发, 2007, 26(4):17-22. Wang Pujun, Zheng Changqing, Shu Ping, et al. Classification of Deep Volcanic Rocks in Songliao Basin[J]. Petroleum Geology & Oilfield Development in Daqing, 2007, 26(4):17-22.
Application of Least Squares Support Vector Machine to Lithology Identification: Taking Intermediate/Basaltic Rocks of Liaohe Basin as an Example
Mou Dan1, Wang Zhuwen1, Huang Yulong2, Xu shi1, Zhou Dapeng1
1.CollegeofGeoExplorationScineceandTechnology,JilinUniversity,Changchun130026,China2.CollegeofEarthSciences,JilinUniversity,Changchun130061,China
Least squares support vector machine (LS-SVM) is a pattern recognition method developed from the statistical learning theory. Compared with the traditional statistics, LS-SVM can effectively resolve the problems of the finite of samples,non-linearity and high-dimension, and it can achieve accurate prediction. The essence of lithology identification is for classification. We take the advantage of the classification by LS-SVM: at first, the sample space is established by using the conventional logging curves ofGR、CNL、DEN、AC、RLLD; and then, the classifier of LS-SVM is optimized by searching optimal parameters using the simulated annealing algorithm and cross validation method; finally, the model of LS-SVM lithology identification is determined. Through the description of core section and the analysis of core/cuttings, 2 520 samples from the 315 m section of the 40 wells are taken as training samples in Liaohe basin, for establishing the standard of lithology identification. 110 928 logging data from 13 866 m section of the 8 wells are taken as the predicting samples. 8 types of volcanic rocks have been identified such as vesicular basalt,compact basalt,trachyte, et al. In comparison with the 316 samples from 8 wells,the corresponding identification rate is 75.2%. The accuracy and velocity of the LS-SVM lithology identification is improved distinctly compared with other well logging methods.
LS-SVM; Liaohe eastern depression; volcanic rocks; lithology classification
10.13278/j.cnki.jjuese.201502305.
2014-07-02
国家“973”计划项目(2012CB822002)
牟丹(1986--),女,博士研究生,主要从事地球物理测井、测井新方法新技术等方面的解释理论和方法的科研工作,E-mail:mudan-main@163.com
王祝文(1961--),男,教授,博士生导师,主要从事地球物理测井、核地球物理、测井新方法新技术等方面的解释理论和方法的教学与科研工作,E-mail:wangzw@jlu.edu.cn。
10.13278/j.cnki.jjuese.201502305
P631.8
A
牟丹,王祝文,黄玉龙,等. 基于最小二乘支持向量机测井识别火山岩类型:以辽河盆地中基性火山岩为例.吉林大学学报:地球科学版,2015,45(2):639-648.
Mou Dan, Wang Zhuwen, Huang Yulong, et al. Application of Least Squares Support Vector Machine to Lithology Identification: Taking Intermediate/Basaltic Rocks of Liaohe Basin as an Example.Journal of Jilin University:Earth Science Edition,2015,45(2):639-648.doi:10.13278/j.cnki.jjuese.201502305.