利用支持向量机识别松辽盆地火山岩岩性
2014-04-12柳成志滕立惠
柳成志,滕立惠
(东北石油大学,黑龙江 大庆 163318)
利用支持向量机识别松辽盆地火山岩岩性
柳成志,滕立惠
(东北石油大学,黑龙江 大庆 163318)
利用支持向量机(SVM)方法,选取个性特征元素,建立火山岩岩性成分的识别方法,来区分玄武质、安山质、粗面质、英安质、流纹质火山岩岩性.通过对松辽盆地内部的火山岩样本进行学习和预测,火山岩大类平均识别率达到95%以上,表明支持向量机在火山岩岩性成分识别方面取得了良好效果.
松辽盆地;火山岩岩性;支持向量机;核函数
0 引言
近年来随着深层天然气及外围盆地勘探的深入,勘探的目的层主要变为以火山岩岩性为主的地层.以往对火山岩岩性识别主要依靠肉眼观察、薄片鉴定等手段,但由于肉眼观察描述需要深厚的岩石矿物学专业知识和丰富的实践经验,在录井现场工作人员的实践经验还不丰富,无法达到精确判断的需求.而薄片鉴定、化学分析等鉴定手段由于周期长、成本高,不能及时地对现场每个点、层进行识别和描述.所以需要通过开展能够满足各类火山岩个性特征元素分析测定的分析仪器样机研制,对代表性样品元素进行分析.
因此,深入开展火山岩元素识别岩性方法研究,选取不同岩石的个性特征元素,利用支持向量机来建立不同岩石的岩性识别方法,对建立正确的地层岩性剖面,认识火山岩的复杂地质特征具有积极的影响和重要的意义.
支持向量机(Support Vector Machine,SVM)是Cortes和Vapnik于1995年正式提出的[1],以最小化错误率理论界限为思想,以统计学习理论为基础,能较好地解决小样本学习问题的一种新的机器学习方法[2].对于支持向量机的通俗表述,就是在已知样本和部分函数值的情况下,努力寻求某一映射,对未知的函数值进行估计判断[3].与传统的人工神经网络相比,SVM不仅具有坚实的理论基础,而且结构简单,各种技术性能尤其是泛化能力明显提高,因此被广泛应用于模式分类、函数估计及回归分析等领域[4].
1 支持向量机
1.1 支持向量机原理
支持向量机算法的主要思想是寻找一个能将两类样本正确划分,并且使分类间隔最大的平面,即最优分类面.例如给定一组由两类点组成的训练样本(xi,yi),i=1,2, ,n,xi∈Rd,yi∈{+1,-1},其中n为训练集数,d为空间维数,当xi属于第一类,则标记为yi=+1,如果属于第二类,则标记为yi=-1.
图1 最优分类面Fig.1Optimal hyperplane
图1中,N+和N-代表两类样本,P是分类面,P1和P2分别为过各类中离分类线最近的样本且平行于分类线的直线,两者之间的距离叫做分类间隔.
假设存在一个超平面,能将这组训练样本完全分开,使得:
其中<,>代表向量点积.可以把上述不等式合并,写成:
由于参数(w,b)不是唯一确定的,可以相差一个常数因子yi,此时的分类间隔等于2/(‖‖w),间隔最大等价于使‖w‖2最小,满足式(3)且使最小的分类面就是最优分类面.
根据以上分析,求解最优分类超平面可以归结为如下二次优化问题:
这是一个严格的凸规划问题,有唯一的极值点,而函数的极值点就是Lagrange函数的鞍点[5],所以求下列Lagrange函数的鞍点:
其中αi为每个样本所对应的Lagrange乘子,yi为第i个样本的标签,xi为样本点向量.在鞍点处,参数w,b的梯度都为零:
将(6)(7)式代入(5)式中,消去w,b可得原优化问题的Wolfe对偶问题,即在约束条件下,对αi求解下列函数W(α)的最大值:
利用任一支持向量和KKT条件,依据在鞍点处,对偶变量与约束的乘积为0,即:
这样就可以得到所求的最优分类判别函数:
1.2 核函数
对于一些非线性问题,只要选择适当的核函数,支持向量机就可以先将低维空间的非线性转换为高维空间的线性问题,再将高维空间的点积运算转换为低维空间的核函数运算,从而回到原始的低维空间[3].采用的核函数不同能够导致不同的支持向量机的算法[6-7].目前,支持向量机多使用以下3种核函数:
2 利用化学元素区分火山岩岩性成分大类
2.1 岩性分类流程
松辽盆地深层火山岩地层提供了154个有准确岩心薄片定名资料的数据点,即支持向量机的样本数目为154个,选取其中88个样本作为训练样本,66个样本作为测试样本.
通过对不同岩性火山岩的研究,最终选取Na、Mg、Si、K、Ti、Sr、Ag、In、Ba、Ca 10个元素属性作为样本的输入维数,并且按照SVM的格式输入数据(见表1).将地质上按照岩石常量元素化学成分划分的火山岩类别作为支持向量机的预测结果,即下述5大类:玄武质火山岩类、安山质火山岩类、粗面质火山岩类、英安质火山岩类、流纹质火山岩类.这样样本空间便是10维5类.
选定RBF函数后,确定该模型的参数g以及惩罚参数c.主要采用了Matlab LibSVM分类法确定模型参数(图2):
对于给定的151个数据点的10个元素属性数据,首先选定一组c和g的范围,c=2-6,2-3, 215和g=2-15,2-12, 215,逐渐调小步长,再确定一组参数c=2-5, 20, 215和g=22,23, 2-14,将得到的准确率最高,可知当c=2,g=4时,针对66个样本点的回判分类,共有3个点分类错误,回判正确率为95.5%(图3).
表1 SVM部分输入数据Table 1Input data for SVM
图2 火山岩岩性分类程序Fig.2Classification program of volcanic rocks
图3 火山岩岩性分类的准确率等值线Fig.3Accuracy contour of volcanic rock classification
2.2 结果及讨论
使用Matlab 2010b编写处理数据,利用已经学习后的SVM模型进行火山岩岩性成分识别,结果见表2.由表2可知,采用SVM识别松辽盆地深层火山岩的岩性与实际取心资料进行对比,其中英安质、粗面质火山岩符合率达到100%,说明在小样本的情况下,利用支持向量机能够准确识别火山岩岩性,提高划分精度.
3 结论
(1)利用支持向量机方法来识别火山岩岩性,在小样本、高维和非线性情况下能获得较高的准确率.
表2 支持向量机分析岩性准确率Table 2Accuracy of SVM analysis
(2)在对火山岩岩性成分识别的过程中,支持向量机能够充分发现岩性与个性特征元素之间的映射关系,保证良好的学习效果.
丹东五龙山(五龙山风景区管理委员会提供)
[1]Cortes C,Vapnik V.Support vector networks[J].Machine Learning, 1995,20:273—295.
[2]李艳芳,程建远,王成.基于支持向量机的地震属性优选及煤层气预测[J].煤田地质与勘探,2012,40(6):75—78.
[3]朱永才.基于支持向量机的储层参数预测方法研究[D].成都:西南石油大学,2012:12—13.
[4]王奇安.基于广泛内核的CVM算法研究及参数C的选择[D].南京:南京航空航天大学,2009:1—2.
[5]席少霖.非线性最优化方法[M].北京:高等教育出版社,1992.
[6]Osuna E,Freund R,Girosi F.An improved training algorithm for support vectormachines[A]//NeuralnetworksforsignalprocessingVII.Proceedings of IEEE 1997 workshop.New York.
[7]Vapnik V N.Estimation of dependences based on empirical data[M]. Spring-Verlag,1982.
RECOGNITION OF THE LITHOLOGY OF VOLCANIC ROCKS IN SONGLIAO BASIN BY SUPPORT VECTOR MACHINE
LIU Cheng-zhi,TENG Li-hui
(Northeast Petroleum University,Daqing 163318,Heilongjiang Province,China)
Using the method of support vector machine(SVM),with selection of characteristic elements,an identification method for the lithology of volcanic rocks is established to distinguish the basaltic,andesitic,trachytic,dacitic and rhyolitic volcanic rocks.By learning and prediction of the volcanic rock samples from the Songliao Basin,the average recognition rate for volcanic rocks reaches to 95%and more,showing that the SVM obtain a good result in the identification of volcanic rock component.
SongliaoBasin;lithologyofvolcanicrocks;supportvectormachine;kernelfunction
1671-1947(2014)03-0288-04
P631
A
2013-06-21;
2013-07-30.编辑:张哲.
柳成志(1962—),男,博士,教授,从事层序地层学、成岩作用、油气储层地质学、沉积学、火山岩油气藏研究,通信地址黑龙江省大庆市高新技术开发区发展路199号,E-mail//chzhdq@vip.sina.com