基于最小二乘支持向量机的低孔低渗薄互层油藏水淹层识别方法①
2014-06-14宋金波张剑风宋衍茹
宋金波, 张剑风, 宋衍茹
(1.东北石油大学,黑龙江大庆 163318;2.大庆油田有限责任公司第九采油厂地质大队黑龙江大庆163513;3.大庆工程有限公司,黑龙江大庆 163513)
0 引言
目前,在世界范围内,注水开采的油气产量占了很大比重.由于长期大量的注入水,许多油田已经发生水淹,油田进入了高含水期开采阶段.水淹层解释已成为油田开发生产中的重要工作.大庆西部外围油田低孔低渗泥质砂岩储层岩性复杂,泥质含量高,储层以薄互层为主,导致测井响应不同程度地受到影响而失真,油水层识别难度大,测井解释符合率较低,传统的经验性测井解释逐渐满足不了生产需要.
近年来,支持向量机(SVM)在模式识别中取得了良好的应用.它是由Vapnik在1995年提出的以结构风险最小化为原则的统计学习方法[1],相对于传统统计学的经验风险最小化原则,有效的提高了学习的泛化能力.标准支持向量机通过适当的选择核函数及函数子集,根据有限样本信息在模型复杂性和学习泛化能力之间寻找最佳折中,使分类器的实际风险达到最小[2~3],而Suykens J.A.K[4]在1999年提出的最小二乘支持向量机(Least Squares Support Vector Machine,简称 LSSVM)作为支持向量机的一种,采用最小二乘线性系统作为损失函数,将凸优化的求解过程变成了解一个等式方程组,求解速度相对加快,并且在解决模式识别小样本、非线性及高维识别中表现出一定的优势,具有良好的应用前景[3-6].测井资料的水淹层识别过程则是一个典型的小样本高维非线性模式识别过程,因此,针对低孔低渗透油藏水淹层识别困难现状,本文以大庆西部外围XZ油田为例,给出了LSSVM分类识别方法,建立分类识别模型并验证其合理性,试图寻求一种便捷可行的低孔低渗泥质砂岩水淹层识别方法[7-9].
1 最小二乘支持向量机
1.1 标准支持向量机
支持向量机(SVM)采用结构风险原则训练学习机,通过核函数的非线性映射把实际的n维向量从原来的空间映射到高维特征空间,然后在此高维特征空间中构造最优线性决策函数,并且用VC维理论度量结构风险最小,算法最终归结为求解一个凸二次规划问题,从而获得全局最优解.
SVM是从二分类问题发展而来的.首先要定义一个用于分类的判别函数,即n为空间的分界面,这个分界面不仅能将两类样本正确的分开,而且还能保证样本点距离分界面的间隔最大[2].假设分类线为x·w+b=0(w为权向量,b∈R),对它进行归一化,从而使线性可分的样本集x⊆Rd,y∈ {+1,- 1},满足[2]
此时的分类间隔为2/‖w‖,若使分类间隔最大,则使
最大.所以,求解最优分类面问题实质上就是求(2)式在约束(1)式下的条件极值.
然而,在实际应用过程中需要分类识别的大多是小样本非线性的,此时,可以通过非线性映射将问题转化为某个高维空间的线性问题,在此高维空间中求解线性分类问题,找到最优分类面[10].假设特征空间F内,对于线性不可分的间隔超平面是在条件下求如下函数的极小值
其中 <·>符号表示在特征空间中求点积,Ψ为Rd→F样本空间到特征空间的映射,c为惩罚参数,ζi≥0为允许分类误差而引入的松弛变量.
引入Lagrange乘子,可以将标准支持向量机的最优问题转化为如下的二次归化问题:
式中,K(xi,xj)为任意满足Mercer条件的核函数.
1.2 最小二乘支持向量机
最小二乘支持向量机作为标准支持向量机的发展,将最小二乘线性系统引入到支持向量机中,用误差的二范数作为系统的损失函数,代替了标准支持向量机中的用误差来作为损失函数,所以,最小二乘支持向量机优化问题为[4]:
引入Lagrange乘子,可以将最小二乘支持向量机的优化问题转化为求解如下线性方程组的问题:
2 最小二乘支持向量机水淹层识别方法
2.1 油田概况
大庆西部XZ油田平均渗透率为5.4mD,平均孔隙度为12.6%,泥质含量21.5%,属于典型的低孔低渗泥质砂岩油藏.由于该油田储层物性差异较大,储层非均质性强,油田注水后受效不均匀,层间矛盾突出.一是泥质和钙质含量较高、薄互层发育,水淹层常规测井响应特征不明显,识别难度大;二是储层非均质性强,各层水淹程度不同,储层受注入水冲刷,导电机理发生变化,水淹层电性特征不能反映储层的真实流体性质,水淹层人工解释解释符合率低,给油田开发带来较大的困难.
2.2 数据选取及模型建立
在测井解释中,学习样本的真实性、代表性和泛化性是决定模型判别效果的关键.因此,本文样本选取过程中,主要考虑对储层水淹较为敏感的声波时差、深侧向等测井信息以及泥质含量等储层特征信息,且样本深度段有试油资料作为验证.输出结果用正整数代表油层是否水淹及水淹级别.在与模型匹配的核函数选择的基础上,编写了分类计算程序,通过有试油资料的多组样本数据学习和训练,选取识别率最高模型对应的参数为最优参数.
经过对研究目标油田测井曲线和地质特征深入分析后,优选出以下7个对储层水淹最为敏感的参数:
(1)测井资料参数:声波时差(AC),自然电位(SP),深侧向(RLLD).
(2)储层参数:泥质含量(Vsh),孔隙度(φ).
(3)饱和度:利用取心资料拟合公式计算含水饱和度(Sw)和束缚水饱和度(Swi).
表1 LSSVM模型部分输入数据
图1 大庆西部XZ油田A井测井综合解释成果图
经过优选不同核函数进行对比分析,针对目标油田水淹层识别和分类问题,径向基函数(RBF)识别符合率最高,因此选择RBF函数作为核函数,使用网格选择法确定最优的参数和数值,最终优选的参数c=2145,σ2=1.
2.3 应用分析
实验过程中,根据算法用C++语言编写水淹层识别模型程序,利用已优选的参数,从目标油田选取有试油资料的20口井70个小层,将其中的30个小层输入样本作为训练样本,另外40个小层的样本作为验证样本,输出结果利用正整数分别代表不同的水淹级别:1代表未水淹层(油层)、2代表差油层、3代表水层、4代表弱水淹层、5代表中水淹层和6代表强水淹层.
表2 复杂储层流体性质分类结果
图1为所选研究目标油田的1口井水淹综合解释成果图,人工解释认为PI5-21号小层是弱水淹层,但通过所建立的自动识别模型判定为高水淹层,试油资料显示含水91.2%;PI6号小层人工解释为油层,但通过所建立的自动识别模型判定为中水淹层,试油资料证实含水63.3%,因此,从试油结果看,所建立的分类模型识别结果是正确的.利用训练好的LSSVM模型对其余40个小层的样本验证,并与试油结果对比分析,符合率达到92.2%(如表2所示).从验证结果来看,所建立的LSSVM模型对电性响应较弱的中水淹层和弱水淹层识别程度高,说明最小二乘支持向量机尤其对四性关系较差的储层水淹程度判别具有高效性.
3 结论
通过理论研究和实验验证,本文所建立的基于最小二乘支持向量机的水淹层分类识别模型,可以在给定测井曲线信息、地质信息情况下建立起良好有效的与储层流体性质之间的对应关系,实现低孔低渗油田水淹层高精度判别,能够避免人工解释引起的误判.同时,低孔低渗储层厚度薄、岩性复杂,测井曲线不能完全反映地层的真实流体性质,因此,水淹层解释过程需在生产动态资料的指导下,地质、测井、录井等多专业相结合,才能获得较高的识别率.
[1]Vapnik V.The nature of Statistical Learning Theory[M].New York:Springer.1995,10-45.
[2]Burges C J C.A Tutorial on Support Vector Machines for Pattern Reconnition[J].Data Mining and Knowledge Discovering,1998,2(2):32-35.
[3]郭新辰.最小二乘支持向量机及应用研究[D].长春:吉林大学,2008.12:23-36.
[4]Suykens J A K,Vandew alle J.Least Squares Support Vect or Mach Ine Classif iers[J].Neural rocessing Lett ers,1999,9(3):293- 300.
[5]赵宇,王志良.一种基于支持向量机的测井岩性预测新方法[J].微计算机(测控自动化),2004,20(6):50-51.
[6][11]阎威武,邵惠鹤.支持向量机和最小二乘支持向量机的比较及应用研究[J].控制与决策,2003,18(3):358-360.
[7]杨斌.一种用于测井油气层综合识别的支持向量机方法[J].测井技术,2005,29(6):512-514.
[8]宋延杰,张剑风,基于支持向量机的复杂岩性测井识别方法[J],大庆石油学院学报,2007,31(5):18-20.
[9]连承波,等.基于支持向量机的低阻油层识别方法及应用[J],石油天然气学报,2008,30(1):80-82.
[10]张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):18-21.