APP下载

一种基于SVM的地层划分方法

2018-08-10杨玲

科学与财富 2018年16期
关键词:分类器测井分层

杨玲

摘 要: 地层划分是一个复杂的非线性系统,根据地层结构,本文提出了一种基于SVM(支持向量机)的划分方法。该方法利用同一区域地质结构相似、地质结构有序连续的特征,使用有序学习多分类模型,以高斯核函数为核函数,建立了地層自动分层模型,最终得到样本空间的分类结果。实验结果表明,按照所提方法训练出的SVM可以很好地划分同一区域内其他井的地层,有效地提高地层划分的效率。

关键词: 地层划分;SVM;高斯核函数

0 引言

地层划分的目的是把地层由上至下切割成不同的片段,划分出不同等级的地层单位,即把一个地区的地层进行纵向划分,以便与地质单层相对应。目前采用的方法主要有人工解释方法,数理统计方法和人工智能方法。

人工解释的方法对测井曲线进行分层,该方法不仅费时费力,而且分层取值过程中受测井分析人员的经验知识和熟练程度影响较大,主观性较强;数理统计方法能够保持岩层内部的均一性,但计算量比较大,同时对测井信息和地质信息的一一对应有很高的要求,如果达不到(事实上也无法完全做到一一对应),则分层结果不易达到地质应用的要求。人工智能是一种现代化方法,主要有神经网络和机器学习等,其具有较好地学习和自适应能力,但在地质分层应用中目前仍处于探索阶段。

本文采用SVM机器学习方法对测井曲线进行地层划分,以同一区域已有的分层井数据变化特点为切入点,结合每口井测井曲线数据以及代表地层特性测井曲线数据的变化特点,建立合理的数学模型,实现自动分层。实践证明,根据实际问题合理选择二类分类模型和核函数,SVM方法对于测井曲线划分是行之有效的。

1 SVM简介

SVM方法是建立在统计学习理论基础上的机器学习方法,其目的在于寻找一个超平面H(d),该超平面可以将训练集中的数据分开,且与类域边界的沿垂直于该超平面方向的距离最大,故SVM法亦被称为最大边缘(Maximum Margin)算法。通过学习算法,SVM可以自动寻找出那些对分类有较好区分能力的支持向量,构造出的分类器可以最大化识别类与类的间隔,因而有较好的适应能力和较高的分准率。目前,构造SVM多类分类器的方法主要有两类:一类是直接法,直接在目标函数上进行修改,将多个分类面的参数求解合并到一个最优化问题中,通过求解该最优化问题“一次性”实现多类分类。这种方法看似简单,但其计算复杂度比较高,实现起来比较困难,只适合用于小型问题;另一类是间接法,主要是通过组合多个二分类器来实现多分类器的构造,常见的方法有一对多法和一对一法两种。不同的构造方法训练时需要的分类器个数不同,实际应用时,可根据问题背景选择合适的分类方法。

2 SVM测井曲线分层

测井曲线分层是通过多条测井曲线数据对地层进行划分的过程,由于地层具有连续性且在同一区域内地质特征相似,而对某采样点进行分类时,其只可能属于两个连续地层中的某一层,因此测井曲线分层可以归为有序多分类问题。

2.1 设计多类分类模型

对测井曲线分层,采用优化的一对一的方法,将多类问题转化为二类问题。按照地层顺序,建立N-1个相邻地层的二类模型。

已知测井曲线数据X={Xij}r×s,r为样本个数;地层分类L={li}n×1,N为地层个数。将X按照已知的分层结果分为N个子集:Xl,l=1,2,...,N,按照顺序依次建立Xl和Xl+1的二类模型。

2.2 分层模型

对测井曲线分层,重点是寻找地层分层界面。但是由于地质的随机性、复杂性和不可预见性,单独一个或几个采样点并不能代表某一连续区域的地质特征。因此,需在一定区域内多达几十个、甚至几百个的连续采样点的二分类基础上做进一步分析。寻找出分类结果的分类面从而确定出地层的分界面。

假设已知连续样本集X={xij}m*s,为l和l+1层的样本点,其中m为样本个数;l和l+1的分界样本点为Xt,t∈{1,2,...,m}。

由二类模型的决策函数f(X)=sgn(g(X)),可以计算得到Y={yi}m*1,其中Yi∈{+1,-1}。假设Xt为两类分类面,由于二类分类问题存在错判的情况,只能保证Y={yi},y=1,2,...,t中大部分应该为+1,而Yl+1={yi},i=t,t+i,...,m中大部分应该为-1。此时,为了得到分界点Xt,需要求解如下模型:

但是根据上述假设,需要确定样本集X可以被分为两类,因此可以增加约束条件:

其中C∈{0,1,...m/4}为两类样本个数的差值的阀值,根据样本个数可以适当选择数值。

2.3 曲线分层

由于每次只能对连续两层的样本数据进行分类,因此采用循环步进的方式实现分层,流程如图1所示。

每次从样本集中选择连续的t个样本点,根据 l 和 l+1 层的学习结果进行分类,则可能有三种结果:第一种大部分为 l 层,则向前步进选取新的 t 个样本点;第二种大部分为 l+1 层,则退回上层分层线重新选取新的 t 个样本点,并更新l=l+1;第三种两层点比较均衡,此时通过分层模型确定分层界面。循环上述步骤,直到分层结束。

3. 结果比较与分析

首先对样本井进行学习并对其进行自动分层,然后根据样本井的学习结果对 B-D 号井进行自动分层,人工与自动分层结果比较如表4-1.

表 4-1 B-D 号井分层结果比较

由实验结果可知,与人工解释方法相比,SVM应用于测井曲线自动分层效果良好,在测井数据较少的情况下也可以很好的实现分层,大大提高了工作效率,并减少了人为主观性及经验性对分层结果的影响。

参考文献

[1] Hsu C W, Lin C J. A comparison of methods for multi-class support vector machines. IEEE Transactions on Neural Networks. 2002.

猜你喜欢

分类器测井分层
本期广告索引
八扇区水泥胶结测井仪刻度及测井数据处理
一种沉降环可准确就位的分层沉降仪
雨林的分层
BP-GA光照分类器在车道线识别中的应用
有趣的分层
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
基于测井响应评价煤岩结构特征
中石油首个全国测井行业标准发布