深度学习在测井岩性识别中的应用
2015-05-07李建国张卫东刘冠男
李建国 张卫东 刘冠男
摘 要:深度学习也被称为深度神经网络,是机器学习的最新研究结果,在2006年Geoffrey Hinton提出训练深度神经网络的方法以后,其在语音和图像处理的领域迅速发展,并取得了很好的成绩。由于深度学习优良的特征提取性质,所以在这里把深度学习用在地球物理测井岩性的识别中,对四川西部川科1井的岩性进行识别。
关键词:深度学习;测井;岩性识别;储层预测
引言
储层预测是寻找油气资源,评估油气储量基础的工作之一。由于井下地质构造的复杂性和测井参数分布的模糊性,传统的岩性识别方法往往识别精度有限,很多时候对人的经验要求比较高。前人应用神经网络在测井岩性识别上做了大量的研究,取得了很好的结果,但是前人的研究中主要是使用BP神经网络对岩性预测,卢新卫,金章东对胜利油田某测井岩性用BP神经网络进行识别[1],以及范训礼等用BP网络对塔里木油田TZ4测井的岩性进行了自动识别[2],侯俊胜、王颖利用BP网络对煤气层测井资料进行了定量解释识别[3],识别准确率不是很高。BP神经网络有一个致命的缺点就是容易陷入局部最小值,特别是随着神经网络层数的增加,其陷入局部最小值的可能性大大增加,相对而言深度学习就可以很好的克服这个缺点,取得很好的结果。
1 深度学习发展
在Geoffrey Hinton 2006年提出深度学习[4]之后的短短数年里,深度学习就以其强大的对数据内部结构的表征能力赢得了国际学术界的广泛重视,各个互联网巨头如:百度,google,腾讯,纷纷成立深度学习的研究实验室,美国国防高级研究计划局也于2009年成立了深度学习项目组。微软公司已经成功地将深度学习方法应用于自己的语音识别系统当中,它能够将单词错误率相较之前的最优方法降低约30%。 因此,深度学习被认为是继1997年的隐马尔科夫(Hidden Markov Model, HMM)模型之后,语音识别领域的又一次重大突破[5]。
2 深度学习理论简介
到目前为止深度学习主要有三种方法:卷积神经网络,限制玻尔兹曼机,自动编码机,在这里我们主要使用的是受限玻尔兹曼机(RBM)。
RBM是第一个由统计力学推导出来的多层学习机,机器的命名认可了神经网络的自身动力学行为和RBM原始关于统计热力学工作形式上的等价性。基本上说,RBM可以对给定数据集的固有概率的分布进行建模,这样在诸如模式完备和模式分类的任务中所使用的条件分布就可以推导出来了。在对比散度出现以前我们一般用MCMC求解,但是那样的话其学习过程是慢得难以忍受,所以在这以前其根本没有任何实用价值,直到Hinton发明对比散度以后其才得以飞速发展,特别是在语音和图像上取得了很大的成功。
3 能量模型作用
在RBM中使用了能量模型,其原因有几个:
(1)RBM网络是一种无监督学习的方法,无监督学习的目的是最大可能的拟合输入数据,所以学习RBM网络的目的是让RBM网络最大可能地拟合输入数据。
(2)在马尔科夫随机场(MRF)中能量模型主要扮演着两个作用:全局解的度量(目标函数),和能量最小时的解(各种变量对应的配置)为目标解。换句话说,使用能量模型使得学习一个数据的分布变得容易可行了。能否把最优解嵌入到能量函数中至关重要,决定着我们具体问题求解的好坏。统计模式识别主要工作之一就是捕获变量之间的相关性,同样能量模型也要捕获变量之间的相关性,变量之间的相关程度决定了能量的高低。把变量的相关关系用图表示出来,并引入概率测度方式就构成了概率图模型的能量模型。RBM作为一种概率图模型,引入了概率就可以使用采样技术求解,在对比散度算法中采样部分扮演着模拟求解梯度的角色。能量模型需要一个定义能量函数,RBM的能量函数的定义如下:
这个能量函数的意思就是,每个可视节点和隐藏节点之间的连接结构都有一个能量,通俗来说就是可视节点的每一组取值和隐藏节点的每一组取值都有一个能量。
4 公式推导
在这里我们的能量函数不是以前的二项分布的能量函数了,而是具有高斯分布的能量函数了,如下所示:
写成向量的形式如下:
因为在这里我们的V是高斯分布,其是连续分布的不是二项分布的,所以
经过很多步化简可以得到以下结果
由以上公式可以推导出:
所以可视节点是由u=bi+?撞jwi,jhj?滓i为均值,?滓i为方差的高斯分布。
5 研究结果
本次研究以川西地区川科1井来验证岩性的识别结果,川科1井是开拓四川盆地海相勘探新领域具有重要战略意义的科学探索井。选择了声波测井(AC),井径1(CAL1), 井径2(CAL2),密度(DEN),自然伽玛(GR),5条测井曲线作为研究对象,选取有岩芯资料的样本45个,作为深度学习的输入样本,在这45个样。
文章中我们以30个作为训练的样本,15个作为测试的样本在这个神经网络中通过不同的参数对深度学习的影响,选择最优的参数,最后得出结果,当层数为5层时,每层的节点个数为10个时所得到的结果最好。个别样本测试结果的误差较大,其余的与期望输出值完全一致,岩性识别正确率高达90%以上。
6 结束语
在通过大量的测试发现深度学习可以得到很好的结果,相对于的传统BP网络其克服了收敛慢和发散的问题,也体现了其特征提取的优越性。但是由于深度学习神经网络参数初始化的随机性,有时候相同的测试参数可能得到不同的测试结果,所以深度学习训练有一定的困难性。
研究表明采用深度学习来进行测井岩性识别,方法简单易操作,且识别准确率相当高。这为测井资料地质解释提供了一个全新的方法,对于探寻和鉴别含油气地层的精确性,在油气资源开发领域非常具有实用意义。
参考文献
[1]卢新卫,金章东.前馈神经网络的岩性识别方法[J].石油与天然气地质,1999,3.
[2]范训礼,戴航,张新家,等.神经网络在岩性识别中的应用[J].测井技术,1999,1.
[3]侯俊胜,王颖.神经网络方法在煤气层测井资料解释中的应用[J].地质与勘探,1999,5.
[4]Hinton,G.E.Osindero,S.and Teh,Y.A fast learning algorithm for deep belief nets[J].Neural Computation,2006,18:1527-1554.
[5]曾黄麟,虞厥邦,曾谦.基于主成分分析的特征简化[J].四川轻化工学院学报,1999,12(1).
作者简介:李建国(1987-),男,成都理工大学地球物理学院在读硕士研究生,地球探测与信息技术,主要研究方向为深度学习在地球物理方面的应用。