APP下载

测井数据岩相分类的机器学习方法和大数据岩相分类探讨①

2017-11-01曹志民吕秀丽宋鸿梅赵丽华

化工自动化及仪表 2017年8期
关键词:岩相测井分类器

曹志民 吴 云 韩 建 吕秀丽 宋鸿梅 赵丽华

(1.东北石油大学电子科学学院;2.大庆油田博士后科研工作站)

测井数据岩相分类的机器学习方法和大数据岩相分类探讨①

曹志民1,2吴 云1韩 建1吕秀丽1宋鸿梅1赵丽华1

(1.东北石油大学电子科学学院;2.大庆油田博士后科研工作站)

对现有测井数据岩相分类的机器学习方法进行归纳总结,并针对大数据岩相分类的相关问题进行探讨。

机器学习 岩相分类 储层预测 测井数据 大数据

岩相是指一定沉积环境下形成的一系列具有特殊岩性(如矿物组成、沉积结构及几何结构等)的岩石或岩石组。准确可靠的岩相分析对于地层特性分析、地层学小层对比及储层预测等油气田勘探开发应用来说至关重要[1~4]。岩相分类是油气田开发中地层特性分析、小层对比及储层预测等应用的关键环节。显然,通过取心井提取岩心进行岩相分析的精确度和可靠性是最高的,但是这种方法不但费时,而且成本非常高;特别的,对于密井网获取的大量数据来说,这种方法根本就行不通。测井技术通过利用不同物理属性(如自然伽马、电阻率、自然电位、声波速度、岩石体积密度、岩石中子减速及俘获信息等)的测井手段可以获取能够直接反映地下连续岩相地质信息的测井响应数据(信息)。可见,测井数据(信息)能够直接用于岩相分析。然而,实际获取的测井数据不可避免的会受到采集、记录及地层环境等多种内在或外在因素造成的噪声和失真的干扰,从而导致测井信号降质,而且不同岩相的测井响应往往具有一定的重叠特性,这就造成了利用测井曲线进行岩相分类解译往往依赖于解译人员的经验,且解译成果具有一定的多解性,而且人工测井数据岩相分类的效率还是太低。为此,在过去的20年里,朴素贝叶斯(Naïve Bayes,NB)分类器[5]、人工神经网络(Artificial Neural Networks,ANNs)[6~11]、决策树(Decision Tree,DT)[12]、支持向量机(Support Vector Machine,SVM)[13~15]、联合/集成分类器(Combined Classifier,CC)[16,17]等(有监督)机器学习方法不断被成功应用于各种不同地质环境的岩相分类和识别应用中。

随着我国大部分油气田已经进入开发后期,地层结构越来越复杂,油气开发成本越来越高,各种应用都对岩相分类的精度和可靠性提出了越来越高的要求。为此,越来越多的机器学习方法被应用到测井数据岩相分类的研究中。笔者对现有的主要岩相分类机器学习方法进行归纳总结,并针对大数据岩相分类的机器学习方法存在的问题进行了较为详细的分析。

1 测井数据岩相分类的机器学习方法

一般的,机器学习方法的基本流程如图1所示。

图1 机器学习方法基本流程

由图1可知,在选定分类器的情况下,分类器分类性能直接取决于训练数据的构建和特征提取/选择。现对基于ANNs分类器、基于SVM分类器和基于联合/集成分类器3种典型的岩相分类机器学习方法,分别从分类器基本原理和典型应用的训练数据构建及特征提取/选择等方面进行介绍。

1.1 ANNs法

ANNs方法采用的是一种并行的分布式处理网络结构,通过多层神经元结构的加权组合构成的前馈神经网络或误差反向传播神经网络(BP神经网络)在岩相分类等地质和地球物理勘探中都得到了较好的应用。显然,神经网络的基本元素是神经元,图2a给出了神经元的基本结构,以此为基础,可以构造如图2b所示的多层神经网络,图2b中的每个圆形结构代表一个图2a给出的神经元结构。

图2 神经网络基本结构示意图

由图2可知,ANNs网络的成功应用需要对网络中的参数组{Wi,Bi}进行精确学习,而这些参数精确学习的基础是质量良好的训练样本。

文献[9]在对法国拉希奥塔附近的南省盆地La Ciotat-1号井进行岩相分析时采用孔隙度、密度、P波速度、S1波速度、S2波速度、矿化基质体积模量、矿化基质剪切模量及各种矿物含量等19种特征,对石灰岩、石英、纯净砂岩及碳酸盐砂岩等岩相进行分类。所采用的ANNs网络为一个三层BP ANNs:一个输入层,一个隐层和一个输出层。实验结果表明该井的ANNs岩相预测精度达到了85.62%。

尽管ANNs法可以通过学习实现较高的分类精度,但仍然具有对不同数据集的泛化能力很弱、参数过多,以及学习时间长甚至达不到学习效果等缺陷。

1.2 SVM法

SVM法是一种基于经验风险最小化等严格理论基础的间隔最大准则下的分类方法,如图3所示。

SVM法的判别函数f(x)=ωTx+b,在间隔最大准则下通过引入支持向量的概念,最优判别参数求解的优化问题通过对偶转化为易于求解的如下二次规划问题:

图3 SVM法分类划分示意图

s.t.yi(ωTxi+b)≥1,i=1,…,N

(1)

构造拉格朗日函数:

(2)

s.t. αi≥0,i=1,…,N

(3)

最终,可以根据下式给出最优SVM参数:

(4)

上述SVM分类原理是针对线性SVM分类器而言的,对于非线性分类问题,仅需引入核函数,通过对上述优化问题进行核扩展即可。显然,SVM方法与ANNs方法相比,学习参数要少很多,并且具有更好的泛化性能。

文献[13]在对中东某砂岩储层开展的关于测井曲线岩相分类研究中,以井径CAL、自然伽马GA、光电PEF、中子孔隙度NPHI、声呐孔隙度DT、体积密度RHOB、深侧向电阻率LLD、浅侧向电阻率LLS和微球聚焦电阻率MSFL共9种测井曲线为输入特征,对纯净砂岩、砂砾岩和砂页岩3种岩相进行分类。结果表明,与ANNs法相比,SVM法具有更好的分类性能。

SVM法虽然已经较为成功地应用于岩相分类等应用中,但是面对复杂数据集,核函数的选择等问题制约了该方法的泛化能力。

1.3 联合/集成学习法

虽然各种专家系统和单分类器机器学习系统在测井曲线岩相识别、分类等研究中已经取得了较多的成功经验,然而,随着大多数油气田开发已经进入中晚期,地层地质环境越来越复杂,储层预测难度和开采成本不断增加,为了更好地实现对复杂环境下专家知识和实际测试数据的有效集成,有必要开展更复杂的机器学习方法来提高系统预测和分析的准确度和可靠性。

联合/集成机器学习法是通过多个同类或异类学习机器构成一个学习网络,进而,通过综合各个学习机器的判决结果实现最终判决,图4给出了该类方法的基本框图。

图4 联合/集成机器学习方法基本框图

可见,该类方法主要由两部分组成,即学习机器的选择和决策规则的制定。根据学习机器的构成情况,可以有神经网络委员会法、集成学习法及异构机器联合学习法等。

文献[17]对巴西亚马逊油田相关储层进行的岩相识别研究中,利用自然伽马GR、感应测井ILD、声呐DT和密度RHOB共4种测井曲线进行砂屑灰岩、无水石膏、页岩和岩盐4种岩相,分别采用多层感知器、SVM、kNN、决策树J48及逻辑回归等单个分类法以及所有这些方法集成的集成分类法进行岩相分类研究。实验结果表明,集成分类法在6组测试中的4组分类精度最高,而且相关统计结果表明,在改变训练数据的情况下,集成分类法的性能最稳定。

2 大数据岩相分类探讨

随着勘探开发进程的推进,国内外油气田勘探开发均已进入大数据时代[18~20]。所谓大数据就是指数据量和数据属性变化已经超出现有数据库与相关软件工具的采集、存储、管理和分析能力的数据集。具体的,大数据主要体现为数据量大、数据质量不统一及数据结构多样化等多源、异构且多时相特点。显然,油气田勘探开发过程中测井数据本身就是一种大数据,利用测井数据可以进行岩相分类、岩相相关的沉积微相分类、小层对比等多种任务,且不同开发区块,不同沉积相下的岩相种类变化多样等问题,都为机器学习方法在测井数据岩相分类等应用中的大数据分析提出了很多亟待解决的难题。

综合考虑,面对大数据的应用需求,传统机器学习方法主要存在如下问题:

a. 机器学习分类方法的鲁棒性问题。利用某个数据库或数据域的样本训练得到的学习机器很难适用于其他数据库或数据域中的数据。

b. 类别确定性问题。传统机器学习方法的训练数据往往是针对有限已知类别进行的,而随着数据的快速变化,类别多变性问题很难得到解决。

c. 传统机器学习方法一般是针对单任务学习,不适合大数据环境下的多任务学习和知识迁移的需求。

显然,大数据分类技术需要重点着眼于多领域表示学习技术,在数据联合表示、联合特征提取与选择、跨领域知识迁移等方面进行深入研究。

3 结束语

面对日益复杂的地质地理条件,测井数据在岩相分类相关应用的研究中越来越迫切的需要人工智能与机器学习方法的参与。针对测井数据岩相分类问题,对现有机器学习方法进行了归纳,重点对ANNs、SVM和联合/集成分类法进行了介绍,并对测井数据岩相分类大数据分析的机器学习方法存在的问题进行了探讨。显然,联合/集成学习方法是今后勘探开发大数据分析的一个主流发展方向,在特征选择、分类器选择及分类决策等多方面还存在较多问题需要解决。而对于测井大数据来说,重点在于多任务联合特征和知识的应用潜能挖掘。

[1] Rogers S J,Fang J H,Karr C L,et al.Determination of Lithology from Well Logs Using a Neural Network[J].AAPG Bulletin,1992,5(5):731~739.

[2] A Kadkhodaie Ilkhchi,Rezaee M,Moallemi S A.A Fuzzy Logic Approach for Estimation of Permeability and Rock Type from Conventional Well Log Data:An Example from the Kangan Reservoir in the Iran Offshore Gas Field[J]. Journal of Geophysics & Engineering,2006,3(4):356~369.

[3] Dong S Q,Wang Z Z,Zeng L B.Lithology Identification Using Kernel Fisher Discriminant Analysis with Well Logs[J].Journal of Petroleum Science and Engineering,2016,143:95~102.

[4] 赵显令,王贵文,周正龙,等.地球物理测井岩性解释方法综述[J].地球物理学进展,2015,30(3):1278~1287.

[5] Li Y M,Richard A S.Facies Identification from Well Logs:A Comparison of Discriminant Analysis and Naïve Bayes Classifier[J].Journal of Petroleum Science and Engineering,2006,53(3-4):149~157.

[6] Derek H,Johns R,Pasternack E.Comparative Study of a Backpropagation Neural Network and Statistical Pattern Recognition Techniques in Identifying Sandstone Lithofacies[C].Processdings 1990 Conference on Artificial Intelligence in Petroleum Exploration and Production.Houston,TX(United States):Knowledge Systems, Inc,1990:41~49.

[7] Bhatt A,Helle H.Determination of Facies from Well Logs Using Modular Neural Networks[J].Pet Geosci,2002,8(3):217~228.

[8] Dubois M K,Bohling G C,Chakrabarti S.Comparison of Four Approaches to a Rock Facies Classification Problem[J].Computers & Geosciences,2007,33(5):599~617.

[9] Adrielle A S,Irineu A L.Artificial Neural Networks to Support Petrographic Classification of Carbonate-Siliciclastic Rocks Using Well Logs and Textural Information[J].Journal of Applied Geophysics,2015,117:118~125.

[10] 张强,许少华,富宇.基于过程神经网络的储层微观孔隙结构类型预测[J].化工自动化及仪表,2015,42(8):893~897.

[11] Sasmita S,Madan K J.Pattern Recognition in Lithology Classification:Modeling Using Neural Networks,Self-Organizing Maps and Genetic Algorithms[J].Hydrogeol J(Springer Online),2016,(1):20.

[12] 石宁,李洪奇,罗伟平.数据挖掘与测井解释:应用于砾岩储层[J].应用地球物理(英文版),2015,12(2):263~272.

[13] Anazi A A,Gates I D.On the Capability of Support Vector Machines to Classify Lithology from Well Logs[J].Natural Resources Research,2010,19(2):125~139.

[14] Sebtosheikh M A,Motafakkerfard R.Support Vector Machine Method,A New Technique for Lithology Prediction in an Iranian Heterogeneous Carbonate Reservoir Using Petrophysical Well Logs[J].Carbonates Evaporites,2015,30:59~68.

[15] Fatai A,Suli A.Integrating Seismic and Log Data for Improved Petroleum Reservoir Properties Estimation Using Non-linear Feature-selection Based Hybrid Computational Intelligence Models[J].Journal of Petroleum Science and Engineering,2016,145:230~237.

[16] Christopher M G,Arvin A.Collaborative Multi-agent Rock Facies Classification from Wireline Well Log Data[J].Engineering Applications of Artificial Intelligence,2010,23:1158~1172.

[17] Joacir Marques de Oliveira Jnior,Eulanda Miranda dos Santos.Ensemble of Heterogeneous Classifiers Applied to Lithogacies Classification Using Logs from Different Wells[C].Neural Networks (IJCNN),The 2013 International Joint Conference on.Piscataway,NJ:IEEE,2013:1~6.

[18] 崔海福,何贞铭,王宁.大数据在石油行业中的应用[J].石油化工自动化,2016,52(2):43~45.

[19] 李洪奇,郭海峰,郭海敏,等.复杂储层测井评价数据挖掘方法研究[J].石油学报,2009,30(4):542~548.

[20] Johnston J,Guichard A.New Findings in Drilling and Wells Using Big Data Analytics[C].Offshore Technology Conference.Calgary,Canada:Society of Petroleumn Engineers(SPE),2015:OTC-26021-MS 1~8.

MachineLearningMethodsforLogDataLithofaciesClassificationandBigDataLithologyClassificationDiscussion

CAO Zhi-min1,2, WU Yun1, HAN Jian1, LV Xiu-li1, SONG Hong-mei1, ZHAO Li-hua1

(1.SchoolofElectronicScience;NortheastPetroleumUniversity;2.PostdoctoralResearchStation,DaqingOilfield)

The existing machine learning methods for lithofacies classification of the log data were summarized and issues relating to big data lithofacies classification were discussed.

machine learning, lithofacies classification, reservoir prediction, log data, big data

TH865

A

1000-3932(2017)08-0717-05

2016-12-28,

2017-04-20)

曹志民(1980-),讲师,博士后,从事多源信号融合及模式识别、大数据储层预测及油藏描述的研究,dahai0464@sina.com。

猜你喜欢

岩相测井分类器
本期广告索引
火山岩储层岩相研究进展*
基于注意力机制的碳酸盐岩储层岩相识别方法
渤中34-9油田古近系火山岩岩相特征与分布预测
西非P油田深水重力流水道岩相特征及组合规律
基于差异性测度的遥感自适应分类器选择
基于实例的强分类器快速集成方法
基于测井响应评价煤岩结构特征
随钻电阻率测井的固定探测深度合成方法
中石油首个全国测井行业标准发布