利用主成分分析法优化BP神经网络模型在砂砾岩岩性识别中的应用
2020-11-06潘拓马鑫谢安
潘拓 马鑫 谢安
摘 要:准噶尔盆地玛湖凹陷JL57井区上乌尔禾组发育块状砂砾岩储层,砂砾岩可以细分为粗砾岩、中砾岩、细砾岩、中粗砂岩和粉细砂岩5类岩性,有效储层为中砾岩、细砾岩和中粗砂岩3种岩性,如何识别出有效储层岩性,是油田生产试油选层亟待解决的问题。传统利用测井曲线与岩性间简单线性关系的交会图法无法满足油田生产对岩性识别的要求,而传统利用非线性关系的BP神经网络模型岩性识别方法,虽然能识别部分砂砾岩种类,但该方法需要输入参数多,运算量大,识别结果准确率一般。本文探索性利用主成分分析法先从自然伽马、自然电位、地层电阻率、声波时差、密度、补偿中子6种测井曲线中计算出主成分特征值X、Y、Z三个参数,然后用三个特征值参数替代传统BP神经网络模型中6个油气参数作为新的输入参数,与传统BP神经网络模型对比,简化了BP神经网络模型的网络结构,减少了模型计算量,而且岩性识别准确率得到了有效提高,有效地解决了研究区测井识别岩性问题。
关键词:上乌尔禾组;主成分分析法;BP神经网络模型;砂砾岩;岩性识别
近年来新疆油田在玛湖凹陷发现10×10-8 t规模储量,其中二叠系上乌尔禾组为主要目的层之一。二叠系上乌尔禾组发育厚层状-块状砂砾岩,单层砂砾岩厚度普遍在10~100 m,砂砾岩可细分为粗砾岩、中砾岩、细砾岩、中粗砾岩和粉细砂岩5类,其中有效储集层为中砾岩、细砾岩和中粗砾岩3类。因砂砾岩单层厚度普遍较大,层内岩性变化较快,如何识别有效储层岩性,是油田生产试油选层亟待解决的问题。传统的利用常规测井曲线交会图法和地质统计学法等线性关系类方法无法准确识别出有效储集层岩性。而传统利用非线性关系的BP神经网络模型岩性识别方法,虽然能识别部分砂砾岩种类,但该方法需要输入参数多,运算量大。如何快速准确识别研究区的岩性,本文探索性地利用主成分分析法对BP神经网络模型进行优化。
1 方法原理
1.1 主成分分析法(PCA)原理
主成分分析法是一种减少信息损失将高维数据映射到低维数据(即主成分)的数据压缩和特征信息提取技术。主成分能反映原始数据的大部分信息,且各主成分互不重复。主成分求解主要步骤如下[1-5]:
对方程求解,得到特征值[λ]及特征向量α;按大小顺序对[λ]进行排序,即[λ][1]≥[λ][1][≥]···≥[λ][p]。α为[λ]对应的特征向量。
(4)选择合适的主成分数量实现最终的分析。
通常采用[i=1ei=λip×100%λi]作为主成分的贡献率;[i=1pei]即为累计贡献率。一般认为累计贡献率大于85%时的主成分个数即为最佳的变量个数。
1.2 BP神经网络原理
BP(back propagation)神经网络基本思想是梯度下降法,利用梯度搜索技术,以期使网络的实际输出值和期望输出值的误差均方差为最小[6]。它具有很强的非线性映射能力,在岩性识别应用中,能够较好地解决岩性识别过程中,因多种因素造成的测井信息与岩性之间为非单纯的线性关系。
目前,BP神经网络方法在测井岩性识别领域已得到成熟的研究与应用,在火成岩、碳酸盐岩等岩性识别和储层评价中应用效果良好[7-16]。该模型在研究区识别岩性的优点是:无需在测井曲线和岩性之间建立准确的相互关系,缺点是与地层岩性有关的测井曲线,一般都要作为模型的输入参数,输入参数越多,模型的计算时间越长,参数越多模型的识别准确率并未有效提高[17-18]。
1.3 PCA与BP神经网络模型关系
主成分分析法(PCA)和BP神经网络模型是相互独立的两种算法,其中PCA可以最大限度在保证原始数据主要特征不变的情况下,将高维数据转换为低维度。BP神经网络模型则是尽可能减小实际输出值和期望输出值的误差而进行的梯度下降法。因此,将PCA提取的特征值作为BP神经网络模型输入参数,理论上可以减少无效信息带来的干扰,从而优化BP神经网络模型的网络结构,减少模型的计算量。
2 应用实例
2.1 样本参数设定
据研究区录井、测井、取心资料和薄片鉴定的分析得出,研究区主要岩性为泥岩、粉细砂岩、中粗砂岩、细砾岩、中砾岩和粗砾岩共6类。研究区与岩性相关的测井资料有自然伽马、自然电位、地层电阻率、声波时差、密度、补偿中子6种测井曲线,选取346个样本作为样本集。
2.2 主成分分析法特征提取
在进行主成分分析法提取特征值之前,首先对样本数据进行标准化处理。本文采用标准差标准化方法。具有线性特征的测井曲线,采用线性归一化公式:
2.3 模型建立
为了和传统BP神经网络对比,本文分别建立两种模型。模型一为传统的BP神经网络模型,将归一化后的自然伽马、自然电位、地层电阻率、声波时差、密度、补偿中子6条曲线作为输入层结构;模型二采用前文主成分分析法提取出的特征值X,Y,Z為输入层,结构见图1。设定两种网络模型的迭代次数为300次,误差3次迭代不下降,误差终值0.01。将346个样本中290个样本数据作为训练样本。利用MATLAB软件对两种模型进行多次训练,模型一最佳网络结构为6-12-6,模型二最佳网络结构为3-8-6。训练完毕后将56个检验样本数据导入模型以验证模型的有效性,传统的BP神经网络识别正确率为76%,而使用主成分分析法优化后的BP神经网络识别正确率提高到了89%。对两种模型的误差曲线对比发现(图2),优化后的BP神经网络模型只需要10步就能将值误差缩小到0.009 53,而传统BP神经网络模型30步时的误差仍然高达0.177 06,表明优化后的模型识别岩性不仅提高了准确率(表2),且简化了模型网络结构,减小模型的计算量。
2.4 应用效果
利用前文训练好的优化后的神经网络模型,对JL57井乌尔组进行岩性识别,见图3。第三道为岩屑录井的岩性,第四道为PCA-BP神经网络识别的岩性,第五道为传统BP神经网络识的岩性,将两个模型识别的岩性分别与岩屑录井、钻井取心岩性进行对比(图4),两种模型基本都能识别JL57井的岩性,但在深度4 978.3 m的录井岩屑和取心岩性都为中砾岩,PCA-BP神经网络岩性准确识别为中砾岩,而传统的BP神经网络模型识别为粗砾岩;同样PCA-BP神经网络模型可准确识别出4 980.6 m为中粗砂岩,4 983.7 m为粉细砂岩,而传统的BP神经网络模型均识别错误。实际应用表明,优化后的BP神经网络模型识别岩性准确率高,可有效识别研究区上乌尔禾组砂砾岩岩性,为油田生产选取有效储层进行试油射孔提供依据。
3 结论
(1) 采用自然伽马、自然电位、地层电阻率、声波时差、密度、补偿中子6条测井曲线所提取的3个主成分特征值X,Y,Z,将其作为BP神经网络模型的输入参数,不仅简化了模型的网络结构,减少了模型计算量,并且有效地提高了研究区的岩性识别准确率。
(2) 本文利用主成分法优化BP神经网络模型,在研究区对砂砾岩的识别得到较好的应用效果,但是影响BP神经网络模型的因素还有黑匣子中的激活函数和隐层的数量等参数。因此,BP神经网络模型仍有进一步优化的潜力。
参考文献
[1] 胡红,曾恒英,梁海波,等.基于主成分分析和学习矢量化的神经 网络岩性识别方法[J].测井技术,2015,39(5):586-590.
[2] 马峥,张春雷,高世臣.主成分分析与模糊识别在岩性识别中的应用[J].岩性油气藏,2017,29(5):127-133.
[3] 刘毅,陆正元,吕晶,等.主成分分析法在泥页岩地层岩性识别中的应用[J].断块油气田,2017,24(3):360-363.
[4] 杨兆栓,林畅松,尹宏, 等.主成分分析在塔中地区奥陶系鹰山组碳酸盐岩岩性识别中的应用[J].天然气地球科学,2015,26(1):54-59.
[5] 刘爱疆,左烈,李景景,等.主成分分析法在碳酸盐岩岩性识别中的应用——以地区寒武系碳酸盐岩储层为例[J].石油与天然气地质,2013,34(2):192-196.
[6] 闻新,张兴旺,朱亚萍,等.智能故障诊断技术[M].北京:北京航空航天大学出版社,2015.
[7] 单敬福,陈欣欣,赵忠军,等.利用BP神经网络法对致密砂岩气藏储集层复杂岩性的识别[J].地球物理学进展,2015,30(3):1257-1263.
[8] 纪福全,程国建,王潇潇,等.构造性神经网络在测井岩性识别中的应用[J].石油矿场机械,2007(4):52-55.
[9] 徐海浪,吴小平.电阻率二维神经网络反演[J].地球物理学报,2006(2):584-589.
[10] 管志宁,侯俊胜,黄临平,等.重磁异常反演的拟BP神经网络方法及其应用[J].地球物理学报,1998(2):242-251.
[11] 刘宗彦,王燕,曹润荣,等.测井储层分类评价方法的研究[J].国外测井技术,2008(4):19-22.
[12] 王文娟,曹俊兴,张元标,等.基于微粒群算法的神经网络储层物性参数预测[J].西南石油大学学报,2007(6):31-33.
[13] 邹长春,严成信,李学文.神经网络在枣北地区火成岩储层测井解释中的应用[J].石油地球物理勘探,1997(2):27-33.
[14] 郭巧占.基于神经网络的LM算法预测储层声波孔隙度[J].石油钻采工艺,2007(1):97-101.
[15] 袁爽,张晓波.根据测井资料估算储层渗透率的新神经网络方法[J].国外油田工程,2007(4):30-32.
[16] 朱丽红,杜庆龍,魏丽影,等.神经网络技术识别厚油层层内剩余油方法[J].石油学报,2006(1):129-132.
[17] 连承波,李汉林,渠芳,等.基于测井资料的BP神经网络模型在孔隙度定量预测中的应用[J].天然气地球科学,2006(3):382-384.
[18] 赵成,桂志先.基于神经网络的储层参数预测方法及应用[J].石油天然气学报(江汉石油学院学报),2005(3):69-70.
Abstract: The massive glutenite reservoirs are developed in the Upper Wuerhe Formation in JL57 region,Mahu deepresssion,Junggar Basin.The glutenites are classified into five types,which are coarse grained rock,medium-grained rock, fine conglomerate,medium coarse sandstone and siltstone.The medium-grained rock, fine conglomerate,medium coarse sandstone are the main lithologies in the effective formations. How to identify effective reservoir lithology is an urgent problem to be solved in oilfield production test.The classic method based on the crossplot technology cannot be used in the target glutenite reservoirs.In addition,the classic BP neural network model is not advisable due to the needed a large number of input parameters and computation.The accuracy of lithology identification is low.In this study,the principal component analysis method is used to first calculate three eigenvalues of X,Y and Z from three well logging curves.These curves are natural gamma ray (GR),spontaneous potential (SP),formation resistivity (RT),acoustic travel time (AC),density (DEN) and compensated neutron (CNL).Afterwards,there three eigenvalues are used as the input parameters in the BP neural network model to identify formation lithology.Comparing with the classic BP neural network model,the composition of the improved model is simplified,the computing time is reduced,and the lithology identification accuracy is improved.The lithology identification problem of the target formation is effectively solved by using the proposed method.
Key words:Upper Wuerhe formation;Principal component analysis(PCA);BP neural network;Glutenite;Lithology identification