利用Matlab 聚类分析工具箱划分碳酸盐岩岩性
2014-12-24钟亚军张宏涛胡高贤
钟亚军 张宏涛 胡高贤 董 岩
(1. 石油大学(北京) 北京)(2. 陕西省煤层气开发利用有限公司 陕西 西安)(3. 石油集团测井有限公司油气评价中心 陕西 西安)
0 引 言
岩性识别是储层测井评价的首要任务。常规油田生产往往采用交会图法识别矿物成分,最常用的就是中子—密度交会图法识别岩性。交会图法一般适用于岩石骨架成分不超过2 ~3 种,复杂岩性碳酸盐岩储层,其岩石骨架的主要矿物成分是方解石和白云石,通常还含有一些粘土矿物、有机质、石膏、盐岩、黄铁矿、硅质等,它们虽然含量不多,但对储层的影响及对测井信息的贡献特别大,因此依靠该方法无法细致的划分储层岩性。Matlab 具有其他编程语言例如FORTRAN、C 语言无法比拟的强大图形功能,本文主要引用Matlab工具箱中的聚类分析函数实现岩性划分识别,即利用Matlab 聚类函数进行测井相析,通过测井相与岩相之间转化,得到单井系统聚类岩性。对研究区几口取心井进行计算分析,然后对比取心岩性。对比结果有较高的识别符合率,可以在该地区推广使用。
1 聚类分析测井相基本原理
聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术,根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法,它们讨论的对象是大量的样品,要求能合理地按各自的特性来进行合理的分类,没有任何模式可供参考或依循,即在没有先验知识的情况下进行的。聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析的目标就是在相似的基础上收集数据来分类[1]。
本文主要运用系统聚类方法,简单地说,是指聚类过程按照一定层次进行。它是目前使用最多的一种聚类方法,其基本思想是:首先,将要分类的n 个变量各自看作一类,然后分别计算两个个体之间的对应程度或关系密切程度[2]。可以用两种方式来测量:1)采用描述个体对(变量对)之间的接近程度的指标,例如距离,距离越小的个体(变量)越具有相似性。2)采用表示相似程度的指标,例如相关系数,相关系数越大的个体(变量)越具有相似性[3]。在计算出个体之间的距离之后,将关系最密切的两个个体归为—类,其余不变,即得到n-1 个类,如此重复进行下去,每次归类都减少1 类,直至最后n 个变量都归为1 类,如图1 所示。系统聚类能够得到多个分类解,可以根据实际情况进行分类。系统聚类的显著优点就是可以在岩心资料较少情况下,根据测井曲线系统聚类,结合地区经验,进行岩性分类,不同于判别分析需要大量岩心资料样本。
图1 聚类分析原理图
2 计算过程
Matlab 统计工具箱聚类分析函数实现测井相分析主要有以下步骤:
1)找到数据集合中变量两两之间的相似性和非相似性,用pdist 函数计算变量之间的距离;
2)用linkage 函数定义变量之间的连接。将对象进行分组,生成二进的具有层次结构的聚类树;用linkage 函数将很接近的两两对象联系一起;对象被两两合并成为二进类,同时新生成的类合并更大的类,直到聚类树生成;
3)用cophenetic 函数评价聚类信息,利用pdist 函数生成的Y 和linkage 函数生成的Z 计算cophenet 相关系数;
4)利用cluster 函数,根据linkage 函数的输出Z 创建分类。
当分类变量的测量尺度不一致时,需要事先做标准化处理。
数据标准化处理包括选择数量,类型和特征的标度,它依靠特征选择和特征抽取,特征选择选择重要的特征,特征抽取把输入的特征转化为一个新的显著特征,它们经常被用来获取一个合适的特征集来为避免“维数灾”进行聚类,数据预处理还包括将孤立点移出数据,孤立点是不依附于一般数据行为或模型的数据,因此孤立点经常会导致有偏差的聚类结果,因此为了得到正确的聚类,我们必须将它们剔除。
在利用测井资料作聚类分析时,我们选取六条与岩性相关度较高的曲线作变量,他们分别是GR、AC、DEN、CNL、PE、RLLD。测井数据之间的量纲是不一致的,灰岩的电阻率可达103数量级,而中子、密度一般只有个位数量级,为了防止出现中子、密度曲线被“吃掉”的情况,因此,在作聚类分析之前先将测井曲线进行归一化处理。
具体代码如下:
根据聚类树图的分布特征,结合地质取心资料,将本区岩性主要分为4 大类:灰岩,白云岩,泥质白云岩,膏质白云岩。所以将测井相分为4 大类(图2)。图中可以看出4 类测井相在交会图上较好区分。
图2 Matlab 程序生成聚类树谱
3 应用实例
利用聚类分析程序,对鄂尔多斯地区well001 井奥陶系测井数据进行处理,得到该井奥陶系马家沟组聚类分析岩性,然后与取心岩性相对比,取得较好的符合率,尤其是膏质白云岩层段符合率很高,说明该方法在识别复杂岩性上是有效的(图3,图4)。
图3 matlab 聚类分析结果在岩性交会图上的分布
图4 鄂尔多斯地区well001 井奥陶系取心岩性与聚类分析岩性对比图
鄂尔多斯盆地奥陶系马家沟组地层属于海相沉积地层,岩性以灰岩、白云岩为主,白云岩段储层较多发育,取心资料较多。该井在马家沟组共有3 处取心,1#取心13.35 m,2#取心17.22 m,3#取心30.64 m,将取心岩性观察与测井聚类分析识别岩性对比,符合率达96.3%。
在1#取心段,可以看出聚类分析识别的岩性中,很有效的泥质白云岩段、灰岩段从白云岩段中分辨出来;在2#取心段中,深度为2 313.24 m ~2 315.45 m 的白云质灰岩识别模糊外,其他层段全部符合取心观察岩性;在3#取心段聚类分析识别岩性准确的识别除了含膏质在内的白云岩层段。
4 结 论
1)利用Maltab 函数编写程序可以节省大量时间,提升工作效率,而且,利用它强大的图像功能可以实现测井解释的可视化,提高数据分析处理效果。
2)可以利用Matlab 统计分析工具箱实现了测井相聚类分析,完成了单井岩性识别,通过对比取岩心井岩性验证,证实该方法是岩性识别方便有效的手段。
[1]孙宇峰. 基于Matlab 的模糊聚类分析及应用[J]. 韶关学院学报(自然科学),2006,27(9)
[2]寻知锋,余继峰. 聚类和判别分析在测井岩性识别中的应用[J]. Journal of Shandong University of Science and Technology(Natural Science),2008,27(5)
[3]张振城,孙建孟,马建海,等. 利用测井资料自动识别藻灰岩[J]. 吉林大学学报(地球科学版),2005,35(3)
[4]杜 藏,骆 源. 科学计算语言matlab 简明教程[M]. 天津:南开大学出版社,1998
[5]陈桂明. Matlab 数据统计(6. x)[M]. 北京:科学出版社,2002
[6]刘 飞,陈岳龙,蒋丽婷.MATLAB 在碎屑沉积岩矿物含量计算中的应用[J].沉积学报,2006,24(2)
[7]朱剑兵. Matlab 软件在测井资料处理中的应用[J]. 油气地球物理,2006,4(1)