Fisher判别分析法在油页岩识别中的应用
2014-06-27应芳芳西安石油大学地球科学与工程学院陕西西安710065
应芳芳 (西安石油大学地球科学与工程学院,陕西 西安 710065)
李朋 (中石化中原油建工程有限公司,河南 濮阳 457000)
Fisher判别分析法在油页岩识别中的应用
应芳芳 (西安石油大学地球科学与工程学院,陕西 西安 710065)
李朋 (中石化中原油建工程有限公司,河南 濮阳 457000)
近年来,多元统计方法的应用在石油地质领域逐渐受到重视并且取得了良好的效果。由于石油天然气资源有限,油页岩作为一种非常规能源越来越受到人们的重视,但由于沉积环境的不同,油页岩在不同的地区会有不同的测井响应类型和强度特征,常会造成地质工作者对油页岩层的误判从而提高了油气勘探的成本。基于多元分析Fisher判别准则建立了鄂尔多斯盆地FX地区的油页岩判别模版,模版采用研究区油页岩的声波时差、自然伽马、电阻率测井资料3个指标作为判别因素,利用方差分析的思想计算出判别系数并建立相应的研究区油页岩的识别方程。实测数据分析表明,该方法在研究区油页岩识别上具有良好的实用性和可操作性。
Fisher判别;油页岩;测井资料;泥岩;凝灰岩
目前随着常规油气勘探程度的不断提高,新的油气藏越来越不容易被发现。油页岩作为一种非常规能源,越来越受到人们的重视。但是目前国内对油页岩的研究程度还处在起步阶段。油页岩层的测井准确识别一直是一个比较困难的问题。虽然各种测井曲线在油页岩会有一些异常反应,但是这并非是一个充要条件。也就是说这些异常反应层段并非都是油页岩,不同的研究区其油页岩测井异常曲线类型和强度也不相同。这就给油页岩层的准确识别带来了很大的困扰,可能造成误判。多次的误判将会给油气勘探决策带来巨大的影响。为此,笔者引入数理统计的概念对油页岩进行判别。经过对多种行业相关问题解决方案的调研和不断分析实验,考虑到方法的实用性、准确性,引入Fisher判别法进行油页岩层段的识别研究。
1 Fisher判别分析方法
Fisher判别法的基本思想是将高维数据点投影到低维空间(如一维直线)上,同类别数据点比较密集,不同类别数据点区分明显。从而可以克服由高维数而引起的辨识混乱现象。为了提高效率,使该方法能在广大地质工作人员中推广使用,笔者主要考虑2类数据分析的情况,多类的情况可以依此类推。具体方法是从2个已知总体中抽取具有p个指标的样本观测数据作为训练样本,借助方差分析的思想构造一个判别函数y:使2组间离差达到最大,使各组内部的离差达到最小,从而确定函数系数,进而得出判别式。对于一个新的样本,将其各指标代入该判别式求出y值,然后与判别临界值y0进行比较,依据判别准则就可以判别其属于哪一类总体[1-3]。
假设预测目标有p个指标,即x1,x2,x3,…,xp,有n组已知的数据,判别方法就是根据这些已知数据,在一定的准则下确定函数式y的系数并找出临界值:
作2组判别时,将已知数据根据需要分成2组,即A和B,每组具有相同的判别因素x1,x2,…,xp。假设A有s组数据,B有t组数据,n=s+t,则组间数据分组如下:
2 FX地区油页岩判别模版的建立
根据研究区岩性区分难易程度,判别主要目的是建立油页岩与泥岩、凝灰岩的判别模版。从而有效的识别出油页岩。分别建立油页岩与泥岩、油页岩与凝灰岩2个判别模型,综合2个模版最终确定油页岩层位。根据研究区的油页岩测井响应特征,建模采用自然伽马(GR)、声波时差(AC)、电阻率测井(RT)3种测井资料作为研究区油页岩的判别参数。研究共采集数据183组,训练数据113组,其中油页岩42组,泥岩42组,凝灰岩29组;检测数据70组,其中油页岩22组,泥岩24组,凝灰岩24组。
2.1 油页岩与泥岩判别模型
首先假设油页岩与泥岩判别模版,具体数据如表1所示。根据数据确定油页岩与泥岩的矩阵。假设判别模版为:
构造其离差矩阵A、B(A、B分别由样本各列值减去均值所得)从而得到协方差矩阵S1、S2和综合协方差阵S:
表1 油页岩与泥岩数据统计表
则模型系数c1、c2、c3为下述方程的最优解为:
2.2 油页岩与凝灰岩判别模型
油页岩与凝灰岩的判别模版建立方法与油页岩与泥岩的判别模型相同,首先假设油页岩与凝灰岩判别模版:
2.3 判别模型有效性检验
模版的有效性需要检验之后才能确定,其有效性同样品个数、类别特征值之差有关。一般采用统计量F进行检验[7-9]:
对于给定的显著性水平α,从F分布表里查出Fα(p,s+t-p-1)。若F>Fα(p,s+t-p-1)(α一般取0.05),说明所得模版函数有效,可以作为判别模版。
模版F值分析得:
查表知F(油页岩-泥岩)与F(油页岩-凝灰岩)分位数都在2.68~2.76,所以该判别模版是有效的。
2.4 判别式检验
在研究区,需要解决的主要问题就是区分油页岩与泥岩、凝灰岩。将检验数据(70组)带入上述判别方程,假设所得结果y(油页岩-凝灰岩)为y1,y(油页岩-泥岩)为y2,通过y1、y2来判别是否为油页岩。若计算后y1、y2都符合油页岩要求,则可判断数据来源于油页岩(见图1)。经过2个判别式90次判别分析发现,正确率为97.78%,证明该方法在研究区是可取的。
图1 油页岩判别投点图
3 结论
1)Fisher判别根据投影的思想将变量的特征差异表现在判别函数中,适用于多变量的油页岩判别,研究采用2类判别式进行油页岩判别,从而使判别方法更加方便快捷,便于方法的推广。
2)运用70组检测数据对所得模版进行检验,其判识正确率达到97.78%,表明所建立的判别分析模型可用性强。在实际应用中,不同的研究区可根据具体情况,合理选择参数指标,大量收集建模资料数据,建立相应的建模数据库,随着模型训练样本的增加,模型的针对性和判别准确性会进一步增强。
3)Fisher判别分析方法为油页岩的识别提供了一条较为实用的技术途径,同时也重申一下判别因素与油页岩之间并非充要条件,即油页岩可以具有不同识别因素,反过来具有相似识别因素的不一定都是油页岩。也应当看到油页岩的判别因素是多种多样的,且不同的研究区块其判别因素和各判别因素的权重大小也不尽相同,因此油页岩的判别并非可以通过一个模版解决。但是可以通过提高训练数据的数量和准确性来提高判别模版的判识正确率。
[1]Altman E.Financial ratios,discriminant analysis and the prediction of corp0-rate bankruptcy[J].Journal of Finance,1968(10): 589-609.
[2]Edmister R.An empirical test offinancial ratio analysis for small business failure prediction[J].Journal of Finance and Quantitative Ananlysis,1972(5):1477、1 493.
[3]袁志发,孟德顺.多元统计分析[M].杨陵:天则出版社,1993.
[4]洪波,杨红.Fisher型逐步判别法在东海水团判别中的初步应用[J].海洋渔业,2005,27(2):143-149.
[5]高卫东.Fisher判别法在煤与瓦斯突出危险程度预测中的应用[J].中国安全科学学报,2010,20(10):26-30.
[6]王飞跃,董陇军,白云飞.隧道施工现场安全评价的费歇判别分析模型及其应用[J].中国安全科学学报,2008,18(1):160-164.
[7]赵路子,周彦,夏吉文,等.费歇尔多参数判别法在蜀南地区气层识别中的应用[J].天然气工业,2008,28(5):44-46.
[8]白云飞,邓建,董陇军,等.费歇判别分析方法在采空区塌陷预测中的应用[J].矿业研究与开发,2008,28(5):74-76.
[9]钟绍军,叶小青.费歇判别法在乳房癌诊断中的应用[J].黄冈师范学院学报,2004,24(3):27-31.
[10]张尧庭,方开泰.多元统计分析引论[M].南宁:广西师范大学出版社,1982.
[11]刘钦普.判别分析在黄土地层划分中的应用——以陕西洛川黄土剖面为例[J].中国矿业大学学报,2001,30(4):30-31.
[编辑]洪云飞
TE122.1;O213
A
1673-1409(2014)14-0016-05
2013-11-02
应芳芳(1987-),女,硕士生,现主要从事油气田地质与勘探方面的研究工作。