利用快速聚类分析分区确定化探背景上限的方法
2014-06-27赵玉岩郝立波陆继龙
赵 禹, 赵玉岩, 郝立波, 陆继龙
(吉林大学 地球探测科学与技术学院,长春 130026)
0 前言
背景上限的确定方法是区域化探数据处理的核心问题之一,其科学与否直接影响到找矿靶区定位的准确性,甚至决定了能否发现具有微弱异常的隐伏矿床。区域地球化学原生背景与异常形成于相互独立的地质过程。在地质背景单一的研究区,由于其背景形成于相似的地质过程,采用统一的背景异常划分方法就可以得到好的效果;在岩性复杂地区,不同地质单元的形成过程可能完全不同,选择统一的背景上限显然是不科学的。
在复杂岩性区内,全区采用统一的背景上限值来圈定异常是不合理的,这已经成为所有地质学家的共识,并提出了一系列的新方法,主要有分区背景校正法、移动平均法、趋势面法和子区中位数衬值滤波法等。分区背景校正法[1]是在已知地区岩性地层分布情况下,对不同的岩性区分别处理,去除岩性对背景值的影响,然后把剩余值合起来统一圈定异常。然而目前并不是所有地区都有完备的地质图或者至少有些地质图岩性的圈定是不明确的,因此当面对这些地区时就会形成多种分区方案,导致异常圈定的可变性和不确定性。移动平均法和趋势面法都需要元素含量是连续变化的[2-3],然而这在地质事件中是很难实现的,因为元素含量的形成受地质、地形、景观等多种因素控制,往往形成一个凹凸不平且不连续的面。子区中位数衬度值滤波法[4-5]作为目前较为常用的确定地球化学背景及异常的方法,它强调数学意义上的分区,其地质地球化学意义仍有待于进一步验证。近些年,成秋明[6-9]以“局部奇异性-广义自相似性-分形谱系”为核心理论提出的C-A、S-A等多重分形技术,充分考虑了元素的含量分布频率、异常的空间形态和变化性、地球化学场的各向异性和广义自相似性,已被普遍证实为有效的矿产勘查评价方法。
受广义自相似性理论[10-11]的启发,本次研究提出一种基于风化产物(土壤或水系沉积物)对基岩的继承性,以主要造岩元素为指标,用快速聚类分析方法对研究区样品进行广义自相似性分类,分区计算背景上限的新方法。以1∶200 000 郴县幅化探采样数据进行实例验证。结果表明,该方法能有效地去除不同地质体类型背景对异常的影响,突出矿致异常,削弱区域背景,缩小靶区面积,识别微弱异常。
1 方法原理
1.1 风化产物对基岩的继承性
采用土壤或水系沉积物开展区域化探工作的基本前提是残积物来自基岩的风化,与基岩有紧密的空间和成因联系,其化学成分对基岩化学成分有继承性。元素在土壤中的相对含量变化与基岩元素含量高低有关,主要造岩元素(以氧化物形式表示)组合关系没有发生明显的变化,反映了土壤与基岩成分的继承性[12],而一些微量元素,特别是亲硫元素,在岩石风化成土过程中,元素组合关系发生较大的变化。
1.2 造岩元素指标的选择
地表岩石的物质来源是地壳或上地幔,而地壳和上地幔中分布量最多的七种元素为:O、Si、Al、Fe、Ca、Na和Mg,它们的总质量约占地壳的 99.4 %,上地幔的 99.11 % ,这些元素是地壳中的各类岩石的基本成份。在国内化探数据中,这些元素含量都是以氧化物的形式给出,SiO2、Al2O3、Fe2O3、FeO、MgO、CaO和Na2O,因此,研究指标选择为 SiO2、Al2O3、Fe2O3、FeO、MgO、CaO和Na2O。如果以单元素为标本,那么建议不选用O,而用 Si、Al、Fe、Ca、Na和Mg。
1.3 样品分类方法
目前被人们广泛使用的统计分类方法有聚类分析和判别分析两种。聚类分析的实质是建立一种分类方法,它能将一批样品数据按照它们在性质上的亲密程度在没有先验知识的情况下自动进行分类,且不需要对原始数据做任何假设,包括“快速聚类分析”(K-Means Cluster Analysis)和“层次聚类分析”(Hierarchical Cluster Analysis),当观察值的个数多或文件非常庞大时更适于选用前者。判别分析是先由已知分类情况的不同样本构造出判别函数,再由此函数来决定新的未知类别的样品属于哪一类,该方法需要有预测变量服从正态分布、变量之间没有显著相关性等假设条件。由于判别分析需要给出已知分类,而复杂情况存在差异无法事先的判别分析标准,不同地质工作人员对判别标准理解不同,实际操作时或有人为因素影响,所以,本研究采用聚类分析方法进行样品分类。在 SPSS、SAS、Stata 三大权威统计软件中都可以实现以上分类功能,本研究选择 SPSS 软件下的“快速聚类分析”功能对化探数据进行分类处理。
1.4 方法流程
1)数据的分类处理。将EXCEL格式的原始数据导入SPSS软件,以七种氧化物SiO2、Na2O、K2O、MgO、Al2O3、CaO、Fe2O3为“变量”对样品进行快速聚类分析,并使聚类成员的分类号自动保存到SPSS的表格中,然后把这些分类号对应复制粘贴到原始数据的EXCEL表格中,利用EXCEL的自动筛选功能按分类号将所有样品分类保存。
2)分子区确定背景上限。以上得到的分类结果实际代表着研究区内不同类型地质单元,需要对这些子区分别计算背景值。可以采用传统经典统计方法,如采用平均值(X)±3×均方差(S)为上下限迭代剔除极异常点,使所有数据全部分布在X-3S与X+3S之间,再以背景值加2倍均方差计算背景上限,或者采用 Tukey[4]提出的非常规统计学方法 EDA 技术来计算背景上限Fu。
3)异常区域的统一圈定。用原始数据减去各数据所在子区的背景上限,所得结果即为“异常量”值,然后利用该“异常量”值作等值线图,这样圈定的大于“0”的区域即为异常区。传统方法处理与本文新方法对比效果见图1。
图1 方法原理图Fig.1 Figure of method principle(a)未分区前;(b)分区处理后
图3 W元素地球化学异常分布图Fig.3 Figure of geochemical anomaly distribution of W (a)新方法处理结果;(b)传统方法处理结果
2 应用实例
2.1 研究区地质概况
研究区大地构造位置属华南褶皱系赣湘粤桂褶皱带的重要组成部分。地处湘南扬子古陆与华夏古陆之间的南岭构造岩浆带中东段的北缘,与粤北南北向构造带交叉复合部位。区域内岩性复杂,出露地层由老到新有震旦系、寒武系、泥盆系、石炭系、侏罗系、白垩系、第四系等,并于山间河谷地带发育大量新近纪冲洪积层。雪峰期、加里东期、海西期、印支-燕山期和喜山期构造岩浆活动频繁,各类花岗岩发育。区内最主要成矿有利位置多处于燕山期花岗岩与震旦系、寒武系、泥盆系地层接触部位,目前已发现有柿竹园钨锡铋钼多金属矿区、瑶岗仙钨矿、白云仙钨矿、圳口钨矿等多个矿床。
2.2 异常提取效果
以1∶200 000 郴县幅化探采样数据进行实例验证。利用本文方法,以成矿元素W为例进行异常区域的圈定,原始数据分类情况和各子区背景上限计算结果(本文采用传统经典统计方法)列于表1,每一类数据分别对应研究区内A、B、C、D四个不同的子区(图2)。同时应用传统方法对原始数据进行处理,用背景值加2倍的标准差作为全区统一的背景上限圈定异常,并对两种方法圈定结果作对比图(图3)。
表1 原始数据分类情况和各子区特征值
图2 分区数据投点图Fig.2 Point figure of subregion data
两种方法圈定结果与研究区内已知钨矿对应情况见表2,可以看出,对于中大型、超大型钨矿两种方法都具有很好的提取效果,而本文新方法对于部分小型、极个别中型矿(杨梅坑中型钨矿)提取效果明显优于传统方法,主要表现为可以增强矿区内弱小异常或使其以独立的异常区域显示,从而达到提高识别度的目的。此外,利用快速聚类分析分区确定异常下限的方法还具有如下的优势:
1)增强了低背景场内弱小异常,不易漏矿。图3(a)中1、2、3号异常区域在图3(b)中只以微弱异常显示或仅位于大面积异常的边部,而在图3(a)中则形成独立的异常区,增强了微弱异常的识别度,起到了突出矿致异常的作用。这些异常点均距离出露岩浆岩体有较小的一段距离,可能与深部隐伏岩体有关,例如观音山地区作为瑶岗仙矿田后期发现的东部矿区的重要组成部分,在图3(a)中圈出了很好的3号异常区,然而应用传统方法,即使把背景上限缩小到背景值加 0.5 倍的方差,都不会有异常的显示。
表2 研究区内已知钨矿点异常提取效果
2)削弱或排除高背景区内的非矿致异常,缩小靶区面积。大面积的高背景区往往会造成异常等值线连续分布,形成大面积的异常区,然而真正成矿的只是很小范围内,从而增加了勘查找矿的工作量。如图3(a)中 5、6 所示,排除了高背景场内非致矿异常,缩小了靶区面积,但并没有丢失掉重要的矿点,反而异常强度得到了增强。
3)发现了新的矿点。图3(a)中4号异常区,虽然异常强度不大,但成矿条件与已知矿床具有很大相似之处,都位于岩浆岩与有利成矿地层泥盆系接触部位,因此具有很好的成矿远景。
3 结论
1)快速聚类分析能够快速、有效的对原始数据进行分类。
2)经验证,本文提出的新方法确实能够起到突出微弱异常,不易漏矿,削弱高背景区内非矿致异常,突出矿致异常,缩小靶区面积的效果,与分区背景值校正法效果相似,但更简单快捷。
3)本方法是以造岩元素含量在风化产物与基岩的明显的继承性为基础的,具有明确的地质意义,而不仅仅是数学意义上的处理。此外,本文新方法还具有不需要考虑岩性复杂与否、不需要研究区地质图的优点。
参考文献:
[1] 周蒂.分区背景校正法及其对化探异常圈定的意义[J].物探与化探,1986,10(4):263-273.
[2] 李长江, 麻土华, 徐有浪.地球化学景观吸引子发现及其意义[J].浙江地质,1995,11(1):86-90.
[3] 谢学锦.区域地质调查野外工作方法(第四分册)—区域化探[M].北京:地质出版社,1979.
[4] 史长义,张金华,黄笑梅.子区中位数衬值滤波法及弱小异常识别[J].物探与化探,1999,23(4):251-257.
[5] 赵宁博,傅锦,张川,等.子区中位数衬值滤波法在地球化学异常识别中的应用[J].世界核地质科学,2012,29(1):47-51.
[6] 成秋明,张生元,左仁广,等.多重分形滤波方法和地球化学信息提取技术研究与进展[J]. 地学前缘,2009,16(2):185-198.
[7] 成秋明. 非线性成矿预测理论: 多重分形奇异性-广义自相似性-分形谱系模型与方法[J]. 地球科学—中国地质大学学报,2006,31 (3):337-348.
[8] CHENG Q. Non-linear theory and power-law models for information integration and mineral resources quantitative assessments[J] . Mathematical Geosciences,2008,40:503-532.
[9] CHENG Q, XU Y, GRUNSKY E. Integrated spatial and spectrum method for geochemical anomaly separation [J]. Natural Resource Research,2000,9(1):43-52.
[10] 成秋明.非线性矿床模型与非常规矿产资源评价[J]. 地球科学—中国地质大学学报,2003,28 (4):445-454.
[11] 成秋明. 空间模式的广义自相似性分析和矿产资源评价[J]. 地球科学—中国地质大学学报,2004,29 (6):733-743.
[12] 郝立波, 马力, 赵海滨. 岩石风化成土过程中元素均一化作用及机理: 以大兴安岭北部火山岩区为例[J]. 地球化学,2004,33(2):131-138.