APP下载

大数据时代基于多元素数据融合的一张图化探异常评判

2020-12-31娄雪家张大伟史长浩崔军军

中国金属通报 2020年8期
关键词:化探正态分布对数

娄雪家,张大伟*,王 淼,史长浩,崔军军,刘 周

(1.吉林省有色金属地质勘查院,吉林 长春 130021;2.吉林省有色金属地质勘查局,吉林 长春 130021;3.吉林省有色金属地质勘查局六0二队,吉林 白山 130021)

国际数据公司(IDC)将大数据定义为“为更经济地从高频率的“大容量的”不同结构和类型的数据中获取价值而设计的新一代架构和技术”。基于多元素数据融合的一张图化探异常评判是在大数据的背景下,根据不同的元素之间的相关性,把各种分散的元素信息集成到一起而去除冗余信息、增强信号强度,真正达到为找矿服务的目的。

1 绪论

1.1 研究现状

化探找矿是一种效率高、效果显著的找矿方法,上世纪浅地表富矿的发现80%以上都与地球化学勘查有关。勘查地球化学(简称化探)是系统地测量各种天然物质(如岩石、疏松覆盖物、水系沉积物、水、空气或生物)地球化学性质(如成矿元素及伴生元素的含量等)的一门地球科学。测量目的是发现与矿化有关的地球化学异常,并通过异常的线索来圈定成矿远景地段、缩小找矿靶区,以寻找具有经济价值的矿床。其关键在于“异常评判”,评判的准确性和效率直接影响了找矿效果和找矿周期。

异常是一个相对概念,所以不能将其看作一个定值。传统的异常评判,通常都是对单一元素采用简单数理统计方法进行分析,或者依赖于人为经验判断。这种背景值的确定,一般是以特定区域范围内的元素样品平均值来度量,异常的下限基本以元素均值与其方差的加减倍数来划定的(单元素计算法),或者仅仅将不同元素等值线叠加到一张图上来了解不同元素的套合性,很少对多元素进行综合考虑。

随着计算机技术的发展,尤其是地理信息系统(GIS)等软件的广泛应用,提高了化探的数据处理的效率,将数据输入电脑可以直接制成化探的成果图件—单元素异常等值线图。而在实际工作中这种高效的电脑圈定的异常,要么大片出现失去了指示性,要么漫天撒豆毫无规律可循,难以达到指导地质工作的目的,也给异常的检查验证提出了难题。所以综合分析各元素的区别与联系,将它们融合到一起,能够达到信息的互补,去除冗余信息和干扰因素,弥补单一元素反映信息的不足。

1.2 研究目的与意义

20世纪以来,随着地质工作的深入,浅部富矿产资源开采殆尽,现阶段易识别矿和地表露头矿越来越少,地质找矿难度急剧增大,以往筛选“高、大、全”化探异常的找矿模式概率很小,单元素化探信息已经满足不了地质找矿工作的需要,异常筛选思路和准则也需要改变。21世纪以来多元数据融合技术(物探、化探、地质、遥感等)在地质找矿方面的使用也越来越广泛,化探作为多元中的一部分发展缓慢,基于多元素数据融合的化探异常评判符合多元信息集成的发展需求,也顺应“一张图”管理和“大地质、大数据”时代的发展。

2 多元素化探数据融合

2.1 数据处理及正态分布检验

2.1.1 数理统计

对全部数据进行数理统计:

(1)计算全区各元素测试数据的均值(X1)和标准离差(S1)。

(2)按大于X+3S的条件剔除一批高值后获得一个新数据集,再计算此数据集的均值(X2)和标准离差(S2)。

(3)重复第二步,直至无特高值点存在,求出最终数据集的均值(X)和标准离差(S)。

(4)用原始数据或取对数后数据绘制频率直方图,检验样品元素是否符合正态分布或对数正态分布。均满足正态分布检验要求。

2.1.2 化探参数统计

对研究区化探次生晕数据参数进行统计:算术全区、对数全区、算术剔除高值全区、对数剔除高值全区中的样品数、平均值、标准离差、变化系数、偏度、最大值、最小值、浓集克拉克值及致矿系数进行统计,为估计评价各元素找矿潜力和各地质单元地球化学富集特征提供必要的依据。

2.2 数据均匀化

由于不同元素在地质体中的含量存在数量级上的差别(10-6,10-9),将各种元素进行均匀化处理,将大小悬殊的数据变化到同一度量的水平,计算公式为:

2.3 元素相关性分析

为了研究各种元素的相关密切程度,将区内化探数据进行R-型模糊聚类分析。

(1)根据相关性检验,服从正态分布的元素直接用原始数据;过于离散,服从对数正态分布的微量元素,先将实测数据转换为对数再进行相关性分析。

(2)由于不同元素在地质体中的含量存在数量级上的差别(10-6,10-9),将各种元素进行标准化处理,将大小悬殊的数据变化到同一度量的水平,计算公式为:

j —样品数(j =1,2,3,……,n)。

(3)相关系数计算。采用R-型模糊聚类分析,得到相关系数矩阵,并制作谱系图。

2.4 多元素数据融合模型

2.4.1 主元素、辅助元素确定

根据区域找矿方向、元素富集系数和地球化学特征选择主元素,结合元素相关性和数据融合的可操作性选择辅助元素。元素组合的原则初步设定为:

(1)元素组合个数为3个~7个。

(2)相关系数大于0.30。

2.4.2 影响系数及阀值设定

主元素本身影响系数为1,为了避免辅助元素喧宾夺主,设定辅助元素的影响系数γ和阀值L防止其对主元素影响过大。

2.4.3 融合模型的建立

以均匀化数据为基础根据证据加权理论将多个元素进行数据融合,主元素变量影响系数为1,其它元素影响系数为γ,以此进行加权融合,融合后乘以主元素的平均值(剔除异点后)得到融合后主元素数据,融合模型:

式中:S1j—主元素融合后的第j个数据;

x1j—主元素第j 件样品的原始数据;

L —辅助元素影响系数阀值;

γi—第i 个辅助元素的影响系数;

Jij—第i 个变量第j 个数据均一化后的数据。

2.4.4 多元素数据融合步骤

(1)通过正态分布检验,数据符合正态分布或对数正态分布。

(2)通过均匀化处理,将大小悬殊的数据变化到同一度量的水平。

(3)进行R-型模糊聚类分析,分析元素之间的相关性。

(4)根据元素组合和勘查矿种确定主元素和辅助元素。

2.5 异常圈定

背景值和异常下限的确定与化探找矿的效果有很大关系,高了容易漏掉异常,造成漫天撒豆现象毫无规律可循;低了造成假异常或者使异常大片出现而失去了指示性。因此背景值和异常下限的确定采用数理统计方法,如2.1节中处理方法将原始数据的异点多次剔除后进行正态分布检验和计均值、标准离差统,并以此确定背景值及异常下限值。即异常下限=背景值+n倍的标准离差。

3 结论

通过试验融合后数据重新进圈定的异常与融合前的成果具有很好的再现性,吻合度较好,尤其是在对弱异常的处理上效果比较理想,在研究矿化富集规律上具有明显的优势,实现了对异常快速、准确、经济、高效定位的目的。通过结果验证与对比分析得到以下结论:

(1)异常再现性好。通过融合前、后异常对比,95%的异常具有重现性,说明融合数据异常信息的提取方面与传统经典方法一样具有很高的可信度。

(2)增强信号强度,降低噪声干扰。在低异常区具有较好的效果,主要表现在单元素较低,而其它具有成矿指示作用的元素有一定显示时,通过数据融合增强了信号强度,而使异常得到凸显;另一方面,对于单元素较低,其它元素指示也不好的异常区,通过融合提高了异常下限,从而降低单元素低值异常的干扰。

(3)精确定位与定向。对于规模较大的异常,往往成片出现,虽然面积较大,具有较好的找矿前景,但是几平方千米甚至几十平方千米的面状异常往往让工作无从做起,通过多元素融合不仅提高异常强度,也通过提高异常下限而使范围更加精确,同时使异常具有方向性和成带性,圈定的融合异常更接近真实情况,并且能够更加精确地指导找矿。

4 存在问题与工作展望

4.1 存在问题

(1)基于多元素数据融合的化探异常虽然通过对比实验取得了较好的效果,但是多元素数据融合模型还不成熟,辅助元素影响程度和阀值的设定是一个复杂的过程。由于时间问题和本人水平有限,笔者是基于经验和初步实验对比选定影响程度为0.6倍的相关系数,阀值确定为0.6,要想达到最佳效果,影响程度和阀值的设定还有待于进一步研究。

(2)土壤地球化学异常存在次生迁移现象,不同元素的迁移能力也不尽相同,与外界环境、地形、元素自身活性等密切相关,如果将以上因素参与多元素数据融合的定量和定向,将会取得更加准确的效果。

4.2 工作展望

21世纪以来“深穿透地球化学(Deep-penetrating Geochemistry)”技术在隐伏区找矿取得了突破性进展,BP神经网络应用于地质找矿与预测工作中也取得了相当好的成果,如果将深穿透物质纳入多元素数据融合之中,多元素数据融合的项目增加,会提高异常评判的准确性;而结合BP神经网络模拟人脑的自适应性、自学习性、自组织性、容错性等进行模式识别和数据处理,是化探信息技术“大数据”的发展方向,随着多元素数据融合模型的发展和完善,也必将在多元地学集成找矿预测中得到更好的应用。

猜你喜欢

化探正态分布对数
关于n维正态分布线性函数服从正态分布的证明*
指数与对数
指数与对数
趋势面法确定西藏青龙地区银铜铅锌化探异常及应用效果评价
东昆仑东段化探采样方法找矿效果探讨——以青海科日南地区为例
西藏热昌金矿地质及物探化探特征
比较底数不同的两个对数式大小的方法
生活常态模式
化探异常找矿效果在地质找矿过程中的应用
神奇的对数换底公式