广义帕累托分布在地球化学异常提取中的研究
2023-03-30李月林秦飞龙
李月林,罗 芳*,秦飞龙,罗 涛,秦 月,郑 伟
(1.中铁二院工程集团有限责任公司,四川 成都;2.成都工业学院 大数据与人工智能学院,四川 成都)
引言
随着社会不断的快速发展,人们越来越依靠能源进行生产,矿产资源是能源的基石,几乎所有的行业都直接或者间接与矿产资源存在联系,矿产资源是地球化学元素在地球深部的特定地质环境下通过不断运移而形成的,勘探矿产资源在地球的位置就需要研究地球化学异常分布规律,从而,地球化学异常提取是矿产预测的重要方法[1]。近年来,学者们围绕异常提取得出了许多成果,如累计频率、均方差等方法在异常提取存在广泛的应用,但该类方法有很大的缺陷,它需要地质数据满足或者近似满足正态分布,然而地球化学数据受到复杂地质环境影响,并不满足正态分布[2]。为了弥补上述缺陷,成秋明提出了一种基于复杂地质环境的非正态数据分布的分形方法[3],并在异常提取中得到了广泛的应用,然而该方法适合弱小异常提取[4]。针对上述问题,赵鹏大将地球化学异常理论知识描述为极值,地球化学异常是属于后尾分布[4],广义帕累托分布是对一个足够大的数据进行拟合,从而有些学者在此基础上利用广义帕累托分布进行地球化学异常提取建模[5],并取得了成功的应用,因此本文在前人研究成果基础上,根据地球化学数据非线性特性和后尾特性的特点,利用广义帕累托分布(Generalized Pareto distribution,GPD)后尾性分布特性原理,建立地球化学异常提取GPD 数学模型,对实际数据进行处理,为地球化学异常提取提供方法借鉴。
1 理论基础与模型建立
第1 步:数据准备。通过实际地质采样获取地球化学数据;
第2 步:数据后尾性检验。检验数据是否是后围分布,如果满足,能够GPD 进行异常提取;
第3 步:参数和阈值估计。将数据代入模型求取阈值,形状参数,尺度参数;
第4 步:结果合理性判断。利用PP 图[8-9]进行模型检验,如果理论分布和实际分布吻合,估计参数合理,否则返回第2 步重新计算,直到满足诊断性检验的理论和实际分布位置一致为止;
第5 步:GPD 空间分布。将估计的各种参数代入式(1),得出地球化学异常模型,利用GIS 软件刻画异常空间分布规律,进行矿产预测。
图1 不同形成参数的标准GPD 分布
2 模型应用
当GPD 模型确定后,将建立的异常提取模型应用于鸡冠嘴铜金矿区。选取矿区中的Cu 元素含量进行分析研究,经过计算Cu 的峰度值为240.4,不满足正态分布;偏度为10.3767,大于0,属于后偏,从而该数据符合GPD 分布。通过矩法估计得出Cu 元素的形状参数为0.5,尺度参数为312.5,通过峰度法得出阈值为910.1,带入式(1),得出Cu 元素GPD 分布为
将大于阈值910.1 的Cu 元素含量数据代入式(4),进行PP 图诊断性检验,见图2,由图2 发现超过阈值后的元素含量数据的分布与理论分布吻合,说明阈值和参数估计具有合理性。
图2 GPD 诊断性检验
最后将Cu 元素大于阈值的所有地球化学异常值对应的空间分布坐标和结合GIS 软件描绘出Cu 元素异常空间分布(图3)。由图3 可知,Cu 元素异常含量空间分布与所在矿体位置吻合,强异常区域完全能够指示矿体赋存位置,通过实际验证进一步说明建立的模型有效。
图3 Cu 元素异常含量空间分带
3 结论
本文在地球化学异常含量后尾性和非正态分布特性基础上,设计了一种提取地球化学异常GPD 模型。具体如下。
(1) 根据地球化学异常不是正太分布,具有非线性特点和后尾特点,广义帕累托分布是对一个充分大的样本数据进行拟合,以此建立了地球化学异常提取模型。
(2) 建立的模型中,利用峰度法进行阈值估计,通过矩法估计得出模型的参数值。
(3) 设计的模型能够提取实际矿区的地球化学元素含量异常值,所提取的异常区域与矿体走势一致,确定的异常分布能够指示矿体位置。