APP下载

基于机器学习的铀成矿有利区预测技术研究

2022-11-21李瀚波叶发旺张川李新春淦清清

铀矿地质 2022年6期
关键词:铀矿成矿机器

李瀚波,叶发旺,张川,李新春,淦清清

(核工业北京地质研究院 遥感信息与图像分析技术国家级重点实验室,北京 100029)

近年来,越来越多的国内外学者提出运用大数据的思维方式对地质矿产数据进行分析,而机器学习技术逐渐成为其中的核心研究领域之一,也有一些学者开展了基于机器学习的成矿预测研究。国际上,Beucher 等在2013 年将径向基神经网络模型应用于芬兰西南部土壤中砷元素污染研究,得到区域内砷元素污染概率图[1]。Geranian 等在2015 年利用支持向量机、AdaBoost、随机森林3 种机器学习算法开展伊朗的Kerman 地区多元地球化学异常信息提取[2]。Carranza 和Laborte 在2015 年运用随机森林算法开展了菲律宾Baguio 地区金矿成矿预测[3]。

近年来,越来越多的学者提出运用大数据的思维方式对已有的数据进行分析,也有一些学者开展了基于机器学习的成矿预测研究。赵鹏大分析了地质大数据特征,提出数字地质是地球科学的数据科学[4];肖克炎等分析了在大数据思维下的矿产预测与评价的基本理论和方法[5];王登红等指出了地质大数据的特点以及在成矿预测中的应用[6];周永章提出在地质数据快速增长的情况下,开展智能数据处理方法的必要性,并提出机器学习是人工智能的核心[7]。蔡惠慧等利用一维卷积神经网络替代传统的人工计算,通过对研究区金多金属矿的地球化学元素及地球物理元素数据进行训练,划分出4 类成矿远景区[8]。王语、周永章等以已知钻孔数据作为训练集和测试集,运用支持向量机算法对模拟结果中的不同参量进行训练学习,建立相应的定量找矿预测模型,对研究区外围和深部找矿进行预测评价[9]。

在铀矿地质领域,地质、矿产、遥感、地球物理、地球化学等多个专业的工作为铀资源预测提供了大量数据,在大数据时代背景下也需要铀矿预测的方法有所创新[10]。通过对国内外学者研究成果分析后,笔者认为铀资源样本集合与机器学习技术结合的方式,可能是智能化预测应用方向。本文针对所建立的巴音戈壁盆地的塔木素-本巴图地区铀成矿信息样本集合,开展了砂岩型铀资源神经网络模型建设方法研究,建立了砂岩型铀资源机器学习模型,确定了基于机器学习的铀成矿有利区预测的主要流程,并对试验区进行了基于机器学习方法的有利区预测。

1 基于机器学习的砂岩型铀成矿有利区预测方法

1.1 机器学习和神经网络的基本概念

机器学习是一种从数据中研究算法的科学学科。简单来说,机器学习是一种根据已有数据,基于算法、数据训练和构建模型,进行预测的一种方法。其中,神经网络是诸多机器学习算法中的一种,适用于解决成矿预测的问题。神经网络是由大量神经元互相连接而形成的复杂网络系统,是高度复杂的非线性动力学习系统。神经网络具有自组织、自学和自适应能力,非常适合应用于需要同时考虑多种要素和条件的信息处理问题。神经网络技术现在已经广泛应用于人工智能、自动控制、机器人、统计学等领域的信息处理中。

成矿有利地段优选是研究多种地质特征相互关系的工作,在此基础上完成成矿预测。每种地质特征可能都反映某种地质现象,但特定的地质现象是多种地质事件综合反映后的结果,因此很难通过简单的线性拟合达到准确成矿预测的目的。而通过神经网络建模可以计算各种地质特征间的复杂关系,从而完成基于机器学习的成矿有利区判断与预测。

1.2 基于神经网络的砂岩型铀矿有利区预测技术方案分析

砂岩型铀矿地质找矿过程积累了大量的地、物、化、遥数据,这些数据从不同方面反映了铀矿找矿特征,因此将不同类型数据应用于有利区预测,是目前地质工作的一个重要问题。神经网络算法能够通过大量的历史数据,逐步建立和完善输入变量到输出结果之间的发展路径,当数据越多,神经网络就越接近真实。神经网络建立后,就能够通过不同的输入变量值,预测输出结果。

为实现数据挖掘方法及机器学习预测等应用,需要将试验区的地质、物探、化探、遥感等与成矿有关的数据与铀矿化数据集合在一起,形成统一的铀矿数据集进行数据挖掘和机器学习。在铀矿预测中,由于找矿数据类型多、差别性大等特点,不适合用线性数学模型来表达,神经网络等机器学习技术比较适合解决上述问题。由此,笔者设计了基于机器学习的铀成矿有利区建模和预测的方案。可简单描述为:首先建立铀资源勘查数据样本集合,使用神经网络等机器学习模型对铀资源勘查样本集合进行训练。具体可使用已知铀矿化级别作为神经网络模型的输出标签,地质、物探、化探、遥感等样本特征要素作为神经网络输入要素,进行机器学习和训练,完成神经网络建模。将预测区的铀成矿相关要素输入模型,判断该预测区的成矿潜力和前景。

通过对铀成矿有利区建模和预测方案的细化,确定了基于机器学习的铀成矿有利区预测的主要流程,具体实现步骤包括(图1):

图1 基于机器学习的砂岩铀成矿预测技术流程图Fig.1 Flow chart of sandstone uranium metallogenic prediction technology based on machine learning

1)提取样本特征变量,建立铀资源勘查样本集合。对样本特征变量进行量化处理,一般来说,数据样本的地、物、化、遥特征可以通过相应的成果图件计算获得,样本标签使用钻孔或已知铀矿化的矿化级别获得。

2)对训练样本进行学习,生成研究区的铀成矿预测区优选神经网络模型。即针对已建立的铀资源样本集合,使用神经网络等机器学习方法对样本集合进行训练,构建模型。

3)预测成功率检验。用部分未参与模型建立的已知数据作为输入向量,用训练好的人工神经网络模型对测试数据集进行识别检测,判断模型的预测成功率。

4)生成待预测区规则网格预测点,计算待预测点的特征值。通过GIS 空间分析功能生成待预测区的规则预测点,使用空间距离量算和预测点位置特征要素栅格图层读取,获取待预测点的特征值。

5)使用机器学习模型计算规则待预测点的成矿概率值。将待预测点输出的特征表格作为机器学习模型的输入,进行机器学习预测,得到每一个规则预测点的铀成矿概率值。

6)针对规则预测点成矿概率值特征进行插值,获取研究区的铀成矿概率图,数据分割得到铀成矿概率高值区,可以获取铀成矿有利区。

2 铀资源勘查样本集合建设及机器学习建模

2.1 铀资源勘查样本集合建设

本次机器学习建模与铀成矿有利区预测试验选择在巴音戈壁盆地的塔木素-本巴图地区进行。首先收集了试验区的铀矿化、地质、物化探、遥感等数据和图件,梳理了塔木素-本巴图地区机器学习建模所使用到的铀成矿特征,具体包括:找矿目标层、富铀体、目标层底板埋深、底板埋深坡度、氧化带前锋线、沉积相、遥感解译的排泄构造、航放铀、航放钍、航放钾、航放铀钍比、航磁等,共计12 个特征项。

开展铀资源样本集合建设,需要将数据样本标签与地质、物探、遥感特征联合在一起。在此之前应该首先进行数据预处理,包括成矿要素的选择与整合,空间数据要素修正、特征图层的抽取、文件格式的转换以及各种数据的投影变换等。

其中一部分数据以等值线类型为主,比如航放、航磁数据,这些数据可插值为栅格图,使用GIS 空间分析功能计算矿化位置处的栅格数值作为样本相应的特征值,完成与标签数据的关联。而以矢量格式存在的数据,可以通过计算各类要素与铀矿化标签的空间距离,完成相关样本特征的提取。图2 为试验区航放铀与铀矿化关系图,其中铀矿化数据作为铀资源样本集合中的标签数据,可以通过计算铀矿化所在位置的铀钍比数值来批量获取标签对应的特征值。

图2 巴音戈壁盆地塔木素-本巴图地区航放铀与铀矿化关系图Fig.2 Relationship between airborne EU and uranium mineralization in Tamusin-Bembatu area in Bayingebi basin

使用该方法计算了试验区中所有样本的目标层底板埋深、底板埋深坡度、氧化带前锋线、沉积相、遥感解译的排泄构造、航放铀、航放钍、航放钾、航放铀钍比、航磁等特征要素。将铀矿化级别标签信息与以上计算结果进行整合,获取了研究区相应的铀矿化样本集合(表1)。

表1 试验区用于机器学习建模的部分示意样本数据Table 1 Part of the sample data used for machine learning modeling in the experimental area

2.2 试验区机器学习建模

根据基于机器学习的铀成矿有利区预测流程,笔者针对所建立的巴音戈壁盆地塔木素-本巴图铀成矿信息样本集合,开展了砂岩型铀资源神经网络建模试验。

在神经网络模型中,使用有矿孔和无矿孔差异较大的特征参数作为试验区样本集合的输入层,输入节点为11 个,具体包括:找矿目标层、目标层底板埋深、底板埋深坡度、沉积相、遥感解译的排泄构造、航放铀、航放钍、航放钾、航放铀钍比、航放钍钾比、航磁等。样本的矿化级别作为输出层,节点为4 个,具体包括:无矿钻孔定量化为0,异常点定量化为1,矿化点定量化为2,工业孔或矿点定量化为3。

用于神经网络建模的铀资源勘查样本总计为131 个,使用102 个样本作为建模样本,29个样本作为测试模型精度的样本。通过多次试验,比较测试数据的分类精度,确定了神经网络的模型结构,神经网络模型结构图如图3所示。其中,神经网络模型中间隐层设置为1层,其中中间层为10 个节点,激活函数选择双曲正切函数。

图3 神经网络模型结构图Fig.3 Structure diagram of neural network model

通过不断试验和调整模型,得到了试验区用于铀矿预测的神经网络机器学习模型,通过测试样本数据检测,该机器学习的总体分类准确率为82.7%。

3 使用建立的模型对试验区进行铀成矿有利区预测

在建立砂岩型铀资源机器学习模型后,需要生成预测区的规则预测点,通过计算待预测点的特征值组合,代入机器学习模型进行计算每个待预测点的成矿概率值,通过插值运算完成了二连盆地中部的铀成矿有利区预测。

首先,通过GIS 空间分析功能生成试验区的规则预测点,共计约20 万个点,点距约500 m。使用空间距离量算和预测点位置特征要素的栅格值读取,依次计算待预测点的特征值,这些特征值应该和所建立的砂岩型铀资源机器学习模型输入值相同。完成特征计算后,将规则预测点的属性文件组织成可被神经网络模型读取的表格形式。将待预测点的特征要素代入铀资源机器学习模型中,可以计算每个预测点的成矿概率值。对经过机器学习模型计算后的规则点表格进行组织,根据其表格中的坐标值将这些规则点重新写入到GIS 系统中,并输出为矢量点格式。根据克里金空间插值方法,对规则点的预测值属性进行插值,获取了巴音戈壁盆地塔木素-本巴图的砂岩型铀成矿预测规律分布图(图4)。

图4 巴音戈壁盆地基于机器学习的铀成矿概率分布图Fig.4 Probability distribution map of uranium metallization based on machine learning in the Bayingebi basin

从巴音戈壁盆地的预测结果来看,如图4 所示,塔木素地区、本巴图地区和路登地区铀成矿潜力较高,其中本巴图和路登地区航放异常明显,地质和遥感特征与已知的塔木素矿床比较接近,可以作为下一步工作的重点。塔木素矿床附近沿北东走向仍然有成矿潜力,此外,乌力吉到银根地区沿北东向也有一定的成矿潜力。

4 结论

1)通过试验确定了基于机器学习的铀成矿有利区预测的主要流程,明确了砂岩型铀资源机器学习模型建立的方法,所建立的预测模型实现了试验区的铀成矿有利区预测,对未参与建模的样本进行测试,准确率可达到80%以上。

2)从巴音戈壁盆地的预测结果分析,本巴图和路登地区与已知的塔木素矿床成矿特征和条件比较接近,铀成矿的潜力较高,沿北东向的乌力吉到银根地区也有一定的成矿潜力。

猜你喜欢

铀矿成矿机器
机器狗
机器狗
欢迎订购2022年《大地构造与成矿学》
欢迎订购2022年《大地构造与成矿学》
欢迎订购2021年《大地构造与成矿学》
欢迎订购2021年《大地构造与成矿学》
CSAMT法在柴北缘砂岩型铀矿勘查砂体探测中的应用
铀矿地质勘探设施治理分析
未来机器城
关于铀矿地质退役设施的长期监护