APP下载

基于数据挖掘的成矿预测研究

2018-07-11史小英

中国锰业 2018年3期
关键词:空间数据成矿数据挖掘

史小英

(西安航空职业技术学院,陕西 西安 710089)

0 前 言

矿产资源对我国国民民生和国家经济建设有比较大的影响,矿产作为各行各业生产必须的能源,对矿产的分布情况进行评估和了解具有重要的意义。随着现代化科学技术的不断发展,可以为地质矿产生产提供的数据日益增多,为成矿的预测打下了基础,并提供了相应的数据支持。同时也使数据的维护难度和管理难度增大,数据的获取难度也随之增加。人们为了可以更好的探明矿区的地质情况,研发了各种可以对数据进行提取的方法,推进了数据挖掘的研究进展。

1 案例介绍

我国西部地区某成矿带在进行成矿预测时,以资源潜力为例开展实验研究,并将最后得到的预测结果和传统分析方法得到的数据结果进行了分析,在利用数据理挖掘技术进行分析时,使用ArcSDE作为空间数据引擎,本矿区在进行预测时所使用的数据库系统中包括了矿区的地球物理数据、矿区的基础地质数据、矿区的地球化学数据、矿区的遥感数据等数据内容。在对数据进行计算时,主要采取以ArcEngine组件为基础的算法进行计算,利用C语言来实现数据的挖掘和分析。该矿区的南北宽度为150 km,东西长度为850 km,总面积大小为9.5万km2,该矿区岩性主要包括结晶灰岩、基性火山岩、片岩、古元古代的金水口岩群、结晶灰岩、大理岩、斜长角山岩,岩性组合下部采用碎屑岩,上部为中酸性—中基火山岩,新—中元古代万宝沟群,岩性组合为下部中基性火山岩、上部碳酸盐岩。出露的浆岩主要为各时代的花岗岩。主要为英云闪长岩、钾长闪长岩、花岗闪长岩。由于该矿区出现了多个阶段的俯冲情况,矿区陆缘有增生的情况出现,而且岩浆也产生了活动,导致矿区环境表现为广泛化和多样化的特点。

2 成矿预测模型与技术支撑

在建立成矿预测模型和确定需要用到的技术的主要内容为:收集大量的地质空间数据和矿床的模型作为成矿模型的参考依据,从中找出区域成矿的规则,找出规则后还要对其进行验证,建立一个系统的评价指标来对找出的规则进行判别,从而为区域成矿预测模型提供数据支撑[1]。在成矿预测模型过程中需要的技术有:连续型地质空间数据离散化、成矿空间关系的提取、成矿规则的提取、系统化的评价。图1为成矿预测模型框架示意图。地质空间数据的空间关系、数据的分类、结构化等问题比较复杂,所以为了将这些问题进行总结归纳,建立一个空间数据库管理系统。将不同的数据系统化,将结构化的数据和非结构化的数据进行系统化的管理,将各数据之间建立联系。除此之外,空间数据库管理系统还要将管理图形、遥感影像和 DEM 数据收集在内,并对这些数据进行分析研究。数据仓库的主要内容是将收集到的数据进行加工、分析、分类和储存,然后将这些数据汇总并制作成多维数据图的形式展现出来。收集到的数据经过数据库的分析后不能直接作为参考依据,还要通过在实际的挖掘过程中进行验证,验证符合标准的才能作为参考依据

图1 成矿预测模型框架示意图

2.1 云模型离散化方法

在进行地球化学连续区间数据的收集过程中,收集到的数据往往不符合空间数据收集的要求,为了解决这一问题,就要对收集到的数据进行离散化。传统的数据离散化方法没有考虑到数据的变化性,所以不能准确进行离散化,在本次地质空间数据收集的过程中采用云模型的离散化方法[2]。采用云模型的方法可以准确计算出变化的地质空间数据,它可以用专业的数值和语言来作为转换模型将变化的值转换为确定的数值,将人类认知中那些模糊和随机的概念加以系统化的分析,把这些概念构成一个映射关系,从而将转换到的数值运用到数据的挖掘和控制当中来。在利用云模型进行地质空间数据连续性区域化学数据离散化处理的过程中,首先要对收集到的数据进行等级分类 ,然后对收集到的数据进行云模型计算,如果计算出的数值与设计的数值偏差较大的时候,就要对设计的数值进行一定的修改。

2.2 分析成矿空间内因素之间的关系

当判定区域成矿具备相关条件的时候,还要对相关条件和因素进行空间关系的提取,空间关系包括矿区断层的走向、矿层到断层之间的距离、矿层到不整合界线之间的距离、矿层与断层、不整合界线三者之间的距离。这些关系可以为成矿的规则提供重要的参考依据,为研究地质空间与成矿空间的关系提供数据基础。

3 基于数据挖掘的成矿预测

3.1 对数据进行分析研究

在进行数据分析和研究之前,要先参考成矿预测模型中数值来确定最符合要求的控矿变量及阈值。然后将收集到的数据和控矿变量送到相关部门进行检验,检验通过后要将地层结构的状况、断层分布和结构状况、航磁的数据、矿层的分布状况等影响因素绘制成图属性表,作为相关性检验的参考依据。在构建地质空间研究对象之前,要先将研究的区域按照1 km×1 km的方式划分为网格结构,然后再利用空间链接,将网格结构与制作好的图层属性表相对应,从而将每一网格结构的地层结构的状况、断层分布和结构状况、航磁的数据、矿层的分布状况都体现出来。除此之外,为了保证施工的安全性,在进行数据处理的时候要将矿层到断层之间的距离、矿层到不整合界线之间的距离设置缓冲距离,起到保护作用[3]。

根据地质空间的网格特征,现在将每一网格结构的断层的走向关系和断层到矿层的距离关系整合在一起,方便成矿的规则提供参考依据。为了将它们之间的空间关系更直观的表现出来,需要利用这些空间关系的数据制成图层属性表,并将每一网格结构看成是一个地质空间对象,把每一个网格结构的相关属性都表现在图层属性表中。然后再分析每一网格结构的图层属性表就可以了解该地质空间的网格特征了,土层属性表要表现出该地质地层的结构、岩石结构、不整合界线、布格重力的大小、航磁的数据、矿层的分布状况。最后为了计算出具体值,利用云模型的方法对地质空间数据进行连续区间数据的离散化挖掘[4]。

3.2 提取成矿关联规则

除了上文提到的要对收集到的地质空间数据集进行系统化的管理和相关性的检验外,还要对数据集进行层次分析和专家评价,专家要根据评价参数的重要性将影响参数重新排列,如表1所示。其中影响最大的是兴趣因素,提升度和覆盖度次之,影响因素最小的是置信度。

表1 计算得到的评价指标权重分配结果

结合以上提取到的成矿关联规则和质量评价指标,对成矿地质空间数据集进行权重分配,将所研究的地质区域的每个网格结构的值都计算出来。我们就可以跟据计算出的值将地质区域划分为不同级别的区域,如图2所示,地质空间数据挖掘的有利成矿区在高潜力区和中潜力区占比大,占总研究值的92%[5]。证据权模型有利成矿区也主要集中在高潜力区和中潜力区,占总研究值的68%。

图2 证据权模型与地质空间数据挖掘预测示意

如图2所示,地质空间数据挖掘的有利成矿区域,总矿床点为81个,处于有利成矿区域的矿床点就达到74个,占总矿床点的92%。此外,在高潜力区中,处于有利成矿区域的矿点为58个,占总矿床点的72%,在中潜力区中,处于有利成矿区域的矿点为16个,占总矿点的20%。通过以上数据我们可以得出基于地质空间数据挖掘的成矿预测模型的精准度要大大高于传统的证据权模型预测的精准度。

4 结 语

总而言之,在对成矿进行预测时,采用基于数据挖掘的预测方法可以对海量的多源地质空间数据进行充分的利用,通过在矿区探测中使用数据挖掘技术可以有效提升矿区预测的预测效率和预测精确度,并且可以极大的降低矿区勘察过程中需要耗费的资金。本案例在对矿区的成矿情况进行预测时,首先构建了以数据挖掘技术为基础的矿区预测模型,并且提出了具体的预测方法,然后结合实际案例,对成矿预测效果进行了分析,实践证明。基于数据挖掘的成矿预测精准度更高,具有较高的推广应用价值。

猜你喜欢

空间数据成矿数据挖掘
改进支持向量机在特征数据挖掘中的智能应用
桂西沉积型铝土矿床成矿规律及成矿模式
探讨人工智能与数据挖掘发展趋势
新疆寨北山铜矿成矿新认识及找矿预测
中非铜钴成矿带矿床遥感特征研究
柴达木盆地北缘锂多金属矿成矿条件及找矿潜力
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
GIS空间数据与地图制图融合技术
软件工程领域中的异常数据挖掘算法
网格化存储的几项关键技术分析