浅析大数据在地质矿产中的应用
2018-10-21焦平
焦平
摘 要:在当今社会,计算机的应用越来越广泛,地质矿产类的数据大量累积,两者自然而言的产生了相关的联系,为把计算机技术应用到挖掘技术中提供了可能。目前在地质矿产中的信息可以分为遥感信息和非遥感信息两种,针对矿化蚀变信息可以利用这两个方面的信息进行数据挖掘从而实现对于矿靶区的规划。
关键词:大数据;地质矿产;应用
中图分类号:P628 文献标识码:A 文章编号:1004-7344(2018)11-0126-02
前 言
目前随着大数据技术的快速发展以及地质矿产方面的数据积累日渐完善,大数据在地质矿产中应用的条件基本已经具备。所谓的大数据就是历史上保存的数据进行分析和数据挖掘,通过建立数据模型,从而获得数据之间的关联,进而达到对信息分析和数据预测的目的。目前大数据技术已经开始在很多领域应用,比如交通运输行业、医疗行业、刑事侦查,商业运营等,面对不同的情况采取不同的方法。本文主要通过探讨大数据在地质矿产中的应用,以谋求促进地质矿产行业水平的提高。
1 数据挖掘技术的简单介绍
1.1 什么是大数据
目前科学界对于大数据没有具体的定义,有些人看来:大数据是超过了传统数据的大小、总量的集合。这个描述并不严谨,并且大数据的概念并不是一成不变的,可能会随着时代的变迁发生新的变化。
大数据已经成为当今社会各个领域重点关注的对象,但是因为对其了解程度不够,各领域对大数据的认识还存在一些差异,许多领域的相关人员还没有把大数据和海量数据的差异区分开来。专家认为,想要正确使用大数据,促进大数据的快速发展,首先要知道大数据产生的条件,现状和今后的发展情況。
大数据代表的是获得信息的集合,目前所提及的“大数据”,但并不是指大规模数据集合的本身,而是数据,技术和应用三者的统一。半世纪以来,随着计算机全年的融入社会生活,信息爆炸已经积累到了一个开始引发变革的程度。全球的数据总量呈指数形式增长,并且新数据还在源源不断的出现。大数据时代已经来临。
1.2 数据挖掘技术的目的
人们在长期对数据的分析使用过程中发现,数据和数据之间存在着某种关联,但是这种关联性并不是显而易见的,需要通过定量的分析找到合适的方法推导说明,在推导说明的过程中存在一定的难度。首先,数据之间的关联性是比较复杂的,所以建模和分析过程也会变得较为复杂。其次,数据本身的量比较大,在具体实施的过程中,一步一步的推理将会繁琐复杂。因此,专业人员通过采取数据挖掘的方法来研究数据之间的关联性。一般常采用的建模训练,把大量的数据带入到解释模型中,对于模型进行反复推敲和分析,最终使得模型能够表示数据之间的关联。当今社会计算机的快速发展已经为大数据的运算提供了可靠的基础条件,也为数据挖掘技术的应用和普及提供了有利的基础。
1.3 数据挖掘技术的方法
数据挖掘的方法可以分为聚类分析、关联分析等几种类型。所谓的聚类分析方法是指对大数据进行分类,然后采用合适的方法进行聚类分析,现在最常用的是K-means算法。这种方法应用的原理是采用特征向量度对样品进行度量得到每个样本的特征向量,然后通过设置初始簇的方法将新样本加入到对应的簇当中,通过运算得到新数据的预测结果。在进行分类的同时也进行中心特征向量的修正,这样会让分类的标准更加准确。例如对于文档的分类的问题,描述同一个主题内容的文档在题目上可能存在很大的差异,但是聚类分析可以通过对关键词的统计和对应词、短语的使用次数对文档的内容进行区分识别,进而实现分类的目的。所谓关联分析,就是在数据交换、相关数据或其他信息数据中,找到存在于对象集合或项目内容之间的因果关系。
2 数据挖掘技术在地质矿产中的应用
2.1 成矿模式的建立和矿区深部或外围盲矿体的探伐
因为每个矿床的产生必定和周围的地质环境有一定的联系,所以相似的矿床或成因上有联系的矿床在一个区域中有成群出现的特点。所以,依据矿床找另一个矿床成为行之有效的方法。这种方法的运用在实际情况中屡见不鲜,据有关数据显示世界上已经探明的矿床80%分布在矿田范围内。因此许多矿山投产以后,陆续发现的矿产和储存量可能会远远超过勘探阶段所找到的矿体和存储量,在我国就有许多这样的例子,江西的钨矿,黑色金属里面的利国铁矿和水口山铅锌矿等。生产矿山积累了很多数据和信息,这位我们成矿的规律研究提供了有利条件。
2.2 优化矿山经营参数
矿山经营参数是经济学在矿山选取中的一种表现。矿山参数指的是在矿山开采中可以进行人工控制,进而控制生产的资源分配和经济收益等,其中含有采矿中的损失率、贫化率的分配、选矿中的精矿品位、回收率等。虽然现在已经有一些优化这些参数的方法,但是如果应用数据挖掘技术,对生产过程已经积累的海量数据,建立起来从入选矿石的各个变量直接求各种精矿产品的数量和品位的数模,将会大大简化优化的过程,而且可以减少优化结果的误差。
2.3 地质矿石质量的管理
在矿山开采过程中,矿石的质量管理对于矿山生产的经济效益和资源利用有举足轻重的作用。例如,在我国某个矿产公司经营的主要产品是高炉矿,客户对这些商品有较高的要求,铁的纯度要达到一定的要求,含S杂质也有一定的限度,否则就会降价处理,也可能会作为废弃品处理。对于在地下开采的铁矿资源,对于其中的含磷也有一定的要求。但是,据我们所知,矿床的不同区域的矿物资源和杂质含量都有一定的差异,要想满足客户的要求,需要对矿石的质量进行严格的控制管理。从矿石的开采到矿石的产出,有多个步骤做到商品矿符合用户的要求,是一个非常复杂的过程。但是一般需要进行质量控制的矿山都有海量的人工控制的信息,不仅有成功的信息,也有失败的教训,但是之间的联系有些是模糊的,一些数据挖掘的软件带有特定质量管理的功能,一旦可以利用数据挖掘技术构建一个综合性的质量管理模型,那么必然将会提高质量管理水平,较传统的人工控制有更大的优势。
2.4 围岩和矿石的分类、应用和评价
围岩和矿石是否稳定不仅影响着开采方法的选择,还影响着露天矿山的维护。一旦处理不好,不仅造成经济效益下降,甚至导致冒顶、片帮,或者边坡垮落等现象发生。但是,岩矿的稳定性是由许多因素共同控制的,除了物理机械因素外,还受其中结构面的类型、形状、水对岩石强度的影响和硬度,地应力方向、大小和挖掘工程方向等因素的影响。如果可以利用传统的信息进行分类处理,进而对不同区域的岩矿进行稳定性的估计,选用适合地下矿山采矿的方法、矿山边坡维护的方法、巷道支护的方法等,肯定也还有很大意义。
3 数据挖掘技术在矿化蚀变信息采集的应用
3.1 数据选择
采用数据挖掘进行地质矿产数据和信息分析首先要确定数据,如果数据范围划定太大则会导致分析时间过长结果不准确。因此,要根据地质矿产的应用目的进行数据选择,目前选择的主要数据包括:地质矿产历史积累数据和图像类数据。要对地质矿产的数据进行分析就需要大量的历史数据,在这方面主要采用地质、地球物理、地球化学等方面的资料。图像类数据。既包括对于该地区的遥感信息以及初步的光谱分辨信息等,目前在这个方面主要采用TM/ETM為主。
3.2 矿化蚀变信息的提取和举例应用
对于地质矿产的研究而言矿化蚀变信息的提取对于开矿区区域的划定具有重要意义。对于矿化蚀变信息可以分为两大类:①遥感信息;②非遥感信息。
在遥感信息的提取上,常常采用TM1、TM4、TM5、TM7波段组合提取羟基、含碳酸根离子等的矿物遥感蚀变异常:TM1、TM3、TM4、TM5波段组合提取含氧化铁遥感异常。进而把积累的历史数据作为基础进行分析处理,与此同时调整数据模型,找到最适合的模型向量,从而对于可能出现的矿化蚀变进行初步预测,进而可以稳定的选取开矿矿区范围。
在非遥感类信息的应用方面,可以收集有关的地质方面、控矿因素的特征数据、地质化学元素含量进行分析,采用关联原理或者用聚类处理的方法进行处理分析,根据矿化蚀变的预测结果来进行矿靶区的划定。
4 结束语
本文通过以上的探讨,指出了计算机性能大幅度提升和地质矿产类领域中进行应用的基础条件,希望大数据的应用能够推动在地质矿产中的高效发展。
参考文献
[1]杨晓敏.当前地址矿产勘查及找矿技术探讨[J].科技创新与应用,2016,04:73.
[2]齐维维.试论新形势下地质矿产勘查及找矿技术[J].建材与装饰,2016,06:216~217.
收稿日期:2018-3-13