大数据在露天矿特征提取中的应用研究
2022-08-02于琳琳胡英男
于琳琳,胡英男
(1.中国建筑材料工业地质勘查中心黑龙江总队 资源地质勘查院,黑龙江 哈尔滨 150043;2.中国建筑材料工业地质勘查中心黑龙江总队 地质环境院,黑龙江 哈尔滨 150040)
露天矿开采是以矿区为中心点,沿矿区逐步向下开采。由于采煤工程作业安排的差异,使得边坡类型也存在差异,露天矿开采引起的边坡问题经常发生。由于露天矿使用时间较长,对安全性的需求也较高,一旦发生塌方或滑坡,就会导致重大的人员伤亡和经济损失。随着环保意识的增强,露天矿矿山开采对资源的破坏日益受到重视,矿山地质环境保护和安全生产已成为矿山企业在实际生产过程中面临的重要课题[1],也是当今社会、政府主管部门和矿山企业关注的热点问题,露天矿地质环境研究对预防地质问题、经济以及人们生命财产安全存在重要意义[2-3]。
相关学者对此展开研究,文献[4]提出高密度地质灾害易发区面向对象信息提取研究,利用耦合多尺度分割和支持向量机模型识别研究区内的环境体分布,建立环境特征数据集与环境体物理信息相关联机制。除可用来描述对象的光谱信息和几何信息外,坡度、粗糙度、植被覆盖带、沟谷、水系、矿区、断层等都可以很好地解释实际地形地貌特征,而且与环境信息具有高度相关性。文献[5]提出基于多源遥感时空谱特征融合的环境灾害检测方法,对多波段遥感图像进行了光谱空间和尺度配准,构造了融合时序变化特征、光谱特征和空间形状特征遥感影像数据集,将多维多谱变化信息转换成光谱表征模型,并利用SVM模型识别环境目标和背景地物,在此基础上根据环境基础形状模型的轴向长宽比、面积参数和不变矩等典型形状指标对环境区域进行目标精确分类和识别。虽然上述研究取得一定进展,但是对露天矿山地质保护工作存在一定干扰。为此提出大数据在露天矿特征提取的应用流程,可以实现高精度的露天矿特征提取。
1 露天矿面临的大数据问题
露天矿开发是一个复杂的系统工程过程,产生了大量的信息,信息来源可以分为内部和外部信息来源。内部数据来源包括露天矿每天生产和销售煤炭的活动,主要是用于数据开发的煤矿以及安全与调度、设施与耗材、通风、运输等生产数据,还包括财务、劳动与人事、原材料消耗等运营数据;外部信息来源包括对国家政策规范以上部门的指示、原材料市场、矿产市场等地质信息,主要集中在煤矿的特殊空间系统上,该系统包括煤层等地质设施。在信息表示形式中,可以概括为2种类型,其中一种可以以图的形式记录、分析和传输;另一个类别被记录、以电子表格等书面信息的形式传输。露天矿对地质数据的描述是一个从隐藏到可见的过程,露天矿煤田的形成和分布是由许多因素控制的,例如降水和构造性质,以及通过地理学方法(如磁石、地震等)获取地质层(山和煤)分布数据,岩石的物理特征可以通过钻探、测井和其他方法获得。
露天矿具有自动化、信息化特征,且能够深度融合,大型露天矿拥有众多的信息系统,这些信息系统每天都会产生大量的数据,但这些数据除用于基本的日常统计分析之外,还缺乏集中管理和深入挖掘数据的问题,具体问题表现为:①数据量巨大。露天矿每天人工记录和自动生成的数据超过万条,每年信息部门要收集、复制、分析上百万条数据,需要耗费大量的人力和时间。②数据量分散。露天矿往往地理位置分散,信息系统按照业务需求分散建设,不同时期建立的信息系统之间缺乏有效联系,信息系统间“信息孤岛”问题十分突出。每个信息系统的数据库是相互独立的,所以整个露天矿的数据都是一个分散的存储状态,并且很少相互关联。③数据格式不统一。因为信息系统在开发设计过程中没有遵循统一的数据标准,导致露天矿目前各信息系统数据格式不统一,使得内部系统集成、数据整合、数据分析较为困难。
2 大数据在露天矿特征提取流程
2.1 大数据预处理
在露天矿特征提取图像中,人类行为、提取系统、运行机器等多种因素的作用,导致了露天矿特征提取图像的存在误差。为了确保大数据在露天矿特征提取的应用的准确性,需要对大数据进行预处理。露天矿特征提取图像是通过几何校正和地图投影而形成的,图像中有少量的云层和积雪,但不会对研究区域造成任何影响,所以不需要进行云处理。在不同的条件下,露天矿山地质环境特征信息的正常数据与异常数据不同,所选用的预处理方法也不尽相同,综合了露天矿面临的大数据问题,大数据预处理对正常数据采用正射校正方式,对异常数据采用图像裁剪方式。
(1)正射校正。通过对地面接收站进行常规处理,分析露天矿的遥感图像,几何修正由系统和非系统因素造成的图像失真问题。为了满足要求,必须对露天矿特征提取图像进行正射校正,利用数字高程模型校正因地形起伏造成的图像失真,并提供了高程信息,从而产生大数据预处理下正射校正的处理步骤,具体为:①在不进行地理编码的情况下,2个图像数据的坐标是严格统一的。仅通过控制点来进行地理上的参考。修正模式的选取,修正的参数设定。利用GPS技术采集地面控制点信息,对全域图像进行修正。②对修正模型进行选取,并设定修正参数。在多波段影像与正射校正的全域图像中,选取8个清晰的画面,并以修正后的全域图像为参考进行配准;③重新取样图像,在进行图像正射校正时,图像像素的位置因重新定位而造成图像像素的不均匀分布,所以需要对图像进行再抽样,并对其进行再定位。
(2)图像裁剪。为了降低露天矿山地质环境特征信息的异常数据图像的冗余信息,方便数据的后续处理,需要对露天矿的遥感图像之外的部分进行裁剪。利用图像处理技术,对所涉及的区域进行了分割,具体过程:①选取原图像中需要向量网格化的区域,将平面矢量图转换成二值网格,像素尺寸不变;②在向量栅格基础上建立一个区域;③将图像内部像素值设为1,其余区域像素值为0,再进行交叉操作,从而获得分割后的图像,完成图像裁剪。
2.2 露天矿主体设备结构配置
设置以大数据为基础的露天矿特征提取流程,实现露天矿数据的全面集成与统一管理,充分挖掘数据的内在价值,一级指标测度矩阵具有预警能力、应急能力、管理能力以及重建能力。大数据在露天矿特征提取的应用流程具体如下:露天矿山地质环境监测数据时间序列里周期分量的特征提取就是为了判断露天矿山地质环境监测数据时间序列周期,通常情况下周期判断方法有小波变换[6]。按照露天矿山地质环境监测数据时间序列周期属性,融合新的方法设定周期,对露天矿山地质环境监测数据时间序列实施差分运算,为了保障露天矿主体设备正常运行效果,增加主体设备系统内部的处理器,对运行状态进行实时监控管理;通过设置监控主体设备提高控制精度和预警精确性[7]。露天矿主体设备系统中还建立了数据库[8],以便在运行过程中有效地对属性特征进行提取。在露天矿特征提取过程中,进一步优化调峰单元结构,以实现对专用露天矿主体设备的有效管理。在此基础上,对露天矿主体设备结构配置进行了整体设计,具体如图1所示。
图1 露天矿主体设备结构配置Fig.1 Structural configuration of main equipment in open-pit mine
由图1可知,通过露天矿系统控制层和数据传输层处理海量大数据,利用信息采集层实现对海量大数据的有效采集和处理,结合数据处理器进行数据管理,获取露天矿主体设备运行的状态信息,结合监控主体设备,对露天矿主体设备结构进行优化。
当露天矿主体设备结构配置中存在多个露天矿山地质环境监测数据[9],将露天矿山地质环境监测数据全部序列依次进行提取,其过程如下所示:①若露天矿山地质环境监测数据序列里具有异常特征,那么把异常特征空值去除,序列长度变短。②将处理后的数据实行聚类,离群点导进露天矿山地质环境监测数据数值点。
2.3 大数据在露天矿区域网络特征提取流程
针对露天矿山地质环境监测数据序列中全部点,它的本质是露天矿山地质环境监测数据序列里全部周期中同一位置点集,去除突发分量与随机误差干扰,理论中存在一样的分布特征[10]。如果露天矿山地质环境监测数据序列趋势分量是固定值,那么全部点属于相同水平直线中,此直线之外的全部点都看作数值点;如果序列的趋势分量根据固定的规律分布,则若没有按这个规律分布的点就视为数值点;若序列趋势分量是随机分布的,那么必须获取随机分布区间,基于此区间之外的点都属于露天矿山地质环境监测数据数值点。大数据在露天矿区域网络特征提取流程如图2所示。
图2 大数据在露天矿区域网络特征提取流程Fig.2 Flow chart of big data network feature extraction in open-pit area
由图2可知,大数据在露天矿区域网络特征提取的基本流程为:首先获取并划分露天矿区域网络结构模型,根据矿区相关性进行数据挖掘,然后进行大数据下露天矿特征提取,若特征提取量≥1时,直接进行输出特征操作;若特征提取量<1,则需重复大数据下露天矿特征提取操作,特征提取量≥1时可进行下一步操作,直到完成大数据在露天矿区域网络特征提取。
3 实例分析
为了验证提出的大数据在露天矿特征提取的应用流程的有效性和可行性,选取某露天矿作为实验对象进行分析,该区域占地面积为100 hm2,矿区内有煤炭、铜、琥珀、重晶石、镜铁矿、石膏等矿产资源,以煤矿为主。矿床富集区在地表浅部,其上部煤层以煤灰为主,下部煤层以焦煤为主,地形较为平坦,采取了露天开采的方法。该露天矿山地质环境作业现场如图3所示。
根据图3提出实验所需数据,具体参数内容见表1。
3.1 地物信息特征提取
利用大数据技术提取该露天矿的地物信息特征,所提取的露天矿地物特征包括采矿场、排土场、道路、河流、建筑、植被等类型。地物信息特征提取结果如图4所示。
图3 露天矿山地质环境作业现场Fig.3 Geological environment operation site map of open pit mine
表1 实验参数配置Tab.1 Experimental parameter configuration
由图4提取出的地物信息特征可以看出,该露天矿区的采矿场面积较大,河流颜色特征明显,且该露天矿下提取的地物信息纹理特征明显,建筑物密集排列以及植被覆盖面积较大,说明该露天矿的地质环境较为良好,且生态环境相对较好。
图4 地物信息特征提取结果Fig.4 Feature extraction results of ground feature information
3.2 提取性能测试结果
根据表1实验配置内容,为深度分析本文方法的地质环境特征信息提取性能,设定露天矿山地质环境特征信息正常数据(未产生不良结果)与异常数据(造成不良结果),分析本文方法对正常数据、异常数据的提取精度,结果见表2。由表2可知,本文方法对2种露天矿山地质环境数据中异常特征数据的整体提取精度为97%,提取性能显著。
3.3 有效数据集提取结果
在该露天矿山边坡设置一个数据采集器,选取采集到的近一个月数据作为地质环境特征信息提取的数据依据,同时根据下列环境保护原则进行实验验证。
(1)在露天矿山地质环境中,公众参与是发展过程中的一个重要环节,邀请公众参与,同时向公众传授相关地质环境保护特征信息知识,不仅能使公众认识到露天矿山地质环境可持续发展和生态环境保护的重要性,而且能在今后的管理和维护中发挥很强的优势,提高公众的素质,使人们更深刻地认识可持续发展战略对露天矿山地质环境发展的重要意义。
表2 提取性能测试结果Tab.2 Performance test results of this method
(2)遵循可持续性发展原则,该原则是遵循一种全新价值、道德以及伦理的观念,在本质上是充分利用现代科技手段,通过发展清洁生产、开发绿色资源,来改善以及优化露天矿山地质环境,从而促进人和自然的和谐发展,促进矿山地质、环境、资源以及人口之间的相互协调性。
在上述原则基础上,在研究区域设定10个监测点,对采集到的数据进行预处理,提取开采后监测点位移结果,经过数据预处理的有效数据集提取结果见表3。
表3 有效数据集提取结果Tab.3 Effective data set extraction results
分析表3能够看出,本文方法识别结果与实际测量结果较为接近,说明大数据在露天矿特征提取的应用可以提升数据提取精度,本文方法具有较高的提取准确性,有效数据集提取结果的置信度较高。在该露天矿山中分别选取A、B、C以及D四个矿点作为评价指标,分别计算4个矿点的2020年的一级指标测度矩阵,测度矩阵结果见表4。根据表4数据,表明该露天矿山2020年各方面能力有进一步的提高,预警能力和应对能力都达到良好以上级别,表明露天矿山地质环境一直处于良性发展状态中,随着监测预警和应对机制的完善,露天矿山的环境保护也相应得到保障。因此,将露天矿山的环境保护作为地质环境治理工作的重点,具体内容描述如下。
表4 2020年一级指标测度矩阵结果Tab.4 Primary index measurement matrix in 2020 year
(1)露天煤矿生态的设计应该将持续发展作为基础,可以整体改善矿区的生态环境以及持续利用,从而保障了露天煤矿的可持续发展。
(2)在煤矿开采过程中,要加强边坡监测,及时清除陡坡,清理废土石,防止崩塌,消除地质灾害隐患。在采煤后期进行削坡减载、绿化等措施。
(3)注意保护露天矿山内的植被资源,防止破坏生态环境;在防治区附近和周围设置警示牌,禁止越界和无序开采;对已停采或终采矿山,应及时进行恢复治理,以防止对环境造成破坏;对已停采地段或终采矿山,应及时进行修复。
4 结论
露天矿山地质环境特征信息提取实时性与准确性对预防灾害、保护人们生命和财产安全意义重大。为了实现高精度的露天矿山地质环境特征信息提取,本文提出一种大数据在露天矿特征提取的应用流程。将该方法应用于2020年某露天矿山地质环境案例中进行有效性测试,经测试结果显示:本文方法对2种露天矿山地质环境数据中异常特征数据的整体提取精度为97%;同时有效数据集提取结果的置信度高达97%,表明该露天矿山的部分区域存在较稳定的地质环境,环境保护问题得到保障。