新一代人工智能在矿山充填中的应用综述与展望
2021-03-24齐冲冲杨星雨李桂臣陈秋松孙元田
齐冲冲,杨星雨,李桂臣,陈秋松,孙元田
(1.中南大学 资源与安全工程学院,湖南 长沙 410083; 2.中国矿业大学 矿业工程学院,江苏 徐州 221116)
矿业对国家的工业化和国防的现代化起着至关重要的作用,极大地推动了国民经济的快速发展[1]。但是随着矿产资源的大规模开采,我国浅部矿产资源已趋于枯竭[2],深部资源开采成为矿业发展的必然,是开拓金属矿业的前沿领域[1]。国家高度重视深部资源开采,聚焦深部开采的科学技术问题,力争使我国的采矿科学技术走在世界矿业科技的前沿[1,3-6]。
充填采矿法是深部开采的主要采矿法之一,具有巨大的经济、技术和环境优势[1,7-17]。矿山充填是指将矿山废料回填至采矿形成的采空区的作业过程,有利于从源头上解决采空区采动灾害和矿山废料堆砌两大安全和环境问题,是推动矿山可持续发展、矿产资源绿色开发以及推行资源循环经济战略的重要途径[18]。但目前矿山充填占采矿成本高,其中膏体充填可占总采矿成本的20%左右,严重制约了充填采矿法的应用与推广[18-19]。如何提高矿山充填设计,降低充填成本,已成为制约矿山充填发展的关键问题之一。
当今时代,以深度学习为核心的人工智能方法取得了重大突破,得到了国内外学术界及工业界的广泛重视。美国斯坦福大学尼尔逊教授对人工智能的定义如下:“人工智能是关于知识的学科——怎样表示知识以及怎样获取知识并使用知识的科学”[20]。众多学者对人工智能基本思想和基本内容的探讨,阐释了人工智能是通过探讨人类的智能活动行为,研究如何应用计算机软硬件技术来模拟人类的某些智能行为(如学习、推理、规划等),构造具有一定智能的人工系统的基本理论、方法与技术[21]。矿业作为传统行业的支柱产业之一,也立足自身发展需要,结合新一代人工智能方法,展开了面向智能化革新的进程。
绿色化与自动化、工业化与智能化的加速融合,为矿业领域和矿山充填的发展带来了新的挑战和机遇[22]。一些发达国家和发展中国家目前加快矿山智能化的战略规划和布局,强化矿业创新,重塑矿业技术新优势。如加拿大提出Underground Mining 2.0计划,着力建设全智能无人矿山;芬兰启动智能矿山研究计划;澳大利亚提出未来矿山计划等。我国也把智能化作为传统产业改造升级的最佳途径以及实现技术跨越式发展的主攻方向和突破口[23]。国家相继出台《国家中长期科学和技术发展规划纲要(2006—2020年)》、《国家创新驱动发展战略纲要》、《“十三五”国家科技创新规划》等政策,受到了矿业领域专家学者的积极响应[24-26]。
只有与矿山充填的特点和目标密切结合,充分利用人工智能、大数据、建模、优化与决策等信息技术与矿山充填过程的物理资源紧密融合与协同,实现矿山充填设计智能优化决策,才有利于推进矿山充填的跨越式发展。近年来,新一代人工智能方法在矿山充填中研究与应用备受关注,相关文献逐渐增多。笔者率先提出“机器学习辅助充填设计”(Machine Learning-Aided Design for Cemented Paste Backfill)的理论框架,拉开了充填智能化的序幕[27]。但目前国内外尚无对该方向整体研究现状的总结性综述文献。笔者简要介绍了人工智能方法的基本概念,讨论了人工智能方法在矿山充填中的应用难点,对新一代人工智能在矿山充填中的应用进展进行综述,展望了其发展方向并提出了智能充填系统的构想。
1 新一代人工智能方法简介
新一代人工智能的发展日新月异,根据所准备数据集是否包含标记信息,新一代人工智能方法可大体分为监督式学习(包含样本标记信息)以及非监督式学习。简单来说,监督式学习的目的是训练一个人工智能模型,使其预测结果尽可能符合先验知识且具有一定的泛化能力;非监督式学习的主要目的是找到数据集中的潜在数据关联。目前,人工智能方法在矿业工程领域的应用以监督式学习为主,对非监督式学习的应用研究较少。本节主要对常用监督式学习及非监督式学习的方法进行简介。
1.1 监督式学习
1.1.1人工神经网络
人工神经网络(Artificial Neural Network,简称ANN)是由大量处理单元互联组成的非线性、自适应信息处理系统。神经网络中最基本的处理单位为神经元(neuron),每个神经元通过带权重的连接(connection)与其他神经元连接,构成复杂的层状结构。神经网络的第1层为输入层,最后1层为输出层,中间层为隐含层。在神经网络计算过程中,每个神经元接收来自前一层神经元传递过来的输入信号,这些权重信号通过带权重运算获得总输入值,该输入值将与神经元的阈值(threshold)进行对比,最后通过激励函数(activation function)处理产生该神经元的输出。假设存在一组训练样本(x1,y1),(x2,y2),…,(xn,yn)其中xi∈Rn,yi∈R,那么从输入到输出的映射关系可以通过以下公式表示:
hi=g(0,Wihi-1+bi)
for 1≤i≤L,andh0=x
(1)
y=g(0,VhL)
(2)
其中,hi为第i层输出;Wi,bi为神经网络模型第i层待学习参数;L为神经网络层数;V为神经网络模型待学习参数;g(z)为激励函数。定义一个标志性的激活函数为ReLu函数如下:
g(z)=max(0,z)
(3)
目前,神经网络在矿业工程中已经获得了广泛应用,如矿业组合优化方法[28]及采矿工程优化[29]等。神经网络算法繁多,其他常见神经网络方法包括径向基函数(RBF)网络,级联相关网络、Elman网络等[30]。
1.1.2决策树
决策树(Decision Tree,简称DT)是一种简单高效并且具有强解释性的模型,广泛应用于数据分析领域。决策树通过构建一棵具有多个判断结点的树状结构进行数据分析。一棵决策树模型一般具有一个根结点(root node)、若干个内部结点以及若干个叶结点(leaf node);根结点包含样本全集,叶结点对应决策结果而内部结点则对应一个属性测试。决策树主要通过构建一系列属性测试,将样本划分至不同的结点,使得相同结点内样本间“相似性”越来越高,进而达到学习及预测的目的。
决策树学习的关键是如何选取最优划分属性[30]。对于分类问题,通常使用信息熵(information entropy)或者基尼指数(Gini index)来选取划分属性;对于回归问题,通常使用误差平方和(Sum of Square Error,SSE)、均方误差(Mean-Square Error,MSE)等来选取划分属性。在决策树学习过程中,为了尽可能正确分类训练样本,会使得结点划分不断重复,有时会导致分支过多,造成“过拟合”,这时需要通过剪枝(pruning)处理,剔除不能带来决策树泛化性能提升的分支,进而降低过拟合的风险。
1.1.3随机森林与梯度提升树
近年来,基于决策树的集成学习模型受到了国内外学者的广泛关注。随机森林(Random Forest,简称RF)是并行式集成学习Bagging的扩展变体。在Bagging中,训练样本集被随机采样T次生成T个采样集,然后基于每个采样集训练出一个基学习器,最后将这些基学习器进行结合(通过averaging或者voting等)[31]。RF在Bagging的基础上,进一步在决策树训练过程中引入随机属性选择(Random Feature Selection,简称RFS)。具体来说,对于基决策树的每个结点,先从该结点的全部属性集合中(假设有d个属性)随机选择k个属性,然后从这个包含k个属性的子集中选择一个最优属性用于结点划分。通过Bagging中的样本扰动以及RFS中的属性扰动,随机森林的泛化能力显著提高,被誉为“代表集成学习技术水平的方法”[30]。图1为随机森林示意图。
图1 随机森林示意Fig.1 Random forest diagram
梯度提升树(Gradient Boosting Tree,简称GBT)是boosting算法的典型代表。Boosting算法的主要思路为考虑现有基学习器的表现,通过不断迭代降低误差。具体来说,boosting先从初始训练集中训练出一个基学习器,根据此基学习器的表现对训练样本的分布进行调整,使得训练集中尚未得到很好预测的样本在后续的基学习器训练中受到更多关注,然后基于调整后的样本分布训练下一个基学习器;如此重复迭代,直至基学习器数目达到设定值。Adaboost及gradient boosting为boosting的两种典型算法,其中Adaboost通过调整样本的权重值改变样本分布而gradient boosting通过改变损失函数的梯度达到类似的效果[32-33]。
1.1.4支持向量机
支持向量机(Support Vector Machine,简称SVM)的基本思路为在特征空间上求解能够正确划分训练集且几何间隔最大的超平面。在样本空间中,超平面可由wTx+b=0来描述,其中,w为法向量,b为位移项,分别决定了超平面的方向和超平面与原点之间的距离。距离超平面最近的训练样本点称为“支持向量”(support vector),2个异类支持向量到超平面的距离之和称为“间隔”,SVM的学习策略即为找到某一超平面,使其间隔最大化[30]。
对于非线性分类及回归问题,SVM引入核函数(kernel function),将样本从原始空间映射到一个高维空间,进而在高维空间寻找超平面。如图2所示为特征空间映射示意图,其中,ξ为松弛变量;ε为划分边界;φ为特征空间映射。核函数的选取决定了特征空间的映射,进而在很大程度上决定了支持向量机的性能。常见的核函数有线性核、多项式核、高斯核、拉普拉斯核、Sigmoid核以及常见核函数的组合等。
图2 特征空间映射示意Fig.2 Mapping diagram between feature spaces
其他常用监督式学习方法包括岭回归(Ridge Regression),贝叶斯分类器(Bayesian Classification),随机梯度下降(Stochastic Gradient Descent),高斯过程回归(Gaussian Process Regression)及朴素贝叶斯(Naive Bayes)等。因上述监督式学习方法在矿业领域的应用较少,同时考虑本文篇幅限制,故不详细介绍,具体可参考文献[30,34-36]进行学习。
1.2 非监督式学习
如上所述,非监督式学习主要针对初始训练集中不含有样本标记信息,其主要目的为挖掘样本间的内在联系,揭示数据的内在规律。聚类分析(Clustering)是非监督式学习研究最多、应用最广的算法之一。
聚类分析的研究起源于1955年K-means算法的提出,并于1957年发展成为K-均值聚类算法(K-means Clustering Algorithms)[37]。聚类分析试图将数据集样本划分为若干不相交子集,每个子集称为一个“簇”(cluster)。经过聚类分析的划分,有利于对相同子集内样本内在结构进行分析,推动知识发现。经过多年发展,聚类分析常用方法包括K-均值聚类,学习向量量化法(Learning Vector Quantization),高斯混合聚类(Mixture-of-Gaussian),密度聚类(Density-based Clustering)以及层次聚类(Hierarchical Clustering)等。目前聚类分析已经陆续被用于矿业工程领域,如煤岩分界图像识别[38]及铁矿资源勘查开发基地划分[39]等。
自组织映射(Self-Organizing Map,简称SOM)网络以及自适应谐振理论(Adaptive Resonance Theory,简称ART)网络作为神经网络模型的典型算法,也可用于聚类分析。其中SOM作为一种竞争学习型无监督神经网络,可在保留数据拓扑结构的同时,将高维数据映射至低维空间[40]。因此,SOM不仅被用于聚类分析,也常常用来做数据降维。ART是一种自组织神经网络结构,通过输出神经元相互竞争,可自组织地产生对环境认识编码的神经网络理论模型[30]。
生成对抗网络(Generative Adversarial Network,GAN)作为时下热门的非监督式学习算法,通过引入对抗训练的方式使得GAN生成的样本服从真实数据分布。GAN由生成器和判别器构成,其中生成器尽量生成判别器无法区分来源的样本,而判别器则尽量准确地判断样本来源(真实数据或者生成器生成)。通过不断交替训练,在达到纳什均衡时,GAN生成器可以准确地恢复真实数据分布[41]。目前,GAN被广泛应用于图像生成、修复、语义转化等领域,在矿业领域的应用有待继续研究。
2 新一代人工智能在矿山充填中应用难点
2.1 多源异构数据处理
矿山充填是一项系统工程,其优化设计不可避免地涉及到多源异构数据的处理与分析。矿山在开采和充填过程中,资源赋存条件、围岩状态、应力环境等生产要素处于不断地动态变化中,直接影响到所需充填材料的力学和流变性能。随着当今设备感知和测量技术的进步,矿山数据的来源及结构日趋多样化。同时,监测过程中必然会引入对研究不起作用的非有效信息点,即噪声点,数据类型不同,噪声点也各具特征。这些均为数据的清洗、转换、多源异构数据特征提取以及数据融合提出了新的挑战,为矿山充填对工况变化的智能感知增加了难度。
同时,矿山充填设计本身具有不同设计环节,各设计环节具有独特的影响因素及性能参数。如充填养护时间对充填配比设计至关重要而充填流变性能及管道输送则更多的关注于充填料浆。因此,目前矿山充填设计主要集中于单一环节设计,对多环节协同下矿山集成设计系统的研究较少。此现状一方面因为目前国内外学者对环节间的关联耦合的探索处于起步阶段,对多环节交互协同机制的揭示不足[42];另一方面则是因为各环节数据类型及结构特点各不相同,极大提高了多环节集成设计的难度。
2.2 作用机理复杂
矿山充填各环节影响因素对性能参数作用机理复杂,对人工智能方法的应用提出了新的调整。目前,矿山工况变化对充填材料的力学和流变性能的影响研究较少,作用机理尚不明确。在力学性能方面,LI[43]提出了一种改进的理论解算法以确定不同围岩与开采情况下充填体最低强度要求。CHEN等[44]开展相似实验,模拟采场中充填体强度的分布特征,为室内膏体配比提供实验支撑。在流变性能方面,LIU等[45]研究了管道输送过程中充填料浆的流动情况,为不同工况下管道输送研究做了初期探索。笔者等[46]开展环管实验,研究了不同管线、不同尾砂在管道输送过程中的沿程阻力。上述研究虽充分认识到矿山工况的变化对充填材料力学和流变性能的影响,但作用机理尚不清楚,影响了人工智能方法的应用(如特征选取等)。
充填设计各环节内部作用机理各异。如全尾砂絮凝沉降、充填配比、管道输送分别受到絮凝沉降机理、水泥水化机理及多相流动机理的影响。同时,各机理目前在学术界仍处于探索阶段,缺少统一的理解与认识[17]。环节间耦合作用机理的研究更是处于起步阶段,导致人工智能模型的构建缺少理论知识的指导,不利于理论模型与算法模型的精准配合,促进精度提升。
2.3 模型需求难以兼顾
矿山充填各环节性能参数不同,且性能参数间可能存在矛盾。通常情况下,充填材料的强度与其流变性、水泥基充填材料强度与其经济性呈负相关。在充填材料优化设计过程中,往往需要兼顾多个优化目标(如强度、流变性等),导致人工智能模型的建立与优化非常复杂、困难。同时,矿山充填设计对人工智能模型提出了准确性、可靠性、实时性、动态性等多样性需求,在数据集不足的情况下往往难以兼顾。最后,充填设计涉及多个环节,各个环节对本环节数据集依赖程度较高,集成智能模型的构建易造成环节间误差累积,影响人工智能模型最终的准确率及鲁棒性。
3 新一代人工智能在矿山充填中的应用综述
新一代人工智能方法在矿山充填中的应用一般是将研究问题转化为分类或回归问题,非监督式学习在矿山充填中的应用较少。本文按照矿山充填不同环节和研究方向,对新一代人工智能方法在矿山充填中的应用进行了详细的综述。
3.1 全尾砂絮凝沉降
选矿后排除的全尾砂浆质量分数一般在10%~25%,无法满足胶结充填或膏体充填对充填料浆质量分数的要求(70%左右),因此需要对全尾砂浆进行浓密。传统的浓密方式(如自然沉降等)沉降缓慢,溢流水浑浊,且沉降浓度低,直接影响到全尾砂充填度设计[47]。针对传统浓密方式存在的问题,絮凝沉降技术因其便携性和可操作性,成为了矿山浓密的重要研究方向[17]。全尾砂絮凝沉降需要考虑多因素耦合影响下(如絮凝剂类型、添加量等)的絮凝沉降特性(如底流质量浓度、初始沉降速度等)。近年来,新一代人工智能方法已初步应用于全尾砂絮凝沉降过程,为絮凝沉降研究提供了新思路。
王新民等[48]基于室内试验结果,使用ANN建立了絮凝剂单耗、料浆质量浓度及絮凝剂质量浓度到沉降速度和极限浓度的智能模型。结果表明,ANN智能模型对絮凝沉降结果的预测误差可控制在5%左右,精度较高,且训练好的智能模型可用于絮凝沉降方案的快速优选。
张钦礼等[49]针对全尾砂絮凝沉降,建立了遗传算法(Genetic Algorithm,简称GA)与SVM的杂化模型,其中SVM用于学习供砂浓度、絮凝剂单耗和絮凝剂添加浓度到沉降速度的映射关系,GA用于优化SVM模型参数,提高SVM在絮凝沉降数据集上表现。
上述研究主要针对某种特定尾砂和絮凝剂进行人工智能建模,导致所构建智能模型应用受限,不能直接用于其他尾砂和絮凝剂的预测分析。针对以上问题,笔者等[50]在国内金属矿山收集了27种尾砂,使用4种絮凝剂进行大量絮凝沉降实验,并对实验结果进行了分析。同时,基于絮凝沉降实验结果,构建萤火虫算法(Firefly Algorithm,简称FA)-GBT杂化模型。结果表明FA-GBT对多尾砂、多絮凝剂共同影响下初始沉降速度实现了较好的预测(测试集实验与预测结果相关系数达到0.841)。
为进一步提升预测精度,促进人工智能方法在絮凝沉降中的应用,笔者等[51]进一步完善人工智能预测方法,使用主成分分析法(Principle Component Analysis,简称PCA)降低输入参数维度,使用粒子群算法(Particle Swarm Optimisation,简称PSO)-自适应模糊神经推理系统(Adaptive Neuro-Fuzzy Inference System,简称ANFIS)进行初始沉降速度预测,并使用蒙特卡洛方法检验预测的收敛性。结果表明人工智能方法在絮凝沉降中的预测精度进一步提升。
3.2 充填强度设计
根据矿山充填的功能及地下采场环境不同,充填材料需要具有一定的强度及力学性能。一般来说,充填材料单轴抗压强度需要达到150~300 kPa以降低早期充填料浆的液化风险;在特定情况下,充填材料单轴抗压强度需要大于4 MPa以用于顶板支护[17]。充填材料的强度主要受灰砂比、养护时间、质量分数等因素的影响。目前,部分学者对充填材料强度的人工智能预测已进行了初步探索,典型研究成果见表1。
表1 人工智能方法预测充填材料强度汇总Table 1 Summary table of artificial intelligence method to predict the strength of backfilling materials
由表1可知,目前充填材料的强度预测集中于单一尾砂充填材料强度预测。在单一尾砂充填材料强度预测方面,人工智能方法以ANN为主,近年来陆续出现群智优化算法与人工智能算法的杂化方法,其中人工智能方法负责非线性回归而群智优化算法负责人工智能超参数调整。根据研究对象不同,人工智能方法的输入变量存在些许区别,但主要以水泥含量、质量或体积分数、养护时间为主。输出以28 d UCS为主,3,7,14 d UCS也多有涉及,其他龄期的UCS较少。单一尾砂充填材料强度的预测虽研究成果较多,但所构建智能模型仅限于特定尾砂,应用受限,不能直接用于其他尾砂的预测分析。
在笔者、陈秋松及其合作者的共同努力下[52-55],充填材料强度预测从单一尾砂逐渐向多尾砂发展。笔者等[55]通过遗传编程,阐述了人工智能模型对全新尾砂的强泛化能力,提高了科研及矿山工作者对人工智能预测的信息,证明了人工智能模型的潜在应用价值。基于上述研究成果,陆翔等[56]进一步使用集成学习,提高了人工智能模型的预测精度。
人工智能方法在充填材料强度方面的应用正日益增加。秦学斌等[68-69]使用人工智能方法,提出了通过充填材料的孔隙特征预测充填材料强度的新方法;QIU等[70]通过grid search optimizer以及RF,构建了泡沐充填材料强度预测模型;LI等[71]基于室内试验结果,使用slap swarm algorithm-SVM杂化模型预测纤维增强性充填材料强度;张钦礼等[72]通过GA-SVM模型,研究了减水剂对充填体强度的影响;王志会等[73]使用PSO-ANN建立了胶结剂含量、养护温度、养护时间及剪切面方向压力到界面抗剪强度的智能预测模型;白春红[74]及周士霖[75]采用ANN,SVM等人工智能方法,建立了采场稳定性与充填体强度的智能模型。
3.3 充填料浆流变及管道输送
在实际生产中,充填料浆通常在矿区地表制备,而后通过管道输送至地下采场或露天矿坑。充填料浆的管道输送与其流变性能密切相关,对充填系统的稳定性至关重要。
LIU等[76]基于流变实验,以砂浆质量分数、砂灰比、砂浆重度、坍落度为输入变量,屈服应力和黏度为输出变量,使用PCA-ANN建立了人工智能预测模型。研究表明PCA可以在尽可能保持输入参量的有效信息的同时降低输入参量的维度。PCA-ANN模型可以实现充填料浆流变参数的准确预测(预测结果与实验结果的误差在5%以内)。
张钦礼等[77]选用PCA和改进的ANN对充填膏体流变参数进行优化预测研究。首先使用PCA对流变性能影响因素进行预处理,再利用改进ANN建立影响因素到流变性能的智能预测模型。结果表明主成分分析法可以有效提高流变参数的预测精度(屈服应力预测相对误差降低0.48%~7.29%,黏度相对误差降低1.67%~6.20%)。
2389 在△ABC中,a,b,c;ta,tb,tc;R,r分别表示三边长,内角平分线长,外接圆半径和内切圆半径, 则有
LÜ等[78]使用混沌优化(Chaos Optimization,简称CO)和ANN构建充填料浆坍落度的智能预测模型。坍落度的影响因素选为煤矸石含量、粉煤灰含量以及料浆质量分数。实验结果表明CO-ANN杂化模型对充填料浆的坍落度具有很好的预测效果。
笔者等[79]采用环管实验研究,探讨了质量分数、灰砂比、入管压力及管道形状对充填料浆环管压降的影响,并使用FA-GBT构建智能预测模型。结果显示实验与预测环管压降的相关系数>0.99,表明FA-GBT可以有效地预测充填料浆环管压降。
笔者等[80]在前期研究基础上,进一步探讨了不同尾砂对充填料浆直管压降的影响,并构建了PSO-DTR智能预测模型。如图3所示为决策树深度对其测试集表现的影响。由图3可知,决策树深度显著影响其预测表现;当决策树深度≥5时,预测与实验直管压降的相关系数约等于0.9,预测效果较好。
图3 决策树深度对其测试集表现的关系Fig.3 Relationship of decision tree depth to its testing set performance
骆正山等[81]以国内某矿山为例,建立了基于粗糙集(RS)和正余弦(SCA)算法优化投影寻踪回归(PPR)的充填管道失效风险预测模型。首先选取了10项影响因素,通过RS属性约简原理提取5项核心因素,再利用PPR对充填管道失效风险进行预测,并采用SCA对模型参数进行优化。结果表明RS可有效去除冗余信息,简化计算,SCA-PPR具有预测精度高、模型性能好的优点。
3.4 充填集成设计及多目标优化
上述人工智能在矿山充填中的应用主要以特定环节为主,而矿山充填包含多个工艺环节,且环节间关联耦合复杂。为了实现膏体充填的整体优化,必须考虑各环节的交互协同机制,建立膏体充填集成设计系统。目前,国内外学者对环节间的关联耦合进行了初步探索,其研究成果为多环节交互协同机制的揭示做出了巨大贡献。如REID等[42]总结归纳了絮凝剂添加对尾砂土工性能的影响,论述了絮凝剂添加对尾砂固结速率、临界状态线、不排水剪切强度等的重要作用。然而,人工智能方法在充填集成设计的应用研究较少,仍处于起步阶段。
齐冲冲等[82]综合考虑膏体充填的强度及流动性能,建立了充填材料单轴抗压强度和塌落度的PSO-GBRT集成智能预测模型,分析其预测性能及泛化能力,探究了强度及坍落度与其影响因素的响应关系。作者进一步融合线性回归和多目标优化NSGA-II算法,探讨了膏体充填强度和塌落度的协同优化,遍历不同尾砂及水泥类型情况下的Pareto点,并结合实际情况提出了方案优化策略。如图4所示。
图 4 塌落度与28 d强度多目标优化与方案选取Fig.4 Multi-objective optimization and scheme selection for slump and 28 d strength
3.5 其 他
新一代人工智能方法不仅被用于矿山充填主要设计环节,同时还被陆续应用于矿山充填各个方面,且应用范围不断丰富、拓展。张钦礼等[83-84]构建GA_SVM和ANN模型,对矿山充填钻孔使用寿命进行预测,结果表明人工智能模型最大预测相对误差可保持在10%以内,平均相对误差约5%,为充填钻孔寿命分析提供了新思路;在矿山充填设备方面,梁兴国[85]研究了TDS智能干选机在井下排矸充填技术中的应用;崔晓庆等[86]对矿山充填的智能仪表及智能控制方法进行了初步探索;在矿山充填系统方面,赵望达等[87]介绍了智能故障诊断、学习控制等智能控制方法,并总结了矿山充填具体应用案例;张吉雄等[88]系统阐述深部煤矿井下智能化分选及就地充填技术总体框架,详细介绍了目前取得的最新进展;刘晓俊等[89]介绍了中钢刘塘坊矿业公司尾砂充填智能控制系统的实施和运行情况,为相关应用提供参考。
4 新一代人工智能在矿山充填的发展方向
4.1 性能提升
新一代人工智能方法的预测精度提升一直是矿山充填应用的关键问题。目前,在单一尾砂学习及预测中,人工智能模型的预测误差可以控制在5%左右,但基于单一尾砂构建的智能模型无法应用于其他矿山尾砂,因此,多尾砂数据库建立及模型构建是目前新一代人工智能方法在矿山充填应用的趋势。现今多尾砂智能模型的预测精度可达R≈0.9,此预测精度虽在绝大多数情况下可以接受(文献中一般认为R>0.8预测精度较好[90-91]),但特定矿山充填应用环节的精度要求更高,因此新一代人工智能方法的性能提升至关重要。
在人工智能方法的性能提升方面,可以考虑数据集提升及智能方法提升两种途径。数据集提升包括样本质量提升,有效的参数工程(Feature Engineering)以及数据集规模扩大等方面。在人工智能方法提升方面,一般从人工智能算法的改进、杂化模型的建立、高效的超参数调整、智能算法的优选等方面进行研究与探索。
4.2 小数据集问题
新一代人工智能方法在矿山充填中的应用极大受限于数据集问题。首先,新一代人工智能方法对数据集样本的规模研究较高。其次,矿山充填领域的数据收集较为复杂。目前,新一代人工智能方法在矿山充填的应用主要基于实验数据集,其实验过程繁琐,人力、财力、物力消耗大,时间成本高,造成数据集一般较小,难以有力证明所构建智能模型的精度,体现其应用前景。但从另一个角度思考,目前国内外针对不同矿山、不同尾砂已经进行了大量实验研究,积累了丰富可靠的实验数据。目前,对已积累数据缺乏统一的梳理与汇总,造成已积累数据利用率低,无法进行深度数据分析与挖掘,影响共性规律的探讨。推进矿山充填方面的国际数据集建设是解决当前小数据集问题的有效途径之一[27,92]。解决小数据集问题的另一个方法为拓展数据来源,从室内试验数据向多源数据转换。其中,多源数据包括室内试验数据、地下采场-充填体位移及应力监测数据、环管输送的实时监测数据等。
4.3 应用思路扩展
应用思路拓展是新一代人工智能技术在矿山充填中的应用必须考虑的问题。目前,人工智能模型在矿山充填的应用之所以受到怀疑,一方面是因为预测精度,另一方面因为预测的必要性不突出。如预测塌落度或静态絮凝沉降初始沉降速度,实验并不复杂且周期较短,因此矿山更倾向于进行部分实验研究而非智能模型预测。但动态絮凝沉降、环管输送的压降、屈服应力以及56 d UCS等实验,严重依赖实验设备或周期较长,矿山无法通过实验快速测定,是否可以通过人工智能方法提供解决途径?如使用尾砂物化性质、配比方案、结合3 d UCS,直接对7 d UCS,28 d UCS甚至56 d UCS进行精准预测,节省实验时间;或通过尾砂物化性质、配比方案及塌落度,对充填料浆的屈服应力和环管压降进行预测分析等。上述研究思路对矿山充填的设计优化更具价值,因此在新一代人工智能的应用方面一定要拓展应用思路,结合矿山实际。另一个推进人工智能方法在矿山充填中的应用思路为推进软件开发。矿山充填从业者缺乏新一代人工智能方法的基础知识及编程技能,无法有效利用所构建智能模型,因此友好的可视化界面及简易的操作方式对人工智能方法的推广至关重要。笔者等[52]通过大量力学性能数据集,构建充填材料UCS、屈服强度、杨氏模量及抗拉强度的智能模型,并开发预测软件。
5 智能矿山充填系统构建
新一代人工智能方法在矿山充填中的应用最终目标为构建智能充填系统,实现矿山充填的智能化与现代化,促进矿山充填技术的推广。本节对智能矿山充填系统的概念和主要内容进行简要介绍。
5.1 智能矿山充填系统概念
参照国内外文献及国家各部委(如国家工业和信息化部)对各行业智能系统的定义,笔者对智能矿山充填系统的定义如下:搭载先进的过程监测传感器(位移、应力、环管压降等)、控制器、执行器等装置,融合现代通讯及人工智能技术,推进矿山工况、充填各环节、矿山从业者等智能信息的交换与共享,具备复杂环境感知、智能分析、动态优化决策、协同控制等功能,进而实现矿山充填的安全化、高效化、精细化及智能化,并最终可实现代替专家来决策控制的新一代充填系统。
5.2 智能矿山充填系统主要内容
智能矿山充填系统的构建有赖于以下环节的实现:① 矿山工况及充填各环节的全过程监测及控制;② 矿山工况变化的智能感知与实时反馈;③ 矿山充填各环节影响因素到性能参数的智能替代模型;④ 集成性能预测模型构建;⑤ 多目标、多方案、复杂约束条件下动态、整体优化决策。通过上述环节,智能矿山充填系统可以根据矿山工况变化实时、动态调整矿山充填设计,实现矿山工况变化、充填优化决策与充填现场实施的闭环协同。
6 结 论
(1)充填采矿法可从源头上解决采空区采动灾害和矿山废料堆砌两大安全和环境问题,具有巨大的经济,技术和环境优势,已发展为深部开采的主要采矿法之一。
(2)矿山充填占采矿成本高,严重限制了充填采矿法的推广,新一代人工智能方法的发展为矿山充填带来了新的机遇与挑战。
(3)目前新一代人工智能技术在矿山充填中的应用以监督式学习为主(ANN,DT,RF,GBT,SVM为常用监督式算法),非监督式学习(包括Clustering,GAN等)在矿山充填中的应用较少。
(4)新一代人工智能方法在矿山充填中的应用主要受到多源异构数据处理、作用机理复杂以及模型需求难以兼顾的问题,未来的主要发展方向为性能提升、小数据集问题以及应用思路扩展。
(5)新一代人工智能方法在全尾砂絮凝沉降、强度设计、流变及管道流动、集成设计及多目标优化等方向已有初步探索,面向多尾砂、多环节的智能集成模型构建是当前主要研究方向。
(6)新一代人工智能方法在矿山充填中的应用最终目标为构建智能充填系统,可以根据矿山工况变化实时、动态调整矿山充填设计,实现矿山工况变化、充填优化决策与充填现场实施的闭环协同。