基于注意力卷积神经网络的焦家金矿带三维成矿预测及构造控矿因素定量分析
2021-10-18邓浩魏运凤陈进刘占坤喻姝研毛先成
邓浩,魏运凤,陈进,刘占坤,喻姝研,毛先成
(1.中南大学有色金属成矿预测与地质环境监测教育部重点实验室,湖南长沙,410083;2.中南大学地球科学与信息物理学院,湖南长沙,410083)
焦家金矿带位于我国最大的金矿集中区胶东半岛西北地区,是我国首个1 000 t级金矿发现地,目前已勘探金资源量超过1 260 t[1]。随着工业化开采程度不断加大,该区浅部矿产保有量快速下降,深部矿产资源勘探工作已成为目前找矿工作重点。当前该区勘探深度普遍超过2 000 m,深部找矿难度越来越大,在这种情况下,充分利用既有勘查成果,开展深部三维成矿预测是实现深部找矿突破的重要途径[2−6]。三维成矿预测以地质勘查数据为输入,经三维地质建模、成矿信息提取以及预测建模等环节,实现深部隐伏矿体的定位定量预测[2,7]。焦家金矿带产出焦家、新城、寺庄等超大型矿床,矿床(体)在走向和垂向上均沿焦家断裂断续分布,具有显著的断裂构造控矿特征[8]。在以往的地质勘查过程中,前人发现焦家金矿带及胶西北其他矿带的金矿多产出于断裂产状变化部位,具有矿体单向侧伏、雁列式排列、间隔分布等特征,提出了“断裂变缓控矿”“阶梯式成矿”和“对称成矿”等勘查思路[9−11],但要将这种定性经验模型运用至三维成矿预测,还需要从焦家断裂面三维结构建模出发,明确控矿因素,建立定量找矿指标,寻找断裂面三维结构与矿化定位间的定量关系,由此预测深部成矿有利部位。然而,断裂面三维结构对应力空间分布、裂隙构造、含矿流体运移的影响极其复杂[12−14],焦家断裂面三维结构、金矿体形成与定位间的定量关联具有显著的非线性特征。利用现有三维成矿预测建模方法尤其是多元统计分析和传统机器学习方法难以较好地刻画焦家断裂面三维结构控制矿体空间定位的非线性规律,因而难以保证三维成矿预测模型的准确性与可靠性。因此,要开展焦家矿带三维成矿预测,还有待建立专门的预测方法,表征焦家断裂面三维结构与矿化定位间的非线性关联,对还原焦家深部成矿规律进行定量化研究。焦家金矿经过半个多世纪的地质勘查与生产开采,积累了丰富的勘查数据。在大数据时代,深度学习等大数据学习与分析技术得到充分发展[15−19],为从数据科学角度解决焦家三维成矿预测问题提供了新的思路。
为此,本文作者借助深度学习技术中的卷积神经网络[20],分析勘查数据背后特征、学习获得焦家断裂面形态特征与矿化定位间非线性关联。为提升并保证网络模型对矿化空间定位的判别性能,在卷积神经网络的基础上,引入注意力机制模块[21],通过模仿人类认知过程中的注意力机制,建立注意力卷积神经网络模型,引导网络模型在学习过程中抽取与提炼对具有显著矿化指示性的信息特征,由此建立三维成矿预测模型,从而更准确地表征矿体定位规律。基于这种三维成矿预测模型,进一步开展深度网络特征的解构,以便发现网络模型中深层次成矿信息关联,从而定量分析控矿因素对成矿的影响程度,最终综合上述成矿预测和定量分析结果圈定深部找矿靶区,为焦家矿带深部找矿提供可靠的科学依据。
1 地质背景
胶西北金矿集区位于郯庐走滑断裂的东侧、华北克拉通的东南缘、苏鲁超高压变质带北段的西侧,主要地层为前寒武纪变质结晶基底,包括太古代胶东群、古元古代荆山群、粉子山群以及新元古代蓬莱群。区内褶皱轴向以东西向为主,包括游优山—粉子山倒转向斜和朱马短轴复式背斜。区内断裂构造主要为三山岛断裂带、焦家断裂带和招平断裂带,其中焦家断裂带整体走向10°~40°(见图1),倾向为NW,倾角为30°~50°,局部可达78°,长70 km 左右。区内岩浆岩主要以中酸性和酸性为主,包括太古代TTG 花岗岩系、晚侏罗世玲珑、栾家河花岗岩系和早白垩世郭家岭花岗闪长岩系。
图1 焦家断裂带地质简图(据文献[9]修改)Fig.1 Geological map of Jiaojia fault belt(modified by Ref.[9])
焦家金矿带内各矿床均属于典型的破碎带蚀变岩型金矿床,矿石以碎裂状、浸染状构造为主,与金有关的金属矿物有黄铁矿、黄铜矿、银金矿等,非金属矿物主要有石英、绢云母、菱铁矿等。区内矿床发育以焦家断裂主裂面为中心的蚀变分带,其中主裂面上盘为绢英岩化辉长岩质碎裂岩带,下盘依次为黄铁绢英岩化碎裂岩带、黄铁绢英岩化花岗质碎裂岩带、黄铁绢英岩化花岗岩带和含赤铁矿钾化花岗岩带。蚀变带与断裂带产状相似,平均走向为30°,倾向为NW,倾角为25°~50°。赋矿岩石主要为晚侏罗世玲珑花岗岩和早白垩世郭家岭花岗闪长岩。
焦家金成矿带总体上与焦家断裂带及黄铁绢英岩化蚀变带具有紧密联系,矿体分布受到焦家断裂面的形态和产状控制,主要产于沿着断层面分布的黄铁绢英岩化蚀变带内(图2),但同时对赋矿围岩不具选择性[22−23]。基于前人在“焦家式”矿床已开展的地质研究和深部找矿预测工作[24−25],本文建立焦家断裂成矿概念模型,如表1所示。具体选取焦家断裂带的距离场、坡度、坡度变化率、形态起伏度作为焦家断裂面的形态控矿指标,其中,各控矿指标通过焦家断裂主裂面三维地质模型的三维空间分析获得[25]。
图2 焦家矿区112号勘探线焦家断裂剖面图(据文献[9]修改)Fig.2 Section map of No.112 section line at Jiaojia gold deposit(modified by Ref.[9])
2 研究方法
为对焦家矿带三维成矿预测与控矿因素进行定量分析,从勘查数据出发,首先开展三维地质建模并将三维地质模型重构至深度网络,然后基于深度卷积神经网络,建立三维成矿预测模型。为提升深度卷积神经网络模型的预测性能,在卷积神经网络中加入注意力机制模块[21]进一步改进网络模型,建立焦家三维成矿预测模型。在此基础上,采用DeepLIFT 算法对深度网络特征进行解构,通过提取各控矿指标对网络决策的贡献值,从定量角度分析焦家断裂面的控矿因素,以此剖析焦家断裂带的控矿规律。
2.1 三维地质模型及其对深度网络的重构
为表征焦家矿带三维结构,以地质勘探资料为基础开展三维地质建模,建立相关地质体、构造和矿体的三维线框模型。进而,基于钻孔剖面资料,对钻孔资料数字化,进行矿化空间插值,建立焦家矿带三维块体模型,由此综合实现焦家断裂面三维结构数字化。为实现三维地质模型对深度网络模型的重构,以焦家金矿成矿概念模型(表1)为指导,针对焦家断裂面三维模型,计算相关控矿指标。针对各立体单元,提取相关控矿指标,将相关控矿指标投影至多通道图像[7],以此表达焦家断裂三维结构对成矿空间中特定位置的影响,实现焦家矿带三维结构对深度网络的重构。
表1 焦家金矿带成矿概念模型Table 1 Conceptual metallogenic model of the Jiaojia ore-belt
2.2 深度卷积神经网络
深度学习为机器学习方法的分支,能够有效实现样本数据特征规律的学习,其特征是利用多层次神经元结构从输入数据中自动提取高层次特征,实现对输入数据中所蕴含复杂规律的拟合。深度卷积神经网络是深度学习技术的最典型代表,其基本结构一般包括输入层、卷积层、池化层、全连接层及输出层。本文拟采用AlexNet卷积神经网络[26]为骨干网络结构,其主要结构由8层网络组成(见图3),分别为5层卷积层(Conv)和3层全连接层(fc),在Conv1 和Conv2 后设置了局部响应归一化机制,在增强神经元反馈大的激活值的同时,减小其局部反馈小的神经元的激活值,另外,网络在Conv1,Conv2 和Conv5 后分别设置1 个池化层,以减少网络的参数数量。
图3 AlexNet卷积神经网络基础结构(文中数字表示各层特征和卷积核的大小)Fig.3 Architecture of AlexNet convolutional neural network
针对本工作多个控矿指标投影得到的多通道图像,将网络输入层的维度修改为224×224×5;同时,针对成矿预测的目标,将原本面向多类分类问题的网络输出层修改为输出成矿后验概率的二分类形式。针对网络训练,修改训练损失函数L(θ)为面向二分类问题的交叉熵形式:
式中:θ为待训练网络参数;N为立体单元个数;Xi为立体单元i的多通道图像矩阵;yi为立体单元的矿化信息,有矿为1,无矿为0;fθ(X)是参数为θ的网络输出,即成矿后验概率。训练中,采用反向传播算法极小化式(1)中的损失函数,实现对网络的训练。
2.3 注意力机制模型
注意力机制模型(attention model,AM)是一种神经网络与视觉注意力机制相结合的解释性模块。注意力模型模仿人脑观察事物时对重点标志性信息注意力较强、对非重点标志性信息注意力较弱的视觉心理特性,在网络内部建立实现自注意力特征变换机制,引导后一层网络在对前一层网络特征结果进行抽取时自动关注关键特征,从而提升网络的学习性能。
为有效提升卷积神经网络对焦家构造形态控矿因素的学习性能,在卷积神经网络结构的基础上引入CBAM 注意力机制模块[27]。CBAM 注意力机制是一种结合特征通道注意机制和空间注意力机制的串联结构。如图4所示,CBAM注意力机制的权重层分为2部分:第一部分是特征通道模块的权重,第二部分是空间模块的权重。特征通道模块的权重表示某特征图像不同通道的重要性程度,空间模块的权重代表某特征图像中不同位置的重要性程度。通道注意力机制Ac和空间注意力机制As分别通过卷积、池化、全连接等操作实现,如式(2)和式(3)所示。
图4 CBAM注意力机制结构Fig.4 Convolutional block attention module
式中:I为给定原始卷积层特征矩阵;σ为Sigmoid函数;MLP 为含1 层隐藏层的多层感知机网络映射;AvgPool 为平均池化映射;MaxPool 为最大池化映射;f7×7为核尺寸7×7的卷积映射。
以通道注意力机制Ac和空间注意力机制As为基础,CBAM 注意力机制的整体实现按式(4)和式(5)进行:
式中:⊗为矩阵间对应元素直接相乘的元素积运算;I′为通道注意力模块输出的特征矩阵;I″为CBAM注意力机制模块输出的最终特征矩阵。
2.4 DeepLIFT网络特征解构
为显现注意力机制卷积神经网络模型学习得到的控矿因素,采用重要特征深度学习(Deep learning importantFeaTures,以下简称DeepLIFT)方法[28]解构网络模型所得到的高层次特征,以解释深度网络所表征的焦家断裂控矿作用。DeepLIFT 方法是一种基于反向传播的网络解释性算法,通过提取网络中的神经元激活量(图5)的方式将网络输出沿反向传播路径传递回神经元,以此计算神经元对输出的贡献得分,从而达到网络特征解构的目的。
图5 激活量示意图Fig.5 Schematic diagram of activation value
DeepLIFT 方法中,将单个神经单元激活量Δt表达为
式中:t为所关注的某个神经元激活值;t0为神经元t的参考激活值。目标神经元x的贡献得分Cx满足
式中:xi为输入数据到达神经元t所参与计算的过程神经元;CΔxiΔt为Δxi的贡献得分。
在具体计算网络得分贡献为CΔxΔt时,首先按式(8)定义1个乘数MΔxΔt,再进行网络层之间的得分传递计算,其传递算法见式(9)。
式中:xi为输入层的神经元;yj为中间隐藏层的神经元。
3 结果与讨论
3.1 研究方法实现及预测建模结果
为实现上述研究思路和研究方法,首先收集预测焦家矿带的地质勘查资料,重点包括钻孔柱状图865幅、勘探线剖面图137幅等,以此为基础建立焦家断裂带和矿体的三维线框模型(见图6(a))。进而以边长为25 m 的立体单元划定焦家矿带3 000 m 以浅成矿空间,其中,有勘探工程控制的立体单元(下文称作已知单元)共78 351个。对已知单元,利用克里格方法插值计算立体单元的金属量(图6(b))。以工业品位1.0 g/t 的标准换算金属量340.75 g为阈值,将已知单元分别标记为矿化单元和非矿化单元(图6(c))。根据成矿概念模型,以焦家断裂面三维模型为基础,分别计算焦家断裂面的坡度、坡度变化率、一级起伏度、二级起伏度和距离场共5个指标。基于上述5个指标,根据各立体单元位置,经投影操作,重构为各单元所对应的多通道图像。最终得到由各已知单元矿化信息及其所对应多通道图像构成的深度网络训练集X。
图6 焦家断裂带和已知单元空间分布(下盘视角)Fig.6 Models showing Jiaojia fault and spatial distribution of known voxels(viewing from footwall side)
在此基础上,结合CBAM 注意力模块和AlexNet卷积神经网络,建立成矿预测模型。为确定注意力模块与卷积神经网络的结合机制,开展消融测试实验,确定将CBAM 注意力模块加入至AlexNet 网络Conv5 卷积层之后具有最优性能,据此建立AlexNet+CBAM 的注意力卷积网络模型,如图7所示。对深度网络训练集X按照8:2 分层采样为训练集XI和验证集XII,对网络模型进行训练。采用Adam随机梯度下降方法进行网络训练[29],其中批次大小设置为512,迭代学习率初始值η0设置为1×10−4,经40轮训练,得到基于注意力卷积神经网络的三维成矿预测模型。
图7 基于注意力机制卷积神经网络结构的预测框架Fig.7 Predictive model based on attention convolutional neural network
3.2 注意力卷积神经网络预测性能分析
为评价注意力卷积网络模型的准确性与可靠性,将该模型与由其他机器学习模型所建立预测模型进行对比分析。其中,其他深度学习模型选取无CBAM注意力机制的AlexNet网络模型,传统统计学习模型选取多层感知机和随机森林模型。
在此,采用二分类任务中常用的受试者工作特征曲线(receiver operating characteristic,ROC)的下面积(area under curve,AUC)和预测度曲线评价网络的预测性能。ROC 曲线上点的纵横坐标分别表示输出结果在不同阈值下的真阳性率(true positive rate,TPR)和假阳性率(false positiverate,FPR)。AUC 越大表示模型的分类准确性越高。预测度曲线表示模型在不同的阳性预测范围内,真阳性单元占已知矿化单元的百分比,曲线越凸向图左上角表示该模型预测可靠性越高。本文以验证集XII为基准计算以上指标,在ROC曲线图中(图8(a)),注意力卷积神经网络模型AUC 高达0.940,说明模型分类准确性很高;在各种模型的预测度曲线中(图8(b)),注意力卷积神经网络模型的预测度曲线在凸向图的左上角,表示模型利用较小的预测范围预测出较多的矿化单元,说明注意力卷积神经网络的预测结果更可靠。综合上述结果,本文建立的注意力机制卷积网络模型具有更高的预测准确性与可靠性。
图8 受试者工作特征曲线与预测度曲线图Fig.8 Curves of receiver operating characteristic and success rate for predictivity
在预测结果中,注意力机制卷积网络和原始卷积网络等深度学习预测模型的预测结果明显高于多层感知机和随机森林2个统计学习预测模型的预测结果。相比于统计学习方法,深度学习模型不仅可以更好地处理高维数据,而且能从冗杂、高噪声的数据中提炼隐含的信息特征。就本工作而言,深度学习预测模型可以利用深度网络对高维数据的良好支持性,允许以多通道图像这种张量形式将更大空间范围内的控矿指标输入至预测模型,从而更好地从整体上表达焦家断裂面的整体形态和分布特征。基于这种更全面的控矿指标输入,深度网络模型通过卷积、池化等多层非线性变换与融合机制,对输入的初始特征进行逐层抽取和精炼,最终在网络顶层获得更具矿化指示性的深层次特征,表达断裂面整体形态和产状变化对矿体分布的控制作用,保证模型的预测性能。而在这2 种深度学习模型的预测对比中,AUC 和预测度曲线均表明注意力机制卷积网络优于未加入注意力机制的卷积网络模型。注意力机制卷积网络通过在网络的最终卷积层(Conv5)中加入CBAM 注意力模块,引导网络自动关注卷积特征的空间异质性和通道差异性,通过学习建立空间和通道维度的自适应权重机制,强化卷积特征中更具矿化指示性卷积特征,有效降低了后续最大池化过程中有利卷积特征的损失,从而在网络最后的全连接层结构中,能更有针对性地抽取具有矿化指示高层次特征,进一步提升网络对焦家断裂非线性控矿作用的表征能力,提升预测结果的准确性和可靠性。
3.3 基于网络特征解构的焦家金矿带断裂控矿因素定量分析
鉴于上述注意力卷积网络模型已具备较高准确性与可靠性,可较好地表征焦家断裂带的控矿作用,本文基于DeepLIFT 方法开展深度网络特征解构,实现焦家控矿因素定量分析。DeepLIFT 分析中,设置各控矿因素的参考值,如表2所示。基于此设置,利用式(6)~(9)提取各控矿要素指标对各体元成矿概率预测的贡献,通过统计各控矿因素对各已知单元成矿预测影响值之和来评价控矿因素对成矿预测的影响度。其中,影响值表征网络决策对控矿因素的敏感度,反映控矿因素在成矿作用中的重要性程度;影响值的正负则反映控矿因素指标与成矿后验概率的正负关联性。进一步统计各控矿因素主导的已知单元数量在所有已知单元中的占比,以此反映焦家矿带的主导性控矿因素。
表2 DeepLIFT模型参考值设置Table 2 Reference values for DeepLIFT model
基于上述焦家断裂控矿因素的分析思路,得出焦家金矿控矿因素分析统计结果,如表3所示。从表3可见:一方面,断裂面距离场因素对网络决策起主要作用,其次为断裂面坡度和坡度变化率因素,而形态起伏度因素对成矿影响相对最小;另一方面,53.5%的已知单元受距离场因素影响最大,其次受坡度和坡度变化率因素的主导单元占比较高,而受断裂面形态起伏度因素主导的单元占较低,低于10%。上述结果综合反映出距裂面距离场、坡度和坡度变化率因素是影响焦家金成矿的主导因素。
表3 基于网络特征解构的焦家金矿控矿因素分析结果Table 3 Analysis results of ore-controlling factors in Jiaojia ore-belt using network feature inspection
在此基础上,进一步分析各控矿因素所主导的单元在三维空间的分布情况,结果如图9所示。从图9可见:在焦家矿带的不同地段,各控矿因素的影响具有明显空间差异(图9(a));在金属量较高的地段如纱岭、曲家等,断裂面距离场因素对成矿的影响最重要(图6(b)和图9(b));此外,绝大多数金矿体处于焦家断裂面下盘,焦家成矿带的矿化可能主要受断裂面距离场控制;焦家成矿带的金矿化主要表现为细脉浸染状碎裂状黄铁绢英岩,且主要含金矿物(银金矿)多以不规则细脉状分布在硫化物或石英裂隙中[30-31],因此,金矿化的发生是焦家断裂活动时期强烈角砾岩化与热液交代作用耦合叠加作用的产物;在焦家断裂带内,强烈的构造变形作用提高了深部流体上涌的通量,同时也促进了围岩的碎裂岩化,整体提高了断裂带内岩石的渗透率,为水岩反应提供了有利条件,另外,构造活动引发的快速减压也是促使金沉淀的重要机制[31−34],因此,距离因素对金富集的主要影响作用反映出焦家断裂带附近的构造活动是浅部流体汇聚、矿质沉淀的重要驱动因素,而远离断裂面成矿流体的流动或金的沉淀将大大减弱,在纱岭、曲家等部位金富集暗示了这些部位可能是主要成矿流体汇聚部位。
此外,本次研究揭示出坡度因素对焦家矿带的成矿有显著影响,特别是在焦家和纱岭等地段深部,坡度为起主导作用的影响因素。但值得关注的是,曲家深部的产状与焦家深部的产状相似,但坡度对其影响并不明显(图9(c))。焦家断裂的三维模型显示在焦家和曲家的过渡部位出现了沿走向上的产状变化,这种产状的变化与焦家断裂在成矿期走滑压扭变形作用伴随的局部旋转有关[35]。因此,焦家和曲家深部坡度控矿的差异性可能与局部挤压改变成矿流体在水平方向上的流动有关。
尽管前人提出胶东型金矿化的部位可能与断裂面的产状变化有关[10,25],但本文定量分析结果呈现出局部的起伏与金成矿关联性较小(图9(a))。焦家成矿带在区域上整体产状相对稳定,而金矿化分布具有规模大且相对连续的特征,反映出形态的起伏变化可能未对大规模的成矿流体迁移、汇聚起到明显控制作用,但焦家断裂面产状变化在局部(特别是在富矿带边缘)仍起主要影响,尤其是在南吕欣木和纱岭等地段主矿体的边缘部位更加明显(图9(d)),这在某种程度上反映断裂面产状变化可能影响含矿流体的圈闭作用。因此,本文认为在矿床尺度内和特定有利部位,断裂面产状变化对矿体定位存在一定影响。
图9 控矿因素主要影响分布(下盘视角)Fig.9 Predominant affected areas of different orecontrolling factors(viewing from footwall side)
3.4 预测靶区与深部找矿方向
基于建立的预测模型,本文对焦家金矿带深部3 000 m以内范围开展三维成矿预测。根据预测得到的未知区单元成矿后验概率,综合ROC 曲线和预测度曲线,选取成矿后验概率大于0.9的立体单元为预测成矿有利单元(图9)。在此基础上,根据控矿因素定量分析的认识,考虑受断裂面距离和坡度因素影响的主要地段,最终圈定深部找矿靶区3 处。其中,I 号靶区位于纱岭勘查区深部2 300 m 处的断裂面下盘部位,分布在现有矿体深部的延伸方向;II号靶区位于曲家勘查区北段矿体的深部,埋深约2 100 m;III 号靶区(潜力区)位于焦家和曲家连接部位深部2 000~3 000 m地段,整体呈现出NW分布,与现有控制矿体并不连续,可能反映了深部新的矿化富集带。I 号和II 号靶区为优先验证靶区,而III 号靶区是未来深部勘探的重点关注部位。
在胶西北金矿区,招平、三山岛等矿带具有与焦家矿带类似的成矿机制[23,25,36−39],成矿物质的输运和成矿流体的圈闭受区域断裂形态与分布的控制作用明显。结合上述对比分析结果以及注意力卷积神经网络在表征焦家断裂面非线性控矿作用的优势,可知基于注意力机制网络的预测方法在胶西北金矿区深部找矿工作中具有广阔的应用前景。
图10 焦家成矿带深部三维成矿预测图(下盘视角)Fig.10 3D prospectivity map of the deep of Jiaojia ore-belt(viewing from footwall side)
4 结论
1)基于焦家深部三维成矿预测,提出了一种基于注意力卷积网络的三维成矿预测建模方法。通过引入CBAM 注意力模块,引导卷积神经网络关注控矿特征的差异性,自学习更具矿化指示性的卷积特征,有效降低了后续最大池化过程中有利卷积特征的弱化与损失,有利于在网络顶层更有针对性地抽取具有矿化指示性的高层次特征,提升网络对断裂面三维结构非线性控矿作用的表征能力。经与原始卷积神经网络、随机森林和多层感知机等预测建模方法对比,基于注意力卷积网络的预测模型展现出更高的预测准确性与可靠性。
2)基于注意力卷积网络模型,利用DeepLIFT对网络特征进行了解构分析,发现网络决策中焦家断裂距离场对成矿影响最显著,其次为坡度和坡度变化率,形态起伏度影响较小,反映出焦家主断裂附近的构造活动对流体汇聚、矿质沉淀的控制,断裂面的几何形态可能通过改变浅部流体流动方向影响局部的矿化富集。
3)基于三维预测及定量分析结果,在矿带深部2 000~3 000 m 圈定找矿有利靶区3 处,其中,纱岭勘查区矿体深部延伸部位和曲家勘查区北段深部具有较强的找矿潜力,焦家与曲家勘查区连接部位深部可能存在新的矿化富集区。
4)鉴于胶西北金矿区招平、三山岛等矿带具有与焦家矿带类似的成矿机制,本文的预测建模方法在胶西北金矿区其他区域深部找矿工作中将具有较强的应用潜力。