加权Logistic回归模型在火山岩型铜矿预测中的应用:以宁芜盆地中段为例
2016-05-03赵增玉陈火根潘懋贾根李向前徐士银郭刚张祥云江苏省地质调查研究院南京0049北京大学地球与空间科学学院北京0087
赵增玉,陈火根,潘懋,贾根,李向前,徐士银,郭刚,张祥云.江苏省地质调查研究院,南京0049;.北京大学地球与空间科学学院,北京0087
加权Logistic回归模型在火山岩型铜矿预测中的应用:以宁芜盆地中段为例
赵增玉1,2,陈火根1,潘懋2,贾根1,李向前1,徐士银1,郭刚1,张祥云1
1.江苏省地质调查研究院,南京210049;2.北京大学地球与空间科学学院,北京100871
摘要:文中探讨了加权Logistic回归模型在宁芜盆地中段火山岩型铜矿预测中的应用。首先,结合研究区的成矿地质背景,提取地质体、构造、围岩蚀变三大类证据因子;其次,分析各证据因子与铜矿点之间的空间关系,认为姑山旋回、娘娘山旋回火山机构控制了本区火山岩型铜矿的空间分布,根据计算结果,选取与火山岩型铜矿密切相关的龙王山组、姑山组地层,姑山旋回粗面斑岩、娘娘山旋回二长斑岩、NW向构造1.5 km缓冲区、NE向构造1.3 km缓冲区、EW向构造4.5 km缓冲区、硅化、褐铁矿化、黄铜矿化等作为模型自变量;最后采用加权Logistic回归模型进行成矿概率计算,并结合成矿地质背景,圈定四个成矿远景区,分别为P1、P2、P3、P4,其中P1、P2、P3呈北东向展布,主要受娘娘山和姑山火山机构控制,P4为东西向分布,主要受龙王山火山机构控制,在这些预测区中,均存在已发现的铜矿体,说明预测可信度较高。
关键词:加权Logistic回归模型;宁芜盆地;证据权模型;成矿预测
GIS在矿产预测中的应用研究日益普及和深化,在矿产勘查领域中已成为一种快速有效的资源评价手段。基于GIS,学者们提出了各种矿产预测模型(Agterberg et al.,1992;王世称,1995;肖克炎,1999;陈建平,2005;池顺都,2007;成秋明,2007),其中Agterberg等(1992)提出的加权Logistic回归模型由于可以避免证据权模型(Bonham-Carter,1988,1989; Carranza,2001)中条件独立性假设的限制,在成矿预测中得到了很多地质学家的关注,该模型近年来被广泛应用于矿产预测与远景区圈定(刘艳宾等,2011;努丽曼古·阿不都克力木等,2012)。文中基于加权Logistic回归模型对宁芜盆地中段铜矿开展成矿预测研究。
宁芜盆地是长江中下游多金属成矿带重要成矿单元之一,以发育著名的“玢岩铁矿”为重要特征(宁芜研究项目编写小组,1977),矿产资源丰富,有色金属矿产以铜矿为主(伴生有金),铅锌为次,均为内生矿产。该区历经两轮1:5万区域地质调查工作,积累了极其丰富的地质矿产资料,本次工作是在新一轮的区调工作基础上进行的。宁芜盆地铜矿的主要成因类型为火山岩型铜矿,其规模多为中小型矿床或矿(化)点。根据矿床地质特征可分为两类:一类为中低温热液充填型铜矿,另一类为中温热液细脉浸染型铜矿(侯龙海,2008)。如何充分挖掘铜矿点与各成矿因素之间的空间相关性及成因联系,进而圈定铜矿找矿远景区,一直以来是宁芜地区多金属矿预测研究的热点之一。在以往对该区成矿预测的研究中(贾根等,2007;侯龙海,2008;吴良芳等,2012),主要是基于传统的地质理论,并参考物化探数据和地质专家经验进行成矿规律及预测的研究。加权Logistic回归模型的应用无疑是对该区地质资料的充分利用及区域地质调查成果的升华,为铜矿成矿规律的研究提供辅助决策,并且可应用于找矿远景的圈定。
1 加权Logistic回归模型
证据权模型由于是基于贝叶斯法则的统计方法,因而需要各证据之间满足条件独立性假设,在实际应用中,各证据之间往往不符合这种假设,因此,Agterberg等(1993,2002)提出了加权Logistic回归模型。该模型借助证据权模型思想对证据与矿点空间关系进行相关性分析,选择回归自变量,通过Logistic回归模型进行成矿概率计算,既发挥了证据权模型分析各证据与矿点之间空间关系的优势,又可避免贝叶斯法条件独立性假设对地学应用的种种限制,在成矿预测中应用效果也较理想(Agterberg,et al.,1993;刘艳宾等,2011)。
应用加权Logistic回归模型进行成矿预测步骤如下:
(1)对证据与矿点空间关系进行相关性分析
假设研究区被分为N{T}个面积相同的栅格单元,并且在每个单元内最多只能包含一个矿点,那么,任意单元矿点存在的先验概率Pprior{D}为N{D}/N{T}。再假设证据图层为{B},证据存在和不存在的单元个数分别为N{B}和N{B¯},对应的正负权重分别为W+和W-,可通过对应的似然比来计算,如公式(1)和(2)。
则,反差C(contrasts)=W+-W-可以衡量空间证据图层与矿点之间的空间相关性,而学生化反差为权重方差,)可以用来对C进行显著性检验。满足给定置信水平T下的stud(C)值(表1)所指向的证据可作为自变量参与logistic回归模型的计算。
(2)通过Logistic回归模型计算成矿概率
设p为某事发生的概率,取值范围为[0,1],1-p即为该事件不发生的概率,将其两者比值取自然对数ln[p/(1-p)],以p为因变量,xm为自变量,建立线性回归方程:
此即Logistic回归模型,α为常数,βi(i=1,2,...,m)为逻辑回归系数。Logistic回归模型是普通多元线性回归模型的推广,与普通多元线性回归模型比较,Logistic回归模型采用最大似然法拟合而不是最小二乘法,并且它的误差项服从二项分布而非正态分布。
由(3)式可得成矿概率:
(3)圈定成矿远景区
根据式(4)中计算得到的成矿概率,利用累积曲线拐点法等方法确定找矿远景区的概率区间。
加权logistic回归模型本质上是证据权模型与logsitic回归模型结合,将证据权模型中满足给定置信水平下的证据图层作为自变量,矿点的存在与否作为因变量,利用各证据图层和矿点进行Logistic回归分析,即可得到各证据组合下成矿的概率。
表1 C值置信水平T(%)与stud(C)的对应关系表Table 1 Relationship between studentized contrasts and confidence levels of C values
2 成矿地质背景
2.1地质背景
研究区出露地层主要为三叠系、侏罗系和白垩系。其中,三叠系至中侏罗统主要发育粉砂岩、石英砂岩等沉积岩地层,上白垩统发育一套红色碎屑岩,为赤山组,上侏罗统至下白垩统主要为陆相火山岩地层,每个火山岩地层组发育于一个火山旋回,分别对应于龙王山旋回、大王山旋回、姑山旋回与娘娘山旋回,每个旋回对应一套火山岩相组合,空间上各旋回产物有套叠现象,并具自南东向北西迁移的规律(图1)。各火山岩旋回岩石组合特征如表2所示。中低温热液充填型铜矿主要与燕山中期较晚阶段的姑山旋回、娘娘山旋回的中偏酸性、偏碱性的火山-侵入岩成因关系密切,受火山机构和北西向断裂控制明显。中温热液细脉浸染型铜矿主要与龙王山旋回的火山-侵入活动关系密切。
研究区的断裂构造非常发育,北西与南东边界即分别受长江断裂带和方山-小丹阳断裂的控制。区内主要发育NE向、NW向及近EW向三个方向的断裂构造。其中,NE向、NW向断裂形成较早,近东西向断裂切割前二组方向的断裂,明显较晚。较大的北东向断裂控制了区域火山喷发与岩浆侵入活动,同时也控制了铁铜多金属成矿带的空间展布格局。北西向断裂与北东向断裂交切部位是区内岩浆侵入与喷发活动的最有利地段,控制着主要火山机构的空间分布,同时NW向断裂也是重要的控矿构造。而近东西向断裂可能为后期叠加的断裂构造,该期断裂对先存地质体和构造起破坏作用,且多伴有脉岩侵入。铜矿以脉状为主,少数呈细脉浸染状产于龙王山至娘娘山旋回火山岩及次火山岩的断裂中。
2.2主要成矿特征
中低温热液充填型铜矿床一般以脉状产于岩体(石英闪长玢岩、二长斑岩、粗面斑岩等)附近的构造裂隙中,少数见于辉石闪长玢岩体中,主要矿物组合为黄铜矿—自然金—菱铁矿—石英、石英—黄铁矿—黄铜矿、石英—碳酸盐或镜铁矿—黄铜矿—黄铁矿,矿石具自形—它形粒状结构为主,具不规则块状、星散状、网脉状、梳状、晶洞状以至角砾状结构,铜井矿硫化物的测温资料在120℃~290℃,石英、重晶石的形成温度在95℃~160℃。主要蚀变特征:近矿以硅化、高岭土化为主,向外为绢云母化、绿泥石化、碳酸盐化等。铜井铜金矿、铜山铜矿均属于此类型铜矿。
中温热液细脉浸染型铜矿床主要产于龙王山组火山碎屑岩及辉石安山玢岩中,以大平山铜矿为代表。矿体受产状平缓的层节理控制,呈透镜状为主产出,矿石以浸染状、细脉浸染状为主,与围岩界线不清,以黄铁矿为主,伴有黄铁矿、少量镜铁矿、毒砂、闪锌矿等,蚀变自内向外为钾钠长石化带—碳酸盐、绢云母化带—青盘岩化带,属于此类型的还有皇姑山铜矿、莺子山铜矿等。
图1 宁芜盆地中段铜矿地质背景Fig.1 The geological map showing deposits in the middle part of NingWu Basin
表2 各火山旋回岩石组合特征Table 2 The volcanic rock assemblages and their relations with copper
3 模型应用
在成矿地质背景分析基础上,挖掘各控矿因素与成矿之间的空间关系,有效提取有利的找矿信息,利用加权logistic回归模型,对研究区成矿概率进行了计算,对结果的可靠性进行了分析。
3.1资料收集与处理
宁芜中段的区域地质调查工作在数字填图系统(DGSS)中建立了较为全面的空间数据库,将野外路线数据、勘探工程数据、实际材料图、地质图、物化遥数据等原始资料和成果统一组织管理,这就为进一步的GIS成矿预测奠定了坚实的数据基础。本文正是基于这些资料,以ArcGIS为空间数据建模工具,分析这些数据与铜矿(化)点之间的空间关系及成因联系,并计算成矿概率。
通过空间数据库,收集到与成矿相关的多方面原始资料及成果图件,包括地质图、基岩地质图、矿产地质图、火山机构图等,从这些资料中提取出与成矿相关的要素,并栅格化,使之成为证据权模型的输入数据。本文提取的证据图层包括地层、岩体、构造线、围岩蚀变。研究区面积为892 km2,铜矿(化)点个数为33个。
在训练点、证据图层、研究区范围均确定后,便可计算各证据的正负权重值、对比值、以及学生化反差,分析各证据与矿点之间的空间相关性,进而选择成矿影响因素。
3.2成矿影响因素(自变量)的确定
加权logistic回归模型自变量的确定是基于证据的权重大小,下面计算各证据图层的权重表,并对各证据与矿点进行空间相关性分析。
3.2.1地质体
基于研究区的基岩地质图,对区内的沉积地层(包括沉积岩地层和火山沉积地层)和岩体进行权重、反差值C、综合权重值Weight的计算,其中不同时期沉积地层对成矿的权重如表3所示。
由表3知,沉积地层对火山岩型铜矿的控制作用主要表现在姑山组,综合权重达3.33,其次为龙王山组,说明了下三叠统至上白垩统的姑山旋回、龙王山旋回较其它地层而言,与铜矿相关性更强,因此,上述火山旋回地层是对本区火山岩型铜矿预测主要的影响因素之一。
研究区内岩体对成矿的影响相对于地层来说,更为显著,表4列出了对铜矿点有影响的岩体权重计算结果,由于其余岩体权重均为0,不在下表中列出。结果显示,姑山、娘娘山旋回的侵入岩体对成矿的影响较大,姑山旋回粗面斑岩的反差高达3.09,学生化反差为3.02。而娘娘山旋回的粗安斑岩、龙王山旋回的闪长玢岩对成矿的影响较小,龙王山旋回的安山玢岩反差结果则为负值,说明该岩体与铜矿关系不密切。
计算结果与第二部分对成矿背景的分析比较吻合,取置信水平为97.5%,则stud(C)>1.96为可采用证据。
对地质体与铜矿点的空间分析表明,本区龙王山旋回、姑山旋回的火山喷发作用对控矿作用明显,可作为Logistic回归模型自变量。
表3 地层单元证据权重及反差值Table 3 Weights and contrasts for strata with respect to ore occurrences
表4 岩体对成矿的权重表Table 4 Weights of rock mass
3.2.2构造
构造在研究区火山岩型铜矿的形成中担任相当重要的角色,其控制着区域火山喷发与岩浆侵入活动,同时也控制着火山岩型铜矿的空间分布。基于研究区地质图中的构造线,利用ArcGIS提取了NE、EW、NW三个方向的构造线,并作了不同距离的缓冲,缓冲距离间隔为0.1 km,不同方向构造线缓冲区的C值、stud(C)及综合权重值Weight对比见表5。
NW、NE、EW三个方向的构造线分别在累积1.5 km、1.3 km、4.5 km缓冲区处达到置信水平。同时,通过对各方向构造0.3 km缓冲区的C与stud(C)进行对比发现(表5),在同样置信水平下,三个因素当中,NW向构造控矿作用更为明显,C值为1.3119,且NW向构造比NE向、EW向构造更有利于成矿。
3.2.3矿化蚀变
基于研究区蚀变图,提取了十四种矿化蚀变带(区),各蚀变带(区)的C值及stud(C)对比见图2。
由图2可知,所有的矿化蚀变类型与矿点均呈正相关或不相关,若取置信水平为97.5%,满足该置信水平的有三个矿化蚀变类型,即硅化、褐铁矿化和黄铜矿化,其中黄铜矿化的C和stud(C)值均为最大,说明了黄铜矿化对矿点的影响最大,而硅化、褐铁矿化与矿点相关程度较大,是由于在构造强烈变形地区比较容易发育这两种蚀变,而构造的控矿作用是明显的,因而会得出硅化、褐铁矿化控矿作用也明显的结论。
表5 构造缓冲区权重及反差值Table 5 Weights and contrasts structural buffers
表6 加权logistic回归模型自变量Table 6 Independent variables of the weighted logistic regression model
图2 围岩蚀变的C与stud(C)Fig.2 C与stud(C) values of wall rock alteration
3.3成矿概率计算
通过证据权模型对铜矿点与各证据因子之间的空间分析,取置信水平为97.5%,选取了如表6所示的模型自变量。
选取各模型自变量后,即可计算每个单元对应的成矿后验概率值,计算结果如图3所示。在成矿后验概率图中,共6个铜矿点落在>0.105的概率区间,而其面积占全区面积的0.8%,概率在0.011~0.105之间的区域,共有19个铜矿点,所占面积约6.35%。根据成矿概率图,结合成矿地质背景,划分出四个找矿预测区,P1、P2、P3和P4(图3),其中,P1、P2、P3分别呈北东向展布,P4为东西向分布。这几个预测区普遍分布着龙王山旋回地层、姑山旋回粗面斑岩岩体或娘娘山旋回石英二长斑岩岩体,且NW与NE向构造发育较为密集,并且这些地方均包含了已知铜矿点。
P1:位于双虎山破火山口,出露地层为姑山组四段粗安岩与姑山组五段粗安质火山角砾岩,姑山旋回粗安斑岩及正长斑岩沿北西向断裂呈脉状侵入,P1预测区已发现火山岩型铜矿点,北西向构造破碎带为控矿构造,矿点规模虽不大,但铜的品位较高,主矿脉向北西有继续延伸的可能,可作为供地方开采小而富的铜矿,值得进一步工作,有望发现中低温热液充填型铜矿。
图3 研究区铜矿成矿概率图Fig.3 Copper metallogenic probability of the study area
P2:位于娘娘山破火山口,出露地层为娘娘山组碱性粗面岩、集块岩、假白榴石斑岩。侵入岩有娘娘山旋回石英二长岩、二长斑岩和花岗岩。预测区内北西向、北东向构造发育,已发现矿点的矿体呈脉状,为含铜石英脉或含铜锰菱铁矿脉,与围岩界线清楚。根据对已有矿点的分析,北西向断裂为成矿前构造,控制了本区矿脉的形态和产状,北东向断裂为成矿后的构造,破坏了矿体的连续性。沿着预测区北西向断裂进一步开展深部地质工作,有望找到品位较高的中低温热液充填型铜矿。
P3:该区出露地层为姑山组一段安山质火山角砾岩、凝灰岩、火山碎屑岩和姑山组二段安山岩、石英安山岩,发育北西向和东西向断裂,主要出露有石英安山玢岩、安山玢岩、花岗岩、石英二长岩等中酸性岩体,蚀变强烈,具有良好的成矿地质条件,同时又位于铜井含铜矿附近,可进一步工作,有望发现中低温热液充填型铜矿。
P4:该区出露有侏罗系上统龙王山组安山岩,凝灰角砾岩,角砾熔岩,凝灰岩。侵入岩有闪长玢岩,正长斑岩和细晶岩脉。P4区已发现矿点以龙王山含金铜矿为代表,控矿构造为北西向断裂,矿体离侵入体较近,蚀变强,硅化、绿泥石化与铜矿关系强,进一步工作可望找到中温热液细脉浸染型铜矿或扩大已有矿床的规模。
4 结论
此次研究以宁芜盆地中段火山岩型铜矿为例,以区域成矿地质背景为预测依据,利用加权Logistic回归模型,实现了该区铜矿的成矿预测,为进一步铜矿勘探提供辅助决策支持。
(1)定量评价各种影响因子对铜矿点的影响程度,认为研究区火山岩型铜矿的空间分布主要受控于龙王山旋回、姑山旋回与娘娘山旋回火山机构,并据此对成矿预测证据进行选择及定量评价,模型计算得到的证据权值与区内火山岩型铜矿床的成矿规律可相互印证。
(2)计算了每个栅格单元的成矿概率,在成矿地质条件分析基础上,划分出四个成矿预测区,与区域成矿地质背景吻合,并为研究区铜矿的勘探提供理论依据、技术支持及数据支撑,以服务于铜矿勘查部署工作。
参考文献(References):
陈建平,王功文,胡树起,等.2005.基于GIS技术的西南三江北段矿产资源定量预测与评价[J].矿床地质,24(1): 15-24.
成秋明,陈志军,Khaled A.2007.模糊证据权方法在镇沅(老王寨)地区金矿资源评价中的应用[J].地球科学——中国地质大学学报,32(2): 175-184.
池顺都,赵鹏大,刘粤湘.1999.应用GIS研究矿产资源潜力:以云南澜沧江流域为例[J].地球科学——中国地质大学学报,24(5): 493-497.
贾根,张登明,黄震,等.2007.宁芜火山岩区(江苏部分)深部矿产资源潜力分析[J].中国地质,34(增刊):l13-1l7.
侯龙海.2008.浅析宁芜北段铜矿地质特征、找矿前景与方向[J].地质学刊,32(4): 263-270.
刘艳宾,弓小平,薛迎喜,等.2011.ArcGIS在东昆仑西段铁矿资源预测中的应用——以矽卡岩型铁矿为例[J].地质与勘探,47(6): 943-956.
宁芜研究项目编写小组.1977.宁芜玢岩铁矿.北京:地质出版社: 1-290.
努丽曼古·阿不都克力木,张晓帆,陈川.等.2012.加权Logistic回归模型在斑岩铜矿预测中的应用——以中一哈边境扎尔玛一萨吾尔成矿带为例[J].地质论评,58(2): 396-400
王世称,陈永清.1995.金矿综合信息成矿系列预测理论体系[J].黄金地质,1(1):1-7.
吴良芳,魏新良,景山,等.2012.宁芜盆地卧儿岗铁矿成矿地质特征及找矿方向探讨[J].地质与勘探,48(4): 760-767.
肖克炎,张晓华,宋国耀,等.1999.应用GIS技术研制矿产资源评价系统[J].地球科学,24(5): 525-528.
Agterberg F P,Bonham,Charter G F,et al.1993.Weights of evidence modeling and weighted logistic regression for mineral potential mapping [J].Computers in Geology,Oxford University Press,13-32.
Agterberg F P and Cheng Q M.2002.Conditional independence test for weights-of-evidence modeling [J].Natural Resources Research,11(4): 249-255.
Bonham-Carter G F,Agterberg F P and Wright D F.1988.Integration of geological datasets for gold exploration in Nova Scotia [J].Photogrammetric Engineering and Remote Sensing,54(11):1585-1592.
Bonham-Carter G F,Agterberg F P and Wright D F.1989.Weights of evidence modeling: a new approach to mapping mineral potential [C] // Agterberg F P,Bonham-Carter G F.Statical Applications in the Earth Sciences.Ottawa: Geological Survey of Canada: 171-183.
Bonham-Carter G F.1994.Geographic Information Systems for Geoscientists: Modelling with GIS [M].New York: Pergamon: 302-329.
Carranza E J M and Hale M.2001.Logistic regression for geologically constrained mapping of gold potential,Baguio district,Philippines [J].Exploration and Mining Geology Journal,10(3): 165-175.
Cheng Qiu-ming and Agterberg F P.1999.Fuzzy weights of evidence method and its application in mineral potential mapping [J].Natural Resources Research,8(1): 27-36.
Applicationofthe Weighted Logistic Regression Modelin Predictionof Volcanic Rock-Hosted Copper Deposits-Takingthe Middle Partof Ning-Wu Basinasan Example
ZHAO Zengyu1,2,CHEN Huogen1,PAN Mao2,JIA Gen1,LI Xiangqian1,XU Shiyin1,GUO Gang1,ZHANG Xiangyun1
1.Geological Survey of Jiangsu Province,Nanjing 210049,China; 2.School of Earth and Space Sciences,Peking University,Beijing 100871,China
Abstract:Application of the Weighted Logistic Regression model in prediction of volcanic rock type Copper deposits in the Middle part of Ning-Wu Basin is studied.First,the geological setting of ore-forming processes is analyzed.Three kinds of factors including geological body,structure and wall rock alteration are extracted based on the spatial distribution of copper deposits from the geologic map.Then,the spatial relationships between Copper mineral occurrence and each evidence factor are analyzed.It is suggested that Niangniangshan and Gushan volcanic edifice play an important role in spatial distributions of volcanic rock-hosted Copper deposits.The ten evidence raster layers including Longwangshan Formation,Gushan Formation,trachyte porphyry of Gushan volcanic edifice,monzonite porphyry of Niangniangshan volcanic edifice,buffers of the structure lines with NE,NW and EW trending,and the alteration areas of chalcopyrite,silicide and Limonite are selected.Finally,metallogenic probabilities are calculated using the Weighted Logistic Regression model.Four ore-forming prospects,including P1,P2,P3 and P4,are indicated based on the geological conditions ofbook=106,ebook=109metallogenesis and model results.Among these prospecting areas,P1,P2 and P3,which are controlled by Niangniangshan and Gushan volcanic edifice,are spread in the northeast direction.P4 extends in the west-east direction and is controlled by Longwangshan volcanic edifice.The copper ore bodies are already found in these prospecting areas,suggesting that the results should be generally reliable.
Key words:weighted logistic regression model; Ning-Wu Basin; weight of evidence model; mineral prediction
作者简介:赵增玉,女,1984年生,高级工程师,主要研究方向为信息地质与应用地质;E-mail: zengyu1206@163.com
基金项目:江苏1:5万慈湖、柘塘镇、小丹阳、博望镇幅区调(1212011120850)项目资助
收稿日期:2015-05-07;修回日期:2015-09-10
DOI:10.16108/j.issn1006-7493.2015083
中图分类号:P618.41
文献标识码:A
文章编号:1006-7493(2016)01-0105-08
First author: ZHAO Zengyu,Senior Engineer; E-mail: zengyu1206@163.com