APP下载

基于Protégé的矿床成因类型本体推理判别方法
——以中低温岩浆热液型金矿床为例

2023-10-23薛林福冉祥金

黄金 2023年10期
关键词:实例本体矿床

高 鑫,薛林福,冉祥金,燕 群,王 睿

(吉林大学地球科学学院)

引 言

矿床成因类型判别是找矿预测和矿产勘查中十分重要的研究工作,矿床成因类型的确定决定了找矿方向和是否能够成功地找到矿产资源。中低温岩浆热液型金矿床可以划分为中温岩浆热液型金矿床、远成低温岩浆热液型金矿床2个亚类。中温岩浆热液型金矿可以划分为:破碎带蚀变岩型、石英脉型和部分爆破角砾岩型等3个子类。远成低温岩浆热液型金矿床可以划分为:卡林型、类卡林型、微细浸染型、浊积岩型等4个子类[1-2]。

国内外研究人员已经在地质学领域从不同角度构建了地质本体模型。TRIPATHI等[3]构建了水文地质本体;NGO等[4]从维基百科中抽取结构化数据进行地理本体的构建;COX等[5]利用机器学习建立了地质年代本体;侯志伟等[6-7]根据地学数据中的时间概念及其特征进行时间本体建模,应用于地学数据检索,可以优化数据检索质量,在此基础上提出将中国地质年代与地层概念相结合,构建地质年代本体,能为用户提供知识查询服务,解决了检索中的语义异构问题;姚健鹏等[8]利用Protégé本体建模软件对铜矿床领域本体进行了构建;WANG等[9]开发了一个基于本体的区域地质时代、古生物学和基础地质学信息的数据集成与可视化系统,实现了北美地质时间尺度本体的建模与可视化、化石信息的检索与显示等功能。陆智卿等[10]利用Jena建立了包含图片层与知识层的沉积相知识库。在地质找矿领域,利用推理规则进行矿床成因类型的判别还没有得到应用,由此,本文采用Protégé本体建模软件研究了基于推理规则进行中低温岩浆热液型金矿床判别方法研究,期望该方法具有很高的矿床类型判断准确度,为其他矿床成因类型的判别提供依据。

1 Protégé矿床本体建模

1.1 本体的概念

本体形式化地描述了一个论域[11]。一般由概念、概念间的关系及建立在该关系之上的原理3部分组成。Protégé本体建模软件是一种本体知识模型构建工具,被广泛应用在医学、法律和农业等本体知识模型构建中。本体通常表示为{C1,R,P,C2,I}形式[12],C1(Concept)代表概念或类(Class),每一类中的父类可以下设若干子类,是本体中实例的集合,是具有某种特定性质的具体或抽象对象汇总而成的集体。R(Relation)代表关系,是类之间的二元关系,将2个类连接在一起,表示类与类之间的相互联系。P(Property)代表属性,是实例之间的二元关系,将2个实例连接在一起,表示实例与实例之间的相互联系,可以用于描述事物的特征。C2(Constraint)代表约束,用于在本体构建时,对于事物属性的限制,包括取值范围和类型等。I(Individuals)代表实例,是类中包含的对象,实例拥有其所属类的所有属性和关系。本体概念的引入,在表达复杂矿床的分类与联系中提供了有效手段。

1.2 矿床本体构建过程

1)确定本体领域及范畴:领域是一个知识范围,在这个范围内的全部知识可以解决领域对应的特定范围的问题[13]。本文构建矿床成因类型的本体,并将“中低温岩浆热液型金矿床”作为具体研究对象,选择以《地学大辞典》[14]《地质学汉语叙词表》[15]《勘查区找矿预测理论与方法(总论)》[1]《勘查区找矿预测理论与方法(各论)》[2]为主要参资料。矿床成因类型本体推理原理见图1。

勘查区找矿预测理论(又称“三位一体找矿预测理论”)广泛应用于中国的找矿预测实践中,其核心概念主要包括:矿床(体)、成矿地质体、成矿结构面和成矿构造、成矿作用特征标志。矿床(体)是指含有用矿物资源且在一定的经济技术条件下能被开采利用的综合地质体;成矿地质体通常为矿床的形成提供了成矿物质、流体和能量;成矿结构面和成矿构造为矿床的形成提供了成矿流体运移通道和成矿空间;成矿作用特征标志指示了矿床形成过程。不同矿床成因类型具有不同成矿地质体、成矿结构面和成矿构造、成矿作用特征标志,可基于此建立成矿与找矿预测地质模型。

图1 矿床成因类型本体推理原理

2)列出重要术语:对于矿床成因类型本体,要尽可能做到使用通用专业术语,如发育、陆块区、造山带等。着重列出与三位一体找矿预测理论相关术语。

3)定义类及其中的层级:在Protégé本体建模软件中,每个本体模型有一个默认总类“owl:Thing”,可以在该总类之下添加多个不同级别的子类,本文主要研究对象为中低温岩浆热液型金矿床,以此为例,类的创建过程如下,顶层为矿床概念层,自顶向下由宽泛的矿床成因分类逐层细化到矿床类型,以树状形式展现金矿床的分类结构。此外,根据三位一体找矿预测理论,建立成矿地质体、成矿结构面与成矿构造、成矿作用特征标志3个大类及其子类,用于表征各类金矿床特征。

4)定义类的关系:用于描述类或实例之间的联系,向上对类动作状态或特征的陈述或说明,向下承接了共性特征层;以共性特征层为实例,该层为矿床模型的核心层级,涵盖了各类矿床从宏观地质信息到微观地质特性等核心知识。本文除了定义用于描述关系的“是”“具有”“属于”等一般词外,还根据三位一体找矿预测理论定义了“成矿地质体是”“成矿构造是”“成矿结构面是”和“成矿作用特征标志是”等关系。

5)创建实例:创建属于类的实例,一般为领域内的对象,如大桥金矿床。单个矿床作为矿床成因类包含的元素,既向上归属于具体的矿床成因类,又与共性特征层的属性相互融合。创建后可以在个体的Description里声明其所属的类,在Property Assertion里声明其具有的属性。这里主要对从三位一体找矿预测理论角度下的实例创建过程进行说明,以成矿构造中的断裂为例,一般认为按相对运动方向可以分为正断裂、逆断裂、走滑断裂;按力学性质可以分为压性断裂、张性断裂、剪切断裂、张扭性断裂、压扭性断裂;按走向可以分为北东向断裂、北西向断裂等。这些术语既可以按照层级关系当作父类和子类,也可以按照对象的角度当作实例。为了推理方便,在断裂类下面创建“正断裂”“逆断裂”“走滑断裂”“压性断裂”“张性断裂”“剪切断裂”“张扭性断裂”“压扭性断裂”“北东向断裂”“北西向断裂”等。同理,“成矿地质背景”类下面包含的实例为“大地构造单元”“成矿带”“成矿时代”等。“岩体”类包含的实例为“酸性岩体”“中酸性岩体”“中性岩体”“中基性岩体”“基性岩体”“超基性岩体”“基性超基性岩体”等。

从结构、功能、可用性、一致性、完整性、简明几个维度对本体反复评估及迭代修订,修订后的本体在以上几个方面实现相对最优。矿床成因类型本体包含的三元组实体1 326 014个,关联属性2 314 541个(见图1),本体具有较丰富类间关系,适于表达地质领域复杂的关系。

2 矿床本体推理规则

2.1 SWRL推理规则语言

语义网规则语言(SWRL,Semantic Web Rule Language)是由语义方式呈现规则的一种语言,该语言符合W3C规范,也是目前比较流行的规则语言,SWRL表示规则[16]见式(1):

A1,A2,A3,…,An->B1,B2,B3,…,Bm

(1)

->两侧的逗号表示合取,A1,…,An和B1,…,Bm可以形如C(?x)、P(?x,?y)、sameAs(?x,?y)或者differentForm(?x,?y),其中C是一个类,P是一个属性,x和y是变量、实例或者数据值。SWRL的突出优势主要在以下2个方面:一方面可以根据本体推理涉及领域特点,自定义规则,可复用性好,在相近的领域可以重复使用推理规则;另一方面,SWRL能够非常清楚地描述规则之间的层次关系,具有人机可读性好、可以直接结合本体来建立规则、易于使用等优点。

2.2 本体推理机

推理机(Inference Engine)在Protégé本体建模软件中是SWRL Tab插件。在该插件中,可以使用SWRL的所有语法,便于将本体实体加入到规则中,防止输入错误。Protégé本体建模软件中的推理机基于HermiT推理算法,可以用来发现新知识和识别错误知识。

2.3 矿床类型推理规则

由于矿床成因类型本体关系比较复杂,因此本文选择用SWRL Tab自定义推理规则,推理规则定义了由已知知识推导出未知知识,用来推理类的规则的格式见式(2):

rule-name:R1 (?x)^R2(?x,?y)->R3(?x)

(2)

用来推理关系的规则格式见式(3):

rule-name:R4(?x)^R5(?x,?y)->R6(?z,?x)

(3)

式中:rule-name为规则的名称;R1、R3、R4为本体模型中的某个类;R2、R5、R6为本体模型中的某个类或者属性;->前面为推理前的状态;->后面为推理得到的结果;R3和R6由推理得到。

通过推理,可以对x进行归类,或者得到z与x之间的新知识。在编写推理规则时,将多个规则组合,可以进行组合推理。

根据地质领域知识,可以创建若干条推理规则,对本体模型中包含的知识进行推理,对构建的本体模型进行补全。例如:一般认为一块岩石中包含的矿物为石英和长石,则这个岩石为花岗岩。将上述理论归纳为SWRL推理规则即为“S1:岩石(?a)^矿物(?a,石英)^矿物(?a,长石)->花岗岩(?a)”。

根据一系列矿床特征和三位一体找矿预测理论,可以进一步判断矿床的成因亚类或子类,这属于推理新知识的过程。通过SWRL Tab自定义推理规则,利用Protégé内置推理机可以推理分析该矿床属于的类型。针对中低温岩浆热液型金矿床,建立找矿模型要素本体,根据推理格式编写若干推理规则。例如:金矿床位于岩体附近,金矿床的成矿时代为白垩纪,岩体的侵入时代为燕山期,金矿床的成因类型为中低温岩浆热液型金矿床,该推理规则可以表示为:矿床(?a)^岩体(?b)^附近(?a,?b)^成矿时期(?a,白垩纪)^侵入时期(?b,燕山期)->中低温岩浆热液型金矿床(?a)。

3 推理应用

在“矿床类”下面添加大桥金矿床实例,以区域地质调查报告和47篇相关文献为参考资料,结合三位一体找矿预测理论,整理出大桥金矿床的成矿要素,结果见表1。构建矿床本体模型,按照大桥金矿床的成矿地质背景和矿床地质特征为大桥金矿床实例添加属性,经过推理将大桥金矿床的属性补全,同时在Protégé本体建模软件中可以看到大桥金矿床被归为“中低温岩浆热液型金矿床”和“中温热液型金矿床”(见图2),代表着推理后矿床成因类型更加明确,从比较模糊的“金矿”细化到了“中低温岩浆热液型金矿床”,具体推理过程如下。

选择基础地质规则库对大桥金矿床现有成矿要素进行属性补全,得出大桥金矿床的岩石主要是滨浅海碳酸盐组合、陆源碎屑浊积岩、英安岩—安山岩组合;硅化蚀变与金矿化关系密切;成矿地质体为印支晚期中酸性隐伏侵入体,沉淀机制主要为充填。

选择矿床成因的推理规则库进行二次推理,得到推理结果为:大桥金矿床属于中低温岩浆热液型金矿,符合普遍认为的矿床成因类型。分析得到推理的主要依据是:大桥金矿床成矿地质体为中酸性、酸性、偏碱性侵入体;其沉淀机制以充填为主;矿体形态为层状矿体、脉状矿体和复合矿体;矿体受断裂、硅钙面等成矿结构面控制;矿化样式以脉状、似层状为主;蚀变类型为硅化、绢云母化(见图3)。符合矿床成因类型推理一般规律[17-20]。利用Protégé本体建模软件的推理机插件进行推理,能够根据结论所在类,挖掘出隐含的关系,最终得到具有参考意义的结果。

表1 大桥金矿床成矿要素

图2 大桥金矿床推理前、后所属矿床类型对比

图3 大桥金矿床推理后属性

4 结 语

利用Protégé本体建模软件,参照勘查区找矿预测理论,对矿产地质知识进行本体建模,在此基础上基于SWRL,定义一般地质规律规则和矿床成因类型推理规则,针对中低温岩浆热液型金矿床,利用HermiT推理机完成对大桥金矿床成因类型的推理。经验证,推理结果准确,并且能够挖掘出类之间的隐含关系,能够依据理论帮助研究人员确定矿床类型。在未来的研究中,可将基于Protégé本体建模软件的推理判别方法应用于其他矿床成因类型的判别,也可将本方法与现有的人工智能找矿预测模型结合,探索知识驱动与数据驱动综合的找矿预测方法,辅助研究人员开展深部找矿预测工作。

猜你喜欢

实例本体矿床
构造叠加晕法在深部找矿中的应用——以河南小秦岭杨砦峪金矿床S60号矿脉为例
黑龙江省林口县三合村探明超大型石墨矿床
基于本体的机械产品工艺知识表示
西昆仑新发现盐湖型卤水硼锂矿床
《我应该感到自豪才对》的本体性教学内容及启示
完形填空Ⅱ
完形填空Ⅰ
辽南分水金矿床铅同位素特征及矿床成因
专题
Care about the virtue moral education