APP下载

石油领域本体库的构建研究

2011-06-05邓小亚

电子设计工程 2011年20期
关键词:石油勘探本体勘探

邓小亚

(四川文理学院 计算机科学系,四川 达州 635000)

随着石油勘探和开发的深入和科学技术的不断发展,互联网的广泛普及,各种相关信息量极大的丰富,交叉学科知识的增长与更新速度日益加快,为石油勘探和开发领域知识构建带来复杂的问题。石油勘探和开发领域包含勘探、测井、钻井、录井、试油、井下作业、采油工程、石油储运等二十多个专业,这些专业相互协同,构成石油勘探与开发的全部业务流程。但是在专业之间普遍存在着系统开发独立、单纯追求功能实现,没有从整个石油行业的高度来规划各种石油勘探开发应用系统的设计和开发使用,使得从调研确定需求阶段开始到组织管理数据等多方面造成了对各专业知识理解和使用的不一致,导致了各系统之间对信息、知识共享的障碍,无法为石油勘探和开发领域提供完善的全局解决方案。以中国石油天然气集团公司为例,在中国石油天然气集团公司信息系统数据库建设十几年后,依然存在以下问题[1-2]:

1)编码原则不统一,基础数据情况不佳

主要体现在:早先按专业垂直建立的各个信息模块基本上都有自己的基础数据,数据繁杂而且量大,部分数据不够准确、完备。同时,由于时间和技术的局限性,企业在各个不同历史时期所开发的应用系统相对独立,系统之间无互联性,描述企业信息资源的数据和编码分散、口径不一致、冗余、不规范,有时同一数据或数据指标在不同的系统、不同部门以不尽相同的描述和内容表现出来,使得油田资源无法充分有效地共享。

2)信息系统和软件存在重复开发现象

目前,中国石油用于信息化建设的投资和参与信息化建设的人员都具有一定规模,开发完成了一定数量的信息系统和应用软件,并取得了一批研究成果,其中部分系统和软件达到了较先进的水平,但低水平重复开发现象严重,因为在中国石油产业重组改制以前,各家单位都各自为政,都在投资开发自己的系统,这不但造成了资源的很大浪费,而且严重地阻碍了信息化进程的发展。

因此从长远看石油勘探和开发领域全局知识的构建已成为一种趋势,从知识的角度对石油勘探开发资源进行统一综合管理和决策,建立石油领域的本体库成已经为石油公司建立竞争优势必备的环节。

1 本体的构建

1.1 本体的概述

本体论(Ontology)概念起源于哲学领域,在计算机学科的使用可以追溯到上世纪80年代,最终Gruber给出了广泛接受的概念[3-6]:本体是概念化的明确的规范化说明。

本体作为一种知识共享模式,为特定领域的人和应用系统的交流提供了极大的便利,也正因为如此,本体的研究和应用迅速延伸到知识工程、自然语言处理、信息检索系统、智能信息集成和知识管理、信息交换和软件工程等领域。而如何对这些不同领域内的知识进行抽取和描述并构建出合适的领域本体已经成为当前的研究热点之一[7-11]。

所谓领域本体(domain-specific ontology)是对学科概念的一种描述,包括学科中的概念、概念的属性、概念间的关系以及属性和关系的约束。由于知识具有显著的领域特性,所以领域本体能够更为合理而有效的进行知识的表示。领域本体一般用来表示某一特定领域范围内的特定知识,以本文为例即研究石油勘探开发领域本体库的构建方法为主要内容。

1.2 本体的结构

本体的结构(ontology structure)是一个五元组 O:={C,R,Hc,Rel,Ao}。作为不同主体之间进行交流的一种语义基础,本体由描述某种现实情况的特定术语集,加上一组关于术语内涵意义的显式假定集合所构成。在最简单的情况下,本体只描述概念的分类层次结构:在复杂的情况下,本体可以在概念分类层次的基础上,加入一组合适的关系、公理、规则来表示概念之间的其它关系,约束概念的内涵解释。一个完整的本体应由概念、关系、函数、公理和实例5类基本元素构成:

1)概念是广义上的概念,除了可以是一般意义上的概念以外,也可以是任务、功能行为、策略、推理过程等。本体中的这些概念通常构成一个继承的分类层次。

2)关系是领域中概念之间的交互作用,形式上定义为n维笛卡儿积的子集:R:C1×C2×…Cn。在语义上关系对应于对象元组的集合。

3)函数是一种特殊的关系,n元函数中的第n个元素由前面 n-1 个元素惟一确定,形式化的定义为:F:C1×C2×C3×…×Cn-1→Cn。

4)公理是一些永真式的描述。更具体地说,公理是领域中在任何条件下都成立的断言。

5)实例是指概念中的具体例子,特定领域的所有实例构成领域概念在该领域中的值域。

一个本体包括一系列类(classes)或概念(concepts),它们是本体的核心,其定义一般采用框架结构,包括概念的名称、概念之间关系的集合,以及用自然语言对概念的描述[12]。

2 石油本体业务框架模型

建立领域本体模型的关键步骤首先在于建立合适的领域本体框架模型。石油业务模型(Business Model)是一种通过定义组成活动及活动之间逻辑关系来描述石油企业经营生产过程的模型,它是勘探开发数据模型的基础。

业务领域的划分以某种与石油相关的主题为指导从整体上对油田主要业务进行划分。它不是现有机构部门的照搬,也不是基础业务的整理,而是概括的、总结性的划分[13-17]。

2.1 业务领域方法

按照业务管理形式或油田生命周期组织方式进行划分,例如按照业务管理可划分为“勘探、开发、生产、经营”4大类。具体方法是:首先根据专业划分业务域。某一专业在油气田勘探、开发中承担了某一确定领域的业务,具有明晰的业务边界。 如“物化探”、“钻井”、“采油”、“分析化验”等,不同专业间具有明显不同的业务范畴和业务特性。其次根据油气田勘探、开发生命周期划分业务域。油气田勘探、开发存在着明显的阶段性,且有较明显的阶段性标志,如勘探阶段、开发阶段、废弃阶段等,同一阶段内的若干子业务往往具有一定的相关性,如钻探阶段中的钻、测、录、试等。最后根据油气田勘探、开发管理阶段划分管理业务域。针对油气田不同生命周期或阶段,存在着一些重要的阶段性管理业务。其油气田管理手段和管理方式都不相同,管理内容也不相同,如勘探规划部署阶段、勘探综合研究阶段、开发部署规划阶段等。管理业务可能集中于勘探、开发一个或几个阶段,也可能贯穿于勘探、开发的全过程。

2.2 业务领域划分

业务域的划分以方法生命周期为主线,将专业业务域与方法管理业务域有机的串接起来,尽量符合油气田勘探、开发管理的约定俗成的管理习惯,做到不同业务域间的业务不重复,并保证能覆盖所有的勘探、业务开发。

根据以上原则和方法,把油气田勘探开发业务划分为“勘探规划与部署”、“物化探”、“井筒工程”、“分析化验”、“综合研究”、“开发规划与开发方案”、“油气生产”、“油气集输”等8大业务域。

业务领域中包含独立的一个个业务和更细的子业务。每个业务包含该业务的业务流程,业务流程中包含更细的、小的子业务流程。按照同样的原则,可以将业务逐级细分下去,直至不可细分的业务功能单元为止,称为业务活动。

大的业务包含更小的子业务。按照同样的业务划分原则,可以对业务继续细分。业务的划分要覆盖业务领域中的全部业务,直到将该业务领域中的业务全部细分出来为止。业务域-业务-业务流程-业务活动的层次要大于等于3级,业务域-业务的划分和业务流程的分级都不超过3级;如果确实超过3级,则向上一级压缩,或重新规划分级层次。

以“综合研究”业务划分为例,如表1所示。首先,综合研究在整个勘探开发生命周期处于勘探的中后期阶段,也是一个关键性阶段,它的专业特点很突出,产生大量的大块数据和成果文档,因此把“综合研究”作为一个顶级业务域对待。它下面包含5个一级业务:“构造研究”、“资源评价”、“油藏描述与评价”、“剩余油研究”和“油藏数值模拟”;而以其中的“资源评价”为例,它又包含:“盆地评价”、“区带评价”、“探井评价”和“预测储量计算”4个二级业务;其中“区带评价”又包含5个三级业务活动:“烃源岩条件评价”、“运聚条件评价”、“储层条件评价”、“保存条件评价”和“圈闭条件评价”。

2.3 业务活动的本体模型

业务活动是业务流程分解后最基本、不可再分解的最小功能单元。一般来说,一个业务流程包括若干个业务活动。业务活动的划分与业务分析的视角有关。

业务活动描述:对业务活动的文字性概要描述,描述按照“6W”的模式进行描述,即活动是由谁(Who)发起的、在什么时间(When)发起的、在哪里(Where)发起的、为什么(Why)要发起这个活动、在这个活动中都涉及到了哪些(Which)对象、这些对象的特性是什么(What)。通过这个“6W”过程,可以将某一业务活动中涉及的相关信息完全抽取出来。

表1 综合研究业务划分Tab.1 Comprehensive study of the business division

6W的核心实质是“对象-活动-关联-特性”,如图1所示。

图1 APO业务活动建模框架Fig.1 APO business activity modeling framework

3 以储盖组合本体构建为例

3.1 微本体模型

石油勘探开发领域本体模型给出了在该领域内利用本体组织知识、表示知识、应用知识的逻辑形式。勘探和开发领域本体Pet-On可以形式化地表示为五元组Pet-On=,其中O是论域,即本体的集合,C是论域E中的领域概念或术语的集合,R是本体之间的关系,At是本体的属性,Ac是本体的活动或操作。具体的微本体模型如图2所示。

图3 储盖组合的本体层图Fig.3 Reservoir-sealcombinationoftheontologylayerdiagram

图2 业务活动本体模型图Fig.2 Business activity ontology model diagram

O:论域。根据勘探开发领域知识粒度的不同,论域O中的本体分为不同的级别。一级对应领域主题,如勘探井位部署;二级对应构成一级本体的最大粒度的知识,例如烃源岩;其他级别本体划分方法依次类推。

C:概念或术语。根据勘探开发领域知识粒度的不同,概念或术语的粒度也不同。通常情况下,概念或术语也就是相应本体的名称。例如,勘探井位部署是一级本体名称,同时它也是领域概念的名称。但是,二者有着完全不同的含义。作为本体,勘探井位部署有着自己的属性、活动和与其他本体之间的关系。作为概念,勘探井位部署没有活动,也没有属性,但是有与其他概念之间的联系。

R:本体之间的关系。可以是构成关系,继承关系,也可以是作为其他本体属性的关联关系。

At:本体属性。例如圈闭的等级,烃源岩的丰度。

Ac:本体活动或者操作。例如,构造评价就是构造本体的活动。

3.2 储盖组合的本体模型构建

一个专业领域的本体模型首先必须确定一个业务主题,在相关业务主题的指导下收集和整理该业务范围内的所有的词汇和专业术语,然后按照词汇的等级合理划分词集,以树形的结构模式组织这些词汇之间的关系,在词集整理完善的基础上要建立这些词汇的概念、属性、评价技术和参数、操作流程和识别标准以及词汇之间的关系等,就形成了一个完整的领域本体模型。

储盖组合活动微领域本体的构建模型如图3所示。

4 结束语

本体库的构建是一个浩大的人工智能系统工程,领域本体的构建与应用又是其中最有广阔发展前景的方面,文中提供了在石油勘探开发领域一种基于业务流程的多层次本体构建方案探讨。可以预见:在不久的将来,领域本体库的构建与应用会对人类社会的进步作出巨大的贡献。

[1]陈新发,曾颖,李清辉.数字油田建设与实践-新疆油田信息化建设[M].北京:石油工业出版社,2008.

[2]汪福勇,李爱国.浅谈中国石油信息标准化[J].石油工业计算机应用,2005,13(1):2-6.WANG Fu-yong, LIAi-guo.Disscussion on China’s petroleum information standardization[J].Petroleum Industry Computer Application,2005,13(1):2-6.

[3]Thomas R G,Ontolingua.A translation approach to potable ontology specification[J].Knowledge Acquisition,1993,5(2):199-200.

[4]Bomt W N.Construction of engineering ontofogies for knowledge sharing and reuse[D].PhD Thesis,Enschede:University of Twente,1997.

[5]YUAN Guo-ming, LI Hong-qi, FAN Bo.Discussion on the construction method of oil exploration and development domain ontology[C]//Proceedings of ICEOE 2011,the 2011 IEEE International Conference on Electronics and Optoelectronics,Dalian,China:V4-401.

[6]陈刚,陆汝钤,金芝.基于领域知识重用的虚拟领域本体构造[J].软件学报,2003,14(3):350-355.CHEN Gang, LU Ru-yin,JIN Zhi.Constructing virtual domain ontologies based on domain knowledge reuse[J].Journal of Software,2003,14(3):350-355.

[7]冯志勇,李文杰,李晓红.本体论工程及其应用[M].北京:清华大学出版社,2007.

[8]袁国铭,李洪奇.关于决策支持系统发展综述[J].微型机与应用,2010,29(23):5-7.YUAN Guo-ming,LI Hong-qi.Survey on development of decision support system[J].Microcomputer&IT’s Application.2010,29(23):5-7.

[9]NOY F,Hafher CD.The state of the art in ontology design[J].A Survey and Comparatlve Review,AI Magazine,1997:53-74.

[10]Guarino N.Formal ontology and information systems[C]//Proceedings of the lst International Conference on Formal Ontology in Information Systems (FOIS’98).Trento,Italy:IOS Press,1998,3-15.

[11]Quine W V.From a logical Point of view:Nine Logicophilosophical Essays,Cambridge, Massachuetts[M].USA:Harvard University Press,1980.

[12]邓志鸿,唐世渭,杨冬青,等.本体内代数系统之研究[J].计算机工程与应用,2001,37(23):7-8.DENG Zhi-hong, TANG Shi-wei, YaNG Dong-qing, et al.An intra-algebra in ontology[J].Computer Engineering and Applications,2001,37(23):7-8.

[13]Guarino N,Carrara M,Giaretta P.Formalizing Ontological Commitments[C]//Proceedings of 12th National Conference on Artificial Intelligence (AAAI’94),Seattle,Washington,USA,1994.1:560-568.

[14]Peter M.Ontologies are us:A unified model of social networks and semantics[J].Web Semantics:Science,Services and Agents on the World Wide Web,2007,5(1):5-15.

[15]杨义忠,王承勇,林淑凤.石油主题词表[M].北京:石油工业出版社,1994.

[16]刘宝和.中国石油勘探开发百科全书[M].北京:石油工业出版社,2008.

[17]袁国铭,李洪奇,樊波.关于知识工程的发展综述[J].计算技术与自动化, 2011,30(1):138-143.YUAN Guo-ming, LIHong-qi, FAN-Bo.Survey on development of Rnowledge engineering system[J].Computer Technology and Automation,2011,30(1):138-143.

猜你喜欢

石油勘探本体勘探
油气勘探开发三年滚动计划编制的思考
《中国石油勘探》投稿指南
眼睛是“本体”
勘探石油
《中国石油勘探》投稿须知
《中国石油勘探》投稿须知
《中国石油勘探》投稿须知
基于本体的机械产品工艺知识表示
春晓油气田勘探开发的历史
煤层气勘探开发行动计划发布