基于业务模型的油气勘探开发数据标准体系设计
2014-10-03文必龙
肖 波,文必龙,邵 庆
(1.成都理工大学 能源学院,四川成都 610059; 2.中国石油化工股份有限公司 信息系统管理部,北京 100005;3.东北石油大学 计算机与信息技术学院,黑龙江 大庆 163318)
基于业务模型的油气勘探开发数据标准体系设计
肖 波1,2,文必龙3,邵 庆3
(1.成都理工大学 能源学院,四川成都 610059; 2.中国石油化工股份有限公司 信息系统管理部,北京 100005;3.东北石油大学 计算机与信息技术学院,黑龙江 大庆 163318)
石油工业信息标准中,数据技术标准占很大的比例,但大量的数据技术标准之间缺少协调一致的机制.采用综合标准化方法,提出由业务层和系统层标准构成的石油数据标准体系架构.在业务层,以业务模型为核心集成业务层的数据标准;在系统层,按数据的生命周期,设计数据的采集、传输、存储、管理、服务和应用等系列标准.采用模型驱动的思想,实现业务层与系统层之间标准的衔接,并用元模型对系统层不同数据标准进行统一描述、统一管理,形成一个可高度集成的石油数据技术标准体系.
综合标准体;业务模型;数据标准;模型驱动;元模型
0 引言
在石油工业信息标准中,数据标准占绝大多数.以石油行业标准为例,当前石油信息行业标准共发布37项标准,其中数据类标准为29项.随着数字油田、智能油田建设的深入,系统规划或设计油气勘探开发数据标准体系成为石油工业信息标准化方法研究的重点.
景瑞林[1]提出以业务流、数据流为主线索,进行调研和分析的石油天然气勘探开发数据标准体系研究方法,梳理源头数据和代码体系,设计数据元和元数据、分类与编码、源点信息采集、业务模型、图形格式、数据交换标准等标准分类.赵丰年等[2]结合石油勘探开发数据采集、管理与服务,从技术和管理方面及数据元、元数据和管理标准3个维度建立石油勘探开发数据标准模型.王辉等[3]提出FOL数据标准体系,从数据标准内容的扩展性方面,按照固定(Fixed)、开放(Open)和本地化(Local)3个层级进行油田数据标准体系设计,有效解决数据标准的适用性问题.Energistics从数据操作角度提出数据模型、数据存取、数据交换、数据服务等系列石油数据标准[4].为了描述数据标准,Zcollection定义资源集合组织、检索开发框架,该框架有良好的框架结构和可扩展性,能够很好地描述集合、对象,以及它们之间关系的元数据[5-6].这些研究虽然从各自的角度提出定义和管理数据标准化框架,但过于单一,难以形成系统化的、严谨的体系架构.综合标准化方法具有综合性、成套性、整体协调性等特点[7-8],对系统化地设计数据标准体系具有参考价值.
笔者在总结中国石化数据标准制订过程的技术和经验基础上,采用综合标准化方法的思想,提出基于业务模型的数据标准体系,设计数据标准综合体和油气勘探开发数据标准框架;提出油气勘探开发的业务模型,将数据标准的各个内容集成到业务模型的各个单元;给出面向数据集成的模型驱动架构,实现业务层与系统层之间标准的衔接.
1 基于综合标准化的数据标准架构
油田信息系统建设是一个复杂的系统工程,石油数据标准体系应与油田信息系统架构保持一致,标准之间达到高度协调,因此,石油数据标准体系应该有一套成熟的方法.在传统标准化中,特别是在政府直接管理标准化时,由于受上下机构的影响,存在“多而散”的特点,要求必须采用新的方法——综合标准化.
图1 基于数据体系结构的数据标准综合体Fig.1 The data standard-complex based on data architecture
图2 基于数据生命周期的数据标准综合体Fig.2 The data standard-complex based on data life cycle
图3 勘探开发数据标准框架Fig.3 The data standard framework for petroleum exploration and production
两个数据标准综合体将数据标准分为业务层和系统层.数据采集和应用是联接业务层和系统层的两个关键接口.数据标准综合体的结构存在问题:(1)业务层面的各数据标准的关联;(2)业务层与系统层之间标准的衔接;(3)系统层的各数据标准之间的集成.这些问题是实现勘探开发数据标准之间相互协调、集成为一个有机整体的关键.因此,提出油气勘探开发业务模型和数据集成的模型驱动架构,其中业务模型用来集成业务层的数据标准;模型驱动架构用来集成业务层与系统层,并对系统层数据标准进行集成化管理.
2 油气勘探开发业务模型
业务模型(Business Model)是一种通过定义组成活动及活动之间逻辑关系描述企业经营生产过程的模型.油气勘探开发业务建模是将石油勘探开发生命周期中涉及的业务抽象为一个完整的业务功能结构,在系统地、本质地、概括地抽象勘探开发功能结构的同时,还要建立每一个业务功能相关的数据、知识、软件等的关联关系[9].
业务分析与建模过程从形式上可分为4个阶段:一是业务领域划分;二是分业务领域建模;三是业务模型集成;四是业务模型标准化.
业务模型采用“业务域—业务分类—业务活动”三层结构(见图4).由图4可以看出,将油气勘探开发所有业务划分为多个业务域,每个业务域建立多级业务分类,每个分类中定义一个或多项最基本的业务活动.
图4 油气勘探开发业务模型的体系构架Fig.4 The architecture of business model for petroleum exploration and production
业务域(Business Domain)是对企业中的一些主要业务活动领域的抽象,而不是现有机构部门的照搬.对油田业务域的划分可以根据某一主题进行.业务领域的划分原则:(1)根据专业划分业务领域;(2)根据油气田勘探、开发生命周期划分业务领域;(3)根据油气田勘探、开发管理阶段划分管理业务域.业务领域的划分参照三种原则,尽量符合油气田勘探、开发管理的约定俗成的管理习惯,做到不同业务域间的业务不重复,并保证能覆盖所有的勘探、开发业务.因此,将油气勘探开发业务领域划分为“物化探”、“井筒工程”、“分析化验”、“综合研究”、“油气生产”、“地面工程”等六大业务领域.
业务是由一系列业务活动组成的,对业务活动的描述按照“6W”模式进行[9],即活动是由谁(Who)发起的、在什么时间(When)发起的、在哪里(Where)发起的、为什么(Why)要发起这个活动、在这个活动中都涉及到哪些(Which)对象、这些对象的特性是什么(What).采用业务单元定义参与业务活动的基本元素及元素之间的关系.一个业务单元包括八类元素:1个业务活动、该活动作用的1个业务对象、实施该活动的组织机构、1组结果对象(输出)、1组参与对象(输入)、业务规则、相关对象的特性和对象之间的关系(见图5).
业务单元中,“特性”定义业务活动需要的数据、业务活动相关的知识,是数据规划梳理的重点;“参与对象”包括各种人员、软件、数据、设施、材料和方法等;“作用对象”包括区块、油藏、井、层位、油田和企业等;“结果对象”可以是油井等油田实物对象,也可以是文档、方法和研究成果等技术性对象.
基于“6W”的业务模型的建模通过在统一的业务域分类架构下,对单一业务活动的业务单元进行描述,没有进行专门的业务流程梳理;由于业务单元中描述业务活动参与对象与结果对象,即定义活动的输入与输出,以这些对象为中介,很容易自动形成业务流、数据流和知识流等流程.
业务活动与数据之间的关系可以用“CUR”矩阵描述.矩阵中,行对应业务活动,列对应数据元.如果业务活动中创建某一项数据,则行列对应的值标识为“C”(Create);如果业务活动对数据进行更新,则标识为“U”(Update);如果业务活动引用某一项数据,则标识为“R”(Read).对“CUR”矩阵,可以检查某一数据是否有惟一的创建源头,保证数据源头的惟一性.根据CUR关系,可以自动形成数据流.
2007年全球金融危机爆发后,国内外经贸格局发生了深刻变化,集中表现为以下几个方面:一是经过三十多年的高速发展,我国社会经济全面发展,整体技术水平、企业管理能力、资本累积、工业体系、人均收入水平以及总体供给能力与整体消费实力显著提高,引领我国开放发展由“引进来”迈向“引进来”与“走出去”并重的新格局;二是西方国家开始着手构建以“竞争中立”“管制一致性”等为内核的新的全球经贸规则体系,将开放发展的谈判与改革议题拓展至海关之外的“非关税”领域;三是我国比较优势体系发生结构性变迁,传统的劳动力成本优势逐步丧失;四是西方发达国家发展趋缓,需求萎缩。
除了数据外,业务活动还可与知识、软件等关联;通过这些关联,形成以业务模型为基础的企业标准化的数据管理、知识管理和软件服务等信息技术标准化体系.
这里的业务模型是一种逻辑模型,与现实中的油气勘探开发业务并不是一一对应的.一个实际的油气勘探开发业务通常由一个或多个业务活动组成,因此,可以将业务模型看作是一个标准化的业务活动组件库.在将实际工作中的业务与业务模型中的多个业务活动对应起来时,所需要的数据、报表、成果、软件和方法可自动推理出来,快速实现数据服务、知识推送和应用激活等业务支持.
图5 业务单元的结构Fig.5 The structure of business unit
3 面向数据集成的模型驱动架构
所谓模型驱动是指为实现系统的目标,将系统分为若干个层级,在每一个层级上通过模型描述该层级上的实体,建立不同层级上模型之间的映射关系.根据模型间的映射关系,人工或计算机可以完成从源模型到目标模型的变换,从而达到系统运行的目标[10].在数据的生命周期中,每一个环节都可以用相应的模型进行描述,如数据采集模板、数据存储模型、数据交换模型等,解决不同模型之间的变换,实现数据的流转,从而解决勘探开发业务中的问题.
为了实现不同模型之间的转换,MOF定义4层元数据体系结构,分别用M0~M3表示:M0为信息层,M1为模型层,M2为元模型层,M3为元元模型层[11-12].按照模型驱动理论,设计面向油气勘探开发数据集成的模型体系(见图6).
由图6可以看出,M0指存储在各类数据库中的具体数据,包括结构化数据和非结构化数据.
M1指各种模型.除数据采集规程、数据管理规程和资料管理规程等规范人的操作行为的标准外,其他的数据标准可以采用模型进行定义.业务模型中,与业务单元关联的每一种模型都可表达为对数据的需求,表达成用户数据视图.在用户数据视图和逻辑数据模型之间可建立映射关系,不同结构的物理数据模型之间也可建立映射关系,映射关系即模型映射字典.用投影描述逻辑数据模型与物理数据模型之间的转换,各种模型转换构成从业务到数据的映射路线[13].
为了描述和管理各类模型,包括业务模型和数据模型,设计勘探开发元模型(M2),并建立勘探开发元数据库,业务模型和数据模型以元数据的形式保存在元数据库中,这些元数据与各模型是等价的.
图6 油气勘探开发数据集成的模型体系Fig.6 The model architecture of data integration for petroleum exploration and production
基于元模型,业务模型和各类数据模型有统一的描述方式,因此可以对模型进行统一的管理[13],包括模型的注册、发布、模型与数据库的一致性检查、模型培训等.对已经发布为标准的模型,采用元数据进行管理具有特点:
(1)所有标准除发布标准文本外,提供与标准一致的元数据及元数据服务,方便标准的应用,减少标准应用过程中由技术原因产生的不一致问题.
(2)增加采用相同标准的系统间的互操作性和集成性.由于采用相同元模型和元数据,不同系统之间可交换和共享元数据,在基于相同元模型的组件间可进行无缝集成.
(3)在业务层和系统层之间建立映射关系,可实现两个不同层级间数据的模型驱动.可将业务层的数据操作自动转换为对系统层的数据操作,业务层的应用减少对系统层的依赖,将系统层的实现方式透明化,因此,可提高业务层对数据操作的灵活性和可扩展性.
(4)系统层的不同模型之间通过映射,可实现数据流不同环节的模型驱动.通过对源头数据库、数据中心主数据库、项目数据库等数据库模型之间建立映射关系,利用数据迁移工具和数据访问服务可轻松实现异构数据库间的数据流动和相互访问,实现异构数据库集成.模型之间的映射关系可通过人工进行定义,也可以通过数据模型语义进行自动映射[14-15].
该标准体系架构在中国石化得到实际应用,形成中国石化数据标准体系[16].
4 结束语
按照综合标准化方法,设计基于数据体系结构的和基于数据生命周期管理过程的数据标准综合体,提出油气勘探开发数据标准体系架构,该体系由业务层和系统层的标准构成.以业务模型为基准,将不同的数据标准集成到统一的业务模型,保证不同石油专业间数据需求的一致性.采用模型驱动的思想,有效地实现业务层与系统层之间标准的集成,采用元模型对不同的数据模型进行统一描述、统一管理,形成一个可高度集成的石油数据技术标准体系.
基于业务模型的标准体系架构不仅适合于石油勘探开发数据标准体系的设计,同样适合其他石油信息标准体系的设计.以石油勘探开发业务模型为基础,开展智能油田标准体系的建设是未来研究的重点.
[1] 景瑞林.石油天然气勘探开发数据标准体系研究[J].标准科学,2012,49(4):42-46.
Jing Ruilin.Research on oil and gas exploration and development data standard system[J].Standard Science,2012,49(4):42-46.[2] 赵丰年,曲寿利.石油勘探开发数据标准体系分析[J].石油物探,2010,49(2):198-202.
Zhao Fengnian,Qu Shouli.Analysis of petroleum exploration&development data standard system[J].Geophysical Prospection For Petroleum,2010,49(2):198-202.
[3] 王辉,徐鹏,徐金兰,等.基于FOL方法的数据标准体系建设[J].石油工业技术监督,2012,28(7):29-31.
Wang Hui,Xu Peng,Xu Jinlan,et al.Building data standard system based on method of FOL[J].Technology Supervision In Petroleum Industry,2012,28(7):29-31.
[4] Energistics.POSC E&P cataloguing reference standards[EB/OL].http://w3.energistics.org/epicat/epicat.shtml,2004-02-03.
[5] Library of Congress.Z39.50 profile for access to digital collections[EB/OL].http://www.loc.gov/z3950/agency/profiles/collections.htm,1996-05-03.
[6] Meg Sweet,David Thomas.Archives described at collection level[EB/OL].http://www.dlib.org/dlib/september00/sweet/09sweet.html,2000,6(9).
[7] 董晓媛,赵朝义,逢征虎,等.综合标准化工作指南(GB/T 12366-2009)[M].北京:中国标准出版社,2009.
Dong Xiaoyuan,Zhao Chaoyi,Peng Zhenghu,et al.Guideline for the work of complex standardization(GB/T 12366-2009)[M].Beijing:China Standards Press,2009.
[8] 李春田.现代标准化方法:综合标准化[J].中国标准导报,2011,7:4-7.
Li Chuntian.Modern standardization method:Complex standardization[J].China Standards Review,2011,7:4-7.
[9] 肖波,景帅,吴建军,等.基于模型驱动的中国石化企业数据中心模型架构[J].大庆石油学院学报,2012,36(1):78-82.
Xiao Bo,Jin Shuai,Wu Jianjun,et al.Architecture based on MDA of oilfield enterprise data center in SINOPEC[J].Journal of Daqing Peroleum Institute,2012,36(1):78-82.
[10] 王志宝.基于模型驱动的企业应用软件开发方法研究[D].大庆:大庆石油学院,2007.
Wang Zhibao.Research on the enterprise applied software development methods based on model driven[D].Daqing:Daqing Peroleum Institute,2007.
[11] Kleppe Anneke.MDA explained[M].Beijing:Posts&Telecom Press,2004:2-33.
[12] OMG.Documents associated with meta object facility(MOF)version 2.4.2[EB/OL].http://www.omg.org/spec/MOF/2.4.2/PDF/formal-14-04-03.pdf,2014-04-03.
[13] 文必龙,肖波,陈新荣.石油勘探开发数据元管理技术[J].大庆石油学院学报,2012,36(1):83-87.
Wen Bilong,Xiao Bo,Chen Xinrong.Research on management technology of petroleum explortion and production data element[J].Journal of Daqing Peroleum Institute,2012,36(1):83-87.
[14] 秦善华,史春波,邵庆.基于数据元的数据模型语义描述[J].大庆石油学院学报,2009,33(3):100-103.
Qin Shanhua,Shi Chunbo,Shao Qing.Based on the data elements to describe the semantic data model[J].Journal of Daqing Peroleum Institute,2009,33(3):100-103.
[15] Wen Bilong,Zhang Li.Defining semantics for data element with semantic tree[C].Proceedings of 2008 International Symposium on Information Science and Engineering.Shanghai,2008:524-527.
[16] 李剑峰,肖波,段鸿杰.中国石化油田企业数据中心总体框架设计[J].大庆石油学院学报,2012,36(1):73-77.
LI Jianfeng,XIAO Bo,Duan Hongjie.Design of architecture for oilfield enterprise data center in SINOPEC[J].Journal of Daqing Peroleum Institute,2012,36(1):73-77.
TP311
A
2095-4107(2014)04-0086-06
DOI 10.3969/j.issn.2095-4107.2014.04.013
2014-05-23;
刘丽丽
国家科技重大专项(2011ZX05023-005-012)
肖 波(1963-),男,博士,高级工程师,主要从事油田企业信息技术方面的研究.