基于众包的钻井不确定数据信息管理系统的研究
2017-08-12王凡方明
王 凡 方 明
(西安石油大学计算机学院 陕西 西安 710065)
基于众包的钻井不确定数据信息管理系统的研究
王 凡 方 明
(西安石油大学计算机学院 陕西 西安 710065)
石油钻井工程中,由于客观和人为因素导致钻井工程数据中存在着不确定性,且关系型数据库传统精确匹配式查询难以处理,以致石油钻井工程管理和决策分析不能及时获取有效信息。提出采用网络众包的理论和方法,结合传统数据库查询方式和众包方式,研究构建基于众包的钻井不确定数据信息管理系统,设计给出相关系统的总体结构和众包模式,有效扩展以往管理信息系统的数据处理能力,为在不确定环境下钻井决策分析提供有力支持。
钻井工程 众包 不确定数据 管理信息系统
0 引 言
油气钻井工程中存在大量的数据信息,由于钻井工程对象的油气藏结构复杂、深埋地下,存在着难于获取、信息不完整、与实际存在偏差等问题。使钻井工程数据存在着不确定性,给钻井工程数据管理和决策分析带来难题,影响了钻井作业的效益和成败[1]。以往主要是通过查询借鉴其他钻井企业相应数据信息来弥补和完善相关不确定的数据信息,但由于缺乏统一的信息标准和开发规范,各石油钻井企业往往根据自身需求,分别设计、开发和采用相关的信息管理系统,导致不同企业钻井数据信息存在着不一致性。若采用关系型数据库传统的查询处理方式,会造成无法匹配或返回一个错误的应答。本文采用网络众包的理论和方法,将传统方式和众包方式相结合,提出一种基于众包的油气钻井不确定数据信息处理方法,设计构建相关系统的总体结构和众包模式,以有效扩展以往系统的不确定信息处理能力。
1 基于众包的钻井不确定数据信息管理系统的体系结构
在石油钻井工程管理和决策过程中,需要能有效地对钻井数据信息进行查询、管理和利用。然而,由于客观及人为等因素,钻井工程数据中存在着缺失、不完整、不一致和人为差错等不确定性,且传统关系型数据库查询也多为精确匹配,使石油钻井工程管理和决策不能及时获取有效信息。因此,需要在传统数据信息处理方式的基础上,引入人力资源,借助人的判断来处理相关的不确定信息。众包是由Howe于2006年首次正式提出[ 2],它是指一个公司或机构把过去由员工或者承包商执行的工作任务,以自由自愿的形式,外包给非特定的大众网络或虚拟社区的作法,是一种在线、分布式问题解决模式。
基于众包的钻井不确定数据信息管理系统DUDMSC(Drilling Uncertainty Data Management System based on Crowdsourcing)将传统数据信息处理方式和众包方式相结合,在对钻井数据信息进行查询、管理和利用过程中,当传统数据信息处理方式无效时,系统采用众包模式,将相关信息处理事务通过众包平台发布,借助网络人力资源对不确定的数据信息进行处理。为此,设计构建基于众包的钻井不确定数据信息管理系统的体系结构如图1所示。系统由客户端和服务器端组成,服务器端由管理控制层、计算机处理层和众包处理层组成。客户端主要支持本地钻井企业常规确定性数据信息的查询、管理和利用,对不确定数据信息由客户端提交服务器端,服务器端的管理控制层通过语言处理平台读取数据字典,检查是否存在该关系及相应的字段,该用户能否读取它们等,若存在所查询字段,则由数据处理管理平台提交计算机处理层进行传统方式的查询,否则提交众包处理层,借助人力资源参与处理。
图1 基于众包的钻井不确定数据信息管理系统体系结构图
在众包处理层中,众包管理平台是实现众包过程的核心,负责众包系统的发包、接包、评价、质量控制、众包数据库(元数据、中间数据库)的管理等;众包组织和用户管理平台是对众包接包方的选择和管理;人机用户接口平台包含用户界面设计、表格编辑器、UI模板管理器,负责创建、管理和编辑用户界面模板,支持众包人员以友好界面便于参与众包业务。在管理控制层中,数据处理管理平台主要是对不确定数据信息处理业务的分配、调度和反馈等;类SQL语言处理平台包含解析器和优化器,主要负责对数据库语言进行语法分析、语义检查、完整性检查、查询优化等。
2 DUDMSC系统众包管理平台的总体结构
DUDMSC系统总体结构中的众包管理平台是支撑基于众包的钻井不确定数据信息管理的关键。众包系统一般由发包方、众包引擎和接包方三部分组成[3],DUDMSC系统众包管理平台设计由数据处理任务管理器、众包引擎和众包数据处理执行器三部分组成。在该平台中,为改变以往人员参与和数据使用的被动性,拟采用多Agent技术,将平台各组成部分构造成Agent,以多Agent协作组织和工作方式实现相应的众包数据处理模式。智能体(Agent)是一个具有感知能力、问题求解能力和与外界进行通信能力的一个实体,作为具有自主特性的一种抽象实体,它能作用于自身和环境,并能对环境作出反应[4]。该平台的体系结构如图2所示。
图2 DUDMSC系统众包管理平台总体结构图
数据处理任务管理器是支持钻井作业方(发包方)对需要完成的不确定数据处理任务进行发布、处理结论的评价和质量控制等。通过发包方任务描述Agent对任务进行形式化的描述,任务发布Agent将任务和接包方信息发布到众包引擎中的黑板、白板系统中,接包方管理Agent则对所确定的接包方进行管理。结论评价Agent和质量控制Agent对接包方提供的结果进行审核评估,并进行相应的众包决策质量评价与控制。
众包引擎是该平台的核心。通过Agent黑板、白板系统获取发包方对数据处理任务、预期结果、期限、质量参数和奖励政策等的形式化描述,由任务分解Agent将复杂任务分解为多个子任务,并由子任务发布Agent通过黑板、白板系统在网上发布,再由接包方选择Agent支持接包方主动参与任务的外包服务。由结果接收Agent接收各接包方子任务结果,结果评价Agent对完成结果进行评价,结果综合Agent对各子任务完成结果进行综合集成。通过对各接包方结果的评价和集成,将结果存储到众包数据库中,并通过Agent黑板、白板系统反馈给发包方,同时构建相应的元数据文件,以支持对语法、语义不一致数据信息的处理。交互管理Agent则支持所确定的接包方之间相互交互沟通联系和知识经验的借鉴共享。
众包数据处理执行器是支持接包方人员自主参与众包数据处理工作,完成相应的子任务外包服务。通过接包方感知Agent主动发现发包方各子任务,由任务投标Agent以接包方知识能力、兴趣偏好等构造其投标策略,结果生成Agent形成接包方子任务处理结果,并由结果提交Agent提交到众包引擎中的黑板、白板中。在整个接包方任务执行过程中,接包方人员通过用户接口Agent的实例化用户界面与系统进行人机对话。
3 DUDMSC系统众包SQL语言的设计
在DUDMSC系统中,为明确对数据库进行众包操作,在传统SQL语言基础上,参考有关方法进行了扩展[5-7],设计了类SQL 语句的众包SQL语句(C_SQL),C_SQL的语法结构与SQL基本相同。根据钻井工程不确定数据处理的需要,在DUDMSC系统中,设定两种需要众包的情形。一种是对钻井数据信息表中某些字段数据不确定的众包,另一种是对钻井某个数据信息表的内容整体众包。
当需要对钻井数据信息表中某些字段数据进行众包时,如石油钻井物料种类和规格型号繁多,且与井深、地质结构等密切相关,不易选择,产生不确定信息。对此,在定义相关钻井物料数据库表时,通过引入crowd属性类型,将需要众包的字段定义为crowd类型,见例1。在系统运行过程中,通过系统语言处理平台解析,就可对crowd类型字段采用众包方式获得相关数据信息。
1.2.3 统计学分析。采用SPSS 17.0软件进行统计分析,服从正态分布的计量资料,以(x-±s)表示进行描述,采用两独立样本t检验分析组间差异,P<0.05为差异有统计学意义。
例1:石油钻井物料数据库表规格型号众包的定义
Create table Drilling_ Material
{
Material_Id int primary key,
Material_Name varchar(50),
Material_Type crowd varchar(20),
Material_Price varchar(20),
……
};
当需要对钻井某个数据信息表的内容整体众包时,如石油钻具组合设计随着钻井勘探的深入、钻井作业面的偏远荒芜和地质条件的复杂等,其所面临的环境越来越困难,钻具组合设计所涉及到的因素和限制条件较多,为提高设计的效率、可靠性和适应性,需要利用分布在不同地区的众多设计人员的知识、经验进行众包设计[8-9]。对此,在定义相关钻具组合数据库表时,通过引入crowd关键字,将需要众包的数据库表定义为crowd类型,见例2。在系统运行过程中,通过系统语言处理平台解析,就可对crowd类型数据库表采用众包方式获得相关数据信息。
例2:石油钻井钻具组合数据库表众包的定义。
Create crowd table ODBOM
{
Well_Id int primary key,
P_id varchar(8),
P_name varchar(20),
Ch_id varchar(8),
Ch_name varchar(20),
quantity int(3),
Layer varchar(3),
……
};
为了表示众包列中还没有获得的值,在C_SQL语言中扩展了SQL语言中的NULL为CNULL,其含义与NULL相同。
4 结 语
基于众包的钻井不确定数据信息管理系统采用众包方式,利用的是丰富的外部人力资源和智慧,实现了对钻井不确定数据信息的处理,解决了由于信息不完整、不一致所导致的传统信息系统对于某些查询操作返回错误应答的问题,使传统管理信息系统从单一、非开放式、内部小闭环的系统,转变为多元、更开放、跨部门的系统,进一步拓展了以往管理信息系统的数据处理能力,为在不确定环境下钻井决策分析提供了有力的支持。
[1] 刘本勇.石油钻井工程项目管理[M].北京:中国石化出版社,2015.
[2] Howe J.The rise of crowdsourcing[J].Wired Magazing,2006,14(6):176-183.
[3] 冯剑红,李国良,冯建华.众包技术研究综述[J].计算机学报,2014,37(106):1-16.
[4] 刘海燕.多agent系统的研究[J].计算机科学,1995,22(2):57-61.
[5] Franklin M J,Kossmann D,Kraska T,et al.CrowdDB:answering queries with crowdsourcing[C]//ACM SIGMOD International Conference on Management of Data.ACM,2011:61-72.
[6] Feng A,Franklin M J,Kossmann D,et al.CrowdDB:Query Processing with the VLDB Crowd[J].Proceeding of the VLDB Endowment,2011,12(4):1387-1390.
[7] Trushkowsky B,Kraska T,Franklin M J.A Framework for Adaptive Crowd Query Processing[C]//AAAI,2013.
[8] 方明,李润洲,王魁生.石油钻井物料清单的构造方法与系统实现[J].计算机工程与设计,2010,31(8):1844-1847.
[9] 李润洲,方明,张留美.石油钻井物料清单结构设计及一致性维护研究[J].软件导刊,2014,13(12):36-38.
THESTUDYONDRILLINGUNCERTAINTYDATAMANAGEMENTSYSTEMBASEDONCROWDSOURCING
Wang Fan Fang Ming
(InstituteofComputer,Xi’anShiyouUniversity,Xi’an710065,Shaanxi,China)
During the oil drilling engineering, due to objective reasons and man-made factors, there are uncertainties in the drilling engineering data and difficulties in the traditional exact matching query of relational database, and the oil drilling engineering management and decision analysis cannot be timely access the effective information. Our solution to this problem is to propose the theory and method of the network crowdsourcing. Combined with the method of traditional database query and crowdsourcing, it is studied and constructed the drilling uncertainty data management system, and designed the overall structure of the system and crowdsourcing model, which extended the previous management information system data processing ability. Our approach provides a powerful support for the drilling decision analysis in the uncertain environment.
Drilling engineering Crowdsourcing Uncertainty data Management information system
2016-09-01。王凡,硕士生,主研领域:管理信息系统,计算机网络。方明,教授。
TP3
A
10.3969/j.issn.1000-386x.2017.08.010