油田地理信息和勘探开发数据解析及标准化
2016-12-28彭佳琦王海起董倩楠
彭佳琦,王海起,朱 锦,董倩楠,车 磊
(1.中国石油大学(华东)地球科学与技术学院,山东 青岛 266580;2.中油国际(阿联酋)公司,阿联酋 阿布扎比 93785)
油田地理信息和勘探开发数据解析及标准化
彭佳琦1,王海起1,朱 锦2,董倩楠1,车 磊1
(1.中国石油大学(华东)地球科学与技术学院,山东 青岛 266580;2.中油国际(阿联酋)公司,阿联酋 阿布扎比 93785)
建立油田公司地理信息数据库并创建空间数据模型,通常需要解决新老数据空间基准不一致和原始纸质、文本文件或其他格式数据与面向对象的数据模型格式不兼容两方面问题。以阿联酋地区的油气田为研究对象,分析确定了区域空间参考系统,对油田多源数据结构进行了分类、解析和归化,并对空间数据模型进行了分类总结,为建立油田地理信息数据库奠定了数据基础。
数据库;数据模型;数据解析;数据标准化;数据管理
1 数据分类和归化
该研究区数据源于不同公司在不同年代产生的多种数据资料,存在数据格式不统一,类型多样化、空间参考信息和基准转换参数不相同或空间参考信息丢失等情况。
1.1 数据分类
为了便于数据的解析和归化,首先需要把搜集到的数据信息分类列表,归纳为地震采集数据、处理解释数据、油田和井位数据、陆地地理信息数据、海上地理信息数据、模型数据6大类,其中包括测量控制点、水系、居民地、交通、油气管线、各种边界、地形和油田设施等所有地面地理信息,以及二维和三维地震采集数据、油井录井数据、油藏构造等油田勘探开发数据和地下信息,具体分类如表1。可见,数据资料包含的格式主要有text、shapefile、dwg、矢量数据模型、栅格数据模型和纸质文件。其中shapefile文件可直接被地理信息数据库识别和使用,其他格式的文件需进行解析及归化才能录入数据库。
表1 油田多源数据分类
1.2 数据归化
针对需要解析、归化、规范、内插和转换的数据,本文制定了标准化改造流程,如图1所示。
2 数据解析
2.1 基准转换
Nahawan 1967是适合中东地区的区域基准,也是本研究很多数据的应用基准。由于卫星定位技术的应用和发展,最近十几年开发和应用的WGS84基准定义了能与地球完美吻合的椭球,且坐标系原点位于地球质心(中心),目前被世界各地包括中东地区广泛引用。
图1 数据分类、解析、规范和和建模流程图
由于各公司技术要求和工作区域地理位置均不同,因此递交的数据资料是基于不同基准和基准转换参数的,这会造成相邻数据重叠区地理信息不匹配,影响施工生产和勘探开发设计。对于基准不同问题,本文的解决方案是确认原始数据应用的基准和基准转换参数,把所有空间数据都转换到WGS84(ITRF 2000.0)基准面上,这样在保证地理信息数据准确性的同时,也保证了其共享性,能够和阿联酋境内的其他公司以及市政部门应用的基准保持一致。
根据不同公司不同年代或不同地域应用的基准,本文整理计算了基准转换参数表,如表2所示。如果原始数据保存有WGS84(ITRF2000.00)坐标数据,则不转换;如果原始数据没有保留WGS84基准下的坐标数据或根本不是通过WGS84转换过来的数据,将根据相应的基准转换参数转换到WGS84(ITRF 2000.0)基准面上。
2.2 纸质文件数字化及地理配准
原始资料中大多数地形图和海图以纸质形式存在,扫描到电脑后,需要对其进行地理配准和数字化处理,使有用信息能够录入到地理信息数据库中。具体的处理流程如图2所示。
图2 纸质资料数字化入库流程图
地理配准是地图扫描和矢量化至关重要的环节,其精度直接影响后期矢量化的精度,从而影响数据应用的正确性[5]。应用ArcGIS提供的创建数据、数据集合程序、拓扑和高级编辑4种工具实现地形图和海图的数字化。首先对地形图和海图进行地理定位,选取栅格图像控制点进行坐标匹配和几何校正[6],赋予空间参考信息和地理坐标;再创建数据文件或数据模型;最后通过编辑几何图形和属性表完成地形图和海图的数字化工作,获取地理信息。
2.3 补充空间参考信息
矢量数据在应用和存储过程中也有丢失空间参考信息的可能,这些数据可以用ArcCatalog重新赋值。栅格数据的配准改变了原来的坐标属性并赋予了空间参考,而矢量数据重新配置空间参考信息只是找回丢失了的空间参考信息,并没有改变矢量数据原有的几何文件和几何属性,如图3所示。
图3 栅格数据地理配准原理
表2 基准转换参数表
2.4 数据格式转换
早期的油田数据多为text文本格式或CAD软件产生的dwg格式,如井位等坐标数据,多以text文本格式存在;路网、建筑等测绘信息,多以dwg格式存在。为了统一标准和规范油田原始数据,使其能够被地理信息数据库所使用,需要对这些数据进行转换。
1) text文件的转换。对于text文件(ASCII码文本)坐标数据,可以应用ArcMap实现数据的转换,相当于批量导入X、Y坐标,可将其导出为shapefile文件或其他需求的数据格式。通过编辑功能设置其属性信息,并在ArcCatalog编辑元数据信息,完成数据文件的转换,需注意的是在导入过程中要配置空间参考。
2)CAD文件的转换。CAD数据也是目前建立地理信息数据库较多的数据源,在ArcGIS流行之前的测量绘图、土木工程、工业设计都是由CAD相关产品完成的,因此产生了大量的不同版本不同数据格式的dwg或dxf文件。虽然ArcGIS能够识别和应用,但由于其坐标系概念及数据存在的形式与本文建立的地理信息数据库的标准化要求有差异,所以需要把CAD数据看作原始数据,做必要的归化和处理,转换成标准的栅格或矢量数据模型。
基于GIS系统的空间参考坐标系与CAD数据的坐标系有根本区别,CAD只是针对实际物体建立模型,使用固定坐标系定位数据的2D和3D笛卡尔右手坐标系,其X、Y、Z坐标是相对于某一个几何原点(0,0,0)的位置,且X指向东,Y指向北,通常情况下其坐标系的存在形式不能做到直角坐标和大地坐标或不同基准之间的正确转换,其坐标概念不是地理意义上的坐标系。本文是基于地理信息系统和地球信息科学理论,研究的是地球及地球上所有地物的数据模型,某一独立个体针对特定坐标系具有唯一性,所以需对CAD文件进行转换和空间参考信息改造。
CAD数据文件转换为地理数据库数据模型,可以在读取CAD数据集的同时创建相应的新的工程图要素数据集,并配置空间坐标参考信息。本文应用ArcMap模块CAD到地理数据库转换工具实现CAD文件的转换。
2.5 高程数据插值
本文研究区域地震采集资料比较久远,最早可追溯到1969年的二维资料,在对这些资料的分析过程中发现,测量数据大多是常规测量资料,由于当时技术原因,部分物理点高程未实测或因存储设备问题造成部分高程数据丢失,对目前高精度的地震资料处理精度影响较大。由于年代久远,如果再次通过野外测量或卫星影像拾取高程数据,获取的数据并不一定是当时高程的真实体现,因此通过当时区域内的高程数据,建立高程模型,在相关点位提取出当时相应物理点的高程数值并为高程缺失的物理点赋值,才是比较科学和合理的方法。
本文选取了不规则三角网(TIN)、反距离权重法、克里金插值法和样条函数插值法进行了对比分析。
通过高程拟合插值方法,本文针对研究区进行了局部地震采集数据23 377 个物理点的实例计算,建立25 m分辨率的高程模型。通过ArcGIS提供的数据分析提取工具为各个物理点赋值高程数据,得到高程精度统计分析结果如表3。可以看出,TIN方法存在较多点提取不出高程,而其他3种情况相差不大,相比之下,反距离权重法效果更好一些。
表3 精度统计分析表
对误差大的点作进一步分析,通过作等值线检查误差大于1 m物理点分布情况,等高线和误差较大的点位分布如图4所示。对比发现,两种方法误差较大的点多数分布在等值线变化较大或坡度变化较大的区域。图4a的显著特征是误差大或提取不出高程的位置基本都在TIN的边缘地区,可通过边缘裁剪或用其他方法建立的高程模型进行拟合来弥补。
图4 点位精度分布对比分析图
虽然表3中的数据显示反距离权重法结果最好,但从图4误差较大点的分布情况来看,对于研究区域,反距离权重法并不适合,每一种内插拟合方法都有其针对性和优缺点。油田地震采集数据物理点具有分布较均匀、地形起伏不大、距离和方向差异不大的特点,样条法可以通过每一个取样点,综合考虑,使用样条法对本地区数据高程缺失的点进行拟合更加合理。
3 空间数据模型分类和创建
根据地理信息数据库的建设和数据库管理的需要,经过数据解析、归化和转换后的数据模型将会以多种格式、种类、层级存在于不同的地理数据库中,本文对矢量数据、栅格数据和属性数据三大类空间地理数据模型进行了归纳和分类。
通常情况下,矢量数据模型主要是shapefile、地理关系模型Coverage和地理对象关系模型Geodatabase;栅格数据模型主要是tiff、jpeg、DEM等文件;属性数据主要为属性表,包括Access、dBase、Oracle等。图5为各种空间数据模型的全貌图。
图5 地理数据模型全貌图
shapefile、Coverage和Geodatabase是矢量数据模型发展3个阶段的代表产品[7](以ESRI公司产品为例),shapefile是ESRI公司推出的没有拓扑结构的第一代矢量数据模型,是一种由若干个文件组成、空间信息和属性信息分开存储的非关系型数据模型;Coverage是第二代矢量数据模型,是一种以文件夹形式存在的地理关系混合数据模型;Geodatabase是第三代矢量数据模型,是一种将空间对象的属性和行为结合起来的面向对象的智能化地理对象关系数据模型,通常也称作地理数据库,是为了更好地管理和使用地理要素,按照一定的数据模型和规则组合起来的存储空间数据和属性数据的数据库系统[8]。
shapefile、Coverage、Geodatabase的创建、编辑、修改、删除、重命名和转移等活动均可通过ArcCatalog或ArcTools来实现。在用ArcMap模块对其修改时,ArcCatalog将自动修复相应文件保证其完整性。
4 结 语
地理信息数据库是建设数字油田的基础,而在石油勘探开发和生产过程中产生的地震、地质和解释图件数据存在复杂性、多源性和数据量大的特点,本文基于ArcGIS平台,阐述了数据资料的整理、分类及标准化过程;具体介绍了基准转换、纸质文件地理配准及数字化、不同文件格式的转换、高程数据拟合方法和创建数据模型的方法,为油田公司建立地理信息数据库和创建数据库模型提供了具体解决方案。
[1] 刘颖, 李树军. GIS数据库与普通地理数据库[J].海洋测绘, 2001(3)∶52-54
[2] 梁世友.油气勘探项目信息系统的分析与设计[J]. 地理空间信息, 2009,7(3)∶56-58
[3] 万剑华,陶为翔.现代测绘技术在油气田生产与管理中的应用[J].测绘与空间地理信息,2007,30(6)∶9-11
[4] 胡玲.城市规划管理信息系统设计与实现[D].成都∶电子科技大学, 2006
[5] 李晶,王耀强,包亮,等.运用ArcGIS9.0 ArcMap进行内蒙古地质图栅格数据矢量化[J].中国科技信息,2010(9)∶118-119
[6] 李峥.基于ArcEngine的栅格数据批量配准、坐标系转换及裁切功能的研发[J].林业勘察设计,2011(2)∶58-63
[7] 张佐帮,尚颖娟.基于Geodatabase的面向对象空间数据库设计[J].地理空间信息,2005,3(2)∶33-35
[8] 张耀波,张迁.基于Geodatabase海量地理信息数据的组织与管理[J].地理空间信息,2011,9(3)∶44-46
P208
B
1672-4623(2016)09-0019-04
10.3969/j.issn.1672-4623.2016.09.006在现代化工业大生产背景下,油田公司的管理早已从传统的召开会议制定解决方案、下达文件、决策执行向即时获取信息、自动化科学决策和快速反应方向发展。建立油气田地理数据库是油田数字化和智能化的基础,也是有效应用空间数据和属性数据进行分析、模拟和决策的依据[1]。石油勘探成果多以纸质形式保存,也存在一些计算机资料处理系统,但这些系统相对独立,存在“信息孤岛”现象,现有的管理方式不利于资料共享与利用[2]。数据资料存在空间基准不一致,以及纸质、文本文件或其他格式数据与面向对象的数据模型不兼容问题,因此在建立地理信息数据库前,需将数据资料进行分类、解析和归化,筛选出正确的数据信息,改正错误的数据资料,且要对数据结构和模型进行标准化改造[3-4]。本文以阿联酋地区油气田为例,论述了油气田地理信息数据资料的整理分类、解析、归化及空间数据模型的创建方法。
彭佳琦,硕士研究生,研究方向为数字油田。
2016-01-05。
项目来源:国家自然科学基金资助项目(41471322);山东省自然科学基金资助项目(ZR2012DM010)。