APP下载

基于ArcGIS Engine的数据文件到Shapefile转换方法及其实现

2011-01-05李学渊李成尊

自然资源遥感 2011年3期
关键词:数据文件采矿权空间信息

李学渊,李成尊,赵 博

基于ArcGIS Engine的数据文件到Shapefile转换方法及其实现

李学渊1,李成尊2,赵 博1

(1.中国地质大学(北京),北京 100083;2.中国国土资源航空物探遥感中心,北京 100083)

地理数据的多源性导致存储格式的多样性,使其难以在同一GIS平台下实现互操作与空间分析,这有碍于信息的共享。为此,以ArcGIS为基础平台,采用ArcGIS Engine组件进行集成二次开发,通过对数据文件进行访问和空间参考的定义、空间与属性信息的转换来实现Excel型数据文件至Shapefile型矢量文件的转换,以初步实现地理信息间的共享与操作,进而给出了直观的、可视化的数据管理与表达。用此方法实现了山西省宁武县煤炭资源的采矿权文件之转换,即Access→Excel→Shapefile文件。结果表明,其不仅体现出了针对初始文件的降维性、无损性以及可视性的转换表达,还可将记录信息重组(分解)为空间信息与属性信息,对于前者,矿权图层可与遥感影像叠合成图;后者(矿种、开采方式等)可与前者实现无缝链接,并可据以获取相应的开发利用现状信息,以便开展资源遥感监测。

ArcEngine;Shapefile;数据文件;数据转换;空间信息;属性信息

0 引言

随着地理信息资源内容与种类的日益增多,地理数据呈现出“多源异构”的特点,从而导致常用的地理信息系统(GIS)软件无法读取有效信息的问题。例如,地理数据除纸质材料外,大部分是以数据文件(如.xls、.txt、.dbf、.mdb 等)与矢量文件形式储存,而前者并不能为GIS软件透明地获取所需信息。这样就有必要对具有多源性、不同格式的地理数据进行集成化,使之兼容于不同的GIS平台,以实现数据共享与互操作;再者,在异构分布数据库中获取所需信息,为用户提供决策性服务等亦显得尤为重要。

通常,相关研究仅涉及在不同的GIS平台下相应矢量文件间的转换与操作[1-5],但是,有关非矢量数据(如 Excel型数据文件)与矢量数据(如Shapefile)间的互相转换则鲜有述及。虽然,国内外主流GIS软件普遍具有强大的空间分析、查询及显示功能,但并不兼容以数据文件格式存储的地理信息,亦尚未配置相应的数据转换功能。目前,实现多源数据共享的方式大致有数据格式转换模式、数据互操作模式、直接数据访问模式和开放式数据库互接模式[6]等4种。为此,本文借助程序设计,开发出了Excel型数据文件到Shapefile文件的转换工具,以避免数字矢量化过程以及多次中间转换过程,具有一定的实用性。

1 数据格式简介

1.1 ArcGIS 数据

ArcGIS主要有 Shapefile、Coverage和 Geodatabase 3种数据存储格式。其中Shapefile是一种基于文件方式存储GIS矢量数据的文件格式,用于描述无拓扑结构数据的空间与属性特征,该文件格式至少包括坐标文件(.shp)、索引文件(.shx)和属性文件(.dbf)。

坐标文件由文件头和实体信息组成,实体信息包括记录头与记录内容(如表1所示)。实体信息以记录段为基本单位,每条记录段中可用一组或一系列坐标来描述点、线或面等实体的几何特征[7]。

表1 坐标文件组织结构Tab.1 Organization of the coordinate file

索引文件由文件头与定长记录组成,每条记录包括了坐标文件中对应记录的偏移量,并与坐标文件形成逻辑对应关系,通过索引文件可以直接定位几何实体的坐标信息。

属性文件为DBF文件,由头文件与实体信息组成。属性文件通过与坐标文件对应的记录索引顺序来储存相关的属性名称及相应的属性信息。

1.2 数据文件

数据文件主要是指文档文件(如.xls、.txt、.doc等)与数据库文件(如.dbf、.mdb 等)。通常,用于描述地理数据的Excel型数据文件(.xls)的结构如表2所示。

表2 数据文件(.xls)结构Tab.2 Organization of the data file(.xls)

2 数据转换

数据转换设计方案如下:

(1)通过链接和嵌入数据库接口,以访问Excel文件,并对其记录进行必要解析;

(2)根据需求,调用ArcGIS Engine类库中的相应接口,以获取文件中的空间(坐标)与属性数据,随之定义相应的空间参考系;

(3)进行空间与属性信息的转换,生成相应的Shapefile文件要素类(图1)。

图1 数据转换流程Fig.1 Process of data conversion

2.1 数据访问

对数据的访问贯穿于整个转换过程。这里,将存储于Excel文件中的记录作为源数据,通过访问函数来读取相应的坐标值(如经纬度)、属性名称及相应的属性信息,之后写入用于存储点结构类型的数组中,同时计算记录个数。

2.2 空间参考

空间参考是GIS数据的骨骼框架及数字模拟的基础,其包含地理数据的坐标系统及坐标精度,它通过定义数据集的地理坐标系统或投影坐标系统来对地理要素进行精准定位[8]。因此,没有任何空间参考的地理数据在转换过程中是毫无意义的。

ArcGIS Engine提供了一系列用于管理地理数据坐标系统的便捷工具,它既能调用不同的组件,以创建地理要素的空间参考系,亦可将WGS 84坐标系与北京54坐标系或西安80坐标系进行相互转换。这样,具有时序性、多维性、区域性特征的要素或要素数据集中的隐含信息即可显式表达,并可形成空间连续分布的综合信息,进而支持空间分析与决策处理。

2.3 空间信息转换

空间信息是指地理要素的空间分布特征,即地理实体的位置、形状、大小、空间关系及区域结构等,转换过程主要涉及点、线和面等几何类型实体的坐标信息(如经纬度坐标、北京54坐标系或西安80坐标系等),其对应的ESRI字段类型分别为esriGeometryPoint、esriGeometryPolyline 和 esriGeometryPolygon,以及据以定义的地理实体空间特征。这里,点(point)可用一组X、Y坐标来描述;线(polyline)由起始点和终结点构成;而面(polygon)则由组成多边形的点数和点组成[9]。因此,任何几何对象的创建都必须以点实体的产生为前提,本文旨在通过ArcGIS Engine提供的相关接口来读取点结构类型数组中的坐标信息,并写入 Shapefile坐标文件中,在用于存放要素数据集的工作空间中创建相应的Shapefile文件(图2)。

图2 空间信息转换Fig.2 Conversion of the spatial information

2.4 属性信息转换

属性信息是指除空间信息之外描述地理要素的属性特征数据,相应转换应以属性特征字段的创建为前提,并存储于Shapefile属性文件中。属性信息与空间信息的转换同步完成,共存于整个转换过程中。数据文件中的属性信息在Excel文件中是以记录方式进行存储,可通过特定的标识符与地理要素的空间信息建立关联。一般而言,同种要素数据集具有相同的属性字段,而属性信息则各具差异,故为了使创建的字段具有普适性,建议依据字段创建函数,以便遍历整个文件中的属性字段名。那么,通过Arc-GIS Engine提供的不同类型的接口和对象,即可读取文件中的字段名,并可对其Name属性与Type属性进行修改,然后再逐一读取数据文件中的属性信息,并向已创建字段中添加相应信息(图3)。

图3 属性信息转换Fig.3 Conversion of the attribute information

至此,通过对数据文件的访问、空间参考的定义以及空间与属性信息的转换,就将Excel型数据文件成功转换为Shapefile矢量文件,收到了预期效果。

3 应用实例

采矿权是指民事主体依法在取得采矿许可证规定范围内,开采矿产资源和获得所开采矿产品的权利。现以采矿权资料为例,探讨上述方法在矿产资源调查中的应用。

3.1 实验区概况

实验区位于山西省北部宁武县境内(地理坐标112°20'17″~ 112°26'45″E,38°59'35″~ 39°05'25″N),面积约为100 km2,区内煤炭(亦赋存少量铝土矿)资源丰富,储量可观、煤质优良、埋藏较浅,主要以地下开采方式为主。

本区煤炭资源开采规模较大、开采程度较高,是山西省地质灾害和矿山环境地质问题最为严重的地区之一。对此,有必要利用先进的“3S”技术来进行矿产资源开发利用状况和矿山环境的遥感监测,以便为维护矿业秩序和进行矿区环境综合整治提供依据。

3.2 应用与分析

上述信息如果全部以Access数据库的格式存储,则显然无法实现在ArcGIS平台下的信息直接共享,故而需先将其转换为Excel文件,文件中包含采矿点的区域坐标、采矿权许可证号、矿山名称、开采主矿种代号、开采方式、采矿权有效期限、有效期起止时间等多项内容。

在Excel文件中储存的信息,具有结构直观、易于操作、读写便捷等优点。然而,这种将空间信息(如区域坐标)与属性信息(如矿山名称)并行表达的信息存储与管理形式,在总体上,必然有损其可读性及可操作性。

另外,一系列不同的记录可组织起Excel文件的“多维”观测实体,这显然不利于对信息的各种直接提取、分析与操作。不管是客观上,还是主观上都要求一种能够体现出降维性、无损性、替代性的可视化表达。因此,将其兼容于ArcGIS提供的空间操作平台中是极其必要的。

如图4所示,除在界面上直观显示的平面图层(二维)以外,每个图斑亦有相应的属性信息(一维)与之对应。这样,即将Excel文件中的“多维(记录信息)”观测对象转换为空间上的“三维(空间-属性信息)”表达,显然具有较强的实用价值。

图4 采矿权Shapefile及其属性Fig.4 Shapefile of exploitation right and its attribute

在ArcGIS平台下的采矿权Shapefile文件与Excel型的采矿权资料格式不同,在Shapefile文件中存储的矿权信息实质上是针对Excel文件中各条记录进行空间上的有序重组,从而使得几何实体(空间信息)-记录(属性信息)间的无缝(无损耗与冗余)链接得以实现。另外,以最新时相的IKONOS遥感影像为底图,叠置上述采矿权Shapefile文件(如图5所示)。这样,实验区内有关矿产资源的分布状况便一目了然。

图5 采矿权与影像叠加显示Fig.5 Superposition display of the exploitation right and remote sensing image

依据采矿权Shapefile文件的属性信息(如开采矿种、开采方式等),采用人机交互方法提取实验区内矿业活动图斑或矿业活动点的信息,即可得到矿山开采状况与开发占地信息,提取结果如表3所示。

表3 矿山开采状况信息提取Tab.3 Information extraction of the exploitation present

4 结论

受制于数据格式的差异,致使某些描述地理信息的数据文件无法在ArcGIS平台下实现兼容操作。本文在理论与转换技术层面进行了初步探讨,旨在建立数据文件(Excel型)与矢量结构文件(Shapefile型)在信息上的重组(记录文件→属性信息+空间信息)以及相关的空间分析,具有一定的实用价值。在ArcGIS平台下,基于AE组件集,利用C#语言,通过实现Excel到Shapefile文件的数据访问、空间参考定义、空间信息与属性信息转换,实现了多源异构地理数据的共享。

采用本文方法,即可将Access(Excel)型采矿权登记资料转换为Shapefile型采矿权文件,其可为矿产资源调查提供基础地理数据,以便适时获取客观数据,并形成综合分析与评价报告。其中包括实现了采矿权文件与遥感影像之叠合成图,及其与属性信息(矿种、开采方式等)间的无缝链接,获得了预期的实验效果。

存在的问题主要为:一方面,在转换模型与系统功能上还需进一步完善,如扩充对图形的编辑和制图功能,添加地图符号、线型选择、图斑填充和字体库等;另一方面,随着互联网技术的快速发展,有必要开发出基于WebGIS的多来源、多格式数据转换系统,以便可通过对象管理、中件与插件等技术与非GIS系统集成,为实现海量数据的共享和系统服务面的扩大提供优越的方法与途径。

[1] 任东风,徐立军,才 艺.CAD到ArcGIS数据转换问题[J].辽宁工程技术大学学报(自然科学版),2010,29(增刊1):25-27.

[2] 彭晶晶.MapGIS数据向ArcGIS转换研究[D].北京:中国地质科学研究院,2008.

[3] 黄 云.MapGIS向ArcGIS数据格式转换方法探讨[J].地矿测绘,2010,26(1):33 -35.

[4] 刘祥磊,马 静.基于ArcEngine的ArcGIS矢量数据到KML文件转换方法研究[J].国土资源遥感,2007(3):98-101.

[5] 孔 毅,张志强,赵崇亮.基于 ArcGIS的CAD数据入库研究[J].测绘通报,2010(5):54 -56.

[6] 詹发新,付海波,苟浩远.GIS地理空间数据共享的探讨[J].北京测绘,2005(5):11-14.

[7] ESRI.ESRI Shapefile Technical Description[M].RedLand CA,United States of America:Environmental Systems Research Institute,1998:2-5.

[8] 杜清运.空间信息的结构、表达及其理解机制[J].武汉测绘科技大学学报,1998,23(4):388 -393.

[9] 宋艳敏,陈东银.基于ArcEngine与OGR库的Shapefile文件到KML格式转换方法研究[J].国土资源遥感,2009(2):110-113.

The Method for Transformation from the Data File Based on ArcGIS Engine to the Shapefile

LI Xue-yuan1,LI Cheng-zun2,ZHAO Bo1
(1.China University of Geosciences(Beijing),Beijing 100083,China;2.China Aero Geophysical Survey and Remote Sensing Center for Land and Resources,Beijing 100083,China)

The multisource geographical data may correspond to the diversity of storage formats and,as a result,the storage formats fail to carry out relevant interoperation and spatial analysis,which hinders the information sharing.The authors have hence developed a model for transformation from the Excel data file to Shapefile vector files by virtue of a secondary development based on the ArcGIS Engine modules,which include file access,defining the spatial reference,transformation of spatial and attribute information.As a more visualized expression,this data management method has preliminarily filled the gap between various geographical data and provided the sharing or operating.At the same time,the exploitation right file transformation from Access to Excel and then to Shapefile formats has realized,which is also a transformed expression with the nature of non - destruction,dimensional reduction and visuality in comparison with that of the original files.The essence of this method lies in resolving the information as the record format into the spatial and attribute format.The former format means the superposition of exploitation layer and corresponding remote sensing image,and seamless connection exists between the latter(like mineral species,mining pattern etc.)and the former.On such a basis,the exploitation information of the present situation can be obtained,and the remote sensing monitoring of mineral resources can be carried out.

ArcEngine;Shapefile;Data file;Data conversion;Spatial information;Attribute information

P 208

A

1001-070X(2011)03-0156-05

2010-12-13;

2011-02-04

李学渊(1984-),男,在读硕士研究生,主要从事遥感与地理信息系统方面的研究。

(责任编辑:丁 群)

猜你喜欢

数据文件采矿权空间信息
江西规范采矿权深部或上部矿业权协议出让
结合多层特征及空间信息蒸馏的医学影像分割
水泥企业石灰岩矿山采矿权纠纷解决思路
基于表空间和数据文件探讨MIS中数据库架构设计
数据文件安全管控技术的研究与实现
山西省探矿权采矿权征收的现状及建议
基于时效网络的空间信息网络结构脆弱性分析方法研究
浙江省采矿权市场建设的回顾与思考
基于系统动力学的网络空间信息防御体系能力分析*
《国家空间信息基础设施建设与应用“十二五”规划》正式印发