测绘成果数据库的设计与入库
2010-06-12王式太徐丹丹
殷 敏 王式太 徐丹丹
随着全球定位系统、遥感等测绘技术的不断进步,测绘工作者已能够快速高效地获取空间数据,而日益快速增长的空间数据也给测绘工作者带来了新的问题:在测绘成果管理过程中,往往会出现资料类型多样、版本不一的状况,使得资料共享困难,工作重复进行,从而造成人力物力的极大浪费。如何建立基于统一标准的测绘成果数据库、加快和加强与各相关部门数据的共建共享,如何把空间数据与属性数据有机地结合起来,实现不同格式的地理信息数据的入库,都是测绘成果数据建库过程中应该关注并不断完善和解决的问题。
1 数据类型
根据服务对象和内容,测绘可以分为基础测绘、专业测绘、军事测绘、地籍测绘、工程测量、海洋大地测量等。综合各类测绘的成果数据,其涵盖了图形、表格、文档等形式。其中,图形类数据主要包括4D产品(数字线划图(Digital Line Graphie,缩写DLG)、数字正射影像图(Digital Orthophoto Map,缩写 DOM),数字栅格地图(Digital Raster Graphie,缩写DRG)和数字高程模型(Digital Elevation Model,缩写 DEM))、图像数据(.bmp,.jpg,.tif等格式);表格类数据主要包括测量点位数据、属性信息、报表数据等;文档数据主要包括数据更改历史文件、成果报告等。此外,还有其他相关电子资料[1-3]。
2 数据库设计
根据测绘成果数据类型,将测绘成果数据库分为空间数据库、图像数据库、属性数据库和元数据库。
2.1 空间数据库
空间数据库主要存储各种比例尺的数字地图,即4D产品。根据空间数据位置信息记录方式的不同,可将4D产品划归为两大类:一类是采用空间点位的坐标数据记录空间数据的位置信息,即矢量数据模型,如数字线划图DLG;另一类是采用规则格网数据记录空间数据的位置信息,即栅格数据模型,如数字栅格图DRG、数字正射影像图DOM和数字高程模型DEM。
2.1.1 矢量数据的组织方式
矢量数据的组织方式可分为基于图幅的组织和基于要素的组织两种方式。基于图幅组织方法遵循数据分类分层的原则,把具有相同实体意义和空间特征的同类图形要素存放在同一个图层,对于跨图幅要素物理上不进行任何处理。基于要素的组织方法在空间地理数据入库时将跨图幅要素合并为一个要素。该方法严格保持了地物的完整性、连续性和一致性。
根据测绘成果数据管理和应用的需求,本文采用后一种管理方式对数字线划数据进行组织。即入库前先将同一个比例尺同一分带中的数字线划分幅数据进行拼接处理。首先,依据数字线划图的比例尺分类;其次,再按地形实体的大类进行逻辑分层,每一个逻辑层就是一个要素集。
2.1.2 栅格数据的组织方式
栅格数据(DOM,DRG,DEM)按照Geodatabase数据模型中的栅格数据集(Raster Dataset)进行组织和存储。
为了加快栅格数据的显示速度和网上传输速度,栅格数据采用金字塔的存储方式存储数据,即分级分块的存储策略。对于较小比例尺显示时只显示上级的粗略的栅格信息,而当放大到较大比例尺时,把下一级较详细的信息显示出来。可用不同的方法构建金字塔,相邻采样法用于名义数据或者彩色地图类(宗地数据、扫描地图、伪彩色影像)的栅格数据;双线性采样法和立方采样法用于卫星影像和航空影像等连续数据。构建数据金字塔是在服务器端完成的。数据如果被压缩,服务器首先解压缩数据,然后构建数据金字塔,最后再次压缩并将该数据插入栅格数据块表。
2.2 图像数据库
图像数据库用于存储和管理测绘成果相关的图像信息。为了节约数据库的存储空间,在存储过程中,将图像数据进行压缩,表示成二进制文件,提取时再将相应的文件进行解压释放。其数据结构表见表1。
表1 图像数据库结构表
2.3 属性数据库
根据空间实体的特征建立相应的属性表结构,如表2所示为行政区划属性结构表。
表2 行政区划属性结构表
2.4 元数据库
测绘成果元数据库用于记录测绘成果数据和信息的描述性信息,它包括测绘成果数据的内容、质量、继承关系、数据组织、参考系、发行信息、参考信息等,如表3所示。
表3 图像数据元数据结构表
3 ArcSDE数据加载
3.1 矢量数据的加载
矢量数据的加载通常使用两种方法:1)使用ArcCatalog或ArcToolbox中的Shapefile(covera-ge等)to Geodatabse;2)直接使用命令行shp2sde(cov2sde)。前者操作简单,后者可实现批处理[4]。
加载中的参数问题:
1)精度问题(Precision)。ArcSDE是采用正整数坐标来存储空间数据(32位,但坐标的最大值为231)。把连续的矢量数据存储在这些小网格里面,但会出现变形。ArcSDE采用的解决方法是在存储前对矢量数据进行放大。随着放大比例的增加,变形会缩小。
2)偏移问题(ShiftX,ShiftY)。数据如何存储在ArcSDE存储空间里面也是很有讲究的。一般情况下数据的空间范围是会变化的,比如随着城市范围的不断扩大,数据也随着扩大。这样在加载数据时就要慎重考虑。ArcSDE推荐是将数据的中心放到ArcSDE坐标空间中心点进行存储。实现的方法就是将坐标系统进行平移。这就是加载数据时的ShiftX和ShiftY。
3)索引网格大小(Gridsize)。在加载数据时,还需要给数据指定索引网格的大小,选择合适的索引网格可以提高工作效率。具体选择多大的网格,理论上是使得一个索引网格里面只有一个要素。经验值是所研究要素平均值的1.5倍~3倍。此外,索引网格的大小在加载后仍可以根据实际需要进行修改。
3.2 栅格数据的加载
栅格数据的加载亦有两种:1)使用ArcCatalog向SDE中加载;2)使用SDERASTER向SDE中加载。栅格数据存储到ArcSDE数据库时,被转换成许多小的二进制对象(BLOB)或片(tile)。通过这种存储方式,在检索栅格数据时,只会影响并且返回需要的片,而不是整个栅格数据集。
3.2.1 栅格数据的压缩方式
栅格数据加载时需要经过压缩。常用的有两种压缩方法,即LZ77和JPEG。LZ77是一种无损压缩算法,压缩可以节省存储空间,产生较小的数据文件,从而可以提高应用程序的显示性能;但对于那些像元值很重要的数据如分类数据(或用于分析的数据)来说,应该采用无损压缩,对于提取有效像元不是很重要的数据,则可以采用有损压缩。
3.2.2 加载栅格数据参数设置
1)Pyramid:为输出的数据建造ArcSDE地理数据库的金字塔。当选择要建造时,还要选择构建金字塔时重采样的方法,有最邻近法(nearest)、双线性内插(bilinear)最紧以及立方卷积(cubic)的方法。
2)Raster statistics:可以在地理数据库中建立时生成数据的统计值。当选择建立统计值时,需要设定统计计算的采样间隔,即X skip和 Y skip的值。系统默认为1。
3)Compression:指定在ArcSDE中数据压缩方式。LZ77是一种保留所有栅格数据式;JPEG是有损压缩方式,是利用国际上通用的JPEG算法对像进行压缩,用户可以在下面的复选框中选择压缩率;JPEG2000也是有损压缩方法,它采用小波技术对图像进行压缩,使图像表面上看起来没有什么损失,同样用户需要设定压缩率;NONE指对栅格数据进行不压缩存储。
4)Tile size:设定ArcSDE地理数据库中数据的大小,系统默认的宽度和高度都是128。
4 结语
本文从测绘工作的实际出发,将测绘成果进行了分类,对测绘成果数据库进行了设计,并对数据加载过程中出现的相关参数问题进行了说明。
[1]樊文有,谢 靖,邵 隆.MAPSUV数字测绘成果管理系统的设计[J].地球科学——中国地质大学学报,2006,31(5):715-718.
[2]梅树红.基于GIS控件开发测绘成果目录检索系统[J].铁道勘察,2006(4):20-22.
[3]江春发,廖宝勇.厦门市测绘成果的GIS方式管理[J].城市勘测,2001(1):44-47.
[4]桂润堂,钟霞薛,重 生.基于ArcSDE空间数据库引擎技术的应用研究[J].微机发展,2003(3):13-15.