面向遥感影像数据生产的多源控制点数据管理方法研究
2016-05-06刘亚文陈茂霖孟庆祥
刘亚文,陈茂霖,孟庆祥,王 宏
(1. 武汉大学遥感信息工程学院,湖北 武汉 430079; 2. 贵州省测绘资料档案馆,贵州 贵阳 550004)
面向遥感影像数据生产的多源控制点数据管理方法研究
刘亚文1,陈茂霖1,孟庆祥1,王宏2
(1. 武汉大学遥感信息工程学院,湖北 武汉 430079; 2. 贵州省测绘资料档案馆,贵州 贵阳 550004)
A Control Point Data Management Method for Aerial Triangulation
LIU Yawen,CHEN Maolin,MENG Qingxiang,WANG Hong
摘要:提出一种服务遥感影像数据生产的多源控制点数据管理方法,利用元数据方式实现栅格、矢量和文本等形式多源控制点数据组织、查询及定位,并通过建立局域网内部磁盘映射的方式提供遥感影像数据生产中所需的控制点数据。试验表明该系统能满足遥感影像数据处理过程中控制点数据的自动查询和获取,提高了遥感影像数据生产效率。
关键词:控制点数据;空中三角测量;数据管理;元数据
随着卫星遥感技术的不断发展,遥感数据的数据量变得越来越庞大。很多部门的遥感影像数据已经达到了数十TB,甚至上百TB的量级,而且还在不断增长[1]。如此庞大的数据量不仅对数据管理提出了新的要求,同时也对遥感影像数据处理效率提出了更高的要求。
空中三角测量(空三)是航空影像数字摄影测量生产的关键步骤之一,它是利用像点坐标和地面控制点坐标进行区域网平差,以确定加密点在选定坐标系的空间位置和影像的定向参数的过程[2]。控制点是空三数据处理必不可少的数据,传统的空三通过人工方式寻找并编辑控制点文件,导致该生产环节自动化程度低下,进而影响了整个生产过程的效率。随着摄影测量技术的发展,更多类型的数据可以用作控制点数据,如已有的矢量数据、正射影像数据及SRTM(shuttle radar topography mission)数据等。这些数据的特点是数据量大、格式多样、坐标系不统一,在用于空三前需要进一步的信息提取和格式转换。显然,传统的人工控制点数据管理方法已经无法适应新形势下空三数据生产的要求,如何有效管理多源控制点数据并实现空三数据生产过程控制点自动获取是目前需要解决的问题。
现有的数据管理方式一般为文件管理系统和数据库管理系统。文件管理系统实现简单,但数据共享性差、冗余度大;数据库管理系统存在数据入库出库极其费时,同时对服务器存储和运行能力要求过高等问题。而且目前这些数据管理方式大多脱离数据的生产过程,不能有效地服务于数据处理与生产。针对这种情况,本文提出了一种服务遥感影像空三处理过程的多源控制点数据管理方法,该方法以元数据的方式有效管理多源控制点数据,实现了根据条件快速查询,自动提取空三过程所需的控制点数据,极大提高了空三数据处理效率。同时,空三处理得到的潜在控制数据作为新数据扩充原有的控制点数据。
一、多源控制点数据管理关键技术
1. 多源控制点数据管理与空三生产过程
用于空三生产的原始数据及控制点数据通常存放在大容量的磁盘阵列中,对于多源控制点数据,通过本文的元数据管理方式服务于空三生产过程,具体的流程如图1所示。在空三数据生产过程中,数据处理系统向数据管理端发送控制点需求,后者在控制点元数据数据库中通过多条件的查询,并根据查询结果在磁盘阵列中定位控制点数据,通过数据迁移指令将所需要的控制点数据移至工作目录,供前者使用。同时,数据处理系统在完成数据处理后,将得到的正射影像、DEM及加密点等数据经过数据管理端上传控制点元数据数据库作为可用的新控制点数据。其中控制点数据组织、数据查询及数据迁移是重要步骤。
2. 多源控制点数据组织方式
元数据作为描述数据集内容、质量、表示方式、空间参考系、管理方式及其他特征的数据[3],能全面地描述数据。本文的多源控制点数据管理通过元数据的管理来实现。控制点数据包括控制点坐标和对应的影像、矢量线划图、正射影像图及SRTM等。控制点数据的元数据主要包括地理坐标、比例尺、数据类型、生产时间、存放路径等信息。
图1 空三控制点数据管理流程
元数据的组织主要由数据组织表、运维管理表、数据表和功能表4种类型的表构成,如图2所示。数据组织表主要包括树表(T_Tree)和关系表(T_Relation)。树表用来记录树控件结点之间的关系及结点的内部属性,关系表则记录了树结点与元数据索引的对应关系,两种表格共同支撑了元数据的灵活组织和可视化。运维表主要包括用户表(T_User)和日志表(T_Log),实现对用户权限及数据安全性的管理。数据表按照多源数据类型的不同主要分为4种表,分别为栅格数据(T_Raster)、矢量数据(T_Vector)、数字高程模型数据(T_DEM)、文本数据(T_ATT)。并对所有数据进行统一编码,同时记录数据的原始坐标和转换后坐标,以满足空间查询的需要。对于每条栅格数据,用BLOB字段记录其规格为500×500的缩略图,以方便用户预览。功能表主要包括映射表(T_Rep)和椭球表(T_Elli)。映射表记录局域网内不同计算机之间的映射关系,服务于数据迁移。椭球表则记录了常用的椭球参数并允许自定义椭球,用以辅助系统的不同坐标系下数据坐标转换功能。
3. 基于多条件的可视查询
为了满足空三生产过程对数据查询的要求,本文采用了基于地理坐标范围查询、属性查询、行政区划查询及不同查询方式之间的组合查询方法。
地理坐标范围查询主要是根据给定的空间范围查询落在该范围内的数据。由于生产中涉及的多源控制点数据可能基于不同的参考系,因此需要将不同参考系下的控制点数据转换到统一的坐标系下进行管理。地理范围是输入可以提供点选、拉框等多种可视输入方式。
图2 控制点元数据组织结构表
属性查询主要通过数据生产时间、数据类型、文件名、比例尺等多种条件进行查询。同时,管理系统提供文件别名命名的方式,允许用户根据数据特点为数据添加关联信息同时又不更改数据自身的文件信息。
行政区划查询可以通过指定不同的行政区快速查询到相关行政区内的控制点数据。
在上述查询方法的基础上,用户可以将3种查询方式结合起来,根据不同关键字和查询条件进行多条件组合查询,通过数据表的索引准确快速地定位到所需数据。同时,查询结果采用树和表的方式进行表现,并可以根据不同的关键字进行排序、分类等简单的统计和分析操作。
4. 控制点数据迁移
控制点数据迁移是直接将空三所需的控制点数据传送到指定的路径,供空三处理程序调用。空三数据生产采用分布式作业方式,多个客户端可同时进行数据生产,为了保证数据的安全性并满足多个客户端的数据请求,采用局域网内部磁盘映射的方式建立客户端与磁盘阵列的通信联系,并由数据管理系统统一进行分发。在数据表中查找到数据元数据后,系统根据数据在磁盘阵列中的位置信息,在映射表中查找数据所在位置到目标路径所在计算机的映射关系,并将目标路径转化为映射目标路径以实现控制点数据的迁移。
二、系统的实现与分析
本文结合实际生产环境,开发并实现了多源控制点数据管理系统。系统采用C/S架构,使用Visual Studio 2010作为开发工具,C#作为开发语言,并基于.NET 4.0进行系统框架搭建,利用Oracle 11g数据库进行后台元数据管理,利用ArcGIS Engine 10.0和GDAL库进行元数据的提取和浏览。
1. 系统架构与功能
系统在逻辑上分为运行支撑层、数据资料层、应用逻辑层和用户交互层,如图3所示。
运行支撑层提供了系统运行的软件和硬件基础。数据资料层包括元数据库和生产相关的文档,同时封装了访问、获取数据库和磁盘阵列中数据的方法。业务逻辑层包含数据上传、查询及迁移等具体功能实现模块,该层通过数据资料层调用将查询结果返回给用户交互层。用户交互层主要为可视化的界面,用户通过界面的提示完成与底层的交互。
图3 系统总体架构
2. 功能模块
从实际生产需求出发,系统实现了数据上传模块、数据查询模块、数据迁移模块、数据浏览模块和用户管理模块等多个功能模块,如图4所示。主要的功能模块叙述如下。
图4 功能模块设计图
(1) 数据上传模块
数据上传模块是多源控制点数据管理系统的入口,提供单条数据上传和批量数据上传两种方式。元数据提取子模块根据控制点数据不同类型分别进行元数据提取。同时,由于数据的多源性,需要通过坐标转换子模块将不同参考系下的数据纳入到统一的参考系下进行管理。在本文中,系统将WGS-84坐标系、1980西安坐标系、1954北京坐标系等不同坐标系下的数据统一转换到CGCS2000坐标系下进行管理。
(2) 数据查询模块
数据查询模块主要实现了基于文件名、时间、比例尺、数据类型、空间范围等多条件组合的查询和浏览,如图5所示。系统支持拉框、点选行政区等多种查询操作方式,以确保查询的高效性。查询结果采用树和表两种表现方式,以便于用户对查询结果的浏览、选择和统计。
图5 数据查询界面
(3) 数据浏览模块
为了便于空间数据的预览和检查,数据浏览模块提供基于树和基于缩略图的两种浏览方式。
基于树的浏览方式允许用户自定义树的结构和结点,并通过拖动的方式将元数据结点进行自由分组分类,实现了对于数据的自由分类组织。基于缩略图的浏览方式将统一参考系后的数据以缩略图的方式显示在底图上,为用户提供了直观明了的预览方式,如图6所示,该图展示了系统对全球ETM影像数据的浏览。
图6 ETM数据预览实例
(4) 数据迁移模块
数据迁移模块在数据元数据查询结果的基础上,在磁盘阵列中迅速定位数据,并通过自动拷贝的方式将数据迁移到数据生产系统指定的路径下,为数据生产系统实时高效地提供生产所需数据。
3. 运行效率分析
本文对多源控制点数据管理系统的数据入库,查询和迁移效率进行了测试。
以控制点数据中正射影像元数据提取为例,影像大小为5000×5000像素,70 MB无压缩的TIF格式,按照采样倍率为10重采样缩略图的平均时间为0.595 s,元数据提取的平均时间为0.07 s,坐标转换的平均时间为0.05 s,每幅影像入库的平均总时间为1.130 s。表1为多种类型控制点数据入库时间。
对一条记录而言,在总记录为8276情况下,根据文件名、地理空间范围、获取时间及多条件组合等方式查询的平均时间不超过0.004 s。数据从磁盘阵列迁移到指定的机器目录下所需要的时间与磁盘阵列、传输网络、目标机器等硬件有关。
表1 控制点数据入库时间
三、结束语
本文采用基于元数据的控制点数据管理系统可以实现多源控制点数据的有效管理及与空三数据生产过程的无缝衔接。利用分类表格的方式组织栅格、矢量和文本等形式多源控制点数据,在规划统一坐标系下,结合多条件快速查询所需要控制点数据,通过建立采用局域网内部磁盘映射的方式实现控制点数据迁移到指定目录。该系统通过文件接口与空三生产系统对接,实现了空三生产过程中控制点数据的自动获取,进而提高了空三的自动化、一体化水平。
参考文献:
[1]徐迪峰.海量遥感影像管理系统的研究与实现[D].苏州:苏州大学,2009.
[2]许娅娅,王月莉.全数字空中三角测量数据检查验收及质量评价方法的探讨[J].测绘通报,2006(1):33-35.
[3]刘鹏. 基于元数据的遥感影像数据库研究[D].济南:山东科技大学,2005.
[4]赵力彬,张新利,吕志勇,等.测绘资料信息管理系统的设计与实现[J].测绘通报, 2011(12):75-78.
[5]刘伟,刘露,陈荦,等.海量遥感影像数据存储技术研究[J].计算机工程,2009(5):236-239.
[6]刘细梅,牛振国,高光明. Landsat遥感影像检索系统设计与实现[J]. 测绘与空间地理信息, 2014 (2):87-90.
[7]王占宏,王月莉,李发红. 基于控制点影像数据库的控制点提取研究[J]. 测绘通报,2009(12): 13-15.
[8]王月莉,李发红,王占宏. 多级多源控制点影像数据库系统的设计与实现[J].测绘通报,2013(3):86-89.
[9]吴信才,郭玲玲,李军. RDBMS和COM的海量遥感影像数据的管理和Web发布[J].中国图象图形学报,2002(4): 74-77.
[10]周傲英,金澈清,王国仁,等.不确定性数据管理技术研究综述[J].计算机学报,2009(1):1-16.
中图分类号:P237
文献标识码:B
文章编号:0494-0911(2016)03-0029-04
通信作者:陈茂霖
作者简介:刘亚文(1970—),女,博士,教授,研究方向为摄影测量与遥感。E-mail: liuyawen@whu.edu.cn
基金项目:武汉大学自主科研基金(2042014kf0294)
收稿日期:2015-01-27
引文格式: 刘亚文,陈茂霖,孟庆祥,等. 面向遥感影像数据生产的多源控制点数据管理方法研究[J].测绘通报,2016(3):29-32.DOI:10.13474/j.cnki.11-2246.2016.0079.