面向空间数据更新的多源数据融合关键技术研究
2013-12-06胡英男
朱 蕊,邱 茂,胡英男
(1.信息工程大学,郑州 450052;2.61512部队,北京 100088;3.78138部队,成都 610066)
随着当前空间数据获取与处理技术的迅猛发展,空间数据更新中的多源数据呈现出类型杂、来源广、尺度多、信息量大等特点,因此,多源数据在数学基础、空间基准、尺度、现势性、编码和格式等方面存在着不一致、不协调、不统一等问题,这些问题会影响空间数据更新的质量,并可能进一步影响基于空间数据的分析和应用。为了充分利用好这些丰富的信息资源,迫切需要将不同来源不同尺度的数据进行融合,目的是合理利用更多信息源,获取质量更高的信息[1]。本文认为,面向空间数据更新的多源数据融合,它不是各种源数据集的简单叠加,而是要保证多源数据在空间特征、属性特征、时间特征和尺度特征上等各方面的一致,根据应用需求,抽取不同来源地理信息数据中的数据因子,经过一致性处理,集成、派生出有应用价值的地理信息数据。
1 存在问题
数据融合作为一种数据综合和处理技术,实际上是许多学科和新技术的集成和应用。文献[2-6]阐述了关于多源数据融合的应用研究,为多源信息的管理、分析和成果应用提供了一定的理论和技术方法,但是面向空间更新的多源数据融合目前还存在以下问题:
1.1 多源数据融合的数据管理与服务还需完善
由于理论和技术不够成熟等原因,在实际多源数据融合过程中,网络化应用很少,仍然停留在单机作业,而且数据的存储方式仍采用文件方式,数据的传输和发布仍是利用光盘等介质,没有充分发挥网络的优势。空间数据更新中,多源数据融合需要提供数字地图以及基于此的多种信息系统,这具有显著的服务多向性特征。因此,多源数据融合的数据管理应当以信息存储、组织、处理、服务的一体化为前提,在网络环境下实现资源共享,以提供信息综合服务为最终目的。
1.2 多源异构信息的集成功能薄弱
多源数据由于受获取途径和制作技术等多方面的影响,存在数学基础不同、语义定义不同、几何表达不同、数据结构不同等问题,这给多源数据融合和应用带来重重困难。如何充分利用丰富的多源异构信息,就迫切需要在模型建立、几何结构、语义表达和编码解释等层面上适当地转换处理,将不同来源不同尺度的多源数据集成起来进行分析对比,实现多源异构目标信息的集成,使多源数据得到更好的应用。
1.3 多源数据融合成果的表达方式还有待研究
当前多源数据融合成果的表达局限在静态可视化,应用的数据主要有影像数据、矢量数据和一些文档数据,多源数据融合成果也主要是数字地图。由于多种信息技术的介入,使得信息具备了较强的时态性,面对实时数据源源不断地到来,需要深入研究多源数据融合成果的表达方式,才能将复杂的、不可见的、变化的环境及态势信息形象、直观地表现出来,以提高用户对环境和态势的感知能力,方便用户通过视觉快速理解复杂的动态信息。
综合上述情况,空间数据更新中常常面临着诸如究竟哪种数据可靠?怎样进行地理信息数据更新?如何进行相应融合处理等一系列亟待解决的问题。因此,研究多源数据融合的相关技术和处理方法,探索出一条科学、实用、适合空间数据更新的技术路线,就显得十分的重要。
2 关键技术
面向空间数据更新的多源数据融合是一个涉及面很广的课题,所面临的挑战众多。限于研究条件和应用需求,本文重点针对关键技术展开研究,解决多源数据融合过程中资料分析与评价、数学基础、语义匹配与转换、数据定位精度和数据多模式表达等方面存在的问题,为多源数据融合提供技术支撑。
2.1 资料的分析与评价
空间数据更新中涉及的资料种类繁多,数据格式各异,现势性差,存在多种比例尺、多种空间参考系和多种投影类型。因此,需要对资料进行认真分析,确定各类资料使用原则,提出资料的质量评价标准,保证原始数据源的正确选择,这是空间数据更新中进行多源数据融合的前提。资料的分析与评价主要涉及以下方面:
1)资料内容的完备性。分析数据中源数据内容的分类、分级是否和现行标准相适应,各要素表达的数量和详细程度是否满足应用要求,图形概括程度是否满足相关指标要求。
2)资料内容的适应性。分析目标要素表示是否与实地相符,各要素的图形能否反映地区的类型特征和典型特点,各地区之间的密度对比是否正确等。
3)资料内容的现势性。分析数据内容的现势性,采用多种数据进行相互佐证,以现势性较好的影像数据来佐证其他数据的现势性。
4)数据的精确性。主要从数学基础、数据精度进行分析。通过多种资料对比,分析哪一种资料较为准确和详细。
5)信息评价体系研究。确定各类资料使用原则,提出资料的质量评价标准。
就栅格数据分析而言,需要分析扫描地图图像和影像数据的现势性、分辨率、生产单位和制作技术,选择现势性好、来源可靠的栅格数据;矢量数据分析需要在分析矢量数据来源、生产单位、数据可靠性、精度和内容详细程度等基本情况基础上,对不同要素层分别进行比较,选择和确定现势性较好的要素层,同时分析该数据在融合处理中所要进行的工作。文献[7]对此做了相关研究与分析,本文不再赘述。
2.2 数学基础一致性处理技术
平面坐标系统、高程基准、重力基准、参考椭球模型和地图投影系统等所有与地理位置有关的信息提供着时空定位基准,是多源数据的无缝无边连接或融合的重要保障。这是进行多源数据融合的基础条件,用于保证矢量/栅格数据空间几何精度以及位置的配准。
1)空间大地坐标系转换。研究和解决大地坐标系统一问题,将多源数据融合中多个大地坐标系下的地图资料及地理信息数据转换到CGCS2000大地坐标系中。
2)矢量数据投影变换。研究多源矢量数据的地图投影不一致问题,提出并实现多种常用地图投影的正反解变换。
3)建立Google Earth影像的投影与目标体系现行投影的解析转换模型,并在转换过程中改进像素的重采样方法以提高转换的精度。
4)高精度几何纠正模型。在不能正确了解坐标系和数学基础的前提下,利用数值方法建立高精度几何纠正模型。
2.3 矢量数据的语义匹配与转换
矢量数据由于各自对现实世界中的地理实体采用不同的理解和语义表达方式,使得地理实体的属性特征表达方式种类繁多、情况复杂,这给数据共享和数据应用带来很多困难。因此,实现矢量数据属性特征的匹配、转换、合并与更新,才能最大限度地将矢量数据应用在更多领域,这也是多源数据融合的核心任务之一。
1)语义差异性分析。主要包括多源数据的分类分级和编码体系的差异分析。通过研究空间数据更新中各种矢量数据对地理实体的语义表达,对比分析矢量数据在属性特征描述方面的差异,为数据更新处理研究提供理论基础,使数据更新处理前的准备工作更加明确,提高数据更新的工作效率。
2)语义转换的技术方法。面对多源数据纷繁复杂的分类分级和属性特征项描述的差异,参考目标数据的相关说明和数据字典,在对相关技术文档进行深入了解和对比的基础上,将原始数据中要素的属性信息最大程度地保留,通过在规则文件中定义要素分类分级和属性特征项的映射关系,列出相同或相似的属性特征,经过整理表达,建立属性特征转换文件,然后基于外部控制文件进行转换,消除不同分类分级标准导致的属性特征差异,实现多源数据在属性特征表达上的一致。
2.4 多源数据的组织与管理
空间数据更新中需要存储和管理多时相、多分辨率、多尺度数据,因此,数据具有数据量大、种类多、时空分辨率高、时效性强等特点,而且由于数据庞杂、数据结构松散,面对如此复杂多样的数据,多源数据的管理平台需要按照总揽全局的原则进行数据的组织和结构设计,为空间数据更新的处理流程自动实施和生成、高效数据访问和海量数据存储等方面提供保障。
1)数据体系的组织和结构设计。解决数据的组织和结构关键技术采用的主要途径是:按照多角度、多特征对数据进行分类和属性描述,确保数据结构的设计具有强完备性和一致性,能够基本充分描述所有数据结构属性特征,具有十分清晰的逻辑结构。因此,对数据的分类不局限于反映某一方面特性,而采取多种特征角度的实体分类原则,例如类型、地理范围或区域、资源的样式、时间等。在设计过程中,不同数据属性实体按照关键字和不同的标识(码)、指针进行互相联合、相关等。
2)海量数据高效的空间索引与检索机制。对于空间数据更新信息管理系统这样一个大的系统,存贮和管理多尺度数据,要快速显示和浏览信息,建立数据索引非常重要。在海量空间数据库空间索引和检索机制的研究中,主要是建立的方式和保证满足性能需求,例如影像数据建立几级金字塔索引,矢量数据在空间数据引擎中存储方式存储块大小、多要素一体化存储还是区分要素存储等。在海量空间数据获取和访问过程中,数据获取能满足用户的技术性能指标。在网络资源充足状况下,最大限度满足用户网络并发访问数据的能力。为解决海量空间数据的索引与快速检索问题,在数据库服务器端,采用大型关系数据库(如Oracle)管理系统和相应的空间数据库引擎管理海量目标数据,并针对不同的应用建立数据存储优化机制。
2.5 数据定位精度提高与检验
多源数据融合的可靠性直接影响着空间数据更新的精确性,多源数据融合中需要不断吸收不同精度的新数据源来提高数据定位精度。因此,需要对多源数据融合的结果提出合适的检验方法,以确保数据坐标输出结果的正确性,控制数据的几何特征定位精度。空间数据更新中需要实现对来自不同矢量数据集中同名点特征匹配结果的检验方法,以确保同名点匹配和坐标输出结果的正确性,控制和判别数据的校准质量。
面向空间数据更新中,针对数据定位精度提高的技术流程通常是:首先利用属性匹配识别空间数据更新中多源数据的同名点;采取基于叠置方法进行特征点匹配可靠性检验,检验数据定位精度;利用最优插值方法对不同数据集中的同名点坐标最优估计,进而提高数据定位精度。
2.6 面向应用需求的多模式表达
空间数据更新中的信息分为空间信息和非空间信息。空间信息的表达主要是通过地图、影像、影像与矢量信息叠加的影像地图、三维模型等方式实现的;非空间信息可以使用文本、声音、图形、图像、动画和活动影像等表现形式来对信息进行说明性描述,使用户获得感性认识,如表1所述。
表1 空间数据的主要表达方式
面向空间数据更新中,面向不同的用户,需要针对信息表达模式方法和模式组合进行研究,建立面向应用需求的多模式表达模板库。将高分辨率影像、卫星实时监控以及效果评估等信息表达方式,与传统数字地图、影像图一起,按照应用需求以单一模式表达或多模式表达,采用合理有效的形式展现以数字形式存在的信息。
3 结束语
随着空间数据生产周期的缩短及空间探测技术、信息获取技术的发展,如何高效、科学、快速地应用多源空间数据资料并生产或更新满足要求的空间数据成为一个亟待解决的问题。如何根据现有多源空间数据资料的情况,制定出一整套切实可行的多源数据融合处理方案,并研究出相关技术方法,对于提高空间矢量数据更新的数字化、自动化水平,加快地理信息数据库的建设步伐,推进多源空间矢量数据的应用和成果转化,具有重要的现实意义和实用价值。本文只是在面向空间数据更新的多源数据融合方面进行了初步的探索,有些观点和工作尚有不完善之处,有待进一步提升和改进。
[1]朱蕊.多源空间矢量数据一致性处理技术研究[D].郑州:信息工程大学,2012:45-46.
[2]崔铁军.多源数字地图融合技术问题的研究—以数字海图与地形图融合为例[J].海洋测绘,2002,22(2):22-25.
[3]郭黎.多源地理空间矢量数据融合理论与方法研究[D].郑州:信息工程大学,2008.
[4]唐文静.海陆地理空间矢量数据融合技术研究[D].哈尔滨:哈尔滨工程大学,2009.
[5]安晓亚.基础地理信息数据融合技术研究[D].郑州:信息工程大学,2008:33-36.
[6]陈换新.全球百万空间数据集成处理与提取技术研究[D].郑州:信息工程大学,2010:9-11.
[7]朱蕊.面向数据整合的境外地理信息分析与评价[J].测绘科学,2011,36(S):132-133.
[8]熊顺.基于空间认知的地理本体语义信息转换[J].测绘科学与工程,2012,32(1):10-15.
[9]张燕,王锋,张睿.基于本体的网格服务语义匹配方法[J].计算机工程,2007,33(7):181-183.
[10]刘青宝,金燕,邓苏,等.基于模糊聚类的属性匹配算法[J].模糊系统与数学,2006,20(6):96-102.
[11]车森.空间数据跨媒介可视化输出研究[D].郑州:信息工程大学,2010:25-26.