空间数据更新中多源数据不一致的表现与成因分析
2014-08-16胡英男
朱 蕊,胡英男,周 滨,严 薇
(1. 信息工程大学,河南 郑州 450052; 2. 61512部队,北京 100088; 3. 61363部队,陕西 西安 710054)
一、引 言
在进行空间数据生产、更新和应用时,为了充分了解地理要素及其周边区域的具体情况,需要广泛搜集各种最新的数字地图数据、纸质地图资料、遥感影像、相关专题数据,以及各种文字资料等,既有军用的,也有民用的,既有国内的,也有国外的,其形式主要有地图数据、影像数据、文字资料等[1]。因此,空间数据更新中,对于同一个地理实体可以得到多种不同的数据源;同时,由于空间数据的分析和可视化等方面的需要,当以不同的描述方式和不同的描述详细程度来表达同一地理实体时,必然会产生不一致,即对数据一致性限制条件的违背所导致的不确定行为[2]。
空间数据的不一致现象会大大影响空间数据的更新质量,并可能进一步影响基于空间数据的分析和应用。为了充分利用好这些丰富的数据资源,给不同层次的管理、分析、规划和决策提供内容逐步详尽和精度不断提高的空间数据,迫切需要行之有效的技术和方法来对多源空间数据进行一致性处理。要研究空间数据更新中的多源数据一致性处理,就必须分析空间数据更新中涉及的多源数据不一致表现,并对造成空间表达不一致性的原因进行详细分析,这对于指导设计相应的多源数据一致性处理有着重要意义。
二、空间数据更新中多源数据的不一致表现
空间数据表示的是空间实体的位置、形状、大小、分布特征等多方面信息,具有定位、定性、时间和空间关系等特征。其中,定位是指在一个已知的坐标系里空间实体都具有唯一的几何位置;定性是指空间实体的属性特征;时间是指空间实体具有随着时间变化的特征;空间关系通常是指空间实体之间存在的一些具有空间特性的关系。因此本文认为从空间数据本身的特征来看,多源空间矢量数据处理中的不一致主要体现在几何位置、属性特征和要素关系3个方面。
1. 几何位置不一致
由于遥感影像获取手段先进、现势性较好且能提供更为准确的几何位置信息,一直以来空间数据更新中都是基于影像更新矢量数据中同名要素的几何位置,然而这两者在很多方面都有区别。就投影性质而言,空间数据更新中获取的遥感影像多是中心投影,而获得的矢量数据多是高斯投影;就表示方法而言,遥感影像仅以影像特征体现,而矢量数据则通过地图语言如地图符号、颜色和文字等多种特征体现;从时间性来说,遥感影像是在固定时间获得的成果,而矢量数据则是一定时间段的信息编辑成果。因此,两者上述的差异必然造成空间数据更新中的影像数据与矢量数据中同名要素的几何位置不一致(如图1所示)。
图1 影像与矢量数据中道路几何位置的不一致
2. 属性特征不一致
许多行业和部门对空间数据的需求日趋强烈且多样化,并纷纷建立具有各自特点的空间数据库。由于各自在建库过程中采用不同的数据模型设计,且对现实世界中的地理实体采用各自的理解和表达方式,使得它们在语义表达上不一致,这种不一致主要表现在属性特征方面。概括起来,多源空间数据属性特征的不一致主要有以下几方面内容:
1) 要素的分类分级不同。通常情况下空间数据按照地理要素类别分层组织,但是不同专业用途的多源空间数据可能会有不同的地理要素划分标准。如在地形数据中,水系要素基本被抽象为点、线、面3个基本要素类别;而在水利数据库中,则将水系要素如河流、湖泊、水库等分别作为一种独立的要素类别。在地形数据中,道路归为一类,并通过分类区分为国道、省道、县道、乡道及其他公路;而在交通部门的公路数据库中,道路划分为国道、省道和县道3类。这导致不同空间数据中同名要素在要素类别上不完全是一对一的关系,有可能是一对多的关系。
2) 属性数据项的多样性。不同数据对同一要素的属性描述不同,不仅属性项的数量不同,具体的描述内容及方式也不相同,即采用不同的属性字段描述相同的地理实体。这导致不同数据库在描述同名实体上可能存在:① 属性字段在数目上不同;② 相同含义的属性在属性字段描述符上不同;③ 相同属性字段描述符的属性在属性值的类型上不同等。
3. 要素关系不一致
(1) 要素关系冲突
多源空间矢量数据在处理过程中,同名实体在要素关系上往往存在许多冲突。如基于大比例尺数据更新小比例尺数据时,随着比例尺的缩小,图形符号之间的间隔越来越小,甚至互相压盖,要素关系的冲突也更为集中。如图2所示,基于1∶10万数据更新1∶20万数据时出现的居民地、道路与河流关系存在冲突。
图2 居民地、道路与河流关系的冲突
另外,空间数据生产与更新过程中,如果点状要素和线状要素来源于不同的数据,必然导致两者的关系不协调、不匹配。如在1∶50万数据的生产过程中,一个比较典型的例子是:点状居民地来源于1∶25万数据,而道路数据来源于GPS数据,由于这两种数据的获取手段不同,再加上对GPS数据进行了必要的综合操作,必然会导致部分点状居民地与线状道路之间的关系出现异常,如图3所示。
图3 居民地与道路关系的冲突
(2) 数据更新导致的要素关系不一致
在空间数据更新中,当空间目标的几何位置发生变化时,地理要素之间的要素关系也有可能发生变化。如图4所示,道路与居民地在更新前的要素关系表现为相切,基于影像更新矢量道路位置信息后,道路与居民地的要素关系表现为相离,这说明数据更新导致矢量信息的要素关系发生了改变,即数据的要素关系不一致。
图4 数据更新前后要素关系的不一致
除此之外,空间数据更新信息在数据质量、数据现势性、元数据描述等诸多方面都存在着不一致。本文不再赘述。
三、空间数据更新中多源数据不一致的成因分析
随着信息获取技术的飞速发展,人类获取空间数据的能力显著增强,各部门往往基于不同应用目的,对同一地区重复生产出大量的空间数据。不同空间数据在描述同一地理实体时必然存在诸多不一致,而造成不一致的原因则是多方面的。
1. 坐标系的差异
不同地区和国家都根据自身情况,选择适合本国的坐标系统。不同的国家和地区为使地球椭球体表面与本国范围内的大地水准面达到最佳吻合,会根据自身情况选择一定元素的参考椭球,并对参考椭球进行定位和定向,获得大地原点的大地起算数据和基准面,建立适合本国的国家坐标系[3]。
我国境内常用的坐标系有:1954北京坐标系、1980西安坐标系、新1954北京坐标系、2000国家大地坐标系和WGS-84坐标系,其中利用GPS得到的数据成果为WGS-84坐标系,属于地心坐标系,其他坐标系属于参心坐标系。我国台湾地区和周边国家的坐标系情况见表1。
另外,空间基准是随时间变化而变化的。如WGS-84坐标系的主要参数,每隔一段时间就会重新测定一次,这就意味着空间数据即使使用了同样的大地坐标系,可由于使用了不同的参数(由时间引起的),也会造成空间数据不一致的问题。同样的问题还会出现在海岸带的定义,以及高程基准(如1956黄海高程基准、1985国家高程基准)等,因此不能忽略时间对空间数据的影响。
表1 部分国家所采用的大地坐标系
2. 地图投影的差异
地图投影是空间数据的数学基础,起着骨架的作用,是空间数据的基础框架,是实现信息定位和信息可视化的基础。地图投影的实质是建立地球面上点的坐标(B,L)与地图平面上点的坐标(X,Y)之间一一对应的函数关系[4]。我国生产的数字地图及其空间数据中,中、大比例尺多采用高斯-克吕格投影,小比例尺则选用等角圆锥投影。境外地区采用的投影与我国存在较大差别,部分国家和地区所采用的投影种类见表2。
表2 部分国家所采用的投影种类
3. 资料应用情况的差异
根据各种资料在空间数据生产和更新中的应用程度,一般分为基本资料、补充资料和参考资料。各种资料应用程度的不同也会导致多源空间数据的不一致,资料的应用程度由资料的可靠性、现势性和完备性等评价元素决定。多源空间数据中资料应用程度的评价因素众多,具体评价指标在文献[5]中有详细说明,本文不再赘述。不同的空间数据由于资料应用情况的差异导致空间数据的表达不一致,如图5所示。
图5 资料应用情况的差异导致空间数据不一致(林地的存在与消失)
4. 空间数据误差
空间数据误差是不可避免的,其来源于空间数据生产与更新的各个过程,是伴随空间数据的采集、处理与应用过程而产生并表现出来的,主要分为源误差和数据处理产生的误差。源误差是指数据源本身的固有误差,主要包括直接获取数据产生的误差、遥感数据获取产生的误差、摄影测量数据获取产生的误差和纸质地图数字化产生的误差;数据处理产生的误差主要包括数学基础转换产生的误差和数据编辑产生的误差。
在空间表达上,空间数据的源误差主要表现为同名实体在空间位置上不重合,会产生一定的偏移甚至变形;另外,由于空间位置误差,同样也会导致同名实体在大小、形状、方向等方面的不一致;而数据处理和应用过程中产生的误差不但会导致同名实体的地理位置、面积和方向的表示有差异,还会导致属性特征整合处理时产生误差,这些都是产生多源空间数据不一致的重要原因。
四、结束语
空间数据更新过程中涉及的各种空间数据在生产过程中存在尺度、时相、应用目的等诸多方面的不同,使得不同数据源在空间表达上出现了不一致性,要研究空间数据更新中的多源数据一致性处理,就必须首先分析空间数据更新中涉及的多源数据不一致表现。通过对空间数据更新中多源数据的不一致表现和成因进行详细分析,有利于构建面向动态、异构、开放的海量信息环境下快速、准确地进行多源目标数据一致性处理的应用需求,这对于指导设计相应的多源数据一致性处理有着重要意义。
参考文献:
[1] 朱蕊.多源空间矢量数据一致性处理技术研究[D].郑州:信息工程大学,2012.
[2] EGENHOFER M J,ELISEO C,PAOLINO D F.Evaluation Inconsistencies among Multiple Representations[C]∥Advances in GIS Research:Proceedings of the Sixth International Symposium on Spatial Data Handling. [S.l.]:Taylor & Francis,1994.
[3] 马俊.地图数学基础分析及其转换的相关技术研究与实践[D].郑州:信息工程大学,2009.
[4] 李国藻,杨启和,胡定荃.地图投影[M].北京:解放军出版社,1993.
[5] 朱蕊. 面向数据整合的境外地理信息分析与评价[J].测绘科学,2011,36(S0):132-133.
[6] 陈军, 李志林, 蒋捷,等. 基础地理数据库的持续更新问题[J]. 地理信息世界, 2004,2(5):1-5.
[7] 安晓亚. 基础地理信息数据融合的相关理论和技术研究[D].郑州:信息工程大学,2008.
[8] 严薇. 面向空间数据更新的地理事件模型研究[D].郑州:信息工程大学,2011.
[9] 李科. 网格环境下地理信息服务关键技术研究[D].郑州:信息工程大学,2008.
[10] 翟仁健. 基于全局一致性评价的多尺度矢量空间数据匹配方法研究[D].郑州:信息工程大学,2011.