矢量地理信息更新增量的传播
2015-12-26张保钢,杨伯钢,张伟松
引文格式: 张保钢,杨伯钢,张伟松. 矢量地理信息更新增量的传播[J].测绘通报,2015(4):53-56.DOI:10.13474/j.cnki.11-2246.2015.0110
矢量地理信息更新增量的传播
张保钢,杨伯钢,张伟松
(北京市测绘设计研究院,北京 100038)
IncrementalPropagationofVectorGeographicInformationUpdating
ZHANGBaogang,YANGBogang,ZHANGWeisong
摘要:矢量地理信息更新增量的传播在客户数据库更新中起着至关重要的作用。本文从矢量地理信息更新增量传播的必要条件、传播过程、特殊性、传播内容,以及最终客户数据库的更新几个方面系统研究了矢量地理信息更新增量的传播,完善了地理信息更新增量传播理论;归纳了客户数据库更新的4种情况,并给出了解决方案。
关键词:矢量地理信息;更新增量;传播;主数据库;客户数据库
中图分类号:P208
收稿日期:2014-02-13
基金项目:国家科技支撑计划(2011BAK07B02-03);地理空间信息工程国家测绘地理信息局重点实验室开放基金(201135)
作者简介:张保钢(1965—),男,博士,教授级高级工程师,主要从事地理信息系统方面的理论研究与开发。E-mail:bg_zhang65@163.com
一、引言
随着地理数据“原始积累”的逐步完成和共享应用,数据更新已成为广大用户关注的热点问题[1]。更新方式包括版本式更新和增量式更新。由于客户数据库在主数据库基础上新加了专题属性,主数据库的新版数据与用户数据库在数据规格上存在差异。版本式更新客户数据库将为用户后续的使用带来相当大的工作量及数据冗余;而增量式更新可以避免这些不足,还可以对历史地理信息进行回溯[2-3]。文献[4—6]对地理信息变化的描述、种类、建模进行了研究;文献[7]采用目标差、被差和交的三元组对目标快照进行了分类,给出了正差、负差的计算及其在增量采集与变化信息发布中的应用方法;文献[8]提出了基于快照—增量的时空索引机制;文献[9]从拓扑更新的角度,提出了5种更新操作;文献[10—12]分析了空间数据库增量更新的实施方法、信息提取与集成及增量更新制图。矢量地理信息更新增量的传播[13]在客户数据库更新中起着至关重要的作用。文献[13]分析了模式匹配、变化提取、实体识别、更新集成4种更新传播的操作。本文从矢量地理信息更新增量传播的必要条件、传播过程及其特殊性、最终客户数据库的更新几个方面系统研究了矢量地理信息更新增量的传播。
二、矢量地理信息更新增量传播的必要条件
传播的基本要素包括传者、受者、信息[14]。传者是传播之源;受者是传播的目的地;信息是从传者当中挖掘出来、受者需要但没有的内容,是传播的对象。另外,传播介质是信息从传者到受者间连接的通路或桥梁。矢量地理信息更新增量传播是从主数据库传播到客户数据库,传者是主数据库,受者是客户数据库,传播的内容即信息是矢量地理信息增量文件,传播的介质是各种网络或移动设备、光盘、磁盘等数据存储介质。主、客户数据库间的关系一般应满足下列条件。
1. 主、客户数据库覆盖的空间范围
主数据库覆盖的空间范围{(x主1,y主1),(x主2,y主2),…,(x主i,y主i),…,(x主1,y主1)}(i≥2)应包含客户数据库的空间范围{(x客1,y客1),(x客2,y客2),…,(x主j,y主j),…,(x客1,y客1)}(j≥2)的全部或一部分,即:{(x主1,y主1),(x主2,y主2),…,(x主i,y主i),…,(x主1,y主1)}∩{(x客1,y客1),(x客2,y客2),…,(x主j,y主j),…,(x客1,y客1)} ≠ Φ。其中,(x主1,y主1),(x主2,y主2),…,(x主i,y主i),…,(x主1,y主1)和(x客1,y客1),(x客2,y客2),…,(x主j,y主j),…,(x客1,y客1)分别是主、客户数据库空间覆盖范围边界坐标串,Φ表示空集。
2. 主、客户数据库的数据集语义分类
主数据库的数据语义分类集合为{Class主1,Class主2,…,Class主i,…,Class主n}(n≥i≥2)。
首先主数据库的数据集语义分类S主={Class主1,Class主2,…,Class主n}(n≥2)中的某些元素NClass主1、NClass主2、…、NClass主i与客户数据库的数据集语义分类S客={Class客1,Class客2,…,Class客m}(m≥2)中的某些元素NClass客1、NClass客2、…、NClass客j存在对应关系。
其次,客户数据库的语义分类的类级不低于主数据库或通过组合某些主数据库分类得到。如果客户数据库的语义分类高于主数据库分类,可以通过合并或组合主数据库信息的方法更新客户数据库;然而如果客户数据库的语义分类低于主数据库分类,则无法通过主数据库更新客户数据库。如以教育人口空间数据库(主数据库)更新人口空间数据库(客户数据库)时,前者存储了研究生以上文化程度、大学文化程度、中学文化程度、小学文化程度和文盲空间分布数据,后者存储的是该地区人口空间分布数据。若前者的现势性高于后者,可以采用组合前者的5类较低级别语义数据的方法更新后者1类较高级别语义数据;但无法通过较高级别的人口数据更新较低级别的按教育程度划分的人口数据。
3. 主、客户数据库的现势性
主数据库的现势性应比客户数据库的现势性强。客户获取地理信息更新增量的目的是进行客户数据库更新,如果主数据库与客户数据库相比没有更高的现势性,那么从时间或时态的角度来说,主数据库就失去了客户的应用价值。
三、矢量地理信息更新增量的传播过程
传播过程的一般特征是:谁—说了什么—通过什么渠道—对谁—取得了什么效果[14]。由此矢量地理信息更新增量的传播过程可描述为:主数据库—矢量地理信息更新增量文件—各种网络或移动设备、光盘、磁盘等数据存储介质—客户数据库—实现矢量地理信息的更新。传播过程的数据流程如图1所示。
图1 矢量地理信息更新增量的传播过程
与其他形式信息的传播相比,矢量地理信息更新增量传播的特殊性是:①传播的数据量小,只传播发生变化的地理信息;②信息构成复杂,除了传统意义的文字信息外,还包括空间、图形等信息,其中最显著的特征是空间信息可定位;③信息传播过程复杂,信息的解译需要专门的地理信息系统软件;④传播介质特殊,必须是网络或其他存储数字信息的媒介;⑤信息的表现形式直观活泼,表现为各种地物实体的空间图形信息;⑥信息的使用需借助客户数据库,由于更新增量是一个差值,因此只有在用其更新客户数据库后才更有使用价值。表1是矢量地理信息更新增量与传统信息、软件更新增量传播的对比。
表1 矢量地理信息更新增量与传统的信息、软件更新增量传播的对比
根据文献[8],矢量地理信息更新增量包括线目标差、面目标差,以及点目标差。点目标差应包括目标正差和目标负差;线目标差包括目标正差、目标负差、偏离正负差、延长正差、缩短负差、延长缩短差;面目标差包括目标正差、目标负差、偏离正负差、扩张正差、收缩负差、扩张收缩差。矢量地理信息更新增量信息的提取实质上就是给定时间区间,从主数据库中得到时间区间两个端点的时间快照,建立快照差分类描述的目标差、被差和交的三元组,从主数据库的各层空间数据层中提取时间快照的点目标差、线目标差和面目标差。这3类目标差集合即用户所需的增量信息。
四、传播内容
矢量地理信息更新增量传播的内容是其增量本身。地理信息更新增量又称地理信息变化量,描述某个时间段内指定空间区域地理信息的变化情况,也就是地理目标增、删、改的情况。如果把修改看成是对同一地理目标先删除后增加,那么地理信息的变化可只归类为地理目标的增加和删除。为便于增量信息与客户数据库数据的集成或融合,地理信息的增量文件还应包括主数据库地理信息增量的元数据信息。地理信息增量的内容可归纳如下:
1) 主数据库地理信息元数据信息:如地理信息的坐标单位、坐标系、投影类型、比例尺、空间覆盖范围、有效数据时间(增量时间区间)等参数。
2) 删除的地理目标文件:与主数据库结构一致,且在增量时间区间内被删除的地理目标。
3) 增加的地理目标文件:与主数据库结构一致,且在增量时间区间内增加的地理目标。
五、最终客户数据库的更新
最终客户数据库的更新如图2所示。首先对增量文件进行几何纠正,使增量数据的数学基础与客户数据库数学基础相一致;然后依据增量数据与客户数据库数据图层之间的对应关系,在客户数据库中提取并删除增量文件中删除的地理目标,增加增量文件中新增的地理目标,并使其属性信息完善,实现客户数据库的更新。
1. 增量文件几何纠正
1) 人工选取增量文件中删除目标的特征点及客户数据库中对应目标特征点。
2) 依据精度需要,确定增量文件到客户数据库空间坐标变换多项式,用最小二乘法解算多项式系数。
3) 对原增量文件进行整体仿射变换,得到客户数据库数学基础下的增量文件。
2. 增量文件的图层与结构重组
通过几何更新,增量文件与客户数据库的数学基础达到了一致。为保证主客户数据库的数据一致性,首先按客户数据库的数据分层方法,将增量文件的删除部分和增加部分重新进行数据分层组织,使增量文件的数据分层、数据结构与客户数据库的数据分层及数据结构相一致。
图2 最终客户数据库的更新
3. 对客户数据库中应删除地理目标的提取与删除
逐层提取增量文件中需删除的目标,以客户数据库的精度为缓冲区半径,建立需删除目标的缓冲区,客户数据库对应图层与上述缓冲区作叠加分析,完全落在缓冲区内的目标为客户数据库该层应删除目标,删除这些目标;与缓冲区有交叉的目标需通过人机交互和借助其他资料判断其是否需要删除,完成对增量文件中删除部分的操作。
4. 对客户数据库中应增加地理目标的插入
逐层提取增量文件中待插入目标,在客户数据库相应图层中插入这些目标,根据相关补充资料,完善插入目标的属性。
5. 对客户数据库中发生变化图层拓扑关系的维护
逐层处理客户数据库中有过增删操作的地理信息图层,重建拓扑关系,如由于地理目标的增删而引起的合并、分割等。
六、试验与结论
基于上述思想,本文开发了矢量地理信息更新增量传播程序。图3是以房屋图层为例的一个程序运行试验。主、客户数据库间具有相同的数学基础和语义分类。试验表明,程序可在一定程度上实现矢量地理信息更新增量传播和客户数据库更新。
图3 矢量地理信息更新增量传播
客户数据库的更新可分为下述4种情况:①当主、客户数据库的数学基础、语义分类、数据结构等完全一致时,直接使用更新增量对客户数据库进行相应的目标删除、增加和拓扑关系维护等操作;②当主、客户数据库之间除数据结构外,其他属性相同时,首先修改增量文件结构,使增量文件的数据结构与客户数据库完全一致,然后执行步骤①的操作;③当主、客户数据库之间只有数学基础相同时,按客户数据库的数据分层方法,将增量文件的删除部分和增加部分重新进行数据分层组织,使增量文件与客户数据库的数据分层相一致,然后执行步骤②的操作;④当主、客户数据库之间数学基础不同时,应对增量文件首先进行几何纠正,使增量文件与客户数据库的数学基础一致,然后执行步骤③的操作。实际工作中前3种情况较多,第4种情况操作复杂,不建议使用;但当更新资料匮乏时,步骤④也可选择使用。
本试验是在主、客户数据库间具有相同的数学基础和语义分类条件下展开的,未涉及主、客户数据库间数学基础、语义分类、数据结构均不一致时增量更新的情况。今后的研究包括客户数据库快速增量更新算子、增量文件的语义转换及与客户数据库实体的匹配等。
参考文献:
[1]蒋捷,陈军.基础地理信息数据库更新的若干思考[J].测绘通报,2000(5):1-3.
[2]张丰,刘南,刘仁义,等.面向对象的地籍时空过程表达与数据更新模型研究[J].测绘学报,2010,39(3):303-309.
[3]刘勖,蔡先华. 数据增量探测技术在电子地图更新中的应用[J]. 测绘通报,2007(11):50-53.
[4]林艳,刘万增,王育红. 一种基于更新过程的空间变化信息描述方法[J]. 地理与地理信息科学,2011, 27 (4):24-27.
[5]朱华吉,吴华瑞.基于地理事件和更新操作的地理要素增量变化分类[J].辽宁工程技术大学学报:自然科学版,2010,29(3):444-458.
[6]朱华吉.地形数据库增量信息数据建模及其RDF描述[J].吉林大学学报:地球科学版,2007,37(1):195-199,203.
[7]陈军,林艳,刘万增,等.面向更新的空间目标快照差分类与形式化描述[J].测绘学报,2012,41(1):108-114.
[8]尹章才,李霖. 基于快照-增量的时空索引机制研究[J].测绘学报,2005, 34 (3):257-261,282.
[9]陈军,周晓光.基于拓扑联动的增量更新方法研究——以地籍数据库为例[J].测绘学报,2008,37(3):322-329.
[10]王育红, 牛亚辉,林艳.顾及语义差异的基础地理信息客户数据库更新实施模型[J].地理信息与科学,2011,27(1):1-6.
[11]王育红.面向更新信息提取与集成的空间实体匹配方法[J].测绘科学,2011,36(1):128-130.
[12]胡振龙, 李霖,朱海红. 地理数据库驱动的增量更新制图研究[J]. 武汉大学学报:信息科学版,2010, 35 (12):1478-1481.
[13]王育红,陈军. 基础地理数据库更新信息传播实施方法研究[J]. 武汉大学学报:信息科学版,2010, 35 (9):1116-1120.
[14]郭庆光.传播学教程[M]. 北京:中国人民大学出版社,1999.