一种任务自适应的空间关系缺陷自动识别方法
2015-05-08曹亚妮王丽君吴芳华李嘉星
曹亚妮,王丽君,吴芳华,李嘉星
(1.西安卫星测控中心,陕西 西安 710043; 2.地理信息工程国家重点实验室,陕西 西安 710054; 3.61363部队,陕西 西安 710054; 4.信息工程大学地理空间信息学院,河南 郑州 450052; 5.西安测绘研究所,陕西 西安 710054)
一种任务自适应的空间关系缺陷自动识别方法
曹亚妮1,2,王丽君3,4,吴芳华2,5,李嘉星3
(1.西安卫星测控中心,陕西 西安 710043; 2.地理信息工程国家重点实验室,陕西 西安 710054; 3.61363部队,陕西 西安 710054; 4.信息工程大学地理空间信息学院,河南 郑州 450052; 5.西安测绘研究所,陕西 西安 710054)
针对现有的空间关系缺陷识别方法和算法通用性较差,不能适应不同任务需求的问题,提出了任务自适应的空间关系缺陷自动识别方法。首先提升改进了传统的模板匹配法,提出了基于功能的基本算子剖分方法;然后研究了模板与算子重组方法;最后进行了相关试验,对上述方法进行了验证。
任务自适应;空间关系;缺陷;自动识别
一、引 言
矢量地图数据的空间关系缺陷是矢量地图数据质量缺陷中的一种,即不符合矢量地图数据生产作业规范(如《1∶50 000数字地形图编辑出版作业细则》《数字地图矢量数据模型及格式》等)的空间关系质量问题。这些质量问题可能会造成地图数据形式混乱,或造成地理目标间的空间关系不能正确表达现实世界对应地理实体间的空间关系,从而不便于生产、管理、发布、更新、共享及应用。矢量地图数据空间关系缺陷自动识别方法研究的意义重大,不仅有利于提高空间数据的质量,而且有利于提升地理信息服务的广度和深度[1-2]。
目前,众多学者对空间关系缺陷的自动识别方法进行了研究,主要有3种:基于空间关系计算的方法、基于拓扑规则约束的方法和基于规则发现的方法[3-5]。但是,由于矢量地图数据空间关系缺陷产生的原因复杂多样,存在于数据采集、生成、处理及应用各个环节,与所采用的编码、规范、数据结构、采集标准、具体要求等多种因素关系密切,这就导致现有的空间关系缺陷识别方法和算法通用性较差,不能适应不同的任务需求。因此,需要研究能够适应不同任务的矢量地图数据缺陷识别方法,以提升缺陷识别的灵活性和适应性,从而提高矢量地图数据缺陷自动识别的效率。
二、基本思路
通过对矢量地图数据空间关系缺陷识别方法的研究可知,缺陷识别方法之间存在一定的共性。如等高线落水和道路落水缺陷的识别,在语义关系方面,都需要确定落水面要素集、落水线要素集;在空间关系判断算法方面,都是线—面关系判断,算法具有一定通用性。
以实现的功能为指标对识别方法剖析可得,空间关系缺陷识别一般有两个步骤:确定参与计算的地理实体(语义关系确定)和计算地理实体间的空间关系(空间关系计算)。其中,空间关系计算方面,进一步剖析可知每个空间关系计算算法都由若干基础算子按照一定的规则组合而成,同时这些基础算子在功能上有着重复性。无论空间关系计算算法能够实现多复杂的功能,归根到底都可以将其分解为若干个能够实现基本功能的算子的组合。当分析出这些基本算子时,在一定的原则指导下,就可以通过这些基本算子的重新嵌套、组合得到各种复杂的缺陷识别算法。
因此,可以得出以下任务自适应的空间关系缺陷识别的基本思路,如图1所示。首先,针对每个空间关系缺陷识别任务,依据相应的缺陷识别规则,可以得知其语义关系和空间关系;进一步的,采用模板匹配法,通过地理要素编码确定参与空间关系计算的地理实体;接着,在基于功能的基本算子剖分方法的支撑下,选择进行空间关系计算的基本算子;最后,将模板与基本算子按照一定方法进行组合,即可实现对空间关系缺陷的识别。
图1 任务自适应的空间关系缺陷自动识别的基本思路
1.空间关系缺陷自动识别的模板匹配法
模板匹配法是借助模板文件来识别数据缺陷的方法。模板文件记录了某类要素的共有特征,主要是根据作业细则、图式规范、数据模型、地理信息要素编码、制图规则等来详细确立,不同比例尺地图数据采用的模板不同。模板匹配法不仅可以对照模板上定义的规则进行属性项真值的比对检查,而且可以依据实际需求非常灵活地设定各种模板来辅助空间关系缺陷的识别。模板匹配法有以下几种:
(1) 真值模板匹配法
真值模板匹配法是对具有固定取值的属性项缺陷进行识别的方法。其实质在于把需要检查的属性项的正确取值(真值)按一定的形式存储在模板中形成规则,缺陷识别时依据读取规则与待检内容进行逐项比对。此时,模板中记录的内容只有属性项的真值,属性项的数目可以依据具体需要灵活设置。
此类方法适用于对真值确定的属性项进行缺陷识别,如元数据项、各类编码、注记显示规范等。常见模板有元数据模板、注记模板、车站代码模板、省道编码模板、国道编码模板、河流编码模板、类型码模板、行政区划代码模板等。其中,注记模板中包含了编码、注记类型、字大1、字大2、字体1、字体2、字体3、字体4、字型1、字型2、字色1、字色2、字色3共13项内容,图2为1∶5万注记模板。
(2) 约束模板匹配法
约束模板匹配法的实质在于把被约束的目标编码、属性项、相应的阈值按一定的形式存储在模板中形成规则,缺陷识别时依据编码和约束条件对待检内容进行判断。此时,规则中记录的内容为编码、要素名称和阈值。
图2 1∶5万注记模板
本方法适合于对有固定阈值约束的属性项进行检查。常见模板有最小面积模板、最小长度模板等。图3为最小面积模板,其中记录了一些需要进行最小面积判断的地理要素及其最小面积阈值,包括代码、要素名称、阈值3个属性项。
图3 最小面积模板
(3) 要素集模板匹配法
要素集模板是记录某些具有共同性质的地理要素的集合。在缺陷识别时,依据规则中记录的要素编码和名称,逐项检查。此时,规则中记录的内容为需要进行某项缺陷识别的要素编码和名称。
要素集模板匹配法不仅适用于属性缺陷和元数据缺陷的逐项识别,还适用于空间关系缺陷的辅助识别,常见模板有注记散列检查模板、非落水面模板、非法进街区的线要素模板、落水面模板等。如图4为非法进街区线要素模板。
图4 非法进街区线要素模板
2.基于功能的基本算子剖分方法
基本算子是各种空间关系缺陷识别算法建立的基础。要对识别算法进行系统的剖分,才能得到全面、准确的基本算子。考虑到矢量地图数据空间关系缺陷识别面向生产任务的特点,按照算子的功能性对其进行剖分。对基本算子进行剖分时,应按照粒度适宜、个数有限的原则。前者关系到基本算子组合的灵活性,后者关系到具体算法实现的可能性。
目前剖分出来的基本算子有仿射变换算子、比较算子、链的外接矩形算子、点到线段的距离算子、两点间的距离算子、链中删除点算子、链中增加点算子、链的连接算子、面域点的坐标算子、逆向点算子、落入算子、交点算子、平行线算子、夹角算子等,部分算子及其基本功能见表1。
表1 剖分出的基本算子(部分)
3.任务自适应的模板与算子重组方法
以等高线与面状水域之间的空间关系缺陷识别为例,说明任务自适应的模板与算子重组方法。重组步骤如下:
(1) 语义关系抽象
依据缺陷识别规则,产生缺陷的要素必须是水系与等高线,具体来说,所属的地理要素集模板如图5所示。
图5 等高线与面状水域之间的空间关系缺陷识别模板
(2) 空间关系抽象
依据以上规则,此缺陷可抽象为线要素与面要素的关系判断问题,进一步可以抽象为点要素与面要素的关系判断问题,以及线要素与线要素的关系判断问题。
(3) 基础算子的选择
依据上述步骤分析,识别此缺陷应当选择以下基础算子:点与多边形关系的落入算子、最小外接矩形算子、角度算子或面积算子或距离算子。
(4) 基础算子的重组
在缺陷识别时,依据以下步骤把基础算子重组:
1) 依据要素属性编码找到参与关系判断的地理实体。
2) 采用基础算子对空间关系进行判断。首先利用最小外接矩形算子计算出多边形与线的最小外接矩形,利用最小外接矩形排除大量不必参与计算的点;然后利用点是否在多边形中的落入算子判断当前点是否落入水域面中,若落入,则进一步用阈值来精确判断。
3) 利用阈值来精确判断时就需要选择角度算子或面积算子或距离算子来计算相应的度量关系。
4) 有时,也可以采用以阈值为半径,作面的内外缓冲区,判断线与缓冲区之间的关系的方法来判断要素落水的空间关系缺陷。这样,就不需要进行度量值与阈值的比较判断,是另外一种考虑了阈值的空间关系判断方法。
常见空间关系缺陷识别任务的模板与基础算子重组关系见表2。
这样根据不同的地图数据缺陷识别任务,如不同比例尺、不同质量要求、不同数据标准,不用修改软件系统,只需要按以上步骤进行分析,装载合适的检查模板、选择相应的基础算子就可以进行缺陷识别。
表2 任务自适应的模板与算子重组表(部分)
三、空间关系缺陷自动识别试验
依据上述基本思路,可实现空间关系缺陷的自动识别。首先对自动检查项进行设置,然后依据需要识别的空间关系缺陷读取相应的模板文件。比例尺不同,模板不同,如图6所示。在实际应用过程中,用户可以依据实际任务需求对模板进行设置和更改,具有很大的灵活性。
图6 不同比例尺空间关系缺陷识别的模板文件
点击“自动检查及格式转换”,系统在后台通过基本算法的分解和重组,对地理要素目标间的空间关系进行计算。依据计算结果可判断是否产生空间关系缺陷,如图7(a)为水曲矛盾缺陷的自动识别结果,图7(b)为道路落水的识别结果。
通过试验可知,采用本文方法,可极大地提高缺陷自动识别的灵活性和通用性,能够满足不同空间关系缺陷自动识别任务的需要。
图7
四、结束语
在地理信息服务产业遍地开花, 各类地图产品广泛应用的今天,地图数据质量问题已经成为影响地图数据使用价值的主要因素之一。本文方法已经应用于地图数据生产与更新的具体实践,取得了良好的效果。下一步,应当深入分析缺陷产生的原因,探索缺陷自动处理与消除的方法,从而更好地为提高地图数据质量服务。
[1] 李诺夫.GIS数据质量控制方法探讨[J].测绘通报,2011(8):66-68.
[2] 简灿良,赵彬彬,邓敏,等.地理空间数据不一致性探测处理方法研究[J].计算机工程与应用,2013,49(10):150-155.
[3] 刘万增.GIS数据库更新中空间冲突自动检测方法[M].北京:测绘出版社,2009.
[4] 刘万增,陈军,邓喀中,等.线线空间关系描述的拓扑链模型[J].中国矿业大学学报,2010,39(1):75-79.
[5] 詹陈胜.多尺度数据库中空间冲突自动检测方法研究——以线要素为例[D].郑州:信息工程大学,2012.
[6] 李永红,华一新.一种快速判断线段相交的算法[J].测绘通报,2003(7):30-31.
[7] 王礼江,岳国森,程卫兴.基于Oracle Spatial的空间线线拓扑关系判断的实现[J].测绘学报,2006,35(1):77-82.
A Method of Spatial Relationship Defects Automatic Identification Based on Task Adaptivity
CAO Yani,WANG Lijun,WU Fanghua,LI Jiaxing
曹亚妮,王丽君,吴芳华,等.一种任务自适应的空间关系缺陷自动识别方法[J].测绘通报,2015(7):62-65.
10.13474/j.cnki.11-2246.2015.0212
2014-05-05
地理信息工程国家重点实验室开放基金(SKLGIE2013-M-4-2)
曹亚妮(1986—),女,博士,主要研究方向为地图数据质量检查、地理可视分析。E-mail:nierde@163.com
P208
:B
:0494-0911(2015)07-0062-04