顾及多重约束的土地利用图斑自动聚合
2015-03-30江宝得
江宝得,谢 忠,2,吴 亮,2
(1.中国地质大学(武汉)国家地理信息系统工程技术研究中心,湖北 武汉430074;2.中国地质大学(武汉)信息工程学院,湖北 武汉430074)
图斑是土地利用数据库中最重要的地理要素,具有全覆盖、无重叠、无缝隙及多类型层次语义划分的特征。图斑聚合是一种重要的综合操作,旨在将空间上呈现聚集分布、语义上相同或相近的小图斑群合并成一个大图斑。图斑聚合需要解决制图综合“5W+H”中的两个基本问题[1]:①Where问题,即如何识别满足聚合约束条件的图斑群,形成若干个待聚合的区域;②How问题,即如何将待聚合的图斑群自动合并,并保持合并前后图斑群的结构特征、拓扑一致性和语义完整性。其中,问题①是实现图斑自动聚合的前提。目前,对于问题②的研究比较多[2-6],主要实现了几何层面上的多边形群合并方法和顾及部分约束的聚合方法;而对于问题①则很少提及,这是因为小图斑群的识别涉及权属、语义、空间区域划分、邻近关系判断等多方面因素的约束,是一个复杂的智能决策过程,实现起来比较困难。本文从图斑聚合的约束条件入手,针对空间区域划分约束这一难题,提出一种矢量与栅格数据模型相结合的方法。先将各种几何类型的矢量约束地物统一转化为栅格“障碍物”,然后将权属、语义、邻近关系、栅格“障碍物”等共同作为约束条件,对图斑实施聚类分析,解决了图斑自动聚合的Where问题;接着,利用现有的多边形群合并算法,实现了顾及多重约束的图斑自动聚合。
一、图斑聚合约束条件分析
从图斑自动聚合的过程来看,可以分为:①对图斑群自动聚类分析;②对聚类的图斑群实施合并。其中,步骤①需要考虑多种约束因素[6-8]。首先,从图斑的权属看,属于相同行政区划的图斑才能聚合,而不同行政区划的图斑即使邻近也不能聚合;其次,从空间区域划分来看,地类图斑可能会被自然界中山川、河流、沟堑等天然屏障,以及公路、铁路、街道等人工地物的阻隔,这些阻隔物将连续的地理空间划分为若干星罗棋布的空间区域,而地类图斑只能按照一定的空间分布模式镶嵌在这些被阻隔的空间区域中,只要这些阻隔物存在于图上,图斑聚合时就需要考虑其对空间区域的划分约束[9];最后,从同一层类来看,具有聚集态势的图斑既有空间上的欧氏距离邻近约束,也有专题属性上的语义相似度约束,空间上相距较近的图斑在语义上不一定“邻近”,同理,语义上“邻近”的图斑在空间距离上也不一定邻近,只有满足空间距离相近和语义属性相似的图斑才能视为邻近[10]。当图斑彼此间的空间距离和语义相似度均难于区分时,判断邻近关系则需进一步附加方向、大小、形状上相似的Gestalt识别原则进行约束[3]。另外,步骤②除了要实现图斑几何层面的相离多边形合并外,同样需要考虑空间和语义方面的多重因素的约束,如图形结构特征、拓扑、坐标精度等。因此,图斑自动聚合是一项异常复杂的处理操作,需同时兼顾多重约束条件。
二、顾及多重约束的图斑自动聚合
从以上分析可知,图斑聚合需要满足:①具有相同语义下的空间区域划分;②具有一定的空间聚类特征。据此约束条件,图斑自动聚合的思路为:先根据地类编码对图斑进行分类,将类型相同的图斑提取到同一个集合{Pi}中;接着对图斑集{Pi}进行空间区域约束划分,划分方法是,先根据权属是否相同进行初步划分,称为权属划分,使得每个划分区域的图斑集属于同一行政区,其次,将每个区域所包含的街区、道路、河流等人工或自然地物作为“屏障”,对初步划分的图斑集进行进一步的空间区域划分,称为地物约束划分,使得每个划分区域的图斑分布在这些阻隔地物所形成的间隔区间中,防止合并后的图斑出现跨越道路或河流的情况;接着对每个划分的子区域进行空间聚类分析;最后对聚类的结果图斑群进行合并和语义、拓扑一致性改正。
图斑的权属约束划分比较容易,利用行政区层中的行政区划要素对图斑进行空间包含查询,或根据图斑的行政区编码属性进行区分。对地物的约束划分则相对较难,因为在土地利用数据中,这些被视作“屏障”的阻隔地物被抽象为点、线、面等多种几何类型的矢量数据,并以物理分层的形式来表达和存储,而层与层之间的复杂地物关系一般都没有直接进行存储,需要通过复杂的空间查询或空间推理才可获得。因此,需要寻求一种方法将点、线、面等多种几何类型地物进行统一的约束表达,以便于图斑聚类分析时的地物约束划分。
1.基于栅格数据模型的空间区域约束划分
栅格数据模型和矢量数据模型是GIS中最基本和最常用的两种空间数据模型。栅格数据模型用格网来表示要素属性的空间变化,对点、线和面等几何类型的地理要素具有统一的图形表达,易于空间分析;矢量数据模型采用坐标点的方式,精确地记录抽象的点、线、面等地理实体,坐标空间连续,允许任意位置、长度和面积的精确定义和量算,具有精度高等优点。目前GIS中都同时兼容这两种数据模型,并且提供了二者之间的相互转换方法,以便于进一步的分析处理。
由于栅格数据模型具有统一的图形表达特点,因此,利用栅格数据模型来表达图斑聚类分析时各种几何类型的地物约束是再适合不过了。其基本思想是:先对待聚合的图斑栅格化,在栅格化的同时利用数学形态学的膨胀算子对图斑进行聚类分析,则邻近的图斑自动聚合在一起;然后将各种点、线、面矢量“障碍”地物栅格化,并将聚合后的栅格图斑与“障碍”栅格地物作异或运算,则聚合后的栅格图斑又被划分为若干区域,而所得到每块连续的栅格区域即为受地物约束的聚类区块;最后通过栅格转矢量,即可获得图斑聚类的区域集。下面以建筑物图斑为例来阐述该方法的实现过程。
如图1所示,图1(a)为待综合的土地利用数据,它们都属于同一行政区,包括7块建筑物图斑、2条线状道路和空余的街区地块,以线状道路作为约束地物对建筑物图斑实施自动聚类分析。设聚合的最小距离阈值为d,并假设图中街区的宽度均小于d。
图1 顾及空间区域划分约束的图斑聚类分析
1)从地类图斑层中提取所有建筑物图斑,得到结果如图1(b)所示。
2)设定栅格化的步长为d/2,对图1(b)中的图斑进行矢量转栅格,并在栅格化的同时利用数学形态学的膨胀算子对每个图斑进行一个栅格单元(即d/2)的膨胀处理,则街区间距小于d的所有建筑物图斑自动聚合连成一片,如图1(c)所示。
3)从图1(a)中获取线状道路地物,得到结果如图1(d)所示。
4)同步骤2),对图1(d)中的道路进行栅格化,但不作膨胀处理,得到结果如图1(e)所示。
5)用图1(c)中的栅格阵列与图1(e)中的栅格阵列作异或运算,则原先被聚合成一片的建筑物栅格图斑又被分割成若干区块,结果如图1(f)所示。
6)对图1(f)的栅格阵列进行栅格转矢量,即得到以线状道路作为约束的图斑聚类结果多边形集{Ri},如图1(g)所示。
通过以上方法处理,即可实现顾及各种几何类型地物约束的图斑自动聚类分析。但需要注意的是,步骤6)中所得到的矢量多边形集{Ri}只能作为建筑物图斑的空间聚类区域,而不能作为聚合后的结果多边形集。因为{Ri}中的多边形是经过原始多边形膨胀处理后得到的结果,要比原始的多边形范围大,并且多边形的形态结构和空间坐标都发生了改变,不满足图斑结构特征约束和精度约束的要求,因此,还需要进一步对聚合区域中的多边形群作多重约束保持的合并综合处理。
2.图斑自动聚合
聚类分析得到的图斑群是一组空间关系上相离、视觉上邻近的多边形集。目前,对于视觉邻近的多边形合并算法主要分为基于栅格的方法和基于矢量的方法,基于栅格的方法算法相对简单,但合并后的结果多边形的形态不理想,坐标精度差;而基于矢量的方法则不存在这样的问题。因此,本文结合土地利用数据的特点,采用容错性好、图形结构和坐标精度都保持良好的Delaunay三角网合并算法进行地类图斑聚合。另外,图斑聚合后,还需对图斑所在位置的拓扑关系进行重建,以保持综合前后的拓扑一致性;并根据具体语义对图斑的属性值进行继承或累加处理,如对“名称”“编码”等字段进行属性值继承,而对于“产量”“面积”等字段则进行属性值累加。在实际操作中,可以先定义好每个字段的合并规则,在程序实现时读取规则信息对聚合后的图斑属性值进行合并处理。
下面仍以图1(a)中的建筑物图斑为例,介绍聚类结果图斑群的合并方法。假设属性合并规则已建立,图斑聚合的最小距离阈值为d。
1)依次从{Ri}中取一个多边形Ri,用Ri对图1(b)中的建筑物图斑进行空间包含查询,得到查询结果多边形集{Pi},若{Pi}中的多边形个数小于2,则继续取下一个Ri进行空间查询,否则转步骤2)。
2)将{Pi}中的多边形坐标链调整为顺时针方向,并以d/2为步长对多边形坐标进行加密。
3)建立约束Delaunay三角网,利用文献[2]的多边形合并方法,对{Pi}中的所有多边形进行合并,得到结果图斑P'i。
4)根据属性合并规则构建P'i的属性信息,随同P'i一起添加到地类图斑层中,并将{Pi}从地类图斑层中删除。
5)重建P'i所在位置的拓扑关系,以保持图斑聚合前后的拓扑一致性。
6)重复执行步骤1)—步骤5),直到{Ri}中的多边形遍历完为止。
通过以上6步操作,可对待聚合的图斑群实施顾及形态结构特征、精度、拓扑和语义约束的合并综合,结合上一节顾及语义、权属、空间邻近关系、空间区域划分等约束的图斑自动聚类分析,可实现顾及多重约束条件的地类图斑自动聚合。
三、自动聚合流程与试验
以上介绍了土地利用图斑自动聚合的方法,下面给出图斑自动聚合综合的流程,如图2所示。
流程中采用了一个预先定义的规则模板,其中定义了需要聚合的地类及聚合的优先顺序,还定义了属性合并的规则。制定这个模板主要有两个作用:一是允许用户根据制图区域的特征,自定义需要聚合的地类,以及地类聚合的优先顺序,一般来说,重要的地类应优先聚合;二是允许用户根据应用需求灵活修改属性合并的规则,从而提高功能的扩展性和适用性。流程中需要用到3个控制参数:判定为次要地块的面积阈值S、用于聚类分析的图斑间最小距离r及各种约束地物。通常,约束地物以独立的要素层的形式存在地理数据库中,如线状道路层、面状道路层、线状河流层、面状水域层等,在实施聚合前,需要先对这些约束地物层实施选取综合,然后才能作为图斑聚合的约束要素。
为检验上述图斑自动聚合方法的有效性,本文基于MapGISK9设计实现了以上算法流程。试验数据为湖北某城区1∶1万土地利用数据,综合结果为1∶5万。试验前,本文先根据试验地类图斑的属性字段类别和语义特征设计了综合规则模板,并采用了XML进行定义和存储,如图3所示。
模板中对各地类综合的优先级及属性合并的规则进行定义,其中,PRI_Rule标签下的子节点定义了各地类综合的优先级,PRI值越小,表示优先级越高;Semantic_Rule标签下的子节点定义了各字段属性合并的规则,Operator为“Inherit”表示属性值继承,为“Add”则表示属性值累加。试验区域包含地类图斑517块,7种地类类型,包含线状道路246条,原始数据如图4所示。由于该试验区地块主要以城市居民地为主,影响聚合的约束地物主要是线状道路。因此,在实施自动聚合前,先对道路作了选取综合,仅保留主要的城市道路和铁路线,并将选取后的结果作为约束地物层。试验时设置的图斑间最小距离r为40 m,面积阈值S设为最大值,即只要满足地物约束条件和图斑最小间距约束条件都实施聚合。得到综合结果如图5所示,表1给出了综合前后各种地类图斑数量的统计结果,差值描述了对应类别的图斑合并的个数。从结果图中可以看出,聚合后的图斑都以区域中的道路作为约束,没有出现跨越道路的情况,且合并后的图形结构和拓扑都保持良好。
图2 图斑自动聚合流程
图3 综合规则模板定义
图4 试验数据原图
图5 自动聚合结果
表1 自动聚合前后各地类图斑统计 块
四、总结与展望
土地利用图斑自动聚合是一个复杂的智能化处理过程,需要同时兼顾空间和语义多重因素的约束。其中,顾及空间区域划分约束是图斑自动聚合的难点。本文针对该约束的特点,提出了一种矢量与栅格数据模型相结合的方法,实现了图斑顾及多重约束的自动聚合。相比已有研究成果,本文提出的方法具有以下优点:①解决了图斑自动聚合的Where问题,这是实现图斑自动聚合的前提。②算法中虽然用到了基于栅格数据模型的方法,但是仅用于空间聚类分析,最终图斑聚合的过程仍采用基于矢量的多边形合并方法,保持了图形结构特征和坐标精度,从而很好地将栅格数据易于分析的优点和矢量数据形态结构保持和精度高的优点结合起来,二者优势互补,相得益彰。
本文虽然实现了顾及多重约束的图斑的自动聚合,但在面积平衡约束和层间的拓扑一致性约束方面还有所欠缺,需作进一步的深入研究。
[1] 毋河海.地图信息自动综合基本问题研究[J].武汉测绘科技大学学报,2000,25(5):377-386.
[2] 艾廷华,郭仁忠,陈晓东.Delaunay三角网支持下的多边形化简与合并[J].中国图象图形学报,2001,6(7):703-709.
[3] 郭仁忠,艾廷华.制图综合中建筑物多边形的合并与化简[J].武汉测绘科技大学学报,2000,25(1):25-30.
[4] 钱海忠,武芳,谭笑,等.基于ABTM的城市建筑物合并算法[J].中国图象图形学报,2005,10(10):1224-1233.
[5] LI Z L,YAN H,AI T H,et al.Automated Building Generalization Based on Urban Morphology and Gestalt Theory[J].International Journal of Geographical Information Science,2004,18(5):513-534.
[6] 艾廷华,刘耀林.土地利用数据综合中的聚合与融合[J].武汉大学学报(信息科学版),2002,27(5):486-492.
[7] 江宝得,吴信才,万林.土地利用图中狭长多边形降维综合一致性改正[J].测绘科学,2014(12):116-119.
[8] 刘耀林,焦利民.顾及尺度效应和景观格局的土地利用数据综合指标研究[J].测绘学报,2009,38(6):549-555.
[9] 邓红艳,武芳,翟仁健,等.面向制图综合质量控制的数据模型——DFQR树[J].测绘学报,2007,36(2):237-243.
[10] 艾廷华,杨帆,李精忠.第二次土地资源调查数据建库中的土地利用图综合缩编[J].武汉大学学报(信息科学版),2010,38(8):887-891.
[11] 吴亮,谢忠,叶梓.街网约束下的城市居民地自动综合算法[J].地理与地理信息科学,2009,25(3):37-41.