格式塔原则与图形凸分解结合的建筑物群直线模式识别方法
2023-02-18魏智威
魏智威,丁 愫,童 莹,程 璐,刘 洋
1. 中国科学院网络信息体系技术重点实验室,北京 100830; 2. 中国科学院空天信息创新研究院,北京 100830; 3. 浙江农林大学环境与资源学院,浙江 杭州 311300; 4. 武汉大学资源与环境科学学院,湖北 武汉 430079
分布模式是重要的空间结构特征,它表达了地理要素在空间内呈现出的特定组织规律[1]。建筑物是地图表达的基础地理要素,建筑物群空间分布模式提取是城市空间理解[2-3]、城市三维模型可视化[4-5]、地图自动综合[6-9]等领域研究的重要问题。
建筑物群空间分布模式提取主要包括建筑物群聚类与模式识别。基于邻近图聚类,文献[10]利用建筑物间距离进行聚类;文献[5,11—13]在此基础上考虑了建筑物间大小、形状等的相似性;文献[14]则结合了城市形态学特征;文献[1]则考虑了建筑物的语义特征。另外,文献[15—18]将能量最小化、神经网络等智能化方法用于建筑物群聚类。建筑物聚群中有时会存在特殊的空间排列,基于模板匹配方法,文献[19]识别了简单直线排列;文献[20—21]分别基于建筑物间空间关系定义了H型、T型、E型、L型、Z型、阶梯形和格网型模板。文献[22—23]基于邻近图分别提出了用于建筑物群典型化的格网型排列识别方法;文献[24]通过对最小生成树邻近图(minimum spanning tree,MST)剪枝,实现了直线型排列和曲线型排列的识别;文献[25]则基于邻近图和stroke约束探测线性模式;文献[26—27]基于邻近图剪枝,识别了多连通直线型排列和格网型排列;文献[28]从空间推理出发,提出了建筑物空间排列的层次识别方法;文献[29—30]则对比了不同邻近图识别线性模式的适用性。另外,文献[31—32]将随机森林和图卷积神经网络等智能化方法用于识别建筑物群模式。
上述研究主要是基于格式塔原则,认为满足空间邻近、几何相似和分布连续的建筑物群组在视觉判断上更易被归为整体构造,即分布模式[12]。其中,格式塔原则要求的整体是指虚构形体的完整性,并非要求目标自身必须保持完整。但是,已有研究均将建筑物作为整体基于格式塔原则提取排列,导致提取的排列有时存在断裂、遗漏等问题。另外,建筑物形态日趋复杂,有时从整体上表达复杂图形相对困难。实验心理学研究表明,人眼视觉认知遵循格式塔原则的同时,也存在部分与整体的关系。凸多边形是视觉认知的几何基元,人类会将图形分解为凸或近似凸的多边形进行认知,如身体姿态估计和手势识别等[33-34]。同时,建筑物图形凸分解已成功应用于城市三维模型可视化[35]、建筑物复杂空间关系表示[36]和室内建筑物通风效果评估[37]等。因此,基于格式塔原则提取建筑物群分布模式有时需要分解图形,以保持视觉认知上虚构形体的完整性。直线模式是一种典型的空间分布模式,是其他建筑物群模式识别的基础。本文试图结合图形凸分解识别建筑物群直线模式,其中,组成直线模式的元素既可以是建筑物,也可以是建筑物局部。
1 建筑物群直线模式定义
建筑物群直线模式表现为一组满足格式塔原则(相似、邻近)的沿直线排列建筑物[14]。首先,定义建筑物间“邻近”“相似”和“沿直线排列”的空间关系;其次,定义直线模式。
1.1 建筑物邻近关系
相对邻近图(relative neighborhood graph,RNG)能用更少边较完整地体现建筑物群的直线排列关系[30],本文利用RNG表达建筑物间邻近关系。RNG构建过程如下:首先,基于约束性三角网建立骨架线模拟建筑物“势力范围”,依据共享同一段骨架线的建筑物相互邻近构建邻近图,约束性三角网和骨架线构建时考虑了外围街区块边界多边形的约束,如图1(a)、(b)所示;其次,基于邻近图生成RNG,如图1(c)所示。RNG可表示为G=(E,V),V为顶点集合V={v1,v2,…,vm},vm对应建筑物Bm;E为边集合E={e(vi,vj),vi∈V,vj∈V},e(vi,vj)表示建筑物Bi和Bj邻近,记为P(Bi,Bj);e(vi,vj)长度(Le)为建筑物Bi和Bj间最短距离。考虑到分解后邻接的两建筑物间最短距离可能为0,若Le≤Td,则Le=Td,Td为阈值,可依据地图上图形之间可辨识的最小距离阈值确定(一般设为0.2 mm)[11]。另外,RNG需依据图形分解结果进行实时调整,过程如下:将分解后图形以距离ε向内做缓冲区,ε为极小值(如0.1 mm);依据缓冲区处理结果对区域内建筑物重新构建三角网和骨架线生成对应的邻近图和RNG,如图1(d)所示。
图1 建筑物邻近关系Fig.1 Proximity relations between buildings
1.2 建筑物相似关系
建筑物相似性可以用建筑物间大小、方向和形状的相似性表示,定义见表1[13,30]。建筑物Bi和Bj相似记为S(Bi,Bj)
表1 相似性约束参数Tab.1 The measures for building similarity
S(Bi,Bj)=def{Ar≤δ1,Or≤δ2,Er≤δ3}
(1)
式中,δ1、δ2和δ3为阈值。
1.3 建筑物沿直线排列关系
建筑物沿直线排列可以用RNG两邻接边的方向差异和距离差异表示,定义见表2[30]。建筑物三元组{Bi,Bj,Bk}沿直线排列记为Str(Bi,Bj,Bk)
表2 直线排列约束参数Tab.2 The measures for linear building arrangements
Str(Bi,Bj,Bk)=def{Do≤η1,DL≤η2}
(2)
式中,η1、η2为阈值。
1.4 直线模式
直线模式是一组满足格式塔原则(相似、邻近)的沿直线排列建筑物,可看成是由一个或多个存在2个重复元素的直线模式基元组合而成,直线模式基元定义见式(3)[14,28]
LP(Bi,Bj,Bk)=def{P(Bi,Bj)∧P(Bj,Bk)∧
S(Bi,Bj)∧S(Bj,Bk)∧
Str(Bi,Bj,Bk)}
(3)
式中,建筑物Bi、Bj和Bk既可以是独立建筑物,也可以是图形凸分解后获取的建筑物。考虑到人眼视觉认知负担,视觉认知直线模式基元不会同时分解多个多边形,规定:建筑物Bi、Bj和Bk中最多只能有一个是凸分解后获取的建筑物。依据式(3)定义,直线模式基元即为一个最简单的直线模式,任意存在2个重复元素的直线模式基元则需合并为更长的直线模式。
2 结合图形凸分解的建筑物群直线模式识别原理
依据式(3)定义,直线模式基元是构成直线模式的基础。因此,直线模式识别需首先探测建筑物群中直线模式基元;其次,合并其中存在2个重复元素的直线模式基元。本文结合图形凸分解识别直线模式,考虑到建筑物图形可能存在多种凸分解结果,需结合建筑物的不同凸分解结果探测可能存在的所有直线模式基元。式(3)规定:构成直线模式基元的元素最多只有一个是凸分解后建筑物,故分解不同建筑物图形探测直线模式基元的过程相互独立。
依据上述分析,本文结合图形凸分解识别建筑物群中直线模式过程如下:①获取不同建筑物图形凸分解的候选分割线集合;②获取不同分割线组合条件下的建筑物图形分解结果,依据式(3)定义探测建筑物群中不同分解结果下可能存在的所有直线模式基元;③依据图形不同分解结果获取的直线模式基元确定图形的最佳分解,依据图形的最佳分解确定直线模式基元识别结果,合并其中存在2个重复元素的直线模式基元。
2.1 建筑物图形凸分解的分割线集合
图形凸分解是利用分割线消除图形中凹点,并将图形分解为若干个凸或近似凸的多边形[33]。建筑物是典型人造地物,具有多直角表达的形态特点,建筑物图形凸分解需尽量保持其直角结构。给定建筑物图形Bm,组成建筑物的多边形集合记为BPS={Pb,Ph1,Ph2,…,Phn},Pb为Bm外轮廓,Phn为Bm的洞(或岛),Pb或Phn的节点集合记为PVS={v1,v2,…,vk},其中,Pb节点集合中节点逆时针排列,Phn节点集合中节点顺时针排列。若点vk+1在边vk-1vk的左(右)侧,称vk为凸(凹)点,如图2(a)中点v3、v6、v9和v14;节点vk处角度(Anglek)为边vk-1vk绕节点vk逆时针旋转至边vkvk+1角度,若|Anglek-90|<α∨|Anglek-270|<α,则Anglek为直角,α=10。
(2) 分割线分解图形后需要能消除原图形中凹点,即若存在分割线Cp,利用Cp分解图形后凹点数量未减少,则Cp需删除。如图2(a)所示,采用边v3v4、v3v14、v6v7、v9v10分解图形后,分解后获取的图形凹点总数量未减少,故需删除。
(3) 考虑到图形凸分解的目的是利用分割线消除图形凹点。若连接两凹点的边分解图形后能消除其关联的两凹点,其是可行分割线,应补充至分割线集合中。如图2(b)所示,采用边v3v9和v6v14分解图形后,边关联的两个凹点均被消除,故边v3v9和v6v14是可行分割线。
图2 建筑物图形凸分解的分割线Fig.2 The cutlines for building decomposition
依据上述定义,可获取消除给定建筑物图形Bm中凹点的可行分割线集合CS={C1,C2,…,Cp}。如图2(c)所示,虚线连接边即为图2(c)所示建筑物的可行分割线集合;图形凸分解即从集合CS中选择满足约束条件的k条分割线将Bm分解为若干个多边形。需要说明的是:本文结合图形凸分解识别建筑物直线模式,选取分割线分解图形的目的是获取满足分解约束条件且能与邻近图形构成直线模式的多边形,并非要求将图形严格分解为若干个凸多边形。
2.2 结合图形凸分解的直线模式基元探测
给定建筑物图形Bm,其可行分割线集合为CS={C1,C2,…,Cp},从CS中选择满足约束条件的k条分割线SubCSx={C1,C2,…,Ck}分解图形Bm的结果为SubBSx={SubB1,SubB2,…,SubBk+1},若∃SubBy∈SubBSx与邻近建筑物构成直线模式基元,则SubBSx为一个有效分解。考虑到人眼视觉认知负担,视觉认知图形时通常不会将图形分解为较多零散多边形,即k≤Tk,Tk为阈值[34]。另外,图形凸分解存在一些通用约束原则:如同一凹点不会被分解两次、分割线不能交叉等[33]。因此,结合SubBSx探测直线模式基元可表达为获取满足约束条件的排列组合问题,约束条件如下:
(1)k≤Tk,Tk为阈值;
(2) SubCSx={C1,C2,…,Ck}中任意两条分割线不交叉;
(3) SubCSx={C1,C2,…,Ck}中任意两条分割线消除的凹点不完全相同;
(4) ∃SubBy∈SubBSx,使得By与邻近建筑物构成直线模式基元。
以图3建筑物为例,其候选分割线集合为{v2v14,v3v5,v3v9,v6v8,v6v14,v9v11,v9v12},分割线间关系可以表达为弧长链接图,如图3所示;从CS中选择k条分割线时,弧长链接图中存在连接关系的两条分割线不能被同时选取,如已选择分割线v3v9,分割线v6v14不能被选取。假设从CS中选择3条分割线分解图形,{v2v14,v3v9,v6v8}为满足约束条件(1)、(2)和(3)的分割线集合;其次,依据选择的分割线集合分解图形,判断分解结果中是否存在多边形与邻近建筑物构成直线模式基元。
图3 可行分割线间关系表示Fig.3 The relations between cutlines
因此,给定建筑物集合BS={B1,B2,…,Bm},对应RNG为G=(E,V),V={v1,v2,…,vm},E={e(vi,vj),vi∈V,vj∈V},建筑物Bn∈BS的分割线组合记为SubCSx,分解结果为SubBSx,结合图形凸分解的直线模式基元识别过程见算法1。
算法1:直线模式基元识别算法
输入:BS={B1,B2,…,Bm},G=(E,V)
输出:直线模式基元集合LS
初始化:存储RNG边关联的二元建筑物集合S2a=Null,存储RNG中1阶邻近的二元建筑物集合S2-a=Null,RNG备份CacheG=G
Foreache(vi,vj)∈EDo
IfS(Bi,Bj) Then添加(Bi,Bj)至S2a
Foreache(vi,vn)∈E∧e(vn,vj)∈EDo
IfS(Bi,Bj) Then添加(Bi,Bj)至S2-a
Foreach (Bi,Bj)∈S2aDo
Foreache(vn,vi)∈E∧e(vj,vn)∈EDo
If (Bi,Bj,Bn)构成直线模式基元Then添加(Bi,Bj,Bn)至LS
Else Foreach SubCSxforBnDo
更新G=(E,V)
If∃By∈SubBSx,使得(Bi,Bj,By)构成直线模式基元Then
添加(Bi,Bj,By)至LS
G=CacheG
Foreach (Bi,Bj)∈S2-aDo
Foreache(vi,vn)∈E∧e(vn,vj)∈EDo
Foreach SubCSx forBnDo
更新G=(E,V)
If ∃By∈SubBSx,使得(Bi,By,Bj)构成直线模式基元Then
添加(Bi,By,Bj)至LS
G=CacheG
删除LS中重复的元素;
Return LS
2.3 直线模式识别
2.2节已结合图形凸分解获取了所有可能直线模式基元。但是,对于建筑物多边形Bm,可能存在多个满足2.2节定义约束条件的分解结果AS={SubBS1,SubBS2,…,SubBSn},需确定Bm的最佳分解以获取最终的直线模式基元识别结果;其次,组合存在2个重复元素的直线模式基元。对于SubBSx∈AS,存在以下两种情况:
(1) 存在多个SubBSx∈AS,使得By∈SubBSx与邻近建筑物构成直线模式基元,如图4(a)所示,存在分割线集合{Cut1}、{Cut2}和{Cut1,Cut2}均满足分解结果与邻近建筑物B1和B2构成直线模式基元。考虑到人眼视觉负担,若SubBSx∈AS对应的分割线集合{C1,C2,…,Ck}中分割线数量越小,则SubBSx越优,即{Cut1}和{Cut2}较{Cut1,Cut2}更优[34];若分割线数量相同,则分割线总长度越短,则SubBSx越优,即{Cut2}较{Cut1}更优。
(2) 存在多个SubBSx∈AS,使得By∈SubBSx与邻近建筑物构成多个直线模式基元,如图4(b)所示,基于{Cut3}获取的分解结果与邻近建筑物B3和B4构成直线模式基元,基于{Cut4}获取的分解结果与邻近建筑物B5、B6构成直线模式基元,基于{Cut3,Cut4}获取的分解结果与邻近建筑物B3、B4和B5、B6均构成直线模式基元。若基于SubBSx∈AS能获取更多直线模式基元,则SubBSx越优,即{Cut3,Cut4}较{Cut3}、{Cut4}更优。
图4 存在多个满足约束条件分解结果的凹多边形示例Fig.4The concave polygons which have different cutting results
基于式(3)定义,不同建筑物多边形的分解相互独立,确定不同建筑物多边形的最佳分解不是全局优化问题,可以依次依据SubBSx属性确定对应多边形的最佳分解,SubBSx属性定义见表3。基于情况(1)和(2)分析,分解结果SubBSx优劣(Accept_Value)与SubBSx的Pat_Count、Cut_Count和Cut_Length属性相关;其中,Pat_Count最重要,Cut_Count次之,Cut_Length最不重要,Accept_Value定义见式(4)
表3 分解结果SubBSx的属性Tab.3 The properties for SubBSx
Accept_Value=λ1×Pat_Count+λ2×Cut_Count+
λ3×Cut_Length
(4)
式中,λ1,λ2和λ3为权重,满足α1≫α2≫α3。
假设当前研究区域需分解的建筑物图形集合为BS={B1,B2,…,Bm},Bm∈BS满足2.2节中约束条件的分解结果集合记为AS={SubBS1,SubBS2,…,SubBSn},依据式(4),Accept_Value最大的SubBSx∈AS为Bm的最佳分解。基于最佳分解结果获取直线模式基元,依据前文中直线模式定义,合并存在2个重复元素的直线模式基元,合并结果即为最终识别的直线模式。
3 本文方法的有效性评价与参数敏感性分析
3.1 本文方法的可靠性评价
选择Ordnance Survey(OS)开源提供的街道层次地图局部为试验数据,建筑物1046个,道路171条,如图5所示。试验参数设置:δ1=2,δ2=20,δ3=1.3,η1=160,η2=2,Tk=2,直线模式识别结果如图5(a)所示;局部放大结果如图5(b)—(e)所示。共分解建筑物39个(其中,存在非直角建筑物11个),这表明本文方法能有效分解直角和非直角化建筑物;识别直线模式117个。为评价本文方法可靠性,将本文方法识别结果与人眼视觉认知结果对比。人眼视觉认知结果获取方法如下:在告知建筑物图形可分解前提下,由6名从事地图学研究的硕(博)士生依据视觉感知各自勾选出试验区域中的直线模式,合并6人视觉认知结果作为最终视觉认知结果(认知一致的直线模式直接合并,认知不一致的直线模式依据6人投票后确定)。若识别的直线模式与人视觉认知一致,记为tp;若识别的直线模式与人视觉认知不一致,记为fp;漏识别的直线模式记为fn[28]。另外,直线模式识别结果与视觉认知结果可能存在局部一致的情况,若视觉认知获取的直线模式为识别结果的一部分,记为tpp;若识别的直线模式为视觉认知结果的一部分,记为fpp;记入fpp和tpp的直线模式不重复记入tp、fp和fn。直线模式识别准确率(Accuracy)和召回率(Recall)定义见式(5)和式(6),结果见表4
图5 结合图形凸分解的直线模式识别结果Fig.5 The linear pattern recognition results by using polygon decomposition
Accuracy=tp/(tp+tpp+fp+fpp)
(5)
Recall=tp/(tp+tpp+fpp+fn)
(6)
由表4可知,结合图形凸分解能识别试验区域内大部分直线模式(Recall为96.6%),同时,能实现较高的准确率(96.6%),识别结果符合视觉认知。
其中,本文识别方法获取的结果与视觉认知可能存在部分不一致,如图5(b)—(e)中直线模式P1-P5。本文设置δ1=2,严格限制了直线模式中邻近建筑物间面积差异,故P1只能识别部分;若设置δ1=3,则P1能被识别。另外,P2无法被识别是由于本文规定消除相同凹点的分割线不能被同时选取;若不考虑该原则,则P2能被识别,但可能误识别直线模式P6。P3和P4误识别是由于B4中凹点凹度小,而识别直线模式P3和P4对应分割线长度长,即凸分解结果不符合视觉认知。若图形凸分解时设置凹度阈值TC,即凹度大于TC的凹点才存在分割线,则不会误识别P3和P4。另外,P5只能识别部分是因为其不符合本文直线模式定义。
3.2 本文方法的有效性评价
本文直线模式识别方法以文献[28]为基础,为验证结合图形凸分解识别直线模式的有效性,基于相同方法在不分解建筑物图形条件下识别试验区域中的直线模式,与本文方法的对比结果见表4。由表4可知,若不分解建筑物图形识别直线模式,有21个直线模式无法识别,18个直线模式只能识别部分,相比本文方法准确率低15.7%,召回率低30.5%。
表4 直线模式识别结果统计分析Tab.4 The statistical results for linear building pattern recognition results
同时,选择试验区域中3个典型区域对比分析本文方法有效性,如图6所示。如图6(a)所示,分解建筑物B1—B4能获取直线模式P1—P5,且这些模式在视觉上均具有明显的直线排列特点;若不分解建筑物B1—B4,则P4和P5无法被识别、P1—P3只能识别部分。同理,若不分解对应建筑物,图6(b)和图6(c)中直线模式P6、P7、P9、P10、P12无法被识别;P8和P11只能识别部分;而结合图形凸分解以上模式均能被识别,且这些模式在视觉上均具有明显的直线排列特点。由图6可知,上述区域均有建筑物图形局部异质的特点,这一定程度上说明相比已有方法,本文方法能更有效地识别建筑物局部异质区域中直线模式。
另外,本文仅分解邻近范围内存在相似建筑物的多边形识别直线模式,如图6(a)和图6(b)中建筑物B1—B5被分解,而图6(b)中建筑物B6等则未被分解。若同时分解建筑物B5和B6,基于式(3)能识别直线模式P13,但是,该模式无法被视觉感知。这说明人眼认知直线模式时,为有效降低视觉认知负担,只会分解研究区域中的部分凹多边形。
图6 结合图形凸分解识别直线模式对比Fig.6 The comparisons by using polygon decomposition
3.3 参数的敏感性分析
本文方法涉及较多参数设置,不同参数设置对直线排列识别结果影响较大,3.1节中试验参数为经过试验对比设置的经验阈值。
(1)η1和η2表达了建筑物沿直线排列的约束条件,若η1和η2取值过大,可能导致识别的直线模式结构杂乱,如设置η1=150,则图7(a)、(e)中虚线连接的建筑物会被识别为直线模式的一部分,与视觉认知不符。若η1和η2取值过小,则会漏识别直线模式,如设置η1=175,则图7(b)、(c)中虚线连接的建筑物会被认为不构成直线模式,与视觉认知不符。经过试验对比,实际应用中取η1=160,η2=2较为合适[24-29]。
(2)δ1、δ2和δ3表达了建筑物图形间相似程度的约束条件,若δ1和δ3取值较大,则面积或形状差异大的建筑物可能被识别为直线模式,如设置δ1=3,则图7(f)中虚线连接的面积差异较大的建筑物会被识别为直线模式的一部分,与视觉认知不符。若δ2取值较大,则识别的直线排列可能较曲折,如设置δ2=30,则图7(d)中虚线连接的方向差异较大的建筑物会被识别为直线模式的一部分,不符合视觉认知。需要说明的是,基于不同需要直线模式定义不一样,如参考文献[24],图7(f)中排列会被认为是沿道路的线性模式,无须考虑δ1和δ3取值;参考文献[25],若识别锯齿状线性排列时,δ2有时也可能取较大值,以上直线模式均不在本文讨论范围。实际应用中应依据需要和研究区域中建筑物图形特征确定参数阈值,若研究区域中建筑物图形较为规则且图形相对简单,则δ1、δ2和δ3应取值较小,如本文取值δ1=2、δ2=20和δ3=1.3;否则,参数阈值可适当扩大。
(3)Tk约束图形凸分解的分割线数量,若Tk取值较小,可能存在漏识别;如设置Tk=1,则图7(g)中直线模式P1会被漏识别;若Tk取值较大,依据2.1节定义,待判断的分割线组合较多,会导致识别过程耗时。同时,考虑到人眼视觉认知负担,人视觉认知图形时通常不会将图形分解为较多零散多边形[34]。另外,建筑物图形通常较为规则,且建筑物一定邻近范围的直线模式个数有限:经过试验对比,实际应用中取Tk=2或Tk=3较为合适。
图7 参数分析Fig.7 Parameters analysis
4 讨 论
4.1 建筑物形态影响
不同地区建筑物形态各异,可能影响直线模式的识别。选择OS开源提供的街道层次地图中包含复杂建筑物的局部区域(建筑物404个,道路104条)为试验数据,试验参数不变,直线模式识别结果如图8所示:共凸分解建筑物8个,识别直线模式18个;其中,11个为结合图形凸分解才能识别的直线模式。由图8可知,以上直线模式均符合视觉认知,这表明本文方法针对复杂图形仍能有效识别直线模式。但是,需要说明的是:①复杂建筑物较多的区域,建筑物通常排列不规则,直线模式较少,如图8中区域Area_1和Area_2;同时,分解复杂建筑物获取的与邻近图形构成直线模式的建筑物通常形状并不复杂;②本文利用边数差异度量图形相似性可能不适用于复杂图形,如图8中建筑物B1和B2边数相近,但B1和B2形状不相似,针对包含复杂建筑物的区域需要利用转角函数等复杂指标度量建筑物间形状相似性;③复杂图形通常存在较多凹点,依据2.1节定义,其可行分割线较多,因此,识别直线模式时可能存在较多待判断的分割线组合,识别过程耗时。为有效提高直线模式识别效率,需针对复杂图形设计提高效率的策略,如只针对分解后可能存在直线模式的分割线进行判断。
图8 结合图形凸分解的复杂图形区域直线模式识别结果Fig.8 The recognized linear patterns in area with complex buildings by using polygon decomposition
另外,统计OS开源提供的街道层次地图中765 961个建筑物图形形状特征,包括建筑物数量(BC)、平均面积(AveArea)、平均边数(AveEC)、边数小于等于8的建筑物占比(ER8)和直角占比(RR),结果见表5。由表5可知,AveEC为4.47,且ER8为98.03%,说明大部分建筑物图形相对简单;同时,RR为96.06%,这表明建筑物呈现出明显的多直角表达形态特征。因此,本文方法针对建筑物图形具有较好的适用性。
表5 建筑物图形特征统计Tab.5 The statistical results for characteristics of buildings
4.2 其他类型建筑物群模式识别
已有建筑物模式识别方法通常将建筑物作为整体考虑,本文结合图形凸分解成功识别了直线模式。若将分解后建筑物也认为是独立建筑物,就能利用现有建筑物模式识别方法结合图形凸分解识别其他类型建筑物群模式,如C型、T型模式。参考文献[21]中方法,在分解后建筑物图形中识别C型和T型模式,结果如图9(a)、(b)所示;其中,C型模式P1—P4和T型模式P5—P6是结合图形凸分解才能获取的模式;同时,这些模式一定程度上符合视觉认知。
图9 结合图形凸分解的字母型模式识别结果Fig.9 The letter-like pattern recognition results using polygon decomposition
5 结 论
建筑物图形表达具有整体相似和局部差异化特点,为有效提取建筑物群中直线模式,本文既考虑了视觉认知结构整体性的格式塔原则,又结合图形凸分解顾及了图形从局部到整体的视觉认知过程。试验结果证明,本文方法能更有效地识别建筑物群中直线模式,识别结果符合视觉认知。同时,本文方法也可用于其他类型建筑群模式的识别,为结合图形凸分解从局部认知地理图形提供了重要支撑。但是,视觉认知模式具有较大的灵活性,本文基于参数和邻近图严格定义直线模式有时会导致部分模式的漏识别和误识别。另外,随着地理信息内容的逐渐丰富,融合语义信息和机器学习方法识别建筑物群模式是未来研究的重点。