国土变更调查图斑局部狭长区域识别方法
2023-12-25林东铨张俊鑫
林东铨 张俊鑫
(1.广东省国土资源测绘院,广东 广州 510663;2.自然资源部华南热带亚热带自然资源重点实验室,广东 广州 510663;3.广东省自然资源科技协同创新中心,广东 广州 510663)
0 引言
在国土变更调查县级数据库建设工作中,涉及大量图斑矢量图形的调整、修正及空间分析。由于各类业务数据的来源及工作要求不同,且在作业过程存在大量人工整理的步骤,导致未经检查的数据库成果中常存在重叠、缝隙、局部狭长、节点过密、自相交等拓扑问题,严重影响后续数据的治理与使用。因此,对图斑的矢量图形进行系统检查并修正,对建库成果质量至关重要。在数据库存在的拓扑问题中,对图形重叠等有明确定义的情况,可直接通过矢量图形的简单处理进行检查及修复。针对图斑存在局部狭长的情况,目前虽已有不少学者研究,但由于缺少量化且精确的定义,未形成具备稳定性与普适性的方法。
目前,针对国土变更调查数据,已有较为成熟的数据检查软件[1-3],对地理国情监测、新型基础测绘等同样涉及图形拓扑检查的工作,也有相应的研究并形成质检工具[4-7]或数据检查机制[8],实现图形拓扑检查与数据精度控制。同时,也有学者针对狭长图斑、图斑狭长分支等的判定与处理方法[9-15]进行研究。在上述研究中,对图斑狭长情况的识别多基于图斑的矢量特征进行判定,如采用图斑边界平移、计算图形周长面积比例等方式,该些方法能识别出一部分狭长的图形,但矢量图形中狭长的位置可能存在节点过密、多余节点等不规律、不可预测的情况,过度依赖图形的边、点等特征进行识别的方法,其稳定性以及普适性将会大大降低。
因此,本文从图斑本身的图形分布特征出发,分析并研究对图斑局部狭长区域进行识别及定位的方法,通过规避图斑矢量图形本身拓扑问题带来的不可预测因素,提高方法的稳定性与普适性。
1 研究方法
1.1 研究内容
为保证识别过程中不受矢量图形拓扑问题的影响,本文通过将图斑栅格化,以栅格单元集代表图形范围,并基于栅格单元开展研究。同时,由于局部狭长区域呈狭窄、细长、尖锐的形状,位于该区域的栅格单元集呈具有一定长度但宽度有限的特点,即该区域内的每栅格单元,以其为中心的一定范围内可搜索到的栅格单元数量相比其他区域相对较少。根据该特点,本文在栅格化的基础上,为每栅格单元设置一个初始累积值并逐渐追加,当各栅格单元的累计值达到一定程度后,将值逐渐往周边扩散,使周边栅格单元数量多的区域转移速度快、栅格单元的值则分布均匀,反之转移速度慢、栅格单元的值集中,则栅格单元累计值集中的部分可认为是局部狭长区域,如图1所示。
图1 狭长区域示意图
1.2 图斑栅格化
本文首先将图斑进行栅格化,通过设定固定大小的栅格单元,将图斑矢量图形所覆盖到的位置转化为栅格单元的集合,作为图斑范围UA。
1.3 栅格单元值演算
在栅格化的基础上,本文由图斑边缘开始,按一定速度增加栅格单元的值,为此,将位于图斑范围UA中且与图斑范围UA外存在接触的栅格单元认为是边缘栅格单元,将其集合作为栅格边缘UE。接着,设定一定周期,每周期内栅格边缘UE中的栅格单元增加一个累积值,并对整图斑范围UA中的栅格单元进行遍历,如有栅格单元的累积值高于周边其他栅格单元,则将较高累积值往较低累积值处进行扩散,具体如下:
(1)将图斑范围UA中每栅格单元的累积值设置为0个。
(2)设定一定周期,在每周期内栅格边缘UE中栅格单元的累积值均增加1个。
(3)在图斑范围UA内,每周期内当有栅格单元相对相邻栅格单元的累积值更高且差值大于1 个时,则将当前栅格单元的累积值减少1 个,将目标栅格单元的累积值增加1个。
在此方法下,随图斑范围UA中总体的栅格单元累积值越来越高,各区域栅格单元的累积值逐渐往低处扩散,在经历足够多的周期后,位于局部狭长区域的栅格单元由于可进行扩散的其他栅格单元较少,累积值难于扩散,相对其他区域的累积值将相对较高。
如图2(a)和图2(b)所示,分别为图1 中的图斑经栅格化后进行10 次、60 次演算后的栅格单元累积值分布示意。
图2 栅格单元累积值分布示意图
可以看出,随演算次数增加,对图斑范围内非局部狭长区域,其栅格单元累积值分布愈加均匀,且越远离边缘或折点处越低;而对图斑范围内局部狭长区域,其栅格单元累积值则远高于其他位置。
1.4 特征分析及定位
根据多次演算后各栅格单元反映的特征,本文分别选取存在局部狭长区域的图斑与无局部狭长区域的图斑,通过上文方法演算相同的次数,并在演算后获取各栅格单元的累积值,对数值一致的累计值仅统计一次,并由小至大排序,分析其变化趋势。
由图3可以看出,进行相同次数的演算后,无局部狭长区域的图斑的栅格单元累计值的上升速度平缓,而存在局部狭长的图斑的栅格单元累计值起初上升平缓,在某范围内迅速上升后又重新趋于平缓。结合图2 的示例可以看出,栅格单元累积值起初上升平缓的部分对应图斑范围内分布均匀的位置,突然迅速上升的部分则对应图斑范围内分布均匀位置与局部狭长位置的交界部分,最终重新趋于平缓的部分为对应该图斑的局部狭长范围。
图3 栅格单元累积值变化趋势示意图
根据该特征,将栅格单元的累积值由小至大依次排序,如存在累计值上升速度急剧增加的情况,则认为该图斑包含局部狭长区域,并将该值作为判断局部狭长区域的阈值,对大于局部狭长区域阈值的栅格单元值,认为是局部狭长区域对应的栅格单元值;而对栅格单元值持续以较为稳定的效率上升的,则认为是不包含局部狭长区域的图斑。根据该方法,对包含局部狭长区域的图斑,将判定为局部狭长区域的栅格单元提取并转化为矢量图形,最终定位至图斑矢量图形中的局部狭长区域。
如图4 所示,经对图1 中图斑进行栅格化并演算后,将判定为局部狭长区域的栅格单元提取并转化为矢量图形,即可定位至图斑中的局部狭长区域。
图4 局部狭长区域定位示意图
2 方法验证
为验证方法的有效性,同时保证实验结论的准确性及合理性,本文选取了某县区的国土变更调查数据库进行实验,除验证该方法是否能识别出局部狭长区域的存在外,同时考虑到同一图斑包含的多个局部狭长区域可能会对识别结果产生影响,对该方法是否适应同一图斑同时包含多个局部狭长区域的情况也一并验证。因此,本文对选取的数据库中的每个图斑,随机勾绘若干个局部狭长区域,并通过本文方法对每图斑进行识别,验证是否能识别出图斑中的每个局部狭长区域并定位,对单一图斑中每狭长区域均识别成功的情况认为是“识别成功”,对部分识别成功或全部识别失败的情况认为是“识别失败”,对各类图斑以“识别成功”的图斑数占图斑总数的比例计算识别成功率。
本文选取的数据库共包含2 137 个图斑,并对每图斑随机勾绘1~3 个局部狭长区域,其中包含局部狭长区域个数为1、2、3 的图斑数分别为1 337、491、309,成功识别的个数分别为1 223、439、283,识别成功率分别为91%、89%、92%,总识别成功数为1 945,总识别成功率为91%。具体如表1所示。
表1 识别结果表
由实验结果可以看出,分别包含1~3 个局部狭长情况的图斑的识别成功率在89%~92%,单个图斑内局部狭长区域的个数对识别成功率未产生明显影响,总识别成功率达到91%。另外,本文对未成功识别的图斑进行分析,发现由于实验时采用了固定的栅格单元大小进行栅格化,未成功识别的图斑基本属于狭长区域与图斑主体较为贴近的情况,导致栅格化过程中狭长区域与主体融为一体。对该部分图斑,本文采用长、宽较小的栅格单元对图斑进行栅格化后,即可正确区分开来,并进行后续识别与定位,但因栅格化后的栅格单元数大大增加,识别效率受到一定影响。此时,本文将演算次数减少,在不影响识别成功率的前提下,识别效率得到一定提升。
经实验证明,本文的研究方法能够有效识别图形存在的局部狭长区域并进行定位,同时能够规避矢量图形拓扑问题的影响。另外,方法中涉及的栅格单元大小、演算次数等多个参数均在不同程度上对识别成功率及效率产生影响,参数的合理设置方法仍有研究空间。
3 结束语
本文基于目前对图斑局部狭长情况的检查方法的稳定性与普适性有限的情况,提出一种基于图斑位置分布识别图斑局部狭长区域的新方法,并通过实验证明该方法的有效性。通过将图斑栅格化并基于其形状特征进行演化计算,根据计算后的栅格单元值特征区分图斑内部的狭长与非狭长区域,实现对图斑局部狭长区域进行快速检测及定位,在规避图斑矢量图形自身拓扑问题带来的不可预测因素的前提下,提升对图斑局部狭长区域的检查精度,具有较高的稳定性、普适性和推广价值。