基于深度学习的地籍边界自动提取研究
2024-08-18王筱君
摘要:为了应对全球70%的未注册土地权的挑战,对廉价快速的地籍测绘方法的需求不断增长。由于传统的现场实地测量既耗时又耗费人力,因此,土地管理部门一直提倡基于遥感的地籍测绘,但基于遥感影像的自动划界的准确性仍然是一项重大挑战。在这项研究中,使用无人机获得的图像来探索深度全卷积网络(FullyConvolutionalNetworks,FCN)在城市和城郊地区进行地籍边界提取的能力。在甘肃天水的两个地点使用其他最先进的技术来测试FCN、多分辨率分割(Multi-ResolutionSegmentation,MRS)和全局化边界概率(GlobalizedProbabilityofBoundary,gPb)算法的性能。实验结果表明,FCN在两个研究领域的表现均优于MRS和gPb,精度平均为0.79,召回率为0.37,F评分为0.50。总之,FCN能够有效地提取地籍边界,尤其是在大量地籍边界可见的情况下。这种自动化方法可以最大限度地减少手动数字化并减少实地工作,从而促进当前的地籍测绘和更新做法。
关键词:无人机地籍边界深度学习全局化边界概率
ResearchonAutomaticExtractionofCadastralBoundariesBasedonDeepLearning
WANGXiaojun
GansuIndustryPolytechnicCollege,Tianshui,GansuProvince,741025China
Abstract:Thereisagrowingdemandforcheapandfastcadastralmappingmethodstoaddressthechallenge of70%globalunregisteredlandrights.Astraditionalon-sitefieldsurveyingistime-consumingandlaborintensive.Therefore,landmanagementauthoritieshavebeenpromotingcadastralmappingbasedonremotesensing,buttheaccuracyofautomaticboundarydelineationremainsamajorchallenge.Inthisresearch,weuseimageriesacquiredbyUnmannedAerialVehicles(UAV)toexplorethepotentialofdeepFullyConvolutionalNetworks(FCNs)forcadastralboundarydetectioninurbanandsemi-urbanareas.WetesttheperformanceofFCNsagainstotherstate-of-the-arttechniques,includingMulti-ResolutionSegmentation(MRS)andGlobalizedProbabilityofBoundary(gPb)intwocasestudysitesinTianshui,GansuProvince.ExperimentalresultsshowthatFCNsoutperformedMRSandgPbinbothstudyareasandachievedanaverageaccuracyof0.79inprecision,0.37inrecalland0.50inF-score.Inconclusion,FCNsareabletoeffectivelyextractcadastralboundaries,especiallywhenalargeproportionofcadastralboundariesarevisible.Thisautomatedmethodcouldminimizemanualdigitizationandreducefieldwork,thusfacilitatingthecurrentcadastralmappingandupdatingpractices.
KeyWords:UnmannedAerialVehicles;Cadastralboundaries;Deeplearning;GPb
自从高分辨率卫星和航空图像问世以来,遥感一直被用于绘制地籍边界图,实际上,地籍边界通常由物理实体标记,如道路、建筑物墙壁、围栏、排水管、沟渠、河流等[1]。这样的边界在遥感图像中是可见的,并且有可能通过图像分析算法自动提取,从而避免了繁重的实地考察任务。
从遥感图像中探测地籍边界是一项艰巨的任务。最先进的方法主要基于图像分割和边缘检测。分割是指将图像划分为不相交的区域,在该区域内,像素在光谱特性方面彼此相似。多分辨率分割(Multi-ResolutionSegmentation,MRS)是最受欢迎的分割算法之一。经典边缘检测旨在通过局部测量来检测图像亮度的急剧变化,包括基于导数的一阶检测(如Prewitt或Sobel)和二阶检测(如拉普拉斯或高斯)。基于导数的边缘检测很简单,但对噪声敏感。最近,基于学习的边缘检测取得了显著进展,它将多个低级图像线索整合到统计学习算法中,用于边缘响应预测[2]。全局化边界概率(GlobalizedProbabilityofBoundary,gPb)被认为是最先进的方法之一。它使用光谱聚类将亮度、颜色和纹理线索纳入全局化框架。全卷积网络(FullyConvolutionalNetworks,FCN)是一种较新的深度学习方法。FCN能够进行逐像素预测并接受任意大小的输入,从而在很大程度上减少了计算成本和处理时间。FCN在特征学习和计算效率方面的优势使它们有望探测可见的地籍边界,这为这项研究提供了主要动力。
1研究数据
这项研究中使用的无人机图像是2022年在甘肃天水采集的,包含两个研究地点,一个位于市区(命名为TS1),另一个位于城郊(命名为TS2)。数据收集的无人机是配备ZenmuseX5S传感器的DJIInspire2。
在这项研究中,考虑精度和计算时间之间的平衡,将无人机图像的空间分辨率从0.02m重新采样到0.1m。从两个研究地点各选择了4块2000像素×2000像素的图斑进行实验分析。其中,3个图斑用于训练,1个用于测试算法。
2边界检测
2.1全卷积网络
边界检测可被视为一种监督式逐像素分类问题,以区分边界和非边界像素。本研究中使用的网络是从带有扩张内核(FCN-DK)的FCN修改而成。主要做了3处修改:(1)丢弃最大池化层;(2)使用较小尺寸的过滤器;(3)构建更深的网络。
网络的核心组件是卷积层。它们可以在对应于不同抽象级别的不同层次上分层提取空间特征。卷积层中使用的3×3内核从1逐渐扩展到12,以捕获更大的上下文信息[3]。结果,在最后一层实现了高达157像素×157像素的接收场。在每个卷积图层中,使用零填充来保持输出要素地图与输入相同的空间维度。因此,所提出的FCN可用于直接对任意大小的图像进行分类并获得相应大小的输出。为了训练FCN,从每个训练图斑中随机提取了500个用于训练的小图斑和500个用于验证的小图斑。所有小图斑都贴有完整标签,大小为145像素×145像素。
2.2全局化边界概率(gPb)
与图像分割的其他方法(如平均移位、多尺度归一化切割和区域合并)和边缘检测相比,gPb轮廓检测提供了准确的结果并且通常被称为作为最先进的轮廓检测方法[4]。该方法的主要优点是通过结合边缘检测和分层图像分割,同时在局部和全局范围内整合纹理,颜色和亮度的图像信息来实现分割。
图像分割包括:(1)从轮廓形成初始区域的定向分水岭变换(OrientedWatershedTransform,OWT);(2)构建超尺度等高线图(UltrametricContourMap,UCM),定义分层分割。OWT是分水岭算法的变体,并且由轮廓检测器提供的定向轮廓信号构造一组初始区域。UCM表示通过对每个边界及其凝聚聚类进行加权而获得的这些区域的层次结构。
由OWT和UCM两个步骤组成的图像分割可以应用于任何轮廓检测器的输出,尤其适用于gPb轮廓检测器的输出。总体结果是:(1)等高线图,其中每个像素被分配作为边界像素的概率;(2)二进制边界图,可以从中导出闭合的片段。边界图中从等高线图转移到闭合段的轮廓数由阈值定义,gPb-OWT-UCM处理流程在本文中称为gPb轮廓检测。
gPb轮廓检测一般适用于纹理、线条和亮暗等特征对比明显的图像,通过给予不同概率划分边界轮廓,在面积较大的特征范围检测相对准确。
2.3多分辨率分割(MRS)
本研究在eCognition软件中进行MRS。MRS是一种区域合并技术,从每个像素开始形成一个图像对象或区域。合并标准是局部同质性,它描述了相邻图像对象之间的相似性[5]。当所有可能的合并都超过同质性标准时,合并过程将停止。
3精度评估
精度评估采用了精度召回措施,这是一种标准评估技术,特别适用于计算机视觉领域的边界检测。精度(P),用于测量正确检测到的边界像素与检测到的边界像素总数的比率。召回率(R),也称为完整性,表示正确检测到的边界占实地调查真实总边界的百分比。F值(F)表示精度与召回率之间的谐波平均值。由于F结合了精度和召回率,因此可以将其视为整体质量衡量标准。这三个度量的范围介于0和1之间。值越大表示精度越高。
4结果
所提出的方法均在市区和城郊这两个研究地点实施,使用精确召回框架,评估结果时会考虑测试方块上的分类准确性。表1和图1显示了测试图块的视觉和数值结果。
表1分别显示了可见边界和不可见边界的精度,以及每种算法在TS1和TS2上所有地籍边界的总体精度。以TS1中FCN对可见地籍边界的分类精度为例,FCN的精度达到0.75,这意味着真正探测到的可见边界与探测到的总边界之比为75%。召回值为0.65,表示在实际所有可见边界中检测到了65%的可见地籍边界。FCN的最终F分数为0.70,这可以看作是质量绩效的总体衡量标准。表3中的其他结果可以用同样的方式解释。有趣的是,根据精度的数学含义,可见边界和不可见边界上的P值之和应等于所有地籍边界上的P值。可以通过表1中的六组数据轻松验证这一点,容差小于±0.03。将FCN与gPb—OWT—UCM和MRS进行比较,最显著的发现是,在相同的情况下,TS1中可见边界或TS2中所有边界的探测精度,FCN的P值始终大于gPb—OWT—UCM和MRS的P值,而FCN的R值总是较小。FCN始终获得最高的F值。这些结果表明,gPb—OWT—UCM和MRS可以检测到很大比例的地籍655353975ad86187ae1b08205109f3e1df740741e61e7efebac9a89aeeefe9c8边界,但也可以检测许多虚假边界。FCN具有非常高的精度率,可实现最佳的整体性能。
图1显示了可见(白色)和不可见(灰色)的实地调查边界以及所研究算法的检测结果。根据图1,FCN分类输出中缺失的边界片段主要是不可见的边界。此外,与gPb—OWT—UCM和MRS相比,FCN的输出更规律、更清晰。尽管建筑物和树木的轮廓对应于坚固的边缘,但FCN不会将它们与地籍边界混淆。
6结语
本研究提出的深度FCN能够从原始无人机图像中提取可见的地籍边界。在两个研究地点进行的实验得出的F分数约为0.5。所提出的方法提取了非常干净和清晰的边界,避免了混乱的建筑物轮廓的影响。可以减少当前地籍测绘和数据更新做法的处理时间和劳动力。
参考文献
[1]田雨.基于LADM的三维地籍数据库概念模型构建[D].武汉:中国地质大学,2023.
[2]张廷玉,贠银娟.深圳市地籍调查技术方法及问题探讨[J].测绘与空间地理信息,2024,47(1):167-169,172.
[3]丁德生,黄远程,熊良生,等.面向复杂城乡区地籍调查的控制测量方法探讨[J].地理空间信息,2023,21(6):96-98.
[4]侯刚栋.怀来县村镇地籍管理信息系统建设的应用研究[D].西安:西安科技大学,2022.
[5]郭中卿.基于地籍测量的技术方法与应用研究[J].华北自然资源,2023(1):108-110.
[6]许其宁,王云凌.三维激光扫描技术在地籍测量中的应用[J].经纬天地,2023(1):8-10,14.