APP下载

基于深度学习的地图线性要素走向判定方法

2024-05-07张淑霞马小燕

地理空间信息 2024年4期
关键词:缓冲区线性要素

蒋 巍,张淑霞,马小燕,薛 青

(1. 宁夏回族自治区自然资源成果质量检验中心,宁夏 银川 750004;2. 西安锐思数智科技股份有限公司,陕西 西安 710000)

深度学习方法是对复杂图像场景识别解析的重要方法之一,已被广泛应用于计算机视觉任务。尽管基于深度学习在地图要素提取方面取得了一些成果,但是在比例尺有差异的地图中,比对地图的几何特征研究时,还没有更加全面的智能化算法及技术[1-8]。本文以深度学习为技术手段,以人工标注的地图的线性要素走向数据为依据,分析判定待审地图的线性要素走向的正确性。在以宁夏回族自治区行政地图的线状要素提取为实际案例,其中包括行政边界和河流,来验证算法的有效性,期望为地图审查中各类要素的地理位置确定提供参考。

1 方法原理与实现

地图审图依据的参考是标准地图集,为实现待审地图中线性要素走向的正确性,具体流程如图1所示。

图1 线性要素走向判定流程图

1.1 地图地理特征点目标识别

通常我们将标准地图集作为参考地图,它的尺寸和分辨率往往与待审地图不同,因此首先需要对2 幅地图进行配准对齐。本文利用地图中重要的地理目标作为配准的控制点,使用深度神经网络进行地理控制点的识别和定位。

选择的地理目标如表1所示,在样本地图上标注省会城市、地级市和机场等地理目标样本数据,生成目标检测训练样本,所选地图可以是待审地图或标准地图集,使用YOLOV7目标识别算法训练地理目标识别神经网络模型。通过训练卷积神经网络等提取图像的高级语义特征,采用分类方法对输入图像的区域特征进行识别和提取,采用梯度下降算法优化模型输出。在定位地理目标时借助文字提取和识别算法,并采用OCR相关技术辅助定位,简化目标查找难度并提高算法鲁棒性。

表1 地图地理目标识别模型的类型定义

1.2 地图配准

在地图审图过程中,有标准地图集作为参考,也存在因为比例尺问题导致待审地图与标准地图的分级地图级别、范围不能一一对应,因此需要将二者配准对齐。具体地图配准步骤包括以下5点。

1)匹配标准地图:通过待审地图的比例尺、尺寸、分辨率(dots per inch,DPI)等,匹配标准地图库中相应级别的标准地图图像数据。

2)提取地理目标点:通过已训练的深度学习目标检测模型与计算机视觉图像算子,如角点检测等,提取待审地图中的地理目标位置集合和标准地图图像中的地理目标位置集合。地图地理目标包括市镇乡村的位置、河流分叉点、河流汇聚点、道路起止点和道路交叉口等关键点。当标准地图中地理目标的坐标已知时可直接利用其坐标参数。

3)地理目标点匹配:在已提取的待审地图地理目标位置与标准地图地理目标位置之间建立映射关系,进行地图地理关键点对的匹配。将关键点特征中,包括名称、图像特征和几何特征等做矢量化。通过距离函数计算得到不同关键点矢量的距离,距离小于阈值的点对作为匹配的关键点对。将关键点对依据特征距离进行降序排序,找到前n个(n≥3)最接近的关键点对,从而确定几何变换的控制点。

4)地图几何变换:采用仿射变换的几何变换方法将映射关系作为控制点,通过公式(1)和(2)将待审地图和标准地图进行配准。

式中,变换前坐标x,y;变换后坐标x’,y’;系数矩阵M为变换矩阵。

5)获得几何变换后配准对齐的地图对。

1.3 地图线性要素类型语义分割和几何特征提取

通过DeeplabV3神经网络算法,对表2所示地图中省市县区行政边界、双线河流、单线河流、高速公路、高速铁路、各级公路、国铁等线性要素进行提取。将输出的推理结果作为线性要素的掩膜,得到线性要素的感兴趣(region of interest,ROI)区域,在ROI区域获得线性地物的边缘并提取中心线。对中心线上的点密集采样,获得一系列中心线采样点坐标(x,y)。

表2 地图线性要素分类模型的类型定义

1.4 标准参考地图线性要素中心线样本库

建立标注地图线性要素中心线样本库,作为待审地图中线性要素走向判定的标准参考。利用上述线性要素轮廓提取和中心点采样方法,对标准地图中的省市县区行政边界、双线河流、单线河流、高速公路、高速铁路、各级公路和国铁等线性要素做轮廓提取,并获得中心点坐标(x,y),构建标准参考库。

1.5 地图线性要素走向偏差判定

如式(3)所示,在获得待审地图线性要素中心点S坐标(xs,ys)和标准地图中心参考点R坐标(xr,yr)后,地图线性要素走向偏差判定依据参考点S与其最近待审地图中心点R的欧氏距离d进行判定,设定阈值t,作为分类的判断标准。

待审地图线性要素中心点定位算法是通过参考点R坐标(xr,yr)计算周边偏移量以内的点距离,在计算过程中记录最小距离点N的坐标(xn,yn)。

如图2 所示,红色圆圈是待审地图中心点,绿色圆点是配准后的标准地图参考点,距离不超过一定阈值则被判定为走向正确。阈值根据图像分辨率设置,本文定义为3个像素。

图2 待审地图线性要素中心点示意图

2 实验结果与分析

2.1 评价指标

为准确评价本文所采用深度学习方法对地图线性要素的识别能力,选取常用评价方法准确率(pixel accuracy, PA)、 召回率(Recall)、F1 测度值(F1-Score) 和平均交并比(mean intersection over union,MIoU)4个参数对模型性能进行评价。

式中,TP为真实标签为正确分类且预测结果也为正确分类的个数;FP为真实标签为错误分类但预测结果为正确分类的个数;FN为真实标签为正确分类但预测结果为错误分类的个数;TN为真实标签为错误分类且预测结果也为错误分类的个数;P为预测值;G为真实值;K为总类别个数。

2.2 实验结果与分析

采用深度学习方法对宁夏回族自治区行政地图提取自治区界与清水河走向,其中结果如图3、4所示。

图3 宁夏回族自治区行政地图与宁夏回族自治区界走向提取结果图审图号:宁S(2022)第001号

图4 宁夏回族自治区行政地图与清水河走向提取结果图审图号:宁S(2022)第001号

利用模型评价参数对目标识别方法和语义分割方法的识别与提取结果做精度评价,由表3 可知,目标识别方法的准确率、召回率和F1 测度值分别为78.26%、87.97%和82.83%;语义分割方法的平均交并比(mean intersection over union,MIoU)为88.00%。

表3 识别结果统计分析

点缓冲区是以点对象为圆心,以给定的缓冲距离为半径生成的圆形区域。在线性要素走向判定的过程中,采用设定点缓冲区的方法决定输出线性要素的位置范围,确定行政边界和河流的走向偏差是否符合要求。点缓冲区数学表达式为:

即以线性要素中第i点Oi为圆心,对象Oi的半径为r的缓冲区;Bi为距Oi的距离d小于等于r的全部点的集合;d为最小欧氏距离。

其中,通过实验确定的经验值,将行政边界走向判定的缓冲区范围设定为5 个像素,将河流走向判定的缓冲区范围设定为5 个像素,其判定结果分析如表4所示。

表4 线性要素的阈值设定与分析

由上表可知,将行政边界和清水河的缓冲区半径设定为5 个像素,即以5 个像素为行政边界的缓冲区的界内认定为正确的线性走向,溢出缓冲区则视为错误的边界和走向。采用人工方法在行政地图上选取宁夏回族自治区行政边界样本点1105 个,清水河样本点542 个,对本文的方法进行总体的精度评价,结果表明,行政边界线性要素判定的准确率(PA)和召回率(Recall)分别为91.86%和96.19%;清水河线性要素判定的准确率(PA)和召回率(Recall)分别为94.68%和85.42%。

2.3 深度学习方法与传统方法对比

选择银川市、固原市、石嘴山市、吴忠市、中卫市和宁夏回族自治区6个区域的82张行政区划地图和专题地图,其中包括64 张正确地图和18 张包含错误信息的地图,采用本文的方法与传统的人工目视解译方法进行对比,结果如表5所示。

表5 传统的人工目视解译方法与深度学习方法对比分析

由上表可知,采用传统的人工目视解译方法效率为180 s/幅,本文方法效率为15 s/幅。传统的人工目视解译方法采用抽样的方式进行审查,只关注易错区域和包含敏感信息的区域,而本文方法全面审查地图,能够发现偶发错误,其审查面积占比明显高于传统的人工目视解译方法。

由于本文选择YOLOV7目标识别方法定位地理标志点,具有较高的置信度和检测速度且占用内存较小,能够快速为配准提供高精度的控制点位置;选择配准方法对地图进行预处理,使得地图与标准参考地图的吻合度更高;DeeplabV3 语义分割方法具有更高的分割精度和处理效率,对地图的细节特征提取能力更强,其对地图中的河流要素进行了准确的定位与提取;地图线性要素走向偏差判定方法采用设定阈值的方式,能更灵活适应对河流审查的定制化标准。因此,本文的方法不仅具有较高的查准率和查全率,还可以广泛运用于复杂多样的地图要素审查中。

3 讨论

不同比例尺待审地图的配准是决定判定进度的关键环节,为降低配准时的误差对判定精度产生的影响,在标准参考地图库中准备大、中、小3 种级别比例尺的参考地图,选取与待审地图最接近的参考图使配准过程中产生的误差降低;其次,在多对配准点中选择至少3 对以上作为地理目标点,通常选取最常见的易定位的地理标志,如省会城市、地级市和著名山峰等做参考,使获取的候选点具有更高的鲁棒性,且使得待审地图上某些地理目标点不存在或难以查找和准确定位时,确保有其他候补地理目标点可用;此外,地理目标点的分布应尽量离散或靠近待审线性要素对象,以降低地图几何变换后待审线性要素对象与标准参考图中的先行要素对象的误差。不同比例尺下标准地图选取以及地图配准带来的判定精度影响的定量分析还需进一步研究。

4 结论与展望

本文通过训练目标识别和语义分割深度神经网络,识别和提取宁夏回族自治区行政区划地图的地理目标和线性要素,在深度神经网络的解译结果基础上对地图线性要素走向进行判定,实验结果表明具有较好的提取效果。本文仅对地图的线性要素走向进行判定,且在线要素与点要素的位置关系判定中,对于不同复杂程度的地图适用性未做进一步的实验,下一步研究将针对不同类型的地图测试方法的泛化性能。

猜你喜欢

缓冲区线性要素
嵌入式系统环形缓冲区快速读写方法的设计与实现
渐近线性Klein-Gordon-Maxwell系统正解的存在性
线性回归方程的求解与应用
掌握这6点要素,让肥水更高效
二阶线性微分方程的解法
观赏植物的色彩要素在家居设计中的应用
论美术中“七大要素”的辩证关系
也谈做人的要素
关键链技术缓冲区的确定方法研究
地理信息系统绘图缓冲区技术设计与实现