广州市政务电子地图核心要素快速更新的关键技术与应用
2021-06-23邢鹏
邢 鹏
(二十一世纪(广州)空间技术应用有限公司,广州510640)
1 引言
地理空间信息资源已成为城市经济及社会发展中重要的基础性、关键性战略资源,为城市综合管理、应急决策、公共服务等方面提供信息保障[1]。因此,地理空间信息资源共享服务平台建设已成为政府信息化建设框架内的核心内容。国务院关于加强测绘工作的意见中已经要求各地构建权威、标准的基础地理信息公共服务平台,更好地满足政府、企业以及人民生活等方面对基础地理信息公共产品服务的需要。以卫星遥感为代表的空间数据获取技术,通过快速、精确、大范围获取地表信息及其变化特征,已经成为获取地理空间信息的主要手段,并广泛应用于自然资源调查监测等多个领域,为政府公共事务管理和决策提供了不可或缺的信息支撑。
广州作为重要的国家中心城市以及粤港澳大湾区核心门户城市之一,城市化进程越来越快,对政务电子地图更新频率要求也越来越高。政务电子地图是城市智能化、智慧化管理的基础,随着政务信息公开力度和公共服务能力的不断提升,政府各职能部门对电子地图的应用需求日益强烈。2019年自然资源部发布《城市政务电子地图更新技术规范》[2],然而基于传统测绘地理信息数据更新的电子地图在政务服务过程中逐渐暴露出现势性不强[3]、丰富性不足[4]、位置信息挖掘与处理难[5]、地图要素信息挖掘与更新问题突出[6]等问题,政务电子地图无法满足政府部门规划决策提供直接参考信息[7]。
为此,本文在分析了现有政务电子地图更新工作存在的问题的基础上,开展了广州市政务电子地图中水体、植被、道路、建筑物等核心要素快速更新的关键技术研究,攻克了多源遥感影像在辐射和几何自动归一化方面的难题,形成质量高、一致性强的多源影像底图。研制精准提取和变化诊断技术,辅助政务电子地图核心要素更新作业,并基于置信度的理论与方法,研发了政务电子地图核心要素更新软件,形成人机协作的作业模式,提高广州市政务电子地图更新的效率和精准度。
2 电子地图更新存在的问题
2.1 电子地图数据获取周期长和处理复杂
电子地图更新工作中数据获取周期长与处理复杂的问题突出。主要原因:传统的人工数据采集的速度无法满足经济发展带来的基础设施快速增长变更的速度和获取的数据多源化;类型、时间差异较大导致数据的归一化处理繁琐、复杂[3]。
2.2 位置信息挖掘与处理难
位置服务是电子地图的核心,但是准确、全面的位置信息挖掘与处理难问题显著,一方面,互联网中的兴趣点存在结构多样化、类型繁杂、有效信息缺失等问题;另一方面,直接网络获取的兴趣点信息包罗万象不成体系,无法满足政府应用对信息的需求;再者,网络发布的兴趣点数据是通过对坐标进行加密、偏移等操作后进行发布的,直接获取的数据在空间位置精度上无法满足需求[5]。
2.3 地图要素信息挖掘与更新问题突出
电子地图更新工作中地图要素信息挖掘与更新问题突出:一方面,面向政务电子地图更新的核心要素信息自动化提取程度低,各类数据之间的融合、关联、转化难度极大;另一方面,政务电子地图历史要素信息的实时更新,暂无高效便捷的手段。政务电子地图更新工作中缺乏相应的标准规范与常态化的面向区域应用模式:一方面,面向地图更新的数据多样,缺少相应的数据管理规范;另一方面,缺乏从数据获取与处理、要素提取、提取结果后处理、历史信息更新等全链条的政务电子地图更新流程与规范体系;第三,没有一个信息化更新系统有效地、全面地支撑政务电子地图更新实施工作;最后,没有形成一个常态化的快速更新模式[6]。
3 政务电子地图核心要素更新关键技术研究
3.1 总体思路
广州市政务电子地图核心要素更新模型的建立,包含了从数据获取、数据处理至信息要素提取、变化检测及信息修订与自动更新的各个环节,旨在及时开展数据检查、处理和入库等工作,实现政务电子地图的动态更新。总体技术路线如下。
3.2 基于多源遥感影像的辐射和几何归一化关键技术
3.2.1 依托自主运控卫星开展多星协调观测规划研究 针对广州市的地域和气候特点,依托自主运控卫星,通过动态效果模拟,制定了多星协调观测规划,实现了多颗卫星最优成像、多源卫星任务统筹规划以及数据自动优选,解决了因遥感数据零散而无法大区域覆盖的问题,同时也解决了遥感数据时间点差异大的问题,提升了政务电子地图核心要素快速更新中卫星遥感数据获取的效率和质量。
3.2.2 面向多源卫星遥感数据的归一化处理流程技术体系的构建 遥感数据的归一化处理技术体系是面向多源卫星遥感数据的归一化处理流程技术体系。基于多源、多时相数据的辐射归一化处理技术采用自适应调整策略、基于归一化水体指数建立伪不变特征,形成多源多时相数据的自适应辐射归一化处理;几何归一化处理重点解决大区域、多时相的几何误差问题,通过构建网格化,将大区域按照不变点分布特征,构建多尺度网格,采用分布式校正方法,实现大区域多时相几何误差校正,形成质量高、一致性强的多源影像底图。
3.3 政务电子地图核心要素精准提取和变化诊断的关键技术
图1 广州电子地图自动更新模型建设方案Fig.1 Construction scheme of Guangzhou electronic map automatic updating model
3.3.1 基于语义扩展的兴趣点检索与匹配算法的研究 兴趣点信息是政务电子地图的核心要素之一,政务电子地图兴趣点信息更新频率低,为实现多信息获取,利用语义扩展方法,建立自动检索模型,并利用语义分析模型,进行时空信息抽取,形成摘录篇章,并对摘录篇章基于时、空短语模板时空词抽取和标准,并对所有表达进行规范化处理,将高频出现的词语作为扩展结果。同时,对数据基于空间约束关系完成兴趣点地址的标准化处理与地址匹配,并采用名称、地址、空间位置多属性加权的兴趣点语义匹配,高精度地实现了对网络兴趣点数据增量的更新。一方面,解决了直接获取的网络兴趣点存在信息缺失问题;另一方面解决了兴趣点与地理空间位置的高精度匹配问题以及增量更新问题。
3.3.2 基于光谱特征和超像素分割方法的样本纯化技术的研究 政务电子地图更新基于已有历史数据展开,对形成可用样本具有良好基础,但政务电子地图地块信息多为多特征组合而成,无法直接形成深度学习样本。针对这一问题,研究了基于光谱特征和超像素分割方法的样本纯化技术,该技术通过将本底矢量信息产品与高分辨率影像进行超像素分割和决策融合,然后基于不同地物的光谱特征构建决策分类特征体系,并结合本底矢量属性对每个高分辨率遥感影像像素所属的标签进行属性赋值,实现样本的纯化。
3.3.3 综合自适应网络深度学习模型和全局最优阈值算法的研制 政务电子地图核心要素中水体、植被、道路和建筑物,均可通过遥感影像进行自动识别。因此,本研究将深度学习技术和面向对象等多种自动化信息提取技术进行有机融合,实现要素精准提取。提出了基于自适应的阈值算法——全局最优算法,分别建立各地物要素的特征集,构建特征优选模型,建立一套基于空间对象语义特征的自动化地物提取方法,实现对水体、植被相关地物、道路的精准提取;针对建筑物多样性、阴影遮挡等问题,采用对象与像素结合方法,构建自适应网络结构的深度学习模型,提取建筑物语义分割空间分布,结合近红外波段对阴影的显著性反馈,建立建筑物、阴影语义特征,分离建筑物与阴影,多技术融合,扬长避短,进一步提高了地类分类精度。
3.3.4 政务电子地图变化单元轨迹分析研究 针对政务电子地图中核心要素变化发现难以及生产工作量大的问题,构建了面向政务电子地图核心要素历史信息更新的工程化实现方案。针对信息的智能化提取结果,借助图像分割技术,充分利用了已有空间信息成果,从地类地块的变化特点出发,以地块为分析单元,通过构建均值、方差、标准差、最大差等统计特征集,建立地块单元变化矩阵,通过聚类分析诊断变化,形成分析单元变化轨迹。该方法不受季相、传感器类型、分辨率等条件限制,并解决了基于像元的变化检测方法中“椒盐”现象明显、检测结果破碎、后期处理复杂等问题,使检测结果更加准确,后期处理简单,便于直接对历史空间信息进行更新。
3.4 基于置信度的政务电子地图核心要素更新理论与方法研究
3.4.1 基于多源信息的置信度辅助决策模型研究 结合POI 点、志愿者地理信息、“四标四实”等多源信息,建立置信度辅助决策模型,获取高精度的空间地理信息数据。模型中主要是将网络爬取的POI点、“四标四实”、志愿者地理信息、电子地图核心要素更新结果建立分层分析模型,形成评价系数,该系数的大小是衡量该要素的正确性,通过多层次灰色聚类模型,形成每个兴趣点的置信度,该置信度的大小是衡量图斑的准确程度,值越大,准确性越高,辅助后续人工决策。
3.4.2 基于分离阈值的变化图斑置信度的算法研究 基于影像提取变化图斑,其特征分布具有随机性特点,为了保证广州市政务电子地图快速更新中人工识别精度以及提高工作效率,利用变化图斑的分布特征,构建分离阈值算法,估计变化图斑置信度,指导人工作业。首先将变化轨迹进行分离,确定20 种类型变化是存在的,另外5 种变化是不存在的。例如:建筑物变为耕地。再根据20 种变化轨迹的特征分布,建立光谱、形状、纹理等多维特征集,通过分离阈值算法,确定决定性特征,进而统计该特征区间,建立区间估计模型,形成变化图斑置信度,加入自动化结果中,进而指导人工作业,提高成图的精准度。
3.4.3 政务电子地图要素样本库和解译知识库的构建 覆盖全业务流程的政务电子地图核心要素快速更新空间信息软件平台,结合形态学等方法形成了边界优化、信息产品标准化处理、质量检查、质量评价等工具,为实现自动化要素识别,采用了样本技术,构建了标准化样本生产规范、样本管理规范、样本更新准则和策略,构建广州市政务电子地图核心要素快速更新样本库。平台功能主要包括政务电子地图核心要素大数据融合与管理;政务电子地图核心要更新的信息提取、更新模型和算法,并具备完善后处理分析工具及地图要素数据的空间展示与分析功能。通过构建多种标准化的规范,将技术体系进行衔接与组合,形成一种人机协作的工艺流程,更是引入置信度技术,指导人工作业,建立反馈机制,形成闭环式人机协作作业模式。
4 应用示范
结合广州城市功能区特点,按照不同的城市化程度选取建成区、城乡结合部以及郊区相应的示范区域。依据政务电子地图数据更新的整体技术流程,要素信息提取、变化检测等各个环节均已将不同区域的特点纳入考虑,尤其是面对不同区域的建筑物分布特点,都具有较好的适用性与迁移性。同时,考虑到重要目标是发现变化要素,因此技术流程中也尽量保证减少漏提。利用相关手段对更新的地图要素进行精度评价与效果评估,旨在服务于后续的推广应用工作。
4.1 示范区划分
按照广州城市化程度的不同,分别选取建成区、城乡结合部以及郊区为示范区域,基于研究成果开展示范应用。各示范分区的定义与描述如下:
建成区:城市行政区内实际已成片开发建设、市政公用设施和公共设施基本具备的地区,城市化进程较高,道路、建筑物等地图要素更新较快,选取建成区的典型区域作为示范区域。
城乡结合部:随着城市化过程,城市不断向外围扩展,使得毗邻乡村地区的土地利用从农业转变为工业、商业、居住区以及其他职能,并相应兴建了城市服务设施,地图要素变化程度处于建成区与郊区之间,选取城乡结合部典型区域作为示范区域。
郊区:通常是商业区较少,而以住宅为主,或者有相当程度农业活动但属于都市行政辖区的地区地,地图要素变化相对较少,选取郊区的典型区域作为示范区域。
4.2 方法适用性
在现有自动化的信息提取、变化检测技术流程中,已将不同示范区地理要素的分布特点纳入了考虑范围。对电子地图要素中的水体、植被、道路、建筑物等要素而言,差异最大之处即在于建筑物的外形与分布,以及由此带来的阴影等问题。
根据表1的分析可知,对于建成区、城乡结合部、郊区的各要素特点而言,主要差异体现在建筑物方面,特别是建成区内高层建筑物阴影带来的水体错提等问题,需要在后处理中予以关注。但就水体、植被、道路、建筑物本身的提取方法而言,在不同区域均具有较强的适用性与迁移性。这样也避免了用户在实际示范应用过程中,选择不同规则集带来的不便。
4.3 分区精度评价
与整体的精度评价相类似,为了更准确地评价技术流程在建成区、城乡结合部及郊区的适用效果,在这三处区域内均生成随机点,通过人工目视判定的方式,对完成后处理的现状结果与变化检测结果分别开展精度评价。基于精度评价的结果,可以定量化分析技术流程的适用性与迁移性。
表2 建成区现状要素信息提取结果的精度评价Tab.2 Accuracy evaluation of information extraction results of current elements in built-up areas
对建成区内完成后处理的现状提取结果进行了精度评价,总体精度可以达到85%以上,其中水体的用户精度与生产者精度均可以达到75%以上。这一结果也表明,对于建成区内高层建筑物阴影带来的水体错提,在分类结果后处理过程中,通过要素之间的邻近度等上下文关系进行剔除是行之有效的,可以满足建成区内水体提取的要求。
表3 城乡结合部现状要素信息提取结果的精度评价Tab.3 Accuracy evaluation of information extraction results of status factors in urban-rural fringe
对于城乡结合部内完成后处理的现状提取结果,既存在建成区的要素分布特点,也有郊区要素的特点,整体提取精度依然可以达到85%以上,总体精度数值略低于建成区,也是为了保证减少漏提所致。郊区现状要素的提取结果,其整体精度也相对较高,表明了技术流程较强的适用性。
表4 郊区现状要素信息提取结果的精度评价Tab.4 Accuracy evaluation of information extraction results of status quo elements in suburbs
在对现状要素提取结果进行精度评价的基础上,可以开展变化检测成果的评价分析。而变化检测的精度主要取决于两方面因素:一是基于后时相影像进行信息提取的精度;二是后时相分类结果容错过程中的精度。变化检测结果的判定也包含两个层面的内容:未变化图斑是否判断正确;在已变化图斑中,变化类型是否判断正确。
如表5所示,在建成区范围内,变化检测的正确率为83%;变化图斑的发现率(能够检测到的确已发生变化的图斑),可以达到77%以上,即(25%+3%)/(25%+3%+8%),为后续的人工干预减少了大量工作。对于建成区的地物分布特点而言,硬化地表占比较高,自动提取算法会将这类地物识别为建筑物,保证了尽可能多地发现新增建筑,但也会导致后续流程将部分未变化图斑识别为变化结果。另一方面,部分高层建筑物的阴影会在初步提取中被识别为水体,在后处理过程中会将这一类对象修正为其他地类,有效减少了水体错提,但阴影遮挡下地物的真实光谱信息会被抑制,影响了变化检测的准确性,这都是在信息提取与变化检测中需要注意的问题。
表5 建成区变化检测结果的精度评价Tab.5 Accuracy evaluation of change detection results in built-up areas
如表6所示,在城乡结合部范围内,变化检测的正确率为81%;变化图斑的发现率(能够检测到的确已发生变化的图斑),可以达到88%的高值,即(25%+5%)/(25%+5%+4%)。
表6 城乡结合部变化检测结果的精度评价Tab.6 Accuracy evaluation of change detection results in urban-rural fringe
如表7所示,在郊区范围内,变化检测的正确率为84%;变化图斑的发现率(能够检测到的确已发生变化的图斑),可以达到80%以上,即(22%+3%)/(22%+3%+6%)。郊区的地物分布特点是农村居民点建筑物密集,耕地、水塘等占据主要面积,硬化地表出现较少。
表7 郊区变化检测结果的精度评价Tab.7 Accuracy evaluation of suburban change detection results
5 结论
本文针对广州市政务电子地图更新中存在的问题,开展了广州市政务电子地图核心要素快速更新的关键技术研究,具体包括:(1)构建任务协同规划、基于水体指数、伪不变特征点的归一化模型,形成质量高、一致性强的多源影像底图;(2)提出语义扩展的关键词检索算法,研发一种基于超像素分割及决策融合的样本纯化技术,综合自适应网络深度学习模型和全局最优阈值算法,实现政务电子地图核心要素精准提取,结合历史电子地图信息,建立变化分析单元与轨迹,辅助政务电子地图核心要素更新作业;(3)结合POI点、志愿者地理信息、“四标四实”等多源信息,建立置信度辅助决策模型,指导人工作业,提高成图的精准度,构建政务电子地图要素样本库和解译知识库,研发基于本底库的遥感影像变化检测软件,实现政务电子地图核心要素快速更新的人机协作作业模式。
通过广州市政务电子地图核心要素快速更新的关键技术的研究,将广州市政务电子地图核心要素更新项目的实施工作量缩减90%以上,整体提高工作效率50%以上,实施成本减少近80%,有效提升了广州市政务电子地图核心要素更新的技术和工作效率。