地理空间智能研究进展和面临的若干挑战

2021-10-27张永生张振超童晓冲赖广陵

测绘学报 2021年9期

张永生，张振超，童晓冲，纪松，于英，赖广陵

信息工程大学地理空间信息学院，河南郑州 450001

地理空间智能(geospatial artificial intelligence，GeoAI)，是指借助高性能计算工具，利用人工智能技术(尤其是机器学习、深度学习)及数据挖掘方法，从地理空间专有数据和虚拟空间地理关联泛在大数据中汇集、描述、评估地理空间物理特性和变化信息，并挖掘、测算、利用有价值信息的技术[1-2]。地理空间智能是地理空间科学(geospatial science)和人工智能(artificial intelligence)之间深度融合的交叉领域，其目标是采用人工智能手段高效能地处理、分析和应用地理空间数据，强力提升和充分释放地理空间数据潜能[3]。

研究地理空间智能，既要重视对各类传感器收集的地理空间数据进行实时或近实时处理和综合分析技术的智能化升级，又要面对网络空间以非传统方式涌现的地理关联泛在大数据的智能技术接入，才能更好地服务于经济建设、社会发展、大众生活的方方面面[4-6]。因此，实现地理空间智能技术进步，对于驱动地理空间信息行业转型发展具有重要意义。在国内，2013年国家测绘地理信息局测绘发展研究中心发布的测绘地理信息蓝皮书指出，到2030年建成智慧中国地理空间智能体系，在智慧城市建设的基础上，以海量地理信息资源为基础，以新一代互联网络为支撑，以物联网、感知网为骨架，以云计算和大数据为血液，实现地理信息的集成服务和智慧化应用[7]。国际上，2017—2019年，国际计算协会ACM举办人工智能用于空间数据分析及地理信息提取研讨会(SIGSPATIAL)，专题探讨基于人工智能的遥感影像处理、交通建模与智能分析等方面的技术方法[8-9]。2019年9月，美国能源部在橡树岭国家实验室举办万亿像素地理空间智能挑战研讨会，关注人工智能助力地理知识发现应对全球性挑战的重大议题，以及人工智能模型的泛化性能、地理空间数据融合、边缘计算、硬件架构和高性能计算等专题技术。2019年，英国国家地理空间学会在地理信息新技术报告中，将地理空间智能与无人驾驶系统及无人机、智能传感器和物联网一并列入地理信息技术发展的重要趋势[10]。

近年来，地理空间智能兴起的原因主要可归纳为3点：①地理空间数据获取能力增强；②人工智能算法的高速发展和性能增强；③计算能力的迅速提升。在数据获取方面，来自空、天、地的传感器、物联网终端每天都在获取海量数据，这些数据中80%都包含关联位置信息的地理空间数据，例如坐标值、邮政编码或某一地区的天气状况等；在算法方面，研究人员在深度学习网络设计、模型训练中取得了重要进展；在计算能力方面，云计算、图形处理单元GPU等高算力加速硬件的出现，为处理海量地理空间数据提供了计算力支撑。

地理空间智能的技术基础，主要包含地理空间科学、人工智能、机器学习、深度学习及数据挖掘等。地理空间科学，是根据地理位置来显示、分析、理解真实世界现象和规律的学科；地理空间科学利用地理信息系统和遥感技术处理及组织空间数据，从大数据中分析空间模式[11]。人工智能是通过机器来感知客观世界，实现信息获取过程的自动化。机器学习是人工智能的子集，指计算机从原始数据中获取知识，提取信息，并解译隐含的模式信息。深度学习则是机器学习领域近十余年来最受关注的技术，通过让计算机模拟人脑特征的神经网络，使计算机从简单概念中学习复杂的经验，从而更加有效地理解真实世界[12]。数据挖掘技术注重从大数据中分析模式信息从而指导科学决策。

本文在系统分析地理空间智能的技术内涵基础上，梳理国内外科学研究进展，分析存在的问题与挑战，并展望地理空间智能的发展趋势。

1 地理空间智能概述

地理空间智能技术的主要特点，是从输入端(传感器或广义信息源)采集并存储地理空间数据，采用人工智能算法对其综合处理得到模型，在服务端对数据或模型进行应用[13-14](图1)。数据输入端的主要任务是数据采集和数据标注。算法模块的任务包含非监督学习、深度学习和迁移学习等一系列技术方法。应用服务端的任务包括部署模型、共享地理信息数据和训练好的模型等。由于观测对象在不同地区、不同季节、不同尺度呈现的空间特征不尽相同，因此，模型必须具备可拓展功能，以便服务模块根据自身的应用需要对模型进行再训练、再改进，从而满足不同的应用需求。

图1 地理空间智能概念框架Fig.1 Framework of geospatial artificial intelligence

把AI技术应用于GIS，可借助AI技术来改进GIS系统的智能性，实现基于地理空间数据的智能感知、智能认知与智能决策。机器学习是GIS空间分析的核心组成部分，主要解决分类、聚簇和回归3类问题(图2)。分类方法经历了决策树、基于知识的专家系统，再发展到现在的智能机器学习方法，例如支持向量机(support vector machine)、随机森林(random forest)、人工神经网络等。聚簇方法有空间约束的多变量聚簇、基于密度的聚簇、空间时相模式挖掘。回归方法有经验贝叶斯空间内插法、EBK回归预测、最小二乘回归和地理加权回归等。

图2 地理空间智能中主要人工智能算法及其功能Fig.2 Categories and functions of major AI algorithms in GeoAI

深度学习是一种机器学习方法，为GIS提供了强大的数据处理和信息提取工具。机器学习的过程是从数据准备到特征提取，再利用提取的特征对模型进行训练，最后对新的数据完成测试验证。深度学习方法受到大脑生理过程启发，在大脑的神经网络中，存在对刺激做出反应的神经元，它们彼此连接并传递信息。深度学习不同于传统的机器学习，特征提取不再由人工完成，而是由神经网络自主完成。

深度学习从GIS平台中获取数据，利用人工智能平台(如亚马孙云平台AWS、IBM Watson、微软Azure)和深度学习框架(如Caffe、TensorFlow、PyTorch)完成智能推理。地理空间智能中的深度学习包含以下3个步骤：①数据准备，包括数据标注、训练样本管理、训练样本输出；②深度学习模型的训练；③模型应用，指利用训练好的模型在未知数据上进行预测。深度学习可以用于分类、分割和目标提取等任务。分类模块底层的算法较多，典型的有卷积神经网络(CNN)、循环神经网络(RNN)等。用于分割的网络模型包括全连接神经网络FCN、U-Net、PSPNet等。目标提取也是地理空间智能的重要任务，常用模型包括YOLO、Faster-RCNN、Mask RCNN等。围绕地理空间智能已出现多种工具平台，下面介绍国内外的3个典型案例。

谷歌已将人工智能模块加入其谷歌地球引擎(Google Earth engine)(图3)，用户利用谷歌人工智能平台和云存储处理影像，并借助其深度学习框架TensorFlow完成数据智能化处理和分析。例如，谷歌利用Landsat影像对1984—2018年的地球表面变化信息进行可视化，并进行变化分析。

图3 谷歌地理空间智能框架Fig.3 The framework for Google GeoAI

微软发布了“服务于地球的人工智能”(AI-for-Earth)项目，应用于全球农业、水资源管理、生物多样性、气候监测等领域。微软与ESRI合作将ArcGIS Pro内核加入到微软云平台Azure上，发布了地理空间智能数据科学虚拟机(DSVM)(图4)，把人工智能、云技术和基础架构、地理空间分析相结合，服务于更加智能的地理空间分析、数据可视化等应用。

图4 微软地理空间智能数据科学虚拟机核心组成Fig.4 The components of data science virtual machine for Microsoft GeoAI

超图公司的地理信息智能框架包括4个层次：地理空间可视化、地理空间决策、地理空间设计和地理空间控制(图5)。金字塔的复杂性从底部向上增加，而成熟度在降低。超图的GIS软件与阿里巴巴新一代的数据库POLARDB对接融合，完成兼容性认证，构建云原生时空管理平台联合解决方案，并推出“云原生数据库+云原生GIS”平台，通过人工智能提升地理信息服务能力。

图5 地理空间智能金字塔Fig.5 The GeoAI pyramid

2 地理空间智能科学研究进展

地理空间智能作为传统地理信息技术在智能化方向的重要拓展，不仅促进传统地理信息产业的转型升级，也在开拓新的智能化应用领域。地理空间智能的研究进展可以分为地理空间感知智能(perception)、地理空间认知智能(cognition)及地理空间决策智能(decision)3个方面，三者层层递进(图6)。

图6 地理空间智能科学研究进展：数据与应用Fig.6 The research progress of GeoAI: data and applications

2.1 地理空间感知智能

地理空间智能研究的重点，集中在地理空间感知智能阶段，主要实现空间目标提取和模式识别，包括实现影像分类、语义分割、地物提取、实例分割等任务，与计算机视觉的任务相对应。如图7所示，计算机视觉针对二维或三维感知数据进行解译与重建；而地理空间智能针对的是特定的具有地理属性的数据，完成与测绘地理信息需求相关的任务。

图7 地理空间智能与计算机视觉的技术关联Fig.7 The technological relevance between GeoAI and computer vision

(1) 同源遥感信息感知。在同源遥感信息感知方面，地理空间感知智能的研究主要集中在土地覆盖/土地利用分类、城市功能区分类方面，方法主要是全连接神经网络实现逐像素的分类[15-16]。为使网络容易训练或记忆性更强，研究者引入局部和全局注意力机制[17]、残差神经网络[18]等思想。当前空间目标提取的研究内容主要包括地理要素提取(如建筑物[19]、道路网[17]等)和关键感兴趣目标提取(如飞机[20]、舰船[21]、野生动物[22]等)。在配准的遥感影像间或影像序列间检测地物变化，主要采用孪生神经网络作为编码器，提取出两个时相间的特征变化[23]。激光点云智能方法主要分为传统机器学习方法[24]和基于多层感知机的语义分割两类[25]。前者通过人工提取点云几何特征，并采用机器学习算法实施分类；后者直接以点云作为输入，以多层感知机作为模型主干，以加权交叉信息熵作为代价函数，输出每个激光点的标签概率。孪生神经网络也被用于点云变化检测[26]。雷达影像处理方面的研究典型包括基于数学形态学和K均值聚簇的雷达影像形变监测[27]、基于全连接神经网络实数权重核函数的复数域影像分割[28]等。

(2) 异源遥感信息融合。为克服单一数据源的缺陷，很多工作研究对配准的光学影像和DSM进行融合分割[29-31]。文献[32]利用孪生神经网络从不同模态的雷达影像和航空影像中检测变化。文献[33]以L2-Net为模型主干对无人机影像和卫星影像实施配准。文献[34]在视频序列影像分割中，通过全连接的条件随机场(CRF)将短期时间信息融入结构化场景信息，用密集光流提取视频序列的动态信息。

2.2 地理空间认知智能

地理空间认知智能的研究内容主要包括，利用空间数据挖掘和智能分析技术，从空间数据中挖掘出隐藏的模式关系和趋势[35]。基于人工智能的空间数据挖掘研究展现了较强的知识发现能力，在关联分析、聚类分析、异常检测方面都取得了进展。文献[36]利用空间多准则决策分析，基于遥感数据和地理信息系统，建立包含城区扩张、城市可用土地、土地利用变化的数据库，为城市规划提供决策。文献[37]利用街景影像分析北京市内出租车的轨迹模式，在地理空间和人类活动特征间建立联系。文献[38]通过Voronoi邻域分割和反向邻近加权进行空间自相关定量描述，分析地理文本与网络地图的相关性。基于社交媒体数据的智能时空分析，被用于2014年上海外滩踩踏事件社会舆情分析[39]、居民行为模式分析[40]、人群分布分析[41]及贫民窟分布分析[42]等。

在突发事件和应急救灾中，受灾损毁建筑物影像分类方法包括，基于梯度方向直方图特征和Gabor小波特征的分类、视觉词袋模型法(visual-bag-of-words)[43]、融合光谱特征和点云特征的多核学习法[44]等。文献[45]采用最邻近防水模型(HAND)和伪随机森林法预测洪水区域。泊松回归[46]和帝国竞争算法[47]被用于基于卫星影像的山火位置预测，残差神经网络被用于滑坡位置分析[48]。

在全球环境监测方面，文献[49]利用深度学习监测城市大气污染物浓度并预测污染态势。文献[50]利用时空回归克里金法对城市NO2的浓度进行建模。深度学习模型也被用于极地冰川崩裂面监测[51]、全球干旱区植被面积评估[52]等。人工智能方法也在精准农业和生态学中得到利用，例如城市植被覆盖普查[53]、农作物生长态势监测[54]、植被健康状况分析[55]、植被几何结构和功能属性测算[56]等。在公共卫生与健康分析中，地理空间智能对人类活动、地理位置信息及环境状况进行建模，广泛应用于环境卫生、流行病学、遗传学、行为科学等领域[57-58]。新型冠状病毒肺炎COVID-19蔓延期间，地理空间智能方法被用于群体健康数据、轨迹数据的可视化和建模，针对患者制定健康规划和干预措施等[59]。

2.3 地理空间决策智能

地理空间决策智能的研究进展包括空间态势建模、智能预测，其位于GeoAI技术环节顶端，直接服务于多样化的地理信息产业应用需求。地理空间智能通过对商业数据、运营数据的建模和分析，为销售额预测、消费者需求预测、客户分布分析、产业链选址提供支持。文献[60]采用P-DBSCAN进行空间聚类，根据游客旅游历史和当前搜索文本进行个性化的线路推荐。文献[61]使用基于GIS的模糊多准测逐层分析方法为伊斯坦布尔城区建立消防站提供选址意见。在智能交通与自动驾驶方面，GeoAI可以进行基于注意力机制的车流监控、实时跟踪、出行线路规划、交通状况监控与拥堵疏导[62-64]。

三维场景智能重建的研究主要集中在单像深度恢复[65]、基于室内点云和轨迹的室内建模[66]、含有语义信息的三维地图重建[67-68]等。文献[66]利用室内点云和轨迹，通过可视化分析和物理结构分析分割出单个房间的点云，通过基于图割方法的能量优化解决单个房间建模问题。文献[67]使用ORB-SLAM2算法对室内环境进行实时三维重建，融合目标检测方法YOLOv3进行关键帧标注，生成带有语义信息的三维语义地图。

在军事作战指挥方面，地理空间智能系统结合地图、影像情报、参战各方的地理位置数据等，对战场态势进行可视化和仿真，通过虚拟现实(virtual reality)让指挥员身临其境了解战场空间态势变化[69]。美国空军的半自动地面环境系统SAGE，处理和分析多类战场环境要素，支撑军事决策。此外，美国国家地理空间情报局(NGA)的“航行者”项目通过地理空间智能分析获取海洋环境中的地理空间要素，为美国海军作战训练行动提供支持。

3 问题与挑战

多元智能理论创始人、美国哈佛大学教授霍华德·加德纳(Howard Gardner)认为，人类具有相对独立存在且与特定认知领域和知识领域相联系的8种智能：视觉空间智能、语言智能、数理逻辑智能、身体运动智能、音乐智能、人际智能、自我认知智能、自然认知智能[70]。当前，探索和发展人工智能技术，正在向模拟和延伸人类8大智能的纵深方向迈进。研究和破解地理空间智能的技术难题，主要集中在对视觉空间智能、数理逻辑智能和自然认知智能的认识、理解、归纳、模拟、解释、效能放大及工具化等方面。

具体来说，星载、机载、车载传感器和各类物联网终端获取地理空间数据，是视觉空间感知的首要环节，其能力正在逐渐接近甚至超越人类。但是，这类数据具有体量大、获取速度快、模态多样、真伪难辨、价值不一等显著特点[71]。充分利用和深度挖掘地理数据的潜力，核心难题在于让人工实现的自然认知智能、数理逻辑智能，为空间智能增效赋能，达成地理空间智能关键技术突破的主要目标任务。完成这样的任务，近期至少面临7个方面的挑战(图8)。

图8 地理空间智能面临的挑战Fig.8 The GeoAI challenges

3.1 空间数据的多样性和不确定性

不同传感器获取的地理空间数据呈现不同结构，表征三维地球的方式也不相同。例如卫星影像是通过不同的成像方式将地表映射到栅格影像上，机载LiDAR提供的是非结构化的三维点云数据，数字地图提供二维矢量数据，3种数据属性差异很大[72-73]。在地理空间智能系统中如何对多源数据进行恰当的筛选和有效的融合，从中提取出有价值的模式特征，具有一定的挑战性。

3.2 制作训练样本成本高昂

监督学习仍然是当前解决地理空间智能问题使用最广泛的方法。监督学习依赖于大量的、多样化的训练样本。通常情况下，训练数据精度越高、类别越全面，其训练出模型的泛化能力就越高。然而，人工数据标注费时费力，效率不易提高。基于有限训练样本的深度学习，难以获得高精度模型。如何基于小的训练样本得到稳健的模型具有很大的挑战性。此外，当各个类别的训练样本数量差异大时，训练过程也更加难以收敛，结果造成模型测试时在精确率和召回率间存在较大差距，难以使二者同步达到较高水平。

3.3 GeoAI模型缺乏解释，泛化性能难以度量

地理空间智能的发展极大地依赖于人工智能算法的成熟度和可靠性。以深度学习为例，目前确定神经网络结构里的超参数(卷积层、池化层、全连接层出现频次、连接顺序等)，尚无科学的设计方法。设计在不同维度空间对数据进行拟合的神经网络模型结构，其偶然性和随意性比数学物理规则中的确定性和可重复性要复杂。泛化性能指的是人工智能模型应用于新的测试数据时的性能。随着训练数据和测试数据的属性差异增大，模型测试精度也会降低。例如，当训练集和测试集的数据来源不同的传感器、数据质量不同时，模型的泛化性能难以得到保证。

3.4 计算设备性能有限

地理空间数据指数增长、人工智能应用需求增多、机器学习模型复杂度增加，对高性能计算提出了很高的要求。以深度学习模型为例，深度学习网络越深，它能完成分类或识别任务的潜能就越大。随着神经网络加深、参数增加，模型复杂度增加，需要的训练样本数也增多，而当今的数据存储和处理能力都不足以支撑地理空间智能对于计算性能的要求。

3.5 数据和模型的共享面临挑战

地理空间智能瞄准的是数据获取及处理、模型训练和应用、智能化服务的一体化，通过共享地理空间数据和人工智能模型，可以促进整个地理空间智能系统快速发展并逐渐成熟，从而提供更精准、更高效、更智能的服务。然而，受制于高昂的数据获取成本、标注成本和模型训练成本，且不同来源的地理空间数据难以融合利用，目前数据和模型共享仍处于初始阶段，发展的路径并不十分清晰。

3.6 地理空间智能专用模型和算法缺乏

目前用于GeoAI的算法和模型大多来自通用图像处理和计算机视觉领域，融合地学特性的GeoAI专用人工智能算法或专用深度学习框架仍有待研究[15,74]。通过改造通用模型用于地理空间数据处理，一般只考虑到地理空间信息的几何空间特性，难以融合多源异构地理信息数据，难以顾及其地物光谱特性和地学知识。

3.7 技术转化与应用仍有差距

虽然人工智能技术发展迅速，学术界发表的目标提取、语义分割方法在标准试验数据上测试精度持续刷新。但学术界的GeoAI研究成果距离落地生产仍有差距，原因可归结为现实世界的复杂性和真实数据的不确定性。目前通过车载扫描系统获取遥感影像和LiDAR点云，从中提取道路网、路灯、交通信号杆等均可达到较高精度，但距离生产可靠的高精度地图产品仍有技术差距，提取的道路网、地物之间仍缺乏拓扑信息[74]。地理空间智能技术融合时空特征、像人类一样分析农作物长势或战场环境变化态势，并指挥农业生产或军事决策仍任重道远。

4 发展趋势与展望

以人工智能为强力助推器而快速发展的地理信息科学，正以前所未有的清晰度和逼真度监测与表征整个地球。地理空间智能作为地理信息科学与人工智能的交叉技术，已经迎来巨大的发展机遇。随着传感器、5G通信、云计算、虚拟/增强现实技术的发展，地理空间智能必将顺应智能时代的地理信息服务需求，行稳致远向前发展。可预见的发展趋势主要包括：

(1) 地理空间感知智能的研究逐步成熟，地理空间认知智能和地理空间决策智能将获得越来越多的研究投入。随着计算机视觉和空间数据挖掘技术的发展，影像分割、目标提取、空间数据分析、三维重建及时空预测的算法将逐渐成熟。稳健、专用的地理空间数据处理算法，保证了提取的空间模式、空间知识具有真实性、可靠性，从而可以指导精细化决策。人工智能模型也将逐步变得“有章可循”，智能模型将出现设计规范，模型设计过程将被科学化、系统化。多源空间数据融合的智能分析方法将走向成熟。

(2) 在多任务迁移学习和半监督分类方面，小样本训练问题将受到关注并走向实用、可靠。在不同来源、不同时相的遥感数据上使用模型时，模型仍能保持可靠性和稳健性。用于地理信息提取的人工智能算法将走向“通用化+定量化”，训练的模型可在许多不同的场景中使用。相应地，地理空间智能系统的性能将变得可以评估，用户可根据现实问题定量评估系统的可靠性。

(3) 地理空间智能技术将引领地理信息产品和服务的升级。在未来的地理信息服务中，高精全息地图将在国土测绘、资源开发、环境保护、社会安全监控、健康医疗、自动驾驶等领域得到更广泛的应用。地理信息服务将朝着多元化、实时化、大众化、智能化方向发展。地理空间智能系统将瞄准高维化、智能化、集成化的目标进步，且多种数据格式、不同产品和服务之间可以融合与共享。