论人工智能空间分析*
2018-10-23郑敏睿郑新奇王娇
郑敏睿, 郑新奇, 王娇
①北卡罗来纳大学夏洛特分校,夏洛特 NC 28223;②中国地质大学(北京)信息工程学院,北京 100083
笔者2012年提出《论地理系统模拟基本模型》[1]论题时,感觉这些观点已经比较综合前沿。经过几年的探究,笔者所在团队基本解决了其中涉及的关键技术难点,实现了基本模型的研制和试用[2-3]。GSBM(geographic system basic model)基本实现GIS+CA(cellular automata)+ABM(agent based model)+SD(system dynamic)等的深度融合,在地块级进行了真正的时空动力学模型研制。同时还延伸出另外的成果:多级空间系统动力学模型(multilevel space system dynamics model,MSSD)[4]和超参数优化的空间分析方法[5],经过不断的优化和提升,已经达到可以进行区域地理系统模拟研究的决策支持[6]。但是,该研究已经被人工智能(artificial intelligence,AI)的新浪潮盖过。AI是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
2016年AlphaGo的横空出世,让AI成为全世界科技界关注的热点。AlphaGo采用了很多新理论和新技术,在监督学习模式中向前推进了一大步[7]。2017年AlphaGo Zero再次成为“网红”[8],给人们带来一个全新的思维视角。AlphaGo Zero已经不再采用监督学习,不再依靠人类的经验来进行学习,而是在简单的规则指引下开始没有人类参与的自我训练和学习,结果不仅发现人类所有已经发现的定式,还发现人类没有发现的新定式。在这样一个框架下,AI真正进入一个新阶段,标志着知识积累到一定程度会实现从弱人工智能迈上中人工智能,并正在迈向强人工智能的发展。
空间分析(spatial analysis,SA)是一种定量分析空间数据的方法,是揭示和阐明所有发生在地球表面的空间现象的过程,旨在为空间决策、区域规划和政策制定等工作服务[9]。曾经和正在辉煌的GIS中具有竞争力的SA,也因为智能手机、共享单车、滴滴打车、智慧城市等雨后春笋般的发展而受到挑战。在这样的背景下,对SA和AI进行讨论具有重要的意义。一方面,各种新概念不断出现,比如,人类科技发展到了中人工智能阶段,就可以实现全息化了。周成虎等专家致力于全息地图、全息空间、智能空间、空间智能等的倡导和研究[10-11];王家耀等提出“新型智慧城市‘大脑’就是时空大数据平台”[12];李德仁等在多个学术交流会报告中强调,人工智能、脑认知在全世界都被认为是现在和未来十年最重要的科学研究内容[13];IJGIS主编May Yuan教授也认为要开展空间和地理思维的认知神经科学研究[14]。有了这样的思维框架,就可以真正实现一个位置映射这个位置所有故事,或者是一个故事涉及的所有位置,并将“两个所有”继续发扬光大。另一方面,一些人建议干脆将GIS融入IT,比如李振宇认为GIS是在走向一个消亡的过程,是在走向更多的、更广泛的空间信息的一种服务之中[15]。
无论是乐观者还是悲观者都不可否认的是,我们已经进入人工智能时代。虽然人工智能有强、中、弱之分,但空间分析必须感知人工智能并快速形成SA+AI或者AI+SA,最终形成AISA。为此,本文梳理了空间分析每次“颠覆性”跨越的主要节点,简要总结了空间分析的演进和主要流派、代表理论,阐述了AISA的基本原理,预测了AISA未来的几个热点。全文没有按照一般研究的思路进行编写,而是采用“概览+拐点”的思路进行结构组织,迎合了全样本人工智能分析的新思路。希望这些观点对读者具有参考价值。
1 人工智能空间分析发展关键节点
1.1 从0到1的计算机化工作模式(SA1.0)
GIS起源于人口普查、土地调查和自动制图。1963年加拿大测量学家Tomlinson首先提出“地理信息系统”这一术语,并建成世界上第一个地理信息系统CGIS(Canada geographic information system)[16]。这样的技术发展将人们从基于纸张的全人工工作模式解放出来。人们将手工作业输入计算机,通过计算机来进行查询、统计和重复使用——这是0到1的飞跃。这个阶段的空间分析其实是“表+脑”,就是各种表格数据在计算机中,空间相关的内容在工作人员的头脑中。这是初级的人机交互模式。
“地图+数据库”的技术路线于20世纪60年代提出,其产业化发展到今天。我们现在所称的传统GIS,是指通过数据获取、数据质量控制、内业数据库管理、可视化查询分析、简单决策支持等集成手段,以电子地图为信息载体,“GIS平台+应用开发”为主要特点的系统。因此,MIS(management information system)与GIS的最大区别就在于GIS可以是“地图+数据库”模式。2002年,ESRI公司在ArcGIS 8中推出Geodatabase,称得上传统GIS的巅峰之作,《Modeling Our World》可视为GIS界一份雄心壮志的宣言[17]。
1.2 全球视野的可视化技术(SA2.0)
GIS固然有其独特的不可替代的技术优势,却不能看到全球境况和分析动态的可视化全球现象。1998年时任美国副总统的戈尔提出“数字地球”的构想。1999年11月第一届数字地球国际会议在北京召开,这是世界上第一个以数字地球为主题的国际性会议。来自27个国家的500余名代表围绕数字地球的概念和认识、理论与技术、应用前景等方面开展了交流和讨论。会议通过了《北京宣言》,出版了由徐冠华部长和陈运泰院士主编的会议论文集。之后,围绕数字地球的各种学术会议相继召开。2005年Google Earth(GE)上线运行,原来的GIS视野扩展到了全球视野,并通过特有的技术,实现了简单的基于球面的空间分析功能[18]。GE被《PC世界杂志》评为2005年全球100种最佳新产品之一,把地球的卫星图像带入我们的家庭。全球用户为从高处能看到自己的房子、汽车而兴奋,都在热捧这款软件。到目前为止,GE虽然仅仅实现了简单的空间分析功能,甚至算不上人工智能,但是其亲民的交互性让人爱不释手。我们可以确认这个软件在空间分析中有很多潜在的应用[19]。GE的Timelapse功能可以让用户通过卫星图片观看1984以来的地表变化。GE与GIS的结合也使原来单一的GIS空间分析如虎添翼,比如对登革热这种蚊子传播的疾病分析[20]、基于GE的地质数据分析等[21]。
1.3 隐LBS及其智慧应用(SA3.0)
以2012年滴滴打车上线运行为标志的基于LBS的大众化普及应用,将GIS中引以为傲的基于位置的地理数据空间分析再次推到一个新阶段。随着移动互联网的快速发展,以及 2014年以摩拜为首的共享单车的应运而生,让无桩单车开始取代有桩单车。这些发生在身边的位置数据应用,虽然我们几乎感受不到却实实在在存在,并支持着各种空间分析和决策服务。隐LBS 空间分析是指人们看不到基于LBS的空间分析及其技术,却广泛应用[22]。目前这样的空间分析状态造成了GIS的正在失去其应有的地位,逐渐走向衰落的假象。
其实,作为GIS核心技术的空间分析并没有衰退,只是像数码相机取代胶卷相机一样在发生蜕变。这种基于LBS的智慧应用能够广泛支持需要动态地理空间信息的应用,从寻找旅馆、急救服务到导航,几乎可以覆盖生活中的所有方面。LBS演化出了4个特点:从被动式到主动式、从单用户到交叉用户、从单目标到多目标、从面向内容到面向应用。伴随着智能手机、移动互联网技术和大数据技术发展,隐LBS的智慧应用将有更大的市场和潜力。
1.4 云GIS与人工智能时空决策(SA4.0)
据报道,GIS的年产值达到了百亿美元的级别,且还在持续增长,因为近几十年中很多分析优化的方法已经成熟,能在各个行业中起决策支持。当前,人工智能和认知计算正席卷全球,大数据分析、辅助决策、深度学习给人类能力的提升提供了无限的可能。如:IBM Waston 的疾病诊断准确率震撼了人类医生;摩根大通COIN仅用几秒钟就完成了人类需消耗36万小时才能完成的金融合同分析。
时间是地理对象发生、发展和消亡的主导因素。GIS应用领域的不断拓展 , 对描述和掌握地理现象的时空变化规律提出了更高的要求。同时,GIS基础理论的进步也要求系统能够更完整地去描述地理现象,不能再忽视时间变量。这两方面的迫切要求引起了越来越多学者的高度重视,预示着人工智能时空决策时代即将到来。例如,百度地图围绕语音赋能地图,使人机交互听得清、听得懂,能满足驾驶者提的需求,最大限度地实现在驾车环境下更加安全和高效操作地图,让双手得到解放。百度地图事业部总经理李莹介绍,目前百度语音识别能力已经超过了人耳的识别准确率。有了这样的实时决策支持,未来人工智能时空决策将会有更多普及化的发展。
1.5 AI思维的悄然兴起(SA4.0+)
在新技术不断更迭的社会,市场需求给传统GIS服务带来了新的挑战。用户已经不能接受功能齐全但售价昂贵,且难以拓展的纯工具类的软件服务。取而代之的是地理信息的全链条、一站式服务,如底层数据的补充、地理编码服务、数据上图、模型计算等等。人们甚至希望能够提供直接解决实际问题的分析应用。这个趋势目前仍然在探索过程中。
各行各业要从重视AI转变为AI思维,比如互联网时代有互联网思维,移动互联网时代也有移动互联网思维,思维方式随着技术发展转变已经是技术思维演进的套路。李彦宏在2017年百度联盟峰会上发表了主题为“AI时代的思维方式”的演讲,号召行业“AI First”,将AI与业务密切结合[23]。当然,作为GIS科学研究前沿的引领,空间分析中的AI思维也在悄然萌芽并快速发展,我们即将进入AISA的4.0+时代。当有类似“所想即所得”的“意念AISA”出现并规模化应用,AISA将进入5.0新时代。
2 人工智能空间分析演进
2.1 空间分析中不断有人工智能的渗透
与空间分析密切相关的地理计量研究也走过了类似的历程。20世纪60年代兴起了地理计量革命,为地理学带来了新工具,也带来了新思维。由于当时计算理论和计算工具的限制,在20世纪70年代末计量地理陷入沉寂。20世纪90年代初,随着遥感技术和GIS技术发展,地理信息科学开始发展。其间,空间分析的概念和方法在地理学、流行病学、地质学等学科都得到了广泛的推广与应用[24]。1996年第一次计算地理学术会议在英国召开,宣告了计算地理学诞生。此后,研究成果如雨后春笋般地出现,深刻影响着地理学及相邻学科。计算地理学也促进了空间分析的进一步发展。
1956年开始出现AI的相关研究,20世纪80年代就已经受到各国的关注。计算机技术飞速发展, CPU、GPU、TPU的普及应用不断提高计算机处理能力。物联网、云计算、大数据相继出现,使人工智能成为近几年的爆点[25]。以AI和SA为关键词在WOF(web of science)(1990—2018)中通过citespace进行文章分析发现,共247篇合作发表的文献,其中发表数量最多的国家是中国,其次是美国。同时,中国也是中介中心性最高的国家,较为活跃,且大部分研究都是由本国学者完成。从WOF关键词时序视角知识图谱(见图1(a))、CNKI(1993—2018)110篇中关键词聚类知识图谱(图1(b))可见,近20年间,人工智能、GIS、神经网络、遗传算法、元胞自动机、支持向量机、逻辑回归、专家系统、进化计算等成为关键词。
图1 基于Citespace的AISA分析
2.1 空间分析算法滞后AI算法发展
几十年的AI发展,基本形成了机器学习算法研究的五大门派(见表1)。传统算法和各大门派的机器学习算法需要人类知识、规则、经验和数据的支持,是一种归纳和演绎学习,属于初级人工智能[26]。
从表1可知,空间分析在机器学习发展这个过程中也逐步得到发展和演进,从简单的空间分析不断进步到复杂的空间关系分析和时空复杂预测等[27-28]。比如,利用各种模式识别技术对点对象进行智能分析和智能标识,并对结果以各种类型的决策形式进行可视化,利用自然语言研究智能化的人机界面、分析工具的自动组装和快速响应,从而使用户从繁杂的操作工具和命令中解脱出来等,甚至形成意念人机交互的科幻模式。ESRI已经建立了专门的项目团队,来探索AI和大数据在地理信息领域的前沿应用,在新版的ArcGIS 10.6软件中,将会加入与Spark等大数据软件集成应用的新功能。
需要特别说明的是,在2000年之前,空间分析关注“物”多,关注“人”少,属于数据驱动型的静态空间分析,其结果是通过人机交互来实现地理现象的分析和表达。进入21世纪,“人”的因素被越来越多地关注,尤其是智能手机的出现和大数据技术的发展,把人的思维、行为等更多地融合到空间分析中,这个趋势在未来将会更加突出。
任何智能的发展都需要一个学习的过程。近期,人工智能之所以能取得突飞猛进的进展,是这些年来大数据长足发展的结果。由于各类感应器和数据采集技术的发展,我们开始拥有以往难以想象的海量数据,同时,也开始在某一领域拥有深度的、细致的数据——这些数据都是训练某一领域“智能”的前提。AI技术让物质世界在逻辑、思维层面开始最大程度地适应、体现人的主观需求。机器主题意识的培养、目标的培养、自我学习的能力、遗传进化的能力等都使得人类多了一种认识世界、了解自己并体现价值的技术和途径。在这方面,空间分析理论和算法滞后于人工智能的理论和算法。
表1 机器学习算法与空间分析的流派和演进
3 人工智能空间分析原理
3.1 人工智能空间分析概念
通过前面的阐述,我们基本可以了解空间分析和人工智能在各自领域的发展脉络。因为“人”的参与,AISA成为具有“颠覆性”发展的一种新方法。人工智能是对人的意识、思维的信息过程的模拟。它不是人的智能,但能像人那样思考,也可能超过人的智能。空间分析就是借助人的空间认知将地理现象进行数据映射,进而再现地理现象。基于这样的思考,我们将人工智能空间分析定义为:基于多源异构的时空大数据,在地理计算和社会计算等人类创造出来的空间分析理论知识和方法基础上,根据各种可能需求和问题,集成或融合人工智能方法,通过超级计算或云(雾)计算支持,实现比传统空间分析方法更加灵活地适应问题需求,得到比单个分析方法更多结果,展示多维灵动的决策支持方案等的新方法。它具有计算速度快、适应面广、可自学习、不断自我完善功能、全样本参与、全要素决策、过程透视等特点。未来人工智能就是一名具有各种智能工具的智能分析机器人,只要给出原理、算法和假设条件等,智能分析机器人就能自动将其归类并进行计算和更好的应用。
3.2 人工智能空间分析技术框架
从空间分析的一般原理可以知道,在对样本数据不能进行全覆盖分析时,人们只能采用样本抽样来进行空间分析。根据问题性质抽取样本,选择合适的计算模型进行数据计算,验证计算结果和模型应用,我们称之为有监督的AISA,或者是不完全的AISA(表2)。
这样的空间分析原理随着AlphaGo Zero的研发成功,全样本、全自动、全智能的非监督性AISA的研究得到新进展。非监督AISA与监督AISA之间的主要区别在于是否研究时空边界内的全样本和全自动机器学习。由于空间要素的参与,AISA增加了表2中②、③两个新步骤。AISA基本原理可以概括为图2。
表2 监督AISA工作步骤
图2 AISA基本原理
从图2可知,首先,需要明确和分析的问题是时空边界,将问题可能涉及的内容全部涵盖其中,进而明确界定研究对象的空间范围和时间区间。其次,选择可能有效的计算模型,以及对模型超参数进行优化。除了选择已经成熟的空间分析方法外,为了解决问题甚至要新建空间模型,也可以用考虑多种模型的混合(融合)使用。为使模型效果最优化,不断进行超参数优化,直到达到最优。这些过程可以进行抽样样本计算,以免耗费更多计算资源。结果是否优化需要通过正反两方面的精度检验函数,比如精确度熵、损失度熵等来验证。如果精度达不到要求则返回重新进行模型选择,或者返回再次进行超参数调优。循环前述步骤,直到结果满意终止。最后,将优化后的模型和参数进行全样本的非监督机器学习、深度机器学习、增强深度机器学习等训练,实现真正意义上的中强度人工智能,甚至是强人工智能的空间分析。这就是AISA的基本原理,支撑AISA的内部计算(图3)。
在AISA工作中,要考虑适宜于全样本的时空异构数据库、混合(融合)模型,甚至是云计算、大数据和未来新的技术发明的参与(图3)。当然,支持AISA的还有超级计算,如果没有超级计算的参与,AISA还是很难真正达到预期效果的。
图3 AISA算法原理
4 人工智能空间分析主要研究热点
4.1 智能空间计算
2011年吴华意等[29]首先提出空间计算(spatial computing)概念。空间计算是利用空间原则优化分布式计算性能的计算模式。它以空间数据和社会物理现象等为对象,利用空间优化原则,研究地理空间数据分布式计算的原理及大规模模拟的有效分析方法。起初,研究集中在地学、遥感、导航和测绘等学科领域。之后,空间计算经过一系列变革也融入人文社科领域,协助我们回答各种各样关于人的行为的问题。空间计算让我们对“位置”有了新的理解,极大地改变了我们的生活。例如:我们该如何理解自己与位置信息之间的关系?如何沟通并可视化位置信息?以及如何使用导航功能?等等[30]。空间计算将原来狭义的计算机领域的分布式计算扩展到考虑空间位置分布的计算,即以空间原则主导着科学参数之间的时间与空间交互,可推动空间原则在物理现象模拟过程中的应用,进一步推动现代科学的进步。空间自相关性、非平稳性与边缘效应等,给空间预测分析带来挑战。如何将机器学习、人工智能技术拓展到这一领域,解决存在于时间与空间上的自相关性、非平稳性、多相性与多尺度的挑战,以及如何挖掘频繁出现的时间与空间模式等将是研究人员未来研究的重点内容[31]。
4.2 超参数空间优化
很多空间分析模型在运行之前,需要人为设定规则或者参数,即使AlphaGo Zero这样强大的人工智能高手也是如此。超参数就是在开始学习过程之前设置的参数。通常情况下,需要对超参数进行优化,以提高机器学习的性能和效果。在超参数优化方面,一些方法已经得到研究和应用,比如网格搜索、贝叶斯优化、随机搜索、基于梯度的优化等。DeepMind 从遗传算法获得启发,提出一种新型的超参数调优方法,其性能要比贝叶斯优化好很多,且在各种前沿模型的测试中很大程度上提升了当前最优的性能[32]。郑敏睿等[5]首次将超参数优化拓展到空间分析中,提出了“超参数空间优化”的概念和方法,并围绕这个方向进行了神经网络驱动的空间模型的多级分析研究。超参数优化,尤其是空间分析的超参数优化问题,将成为AISA的重点研究方向之一。
4.3 智能空间规划机器人
2010年开始笔者参加《全国国土规划纲要》的编制,在此过程中建立了一个具有272个图层的国土空间数据库,并在数据库管理系统中嵌入了部分空间辅助决策功能,比如通过一个县级行政区查询272个图层的所有信息,依据272个图层数据对全国国土空间进行分区,或者通过这个具有10年全国流动人口和社会经济数据联合位置信息的对国土开发进行变化分析,或者对城市群及城市扩展边界进行识别等。这种既不是基于局部的分析,也不是基于抽样的分析,而是基于全样本的全域分析或者全样本的时间动态分析,给我们带来了很多新的认识和发现。由于受到计算速度的限制,这样全样本的大数据分析技术前几年的发展曾受到短暂的影响。目前,一项新的研究——“规划机器人”正在一些研究机构如火如荼地进行。我们团队也正在致力于Demo的研发,其主要功能就是借助人工智能技术在进行城市总体规划、国土空间规划、土地利用规划等的工作中,对规划方案的实时时空模拟与预测进行可视化分析。美国北卡州立大学的Ross Meentemeyer教授团队也在进行相关的研究。相信这个方向也是GIS“重生”的一个重要阵地[31]。
4.4 全样本时空预测
随着各类传感器和数据采集技术的发展,各种数据所提供的信息量正在呈爆炸式增长。同时,空间数据的使用者也已经从专业的行业用户向更广泛的用户群扩展。传统的空间数据处理方式和空间分析模型,在效率和精度上已经渐渐无法满足用户需求。为此,未来AISA将会在多维度模型、多尺度时空数据、分布式计算能力、可视化功能、泛在移动化等方面深入发展。终极算法的诞生,可能是多种学习方式深度交叉融合的结果。以深度增强学习思想为主线的算法和框架技术将极大地拓展五大机器学习门派的功力,尤其是将时间变量引入后的可视化时空复合分析,在时空插值、时空信息预报、时空统计、时空剪裁与变换等方向将会有新突破。
4.5 空间神经网络分析
从空间分析+人工智能到人工智能+空间分析再到人工空间分析智能,可以看做是人工智能空间分析的基本进程,就像GeoHey的辉煌将来临一样[33]。
4.5.1 空间神经网络新模型
利用人类神经生理与认知科学研究人类思维和空间智能机理,并利用人类甚至高级动物神经基础理论的研究成果,基于位置智能和时间智能,用集成数理方法,学者们建立了功能更加完善、性能更加优越的适合于空间分析的神经网络模型。通过广泛而深入地研究时空神经网络混合算法和多种性能,尤其是服务于决策的各种神经网络新模型,空间分析实现了从弱人工智能向中人工智能的迈进。在弱空间分析人工智能中,我们通过稳定性、收敛性、容错性、鲁棒性和超参数优化等研究,可以开发新的网络数理理论,如神经网络动力学、非线性神经场和全时空尺度增强深度神经网络等。
4.5.2 空间神经网络进化计算
空间神经网络进化计算迫切需要增强的主要是集成基于联结主义的神经网络理论、基于符号主义的人工智能专家系统理论和基于进化论的人工生命这3大研究领域,建立神经计算和进化计算的数学理论基础,提高计算性能。同时,寻找具有计算复杂性、网络容错性和坚韧性的计算理论,使建立的模型和学习算法成为适应性空间神经网络进化计算的有力工具,从而促进地理信息科学的发展。
5 结语与讨论
空间分析过程实际上是一个地理空间建模过程,而空间分析依赖于空间分析模型,因此建立空间分析模型的过程是综合分析处理和应用空间数据的有效手段。研究空间分析模型及如何建立有效的空间分析模型已成为地理信息科学和基础地理信息科学的核心任务[35]。
本文针对人工智能的发展新背景和一些人认为GIS即将消亡的悲观论调,较为系统地回顾了空间分析发展历程中具有“颠覆性”的关键节点,总结了在这些关键节点发生的革命性变革,提出了机器学习和空间分析对应的主要流派和代表性算法,阐明了AISA的原理与技术逻辑。根据新时代对空间分析模型的不同需求,本文提出未来AISA的研究热点和发展趋势。
未来在机器学习、神经网络、深度学习和人工智能的促进下,应用时空大数据进行AISA将遇到更多的挑战与机遇。如果没有时空大数据,AISA要通用化主要取决于终极算法的能力。非监督式的强AISA的目标是机器智能化、拟人化,所想即所得的意念式AISA,需要通过深度学习、强化学习掌握的知识和经验,再结合大脑新皮层理论的时空预测框架,实现像人一样的快速智能响应。这也许就是未来几年甚至几十年AISA终极算法的革命之路。
我们也要警惕,一旦因人工智能的参与产生大量的假数据,而这些数据被AISA分析,结果将是AISA更高级的发展阶段——防伪AISA。
(2018年9月17日收稿)