面向数字经济的地理时空智能计算理论与应用模式
2023-09-08骆剑承吴田军胡晓东李曼嘉陆炫之吴小波
骆剑承, 吴田军, 胡晓东, 李曼嘉,赵 馨, 陆炫之, 吴小波
(1. 中国科学院 空天信息创新研究院 遥感科学国家重点实验室, 北京 100101; 2. 中国科学院大学 资源与环境学院, 北京 100049;3. 长安大学 理学院, 陕西 西安 710064; 4. 浙江科技学院 信息与电子工程学院, 浙江 杭州 310023;5. 贵州师范大学 喀斯特研究院/地理与环境科学学院, 贵州 贵阳 550001; 6. 四川农业大学 资源学院, 四川 成都 625099)
0 引言
进入“十四五”以来,我国经济已由高速增长阶段转向高质量发展阶段,调整发展方式、优化经济结构、转换增长动力已成为新时代主题[1].推动高质量发展,既是遵循经济规律实现可持续增长的内在要求,又是解决社会矛盾的根本途径.数据作为信息时代的核心要素,是理论创新和科技突破的重要工具,加快数字经济领域的技术创新和成果转化,促使新产品、新服务、新业态的出现,是实现高质量发展的关键引擎.为此,近年来,以大数据为核心的“数字中国”“数字经济”“数字政府”等建设工程方兴未艾,在推动社会经济从高速发展转向高质量发展过程中正焕发着强大的蓬勃生机,为重组我国产业体系新架构、加快产业数字化转型升级起到了积极作用[2].正因为如此,如何充分发挥大数据的基础资源作用和创新引擎效用,对于经济发展的新旧动能转换,驱动生产、生活和生态治理方式的全面深入变革具有重要的战略意义.
伴随国家大力推动数字化建设的时代机遇,高质量的大数据产品及相关服务需求应运而生,一系列服务国家和省市地方经济社会发展的大数据产品不断涌现且取得了价值持续提升的应用成效.然而,纵观当前的数字化服务,尚存在一定局限,主要表现在:1) 数据缺乏一致性和统一基准,缺乏实现信息对齐的高效技术和大型所见即所得的软件平台,造成“数据烟囱”和“信息孤岛”现象仍较为普遍;2) 低劣数据混杂,对数据资源的挖掘利用浮于表面,造成数据利用效率低,构建的应用系统脆弱而缺乏生命力[3-4].究其缘由,一个重要的原因是诸多工作缺乏时空观视域下对事物发生现象、本质规律以及各类观测数据的统一理解.事实上,“时空”具有刻画地表的唯一性,是对多源多模态发生数据进行融合处理和关联分析的结构化基准,时空型大数据及其衍生的信息资源天然是各行业管理和社会经济发展的基础性、战略性生产要素,对于开展数字化经济建设与治理、提升管理现代化水平至关重要[5].“十四五”以来,面向经济领域数字化建设需求,加强时空信息平台建设的重要性和迫切性不断提升.例如,在农业农村建设方面,国家针对粮食安全、乡村振兴方面的战略要求,陆续提出精细化、智能化监测监管的需求,以时空大数据为基础的数字化农业建设成为实现农业现代化的必经之路,数字乡村建设正成为中国农村经济变革的新方向,它们的落地必将大力带动农业农村的高质量发展.因此,时空数据支撑下的数字化信息技术必将是当前做大、做强、做优数字经济的重要依托,以“时空”为典型特征的地理信息产业服务也必会为数字经济赋能我国高质量发展发挥关键支撑作用[6].
鉴于此,我们聚焦数字经济时代的形势背景,锚定时空大数据赋能数字化建设的目标,开展地理时空智能计算理论和应用模式的研究,以期充分发挥大数据驱动高质量发展的“时空”价值,助力政府加快形成精细、智能、科学的现代化治理能力,同时为市场与社会提供精准化的信息服务支撑.从该立足出发,本文在既有时空大数据智能计算研究基础上,提出面向数字经济的“地理时空数字化底座”(geographic spatiotemporal digital base,GST-DB,简称为“时空数字底座”或“底座”)概念,旨在以时空大数据为驱动力解构社会经济事物发生演进的真实世界,利用多模态观测数据发掘流动性时空价值,在时序流动中实现重组与再生,在空间流动中调整结构与配置,在人际流动中进行多方演化与博弈,最终通过“空间—时间—属性”维度的分层解构、综合优化与精准决策,为高质量发展实施途径的选择及其评估提供理论方法支持.
1 大数据时空计算综述
基于上述研究背景与需求,本文针对时空大数据计算进行发展动态的综述,重点围绕大数据位置发现、时空信息融合以及关联分析3个方面,阐释“时空”对于大数据结构化智能分析的作用与挑战.
1.1 多源大数据位置发现自20世纪60年代以来,伴随着“数字地球”“智慧地球”概念的提出,以解决空间信息获取、处理、应用与服务为核心的“空天地一体化对地观测网络”逐步形成[7-8].在数据精准化、处理智能化、信息数字化等现实需求的驱动下,现代对地观测逐步发展成为全球覆盖、全天候检测、全要素观测的大系统[9],多源遥感平台与地面观测网所产生的对地观测大数据不断积累.与此同时,得益于互联网与移动通讯技术的发展,社交性大数据也积水成渊.两大类数据共同促进了时空大数据的快速发展,描绘了地表要素和人的行为在时间、空间和属性等方面的内容,加速了对时空格局和人地关系的理解[10].
位置是时空数据的核心特点,各类数据以位置作为空间框架对地理要素和人的行为进行表达.因此,数据位置的确定是多源时空数据聚合的基准和前提.但传统时空数据位置的确定多关注数据本身的三维坐标却忽略其与地理对象的关系,从而导致数据之间关联分析的困境[11].对此,学者们将研究空间位置的基本单元逐渐从“规则像元”或“行政单元”“流域单元”过渡到各精细的“空间对象”[12],并尝试引入分区分层思想[13]以及位空间[10]、知识图谱[14]、地理图斑[15-16]等概念,以促进多源数据的位置发现与匹配.然而,广泛的数据来源、多样的表达方式、多重的观测尺度以及密集的采样频率,极大地限制了数据应用的深度与广度[17-18],如何形成具象化、多层级、可伸缩的位置空间,是当前多源时空大数据应用朝精准、定量、可解释方向发展的重难点.
1.2 多模态时空信息聚合单源观测的信息量局限以及时空大数据的海量扩增,对多源多模态数据的有效聚合提出了更高要求[19].如何从庞杂的海量数据中抽取其中的有效部分,并将其聚合至统一的时空框架内,以全面表征研究对象的多维属性和动态特征,成为剖析各类人地现象及过程的必要环节.数据聚合以时空位置、地表实体等为线索,围绕分析目标和应用需求将多源数据映射至同一研究对象[11],因而数据与对象间的时空关系是结构化聚合的基本依据.常见的数据融合方式多以规则化的像元或网格为基本单元,经分辨率/比例尺标准化处理后相互堆叠,以实现基元在时空域或属性域的信息扩展[20-22].但多源数据采集机制不同、时空范围各异,难以实现无损对齐,且尺度的转换及叠加过程必定伴随观测数据真实性、语义完整性的削弱;同时,由于规则化基元并不与地表实体对应,难以精准匹配针对人地观测的点、线、面离散数据.因此,面对多源多模态的时空大数据,如何通过对复杂地表的逐层解构,在不同尺度识别内部均质、真实有效的空间单元,构建稳定的时空基准框架,至关重要.进一步,以此为容器,充分考虑各类数据在表达方式、覆盖范围、波动速率,以及空间单元自身环境属性等方面的差异,针对性地发展时空尺度转换、地统计、机器学习等方法,实现数据的结构化嵌入与协同计算[23-24].
1.3 多粒度关联关系分析多模态数据从不同角度描绘了地理实体的时空特征,之于地理场景的聚合之后初步实现了对地表要素和人行为的结构化表达与发展过程还原.在此基础上,通过关联分析识别对象的时空演进过程及对象、属性之间的依赖关系,实现由具体数据至时空格局、人地关系综合性结论、知识的跨越.因此,由对空间单元的简单描述转向模式挖掘[25]、规律认知[26]乃至发展预测等关联分析阶段,是大数据时空计算的关键.关联分析通常聚焦以下2个方面[10]:1) 时空关系挖掘.强调不同参量在数据集上呈现的函数关系,常见的如考虑时空特性的地理加权回归模型[27]、考虑非线性相关关系的随机森林机器学习模型[28].2) 时空模式分析.强调对象时空演进机制或对象与环境之间的依赖关系,如评估地理实体或过程分布模式的聚类分析[29]、格局分析[30],度量空间异质性的地理探测器[31]等.
有别于传统以像元为基本单位或尺度固定的分析方式,大数据时代的多源数据模态互异,时空粒度、密度、广度各有不同[10],变量统计指标及其交互关系存在显著的尺度依赖性[32],且分析的时空范围随需求波动,聚焦的时空对象粒度不一,进而决定了面向大数据的关联分析任务具备显著的多粒度特性.随之,关联分析过程亟需包括以下必不可少的计算环节:研究问题及数据的逐级解构、多粒度模式挖掘,以及系统性融合策略指导下的全局模式识别[33].其中的关键问题在于粒度的合理选取,以实现数据驱动下关联模式的最优表达和挖掘,避免虚假模式,揭示内蕴关系[34].时空位置作为信息关联的关键纽带,对地理空间的多层次抽象表达是粒度转换的有效依据.因此,对地理对象而言,时空框架提供了多粒度分析的基准,由于其构建过程遵循自顶向下的解构机制,能够在不同粒度构建与实际地表自然呈现或社会管理相对应的抽象单元;对特征参量而言,该框架能够容纳多源多模态数据,支持其协同计算和联合分析[24],并在粒度转换过程中,实现地学规律指导下的高质量数据关联对齐与关系挖掘[35],进而实现分析粒度的灵活转换,以及分析结论综合性、关系普适性、区域特殊性的合理权衡.
2 地理时空数字化底座概念模型的提出
鉴于当前数字化发展的现实需求以及时空大数据智能计算的发展动态,本文提出“地理时空数字化底座”GST-DB的概念模型,是指采用大数据、人工智能、GIS等技术,以地理实体为基础打造可表达、可计算、可应用的精准化数据生产平台,具备多模态观测数据的高效承载与关联分析能力,可面向创新场景应用提供二维/三维一体化、动态/静态一体化的地理时空信息服务,支撑社会经济建设、管理、运行、决策等环节所需的“多、快、好、省”智慧化应用.
底座的概念示意如图1所示,核心就是要从“格”“局”两方面构建一套具象化的地理知识图谱模型:一方面,对于相对稳定的地表空间(状态,类比喻之“棋盘”“铁打的营盘”),以地理图斑(geo-parcel,或地理对象geo-object)为基本表达单元,通过时空位置、地物形态、土地利用类型等信息获取,形成稳定且与要素存在状态时空异质契合的不规则形态表达单元,从而构建可定位、可量测、可表达的多粒度地理空间场景;另一方面,针对地表之上发生的内容(事势,类比喻之“棋谱”“流水的兵”),以前述地理单元为底盘,开展土地覆盖类型变化分析、指标/参数反演、质量/适宜性评价、价值精算、过程模拟、趋势预测等应用,深度解析环境依存、相互作用、粒度包含、动力传递等关联关系,从而构建具象化的地理知识图谱(geo-knowledge graph, GKG),支撑社会经济高质量发展所亟需的科学、高效、定量决策.
图1 地理时空数字化底座的概念模型设计
对于如何打造时空数字底座,本文借鉴复杂问题求解的结构化处理范式,结合地理大数据的时空特性,在理论层面进一步设计了“空间(粒化—分解)+时间(重组—约束)+属性(关联—传递)”耦合的计算模型(如图2所示),以期通过时空制图(geographic spatiotemporal mapping)方式有序解构复杂地表、解析人地关系.具体过程是:1) 粒化.在分区分层的地理学思想指导下,利用基础地理数据和高分辨率遥感影像精细剖分地表空间,筑起多粒度多层级的空间对象网络,形成稳固可靠的底座支架(空间信息图,spatial information map).2) 重组.将水、光、热、土等表征自然资源禀赋和生态环境本底,以及刻画人类活动和地表变化过程的多源多模态观测聚合于由统一空间对象撑起的底座支架之上,在多重知识约束下,以分谱、分时等方式重组数据,将多尺度连续场转换为离散格,分级呈现空间对象的多维度自然与社会属性,形成多元可信的谱序特征(特征信息谱,feature information spectrum).3) 关联.利用底座支架空间对象承载的属性信息,从空间、时间、属性等维度挖掘关联关系(如对象和环境依赖关系、对象和对象关系、对象聚合关系),基于底座位置、形态、结构构建时空视域下的地理知识图谱,在其引导下面向领域需求进行时空制图与行业应用,结合质量评价和动态验证,形成交互可控的传递优化机制与服务提升措施.
图2 “空间(粒化—分解)+时间(重组—约束)+属性(关联—传递)”耦合的地理时空智能计算模型
遵循上述计算逻辑,本文提出的时空数字底座能否被有力夯实并从中挖掘出流动性价值,根本上起决于时空制图的精准性,而这有赖于以下2类计算方法的实施:1) 图谱耦合是制备数字化底座并彰显其“时空”优势的重要抓手,图的空间位置、形态和结构为地表发生数据的融合处理和关联分析提供了结构化基准,在图的边界约束下重建各类谱序特征,能解决多源多模态数据难以匹配融合和高效关联分析的问题,亦有助于弥补单源、单时数据表征的不足.2) 星地协同是打造时空数字底座兼具“三可”(可靠、可信、可控)特性的关键,“卫星(面)观测的广域空间覆盖”与“地面(点)观测的稀疏绝对量测”两者互有长短,协同2类观测开展由点及面的推测对改善模型可迁移性、提升时空制图精准性有积极促进作用.
为此,我们为数字底座的构建进一步梳理了“地理推测系统—遥感探测星座—地面观测网络”(简称“三测”)闭环计算体系.以面向种植业的数字农业应用为例,说明如下(如图3所示):1) 分解.从地理时空结构和农业生产模式出发,通过地理分区控制、地类分层感知等环节,按照“行政区—种植区—耕地区—种植地块—像元”的多层结构,将农业生产地表空间有序地解构为形态可量测的最小种植地块单元,进而在各个层级之上关联政策引导、地形地貌、环境要素、调查统计、土地利用等信息以推测地块中的作物类型、性状、指标等参量(地理推测系统的可靠表达).2) 约束.协同长时序的多源遥感探测信号,构建地块种植作物的波谱序列,并根据局部先验物候开展分时段的谱序分析,确认推测结果的现状匹配度,并根据不确定性分析制图结果的置信度(遥感探测星座的可信计算).3) 传递.依据地块制图结果置信度的空间分布特征,动态有序下发地面调查验证点开展验证,通过关键的高信息量真值反馈来增强学习模型,迭代优化以逐步优化时空制图结果(地面观测网络的可控优化).除农业应用外,其他诸如生态、城市等领域的应用,亦可遵循该流程构建可靠、可信、可控的时空数字化底座表达与智能计算过程.
图3 以数字农业应用为案例的“三测”闭环计算体系
3 基于时空底座的数字农业应用模式
以农业应用为例,本文进一步探析地理时空数字底座的应用模式.相较于其他产业,农业产业单位面积价值密度低但全域总量高,因此,构建基于省级大区域时空底座的精准化数字应用场景具有推广意义.对此,我们基于农业产业数字化底座提出“全域数字底座—数字孪生平台—分级用户服务”为应用架构,打造以政府、企业、消费者为服务步骤的数字农业平台运营模式(图4):1) 在应用架构方面,首先按照上节阐述的流程主动生产多层级、精细到每个农业生产单元(种植地块)的数字化底座并持续更新;并同步搭建虚实交互的数字孪生基础服务平台,构建起“数据+软件”一体化的应用支撑平台;在此基础上针对不同类型用户的需求开展定制化服务.2) 在服务步骤方面,首先提供精准的政府农情服务,将时空底座与部门数据进行关联和融合,建立领导信任的同时获取政府信用背书;而后,维护起一套可信的精准农情数据,推动为大型企业和金融机构提供低成本、高效率的优质服务,进一步在底座上融合社会经济运行信息;最终,设计与建立链接生产与消费两端的运营服务平台,实现“从地块到餐桌”的消费模式革新.
图4 农业产业数字化底座的平台运营模式
如此运营模式下的农业产业数字化底座具有“精、准、快、稳、动、智”的优点,在服务内容上可以概括为“人、地、钱、事”四大类应用服务(如图5所示):1) “人”侧重于在明确地块权属后,开展地块利用方式、使用状况等的非农化、非粮化监测监管及量化评估,从而有依据地实施对人的奖励(补贴)、惩罚(罚款)和对地的治理、利用.2) “地”强调在划定的有限空间范围和一定的价值目标约束下,对地块的土地资源和外部投入或干预进行时空优化配置与精细规划,使其产生更优的社会经济效益.3) “钱”落实于金融领域,是在一定社会经济相关指标协同下,对地块的农产品产出价值进行资产核算,服务于信贷、保险等金融产品的精确计算.4) “事”发生在对农业生产变化态势的动态预测上,通过耦合自然与社会实时发生的数据,准确预判事件的发生及未来事态的发展,如病虫害、气象灾害、产量、期货等关注内容的预警预判.除数字农业的应用领域外,生态价值评估与整合开发利用、城镇增存量资源评价与优化利用等其他涉及三生空间的应用场景业务也完全可以构建于时空底座之上,有望促使原有的行业应用模式迭代升级.
图5 面向农业产业的“人、地、钱、事”四大类数字化应用服务
4 结论
以数据和信息技术为关键要素的数字经济己经成为创新发展的时代潮流,是国家经济转型和高质量发展的必经之路.时空信息作为不可或缺的资源要素,是数字经济时代推动传统行业高质量发展的重要支撑.本文在时空观视域下分析了时空大数据支撑高质量发展的潜在价值,阐释了借力大数据智能计算技术生成精准化时空信息的重要性与迫切性,并从大数据位置发现、多模态信息融合、多粒度关联分析等方面对当前的时空数据智能计算理论方法进行了进展综述和动态分析,时空大数据位置感知、表达、聚合、挖掘等方面取得的诸多研究成果彰显了“时空”对于大数据治理和场景化应用的积极促进作用.
在此基础上,我们面向数字经济的时代背景及其对精准时空信息的迫切需求,首次提出了地理时空数字化底座的概念,以期激活数据要素,构建一套具象化的知识图谱,为数字经济建设“夯实精细化底座,提升流动性价值”.针对时空底座的打造,本文还设计了“空间(粒化—分解)+时间(重组—约束)+属性(关联—传递)”耦合的计算模型,展示了其中“地理推测—遥感探测—地面观测”协同的闭环计算体系,同时结合数字农业需求,厘清了平台运营模式和“人、地、钱、事”四大类应用服务.农业应用的数字化实践案例充分展示了时空底座“赋能实体经济转型升级”的潜力,未来可以进一步拓展能源、生态等领域的应用,结合行业需求丰富、细化本文提出的框架,形成助力高质量发展的新一代时空信息产品和普适化应用模式.在我国正大力推进数字产业化、产业数字化的紧迫历程中,上述方面的工作亟待尽快实践并落地推广.