数字孪生流域:未来流域治理管理的新基建新范式
2022-11-16冶运涛蒋云钟梁犁丽赵红莉顾晶晶董甲平
冶运涛,蒋云钟,梁犁丽,赵红莉,顾晶晶,董甲平,曹 引,段 浩
(1. 中国水利水电科学研究院,北京 100038;2. 水利部数字孪生流域重点实验室,北京 100038;3. 中国长江三峡集团有限公司科学技术研究院,北京 101199)
全球气候变化和人类活动叠加影响使得气候形势愈发复杂多变,导致局地强降水、超强台风、区域性严重干旱及累积水污染等极端事件的突发性、异常性和不确定性更为突出,且数量明显增多,如2021年郑州“7·20”暴雨、黄河中下游秋汛、塔克拉玛干沙漠地区洪水及珠江三角洲部分地区旱情。极端天气的超标准载荷极易造成水利工程隐患集中暴发,形成灾害链放大效应。水问题表象在河流,根子在流域,江河湖泊的流域特性决定了必须以流域为单元展开科学研究[1- 2]。解决水旱灾害频发、水资源短缺、水环境污染和水生态损害等问题,是国内外公认的科学命题[3- 4]。流域是以水为纽带的复杂开放性系统。水系统演化具有很强的不确定性,科学本质上更具综合性、协作性、跨学科性,迫切需要新的工具来支撑新的研究范式[5- 7]。同时,可获得的前所未有的遥感、地表或地下仪器监测、社会公众以及网络可用的高度复杂且无序的各种数据,需要新的工具进行处理分析和洞察理解[5]。此外,流域治理管理要求决策支持平台具有全息性、时效性、科学性和协同性等性能,亟需新的工具承载这种要求[8- 9]。
2019年Nature发表论文《Make more digital twins》[10],数字孪生研究得到国际广泛关注[11],其核心是构建仿真模型以实现信息空间和物理空间的无缝集成与实时映射[12],从而对物理空间对象进行全生命周期管控,降低复杂系统预测不确定性和规避应急事件带来的风险[13]。数字孪生以实时同步、虚实映射、高保真度等特性为拓展流域科学研究提供了一种新的工具,它与流域科学研究和治理管理相结合推动了数字孪生流域概念的诞生[14]。数字孪生流域是数字流域的高级阶段[15- 16],是实现智慧流域理想目标的最佳技术路径[17- 18],是赋予流域智慧管理的重要设施和基础能力[19]。
欧盟(European Union,EU)和美国国家航空航天局(National Aeronautics and Space Administration,NASA)先后提出了数字孪生地球计划[6- 7,20],旨在建立一个可持续演进、可交互和集成多域多尺度的数字孪生化地球,通过对大自然和人类活动的可视化、监控和预测,模拟未来气候趋势,评估灾难性事件,保护生态环境,推进地球各项管理工作精细化。数字孪生流域作为数字孪生地球的一个重要区域层次,它的开发和研究是实施数字孪生地球的一个很好的试验场所和切入点[16]。国际上,很多学者探索了数字孪生技术在水治理管理中的应用。Ghaith等[21]基于数字孪生建立了城市尺度洪水防御框架;Bartos等[22]提出了将水力求解与在线数据同化相结合的雨洪系统数字孪生模型;Alperen等[23]研究了基于ANN的水文数字孪生防洪模拟;Ranjbar等[24]建立了法国加来渠道的数字孪生框架;Conejos等[25]将数字孪生应用于西班牙巴伦西亚供配水网络;Pedersen等[26]建立了城市水系统逼真的和原型的数字孪生。在国内,在理论探索方面,与NASA提出的数字孪生概念同期,蒋云钟等[8]于2010年提出了智慧流域概念,定义中描述了通过物理流域与数字流域无缝集成实现对流域智慧化管理,已具备数字孪生的思想;此外,国内学者继而发展出“虚拟流域”理论与方法。虚拟流域属于数字流域范畴,但更强调了对真实流域对象的精准化描述[27]。这些研究为解析数字孪生流域提供了理论储备。在技术方面,水利部黄河水利委员会、清华大学、华中科技大学、天津大学等单位开展了虚拟化技术在流域管理、水利工程施工中的应用研究[27],但这些研究仅仅是利用数字化方式进行信息管理,还处于数字孪生技术的初级应用阶段,尚不具备数字孪生的特征。当前,在国家全力推动下,数字孪生流域已成为全社会焦点,如黄艳等[28]探索了面向流域水工程防灾联合智能调度的数字孪生长江建设;刘昌军等[29]研究了数字孪生淮河流域智慧防洪体系;李文学等[30]、甘郝新等[31]、廖晓玉等[32]分别探索了数字孪生黄河、数字孪生珠江、数字孪生松辽的建设方案。由于对数字孪生范式认识不足、理论研究不充分和技术挑战尚未攻克,数字孪生的真实效用尚未真正发挥[33- 34]。
综合分析已有研究成果可知,数字孪生流域的基础理论研究尚处于起步阶段,以下关键问题亟待厘清:数字孪生流域的定义及内涵特征,数字孪生流域基本模型,数字孪生流域的核心能力,数字孪生流域的关键技术,数字孪生流域亟需发展方向。通过上述问题探索,为中国数字孪生流域建设提供理论支撑。
1 数字孪生流域的概念辨析
1.1 数字孪生流域定义
数字孪生可追溯到美国密歇根大学Grieves教授于2003年前后在其产品全生命周期管理课程上提出的“与物理产品等价的虚拟数字表达”概念[35],当时没有被称为数字孪生,却具备了数字孪生的基本组成要素,被认为是数字孪生的雏形。2010年,数字孪生由NASA首次书面提出并给出了定义,即充分利用物理模型、传感器更新、运行历史等数据,集成多学科、多物理量、多尺度、多概率的仿真过程,在虚拟空间中完成映射,从而反映相对应的实体装备的全生命周期过程[36- 37]。2014年,Grieves教授提出数字孪生概念模型包括3个主要部分:实体空间中的物理产品,虚拟空间中的虚拟产品,将虚拟产品和物理产品联系在一起的数据和信息的连接[35]。尽管其他科研机构、企业和学者也各自提出对数字孪生的理解,但仍是以上述概念为基础,针对不同的使用目的进行阐述[38]。陶飞等[37]在Grieves数字孪生三维模型基础上发展出五维模型,包括物理实体、虚拟实体、服务、数据和连接。随着大数据和人工智能的发展,知识作为核心要素将在数字孪生研究中发挥重要作用[39- 40]。与数字孪生流域相关的数字孪生地球被定义为可用数据和物理规律约束的地球系统状态和时间演进进行数字复制的信息系统[6- 7],该定义的核心要素包括虚拟地球空间(数字复制)、数据、知识(物理规律约束)以及服务(信息系统)。
综合上述研究成果,将数字孪生五维模型扩展为六维模型,包括物理实体、虚拟实体、连接、服务、数据和知识。由此,将数字孪生六维模型和流域治理管理相结合,提出数字孪生流域包括物理流域、虚拟流域、实时连接交互、数字赋能服务、孪生流域数据及孪生流域知识6个基本要素。在6个要素协同下,完成对流域的动态监控、诊断评估、模拟仿真、预测预报、决策优化、管理控制等功能。其中,虚拟流域是物理流域的数字镜像,是数字孪生流域的虚拟孪生体;物理流域是数字孪生流域的物理孪生体。
从技术角度理解,与数字孪生流域相关的概念是数字孪生地球,Bauer等[6]认为数字孪生地球是地球数字复制的信息系统。如果单纯从传统信息系统的角度,无法反映新一代信息技术给各行业带来的革命性变化,更反映不出对传统基础设施改造的特点,而数字孪生流域超越了传统信息系统的范畴[41],可以认为是一种新型基础设施。从科学研究角度理解,虚拟空间拓展了地理科学研究空间,受到了国际重视,英国皇家科学院院士Batty[42]认为,发展虚拟地理学可以有效地建立起现实地理环境与虚拟空间的连接桥梁;Bainbridge[43]在Science撰文论述了虚拟世界的科学研究潜力;李双成等[44]认为在孪生空间中,物与物之间、人与人之间、人与物之间的时空壁垒被清除,一个万物感知、万物互联、万物交融的虚实交融空间将开辟地理学模拟现实、预测未来的新综合研究范式。数字孪生作为科学研究和工程实践新范式受到国际认可[38,45- 46]。
通过上面对数字孪生流域基本组成要素和数字孪生概念的分析,本文定义数字孪生流域为:数字孪生流域是服务流域全生命周期管理的全量数据和领域知识驱动物理流域和虚拟流域交互映射、共智进化、虚实融合的新基建新范式。数字孪生流域基本原理是通过物理流域与虚拟流域的精准映射与动态交互,实现物理流域、虚拟流域、流域服务系统的全流域要素、全时空数据、全领域知识及全业务流程的无缝集成和深度融合,以孪生数据和孪生知识驱动物理流域、虚拟流域、流域服务系统的全景仿真[47]、演化自治、实时同步、闭环互动与共生进化,在虚拟流域空间实现对物理流域对象全生命周期过程的监控、诊断、模拟、预测、决策、控制和管理,从而在满足特定目标和约束的前提下,达到流域治理管理决策最优。
1.2 数字孪生与传统建模仿真区别
建模和仿真是数字孪生流域的核心,但是数字孪生与传统的建模仿真仍有区别,见表1[6- 7,47]。
表1 数字孪生与传统建模仿真的区别
2 数字孪生流域的内涵特征
数字孪生流域的内涵是:基于高度集成的数据闭环赋能新体系[48],生成以自然地理、干支流水系、水利工程、气象水文、经济社会、生态环境等为主要内容的全息数字虚拟镜像空间;通过“由实入虚”,利用多维多时空尺度高保真模型的数字化仿真、虚拟化交互,形成数据驱动决策、虚实充分融合交织的智能系统;通过“以虚映实”,使物理流域对象可以在虚拟流域空间进行协同建模、仿真预测、自主演化、干预操控;通过“由虚控实”,以最优化方案在物理流域中的实施来最大程度地规避风险、减少损失、提高效益[14],实现对物理流域对象的模拟、监控、诊断、预测与控制,解决物理流域系统中规划、设计、运行、管理、任务执行等闭环过程中的复杂性和不确定性问题[6- 7,35]。
基于数字孪生流域概念定义与内涵分析,将数字孪生核心特点[49- 51]和流域治理管理相结合,提出数字孪生流域的特征,包括高度保真、演化自治、实时同步、闭环互动及共生进化。
(1) 高度保真性指河流、湖泊等自然水系以及地下含水层机构和大坝、闸门、泵站、渠道、管道等物理流域对象与虚拟流域空间中的虚拟对象不仅在几何结构和外形表观有着高度的相似性,而且水流运动状态、工程运行状态以及流域治理管理活动状态也保持高度仿真,同时要求建立描述水资源- 生态环境- 社会经济系统相互作用、共同演化的流域数字孪生模型,能够精确地模拟预测物理流域系统的时空变化过程。
(2) 演化自治性是物理流域对象(如物理空间中的水流运动)和虚拟流域对象(如虚拟空间中水流运动)遵循质量守恒、动量守恒、能量守恒等相同的物理原理进行相互独立的时空演化。如根据采集的真实河道的边界条件或假定的边界条件,在虚拟流域空间中,利用可扩展的数字孪生模型(如水文水动力模型和可视化模型)能够立体直观地自主模拟仿真推演历史或未来或某种工况条件下河道水流的演进过程,分析各种外部影响因子对河道水流状态及伴随属性的影响,从而提升数字孪生流域的推演能力。
(3) 实时同步性指物理流域对象在受气候变化和人类活动影响下处于不断变化过程中,那么这就要求虚拟流域对象与对应的物理流域对象的初始条件和动态运行时的结构、状态、参数保持一致性。利用物理流域对象(如河道)当前状态(如地形、水位、流量)的实时数据初始化虚拟流域模型运行的起始状态,以保证数字孪生模型能够实时预测物理流域对象的运行轨迹,尤其能够跟踪极端事件的变化态势。在数字孪生模型运行中,利用实测数据不断调整模型结构、状态和参数,使物理流域对象演化的物理规律与虚拟流域模型蕴含的物理规律保持一致,以保证对物理流域对象变化轨迹进行高精度的预测。
(4) 闭环互动性指虚拟流域和物理流域之间通过实时连接交互嵌入业务链中,实现数字孪生流域的闭环来实现业务赋能。一方面,通过对物理流域空间中水循环过程的监测分析以及演变规律和形成机理的深度洞察,完善和调整流域数字模型结构和参数来降低不确定性,使其更加准确地反映流域水循环特性,精准预测水循环变化趋势;另一方面,在虚拟流域空间中,利用数字孪生流域高度保真性和演化自治性,通过模拟仿真推演结果的分析评估,滚动调整水利工程运行、应急调度、人员防灾避险等应对措施,制定工程运行和优化调度等方案策略,从而改变物理流域对象的演化轨迹。
(5) 共生进化性指以数字孪生技术构成的虚拟流域和物理流域的“双胞胎”通过高度保真性、演化自治性、实时同步性和闭环互动性来实现共生融合、迭代进化,促进彼此之间的发展。对物理流域来说,虚拟流域通过复演物理流域的历史轨迹、监视和模拟物理流域实时运行态势和预测物理流域未来变化,对流域治理管理的全生命周期进行全方位掌控,为制定可行性的流域治理管理方案提供协商决策平台,从而使物理流域每条河流向“幸福河”目标逼近。对虚拟流域来说,随着“幸福河”分阶段实现,说明管理和技术人员对物理流域的运行规律认识更加深刻,从而能够对物理流域进行“精准画像”,以更加全面的精准认知促进虚拟流域的调整和升级。
3 数字孪生流域的基本模型
由前文数字孪生流域概念定义分析可知,数字孪生流域基本模型(WDT)如式(1) 所示:
WDT={WP,WV,WC,WS,WD,WK}
(1)
式中:WP为物理流域;WV为虚拟流域;WC为实时连接交互;WS为数字赋能服务;WD为孪生流域数据;WK为孪生流域知识。WDT基本架构如图1所示。
图1 数字孪生流域基本架构Fig.1 Basic framework of digital twin watershed
(1) 物理流域。WP是将物理流域信息及时反馈给流域虚拟孪生体(即虚拟流域),包括自然地形地貌、水利工程、流域治理管理活动对象及与其关联的监测控制信息化设施设备。在现有监测站网基础上,构建天空地一体化水利感知网,及时、准确地采集物理流域的水文、水资源、水利工程、水土保持、河湖、经济社会和生态环境等信息,全面掌握流域下垫面数字地形、植被覆盖、河道阻水建筑物、河滩占用、水文大断面和重要河段水下地形等信息,为“由实入虚”提供基础,支撑数字孪生流域的运行。
(2) 虚拟流域。WV是重点构建多维度多尺度的虚拟模型或数字孪生模型,包括几何模型(MG)、机理模型(MM)、数据模型(MD)、机理和数据融合模型(MM&D)、智能识别模型(MR)、行为模型(MB)、知识模型(MK),这些模型能够从多时空尺度多维度对WV进行描述与刻画,如式(2)所示:
WV={MG,MM,MD,MM&D,MR,MB,MK}
(2)
MG为描述WP几何结构和参数、空间位置与关系的实景三维模型,与WP保持时空一致性;对MG进行材质、光照、纹理等渲染,外观与WP具有高度的相似性和逼真度。MG可用BIM、AutoCAD、3dMAX等建模软件或倾斜摄影测量、激光扫描点云进行创建。
MM是气象、水文、水动力、结构、生态环境、社会经济等模型,适用于流域系统物理对象过程和参数能够观测、运动机理明晰和变化规律充分掌握、数学模型表达形式固定的情况。MD通常利用数理统计、机器学习和深度学习对海量样本进行训练建立,适用于物理流域对象物理机制不清楚、参数众多且状态变量缺少观测的情况。MM&D是将MM和MD相结合进行融合建模,分为并联型和串联型2种方式,前者是以MM为主、MD作为误差补偿方式校正MM;后者是MD通过海量样本训练获得MM的输入或者MD通过估计MM模型内部变量或参数的关系作为MM的输出。
MR是遥感、视频、语音等信息的人工智能识别模型,实现河湖“四乱”(乱占、乱采、乱堆、乱建)问题、水利工程安全运行和安全监测、应急突发涉水事件等自动识别[14]。为了增加MR的识别准确率,重视识别对象或事件样本库的构建,MR对不断积累的样本学习训练,不断提升认知能力。
MB是描述物理流域对象的实时响应及行为的模型,比如水循环健康状态评估模型、水工程安全评估模型、水工程调度模型、方案决策模型、水工程控制执行模型及节水效率评估模型等。
MK是通过对流域知识进行存储计算的模型。知识模型可以通过知识图谱方式进行构建,随着规律、规则、经验日益丰富,能够自主学习和演化,对WV进行同步校正和一致性分析,既能提高WV的实时判断、动态评估、持续优化及精准预测的能力,又能提升WP的精细管理、自动控制与安全运行水平。
(3) 实时连接交互。WC由业务网、工控网、政务网、互联网、传感网及通信协议、输入输出设备、安全保障设施及相关技术组成,实现物理流域、虚拟流域、数字赋能服务、孪生流域数据和孪生流域知识间的高效连接传输、协同交互操控及同步迭代优化,如式(3)所示:
WC={CPV,CPD,CPS,CPK,CVD,CVS,CVK,CDK,CDS,CKS}
(3)
CPV实现WP和WV之间的交互,利用水利传感器、数据采集中间件等采集WV数据,通过Modbus- RTU、OPC- UA等协议传输给WV,用于实时校正各种水利数字模型;采集的WV的模拟分析、仿真预测、方案决策等数据转化为控制指令和管理措施,既能传输至物理设备执行器进行控制,又能传给相应管理人员进行操控。
CPD实现WP和WD之间的交互,利用与CPV类似实现方式采集数据至WD,反过来,WD经过融合同化处理后的数据或质量反馈指导WP的健康运行。
CPS实现WP和WS之间的交互,利用与CPV类似实现方式采集数据至WS进行更新和优化;WS产生的诊断分析、决策优化、管理措施和控制运行等结果以大屏端、电脑端和移动端方式推送给用户,以人工方式实现对事件的管理和设备的调控。
CPK实现WP和WK之间的交互,利用WK反馈指导WP的健康运行。
CVD实现WV和WD之间的交互,通过JDBC、ODBC、OLE DB、数据库网关等数据库接口实现,WV一方面把模拟分析、预测预报相关数据实时传输至WD进行存储,另一方面能够实时读取WD中的融合同化数据、关联分析数据、物理流域对象的全生命周期数据等用于驱动水利模拟分析、预测预报。
CVS实现WV和WS之间的交互,可以通过Socket、RPC、MQSeries等软件接口[36]实现WV和WS的数据收发、消息同步、指令传递等双向通讯。
CVK实现WV和WK之间的交互,WV推导的规律性结果、生成的方案反馈给WK进行存储管理,WK反过来指导WV的建模、仿真与预测。
CDK实现WD和WK之间的交互,一方面通过数据挖掘的可用结果实时传输至WK进行存储;另一方面,WD能够读取WK的知识指导数据挖掘。
CDS实现WD和WS之间的交互,利用与CVD相似的实现方式,一方面将WS产生的数据实时传输至WD进行存储,另一方面通过读取WD中的水利实时、历史、预测等数据以支撑业务运行及优化。
CKS实现WK和WS之间的交互,利用与CVD相似的实现方式,一方面将WS产生的知识实时传输至WK进行存储,另一方面通过读取WK中的规则、算法、模型等知识以支撑业务运行及优化。
(4) 数字赋能服务。WS是数字孪生流域建设的目的,面向水行政主管部门、水利工程运行管理单位、社会公众、技术开发运维人员等不同用户,通过集成物联网、大数据、云计算、人工智能、虚拟现实、区块链等技术,实现物理流域与虚拟流域的平行运行,以虚拟流域在虚拟空间中的实时更新数据反馈优化物理流域,如式(4)所示:
WS={Sf,Sb1,Sb2,Sb3,Sb4,Sb5}
(4)
Sf是面向技术开发运维人员的功能性服务,将数字孪生流域中各类水利数据、水利模型、水利算法、水利仿真、统计分析和计算结果进行服务化封装,以工具组件(如监测预警组件、协同填报组件等)、中间件(如数据交换中间件)、模块引擎(如模拟引擎、知识引擎、仿真引擎等)等形式支撑数字孪生流域的感知、传输、数据、模型、知识、仿真等功能的运行与实现。Sb1、Sb2、Sb3、Sb4、Sb5是面向水行政主管部门、水利工程运行管理单位以及社会公众,基于深度和强化学习、知识引导和推理、群智协同优化、智能控制等先进数字技术,以应用软件规范输入输出,以“大屏、电脑、手机”或“三端合一”提供的工程安全运行、业务高效管理、资源优化配置与调控、生态环境保护、应急快速处置、公共主动服务等业务性服务。
(5) 孪生流域数据。WD是数字孪生流域的动力源,是建设数字孪生流域的基础,主要包括WP数据(DP)、WV数据(DV)、WS数据(DS)及融合同化衍生数据(Df),如式(5)所示:
WD={DP,DV,DS,Df}
(5)
DP主要包括河流、水库、灌区、引调水工程等的基础数据、属性数据及监测数据;DV主要包括WV相关的几何尺寸、空间位置、外观纹理等几何模型相关数据,模型边界条件、模型参数化时空分布等数学模型相关数据,外部条件变化、水系统响应及运行状态调整等行为相关数据,边界条件约束、调度控制运行规则、流域实体关联关系等规则数据,以及基于上述模型开展的模拟评价、预测预报、调配优化等的仿真模拟数据;DS包括Sf的流域算法和模型、流域数据处理方法等相关数据和Sb的流域防洪、水资源管理与调配等业务管理数据;Df是对DP、DV、DS进行数据治理(如数据转换、数据预处理、数据分类、数据关联、数据集成、数据融合等)后得到的衍生数据,通过融合自然水系、水利工程、流域治理管理活动等实况数据与“时间- 空间- 业务域”关联数据、历史统计数据、专家经验知识等数据得到的“信息- 物理”融合数据[37]。
(6) 孪生流域知识。知识通常分为描述性和程序性知识,由事实、概念、过程和规则组成[52]。因此,WK包括事实知识(Kf)、概念知识(Kc)、过程知识(Kp)和规则知识(Kr),如式(6) 所示:
WK={Kf,Kc,Kp,Kr}
(6)
Kf主要包括法律法规、标准规范、规章制度及水利对象之间关系、专家经验、视频识别的样本、遥感识别的样本、语音识别的样本等;Kc主要包括流域治理管理中所涉及的概念,如河流、水库、水资源分区等;Kp主要包括面向特定流域科学问题的计算过程模型以及经过演化推导过程后的最终结论(如地下水位管控的阈值、降水与径流的定性或定量关系、历史场景等);Kr主要包括预报调度方案、业务流程规则等。
4 数字孪生流域的核心能力
为反映高度保真、演化自治、实时同步、闭环互动、共生进化等特征需求,数字孪生流域应具备7种核心能力,即物理流域感知操控能力、全要素数字化表达能力、实景可视动态呈现能力、流域数据融合供给能力、流域知识融合供给能力、流域模拟仿真推演能力和孪生自主学习优化能力。
(1) 物理流域感知操控能力。数字孪生流域根据物理流域的结构、特征和承载的资源、生态环境和社会经济功能,在流域上布设雨量、水位、流量、水质、泥沙、墒情、位移、形变、视频、位置等传感器以及利用卫星、航空遥感“感知”真实的物理流域,形成空天地集成传感网,通过各类传感器资源接入管理实现物理流域对象的泛在实时连接、全息协同感知以及运行态势诊断[53],支撑对物理流域对象、过程和行为的智能化感知、识别、跟踪、管理和控制。通过虚拟流域对各种流域治理方案优化,对物理流域进行智能干预和远程操控使其运行达到最优,进而为虚拟流域迭代优化提供海量运行数据,使得数字孪生流域具备自我学习、智慧生长的能力[10]。
(2) 全要素数字化表达能力。数字孪生流域对物理流域各种管控对象全要素进行精确的数字化标识,利用流域、区域、计算单元等编码相结合以及空间剖分和时间细分整合的方式对物理流域对象进行唯一标识,支撑数据资源互联互通。通过新型智能数据采集设备,对物理流域进行多维度、多层级、多粒度的数字化及语义化描述[54- 55],能够在虚拟流域空间重现拟真物理流域,从粗到细、从宏观到微观、从地上到地下、从外部到内部复制、仿真或预测物理流域的状态和过程,实现物理流域空间在虚拟流域空间中的精准映射,为数字孪生流域可视化展现、智能计算分析、高保真仿真模拟、智能决策等提供数据基础。
(3) 实景可视动态呈现能力。数字孪生流域感知、汇聚、融合物理流域对象全生命周期的数据,获得流域地理地貌、土地利用、工程、降水、土壤水分及生态环境、社会经济等全方面的时效信息,通过对物理流域对象进行多层次实时渲染及可视化呈现,支撑对空间分析、大数据分析、仿真过程的多终端一体化展示,不仅能够真实展现流域地形地貌、自然环境、工程背景等各种场景,更重要的是能够将运行机理复杂、结构复杂、且内部状态和过程不可见的流域系统变得透明,帮助决策者全面深入地了解物理流域对象的性能、运行状态及趋势、历史信息、运行环境和任务需求等[56- 58],有效支持流域资源配置、生态环境保护和工程安全运行。支撑视频虚实融合、倾斜摄影动态加载等,能够提供虚拟场景的自动实时动态演变、运行态势自动实时动态还原。
(4) 流域数据融合供给能力。数字孪生流域能够全面汇聚、关联集成流域多源、多类型、多形态的水资源、生态环境和社会经济等数据,提供涉水全空间(空中、地表、地下、水中)、涉水全要素、涉水全过程的一体化流域数据融合能力[59- 60]。能够在保证流域数据及时、全面、准确、完整要求的前提下,以实时数据流方式按需供给几何模型、机理模型、数据模型、知识模型、业务模型等多维度多尺度模型,支撑更为精确全面的流域结构、功能和行为的动态呈现和可视化表达[61],更准确地实现动态监测、态势诊断、趋势预判、虚实互动等核心功能。
(5) 流域知识融合供给能力。数字孪生流域能够从Word、Excel、PPT、csv或JSON、XML、HTML等文件进行导入、读取和存储,解析成流域的概念、实体、事件、关系等相关知识源。能够提供自然语言处理、知识抽取、知识融合和知识加工能力,以及集成表示学习、关系推理、属性推理、事件推理、路径计算、比较算法等模型能力。具有稳定高效的知识谱图架构以灵活适应流域资源优化配置、生态环境保护、工程安全运行等不同应用场景需求[62]。
(6) 流域模拟仿真推演能力。数字孪生流域能够在虚拟流域空间中通过数据建模和事态拟合进行某些特定事件的评估、计算、推演,同时具备预测流域未来运行态势的能力,即给定外部环境信息,数字孪生流域模型能够对流域特性进行较高准确度的计算推演,结果可用于防汛态势诊断、治理决策方案优化等应用场景。与物理流域相比,虚拟流域具有可重复性、可逆性,全景数据可采集、重建成本低、试验后果可控等特性[63]。通过提供空间类模拟仿真、流程类模拟仿真、空间- 流程综合类模拟仿真等能力,可以为流域规划、应急处置等方案的评估与优化提供细化的、量化的、变化的、直观化的分析与评估结论。
(7) 孪生自主学习优化能力。数字孪生流域模型系统可以利用深度学习、强化学习、对抗学习、粒子滤波、集合卡尔曼滤波等在线学习算法,融合领域知识和专业模型,利用实时采集流域数据更新模型计算边界条件,实现孪生模型的结构和参数的自我学习和持续优化,实现高精度的仿真模拟。
5 数字孪生流域的关键技术
5.1 科学问题
结合数字孪生流域概念、内涵、特征,围绕数字孪生流域基本模型和核心能力,将制约数字孪生流域构建的核心科学问题归纳为两方面:一方面是如何实现物理流域向虚拟流域保真建模,另一方面是如何实现虚拟流域向物理流域反馈优化。
(1) 实现物理流域向虚拟流域保真建模。物理流域对象空间分布广、行为特征不同,建立精准映射的前提是要根据不同物理流域对象的时空演变特点,优化布局可靠的感知装置、构建高效传输的连接以及海量数据的接入与处理方式。由于流域系统复杂性,影响水循环系统运行的环境因素多,水循环系统运行状态存在随机性和不确定性,应充分结合物理机理建模和数据驱动建模的优点,构建物理流域与虚拟流域融合的动态多维、多时空保真模型,同时要平衡虚拟流域环境模型保真度与计算复杂度之间的矛盾,根据研究对象和场景的变化能够实现模型自适应动态匹配和无缝切换,从而保证以有效计算资源支持模型高效求解、数据快速分析与场景沉浸渲染[63]。
(2) 实现虚拟流域向物理流域反馈优化。流域治理管理决策影响因素众多、约束条件复杂、目标维度高、非线性特点突出、时效滞后,传统的单一时空尺度、单目标最优的决策模式已无法满足可变时空下的综合效益最优,需要构建物理流域和虚拟流域之间的迭代交互与动态演化模式,实现物理流域系统运行数据驱动下的虚拟流域模型自主学习与进化。虚拟流域通过与物理流域之间数据、知识的双向流动,利用人工智能将数据与知识深度融合,进而对流域治理管理决策方案进行挖掘分析,生成最优方案与执行指令反馈给物理流域对象。
5.2 关键技术
围绕上述2个科学问题,需要突破6项关键技术,包括物理流域对象全景感控与共融关键技术、虚拟流域高保真模型构建关键技术、数字孪生流域实时连接交互关键技术、数字孪生流域孪生数据关键技术、数字孪生流域孪生知识关键技术及数字孪生流域数字赋能服务关键技术,如图2所示。
图2 数字孪生流域关键技术组成Fig.2 Composition of key technologies of digital twin watershed
5.2.1 物理流域全景感控与共融关键技术
物理流域的全面感知是实现数字孪生流域的基础。虽然具备了较为全面的空间信息基础设施,但如何有效地集成利用、构建一体化空间信息基础设施、应对“三多现状”(多观测融合、多协议互联、多主题交互)和“三高需求”(高时空感知、高精度感知、高智能感知)一直面临巨大挑战[64],而构建空天地集成化传感网是应对这一挑战具有希望的解决方案[64]。空天地集成化传感网,利用高速通信网络和无处不在的感知手段,遵循观测、数据、处理和服务等标准规范,集成现有空间信息基础设施,采用异构资源集成管理、多平台协同观测、多源数据融合,以及信息聚焦服务等多种方法和技术,构建互联互通的流域感知基础体系[53,65]。
(1) 新型监测设备研制。水文监测要素主要包括水位、流量、雨量、水质、泥沙含量。水文传感器虽然在业务应用中发挥了重要作用,但是由于国产化设备较少,尤其存在针对江河断面水流和泥沙通量在线监测国产化设备少、设备计量校准装置少、监测精度不高等突出问题,亟需研制基于声学、光学、雷达等传感技术的水流流速在线监测和基于光学、声学等传感技术的泥沙含量在线监测等国产化关键设备,研发流量和泥沙在线监测关键设备计量校准方法及量值溯源关键技术与方法体系,研制计量校准装置。高寒高海拔河流湖泊水文要素在线监测技术与装备、水文仪器装备检验测试装备等亟待攻克。另外,还需要开发面向复杂环境的低功耗水环境综合阵列传感器[66]。同时,加强智能测绘设备研制及技术攻关,以快速构建及更新实景三维流域[54- 55]。
(2) 地面传感网节点布局。地面观测网设计过程中,如何设计最优化的传感器节点布置方案,从而能够准确捕捉关键生态水文变量的时空异质性特征,为流域集成模拟研究提供高精度的输入数据,同时节省运维成本。例如,以优化雨量站网为目标,有学者提出了一种考虑地形影响和特殊选址要求的“点观测- 面覆盖”型传感网站点(雨量站)最大覆盖模型,形成了面覆盖观测优化布局方法[64];以优化流量站网为目标,有学者提出了一种基于线目标交点集的“点观测- 线覆盖”型传感网站点(流量站)最大覆盖模型,形成了线覆盖观测优化布局方法[64]。
(3) 流域遥感对地观测。新型卫星传感器愈发精细与多样,且时间、空间、光谱分辨率显著提升,在流域下垫面要素、水循环过程、生态环境与灾害监测等领域的作用日益显著。随着基于流域遥感试验构建的流域土壤- 植被- 大气等相关参量遥感反演方法的不断优化,众多有价值的流域遥感数据产品如流域地物类型、植被结构参数、植被生长状况、水环境参数、水循环参量与资源管理等,以及与之相关的遥感产品生成方法不断涌现,如何从纷繁复杂的遥感信息产品中,挖掘出有用的流域管理信息,成为流域管理的最后一公里瓶颈[67]。同时,还需要针对流域管理需求发展水循环地表状态变量探测卫星、水循环地气通量探测卫星、冰冻圈(固态水)的专题卫星等。
(4) 边缘智能与协同。包括对人工智能算法与模型的边缘侧处理和适配。基于深度学习架构下的模型及机器学习算法,对人工智能模型及算法在边缘侧进行剪枝、量化、压缩,通过软件定义的轻量化容器技术,实现物理资源的边缘侧应用,通过多参量物理代理实现多种传感接入、业务分发、边缘计算及区域自治,最终实现高性能、低成本、高灵活性的人工智能技术边缘侧下沉。
(5) 空天地传感器集成管理。开展海量传感器组网通信、异构传感器接入、传感网资源管理、传感网服务组合、流式数据挖掘分析和地理信息互操作等技术研究;研究协同多源异构感知资源的新方法,包括传感器信息建模、观测能力评价、协同监测、点面观测数据融合和按需聚焦服务等方法。
(6) 工程群耦联智能控制。针对明渠非恒定流输水的水动力学过程具有强耦合、大时滞等非线性控制特点,需将控制算法与渠道运行方式结合,开展渠道运行方式、控制方式和闸门控制算法的适用性和匹配性研究[68];研究分段子系统渠道水力特性对控制系统影响的物理机制,探索合理的渠道运行方式,并研制闸泵控制器;改进渠道运行的闸泵群联合控制模式,开发动态耦合控制模式和控制算法;研发冰期输水过程控制技术,制定冰期输水的闸泵群安全调度操作程序;研究极端、事故条件下的分级、分段控制模式,研发能够处理常态和应急工况的闸泵群全自动控制平台。
5.2.2 虚拟流域高保真模型构建关键技术
数字孪生建模是精确刻画物理流域对象的核心,它使数字孪生流域能够提供监控、仿真、预测、优化决策支持功能性服务以满足流域治理管理的需要[69]。
(1) 流域高保真建模。引入先验知识改善机器学习模型的可解释性、鲁棒性与可泛化性,是突破目前人工智能在流域应用瓶颈的一个重要方向。流域系统在长期的生产实践中积累了大量的逻辑规则、代数模型、物理模型等,将上述机理知识引入数据驱动的分析方法中,可降低对训练样本数量及质量的要求,使机器学习模型具有应对动态环境的能力。针对不同场景下模型的获取难度,物理机理与数据驱动融合建模方法可分为数据模型对机理模型的改进、机理模型对数据模型的指导以及构建混合模型等[70]。
(2) 模型与观测数据同化。数据同化成功地融合了先验的模型信息和大量观测信息,以概率方式调和了模型和观测,批判式地渐进真值[71]。数据同化已成为地理系统科学方法论的重要组成部分,它以新的范式改进了地球系统的可观测性和可预报型。但面临着广义和严谨的数据同化数学框架、自然- 社会系统的数据同化、数据同化不确定性研究以及与机器学习新方法的融合等问题[72]。
(3) 模型资源共享与集成。对多源异构的流域模型进行标准化、规范化的描述,以屏蔽流域模型的异构型,也需要具有模型广泛共享能力,帮助模型使用者发现、获取和使用散布在网络中的流域模型,支持模型的共享与重用[34]。根据流域过程内在机理,对多流域模型进行尺度适应、计算网格转换、数据匹配、逻辑连接与整合。同时,在集成模拟过程中,还需要对参与集成的各种子模型(或组件、模块)进行控制与优化,对误差和不确定性进行跟踪和量化,因此需要大力发展集成建模环境,推动集成建模过程中的模型选择、整合集成、过程控制,从而实现面向多要素、多过程乃至全要素、全过程的集成流域建模[34]。
(4) 模型可信度评估。模型可信度评估是一项非常复杂的过程,涉及对大量定性和定量指标的测量与评估,评估过程中通常还需要依赖领域专家的判断,同时需要将不同类型的测量与评估结果进行综合处理。如今的流域模型越来越复杂,状态变量与输出变量众多,变量关联关系复杂多样,如何度量复杂模型的可信度,已成为建模与仿真领域的关键难题[73]。因此,需要针对数字孪生模型在构建检验、运行管理、重构优化、迁移复用、流通交付等阶段开展系统性评价理论和方法研究[74]。
(5) 模型高性能计算。实时性是衡量数字孪生系统性能的重要指标。随着地理信息系统、数字高程模型、遥感、航测和雷达等遥测技术的发展,流域模型输入所需的降水、蒸发、地形、土地覆被、土壤等信息的时空精度不断提高,模型模拟的空间范围越来越大,时空分辨率越来越趋于精细化。随着洪水监测预报、非点源污染、水资源评价管理及气候变化等科学问题的深入研究,需要根据实际应用开展多学科交融、多过程耦合的分布式模拟。传统流域模型所采用的串行计算方式,限制了模拟的时空范围和精度,不利于多要素、多过程的耦合,亟需发展并行计算技术。硬件架构(多核CPU、GPU和计算机集群等)的发展和并行环境(MPI、OpenMP、CUDA和Hybrid等)的逐步完善,为流域模型并行化研究提供了软硬件支撑[75]。
(6) 模型沉浸可视化。传统的数字流域平台在地理空间元素的真实可视化和流域管理的强大决策支持方面存在局限性,需要开展数字孪生模型沉浸式可视化研究[56- 57]。主要研究流域场景管理、场景重构以及场景输出等场景控制技术;利用场景与模型的耦合机制,实现流域场景与流域模型的有效融合,通过将不同尺度的流域模型运算与结果展示构建到真三维的虚拟环境上,实现从宏观到微观多尺度流域现象展示、分析与预测[56- 57];融合数据索引与加速技术构建多感知数据分离与调度引擎,实现不同感知数据的识别、分离、调度与同步,针对不同设备性能、网络带宽条件上可视化流畅性需求,自适应地调整输出内容、输出格式与绘制质量;最终实现专业虚拟现实环境、高性能工作站、移动设备以及三维显示器、三维鼠标、漫游/触感头盔等多感知设备的协同运作,实现沉浸式、多感知交互的虚拟流域环境的表达与人机交互[76]。
5.2.3 数字孪生流域实时连接交互关键技术
在物理流域与虚拟流域模型、数据、知识和服务的连接中,物理流域对象的识别、感知和跟踪至关重要。因此,RFID(Radio Frequency Identification)、传感器、无线传感器网络和其他物联网技术至关重要。数据和知识的交换需要统一的通信接口和协议技术,包括协议解析和转换、接口兼容性和通用网关接口等[77]。由于人类在物理和虚拟世界中都与数字孪生交互,因此人与计算机的交互技术,如VR(Virtual Reality)、AR(Augmented Reality)、MR(Mixed Reality),以及人与机器的交互协作都应纳入考虑。鉴于模型的多样性,模型和数据、知识的连接需要通信接口、协议和标准技术,以确保虚拟模型和数据、知识之间的稳定交互。同样,服务和虚拟模型之间的连接也需要通信接口、协议、标准技术和协作技术。最后,必须合并安全技术(如设备安全、网络安全、信息安全)以保护数字孪生流域的安全[77]。
(1) 实时连接。主要用于确保数字孪生流域不同部分之间的实时交互[77]。当前,接口、协议和标准的不一致是数字孪生流域连接的瓶颈。有必要研究通用的互联理论、标准以及具有异构多源元素的设备[77]。随着数据流量持续以指数级增长,诸如多维复用和相干技术之类的研究热点可以提供更多的带宽和更低的延迟访问服务[77]。面对海量传入数据,一种有前途的解决方案是构建具有数千万条小型路由条目的超大容量路由器,以提供端到端的通信。有必要开发新的网络体系架构,以实现对网络流量的灵活控制并使网络更为智能。随着通信带宽和能源消耗的增加,有必要为绿色通信开发新的策略和方法[77]。
(2) 本体映射。要实现知识的共享,就需要建设本体之间的映射,本体映射是分布式环境下实现不同本体之间知识共享和互操作的基础性任务。本体映射系统可分为预处理组件、映射发现组件、资源组件、匹配器组件、映射表示组件。对于流域而言,需要基于领域知识特点建立领域本体的映射方法,主要是针对解决水问题的需求,使用具体的领域规则、启发式学习或者是背景知识进行辅助映射,能够提高领域本体映射的准确率[78]。
(3) 虚实映射。通过数据采集、信息集成获得统一规范的数据,对虚拟模型的自定义属性绑定对应的数据接口,将模型与数据关联起来。同时虚拟模型的物理、行为、逻辑需要在几何模型中体现、关联与集成,达到物理流域与虚拟流域的初步融合。为了实现进一步的虚实深度融合,研究虚- 实数据订阅传输模式,实现虚实空间的动态映射。基于数据采集、数据集成和数据匹配等,可以通过数字孪生实时呈现流域运行状态,实现物理流域与虚拟流域的数据同步[79]。
(4) 数字主线。数字主线是数字孪生技术体系中最为关键的核心技术,能够屏蔽不同类型数据和模型格式,支撑全类数据和模型快速流转和无缝集成,主要包括正向数字主线技术和逆向数字主线技术两大类型[80]。正向数字主线技术以基于模型的系统工程MBSE(Model- Based Systems Engineering)为代表,在数据和模型构建初期就基于统一建模语言UML(Unified Modeling Language)定义好各类数据和模型规范,为后期全类数据和模型在数字空间集成融合提供基础支撑;逆向数字主线技术以资产管理壳AAS(Asset Administration Shell)为代表,面向数字孪生打造了数据/信息/模型的互联、互通、互操作的标准体系,对已构建完成或定义好规范的数据和模型进行“逆向”集成,进而为数模联动和虚实映射提供基础。
(5) 网络安全。数字孪生方便了流域治理管理,但是隐藏着黑客、病毒等的入侵和攻击。网络化和数字化进程加快,越来越多的核心资产被网络集成和管理的同时,也被暴露在网络空间中,成为潜在被攻击的对象。针对数字孪生系统的信息安全问题,以数字孪生安全大脑为核心,提出以主动防御为目的基于云边协同的安全数据交互及协同防御、仿生的平行数字孪生系统主动防御、仿生的平行数字孪生系统安全态势感知、基于免疫系统的数字孪生系统主动防控、基于AI(Artificial Intelligence)的数字孪生系统的反攻击智能识别等技术[81]。
5.2.4 数字孪生流域孪生数据关键技术
保障高质量的数据资源是实现数字孪生精准映射和保真建模的基础。数字孪生提出了对数据全面获取、数据深度挖掘、数据充分融合、数据实时交互、数据通用普适以及数据按需使用的新需求[82],因此需要基于互补性、标准化、及时性、关联、融合、信息增长和服务化等准则,研究数字孪生流域数据“交互- 存储- 关联- 融合- 演化- 可视”全生命周期全链条数据技术。
(1) 数据交互。包括数据采集、数据降维、数据压缩、数据中间件和数据一致性评估等技术。其中,数据采集技术可通过传感器、网络爬虫、软件接口等多种方式从各部分数字孪生流域数据中提取连接数据;数据降维技术可减少无关数据、冗余数据;数据中间件技术实现数据格式、接口及通信协议的转换,保证数据统一传输;数据一致性评估技术实现数据距离计算、一致性评估阈值设定等。
(2) 数据存储。面向具有不同结构、格式、类型、封装及接口等数据,研究数据统一建模、数据库管理、数据空间扩展、数据集成等技术。其中,数据统一建模技术实现对各类数据的统一转换与描述;数据库管理技术支持基本数据操作;数据空间扩展技术能够适应不断增长的数字孪生流域数据;数据集成技术可消除数据孤岛,保证数字孪生流域数据的全面共享。
(3) 数据关联。包括数据时空配准、数据关联关系挖掘、知识挖掘等技术。数据时空配准技术使数字孪生数据在时间上同步、在空间上属于同一坐标系;数据关联关系挖掘算法支持对数据分类、关系及相关性分析;知识挖掘技术进一步从数据分类、关系及相关性中提取知识。
(4) 数据融合。包括异常数据检测、粒度转换、异构数据融合、数据融合容错机制、数据融合算法等技术。异常数据检测技术在数据融合前去除异常数据;粒度转换技术可将不同粒度的数据(如稀疏数据和密集数据、原始数据和数据特征、抽象符号和具有实际意义的数据)转到相同粒度;异构数据融合技术可融合具有不同类型、结构、采样频率的数据;容错机制可增强数据融合的鲁棒性。
(5) 数据演化。包括复杂网络建模技术、传播动力学建模技术。其中,复杂网络建模技术支持数据关联关系网路的构建并基于信息测量技术可评估网络节点信息量、信息分布、信息累计量;传播动力学建模技术可分析从单个数据到融合数据的信息传递,动态描述信息传播过程。此外,可从信息增长、变化、传递过程中挖掘数据进化规则,优化对融合数据类型、方法、机制的选择。
(6) 数据可视。包括文本、网络或图、时空及多维数据等可视化技术。其中,文本可视化能够将文本中蕴含的语义特征(如词频与重要度、逻辑结构、主题聚类、动态演化规律等)直观地展示出来;网络或图可视化的形式主要是基于节点和边的可视化、具有层次特征的可视化等;时空数据可视化是反映物理流域对象随时间进展与空间位置所发生的行为变化,通常通过物理流域对象的属性可视化展现;多维数据可视化方法主要包括基于几何图形、基于图标、基于像素、基于层次结构、基于图结构及混合方法等。
5.2.5 数字孪生流域孪生知识关键技术
数字孪生流域知识库是在时空数据库基础上通过知识抽取、空间或非空间关联,形成领域知识网络,基于语义推理和空间计算,实现知识重组,为用户提供时空知识服务。时空知识库针对抽取或收集的每一类知识,厘清其内涵、来源和用途,进行详细的粒度划分,有效揭示和形式化描述流域的概念、实体、属性及其相互关系,构成知识图谱。关键技术包括知识建模、知识抽取、知识存储、知识融合、知识计算和知识表达,实现从知识加工、知识图谱构建到知识表达的深度序化[83]。
(1) 知识建模。基于多源知识进行结构化建模和关联化处理,构建本体模型,实现实体、属性、关系的有序聚合,指导知识的抽取。知识建模除了用到语义关系外,也要充分考虑时间和空间关系。
(2) 知识抽取。将蕴含于信息源中的知识经过分析、识别、理解、筛选、关联、归纳等过程抽取出来,形成知识点存入到知识库。知识抽取除了从结构化、半结构和非结构化数据中抽取实体及其概念、语义关系和属性,还需利用空间分析、知识挖掘、深度学习等技术,从二维或三维空间数据中发现蕴含的实体空间分布格局、空间关联、空间关系、时空演化等过程性知识[83]。
(3) 知识存储。知识存储方式的质量直接影响到知识查询、知识计算及知识更新的效率,主要分为基于表结构的存储和基于图结构的存储,前者代表为关系型数据库,后者代表为图数据库。图数据库的数据模型主要是以节点和关系(边)来体现,也可以处理键值对。相比传统的关系型数据库,查询速度快,操作简单,能提供更为丰富的关系展现方式,成为知识存储的主流工具。
(4) 知识融合。旨在消除实体、关系、属性等指称项与事实对象之间的歧义,形成高质量的知识[84]。从多源异构文本中获取知识,存在大量的数据冗余和空间或逻辑不一致的问题,需要借助实体链接、本体对齐、实体匹配、属性空间化等技术进行知识融合[83]。在知识融合前,应当进行知识归一化处理,清洗、规范知识表达。然后,通过语义相似度计算和实体相似度计算记录实体链接。经过知识验证,进行概念、属性、实力层次的语义对齐,达到知识融合的目的。
(5) 知识计算。针对已建的知识图谱所存在的不完备性和错误信息,将知识统计与图挖掘、知识推理等方法和场景应用相结合,提高知识的完备性和扩大知识的覆盖面。知识统计和图挖掘的方法是基于图特征的算法来进行社区计算、相似子图计算、链接预测、不一致检测等;知识推理是从给定知识图谱中推导出新的实体、关系和属性。
(6) 知识表达。不同于计算机领域对知识表达的定义,流域时空知识表达应当从时空的视角,将隐性知识同地图表达相结合,形成静态表达、动态表达以及交互式表达等模式,直观地反映格局差异、趋势特征、成因机理等系统性知识,便于人们识别和理解知识。
5.2.6 数字孪生流域数字赋能服务关键技术
数字孪生流域数字赋能服务是将数据、知识、模型、应用程序以及计算存储资源封装在服务中[84],屏蔽底层各种数字孪生资源的异构性和复杂性,基于云计算架构,根据不同用户的需求提供个性化、便捷性的数字孪生云服务。目前水系统多是单部门或行业内开发,网络互联的广度和深度不够,各种数字孪生资源的移植性差、扩展性不强,感知- 数据- 知识- 模型- 应用的服务链条尚不完整,导致数字赋能服务研究较少。借鉴其他领域研究成果,归纳数字孪生云服务研究重点包括服务生成、服务搜索与匹配、服务评估与推荐、服务优选与组合、服务供需匹配、服务调度与容错等技术[78,84]。
(1) 服务生成。针对计算存储、数据、知识、模型、应用程序等不同类型的数字孪生资源,研究数字孪生资源服务建模和数字化描述方法,对其进行规范统一的描述。基于Web本体语言(OWL)、语义Web服务描述语言(Web Service Description Language,WSDL)、网络本体语言描述模型(Web Ontology Language Description Logic,OWL- DL)等,构建适合于数字孪生资源特点的服务描述语言;在此基础上,研究能够适应流域治理管理业务需求的服务封装逻辑(如服务描述接口、服务操作接口及服务部署接口),对各种数字孪生资源进行注册和发布,为服务搜索与匹配(即服务发现)提供基础[85]。
(2) 服务搜索与匹配。在云环境下,用户根据流域防洪、水资源管理与调配、水利工程建设管理等业务的需求,在云服务平台上提出数字孪生服务资源的请求,云服务平台根据预设的匹配算法搜索与用户服务请求相匹配的服务资源,将其推荐给用户。数字孪生服务资源的搜索与匹配问题属于多属性决策优化问题,可采用语义描述相关技术制定搜索匹配策略,并构建服务发现框架与搜索机制,研究服务供需匹配模型和方法,同时研究服务评估和推荐方法,以提高服务资源与业务需求之间匹配的效率和精准度[86]。
(3) 服务优选与组合。针对流域治理管理中防洪、水资源管理与调配、水生态环境保护等多种数字孪生资源服务的需求业务,从云服务平台得到满足各子任务功能性约束需求的待选服务资源集体中各选1个服务资源,按照一定的顺序组装成组合资源服务,协同完成该任务资源服务任务的过程。服务组合问题是个多目标规划问题,因此研究以服务质量为主要函数目标,求解算法可用智能演化算法,以发挥其在速度、通用型、编码难易度上的优势[86]。
(4) 服务调度与容错。服务调度就是经过调度策略的优化得到服务申请的响应接口,形成服务分配方案输出。接口执行分配方案处理服务申请,进行服务的选择,即从服务集中选出最合适的服务匹配服务申请,并将结果通过接口反馈给用户。在数字孪生平台运行过程中,除了考虑I/O、调用的前提条件和效果等基本属性之外,还应考虑运行状态、业务关系等动态属性[87]。伴随数字孪生平台的运行,服务及其组合服务的执行可能会不可避免地发生某些故障。因此,服务调度故障的检测和恢复也是研究重点。
(5) 服务执行评价。服务执行评价反映了用户对服务使用效果的反馈信息。硬件资源、软件资源和智力资源所形成的服务效用不同,在评价方法、评价指标选择方面也需要有所区别。服务执行评价需要对服务资源的使用全过程进行监控,以了解服务资源和业务需求之间的供需情况。通过对服务执行情况进行评价,部分服务可能因为资源描述与实际运行状况不符、服务能力达不到用户需求等原因,从资源服务库中被删除。也有部分资源特别是智力资源在阶段任务执行完成后,因知识沉淀和累积以及服务能力的提高、可参与的服务范围增大,与其对应的资源描述信息会被调整修改,而等待下一次被用户检索[86]。
6 数字孪生流域亟需发展的方向
6.1 发展趋势
数字孪生流域作为流域治理管理所需的感知、数据、知识、模型、服务等核心的绝佳载体[39],为“大云物移智链”技术与流域治理管理融合的潜力释放创造了有利条件[63]。网络化是感知单元、数据单元、知识单元、模型单元、服务单元等打破孤岛、协同联动激发更大价值的发展趋势。随着感知网、数据网、知识网、模型网和服务网形态的构建,数字孪生流域才能真正在流域治理管理中具有增值效益,为元流域(元宇宙在流域治理管理中的应用)或水利元宇宙或更大尺度的元水圈发展奠定基础[88],循序推进智慧流域建设。
(1) 感知网。中国已形成了地面站网体系,以水利部门为例,截至2020年底,中国县级以上水利部门各类信息采集点达43.4万处,其中,水文、水资源、水土保持等各类采集点共约20.9万处,大中型水库安全监测采集点约22.5万处。截至目前为止,中国智能手机用户已超过10亿。另外中国对地观测卫星初步建成了包括气象、海洋、资源、环境和减灾、高分等较为完善的对地遥感器和卫星系统及应用系列卫星体系[89]。未来流域感知体系的发展趋势就是构建具有感知、计算和通信能力的传感器网络与万维网结合而产生的空天地集成化观测网络,构建智慧流域的综合感知基站[90],对物理流域各种状态进行立体、即时和准确感知,通过一系列接口提供观测数据与空间信息服务,从而在正确的时间、正确的地点将正确的信息传递给正确的人或物的4R灵性服务[66],为流域资源优化配置、生态环境等综合管理提供数字化基础。
(2) 数据网。2010年3月Science的文章指出科学技术的发展正在变得越来越依赖数据,图灵奖获得者Gray也指出数据密集型科学发现将成为科技发展的第四范式[91],中国学者也指出流域科学研究需要加重大数据的研究。随着流域计算和大数据研究的发展,如何基于动态实时观测大数据、快速提取流域事件和行为的格局和过程信息、科学分析其演化规律并提供主动的智能服务,是流域时空大数据实践所面临的新挑战和新机遇。截至2020年底,中国省级以上水利部门存储的各类数据资源约2 887项,数据总量约6.02 PB,但是水利数据仍存在内容不全面、准确性不高、频次参差不齐、价值密度较低、共享程度不高、更新周期长、开发利用水平低等问题[14],可用数据的供给与流域防洪、水资源管理与调配、河湖管理保护等智慧化应用的需求尚无法实现时空精准匹配。数据供给与需求失衡成为制约水利大数据分析和应用亟需克服的“痛点”,更是数字孪生流域理想目标实现亟需打破的“瓶颈”。因此,涉水大数据的获取、处理、分析与挖掘在数字孪生流域研究中仍是重中之重。大数据时代对流域科学中的数据集成、数据和模型的集成提出了新的挑战,需要加强无缝、自动、智能化的数据- 模型对接[34],为此,高级别的自动数据质量控制、高层次的数据集成以及数据向模型的推送技术都十分关键。
(3) 知识网。知识图谱能够提升数字孪生流域的语义理解和知识推理能力[92]。流域知识图谱是领域知识图谱在流域治理管理和科学研究中的具体应用,较通用领域知识图谱,往往需要可靠的知识来源、更强的专业相关性和更优质准确的内容[93],它将流域的数据信息表达成更加贴近人类认知世界的知识表现形式,具有规模巨大、语义关系丰富、质量优秀、结构友好的特性[91]。流域知识图谱旨在充分利用流域物联网承载的数据信息,以结构化方式刻画流域系统中的概念、实体、事件及其间的关系,为涉水行业产业链提供一种更有效的跨媒体大数据组织、管理及认知能力。结合大数据与人工智能技术,流域知识图谱正逐步成为推动流域人工智能发展的核心驱动力之一。但目前流域知识图谱应用场景相对有限、应用方式仍显得创新不足,因而在一定程度上显得内生驱动力有所不足。如何有效推动知识图谱的应用,实现基于流域原生数据的深度知识推理,提高大规模知识图谱的计算效率与算法精度,一方面需要认真剖析流域数据与知识的特性,在认知推理、图计算、类脑计算以及演化计算的算法上多下功夫;另一方面,有待加强知识图谱标准化测试工具的建设。
(4) 模型网。流域虚拟模型是数字孪生流域建设的核心,是能够体现数字孪生智能化协同交互和自主性进化的根本。通过对水文过程的模拟,促进对流域水循环和生物化学过程的理解,重点在天空地集成化感知网支持下,以区域气候模式为驱动,以分布式水文模型和陆面过程模型为骨架,耦合地下水模型、水资源模型、生态模型和社会经济模型,形成具有综合模拟能力的流域集成模型,全面揭示水循环及其伴随物理、化学和生物过程的发生及演化规律。但由于水系统的复杂性,传统的机理模型过参数化和建模条件简化,导致模型运行过程中的误差累积效应使模拟预测轨迹越来越偏离真实轨迹,为了解决上述问题,一是要开展流域科学基础研究,利用大数据深化对水系统演变规律与相互作用机理的认识,改进模型结构对物理流域的精准描述;二是在模型运行演进中动态融合持续的观测数据,实时校正模型状态变量和参数,调整模型运行轨迹;三是以机器学习和深度学习为基础构建数据驱动模型,并融合多维度多尺度模型形成高保真模型。除了对模型进行研发外,需要开发一个支持集成模型高效开发、已有模型或模块的便捷连接、模型管理、数据前处理、参数标定、可视化的计算机软件平台。模型平台应具有的特征包括[34]:① 平台中既包括地表水、地下水、陆面过程、生态过程、植被生长等自然过程模型,也包括土地利用、水资源调配与管理、经济、政策等社会经济模型;② 支持模型向流域尺度扩展;③ 支持从分钟到年、数十年甚至上万年的时间尺度模拟;④ 支持数据同化和模型- 观测融合;⑤ 集成知识系统,充分利用非结构化信息;⑥ 集成机器学习技术;⑦ 具 有在网络环境下运行的能力,支持云计算;⑧ 具有快速定制决策支持能力。
(5) 服务网。数字孪生流域服务是云计算和数字孪生结合的新型服务模式[94]。融合现有的云计算、物联网、语义Web、高性能计算等技术,将各类资源(包括硬物理设备、仿真系统、计算与通讯系统、软件、模型、数据和知识等)虚拟化、服务化,并进行统一的、集中的智能化管理和经营,实现智能化、多方共赢、普适化及高效的共享和协同,通过网络为流域全生命周期管理提供随时可获取的、按需使用的、安全可靠的、优质高效的服务[95]。它由云提供端(云服务提供者)、云请求端(云服务使用者)和云服务平台(中间件)组成,其中,云提供端通过云服务平台提供相应的资源和能力服务;云请求端通过云服务平台提出服务请求;云服务平台根据用户提交的任务请求,在云端化技术、云服务综合管理技术、云安全技术和云业务管理模式技术等支持下寻找符合用户需求的服务,并为云请求端提供按需服务[95]。
6.2 赋能领域
数字孪生流域系统通过借鉴产生于工业互联网领域的数字孪生理念,以水利行业为例,结合流域防洪、水资源管理与调配、河湖管理保护、水利工程建设与管理等业务,阐述数字孪生流域赋能领域,主要包括赋能流域感知、赋能流域认知、赋能流域智能、赋能流域调控、赋能流域管理等方面。
(1) 赋能流域感知。即利用数字孪生流域对流域自然规律掌握基础上,补充水利传感器的不足。从理想角度而言,在流域自然社会系统布设更多的水利传感器能够更好地跟踪捕捉流域自然水系、水利工程和水利治理管理活动的运行状态,但是庞大数量的水利传感器要求前期投入大量资金以及后期还要投入很多运维成本,因而要求结合潜在收益研究分析和实践验证,寻找最佳的水利传感器布设方式。数字孪生流域和大数据相结合,基于“自然- 社会”二元水循环规律和演变特征、部门共享数据、天空地监测数据、社交媒体数据,可以对没有布设水利传感器的自然水系、水利工程和水利治理管理活动对象的状态进行推算和了解。
(2) 赋能流域认知。流域水利系统是以流域为单元,由水资源系统、生态环境系统、社会经济系统组成的相互作用、耦合共生的复杂性系统,如极端降水和超标洪水形成机理、自然水循环和社会水循环演变机理和变化规律、江河变化机理和泥沙冲淤规律等基础性科学问题仍有待研究。可以采用整体论和还原论相结合的综合集成思路,利用数字孪生流域的虚拟流域不断模拟水利系统的运行特性,形成水利大数据集,以大数据分析方法探索未知物理流域对象的时空特征和变化规律。
(3) 赋能流域智能。流域智能主要体现在物理流域对象的自我感知、自主学习、自主判断、自主预测、自主决策和自主执行的进化能力。虚拟流域以在线、全面的运行方式,通过在线实时的模拟仿真、历史数据的萃取、经验数据的积累形成海量的样本数据,利用深度学习、强化学习总结物理流域对象的特征构建物理流域对象的运行规则和知识图谱,并进行不断的自我训练,获得最优决策方案以指导执行操作,再根据执行效果进行再训练,增加虚拟流域的“智商”,提高不确定场景的应变能力。
(4) 赋能流域调控。数字孪生流域可以预演洪水行进路径、洪峰、洪量、过程,动态调整防洪调度方案;根据流域内不同区域生产、生活、生态对水位、水量、水质等指标的要求,预演工程体系调度,动态调整和优化水资源调度方案。由于河流、渠道、管道等组成的水利工程群存在输入数据多输出变量多、模型存在非线性、随机扰动频繁等问题,数字孪生流域可以作为水库群、引调水工程、灌区等闸门、泵站联合控制的仿真测试平台,在不同水动力边界条件下获得闸门、泵站的控制运行规律,为全面评估闸门、泵站的预测控制、最优控制等算法适用性提供闭环验证环境,以实现水利工程群的准确控制和性能优化。
(5) 赋能流域管理。数字孪生流域可以有助于管理者动态掌握水资源利用、河湖“四乱”、河湖水系连通、复苏河湖生态环境、生产建设项目水土流失、水利设施毁坏等情况,实现权威存证、精准定位、影响分析,加强信息共享和业务协同,支撑上下游、左右岸、干支流的跨层级、跨行业、跨部门之间对涉水日常事务和应急事件的联合防御、联合管控、联合治理,赋能依法实施流域统一监督和管理。
致谢:感谢水利部黄河水利委员会寇怀忠正高级工程师对本文的指导!