大尺度水文模型参数不确定性分析的挑战与综合研究框架
2022-05-10苟娇娇缪驰远徐宗学段青云
苟娇娇,缪驰远,徐宗学,段青云
(1. 北京师范大学地理科学学部,北京 100875;2. 城市水循环与海绵城市技术北京市重点实验室,北京 100875;3. 北京师范大学水科学研究院,北京 100875;4. 河海大学水文水资源学院,江苏 南京 210098)
水文模型是研究水文过程、提供科学可持续水资源规划管理决策的重要工具[1- 2]。传统水文模型研究多集中在流域尺度,且流域之间往往被认为不存在水文联系[3]。随着气候变化及人类活动不断加剧,流域水循环势必会受到全球水文大循环和跨流域人类活动的影响,传统流域尺度研究结果无法为更大尺度(如区域、国家与全球范围)水管理提供科学决策支持[4]。大尺度水文模型在预测洪水和干旱事件、大尺度水资源管理与规划、生态系统可持续发展以及应对未来气候变化[5- 8]等方面不可或缺,发挥着极其重要的作用。另外,大尺度水文过程模拟还有助于分析陆地水文过程在全球/区域气候系统中的作用,包括土壤水分—大气间相互作用对大气环流反馈[9]以及水资源对生态系统服务和碳氮养分循环的调控[10]。
20世纪80年代起,由于水情预报工作对水文模型模拟精度要求的不断提高,如何认识、描述并减少水文模型不确定性这一问题逐渐受到国内外学者重视,并被国际水文科学协会(International Association of Hydrological Sciences,IAHS)列为水文科学领域23个悬而未决的问题之一[11]。水文模型模拟性能受到大量难以直接观测的模型参数的强烈影响,模型参数作为水文模型不确定性的重要来源之一,参数不确定性分析与参数估计一直是水文领域研究的重点方向[12- 14]。参数率定(优化)是水文工作者广泛采用的提高模型可靠性的基本方法,可以帮助建模人员尽可能准确地搜索最优参数值,使得模型输出与观测变量之间差异最小化。然而,目前已有的参数估计方法在大尺度水文模型实际应用中难度仍较大,主要体现在以下几个方面:① 大尺度水文模型相较于传统流域水文模型结构复杂,更精细的参数化方案使得参数数量急剧提高,参数估算面临严重的计算资源限制;② 复杂水文模型参数间交互作用较强,一定程度增加了全局最优参数的搜索难度,进一步加剧了水文模型参数不确定性分析的复杂性;③ 由于观测条件限制,大部分地区缺乏有效的水文监测数据,大尺度水文建模面临无资料流域参数估算难题。此外,大尺度水文模拟范围较广,往往跨越多个水文气象区,模型参数具有一定时空异质性[15]。不同水文气候条件下模型参数时空物理特征如何有效表达,尤其是无资料流域参数估计,也成为大尺度水文模型应用的瓶颈问题[16]。因此,如何高效、合理地获取大尺度水文模型参数仍是水文界面临的巨大挑战之一[17- 19]。
国内外专家针对大尺度水文模型参数不确定性分析效率、准确度的提高及无资料流域参数估算开展了大量研究工作,先后开发了一系列如Sobol′参数敏感性分析[20]、SCE- UA(The Shuffled Complex Evolution)参数自动优化算法[14]及多尺度参数区域化(Multiscale Parameter Regionalization,MPR)[19]等一系列参数不确定性分析方法,取得了丰硕的成果。但目前大尺度水文模型参数不确定性分析工作主要集中在单一的不确定性方法评估,现有研究对参数不确定性分析框架的概念、内涵及分析方法的系统性研究有待进一步加强。本文力求深入阐述参数不确定性概念与大尺度水文模型参数不确定性分析的应用难点及挑战,系统介绍参数不确定性分析框架“敏感性分析—参数优化—参数区域化”(Sensitivity analysis—Optimization—Regionalization,SOR)的重要性,指出该领域未来亟需加强研究的重点方向,以期更好地为明晰水文过程规律、厘清陆地水循环系统各组分相互作用机制以及制定适应气候变化的水管理计划提供理论依据与方法参考。
1 大尺度水文模型参数不确定性研究发展与挑战
1.1 参数不确定性研究发展
不确定性概念最早可追溯到19世纪德国物理学家海森堡提出的基础量子力学理论“测不准原理”,可以将其理解为对事物认知的可能性组合。模型不确定性源自于在对真实自然世界的物理数学描述过程中产生的一系列不可预见性与偶然性。在水文学领域,随着水文模型的蓬勃发展及对水文模拟结果准确性要求的不断提高,水文过程模拟的不确定性分析受到国内外学者广泛关注[14,21- 23]。水文模型包含众多定义模型特征的参数,如使用描述流域特征的各种参数来估算径流[24- 25]。参数不确定性是水文模型不确定性来源之一,可以理解为在忽略模型输入数据及模型结构等不确定性因素的前提下,参数误差带来的模拟或预报误差[12]。模型参数不确定性分析有助于提高模型模拟精度,增加模拟值与观测值间匹配程度[2,26]。模型参数不确定性的量化与率定是水文模拟的重难点问题,其最终目的是希望通过某种准则或结合专家经验获得更为客观的参数真值估计,使得模型模拟要素与观测要素之间误差某种度量最小[2,21]。
大尺度水文模型作为一种认识水文科学规律与分析水循环机理的重要工具,主要通过高分辨率及高空间异质性的土壤水文过程表达实现对水循环系统的大尺度模拟。然而,大尺度水文模型在实际应用中难度较大,主要存在以下3个方面问题:① 模型参数数量较多,参数率定计算资源负担较大;② 高空间异质性模型参数间交互作用显著,全局最优参数求解难度较大;③ 大尺度水文模拟面临无资料流域参数估计问题,参数区域化过程中难以量化流域物理特征异质性对模型参数的影响(图1)。以上困难阻碍了大尺度水文模型参数的高效、准确及全区域范围估计,影响了水文模型在水资源管理决策中的应用。接下来将对3个应用难点问题进行分析。
图1 大尺度水文模型应用难点与其可能解决方案Fig.1 Schematic diagram of the difficulties and corresponding solutions of large- scale hydrological model application
1.2 水文模型参数数量向高维度发展
水文模型是对水文循环规律的数学物理描述,其发展经历了由简单到复杂,即由概念式水文模型到半分布式水文模型,再到基于物理机制的分布式水文模型的过程(表1)。最早的概念式水文模型采用计算机程序对流域水循环的各个组分进行建模[27],以模拟流域尺度水文过程,此类模型的早期代表有斯坦福模型与萨克拉门托土壤蓄水量模型[17- 18]等。概念式水文模型不考虑整个流域的内部差异,以流域参数平均值代表全流域平均物理状况;半分布式水文模型是对整个流域进行简单空间划分,并假设每个划分的子流域参数是统一的。整体上看,概念式与半分布式水文模型结构简单,可调参数数量较少,平均参数数量在20个以内(表1)。
表1 不同类型水文模型可调参数数量信息概述
随着地理信息系统技术的革新以及对水文过程理解的不断深入,水文工作者们不断改进与提高水文模型的模拟能力,在水文建模过程中整合了更复杂的地球物理特征与空间异质的气候下垫面状况,开发出一系列基于物理过程的分布式水文模型,如SWAT(The Soil & Water Assessment Tool)模型与VIC(The Variable Infiltration Capacity model)模型。大尺度分布式水文模型的水文过程表达较传统模型更为细致,增加了模型参数的空间异质性表达,这使得模型参数数量向高维度发展[2],例如,SWAT模型中与地下水、土壤、作物、径流、侵蚀、河道与融雪过程相关参数数量达41个,VIC模型的3层土壤及植被参数数量达46个(表1)。水文模型结构复杂性与参数数量成倍数增加给参数不确定性分析工作带来一系列困难,例如,模型参数的观测误差可能会影响模型参数在区域尺度上的代表性,过参数化(参数数量冗余)也会增大参数之间复杂的相互作用,增加模型参数不确定性量化与率定的难度。
1.3 模型参数间交互作用
对于水文模型参数,以往研究表明野外实际观测的物理参数值可能与实验室测量的数值存在较大差异,参数值的变化范围甚至跨越多个数量级[39]。另外,某些分布式水文模型物理参数呈空间异质性,参数间具有一定交互作用,这使得全局参数的准确估计与搜索任务趋于复杂化。从方差分解的角度来看,单个参数的变化对模型模拟的影响称为一阶效应,或主效应。高阶效应是2个或多个参数同时变化对模型模拟结果的影响。越来越多研究发现,水文模型参数间存在一定的高阶效应。Shi等[40]通过集合卡尔曼滤波器与多元水文变量观测值对陆面分布式水文模型Flux- PIHM进行多参数估计,发现土壤水分特征曲线模型的van Genuchten土壤参数之间、地表与地下参数之间在最优收敛后存在强相互作用;Munoz- Carpena等[41]发现VFSMOD水文模型中饱和水力传导率与初始土壤含水量参数之间存在交互作用;Liu等[42]通过贝叶斯多因子分析方法评估SWAT模型参数不确定性对模拟结果的影响,发现有效土壤含水量与土壤层厚度参数之间交互作用明显,表明土壤深度显著影响植物对土壤水分的吸收;张兰影等[43]对VIC模型作参数敏感性分析,发现模型可变下渗率曲线形状参数与最上层土壤层厚度参数有明显交互作用;由此可见,参数间交互作用在水文模型模拟能力和参数优化中起着重要作用;但同时必须承认,参数间交互作用的存在也会导致大尺度水文模型参数不确定性分析任务难度与计算负荷增加。
1.4 无资料流域参数估计
用于大尺度水资源管理的模型预测工具本质上是由数据驱动的,即需要应用已知的水文资料进行率定。最简单情况是将模型直接应用于有资料流域,但广袤的无资料流域分布增加了大尺度水文模型参数估计难度。由于水文模型在无资料流域缺乏可用资料,参数不确定性分析工作较难开展。目前,许多国家和地区的水文观测数据存在明显数据空白与数据缺失,有资料流域规模通常小于应用模型参数的有效规模。例如,在全球径流量数据库(Global Runoff Data Base,GRDB)中,水文观测站点的控制流域面积仅占全球陆地面积的22%。另外,由于地形、气候、经济和政治等原因,地面水文站空间布设受到很大限制,一些基础性数据由于各种自然因素或人为因素的限制而无法获得。有关全球水文站网分布的研究还表明,受运营资金不足、不完善的数据监测体制、长时间序列水文数据价值认识的缺乏以及少数自然灾害、国家政治动荡等因素影响,世界许多地区水文站点的数量呈显著下降趋势[44]。除此之外,一些原本已具备资料的流域可能因为大规模的人类活动(如土地利用变化、人工引水)使得历史水文资料被“污染”而成为新的无资料流域,进一步增大无资料地区面积比例。如何在无资料情况下,借助其他有效数据“近似率定”来获得流域的水文模型参数,是水文模型参数估计与不确定性分析的重要难题之一。国际水文科学协会还将无资料流域的水文预报问题(Prediction in Ungauged Basins,PUB)作为21世纪水文研究的难点问题。PUB计划以减小水文预报模型参数不确定性为核心,改进水文模拟精度,实现水文理论的重大突破,以满足世界各国特别是发展中国家国民经济生产和社会发展的需要。目前,大尺度水资源管理还对PUB模型开发和应用提出了新的要求,即如何在不进行大尺度模型参数率定的情况下,从空间数据集中推导出模型参数值,保证建模的效率与有效性。不断发展的格网结构分布式水文模型也增加了PUB参数不确定性分析的难度,大面积尤其是在矩形格网结构上的参数不确定性分析更加难以实现[45]。
2 参数敏感性分析—优化率定—区域化系统框架
近年来,针对上述大尺度水文模型应用难点,国内外学者已开发多种参数不确定分析方法用于解决水文模型参数估计难题(图1),并已逐渐形成基于参数敏感性分析、参数优化以及参数区域化方法的综合分析框架“敏感性分析—参数优化—参数区域化”(Sensitivity analysis—Optimization—Regionalization,SOR)[2,46- 47],为水文预报科学提供理论指导和方法支撑(图2)。SOR框架的思路是,首先从1组设定的水文变量相关参数中筛选出对模拟过程重要的模型参数(图2(a)),减少可调参数数量,以应对大尺度复杂水文模型参数高维性问题。在得到参数敏感性分析结果后,有针对性地对重要参数进行参数优化。应用参数自动优化算法(如遗传算法与SCE- UA等),快速定位复杂参数空间(参数交互作用较强)中参数最优解。针对有观测资料的流域,参数自动优化算法将模拟水文变量逼近观测值,以使水文模型的可靠性最大化,改善流域径流模拟效果(图2(b))。无资料流域无可用观测水文信息,通过应用参数区域化方法将有资料流域参数信息转移到无资料流域,建立模型参数与地表特征间传递关系,解决无资料流域水文预报不确定性难题(图2(c))。
在更准确更高效地描绘陆地大尺度水文循环过程的需求驱动下,国内外水文学家越来越重视对大尺度水文模型中SOR框架的研究。1996年,Duan等[21]发起国际间模型参数估计实验项目(The Model Parameter Estimation Experiment,MOPEX),致力于强化对水文模型地表参数化方案中先验参数不确定性的理解。Beven和Binley[48]提出广义似然不确定性参数估计方法(The Generalized Likelihood Uncertainty Estimation,GLUE),用于系统分析水文模型参数的不确定性及建立区间预报。GLUE参数不确定性分析方法能够较好地处理模型非线性、模型结构误差等不确定性因素对模拟结果的影响,在国内外水文模型研究中应用广泛[49- 50]。随着对SOR框架研究的深入,可供用户综合分析模型参数不确定性的工具包开始出现。美国劳伦斯利弗莫尔国家实验室开发的PSUADE工具包(https:∥computing.llnl.gov/projects/psuade/software)集成了如敏感性分析、不确定性分析、参数筛选和数值优化等多种参数不确定性量化算法。Wang等[51]首次使用Python语言集成多种参数不确定性算法,开发了适合于复杂地球物理模型的不确定性分析平台(Uncertainty Quantification Python Laboratory,UQ- PyL,http:∥www.uq- pyl.com/),并提供用户图形界面以连接外部模型执行参数不确定性分析程序。
早期,大部分水文模型参数不确定性分析工作主要集中在单个参数不确定分析方法的应用。例如,李毅等[52]针对邵明安构建的非饱和导水率模型,计算非饱和导水率对不同参数的敏感度,研究发现土壤湿润剖面平均湿度和湿润锋处湿度线性关系下,非饱和导水率对参数的敏感性比其他参数更高;Zhang等[53]根据观测径流及土壤水分资料对VIC模型默认敏感参数的经验率定,重建了一套中国长时间序列水分通量数据集;Beck等[54]基于1 787个中小尺度流域观测数据与HBV水文模型,应用相似气候原理生成全球尺度区域化参数分布图。随后,研究人员在模型优化过程中逐渐应用完善的SOR框架思路,即采用2种以上参数不确定分析方法对模型参数进行估算与优化。例如,Muleta和Nicklow[55]、Li等[56]结合全局参数敏感性分析与参数自动优化方法率定SWAT模型敏感参数,但未考虑无资料流域参数估算效果;Xie等[57]应用不同气候带流域14个站点观测数据率定7个径流模拟相关默认敏感参数并区域化到无资料流域,但未考虑模型的其他参数的敏感性。目前仍缺乏系统整合参数筛选、参数优化和大尺度无资料流域参数区域化方法的SOR框架研究,难以支撑大尺度流域水文模型构建与模拟。近年来SOR框架发展取得了很大的进步,Gou等[46]首次应用完备的SOR框架体系(图2),重建了中国长时间序列天然径流量格点数据集。未来在大尺度水文模型参数不确定分析工作中,应加强SOR框架的规范应用。SOR框架将成为未来大尺度水文模型或其他物理模型(如环境模型与气候模式)的参数不确定分析发展的主要方向之一,也为提高大尺度物理模型可靠性提供了一个有力的不确定性分析思路。
3 结论与展望
综合分析国内外研究现状,大尺度水文模型参数不确定性分析中存在参数高维性、参数交互作用以及无资料流域参数估计等一系列难题。在计算机技术的支持下,用于解决复杂水文模型的参数不确定性分析方法不断完善,如基于方差分解的参数敏感性分析方法、基于替代模型的自动参数优化算法与同步参数区域化方法等。但目前仍缺乏系统整合参数筛选、参数优化和大尺度无资料流域参数区域化工作的研究,难以支撑大尺度分布式水文模型构建与模拟。在对复杂水文模型的参数不确定性分析中,建议尽可能采取系统的参数敏感性分析—优化率定—区域化综合分析框架,以加强模型参数的适用性和水文模拟的精度。
目前SOR框架虽有望提高模型率定的效率和准确性,但率定得到的参数仍面临一系列不确定性的挑战:① 选取不同的敏感参数阈值以及采用不同的敏感性分析算法,均会导致模型参数重要性排序的差异,未来可考虑应用多种敏感性分析方法筛选模型重要参数;② 在参数优化的过程中,通常采用1种或多种称为目标函数或拟合优度的统计指标来量化模型模拟值与观测值间误差大小,目前用户对优化目标函数的选取仍具有一定主观性,应用多种目标函数指标或者预先进行目标函数性能对比或可以避免这一问题;③ 水文模型种类结构丰富,不同模型对流域水循环模拟侧重点不同,而大尺度水文模型模拟往往跨越多个水文气候区,单一模型结构模型参数较难捕捉大尺度水文过程;④ 传统单一目标函数优选出的参数往往不能恰当地描述多个水文变量特征,使用多目标优化算法可以确保水文模型综合模拟多个水文过程,如蒸散发、地表径流、土壤水分及地下水过程等;⑤ 自动参数优化程序搜寻到的最佳参数值可能来自于某些植被参数和模型预测不确定性源的误差补偿(如与模型相关的输入数据不确定性和模型结构不确定性),失去参数本身的物理含义,并可能对后续参数区域化带来更大的不确定性。有以下2种途径来减少参数数学最优与物理最优间差距:① 在原有传统率定方法基础上,尽可能地弱化其他不确定来源,使数学最优与物理最优近似相等;② 未来可考虑应用大数据样本和深度学习方法,从单点参数率定思路转变为大尺度参数学习,有望在大幅提高模型率定准确性效率的同时提高参数物理意义表征能力。
总的来说,以引入参数不确定性系统分析框架SOR为代表,明确模型各物理参数概念,减少过参数化现象,是解决大尺度水文模型参数不确定性的重要手段,可以有效保证模型的真实性并提高模型的预测精度。同时,发展新一代的分布式水文模型与发展更加成熟的水文气象数据观测系统,减少来自模型结构与模型驱动数据的误差,也是解决参数不确定性问题的关键途径。水文模型参数不确定性的“确定”,对于精细理解水循环过程、大尺度水资源管理、水灾害的预报乃至适应全球气候变化背景下的水资源利用与开发都具有重要意义。本研究所归纳与总结的SOR参数不确定性分析框架,不仅为大尺度水文科学的发展提供了新的途径,对其他学科的复杂系统模拟研究也具有一定参考意义。