APP下载

敏感性分析和不确定性分析在水环境模型中的应用

2021-11-03吴伟龙陆丽君黄翔峰李汇沣魏忠庆

四川环境 2021年5期
关键词:样本量不确定性敏感性

吴伟龙,陆丽君,黄翔峰,李汇沣,魏忠庆,2

(1. 同济大学环境科学与工程学院,上海 200092;2. 福州城建设计研究院有限公司,福州 350001)

引 言

20世纪50年代,研究区域水环境的相关水文水力模型相继出现,21世纪初水质模型也开始逐渐成熟的出现在人们面前[1]。由于水系统的不确定性和人类认知的局限性,每个水环境模型都有局限,从而导致其预测评估存在极限值。随着水环境模型的迅速发展,高度集成的复杂模型能较准确地反应水动力状态和生化活动[2],因此很多大型的模型软件得到广泛应用。水文水力模型可用于预测洪涝灾害[3]、评估排水管网能力等[4];水质模型可用于绿色措施方案布设和评价[5],研究河流湖泊污染物的迁移转化[2, 6]等。

这些模型含有大量的参数,互相之间存在高度交互性[7],并且输入数据、模型结构、观测资料、性能指标等误差都对参数的估计和模型的预测造成不确定性[8]。因此,模型应用的前提是保证其精确性,不确定性评估就成为关键[9]。其中敏感性分析(Sensitivity Analysis, SA)和不确定性分析(Uncertainty Analysis, UA)是量化评估模型不确定性的重要手段。通过UA和SA能够在数据挖掘和分析、降低模型模拟的误差水平、量化模型的不确定性等方面提供良好的辅助决策作用,已成为水环境模型研究过程中必不可少的环节。

由于SA和UA概念和作用上有一定的联系与相似性,目前已有相关的研究性文献将两者结合起来进行研究,如刘越洋[10]研究了两者在地下水模型(FEFLOW)中的应用,辅助模型率定,找到对特定结果有重大影响的模型参数,从而进一步优化模型。两者的差异若不能正确被理解和区分,则无法发挥其各自最大的作用。本文梳理SA和UA的分析方法,建立分析流程,形成常用的应用框架,并总结目前两者在水环境模型中的应用方式,为水环境模型的相关研究者提供有意义的借鉴。

1 敏感性分析和不确定性分析的概念与方法

1.1 敏感性分析和不确定性分析的概念

通常而言, SA是研究模型输入因素和输出变化的响应关系,指出识别影响模型性能的关键参数,在模型参数率定、参数相关性和不确定性量化等方面都发挥着重要作用。UA则是对模型输出中由于模型驱动、模型参数、模型结构等综合而产生的结果不确定性进行量化评定,得出不确定区间,评估最终模型的可靠性。概括来讲,UA回答的是“这个模型有多不确定?”,而SA回答的是“这种不确定性从何而来?”[11]。

1.2 敏感性分析方法

SA方法根据样本空间范围分为全局SA和局部SA。全局SA主要有回归法[12]、Morris搜索法[13]、方差法[14](Sobol法、FAST法等)和RSA法[15],局部SA主要有OAT法、偏导数法等。Neumann等[16]对两类方法进行了比较,指出全局SA无论是理论基础还是实践的准确性上都有更好的表现。表1对几种常用的全局SA进行比较。

表1 全局敏感性分析方法比较Tab.1 Comparison of global sensitivity analysis methods

1.3 不确定性分析方法

不确定性分析方法主要包括区间数学法、模糊理论法以及概率分析法。其中概率分析法常用于描述物理系统的不确定性, 根据模型输入的概率分布来确定模型输出的概率分布, 最终以概率分布的形式来表达不确定性,最常用于评估水环境模型不确定性[17]。主要包括贝叶斯平均方法(Bayesian Model Averaging, BMA)[18]、马尔可夫链-蒙特卡罗法(Markov chain Monte Carlo, MCMC)[19]、极大似然不确定性方法(Generalized likelihood uncertainty estimation, GLUE)[20]、顺序不确定性拟合法(Sequential uncertainty fitting, SUFI-2)[21]和参数求解法(Parameter solution, Parasol)[22]等。表2总结了这几种常用的UA方法的原理、取样方式、样本量、参数相关性和特点。

表2 不确定性分析方法比较Tab.2 Comparison of Uncertainty Analysis Methods

2 影响方法选择的因素

无论SA还是UA,每种方法都有着自身的特性,需根据研究的不同来选择合适的方法。分析对象、研究目的、参数相关性、模型结构、方法的计算成本,以及对定量计算和理论支撑的需求等,均是在选择具体方法时需要考虑的因素,对于复杂的水环境模型而言,核心要考虑的因素是方法的精确性和时间成本。

2.1 方法的精确性

SA中方差法最为完善,利用方差的概念作为不确定性的综合指标,继而实现定量化。Song等人[23]统计了前人的研究,发现研究中最多使用的是Morris和方差法,Tang等[24]比较了18个因子的流域模型的4种敏感性分析方法(PEST、Sobol、方差法和RSA),发现Sobol方法理论性更强,鲁棒性也更好。而其他方法则更适用于定性的敏感性分析,适用于仅仅需要敏感性排序的研究。

UA中基于贝叶斯理论的MCMC普遍被认为是理论最完善的方法。Dotto等[25]和Yang等[26]比较了UA的几种方法,指出各种方法都能成功实现模型不确定性的定量评估,但其结果在不确定区间范围和参数相关性上有着一定的不同。而在理论完备性上,MCMC方法更胜一筹。其他的方法由于样本的完全随机性,无法保证样本的可靠性,因此常常用于计算量大的模型的初步不确定性分析中。

由于水环境模型的复杂性和不确定性,很多研究常采用两种或多种方法进行比较研究[27-28],以达到相互验证的效果。

2.2 时间成本

SA和UA的时间成本主要由参数个数和模拟精度决定。参数个数影响样本量,众多的参数之间存在着较强的相关性,为达到收敛需加大样本量。另一方面模拟精度决定了模拟一次的时间,与样本量共同决定了时间成本。

SA定量方法中方差法通常比定性方法需要更多的样本量[29]。而定性方法虽然所需的样本量较小,但本身需要设定较多的参数,只有当设定的参数符合所构建的水环境模型时,才能达到和定量方法较为类似的结果[13]。Pianosi等[30]比较了不同研究的样本量N和参数个数k的关系,得出Morris法的N=10k~100k,RSA的N=100k~1000k,而方差法的N>1000k,据此可通过参数个数来近似评估最终的样本量。对于UA,还未有研究明确指出参数与样本量的关系,相同的参数个数下,样本量排序一般是MCMC > SUFI-2 > GLUE > Parasol。模拟精度方面,有的研究需要数十万的样本量才能使算法达到收敛[16],但是一次模拟需要20多秒甚至更长时间,这显然是不现实的,此时通常会选择样本量较小的方法。

为降低时间成本,SA中常采用“二步法”解决,先用定性方法初选再定量计算。Francos等[31]对SWAT模型进行SA时,先使用Morris定性简化,再使用FAST进行定量求解,大大减少了时间成本。而在UA中常用代替模型法来解决,目前主要用神经网络来构建代替模型以取代原有的复杂水环境模型[32]。

3 敏感性分析和不确定性分析的分析流程与应用

SA和UA的应用需要执行一系列相似的步骤,下图总结了SA和UA的一般流程,建立了两者应用框架,可以方便地说明两者的区别与联系,有助于将两者有效的应用到水环境模型中。

图 水环境模型SA和UA的流程图Fig. The flow chart of SA and UA in water environment model

SA和UA的分析流程上主要分为前期准备和具体分析两个部分。其中前期准备阶段,SA和UA的流程是相同的,主要包括因子选择与随机取样—样本模型模拟—目标函数选择与计算三个环节。而在具体分析阶段,SA和UA都有其独自的分析规则、评价方式和结果表现形式。综合SA和UA的整个分析流程而言,视研究目的的不同,在水环境模型中的应用主要分为3种情况。

3.1 SA或UA单独应用

有些研究在不追求系统性或仅完成某一项目标的前提下,仅作UA或SA。在水环境模型中SA最大的作用即筛选敏感因子,以找到控制水环境变化的主要因子,方便后期的调控。有研究将其用于模型率定前,实现因子降维。Nossent等[33]用Sobol法对SWAT模型水文水质参数共26个参数进行敏感性分析,在考虑参数交互作用的情况下筛选出6个最敏感的参数用于后期率定。此外,SA还可在水环境模型中用于模型率定后对每个因子做不确定性评价以应对各种不同条件。Zhang等[14]通过Sobol法对率定好的SWAT模型进行分析,比较了干旱年、正常年和湿润年的参数敏感性,发现不同条件下,敏感参数是不同的,找到不同条件下的敏感性参数为模型未来在不同场景下的应用提供了控制因子,方便控制流量和污染。

UA在水环境模型的研究则是以量化模型不确定性为主,由于水系统的不确定性,加上人类认知的局限性,评估水环境整体的不确定性尤为重要。Li等利用MCMC评估黑河的SWAT模型不确定性,结合参数分析通过不确定区间以缩小范围并得出参数的不确定性贡献较小,而整体模型的不确定性更多的存在于结构和数据[34]。另外UA也常应用于模型率定后,通过不确定性分析来解决复杂的“异参同效”,如Madsen在多目标参数自动率定后,采用“等效参数组”的概念生成一组确定预期模型响应范围的置信区间,而不是生成一个单一的解决方案[35]。

3.2 SA和UA结合应用

水环境建模中,一个难点是不同的条件下模型的建立很难保持一致性,这往往归结于水环境模型的不确定性。Shin等[36]指出参数范围、数据周期长度、流域、模型结构和气候条件等不同条件都会影响到水环境模型的不确定性和敏感性,因此在构建模型时应充分考虑这些因素并根据不同条件合理设置因子。UA和SA的结合可以很好的解决这一问题,先使用UA整体评估模型在某种条件下的不确定性,缩小范围,进一步使用SA找出关键因子进行调节和处理,从而相应降低不确定性。

另一种结合应用是辅助模型参数的“优化”率定。Ratto等[37]提出一种新的模型率定方法,将GLUE法与基于方差法的SA耦合起来,先通过UA缩小参数范围,然后在这个范围内进行SA,筛选出敏感性参数,最后对敏感参数进行率定,为模型的率定提供新的思路。Muleta等[38]先使用SRC法筛选出了SWAT模型中关键的20个因子,然后使用遗传算法实现模型因子的率定并验证,确定了一组最优参数值,最后再使用GLUE法对模型进行不确定性评估,得出流量模型不确定性小,而产沙模型不确定性大的结论,同时也提供了误差范围。

3.3 全局SA和UA的混合应用

大型综合的水环境模型往往一次模拟的计算量很大,同时由于全局SA和UA都是基于随机取样的原理,在某种程度上可以互相借用样本实现混用,这样大大减少了模拟的运算量。Silvestro等[39]先使用GLUE法对水文模型进行预评估,确定了因子的不确定性范围和参数的后验分布,然后直接利用UA样本的散点图找到关键因子,以实现SA的作用,大大减少了大型水环境模型的计算量。Zhao等[28]也采取了类似研究思路,利用UA和SA方法原理的相似性,在不同的UA方法中根据散点图直接进行“粗略”的SA,均筛选出来了模型中的敏感参数,并在不同UA得到的不确定区间中进行敏感参数的排序,最终排序结果相同,以证明多种UA的样本均可实现SA。

4 结 语

本文对SA和UA的概念、分析方法、方法选择、分析流程与应用等进行了比较和总结,并介绍了两者在水环境模型中的不同应用场景。两者的结合应用更适用于不确定性大的水环境模型,以保证能得到对模型不同角度的理解,既知道不确定性的定量表示是多少(UA),又知道这种不确定性受什么的影响最大(SA)。

关于模型不确定性分析和敏感性分析的研究,以下3个可能成为未来的主要方向。

4.1 方法优化上。目前尚没有一种方法被证明是最好的,虽然上文中建议使用多种方法进行比较验证,但无疑会增加工作量,对各种方法的比较优化显得尤为重要。

4.2 计算效率上。目前已有不少研究将代替模型的方法引入到了水环境模型中,以实现计算效率的提高,未来代替模型法可能会成为一种主流。

4.3 结果可视化上。目前人们对于SA和UA这种抽象概念的理解并不容易,因此多种样式的可视化展示可为建模人员利用和分析提供便利。

猜你喜欢

样本量不确定性敏感性
法律的两种不确定性
一种基于进化算法的概化理论最佳样本量估计新方法:兼与三种传统方法比较*
医学研究中样本量的选择
经前烦躁障碍症发病与四氢孕酮敏感性中西医研究进展
全球不确定性的经济后果
英镑或继续面临不确定性风险
样本量估计及其在nQuery和SAS软件上的实现*——均数比较(十一)
样本量估计及其在nQuery和SAS软件上的实现*——均数比较(十)
英国“脱欧”不确定性增加 玩具店囤货防涨价
丹参叶片在快速生长期对短期UV-B辐射的敏感性