APP下载

水文模型参数区域化方法探讨与研究

2020-10-21赵悬涛

科学与信息化 2020年2期

摘 要 乏资料地区的水文预报一直是国内外水文学者面临的难题,当前解决此问题的最常见方法是水文模型参数区域化。本文从水文模型、参政流域的选取、区域化方法三个方面出发,探讨和总结了参数区域化的概念、方法及注意事项。

关键词 水文模型;水文預报;参数区域化;乏资料流域

引言

无资料流域往往缺少实测流量数据,无法实现水文模型参数的率定,因此,将流域属性特征相似且资料较为完备的流域所对应的水文模型参数移用到无资料流域,是一种较常见的解决方案,也是目前使用最为广泛的方法。研究水文模型参数的区域化过程和水文预报的不确定性对解决无资料地区水文预报、完善洪水预报理论、提高预报精度等均具有理论价值和指导意义[1]。

1 参数区域化的概念

参数区域化指:当流域没有或缺少实测资料时,水文模型的参数一般不能直接率定,区域化方法即通过将有资料流域(参证流域)的水文模型参数推广到乏资料地区(目标流域),从而实现对目标流域的水文预报。从参数区域化的概念可以看出,水文模型、区域化方法和参证流域的选取是参数区域化的关键[2]。

2 水文模型

回顾水文模型的发展历程,从概念性、半分布式到全分布式,水文模型的物理机制日益趋于完善,对水文过程各环节的刻画更加细腻,同时模型的参数也更多样且复杂。完善且复杂的模型结构同样需要高精度、多要素的数据资料来支撑,所以,在作水文模拟与预报时,要根据实际情况择优选取水文模型。

在缺乏实测资料的地区开展水文模拟时,识别水文模型的参数是最为关键的一步,不同水文模型的结构和参数的物理完善性不同,其对区域化效果影响也存在较大差异。然而并不是结构复杂、模型参数较多的分布式水文模型模拟效果更好;相反,模型结构简单、参数数量较少的集总式水文模型模拟效果会更好。其原因在于:当模型需要率定的参数较多时,没有办法避免参数的不确定性和相关性。因此,在保证模拟精度的前提下可以优先考虑参数较少的水文模型。

3 参证流域的选取

科学客观的选取参证流域是实现水文模型参数区域化的关键步骤之一。在大多数的实际应用中,参证流域往往是研究人员通过对流域地形地貌特征、气候特征和流域水文响应特征的主观评判得到,但是人为主观判断易造成较大的计算误差。目前国内外判断多特征指标相似的常用方法主要有聚类分析法、主成分分析法(PCA)、人工神经网络等方法,本文着重对主成分分析法进行介绍。

PCA是一种多元统计方法,它通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫作主成分。PCA主要具有两大优点,一是它可以避免遗漏重要信息且能够尽可能多地去考虑指标,二是它可以解决信息的大量重叠,在保留原始变量主要信息的前提下起到降维和简化的作用。在划分相似流域时,PCA常被用作区域化方法的准备工作,将提取的复杂下垫面及气象信息进行主成分分析,最终起到缩减变量个数的作用。

4 区域化方法

区域化的常用操作方法主要分为两种:一是移植法,移植法主要是通过优选与目标流域距离相近或属性(下垫面条件、所处水文分区、所处温度带等)相似的一个或者多个有资料流域,然后进行参数移植,常用的参数移植方法主要有距离相近法、属性相近法和综合相近法。二是回归分析法,回归分析法指利用数据统计原理,对大量统计数据进行数学处理,并确定因变量与某些自变量的相关关系,建立一个相关性较好的回归方程(函数表达式),并加以外推,用于预测今后的因变量的变化的分析方法。针对无资料流域的水文预报问题,此处的自变量和因变量分别指的是流域特征和水文模型参数。

近年来,计算机技术得到了突飞猛进的发展,且数据量日益丰富,机器学习开始作为一种新的区域化方法应用于无资料地区参数移植。机器学习即让计算机通过简单概念获取新的知识或技能,此方法具有精确识别和预测的优点,被广泛应用于语音识别、行人检测、图像分割等方面。随着水文测站的布设日趋规范,降雨监测技术日益完善,相关监测数据为洪水预报的研究提供了可靠的支撑,同时使机器学习在无资料地区水文预报中的应用得到较快发展。开展机器学习研究是未来无资料地区参数区域化的发展方向。因此,本文重点介绍常用的一种机器学习算法——CART决策树。

CART方法是由Breiman等人在1984年提出的一种决策树分类方法。其采用基尼系数作为划分标准,基尼系数可以单独考虑子数据集中类属性的分布情况,决定由该子数据集生成的决策树的拓展形状,CART方法创建简单二叉树结构对训练样本进行分类及结果预测。

考虑到流域参数相互移植会得到大量的训练样本,为从大样本中提取有用的信息,采用CART决策树会定量给出可以进行参数移植的相似流域的标准,并对移植效果进行预测。构建该分类模型时,训练样本自上向下按照分割条件建立分支。划分样本的分割条件就来自于主成分分析提取出的不相关因子,即为相似流域的划分标准。分类模型不仅需要很好地拟合训练数据,而且对未知样本也要做到准确地分类。为保证得到的标准可以推广到其他流域,需要防止产生过度拟合的情况,其操作方法主要有两种:①利用主成分分析法从流域属性中提取不相关因子,降低复杂度;②限制决策树节点的数量。

5 结束语

水文模型参数区域化为无资料区域的水文预报问题提供了一个新的解决途径,但是不同的操作方式会导致区域化预报结果的精度大相径庭。与率定结果相比,有时区域化的预报精度会明显偏低,这表明参数区域化还有很大的改进空间,未来还需要做进一步研究。

参考文献

[1] 杨邦,任立良,陈福容,等.无资料地区水文预报(PUB)不确定性研究[J].水电能源科学,2009,27(4):7-10.

[2] 毛能君,夏军,张利平,等.参数区域化在乏资料地区水文预报中应用研究综述[J].中国农村水利水电,2016,(12):88-92.

作者简介

赵悬涛(1996-),男,河南商丘人;学历:硕士研究生,现就职单位:华北水利水电大学,研究方向:主要从事水文预报研究。