淮河洪水概率预报方法研究及应用

2018-05-18蒋晓蕾

治淮 2018年4期

王凯蒋晓蕾

（淮河水利委员会水文局（信息中心）蚌埠 233001 河海大学南京 210098）

1 研究背景

水文预报是一种重要的防洪非工程措施，直接为防汛抗旱和水资源管理服务。目前广泛使用的水文预报模型大多是确定性的，模型以确定预报值的形式输出给用户。实际上，由于水文过程的影响因素复杂多变，加之人类认识水平的有限，使得水文预报过程中不可避免地存在着诸多的不确定性。目前，水文预报不确定性量化已逐渐成为了研究热点，概率预报作为其重要的表现形式，已成为了水文预报的发展趋势。

当前国内外关于洪水概率预报的研究主要包括两类途径：第一类是全要素耦合途径，分别量化降雨—径流过程各个环节的主要不确定性，如降雨输入不确定性、模型结构不确定性、模型参数不确定性等，并进行耦合，实现概率预报。如Kavetski等采用“潜在变量”雨深乘子（stormdepthmultiplier）反映降雨输入的不确定性，并将模型的敏感性参数随机化，应用马尔可夫链蒙特卡洛（Markov Chain Monte Carlo，MCMC）采样方法求解流量后验分布，提出贝叶斯总误差分析（Bayesian total error analysis，BATEA）方法。在国内，李明亮等基于层次贝叶斯模型（Bayesian hierarchical model），构建联合概率密度函数以考虑模型参数和降雨输入不确定性，并采用MCMC方法进行求解。梁忠民等借用抽站法原理推求降雨量的条件概率分布，进而实现考虑输入不确定性的洪水概率预报。全要素耦合途径能够溯源预报不确定性，但计算相对耗时，无法满足实时预报的需要。

第二类是总误差分析途径，即从确定性预报结果入手，直接对预报不确定性进行量化分析，推求预报量的分布函数，实现概率预报。Krzysztofowicz等提出的贝叶斯预报系统（Bayesian forecastingsystem，BFS）最具代表性，其中水文不确定性处理器（hydrologic uncertainty processor，HUP）在正态空间中对似然函数进行了线性假定，为推求预报量后验分布的解析表达提供了可能。王善序详细介绍了BFS的理论，并指出它可以综合考虑预报过程的不确定性，不限定预报模型的内部结构。近年来，很多研究表明，不同流量量级的预报不确定性存在差异。王晶晶等在原始空间中开展预报误差规律研究，发现不同流量量级的误差服从不同的分布函数，为此采用极小熵确定各分布线型，采用极大熵进行参数估计，进而降低了福建池潭水库管理的风险。Van Steenbergen等针对不同预见期、不同流量量级预报误差统计规律的差异，采用频率学方法，构建了三维误差矩阵，量化预报不确定性。

本文在第二类研究途径框架下，结合研究区域（淮河王家坝断面）预报误差的统计特征，假定误差均值随流量量级呈分段线性变化，在贝叶斯预报系统（BFS）的基础上，对其水文不确定性处理器（HUP）进行改进，提出改进的贝叶斯概率预报系统（PCA-HUP），定量评估单个水文模型预报结果的可靠度，实现概率预报。

2 模型方法

考虑误差异分布的洪水概率预报方法不涉及预报的中间环节，只对预报结果进行分析，定量评估预报结果的不确定性，并在此基础上实现洪水概率预报。在贝叶斯预报系统（BFS）的基础上，对其水文不确定性处理器（HUP）进行改进，提出改进的贝叶斯概率预报系统（PCA-HUP），定量评估单个水文模型预报结果的可靠度，实现概率预报。

2.1 HUP基本原理

水文不确定性处理器（Hydrologic UncertaintyProcessor，HUP）是贝叶斯概率预报系统（BFS）的主要组成部分，用以分析除降雨之外的其他所有不确定性。其特点是，不需要直接处理预报模型的结构与参数，而是从预报结果入手，分析其与实测水文过程的误差，再利用贝叶斯公式估计预报变量的概率分布，从而实现水文模型预报结果的不确定性分析及概率预报。其工作流程如图1所示。

2.2 改进的概率洪水预报PCA-HUP模型

为推求预报量后验分布的解析解，传统HUP模型结合亚高斯模型，在正态空间中对先验分布式和似然函数式进行线性假设，并采用最小二乘法对相关参数进行估计。

然而，由于似然函数式的自变量之间存在明确的线性关系，必然导致回归方程的多重共线性问题。若采用传统最小二乘法进行参数估计，会使得估计的回归系数不唯一，也使得回归方程不稳定（原始数据的极小变化可造成参数估计值和标准差的明显变化）。因此，项目研究结合主成分分析技术（Principal components analysis，PCA），对传统 HUP模型进行改进，提出PCA-HUP模型。

主成分回归的基本思想：对原始回归变量进行主成分分析，将线性相关的自变量，转化为线性无关的新的综合变量，采用新的综合变量建立模型回归方程。

（1）主成分分析

设 X=（X1，…Xp）T是 P 维随机向量，均值 E（X）=μ，协方差阵 D（X）=Σ。

考虑它的线性变换：

用矩阵表示为：

图1 水文不确定性处理器工作流程示意图

由式（2）可以将 P 个 X1，X2，…Xp转化为 P 个新变量，Z1，Z2，…Zp若新变量 Z1，Z2，…Zp满足下列条件：

1）Zi和 Zj相互独立，i≠j，i，j=1，2，…，p；

2）Var（Z1）≥Var（Z2）≥…≥Var（Zp）；

则新变量 Z1，Z2，…Zp为 X1，X2，…Xp的 P 个主成分，且Z1，Z2，…Zp线性无关。

（2）主成分回归

实际问题中不同的变量经常具有不同的量纲，变量的量纲不同会使分析结果不合理，将变量进行标准化处理可避免这种不合理的影响。

对数据进行标准化首先要得出样本标准差和样本均值，记sj为xj样本标准差，即是 xj的样本均值，即原始数据的标准化变换为：

标准化后的数据矩阵为：

标准化后，X的相关系数阵也就是X的协方差阵（半正定矩阵）：

其中：

采用Lagrange乘子法求解，可以求得：

其中：λ1≥λ2≥…≥λp≥0 为 R 的特征值，a1，a2，…ap是相对应的单位正交特征向量，ap=（a1pa2p，…app）T。

主成分回归可以得到p个主成分，这p个主成分之间互相独立，且方差呈递减趋势，所包含的自变量的信息也是递减的。即主成分对因变量的贡献率是递减的，第i个主成分Zi的贡献率可以用来表示。

在实际问题的分析时，由于主成分的贡献率是递减的，后面的主成分贡献率有时会非常小，所以一般不选取P个主成分，而是根据累计贡献率来确定主成分个数，即：前m个主成分的累计贡献率达到0.85时，选取前m个主成分进行回归。则原始回归问题转化为以下回归问题：

其中：E（εt）=0，Var（εt）=σ2，Cov（εi，εi）=0，（i≠j）

回归模型的矩阵形式为：

采用最小二乘法估计参数矩阵B，根据式（1）和式（3）可以估计因变量矩阵Y与自变量矩阵之间X的回归系数矩阵。

由此可见，主成分回归模型是对普通的最小二乘估计的改进，首先选取主成分，克服自变量间的多重共线性，然后对所选的主成分进行线性回归，进而得到主成分回归方程。

3 实例应用

3.1 研究区概况

王家坝站系淮河上游总控制站，集水面积30630km2。上游干流河长360km，河道比降0.5‰，年平均降水量800～1200mm，且降水年际变化大，时空分布不均匀。年降水量的60%集中在5～8月，以6、7两月暴雨次数较多。产生暴雨的主要天气系统是西南低涡、切变线、低压槽和台风等。淮干上游及淮南山区一般是王家坝洪水的主要来源区。本项目主要针对息县、潢川、班台至王家坝区间（面积为7110km2）开展研究，见图 2。

3.2 概率预报结果

本研究以新安江模型为确定性预报模型，在此基础上，采用PCA-HUP模型分别对上述模型预报的可靠度进行定量，并在淮河干流主要控制断面王家坝进行了实际应用，采取滚动预报方式实现了洪水概率预报。

将新安江模型的预报结果与实测资料输入PCA-HUP模型中，其中20场洪水用于相关参数的率定，8场洪水用于模型验证。模型相关参数见表1。以置信度为90%（亦可采用其他置信度值）的预报区间为例，对概率预报结果进行评估，同时，对流量分布函数的中位数Q50进行分位数评价，率定期模型的模拟精度见表2。

由表2可知，PCA-HUP模型率定期模拟结果：预报区间（置信度为90%）覆盖率较高，且离散度在0.2以内。此外，将每一时刻预报量概率分布的中位数预报与实测流量进行比较，确定性系数接近于1，洪峰误差在1%以内，说明中位数预报的精度非常高，且从不同预见期的模拟过程线中可以看出，随着预见期的逐渐增大，区间离散度呈现出递增的趋势。

采用验证期8场洪水对概率预报模型进行检验，推求预报流量的概率分布，实现王家坝断面的洪水概率预报。预报精度统计见表3，预报流量过程线以其中两场为例，预报流量过程线如图3～图4所示。

由表3和2场洪水概率预报过程线可知，PCA-HUP模型（以新安江模型为确定性预报模型）提供的概率预报结果：预报区间（置信度为90%）覆盖率在87%以上，且离散度在0.2以内，说明在相对较小的区间宽度内，预报区间仍然能够覆盖绝大多数实测数据，说明概率预报精度较高。此外，将每一时刻预报量概率分布的中位数预报与实测流量进行比较，确定性系数接近于1，洪峰误差在1%以内，说明中位数预报的精度非常高，明显高于新安江模型预报结果，充分体现了贝叶斯修正原理。从不同预见期的预报过程线中可以看出，随着预见期的逐渐增大，区间宽度呈现出递增的趋势。

表2 PCA-HUP模型率定期模拟精度统计表（王家坝，Δt=2h）

图2 王家坝断面控制区域图

表1 PCA-HUP模型参数表（王家坝）

图3 a 19920505号洪水预报过程线图（王家坝，Δt=2h）

图3 b 19920505号洪水预报过程线图（王家坝，Δt=6h）

图3 c 19920505号洪水预报过程线图（王家坝，Δt=12h）

图4 a 19950707号洪水预报过程线图（王家坝，Δt=2h）

图4 b 19950707号洪水预报过程线图（王家坝，Δt=6h）

图4 c 19950707号洪水预报过程线图（王家坝，Δt=12h）

表3 PCA-HUP模型验证期概率预报精度统计表（王家坝，Δt=2h）

4 结论

本文在贝叶斯预报系统（BFS）的基础上，对其水文不确定性处理器（HUP）进行改进，提出改进的贝叶斯概率预报系统（PCA-HUP），PCA-HUP模型是在正态空间中对预报误差进行分析，构造线性似然函数，推求预报流量的后验分布，实现洪水概率预报。以淮河王家坝断面的洪水预报为示例进行了应用研究，表明该方法不仅可以提供不同置信度的区间预报结果，还可以获得精度更高的定值预报结果。

该方法可以与任何确定性的水文预报模型相耦合。作为示例，文中对相对误差进行了正态假设，但研究方法不局限于此，同样适用于误差服从其他分布的情况。限于研究区的预报误差特征，本文仅考虑了误差均值随流量量级的变化规律，相同思路亦适用于误差方差等分布参数随流量变化的情况■