基于物理机制耦合深度学习方法的径流预测研究
2023-07-30钟鸣张鸿瑞王一帆耿浩
钟鸣,张鸿瑞,王一帆,耿浩
(1.中山大学地理科学与规划学院,广东 广州 510275;2.云南电网有限责任公司电力科学研究院,云南 昆明 650217)
0 前言
在全球气候变暖与人类活动的影响下,降雨、径流等水文循环过程都发生了变化,全球水资源危机和洪涝灾害风险显著增加[1]。径流预测是流域防洪减灾、水资源优化配置的重要依据,也是当前全球水文水资源领域的研究重点之一。
目前,径流预测模型可分为物理机制模型和数据驱动模型两类。物理机制模型主要从物理机制上对降水、蒸散发、入渗等关键水文过程进行解释和描述,进而实现产汇流计算。在这个过程中,采用合适的经验推导公式或者计算方程刻画水文过程,因此物理机制模型对水文气象数据和流域水文特性参数提出了较高要求[2]。随着水文科学的发展,物理机制模型的发展呈现从集总式模型到分布式模型的趋势,一定程度上提高了径流预报的准确性[3]。数据驱动模型是从数据中学习物理现象的长期规律,建立输入与输出数据之间潜在的映射关系,弱化了径流形成的物理过程,从而拥有了更快的运算效率和良好的模拟性能。传统应用于径流预测的数据驱动模型包括自适应模糊推理系统(Adaptive Network-based Fuzzy Inference System,ANFIS)、人工神经网络(Artificial Neural Network,ANN)、反向传播网络(Back Propagation Network,BP)、支持向量机(Support Vector Machine, SVM)等算法,随着大数据和机器学习的发展,深度学习作为一种基于概率论不断递归进而寻求最优解的方法,能够通过分层学习从大量数据集中挖掘复杂特征。因此,深度学习在时间序列预测和挖掘数据长期相关性上具有明显优势,特别是在径流预测中,深度学习表现出了比其他模型明显更强的预报性能[4]。例如,Bai 等[5]提出基于级联框架的LSTM 模型,对日径流进行预测,通过级联建模,可以在一个框架内通过多个模型充分提取多个目标在不同阶段的特征;Lin 等[6]将DIFF 和FFNN 模型引入LSTM 中,从模型结构、参数及输入的角度分析模型在径流模拟中的有效性;Xiang 等[7]提出了基于LSTM 的LSTM-seq2seq模型,并将其用于每小时的径流预测,提高了短期洪水预报准确性。
为了提高径流预测的准确性、高效性和可解释性,研究物理驱动与数据驱动的耦合模型受到越来越多学者的关注[8]。通常采用两种方式实现多模型耦合,一种方式是在提供观测数据标签时,加入由物理模型提取的控制方程、边界条件等理论知识限制解集空间;另一种方式是基于物理模型模拟结果对深度神经网络进行预训练,从而建立物理指导的深度学习模型[9]。例如,Yang 等[10]将GHM-CaMa-Flood 模型的流量输出与ERA 数据集的气象数据整合作为LSTM 模型的输入,改进了峰值流量的径流预测精度;Liu 等[11]利用TIGGE-ECMWF 气象预报数据,驱动CSSPV2 陆面水文模型预报径流,并将其与气象数据输入至LSTM 中得到出口断面流量,将径流预报误差降低了6%。上述研究表明,物理机制耦合深度学习的径流预测方法能有效提升径流预测精度和效率。因此,本研究在西江流域建立基于物理模型指导的深度学习模型,将基于物理驱动模型的水文水动力模型与深度学习方法相结合,建立优化的径流预测模型,并进行模型计算结果验证。
1 研究区域
西江发源于云南,流经贵州、广西和广东,于珠海市注入南海,干流全长2214 km,流域总面积35.31 万km2。西江流域属亚热带季风气候,多年平均气温为14~20 ℃,多年平均降水量为1200-2200 mm,受季风影响,70%以上降水量主要集中在4~10 月。梧州站以上流域集水面积32.7 万 km2,占西江流域的92.88 %,跨越云南、贵州、广西等省区,因此本文选取武宣站(WX)和梧州站(WZ)两个水文站开展径流预测研究,如图1 所示。
图1 研究区概况
2 理论和方法介绍
2.1 物理机制模型
VIC(Variable Infiltration Capacity) 模型是基于物理机制的大尺度分布式水文模型,广泛应用于全球水文模拟工作。VIC 模型主要考虑了大气-植被-土壤之间的相互作用过程,反映了土壤、大气和植被之间的水热变化状况和水热过程模拟,可同时进行陆-气间能量平衡和水量平衡的模拟。本研究基于VIC-3L 模型,将西江流域划分为4374 个空间分辨率为5 弧分的网格进行径流预测。
CaMa-Flood(Catchment-based Macroscale Floodplain)是一个全球尺度的分布式河流模型,已被广泛应用于不同时间尺度的大规模洪水研究中。水文模型模拟产生的径流可以作为CaMa-Flood 模型的径流强迫数据。本研究以VIC 模型产生的径流(作为CaMa-Flood 模型的输入数据,进而得到基于物理机制模型模拟的日径流流量。
2.2 物理机制模型耦合深度学习方法
为了克服基于机器学习的径流预测模型的局限性,本研究开发了一种耦合水文水动力模型和深度学习的径流预测模型,即将基于物理机制的径流模拟值和气象观测数据输入到深度学习框架中,利用深度学习方法计算径流模拟值。循环神经网络(Recurrent Neural Networks,RNN)由输入层、隐藏层和输出层组成,是能够处理时间序列的神经网络模型。RNN 模型的计算公式如下:
其中,f与g为神经网络激活函数;W和U为权重矩阵;xt,St,Ot为t时刻输入层、隐藏层及输出层数据。
长短时记忆网络(Long Short-Term Memory,LSTM) 是针对RNN 模型在学习较长时间序列时存在的梯度消失问题而提出的改进模型。LSTM 可以有效处理长距离的依赖,与RNN 相比,LSTM 模型增加了三“门”结构,考虑了隐藏层中关联不同时刻的输入,常用来研究时间序列上的变化。具体如下:
式中:Wf,Wi,Wc,Wo和Uf,Ui,Uc,Uo为模型权重参数;bf,bi,bo为偏移系数;ht为t时刻的输出;σ为激活函数;tanh为双曲正切函数; 表示按元素乘。
在本研究中将特征输入长度设定为15 天,输出特征长度为1 天,选取2010 年1 月至2014年12 月数据为训练期,2015 年1 月至2015 年12 月数据为验证期,2016 年1 月至2016 年12 月数据为测试期。此外,本研究分别建立了物理机制模型(VIC-CamaFlood)、深度学习模型(RNN、LSTM) 和两种混合模型(VICCamaFlood-RNN、VIC-CamaFlood-LSTM)进行径流预测,从而进行径流预测模型对比和优选。
2.3 评价分析方法
选取三个指标来评估洪水特征值,分别是最大流量值(MAX)、95% 分位流量值(Q95) 和90%分位流量值(Q90)。同时,选取纳什效率系数(NSE)、相对误差(RE)和相关系数(R2)三个指标定量评估不同类型径流预测模型的径流模拟性能。具体如下:
其中,和分别指第i天的实测值和模拟值,N为样本总数,和分别代表实测和模拟每日流量的平均值。
3 结果与讨论
3.1 基于混合模型的径流预测
基于以上建立的VCR、VCL 两种混合模型对梧州站和武宣站进行了日径流预测,并进行对比分析。图2 展示了VCR、VCL 两种模型的日径流预测结果,表1 展示了两种耦合模型在训练期(2010-2014 年)、验证期(2015 年)、测试期(2016 年)的径流预测结果的评价指标。在测试期内,VCR 模型NSE 值范围为0.70~0.75,VCL 模型NSE 范围为0.71~0.81;VCR 模型R范围为0.85~0.88,VCL 模型R 范围为0.85~0.9;VCR 模型RE 范围为-5.8%~1.6%,VCL 模型RE 范围为-8.6%~0.2%;从不同站点评价指标来看,在测试期中,VCL 的NSE 值在两个站点的表现均比VCR 有一定程度的提高,均提高了1%~4% 左右;R值上,VCL 模型表现均比VCR 模型高。从既往研究中来看,当NSE 值大于0.5 且RE 小于25% 时,那么这模型模拟结果是可以接受的[12]。同时,VCL 和VCR 模型相关系数R均达到0.85 以上,这说明两个站点的径流模拟结果与实测径流均有一定的相关性。
表1 基于混合模型的径流预测结果评价
图2 基于混合模型的径流模拟结果
表2 展示了测试期内观测值和模型模拟值的洪水指标,其中,VCR 模型MAX 的RE 值范围为-34.1%~-33.3%,Q95 的RE 范围为-5.5%~-4.2%,Q90 的RE 值范围为-0.5%~1.8%;VCL模型MAX 的RE 值范围为-22.8%~-19.7%,Q95 的RE 范围为-8.5%~-4.5%,Q90 的RE 值范围为-3.1%~-1.1%。从不同站点评价指标来看,在测试期中,VCL 的NSE 值在两个站点的表现均比VCR 有一定程度的提高;R值上,VCL 模型均比VCR 模型高。在洪水预报指标中,根据MAX 指标评估,VCL 模型预报性能均比VCR模型表现好;根据Q95 和Q90 评估,VCL 模型比VCR 模型略高;从三个站点总体评价指标表现来看,武宣站(WX) 在测试期的表现最好,其次是梧州站(WZ)。
表2 基于混合模型的洪水评价指标性能
综上所述,VCL 模型较VCR 模型能够更好地模拟径流和洪水,该结论将为今后径流预测和洪水模拟提供科学参考。
3.2 物理机制模型、深度学习模型与混合模型的效果对比
为进一步研究不同类型径流模拟模型的模拟效果,本文分别建立了物理机制模型(VICCamaFlood)、深度学习模型(RNN、LSTM)和两种混合模型(VIC-CaMa-Flood-RNN、VICCaMa-Flood-LSTM),并进行径流预测研究。图3 展示了三种类型模型在径流预测和洪水模拟方面的性能。
在基于VIC-CaMa-Flood 模型的径流模拟中,所有站点的NSE 值均小于0.5,R值均大于0.7,同时,在VIC-CaMa-Flood 模型的洪水模拟中,RE 值在大部分情况均大于30%。因此,VIC-CaMa-Flood 模型不能很好地模拟径流和洪水。将VIC-CaMa-Flood 模拟获得的流量及其气象驱动数据输入到深度学习算法(即VCR、VCL)之后,径流和洪水的指标都得到了显著的提升,VCR 模型NSE 范围为0.7 至0.75 之间,R值在0.85 至0.88 之间,除了在MAX 时RE 值达到33% 以上,其余均在7% 左右;而VCL 模型NSE 范围为0.71 至0.81 之间,R值0.85 至0.9 之间,在MAX 时RE 值均在20%左右,而其他洪水指标均在5%左右。总体而言,VCR 和VCL 模型NSE 值均提升到了0.7 以上,R值均提升到了0.85 以上,三个洪水指标也有着不同程度的改善,且VCL 模型在径流预测和洪水预测方面均优于VCR 模型。由此可知,混合模型有效地提高了物理驱动模型的预测模拟性能,这表明深度学习方法在径流和洪水预测中起到了误差校正和提高精度的作用。
在基于深度学习模型的径流预测中,LSTM模型NSE 范围为0.25 至0.6 之间,R值范围为0.6 至0.8 之间,RNN 模型NSE 范围为0.25 至0.65 之间,R值范围为0.5 至0.8 之间;在3 个洪水指标上,LSTM 和RNN 模型均在15%左右,这表明深度学习模型相较于VIC-CaMa-Flood模型虽然能更好的模拟洪水,但是在径流模拟上并没有显著的提升。而将VIC-CaMa-Flood模型模拟的径流量输入到深度学习模型中时,无论是径流预测还是洪水模拟的性能都得到了显著提升。由此可知,混合模型可以有效的提高数据驱动模型的仿真性能。
4 结束语
本文构建了基于物理机制模型(VICCaMa-Flood) 与深度学习方法(RNN、LSTM)耦合的径流预测模型,选择西江流域武宣站(WX) 和梧州站(WZ) 两个水文站在2010-2016 年期间的径流进行模拟实验,评估了物理机制模型(VIC-CamaFlood)、深度学习模型(RNN、LSTM) 和两种混合模型(VICCamaFlood-RNN、VIC-CamaFlood-LSTM) 在径流和洪水预测中的性能。本文主要结论如下:
1)对于VCL 和VCR 模型,在测试期中,VCL 模型NSE 值大于0.71,最大值达到0.81、R值大于0.85、RE 值小于8%;VCR 模型NSE值大于0.7,最大值达到0.77、R值大于0.85、RE 值小于6%。结果表明,VCL 模型相比于VCR 模型能够更好地模拟径流和洪水,其模拟结果与实测径流具有更高的相关性。
2)在三种类型径流预测模型的对比中,深度学习方法在径流和洪水预测中起到了误差校正和提高精度的作用,物理机制模型与深度学习方法的耦合可提高径流预测和洪水预测的准确性。