APP下载

耦合陆面水文模型和机器学习方法的水库径流量预报及应用

2022-04-13陈剑飞刘俊江钟利华史彩霞钟华昌

气象研究与应用 2022年1期
关键词:径流量水文合格率

陈剑飞,李 勇,刘俊江,钟利华*,史彩霞,袁 星,3,钟华昌

(1.广西壮族自治区气象灾害防御技术中心,南宁 530022;2.南京信息工程大学水文与水资源工程学院,南京 210044;3.中国科学院东亚区域气候-环境重点实验室,北京 100029;4.广西桂冠电力股份有限公司,南宁 530029)

引言

水电作为清洁能源,其可靠供应是社会经济发展的重要支撑。广西是我国水利发电的大省(区)之一,利用好水资源、增加水力发电电量是水电经济调度的重要工作。岩滩水电站作为红水河流域广西电力部门直接调度的第一个季调节水电站,其库区精准的径流量监测预报信息对流域水库群联合优化调度起到重要的作用,有利于提高水库群发电效益和供水安全。以往岩滩水库径流量预报方法主要是传统的统计预报方法[1-2],对流域范围内下垫面山坡河网等微地形影响研究不多,难以描述细致的地表、地下产汇流过程和水文要素的时空异质性,而单纯的物理模型或经验模型也难以准确地预报水库径流量,需要人工智能模型加以融合分析。在人工智能模型方面,当前比较流行的模型是长短期记忆网络模型(LSTM),它不仅能够发现输入变量和输出变量之间的隐藏关系,也能够更好地识别并记忆具有长期相关性的信息。

对于耦合气象预报、物理水文模型或利用机器学习方法提高水库径流量预报准确率问题的探讨,许多学者从多个方面开展了研究。包红军等[3]开展了洪水预报中定量降水预报应用进展研究,认为融合预报员预报的格点化定量降水预报技术,是提高面向洪水预报中流域降水预报精度的重要方法;崔春光等[4]开展了定量降水预报与水文预报耦合的预报试验,发现考虑预见期内的降雨相对于未考虑预见期降雨对洪水预报准确性提高具有明显的优势;曾鹏等[5]、彭筱等[6]、卢小凤等[7]、史彩霞等[8]通过开展智能网格、中国气象局广东快速更新同化数值预报系统(CMA-GD)预报产品的降尺度研究和应用检验分析,以期提升模式预报产品的实际预报能力;郭玉雪等[9]以舟山岛水库群为例,基于三种神经网络模型建立了不同预报因子组合和预见期的径流量预报模型,发现LSTM 通过耦合降雨预报信息可提高径流量预报精度;殷兆凯等[10]基于LSTM 建立不同预见期流域径流量预报模型的结果显示,预见期在0~3d 的径流量预报效果LSTM 模型优于新安江模型;梁振清等[11]基于卷积长短期记忆神经网络,构建深度学习的人工智能降水短临预报系统,显示出在1h 内预测准确率保持在80%以上。这些研究对耦合后的径流量预报精度进行了不同方面的论述,为后续改进提供了有益的参考作用。

以红水河流域岩滩水库范围作为研究区域,Liu等[12]在传统水文气象预报模型中引入机器学习方法,使用全球交互式大集合中心的欧洲中心回报数据(TIGGE-ECMWF),驱动CSSPv2(Conjunctive Surface-Subsurface Process model version 2)陆面水文模型进行了气象-水文回报试验后,将结果输入LSTM模型中进行校正,结果表明,耦合气象-水文-机器学习方法,与气象-水文方法建模比较,径流量预报与实况相比能够在前72h 内提升6%的精度。本文将采用多套短期定量降水预报模式优选结果,驱动陆面水文模型计算区间径流量,并将实况径流量输入LSTM 模型中,完成对岩滩水库入库径流量的预报。通过对历史洪水过程及业务运行期间的径流量预报进行评估,系统性分析耦合气象-水文-机器学习方法的岩滩水库径流量预报能力,为水库运行优化调度决策提供参考。

1 资料和研究区域

1.1 资料来源

气象资料采用岩滩水电站流域内97 个自动气象站2013 年1 月1 日至2020 年12 月31 日逐时降水、气温、相对湿度、风速、气压等实况资料,全国智能网格、欧洲中期天气预报中心数值模式(ECMWF)和CMA-GD 模式预报产品,以及中国气象局陆面数据同化系统同期逐时气压、比湿、风速、降水、短波太阳辐射等数据。水文资料采用岩滩、甲篆、罗富、龙滩4 个水库同期逐日平均径流量数据,岩滩、龙滩2 个水库逐时径流量数据。

1.2 研究区域

岩滩水电站位于广西大化县,流域内含岩滩、甲篆、罗富3 水文观测站。利用GIS 技术,通过提取岩滩水库流域范围水系、沿水系分水岭、主河道、流向、汇流量数据,划分为甲篆库区、罗富库区、岩滩上库区、岩滩中库区、岩滩下库区5 个流域区间,图1 所示为岩滩水库5 个流域区间及气象站点和水文站点分布图。

图1 岩滩水库5 个流域区间及气象站点和水文站点分布图

2 研究方法

2.1 CSSPv2 模型和LSTM 机器学习模型

CSSPv2 模型是在Common Land Model 模型[13-14]基础上发展起来的一种分布式、基于网格的陆面水文模型,具有完善的陆面水文过程描述,适合高分辨率模拟[15-16]。CSSPv2 模型分为模型前处理、模拟模块和后处理三个部分。首先通过生成气象强迫数据的插值权重以及根据权重进行气象强迫数据插值,并由陆面模式输入模型进行模拟,最后对陆面模式输出的网络通用数据格式(NetCDF)进行后期处理,根据经纬度将格点和站点进行匹配,找到站点对应的格点位置,选取需要的输出要素进行提取,完成径流量预报。

长短期记忆网络模型(LSTM)记忆单元输入包括t-1 时刻的隐藏层状态变量ct-1、记忆单元状态变量ht-1以及当前输入变量xt,输出当前时刻隐藏层状态变量ct与输出变量ht,其运算主要通过遗忘门、输入门和输出门三个步骤完成。

文中所使用的LSTM 是由Keras 深度学习框架所构建,通过输入历史24h 实况入库径流量、上游出库径流量及CSSPv2 预报的72h 区间径流量进行训练,得到72h 长度的入库径流量预报。

2.2 CSSPv2 模型参数率定

通过对产流参数和汇流参数进行率定实现物理模型的本地化应用,其中模型产流模块采用可变入渗容量产流(VIC)方案,是当前水文模型中运用较广的基于土壤水含量的土壤产流参数化方案。其采用地表入渗曲线来表示网格内部地表入渗能力的分布,对于地下基流则借助基流曲线计算。产流参数率定使用SCE-UA 进化算法[17],以NSE 作为目标函数对地表入渗曲线和基流曲线形状参数进行最大2000 代率定。模型汇流模块则使用隐式求解差分化一维运动波方程[18-19],适合目标区域的多山地形。河道汇流受格点河道密度、河道坡度、河道宽度与河道深度以及河道糙率参数影响,其初值可使用精细DEM 进行提取;参数率定使用人工试错法,以多个代表性强降水过程为目标进行率定。

经产汇流参数率定后,日尺度的CSSPv2 模式模拟流量与实况流量差值较小,而小时流量模拟对于上游的瞬时出库响应较差,波形坦化较重,需使用人工智能方法加以校正。

2.3 模式降水预报产品优选方案

选取智能网格、ECMWF 模式和CMA-GD 模式降水预报产品,经过双线性插值得到岩滩流域降水量预报产品,同时使用自动站实况降水进行距离反比权重插值制作岩滩流域实况降水量产品,采用算术平均法计算岩滩水库甲篆库区、罗富库区、岩滩上库区、岩滩中库区、岩滩下库区5 个流域区间面雨量。使用绝对误差检验方法,即:绝对误差=预报面雨量-实况面雨量,对3 种不同降水预报产品进行优选。采用动态评定方法,按照智能网格、ECMWF模式和CMA-GD 模式降水预报前15 日的平均绝对误差评分的大小进行排名,采用排名第1 的降水预报作为最优预报,代入预报模型运行,形成径流量预报产品;若评分最优预报缺测,将排名第2 的代入,进行依次递补。

2.4 预报模型建立及模型效果

2.4.1 预报模型建立

预报模型建立包括3 个步骤,即:驱动数据制作、物理模型模拟和机器学习预报。其中驱动数据制作过程采用距离反比权重法对流域自动站插值制作气象实况数据,采用双线性插值法对智能网格、ECMWF 模式、CMA-GD 模式预报产品插值制作气象预报数据,经预报降水优选后,为物理模型模拟提供驱动数据。

物理模型模拟采用Restart 方式,将前一天的流域状态文件输入气象实况数据进行状态更新,再输入气象预报数据进行72h 流域区间径流量的预报。其中初始状态数据通过2013—2020 年连续多次循环模拟后,提取相同日期的气候态流域状态制作,经过两个月的业务运行达到稳定后得到。

机器学习预报方面,模型的训练使用2013—2020 年岩滩水库入库实况径流量和模拟区间径流量数据。其中,取2013—2017 年为训练期,训练期预报样本共计1826 个,2018—2020 年为验证期,验证期预报样本共计1096 个。输入的49 个数据分别是0~23h 前岩滩水库入库径流量、0~23h 前上游龙滩水库出库径流量以及距离起报时刻t 小时物理模型模拟的区间径流量,预报数据为距起报时刻t 小时的岩滩水库入库流量;总构建72 个模型,完成t+1至t+72h 的岩滩水库入库径流量预报。

2.4.2 模型检验方法

选取纳什效率系数(NSE)、相对误差合格率方法、洪峰出现时间时距差作为径流量预报性能评价指标,计算公式如下:

3 预报模型模拟效果分析

从2013—2020 年岩滩水库径流量数据中,选取48h 内滑动平均径流量>3000m3·s-1或24h 滑动流域平均面雨量和>12mm 的强降水过程作为预报模型强降雨过程检验样本样本,其中2013—2017 年15次强降水过程作为训练期样本,2018—2020 年8 次强降水过程作为验证期样本。图2 实例中的强降水过程径流量大多在3000~3500m3·s-1,其中图2a、2b显示了土壤湿度未饱和时产生蓄满产流的情况,图2c 显示了土壤湿度未饱和且降水未达到土壤蓄满,流量以超渗产流为主的情况,图d 显示了土壤湿度饱和产生蓄满产流的情况。试验表明,在土壤湿度未饱和时,蓄满产流峰现时间相对土壤湿度饱和情景下能够产生延迟,且降水未使土壤饱和时,产流洪峰并未出现,表明了预报模型能根据土壤湿度条件对洪峰是否出现、峰现时间延迟长度进行调节。采用NSE 评估,训练期强降水过程NSE 为0.66,验证期强降水过程NSE 为0.65,较不使用LSTM 模型,仅使用物理模型汇流的模拟NSE 提升了0.05。

图2 岩滩水库径流量预报模型模拟效果图

采用48h 预报与实况径流量的相对误差为合格率标准进行评估,预报效果见表1。从表1 可见,日径流量预报相对误差绝对值训练期15 次过程均小于15%,预报合格率为100%,达到甲级预报精度,验证期8 次过程有7 次过程小于15%,预报合格率为87.5%,达到甲级预报精度。对于洪峰预报相对误差绝对值,训练期15 次过程有14 次小于15%,预报合格率为93.3%,达到甲级预报精度,验证期8 次过程均小于15%,预报合格率为100%,达到甲级预报精度。对于峰现时间预报误差,训练期15 次过程有13 次≤3h(达到合格要求),合格率为86.7%,验证期8 次过程有5 次≤3h(达到合格要求),合格率为62.5%。表明引入LSTM 模型考虑上游放水影响后,岩滩水库径流量预报有较好的预报精度;日径流量预报和洪峰预报,达到甲级预报精度,可用于发布正式预报;峰现时间预报,训练期的强降水过程预报精度合格率达到甲级,可用于发布正式预报,而在验证期为丙级,可用于参考性预报。

表1 岩滩水库训练期和验证期强降水过程日径流量预报、洪峰相对误差及峰现时间误差

4 业务应用效果

2021 年12 月,通过建立岩滩水库径流量预报系统,实现岩滩水库径流量预报产品的业务试运行。图3 给出2021 年12 月18 日—2022 年2 月10 日24~72h 日径流量预报效果。从图3 可见,24h、48h、72h 日径流量预报与实况的相对误差绝对值分别有48d、38d、40d 小于等于15%,预报合格率分别为87.3%、70.4%、75.5%,表明24h 预报达到甲级预报精度,48h、72h 预报达到乙级预报精度,均可用于发布正式预报。

图3 2021 年12 月18 日至2022 年2 月10 日岩滩水库日径流量预报效果

表2 给出岩滩水库径流量>1200m3·s-1的3 次较大降水过程(2021 年12 月22—23 日,2021 年12月25—26 日,2022 年1 月6—7 日)。从表2 可见,其中3 次过程日径流量相对误差均≤5%,峰现时间误差均≤1h,预报合格率均为100%,峰值相对误差绝对值有2 次≤14%,有1 次为17%,预报合格率为66.7%。表明3 次较大降水过程径流量和峰现时间预报效果好,到达甲级预报精度,可用于发布正式预报,而峰值预报为丙级预报标准,可用于参考性预报。

表2 岩滩水库2021 年1 月—2022 年2 月3 次降水过程日径流量预报、洪峰相对误差及峰现时间误差

5 结论

基于水文物理模型耦合机器学习方法,通过对全国智能网格、ECMWF 和CMA-GD 模式预报产品的优选,驱动CSSPv2 陆面水文模型计算区间径流量,在实况径流量中输入LSTM 模型对岩滩入库径流量进行预报,得到以下结论:

(1)将陆面水文模型模拟的区间径流量结果输入LSTM 模型进行预报后,岩滩水库日水文过程具有较好的模拟效果,率定期和验证期NSE 效率系数在0.65 左右,与仅使用陆面水文模型模拟相比,NSE效率系数提升了0.05。

(2)在强降水评估实验中,日径流量预报和洪峰预报验证期预报合格率≥87.5%,为甲级预报精度标准,对该流域具有较好的应用价值;峰现时间预报合格率为62.5%,为丙级预报标准。

(3)在业务试用中,24h、48h、72h 日径流量预报合格率分别为87.3%、70.4%、75.5%,其中24h 预报合格率达到甲级预报精度,48h、72h 预报合格率达到乙级预报精度,满足发布正式预报的精度要求;3次较大降水过程径流量和峰现时间预报合格率均为100%,达到甲级预报精度,满足发布正式预报的精度要求;峰值预报合格率为66.7%,达丙级预报标准,可用于参考性预报。

在岩滩流域水库径流量预报业务中,将物理模型与人工智能进行有机地耦合,充分利用机器学习的优势,弥补模型的不足之处,对提高水文预报产品的精度和适用性起到很好的借鉴作用。但对于降水未达土壤湿度饱和状态时,径流量主要由上游放水控制,LSTM 模型对于径流量的削减过多,降低了峰值径流量,在今后研究中需要进一步改进。

猜你喜欢

径流量水文合格率
非平稳序列技术在开垦河年径流量预报中的应用
2020年畜禽产品兽药残留抽检样品合格率99.49%
2020年农产品质量安全例行监测合格率达97.8%
继往开来 守正创新——河北省水文工程地质勘查院
采用非参数统计方法及年代际变化分析塔西河来水变化状况
1956年~2015年渭河流域径流年内分配特征分析
继往开来 守正创新——河北省水文工程地质勘查院
1956—2013年汾河入黄河川径流量演变特性分析
水文
水文水资源管理