基于LSTM模型的水库监测预警与风险评估
2021-10-22王茂洋罗天文
王茂洋,罗天文,徐 锐
(贵州省水利水电勘测设计研究院,贵州 贵阳 550002)
当前治水的主要矛盾已经发生深刻变化,我国治水的工作重点已经转变为“水利工程补短板、水利行业强监管”,重点在于解决好“监管什么”和“如何监管”的问题。对于水利工程来说,水库的管理与调度一直是监管的重点,监管的目的是以水库安全水位运行为基础,以饮用水保障为前提,同时保障灌溉需求,在合理范围内达到水库水量的调蓄平衡。构建科学高效的水库监测预警模型,成为当前工作的重中之重。吴美玲等i探索了基于KG-PB神经网络在秦淮河洪水水位预测中的应用;冯钧ii等提出了一种LSTM-BP多模型组合水文预报方法;石继海等iii对中长期径流预报模型进一步进行优选研究。但之前所作研究对象多为某一具体指标,且未从趋势模拟和风险分析的角度去构建模型进行分析。本文综合水文特征具有较长延迟变化的特点,利用适合于处理和预测时间序列中间隔和延迟相对较长的重要事件的长短期记忆网络(Long Short-Term Memory,以下简称LSTM),构建水库监测预警体系。
1 项目区概况与数据来源
1.1 项目区概况
小龙潭水库属于珠江流域南盘江水系,发源于兴义市七舍镇读纳村北部,向南东流,接纳左岸支流后称上后河,继续向南流,接纳下纸厂支沟后称下后河,明流1km后于落水洞潜入地下成伏流,出露于龙滩村的龙潭泉点,再明流1.25km后再次潜入地下,最终流入南盘江。小龙潭水库目前有3个水雨情监测站点,2个水位雨量站,1个水位站。
1.2 数据概况
采用的数据记录时间段为2017年9月1日 08:00:00至2018年9月16日 21:00:00,记录间隔为1h,共计90799条记录,包括:日期、期初水位、期初库容、期末水位、期末库容、面雨量、入库水量、出库水量、最高水位、发生时间、最低水位、发生时间、水位变幅、库容变幅,如图1所示。
图1 主要数据情况
训练集包含9078条记录,时间段为2017年9月1日08:00:00至2018年9月3日 16:00:00;测试集包含318条记录,时间段为 2018年9月3日 16:00:00至2018年9月16日21:00:00。记录间隔为1h。
2 研究方法
水库水量模型是一个动态系统,表达或控制动态特性的数学方程,构成了水库特性的模拟模型,其一般形式如下。
q=f(v,t)
(1)
式中,q—水库根据需求泄放的水量,m3;v—水库蓄水量,m3;t—时间,h。
该模型中蓄水量是入库水量与出库水量及蒸发渗漏损失量的函数。若入库水量采用实测系列值,则构成确定性实测入流系列水库模拟调度模型。
本次研究水库水文特征预测预警系统包括4个LSTM模型:水位、库容、入库水量和出库水量。通过对数据进行平稳性监测后完成数据的相关分析,分析数据之间的耦合关系,完成数据预处理和预分析后构建训练数据集,设置隐藏节点,分析模拟预测结果,实现模型多步预测和长时间趋势分析与风险评估,技术路线如图2所示。
图2 技术路线
针对LSTM模型的隐藏层中不同数量的节点计算训练集的统计误差,模型训练时设置隐层节点的数量从1逐渐增加到100来进行尝试。
LSTM模型训练步骤如下:
(1)将数据集分为训练集合80%、测试集合20%。
(2)将数据归一化为[0,1]之间。
(3)隐含节点数量n取值从3到100,分别用10个数;
(4)构建LSTM模型结构(in,n,out),in:LSTM神经网络的输入样本的纬度(in=6);out:LSTM神经网络的输出样本的纬度(out=1),n是神经网络的隐含节点数量。
据训练子集进行模型训练,并计算最终的模型评估指标RSME,R2,NSE。
需要训练4个LSTM模型:水位模型,库容模型,入库水量模型和出库水量模型。
3 计算结果
3.1 平稳性检测
水库出入库水量、雨量序列进行ADF检验,检验序列是否平稳, ADF检验结果见表1。
表1 入库水量ADF检验结果
ADF检验结果(-9.967665,-9.967699)皆小于1%水平,且假设检验结果趋近于0,显示极显著的拒绝原假设,认为水位、库容、雨量序列是平稳的。
3.2 数据间相关分析
水位一阶差分序列与库容一阶差分序列之间互相关分析得到相关系数为0.999809,显示两者之间存在高度相关性,水位一阶差分序列与入库水量互相关分析得到相关系数为cor=0.676,显示两者之间存在较高的相关性,水位一阶差分序列与出库水量互相关分析得到相关系数为cor=0.676,显示两者之间存在较高的相关性,入库与出库水量互相关分析得到相关系数为cor=0.9999,显示两者之间存在高度的相关性。
在雨量经过6-8h后,入库水量与雨水量互相关分析得到的相关系数最高为cor=0.2802552,显示两者之间存在相对较弱的相关性,如图3所示。
图3 入库水量(x1)、水位(x2)一阶差分序列与雨水量(y)相关分析(滞后7h)
而出库水量与雨水量的相关类似,系数为cor=0.2802531。
水位一阶差分序列与雨水量互相关分析得到的相关系数最高为cor=0.28166,库容一阶差分序列与雨水量的相关类似,系数为cor=0.282256。
可以看出,某一时刻的水库水位受到其他历史变量诸如库容、出入库水量、面雨量等的影响,属于多变量时间序列预测。
3.3 模型预测与评估
3.3.1水位LSTM模型
通过分析,显示当隐含节点数量为83时,各项指标最佳。设置水位LSTM模型的隐含节点数量为83。真实值和预测值的曲线如图4所示,预测评估结果见表2。
图4 水位预测曲线图
表2 模型评估指标(n=83)
3.3.2库容LSTM模型
计算得出,显示当隐含节点数量为89时,各项指标。最佳设置库容LSTM模型的隐含节点数量为89,真实值和预测值的曲线如图5所示,预测评估结果见表3。
图5 库容预测曲线图
表3 模型评估指标(n=89)
3.3.3出入库水量模型
计算得出,显示当隐含节点数量为4或5时,各项指标最佳。设置出入库水量LSTM模型的隐含节点数量为5,真实值和预测值的曲线如图6所示,预测评估结果见表4。
表4 出库水量模型评估指标(n=5)
图6 出库水量预测曲线图
图7 入库水量(m3)预测曲线图
表5 入库水量模型评估指标(n=5)
3.4 模型多步预测
以时间点:2018年9月16日21:00:00为出发点,预测未来7d的水位和库容值,设置3种场景:①无雨天气;②历史同期天气③暴雨天气。
3.4.1无雨天气场景预测
无雨天气场景下水库的水位和库容在未来的7d呈下降趋势。
出入库水量在下降周期内,预测未来也呈下降趋势。
3.4.2历史同期天气场景预测
历史同期天气是有阵雨,水库的水位和库容最初呈下降趋势,7h后雨量开始发挥影响,水位和库容开始上升,随后无雨后,水位和库容呈下降趋势,符合逻辑。
出入库水量在下降周期内,预测未来的下降趋势有一定起伏。模拟结果如图8—10所示。
图8 雨量曲线图(历史同期天气,7h延迟)
3.4.3暴雨天气场景预测
暴雨使水库的水位和库容呈快速上升趋势。
3.5 长期趋势模拟与风险评估
3.5.1水位长期趋势模拟与评估
以时间点2018年9月16日 21:00:00水位值219.72m为当前基准值,依据此值做未来31d的趋势模拟,设置警戒上限值为221m,警戒下限值为208.55m,预期观测值为220m。模拟测试500次,模拟结果如图11—12。
①基本模拟算法:
模拟结果分析见表6。
表6 趋势评估(基本模拟)
图9 库容多步预测曲线图
图10 入库水量多步预测曲线图
图11 水位趋势模拟(基本模拟)
图12 水位趋势模拟(布朗运动)
②采用几何布朗运动
模拟结果分析见表7。
表7 趋势评估(布朗运动)
3.5.2库容长期趋势模拟与评估
以时间点2018- 09- 16 21:00:00库容值7218.32为当前基准值,依据此值做未来31d的趋势模拟,设置警戒上限值为7510.37,警戒下限值为5261.33,预期观测值为6699.84。模拟测试500次,结果如图13—14所示。
图13 库容趋势模拟(基本模拟)
①基本模拟算法:
模拟结果分析见表8。
表8 趋势评估(基本模拟)
②采用几何布朗运动
模拟结果分析见表9。
表9 趋势评估(布朗运动)
4 结论与讨论
(1)小龙潭水库2017年9月—2018年9月水位、库容、雨量序列是平稳的,水位、库容、出入库水量、雨量两两之间高度相关性,某一时刻的水库水位受多因素的影响,属于多变量时间序列预测。
图14 库容趋势模拟(布朗运动)
(2)根据训练子集进行模型训练得出的最终模型评估指标RSME,NSME,MSE,R2,NSE,客观地反映了水位模型,库容模型,入库水量模型和出库水量模型4个LSTM模型的精度问题。实测值和模拟值的匹配较好,模式质量好,模型可信度高。
(3)通过无雨天气、历史同期天气、暴雨天气三种场景下的未来7d水位和库容值预测得出模型多步预测符合历史情况,较为科学。
(4)通过基于随机变量波动率的基本模拟算法模拟的未来31天的水位均值为219.71m,水位最大值为221.16m,最小值为219m,标准方差为0.271m;高于上限警戒值的概率为0.40%,低于下限警戒值的概率:0.00%;库容均值为7222.57m3,最大值为7567.18 m3,最小值为6968.0 m3,标准方差为87.3 m3;高于上限警戒值的概率为0.02%,低于下限警戒值的概率为0.00%。
(5)通过基于几何布朗运动模拟算法模拟的未来31d的水位均值为219.94m,水位最大值为221.66m,最小值为218.69m,标准方差为0.471m;高于上限警戒值的概率为1.60%,低于下限警戒值的概率:0.00%;库容均值为7266.53 m3,最大值为7583.01 m3,最小值为6981.73 m3,标准方差为99.37 m3;高于上限警戒值的概率为0.04%,低于下限警戒值的概率为0.00%。
(6)综合以上,未来31d的水位、库容高于或低于警戒值的风险较小。