APP下载

基于多种学习方案LSTM的信江流域径流预测

2022-10-11马炳焱成静清刘章君邓武彬

水力发电 2022年7期
关键词:径流降雨流域

郑 勇,马炳焱,成静清,刘章君,邓武彬

(1.江西省水利科学院,江西 南昌 330029;2.郑州大学水利科学与工程学院,河南 郑州 450001;3.江西省水利厅,江西 南昌 330009)

1 研究背景

合理的预测径流对于流域防洪和水资源调控具有重要意义[1-2]。受流域水文特征高复杂性和非线性影响,水文统计学模型预测径流的精度受统计数据和模型条件的影响,当预报条件在模型条件范围内时具有良好的效果,但当预报条件接近或超出历史观测极限时,预测效果很差[3]。具有一定物理机制的水文模型虽然可以满足预测精度,但是模型构建对流域下垫面和水文数据需求较高且参数率定过程复杂,存在参数不确定性以及模型普适性较差等问题,难以适用于基础资料缺乏的地区[4]。近年来,随着机器学习算法的发展。以人工神经网络和支持向量机为代表的数据驱动算法在径流预测中得到广泛应用。以应用成熟的BP神经网络(Back propagation neural network)[5- 8]为例,赵文刚等[9]以汛期和非汛期的安乡、石龟山及沙湾站的水位、流量为输入预测西洞庭湖南咀站的月经流量,预测准确率达77.8%,预报等级为乙级;李继清等[10]以唐乃亥水文站1956年~2010年的径流数据为训练样本,2011年~2017年的数据为验证样本进行月和旬径流预报,单一BP神经网络的预报合格率为60%;王长鹏等[11]以2008年~2013年宜昌水文站的日径流数据为训练集,以其中最后90天数据为测试集进行了日径流预测,标准BP神经网络预测准确率达72.2%。近年来,长短期记忆神经网络(LSTM)以其在时间序列模拟回归上的优势[12],逐渐成为径流预测的研究热点,胡庆芳等[13]以汉江安康站及其上游石泉站的前期径流量和流域面雨量为输入构建LSTM模型对安康站日径流进行预测,训练集和检验集的效率系数最高可达0.83和0.84;张森等[14]将LSTM应用于晋江上游控制性水文站石砻站2013年~2017年逐月径流过程进行延时回归预测,合格率为85%,确定性系数R2为0.953,达到预报甲等标准。综上可知,LSTM在径流预测的性能上优于BP神经网络,两种方法对于不同的模型输入会产生不同的预测效果[15],相关研究中对于采用什么样的输入数据进行预测尚无统一标准。

研究基于LSTM,在不改变算法结构的前提下,设置不同的输入集,以筛选信江流域日径流预测的最优学习方案,为基于LSTM的流域径流预测输入数据集的选取提供参考。

2 研究方法

2.1 研究区和数据

研究区为梅港水文站断面上游的信江流域。该流域属鄱阳湖水系五大流域之一,年均降水量1 826 mm。由于气候因素的影响,流域年内水资源分布不均,春夏两季降水量占全年总量的73%,流域出口断面最小流量为4.14 m3/s,最大流量13 800 m3/s,差异巨大,其径流具有极强的非线性特征[16]。加之信江流域人口密度大,人均水资源量少,准确高效的径流预测对于流域洪旱灾害防治和水资源优化配置具有重要意义。

用于本研究日径流预测的降雨数据资料为上游上饶站和弋阳站以及下游梅港站2007年~2019年日降雨数据,径流数据为梅港站2007年~2019年实测日平均流量数据,所有数据在应用前均通过可靠性、一致性和代表性审查。

2.2 LSTM原理

LSTM是用于处理深度学习算法的强大工具,广泛用于回归和分类[17-18]分析。它是循环神经网络的变体之一,能够解决一般循环神经网络在长序列回归上的梯度爆炸和梯度消失问题。LSTM由1个输入层、1个或多个记忆单元和1个输出层组成,如图1所示。图1中,隐藏层包含两个状态变量h和c,分别用于保存短期状态和长期状态;因此,在t时刻,LSTM有3个输入:当前时刻网络的输入值xt,上一时刻网络的短期状态ht-1和上一时刻的长期状态ct-1。

图1 LSTM的输入输出映射

图2给出了LSTM各个门控单元的连接方式。LSTM用两个门来控制长期状态c的内容:一个是遗忘门,它决定了上一时刻的长期状态有多少保留到当前时刻;另一个是输入门,它决定了当前时刻网络的输入有多少保存到长期状态。LSTM用输出门来控制长期状态c有多少输出到LSTM的当前输出值。

图2 LSTM的门控结构

式(1)~式(5)分别对应遗忘门ft、输入门it、当前输入的长期状态c′t、当前时刻的长期状态ct和输出门ot的计算方法。

(1)遗忘门

ft=σ(Wf[ht-1,xt]+bf)

(1)

式中,Wf为遗忘门的权重矩阵;[ht-1,xt]为把两个向量连接成一个更长的向量;bf为遗忘门的偏置项;σ为激活函数为Sigmoid函数。

(2)输入门

it=σ(Wi[ht-1,xt]+bi)

(2)

式中,Wi为输入门的权重矩阵;bi为输入门的偏置项。

(3)当前输入的长期状态

c′t=tanh(Wc[ht-1,xt]+bc)

(3)

式中,tanh为激活函数;Wc为当前输入的长期状态的权重矩阵;bc为Wc的偏置项。

(4)当前时刻的长期状态

ct=ft·ct-1+it·c′t

(4)

经过上述运算,LSTM将关于当前的记忆c′t和长期记忆ct-1组合在一起形成了新的长期状态ct。在遗忘门和输入门的控制下,该状态既可以保存长时间序列的信息,又能避免当前无关紧要的信息进入记忆中。

(5)输出门

ot=σ(Wo[ht-1,xt]+bo)

(5)

式中,Wo为输出门的权重矩阵;bo为Wo的偏置项。

LSTM的最终输出ht由输出门ot和长期状态ct共同决定,即

ht=ot·tanh(ct)

(6)

表1 丰水期3种方案部分输入输出集数据

表2 枯水期3种方案部分输入输出集数据

3 实例分析

3.1 学习方案

神经网络通过建立输入与输出的映射关系来解决非线性回归问题。在径流预测方面,神经网络的性能可通过其在预测集上的准确率来衡量。在模型构建时保证超参数不变,考虑对日径流量可能产生影响的上游来水和区间来水两方面因素,以流量和降雨量的不同组合设计3种不同的学习方案作为输入,下游梅港站当日平均流量作为输出,3种不同的输入集对应相同的输出集,以对比不同学习方案下LSTM径流预测的性能。

方案一:以前期径流预测当日径流,输入数据为梅港站前1、2、3日流量,输出数据为当日流量。这样的处理用于探究LSTM对径流趋势的预测能力。

方案二:前期降雨预测当日径流,输入数据为梅港站及上游上饶站和弋阳站前1日降雨量,输出数据为当日流量。用于判断前期降雨对径流的预测能力。

方案三:前期径流和前期降雨预测当日径流,输入数据为梅港站前1、2、3日流量和3站前1日降雨量,输出数据为当日流量。该方案用于探究前期降雨和前期径流对当日径流的预测能力。

由于信江流域降雨主要集中在4月~9月,考虑不同来水条件,将研究区2007年~2019年的降雨径流数据分为丰水期(4月~9月)和枯水期(10月~3月)两种情况。表1和表2为2种情况下3种方案的部分输入输出集数据。样本数据按照7∶3的比例划分为训练集和测试集,对应的丰水期训练集样本1 663组、测试集样本723组,枯水期训练集样本1 656 组、测试集样本710组。训练集数据用于构建LSTM模型,将其在测试集上的平均绝对误差和纳什效率系数作为衡量模型预测性能的指标。

图3 丰水期和枯水期的降雨量和流量

3.2 结果

信江干流3个水文站2007年~2019年的降雨及下游梅港站的流量数据如图3所示。在枯水期,径流多数由前期径流或基流决定,而丰水期,径流由降水和基流共同影响。丰水期最大日平均流量达12 100 m3/s,平均值为853 m3/s,枯水期最大日平均流量仅为5 400 m3/s,平均值为348.9 m3/s。丰水期最大日降雨量为218.5 mm,平均值为6.6 mm,枯水期最大日降雨量为96 mm,平均值为3.6 mm。

图4 3种方案丰水期和枯水期的平均绝对误差

平均绝对误差通过计算所有单个观测误差的绝对值的平均值,可以避免误差相互抵消的问题,因而可以准确反映实际预测误差的大小,是衡量LSTM预测准确性的重要指标。图4为丰水期和枯水期LSTM在训练集和测试集上50次迭代的平均绝对误差收敛过程,测试集最终的平均绝对误差如表3所示。不论是丰水期还是枯水期,方案三以前期降雨和前期径流共同预测当日径流的模拟误差均为最小,是最适合于信江流域日径流预报的方案。

表3 3种方案丰水期和枯水期的最终平均绝对误差

表4 3种方案丰水期和枯水期的纳什效率系数

丰水期和枯水期测试集的流量预测结果见图5。丰、枯两种情形下,方案三的拟合效果都优于方案一和方案二。表4相应地给出了测试集各方案的纳什效率系数。总体看来,各方案枯水期的拟合效果都优于丰水期。这是由于枯水期数据间的差距要小于丰水期,数据本身的不稳定性更低。方案一和方案三都具有相当高的预测精度,其中方案三在丰水期和枯水期的纳什效率系数分别为和0.94和0.96,达到甲级预报水平。平均绝对误差和纳什效率系数两个指标均表明,方案三在信江流域径流预测中效果最佳,方案一次之,方案二最差。

图5 丰水期和枯水期测试集的流量预测结果

4 结论与讨论

研究设置3种LSTM径流预测学习方案,方案三以前期流量和前期降雨共同预测当日流量最终平均绝对误差均低于另外两组方案,模拟结果的纳什效率系数又最高;因此,方案三表现最佳。在数据可以取得的前提下,应当优先考虑将前期径流和流域前期降雨资料结合起来设置LSTM径流预测模型的输入,以取得更加良好的预测结果。这也表明前期径流和前期降雨两方面单独拿出来对断面来水的代表性都不足,两者结合起来能够有效提高数据的代表性。研究可用于指导基于数据驱动的流域径流预测输入集数据的选取,避免不适当的输入数据导致预测结果不佳。

猜你喜欢

径流降雨流域
基于SWAT模型的布尔哈通河流域径流模拟研究
区域联动护流域
降雨型滑坡经验性降雨型阈值研究(以乐清市为例)
西南岔河径流特性实例分析
河南省小流域综合治理调查
泥石流
称“子流域”,还是称“亚流域”?
闽东北鹫峰山不同迹地与不同植被恢复模式对径流的影响
流域保护的制度分析