APP下载

基于长短时记忆网络(LSTM)的南水北调中线水位预测

2020-10-19雷晓辉谭乔凤

中国农村水利水电 2020年10期
关键词:南水北调水位精度

唐 鸣,雷晓辉,龙 岩,谭乔凤,张 召

(1.中国水利水电科学研究院,北京 100038; 2.河北工程大学水电学院,河北 邯郸 056038;3.河海大学水利水电学院,南京 210098)

0 引 言

水资源调度是缓解水资源分布不均、水资源短缺的有效手段。南水北调中线为我国缓解河北地区水资源短缺,协调南北水资源分布的典型长距离调水工程,并以闸前常水位为渠道运行的控制指标[1]。多年来,学者们试图用水力学的方法模拟渠道水流,以期用数值方法制定闸门控制策略以及水资源实时调度方案。然而实际模拟需要精确的地形资料、准确的实测数据,在参数率定中,受模型参数及边界条件的影响使得精度难以达到水位控制要求,因而存在诸多局限[2-4]。

随着人工智能的发展,机器学习方法发展迅速。学者们试图用数据驱动的方式规避传统水力学模型多方面建模要求及复杂的参数校正过程,而直接探索数据之间的潜在规律。由于人工神经网络(Artificial Neural Networks,ANN)具有强大的非线性能力,能无限逼近任意函数使得其在水位预测中应用中最为广泛[5-7]。然而ANN结构简单不能保存前时信息而无法学习时间序列数据。递归神经网络(Recurrent Neural Networks,RNN)因隐含层神经元相互连接构成循环结构,使其能保存先前时刻的信息并利用先前信息预测当前信息,也被用于水位预测[8]。由于RNN在梯度传递中的缺陷,Hochreiter和Schmidhuber[9]提出了RNN的变体长短时记忆网络。LSTM因其强大的时间序列处理能力,已被用于语义识别[10]、图像识别、疾病预测[11]、股票收益预测[12]等多方面任务。近几年来,LSTM逐步运用水力学及水文预报[13-15],然而在诸多水力控制因素下的长距离调水工程中应用较少。

建立了一个三层LSTM长距离调水工程闸前水位预测模型,应用于南水北调中线京石段12个闸的闸前水位预测,并与DNN模型预测结果进行了对比,探索了LSTM模型参数对预测精度及计算效率的影响。

1 研究区及数据

1.1 研究区域

研究区为南水北调中线京石段,如图1。京石段(桩号970+379~1197+669)为古运河河节制闸-北拒马节制闸渠段,位于南水北调中线干渠末端段,主要向北京、天津和河北三省市供水。沿线共14座节制闸,13个分水口,12座退水闸,以及倒虹吸、渡槽、暗渠等众多水力建筑物,渠道运行方式为闸前常水位。

图1 京石段示意图Fig.1 Schematic diagram of jingshi section

1.2 研究数据

本研究采用京石段14座节制闸闸前水位、闸后水位、过闸流量及闸门开度监测数据及节制闸间渠段的分水口、退水闸的流量数据。数据长度为3-10月,数据时间间隔为2 h,数据集按19∶1划分训练集和测试集。部分闸闸前闸后水位如图2。

图2 部分节制闸闸前闸后水位Fig.2 Water level immediately upstream the gate and water level immediately downstream the gate of partial gates

2 LSTM模型

LSTM 是一种特殊的RNN 变体,具有与RNN相似的循环结构,如图3。RNN因在普通多层BP神经网络基础上,增加了隐含层各单元间的横向联系,通过一个隐藏层状态,可以将上一个时间序列的神经单元的值传递至当前的神经单元,从而使神经网络具备了“记忆功能”。然而RNN在训练中很容易发生梯度爆炸和梯度消失,导致训练时梯度不能在较长序列中一直传递下去,从而使RNN无法捕捉到长周期的影响[16]。Hochreiter and Schmidhuber (1997)提出了LSTM解决了这一问题,其“记忆单元”的门控结构使用两个隐藏层状态控制信息的取舍、输入、更新、输出,因此具备长时间的记忆功能。

图3 RNN及LSTM单元结构Fig.3 Gated structures of RNN and LSTM

LSTM的门控结构如图3(b),原理如下:

(1)遗忘门(forget gate)计算:输入上一序列的隐藏状态ht-1和本序列数据xt,通过sigmoid激活函数得到遗忘门的输出ft,决定上一细胞状态Ct-1的保留概率。

ft=σ(Wfht-1+Ufxt+bf)

(1)

it=σ(Wiht-1+Uixt+bi)

(2)

(3)

(4)

(3)输出门(output gate)计算:首先,ht-1和xt经过sigmoid层确定细胞状态的输出部分。其次,细胞状态经过tanh进行处理并和sigmoid门的输出相乘,输出指定部分ht。

ot=σ(Woht-1+Uoxt+bo)

(5)

ht=ot⊙tanh(Ct)

(6)

式中:⊙为矩阵元素积;Wf,Wi,Wo分别表示从遗忘、输入、输出门到输入的权值矩阵;Uf、Ui、Uo分别表示从遗忘、输入和输出门到隐藏层的权重矩阵;bf,bi,bo分别表示遗忘、输入和输出门的偏置向量。

文中首先进行实验一来确定最优的人脸人耳特征融合权重系数α,β。将权重系数α从0.1开始以0.1为步长逐步调整至0.9,对应的权重系数β也随之调整,β=1-α,统计每次系数对应的识别率,统计结果如图3所示。

3 闸前水位预测模型的建立

3.1 模型输入及输出

考虑模型参数对精度和计算效率的影响,将隐藏层单元数目、最大迭代次数、学习率作为参数可变输入项。并以loss函数在训练期作为模型收敛标准,其中y为实测值,s为预测值,公式如下:

(7)

图4 模型各数据项关系示意图Fig.4 Schematic diagram of the relationship between each data item

3.2 数据前处理方法

为了提升模型的收敛速度及保持数据一致性,将所有变量在输入时都进行了归一化处理,在输出时进行反归一化。

(8)

3.3 模型评价指标

本研究采用两种方法来评判预测值和实测值之间的准确性。均方根误差RMSE对一组测量中的特大或特小误差反应非常敏感,能够很好地反映出测量的精密度和整体偏差大小。纳什系数能很好地反映预测值和实测值之间的吻合程度,反映预测值序列和实测值序列的拟合关系。

(9)

(10)

4 结果与分析

4.1 模型预测精度评价

在训练阶段,用训练集数据训练模型,并用验证集数据预测滹沱河节制闸-坟庄河节制闸的闸前水位。训练阶段所用模型超参为128个隐藏层单元数目,最大迭代次数1 000,学习率10-3。验证集对应的预测结果如图5。

结果显示,LSTM及DNN都能够预测出滹沱河节制闸-坟庄河节制闸的闸前水位随时间的波动趋势,但是DNN在某些闸误差较大不能预测出局部水位波动趋势,而LSTM能够很好地拟合所有节制闸的闸前水位。表1评价指标直观显示,LSTM模型在所有闸预测结果RMSE最高仅为0.029 m,NSE最

图5 LSTM与DNN在京石段12个节制闸预测结果对比Fig.5 Comparison of prediction between LSTM and DNN in 12 gates of jingshi section

表1 两模型预测精度对比Tab.1 Prediction accuracy of two models

低可达0.953;DNN模型RMSE最高可达0.1,NSE最低达0.35,LSTM整体预测效果比DNN更好。对于两模型在唐河节制闸及放水河节制闸高精度的闸前水位预测结果,分析为所用模型输入数据的标准差较小所致;同样对于坟庄河精度相对较低的结果,分析为所用模型输入数据的标准差较大导致。

4.2 模型参数对预测精度及计算效率影响分析

由于LSTM预测效果比DNN更好,在水位预测进行调度决策时首选LSTM模型。本节选择学习率、最大迭代次数以及LSTM隐藏单元数目作为指标探索模型超参对LSTM预测精度及计算效率的影响,为预测精度以及实际工程应用时考虑的计算效率做参考。以沙河节制闸为例,对8组模型参数进行精度及计算效率的测试。为使结果对比明显,本节选用1、2、3 cm误差结果百分比作为精度评判指标,如表2。1和2组,3和4组,5和6组的结果对比可显示出对计算效率影响最大的是最大迭代次数。1、3、5组及2、4、6组的结果显示隐藏层单元数目对计算效率几乎没有影响,而对精度有较大影响。对比第4、7、8的结果可知,过高的学习率会导致过拟合现象,过低的学习率会使精度不足。在模型构建时应首先考虑最大迭代次数对计算效率的影响,其次综合考虑隐藏单元数目及学习率对精度的影响。

5 结 论

本文基于长短时记忆网络建立了南水北调中线闸前水位预测模型,并运用于南水北调京石段闸前水位预测。针对模型性能,将所提模型预测结果与DNN模型预测结果进行了对比分析;选取学习率、隐藏层单元数、最大迭代次数3个超参作为指标,对比在不同组指标下的预测结果,探索了LSTM模型超参对模型精度及计算效率的影响。得到主要结论如下:

(1)LSTM模型能高精度地预测京石段闸前水位,预测精度高于DNN,实现了单点动态实时预测。提出的水位预测模型可作为南水北调中线或其他多闸联控河渠的水位模拟及预测替代模型,并可作为工程运行风险预警方法。

(2)所提模型运用于实际工程水位预测时,应根据工程对结果精度和计算效率的需求合适选择模型学习率、隐藏层单元数、最大迭代次数,保证模型精度和计算效率达到最优。

表2 不同模型超参对预测精度及计算效率的影响Tab.2 Accuracy and calculation efficiency of different hyper-parameters

本文提出了一种新的长距离调水工程闸前水位的预测方法,得到了很好的预测效果。然而,本研究依然存在不足,比如在对精度和计算效率探索上选取的指标可以更全面;针对不同的渠道运行工况,对模型结构和性能的研究可更加深入。

猜你喜欢

南水北调水位精度
南水北调东线山东段工程建设
南水北调运行管理研究
基于DSPIC33F微处理器的采集精度的提高
南水北调
GPS/GLONASS/BDS组合PPP精度分析
基于MFAC-PID的核电站蒸汽发生器水位控制
DRAINING THE SOUTH
改进的Goldschmidt双精度浮点除法器
巧用磨耗提高机械加工精度
基于PLC的水位控制系统的设计与研究