基于时域卷积网络的水文模型
2022-07-05聂青青万定生朱跃龙李致家姚成
聂青青,万定生*,朱跃龙,李致家,姚成
基于时域卷积网络的水文模型
聂青青1,万定生1*,朱跃龙1,李致家2,姚成2
(1.河海大学计算机与信息学院,南京 211100; 2.河海大学水文水资源学院,南京 210098)(*通信作者电子邮箱dshwan@hhu.edu.cn)
水位预测是防洪预警工作的辅助决策支持。为了进行准确的水位预测,为预防自然灾害提供科学依据,提出一种结合改进的灰狼优化(MGWO)算法与时域卷积网络(TCN)的预测模型MGWO-TCN。针对标准灰狼优化(GWO)算法存在早熟停滞的不足引入差分进化(DE)算法,扩展灰狼种群的多样性;改进灰狼种群更新时的收敛因子和变异时的变异算子,以自适应的形式对参数进行调整,提升算法的收敛速度,均衡算法的全局与局部搜索能力;利用MGWO算法对TCN的重要参数寻优,提升TCN的预测性能。将MGWO-TCN预测模型用于河流水位预测,预测结果的均方根误差(RMSE)为0.039。实验结果表明,与对比模型相比,MGWO-TCN预测模型具有更好的寻优能力和更高的预测精度。
水文预测;灰狼优化算法;时域卷积网络;差分进化算法;收敛因子
0 引言
近年来,通过深度学习算法对水文数据进行分析,从中获取有效的信息以提高预测精度是水文时间序列研究的重要方向。对于时序问题的建模,常用基于循环神经网络(Recurrent Neural Network, RNN)的结构及其相关变体[1-4]的方法,如王亦斌等[2]提出的EMD-LSTM(Empirical Model Decomposition and Long Short-Term Memory network)模型、Pan等[3]提出的CNN-GRU(Convolutional Neural Network and Gated Recurrent Unit)模型、刘青松等[4]提出的AR-RNN(AutoRegressive and RNN)模型等对河流的水位进行预测,特定的循环自回归结构能对序列数据进行良好表示。经典的卷积神经网络(Convolutional Neural Network, CNN)模型由于卷积核的限制很少用于时序问题的处理。目前,很多的研究工作[5-8]表明特定的卷积结构在序列处理任务上的性能可以达到甚至超过RNN,这种时域卷积网络(Temporal Convolutional Network, TCN)被应用于语音识别[7]、太阳辐射预测[8]等领域,取得了良好的实验效果。
本文利用TCN对河流水位进行预测,在构建与应用过程中,模型预测效果与参数选择存在很大关系,因此引入元启发性的灰狼优化(Grey Wolf Optimization, GWO)算法[9]对其做出改进以用于TCN参数的寻优。针对GWO算法与常用参数寻优算法类似的易陷入局部最优[10]的问题,在标准GWO算法中引入差分进化(Differential Evolution, DE)思想,并改进收敛因子和变异算子,提出一种由改进GWO(Modified GWO, MGWO)算法优化的TCN模型用于河流水位预测,称为MGWO-TCN。实验结果表明,该模型比TCN、PSO-TCN、GWO-TCN等传统模型的预测结果更好,具有更强的稳定性。
1 基于TCN的水文预报
1.1 TCN模型
循环网络结构的优势在于能够通过门结构保留历史信息,从而实时更新模型参数;但连续训练同样会带来很多的问题[11],如模型训练时间长、模型构建时定性参数较多、内存消耗大等。TCN由传统的CNN发展而来,是一种用于改善序列建模问题的卷积结构,能够有效避免RNN中时常出现的梯度消失或爆炸的情况,其基本结构如图1所示。
图1 TCN基本结构
TCN使用残差连接的方式构建深层神经网络,残差块的引入使得数据信息可以跨层传播[8],即在模型构建时执行的是包含了整个残差模块的层而不是单独的一层卷积。TCN的残差块结构如图2所示。
图2 残差块结构
1.2 基于TCN的水位预测
本文将TCN用于水文时间序列问题的研究,构建TCN模型对长江流域洞庭湖口处的莲花塘站水位值进行预测,数据的处理见3.1节。选取莲花塘站2020-07-09T14:00—2020-08-03T13:00共600条样本数据作为展示,预测结果如图3所示。
图3 TCN预测结果
从图3中可以看出TCN对水位整体变化趋势的预判大致正确,但是预测值的波动较大,在真实观测值曲线的谷峰和谷底处,预测值与真实值差异较为明显,模型的拟合效果有待进一步提高。
模型预测性能的好坏与其网络参数存在很大的关系:TCN中卷积核的数量通常都按经验设置:数量越大特征图越多,提取的特征更为全面,模型拟合能力就越强,但同时会导致计算量偏大、参数个数增加,出现过拟合的情况;而数量太少,模型拟合能力不够,容易欠拟合。TCN训练时,批尺寸batch_size也是十分重要的参数:设置过小算法难以收敛,设置过大内存容量要求高,想达到同等精度需花费的时间极大增加。为了提高TCN的预测精度,本文提出改进的GWO算法对TCN参数寻优,在标准TCN的基础上进一步改善模型预测效果。
2 基于MGWO‑TCN的水文预报模型
2.1 改进的GWO算法
狼群在搜索到猎物时会将其包围,计算公式如下:
其中:表示当前的迭代次数;()表示当前状态下灰狼个体的位置;f()表示猎物的位置(即第次迭代种群中的最优解);为灰狼个体与猎物之间的间隔;和为系数变量,分别由式(8)和式(9)计算。
其中:1、2取[0,1]区间的随机数;为收敛因子,其值随着迭代次数的变化由2线性降到0。
其中:表示当前的迭代次数,为最大迭代次数;max为收敛因子的最大值,取值为2。在这个公式中的值随着值的增大而减小,前期种群中灰狼个体的位置分散,值减小较快,有利于发现潜在猎物的位置信息;后期值变化缓慢,在精细搜索中可以防止遗漏重要的候选解。
其中:1,2,3的取值为(1,2,…,),且互不相同;是变异算子,取值通常为0~2的随机常数。当为固定的常数时并不能合理地使用偏差向量以达到算法全局搜索能力和收敛速度的平衡[17]。因此,本文改进了的计算方式,让其以自适应的方式进行调整,公式如下:
其中:init为的初始值,为0~2的常数;为当前迭代次数,为最大迭代次数。的值在迭代开始时较大,但是随着迭代次数的变化逐渐减小。
其中:表示交叉概率;randi(1,)表示(1,2,…,)的随机整数。
6)对父代种群中的灰狼个体进行更新。比较子代种群与父代种群中个体适应度值的大小,如果子代个体优于父代个体,则用子代灰狼个体替换父代中的个体,公式表示为:
2.2 基于MGWO算法的TCN水位预测
在MGWO的基础上提出一种结合MGWO算法和TCN的水位预测模型MGWO-TCN,使用MGWO算法对TCN参数:卷积核数量以及模型训练时的批尺寸大小进行寻优。MGWO-TCN模型预测流程如图4所示。
图4 MGWO-TCN模型预测流程
如图4所示,采用MGWO-TCN模型进行水位预测时主要包括:运用MGWO算法搜索TCN模型的最优参数组合;使用算法寻优得到的解构建TCN,解决水位预测问题。模型预测的伪代码步骤描述如下。
输入 归一化后的训练集,测试集;
输出 未来水位预测结果。
1)初始化模型参数,狼群的个体规模,搜索空间维度,交叉概率,最大迭代次数,搜索上界,搜索下界,TCN学习率和数据迭代次数;
(,,)=
(最优狼的位置,次优狼的位置,第三头狼的位置);
3) While(<)
{For=1 to
(2)产出指标。产出指标的直接体现就是收益,文中选取新产品销售收入和有效发明专利作为创新产出指标。新产品销售收入作为创新产出的代表性指标,能较好地衡量创新产出效果,应用相对比较广泛;专利虽然难以反映创新活动的全部成果,但由于数据易得,且在某些程度上没有更好的指标来代替,所以在研究中应用也较为普遍,而由于发明专利申请难度大,审核更为严格,能更好地衡量创新产出水平,因此选用有效发明专利数作为另一个创新产出指标。
产生变异种群;
计算更新后的父代种群适应度,确定、、;
4)为最优参数组合,代入TCN中并训练得到最终预测模型,输入测试集,模型计算,输出预测水位。
3 实验与分析
3.1 数据处理
本文以长江中游地区莲花塘水文站的水位值作为预测对象,选取莲花塘站及其上游相关水文站的历史水位数据作为预报因子进行实验。由于上游站点的水位变化会对莲花塘站的水位造成影响,因此对莲花塘站和上游的水文站进行相关性分析,选定相关系数大于预设阈值的13个水文站:宜昌站、高坝洲站、枝城站、沙市站、新江口站、沙道观站、弥陀寺站、藕池站、监利站、七里山站、南咀站、小河咀站、鹿角站,以及莲花塘在内的14个站点的数据构建MGWO-TCN模型的输入数据集。
实验中使用莲花塘站和另外13个相关水文站2014年2月—2020年12月的水位数据,数据中记录的是每隔1 h站点的水位值,共59 427条数据,将原始数据预处理后按照时间顺序以7∶3的比例划分为训练样本和测试样本。实验结果表明使用前5 h的实时水位来预测莲花塘站未来的水位值时效果较好,即将14个站点前5 h的水位数据作为输入特征,未来时刻的水位值作为预测的输出样本。
由于数据采集时可能存在突发事件以及数据本身的不稳定性,会导致数据间量级差别较大,为TCN的预测带来不利影响,为了消除这种影响,提高网络的收敛效率,对训练样本数据采用归一化处理,将数据的浮动范围压缩到[0,1],计算公式如下:
3.2 实验结果与分析
表1 不同模型的最优参数
图5分别展示了PSO-TCN、GWO-TCN、DE_GWO-TCN、 MGWO-TCN模型的适应度值随着种群迭代次数的变化。从适应度变化曲线可以看出,PSO-TCN模型在达到最大迭代次数时算法收敛在局部最优解中;GWO-TCN模型在迭代过程中最佳适应度值的波动较大,并且难以收敛;DE_GWO-TCN模型相对于GWO-TCN模型收敛效果要好;MGWO-TCN模型在种群迭代过程中,最佳适应度值在整体上呈现稳步下降的趋势,最终收敛在一个较小的值,由此可知改进后的算法性能更优。
将MGWO算法寻优得到的参数组合代入TCN中,训练模型并用于莲花塘站水位预测,得到MGWO-TCN预测结果如图6所示。
为了更直观地展现MGWO-TCN模型的预测效果,将该模型与DE_GWO-TCN模型、GWO-TCN模型、PSO-TCN模型及原始TCN模型的预测进行比较,同样选取莲花塘站2020-07-09T14:00—2020-08-03T13:00的数据作为展示,不同模型预测结果对比如图7所示。
图5 不同模型的适应度曲线
图6 MGWO-TCN模型的预测结果及其局部放大图
图7 不同模型的预测结果与局部放大图
从图7中可以看出:TCN模型和PSO-TCN模型对莲花塘水位的预测与实际观测值拟合度较低,尤其在对波峰和波谷的预测时,结果差别较大;GWO-TCN模型、DE_GWO-TCN模型对水位值的变化趋势预判基本正确,但拟合程度不够;本文提出的MGWO-TCN模型相对于其他对比模型来说,水位预测值的拟合程度最高,预测效果最好。
为了便于分析实验结果,本文选取均方根误差(Root Mean Square Error, RMSE)、平均绝对误差(Mean Absolute Error, MAE)、对称平均绝对百分比误差(symmetric Mean Absolute Percentage Error, sMAPE)等指标作为实验结果的评价标准[13]。MGWO-TCN模型与其他模型在整个测试集上的预测结果对比如表2所示。从表2中可知,MGWO-TCN模型预测结果的RMSE为0.039,MAE为0.027,sMAPE为0.120,这三种评价指标的值都优于其他3个模型,RMSE、MAE表明MGWO-TCN模型的预测误差较小,模型精度高,sMAPE表明MGWO-TCN模型性能更为稳定。综合各项系数,MGWO-TCN的预测值更接近真实观测值,体现了模型的准确性和有效性。
表2 不同模型预测结果对比
4 结语
为了进行准确的水位预测,本文提出了改进的灰狼优化算法(MGWO)结合TCN的河流水位预测模型MGWO-TCN。在标准GWO算法中引入DE算法的思想,并对收敛因子、变异算子计算方式做出改进,再结合该算法得到TCN的最优参数组合,进一步训练模型对莲花塘水文站的小时水位进行应用分析。通过与TCN、PSO-TCN、GWO-TCN、DE_GWO-TCN等传统模型预测结果的对比,验证了本文模型具有较好的预测效果和良好的稳定性,在不同评价指标下都能取得不错的结果,有较好的应用前景。未来工作会考虑将改进的灰狼优化算法的搜索扩展至更多维度,对多个参数同时寻优,提升算法的计算效率。
[1] 丁尹,桑楠,李晓瑜,等. 基于循环神经网络的电信行业容量数据预测方法[J]. 计算机应用, 2021, 41(8):2373-2378.(DING Y, SANG N, LI X Y, et al. Prediction method of capacity data in telecom industry based on recurrent neural network[J]. Journal of Computer Applications, 2021, 41(8):2373-2378.)
[2] 王亦斌,孙涛,梁雪春,等. 基于EMD-LSTM模型的河流水量水位预测[J]. 水利水电科技进展, 2020, 40(6):40-47.(WANG Y B, SUN T, LIANG X C, et al. Prediction of river water flow and water level based on EMD-LSTM model[J]. Advances in Science and Technology of Water Resources, 2020, 40(6):40-47.)
[3] PAN M Y, ZHOU H N, CAO J Y, et al. Water level prediction model based on GRU and CNN[J]. IEEE Access, 2020, 8: 60090-60100.
[4] 刘青松,严华,卢文龙. 基于AR-RNN的多变量水位预测模型研究[J]. 人民长江, 2020, 51(10):94-99.(LIU Q S, YAN H, LU W L. Multivariable water level prediction based on AR-RNN model[J]. Yangtze River, 2020, 51(10):94-99.)
[5] 张杰,白光伟,沙鑫磊,等. 基于时空特征的移动网络流量预测模型[J]. 计算机科学, 2019, 46(12):108-113.(ZHANG J, BAI G W, SHA X L, et al. Mobile traffic forecasting model based on spatio -temporal features[J]. Computer Science, 2019, 46(12):108-113.)
[6] ZHAO Y, JIA L. A short-term hybrid wind power prediction model based on singular spectrum analysis and temporal convolutional networks[J]. Journal of Renewable and Sustainable Energy, 2020, 12(5): No.056101.
[7] 武钦芳,吴张倩,苏兆品,等. 遗传算法优化时间卷积网络的手机来源识别[J]. 计算机工程与应用, 2022, 58(3):151-158.(WU Q F, WU Z Q, SU Z P, et al. Source cell-phone identification using genetic algorithm optimized temporal convolutional network[J]. Computer Engineering and Applications, 2022, 58(3):151-158.)
[8] SONG Z Y, BROWN L E. Multi-dimensional evaluation of temporal neural networks on solar irradiance forecasting[C]// Proceedings of the 2019 IEEE Innovative Smart Grid Technologies - Asia. Piscataway: IEEE, 2019: 4192-4197.
[9] MIRJALILI S, MIRJALILI S M, LEWIS A. Grey wolf optimizer[J]. Advances in Engineering Software, 2014, 69:46-61.
[10] 张文胜,郝孜奇,朱冀军,等. 基于改进灰狼算法优化BP神经网络的短时交通流预测模型[J]. 交通运输系统工程与信息, 2020, 20(2):196-203.(ZHANG W S, HAO Z Q, ZHU J J, et al. BP neural network model for short-time traffic flow forecasting based on transformed grey wolf optimizer algorithm[J]. Journal of Transportation Systems Engineering and Information Technology, 2020, 20(2):196-203.)
[11] YANG Y Q, ZHAO Y X, LAI S. Temporal convolutional network for pork price prediction[C]// Proceedings of the 2020 International Conference on Big Data in Management. New York: ACM, 2020:91-95.
[12] ZHANG Z Y, CHEN H R, HUANG Y X, et al. Quantile huber function guided TCN for short-term consumer-side probabilistic load forecasting[C]// Proceedings of the 2020 IEEE/IAS Industrial and Commercial Power System Asia. Piscataway: IEEE, 2020:322-329.
[13] EMARY E, ZAWBAA H M, GROSAN C. Experienced gray wolf optimization through reinforcement learning and neural networks[J]. IEEE Transactions on Neural Networks and Learning Systems, 2018, 29(3):681-694.
[14] 李建民,陈慧,杨冬芹,等. 改进GWO优化SVM的服务器性能预测[J]. 计算机工程与设计, 2019, 40(11):3099-3105, 3163.(LI J M, CHEN H, YANG D Q, et al. Prediction of server performance based on SVM algorithm of improved GWO[J]. Computer Engineering and Design, 2019, 40(11):3099-3105, 3163.)
[15] 郭振洲,刘然,拱长青,等. 基于灰狼算法的改进研究[J]. 计算机应用研究, 2017, 34(12):3603-3606, 3610.(GUO Z Z, LIU R, GONG C Q, et al. Study on improvement of gray wolf algorithm[J]. Application Research of Computers, 2017, 34(12):3603-3606, 3610.)
[16] PADHY S, PANDA S, MAHAPATRA S. A modified GWO technique based cascade PI-PD controller for AGC of power systems in presence of Plug in Electric Vehicles[J]. Engineering Science and Technology, an International Journal, 2017, 20(2):427-442.
[17] 方晓玉,李晓斌,郭震. 一种改进的混合灰狼优化支持向量机预测算法及应用[J]. 激光与光电子学进展, 2020, 57(12):341-347.(FANG X Y, LI X B, GUO Z. Improved hybrid grey wolf optimization support vector machine prediction algorithm and its application[J]. Laser and Optoelectronics Progress, 2020, 57(12): 341-347.)
Hydrological model based on temporal convolutional network
NIE Qingqing1, WAN Dingsheng1*, ZHU Yuelong1, LI Zhijia2, YAO Cheng2
(1,,211100,;2,,210098,)
Water level prediction is an auxiliary decision support for flood warning work. For accurate water level prediction and providing scientific basis for natural disaster prevention, a prediction model combining Modified Gray Wolf Optimization (MGWO) algorithm and Temporal Convolutional Network (TCN) was proposed, namely MGWO-TCN. In view of the shortage of premature and stagnation in the original Gray Wolf Optimization (MGWO) algorithm, the idea of Differential Evolution (DE) algorithm was introduced to extend the diversity of the grey wolf population. The convergence factor during update and the mutation operator during mutation of the grey wolf population were improved to adjust the parameters in the adaptive manner, thereby improving the convergence speed and balancing the global and local search capabilities of the algorithm. The proposed MGWO algorithm was used to optimize the important parameters of TCN to improve the prediction performance of TCN. The proposed prediction model MGWO-TCN was used for river water level prediction, and the Root Mean Square Error (RMSE) of the model’s prediction results was 0.039. Experimental results show that compared with the comparison model, the proposed MGWO-TCN has better optimization ability and higher prediction accuracy.
hydrological prediction; Grey Wolf Optimization (GWO) algorithm; Temporal Convolutional Network (TCN); Differential Evolution (DE) algorithm; convergence factor
This work is partially supported by National Key Research and Development Program of China (2018YFC1508100).
NIE Qingqing, born in 1997, M. S. candidate. Her research interests include data management, data mining.
WAN Dingsheng, born in 1963, professor. His research interests include data management, data mining.
ZHU Yuelong, born in 1959, Ph. D., professor. His research interests include intelligent information processing, data mining.
LI Zhijia, born in 1962, Ph. D., professor. His research interests include simulation and prediction of hydrological physical laws, data mining.
YAO Cheng, born in 1982, Ph. D., associate professor. His research interests include hydrological model, hydrological forecast, data mining, numerical simulation.
TP391
A
1001-9081(2022)06-1756-06
10.11772/j.issn.1001-9081.2021061366
2021⁃08⁃02;
2021⁃11⁃15;
2021⁃11⁃15。
国家重点研发计划项目(2018YFC1508100)。
聂青青(1997—),女,安徽安庆人,硕士研究生,主要研究方向:数据管理、数据挖掘;万定生(1963—),男,江苏溧阳人,教授,CCF会员,主要研究方向:数据管理、数据挖掘;朱跃龙(1959—),男,江苏建湖人,教授,博士,CCF会员,主要研究方向:智能信息处理、数据挖掘;李致家(1962—),男,山西运城人,教授,博士,主要研究方向:水文物理规律模拟与预报、数据挖掘;姚成(1982—),男,江苏扬州人,副教授,博士,主要研究方向:水文模型、水文预报、数据挖掘、数值模拟。