APP下载

基于VMD-TCN 模型的渭河流域月径流量预测研究

2023-10-07张上要罗军刚石国栋景鑫连亚妮左岗岗

人民黄河 2023年10期
关键词:渭河流域

张上要 罗军刚 石国栋 景鑫 连亚妮左岗岗

摘 要:为了有效减小径流序列非线性、非平稳性对径流预测精度的影响,提出一种将变分模态分解(VMD)与时间卷积网络(TCN)相耦合的VMD-TCN 模型,并用于渭河流域咸阳和华县水文站的月径流量预测。采用多种模型性能评价指标对VMD-TCN 模型与其他模型(TCN、EEMD-TCN、ARIMA)的预测性能进行比较,并分析了VMD-TCN 模型在不同预见期下的预测表现。结果显示VMDTCN模型较其他模型具有预测误差更小、预测精度更高以及峰谷值拟合更优的特点,且随着预见期的增大,模型的预测性能会逐渐降低但预测效果保持良好。

关键词:径流预测;变分模态分解;时间卷积网络;渭河流域

中图分类号:P338 文献标志码:A doi:10.3969/ j.issn.1000-1379.2023.10.005

引用格式:张上要,罗军刚,石国栋,等.基于VMD-TCN 模型的渭河流域月径流量预测研究[J].人民黄河,2023,45(10):25-29.

在變化环境影响下,径流变化逐渐呈现出非线性、非平稳性特征,传统的线性时间序列模型预测精度不高且模型方法的改进空间有限[1-2] 。随着人工智能的发展,机器学习领域的非线性模型开始应用于径流预测,并且取得不错的效果。同时,信号分解技术能够将水文时间序列分解成若干相对稳定的固有模态分量(IMFs),将其与径流预测模型相耦合能够显著提升径流预测的精度[3] 。为克服径流序列非平稳性导致预测精度差的问题,周婷等[4] 将小波分解(WD)与支持向量机(SVR)进行耦合并应用于径流预测,研究表明WD 能够有效提升径流预测的精度。张金萍等[5] 将自回归滑动平均模型(ARMA)与完全集合经验模态分解(CEEMDAN) 结合,发现CEEMDAN 能够显著提高ARMA 的拟合优度。桑宇婷等[6] 将CEEMDAN 与BP神经网络进行耦合,并用于汾河流域的月径流量预测,预测结果显示CEEMDAN-BP 模型在模拟期和验证期的径流预测精度都达到甲级。包苑村等[7] 将变分模态分解(VMD)与卷积-长短期记忆神经网络(CNNLSTM)结合开展月径流量预测,结果表明VMD-CNNLSTM模型对径流序列的峰值和谷值拟合更优。He等[8] 将VMD 与深度神经网络(DNN)进行耦合,用于渭河流域张家山水文站的日径流量预测,其预测结果表现良好。Zuo 等[9] 采用一种两阶段分解集成水文预测方法,解决信号分解过程中未来信息的引入导致模型预测结果失真的问题。

鉴于上述研究背景,笔者将变分模态分解(VMD)与时间卷积网络(TCN)相结合构建了VMD-TCN 耦合预测模型,将其应用于渭河流域咸阳和华县水文站的月径流量预测。通过与其他3 种模型(TCN、EEMD-TCN、ARIMA)对比,验证VMD-TCN 的预测性能,同时分析VMD-TCN 在不同预见期的预测表现。

1.2 时间卷积网络(TCN)

时间卷积网络(TCN)是一种新型的时间序列预测模型,它是在卷积神经网络(CNN)的基础上进行改进的,其模型架构包括因果卷积(causal convolution)、空洞卷积(dilated convolution)和残差模块(residual block)。

TCN 的梯度稳定使其能够有效避免模型训练过程中发生梯度消失或梯度爆炸导致模型训练失败的问题,同时具有灵活的感受野[13] 。

TCN 模型卷积结构的层与层之间都是相互依赖的,后一层的输出依赖上一层的输入,每一层都间隔神经元对上一层进行信息提取,通过间隔采样的形式,逐层膨胀系数以2 为指数增长,以便使用更少的层数获得更大的感受野。为保证每一层的信息不丢失,需要对每一层的边缘进行填充。TCN 模型梯度稳定的原因是引入残差模块,残差模块的引入可以保证在进行特征提取时信息相对完整,保证模型预测准确[14] 。

1.3 VMD-TCN 预测模型构建

本研究将VMD 分解与TCN 模型相结合构建VMD-TCN 模型用于月径流量预测,使用贝叶斯优化算法进行超参数调优。开展径流预测主要分3 个阶段,分别是数据集划分阶段、预测样本生成阶段和径流预测阶段,具体流程见图1。VMD-TCN 模型在进行序列分解时将验证集数据逐一添加至训练集中能够有效避免模型训练引入未来信息。同时采用直接法生成预测样本能够提高模型的预测效率,节省计算资源[9] 。

1.4 模型性能评价指标

本文使用4 种模型性能评价指标用于评估模型的预测能力,分别是纳什效率系数(NSE)、标准均方根误差(NRMSE)、平均绝对百分比误差(MAPE)和峰值预测性能指标(PPTS)。

NSE 反映预测结果所含信息量占预测目标所含信息量的比重,其值越接近1 表示模型的预测效果越好。NRMSE 是对预测结果均方根误差的归一化,适用于多模型对比, 其值越接近0 则预测效果越好。MAPE 直接反映模型的预测误差,越接近0 表示模型的预测性能越好。PPTS 能够评价不同比例峰值的预测效果,越接近0 表示峰值预测性能越好。按照《水文情报预报规范》(GB/ T 22482—2008)规定,NSE≥0.9,预测精度为甲级;0.7≤NSE<0.9,预测精度为乙级;0.5≤NSE<0.7,预测精度为丙级。

2 实例分析

2.1 试验环境搭建

本试验采用python3.7 环境,VMD 的附加分解使用python 的vmdpy 库进行,TCN 模型采用keras2.8.0搭建,超参数优化框架采用keras-tuner1.1.0。

2.2 研究区域概况及数据资料

渭河流域面积为134 766 km2,其中陕西省境内流域面积为67 108 km2。渭河干流全长818 km,是黄河最大的支流,多年平均径流量高达75.7 亿m3,多年平均降水量550 mm。咸阳水文站控制面积为4.7 万km2,多年平均径流量为37.298 亿m3,是渭河中游的控制站。华县水文站控制面积为10.6 万km2,多年平均径流量为63.768 亿m3,是渭河下游主要控制站。本研究选用咸阳水文站和华县水文站1953 年1 月至2018 年12 月共66 a 的月径流量数据,按7 ∶ 3 的比例划分训练集和验证集。

2.3 月径流量数据预处理

2.3.1 月径流量序列VMD 分解

采用附加分解方式对月径流量序列进行VMD 分解,分别将咸阳站和华县站的训练数据进行分解。将两个水文站的训练数据分别进行VMD 分解预试验,两站在k =8 时分解效果最好,且恰好不出现模态混叠现象,图2 为咸阳站训练数据分解之后的IMF1 与IMF8 图,IMF2 ~IMF7 图略,华县站同理。

2.3.2 特征序列滞后长度确定

采用直接法生成径流预测样本前,需要确定每一个特征序列输入的滞后长度,以确定t 时刻的流量与其前期流量的相关性[15] 。考虑到完整原始径流序列存在以12 个月为周期的规律性,将未分解的TCN 模型特征序列输入的滞后长度设为12。采用自相关函数法(ACF)和偏自相关函数法(PACF)确定VMD 分解后各个模态分量的滞后长度,具体方法见文献[16-17]。

2.4 VMD-TCN 预测结果分析

2.4.1 不同模型预测结果对比分析

径流序列分解并确定特征序列滞后长度后可构建径流预测样本,将预测样本输入TCN 模型可开展径流预测。为充分验证模型的预测性能,将TCN、EEMDTCN、ARIMA 与VMD-TCN 进行对比,其中EEMDTCN模型同样使用附加分解以避免未来信息引入。图3、图4 分别为咸阳站预见期1 个月的多模型实测与预测径流量折线图和散点分布图,华县站同理。表1 为两站多模型预测性能评价指标对比。

以咸阳站为例,由图3、图4 可知:1)相对TCN、EEMD-TCN 和ARIMA,VMD-TCN 对实测序列的拟合效果最好,特别是峰值的拟合,散点分布更加集中,理想拟合线与线性拟合线的夹角最小,说明VMD-TCN 模型的预测值与实测值具有高度的一致性。2)EEMD-TCN模型的拟合效果次之,但较VMD-TCN 对峰值的拟合不佳,散点更为分散。3)单一的TCN 和ARIMA 模型拟合效果不佳,TCN 与ARIMA 模型对峰值的拟合有明显的滞后且难以预测高峰值,说明单一TCN 和ARIMA 难以预测峰值的到达时间及量值。

结合表1 咸阳站的预测性能评价结果可知:1)VMDTCN模型的预测效果最好,NSE 在0.9 以上,预测精度达到了甲级。VMD-TCN 模型与单一的TCN 模型相比,NSE 提升了318%,NRMSE、MAPE 和PPTS 分别下降了67%、40%、85%。采用VMD 分解之后的TCN 模型预测性能有了极大的提升,主要原因是VMD 分解能够得到平稳的信号分量,从而有效降低径流序列中噪声对预测的影响,进而提升预测的精度。2)EEMDTCN模型相比TCN,NSE 提高了205%,NRMSE、MAPE和PPTS 分别下降了35%、26%、55%,说明EEMD 分解能对非平稳时间序列起到一定的降噪作用并提升预测精度。采用附加分解的EEMD-TCN 的NSE 只有0.67,预测精度只有丙级,主要原因是EEMD 在分解过程中避免了未来信息的引入,预测精度有所降低但更可靠,同时EEMD 分解会出现模态混叠现象,较VMD分解效果更差。3)使用分解之后的TCN 预测效果远高于TCN 和ARIMA,由PPTS 指标可以看出使用信号分解的模型峰值的预测效果更好。分析华县站预测结果可得到与上述相同的结论。

总体上,4 种月径流量预测模型预测性能的高低排序如下:VMD-TCN>EEMD-TCN>TCN≈ARIMA。耦合信号分解算法的组合模型预测效果高于单一模型,上述分析结果说明了VMD-TCN 对复杂非线性的径流序列的处理和预测是可行的。

2.4.2 不同預见期预测结果分析

为进一步验证VMD-TCN 模型在不同预见期下的预测性能,以华县站为例,针对预见期分别为1、3、5、7个月开展径流预测研究。图5 为华县站VMD-TCN 模型在预见期为1、5 个月的预测与实测径流量折线图及散点分布图,表2 为不同预见期预测性能评价指标对比。

不同预见期下,模型的预测能力会有所变化,由图5 可知:1)预见期为1 个月时,实测值折线与预测值折线能够很好地贴合,对预测序列的峰值和谷值的拟合效果较好。从散点图也可以看出,线性拟合线与理想拟合线的夹角较小,说明预见期为1 个月时实测值与预测值的一致性较高。2)随着预见期增大,实测值与预测值之间的拟合误差增大,线性拟合线和理想拟合线的角度增大,说明VMD-TCN 模型的预测能力会随着预见期的增大而降低。

结合表2 不同预见期的预测性能评价指标可知:1)预见期为1 个月时,NSE 在0.9 以上,预见期不断增大NSE 值逐渐减小,当预见期为7 个月时NSE 接近0.8,说明随着预见期增大,VMD-TCN 模型的预测精度会下降,但依旧保持着较好的预测能力。2)随着预见期增大,NSE 逐渐减小而NRMSE、MAPE 和PPTS 总体上逐渐增大,说明预见期增大而预测精度降低,部分原因是模型的峰值预测能力下降。预见期增大而模型预测能力降低的原因是随着预见期的增大,预测值与目标值的相关性逐渐降低,模型无法获得更为准确的信息进行精确预测。

综上所述,VMD-TCN 模型的预测性能会随着预见期的增大而降低,特别是在峰值的预测上。预见期为1 个月时,预测效果最好,预测精度达到甲级;预见期为7 个月时效果较差,但预测精度仍达到了乙级。可见,VMD-TCN 在不同预见期的径流预测也是可行且有效的。

3 结论

1)VMD 对径流序列进行预处理并耦合TCN 模型能够显著提升月径流量预测的精度,同时VMD 采用附加分解方式能够避免模型预测过程中未来信息的引入,预测结果更为可靠。

2)VMD-TCN 与EEMD-TCN 较之单一的TCN 和ARIMA 模型的预测表现更佳,且EEMD 分解会出现影响预测精度的模态混叠问题,VMD 分解能够通过预试验确定模态分量的个数从而有效避免模态混叠问题,VMD-TCN 预测精度高于EEMD-TCN。

3)随着预见期的增大,构建的径流预测样本所包含的信息会有所损失,预测因子与预测目标的相关性逐渐降低,VMD-TCN 模型的预测性能会逐渐下降。

参考文献:

[1] 梁浩,黄生志,孟二浩,等.基于多種混合模型的径流预测研究[J].水利学报,2020,51(1):112-125.

[2] 雷晓辉,王浩,廖卫红,等.变化环境下气象水文预报研究进展[J].水利学报,2018,49(1):9-18.

[3] 李文武,石强,王凯,等.基于变分模态分解和深度门控网络的径流预测[J].水力发电学报,2020,39(3):34-44.

[4] 周婷,金菊良,李荣波,等.基于小波支持向量机的径流预测性能优化分析[J].水力发电学报,2017,36(10):45-55.

[5] 张金萍,许敏,张鑫,等.基于CEEMDAN-ARMA 模型的年径流量预测研究[J].人民黄河,2021,43(1):35-39.

[6] 桑宇婷,赵雪花,祝雪萍,等.基于CEEMD-BP 模型的汾河上游月径流预测[J].人民黄河,2019,41(8):1-5.

[7] 包苑村,解建仓,罗军刚.基于VMD-CNN-LSTM 模型的渭河流域月径流预测[J].西安理工大学学报,2021,37(1):1-8.

[8] HE X X,LUO J G,ZUO G G,et al.Daily Runoff ForecastingUsing a Hybrid Model Based on Variational Mode Decompo?sition and Deep Neural Networks[J].Water Resources Man?agement,2019,33(4):1571-1590.

[9] ZUO G G,LUO J G,WANG N,et al.Two?Stage VariationalMode Decomposition and Support Vector Regression for Stre?amflow Forecasting[J].Hydrology and Earth System Sciences,2020,24(11):5491-5518.

[10] DRAGOMIRETSKIY K,ZOSSO D.Variational Mode Decom?position[J].IEEE Transactions on Signal Processing,2013,62(3):531-544.

[11] 苏丽娜,张亚东,王梓丞,等.基于变分模态分解和能量谱的轨道电路分路不良故障监测[J].铁道标准设计,2019,63(2):155-160.

[12] 方江雄,温志平,顾华奇,等.基于变分模态分解的地震随机噪声压制方法[J].石油地球物理勘探,2019,54(4):757-767,722.

[13] 孙蓉,李强,罗海峰,等.基于自适应移动平滑与时间卷积网络误差修正的风电功率预测[J].全球能源互联网,2022,5(1):11-22.

[14] 杨海晶,孙运全,朱伟,等.基于CEEMD-TCN 模型的变压器油中溶解气体浓度预测方法[J].电子器件,2021,44(4):887-892.

[15] 王文川,高畅,徐雷.基于TVF-EMD 与LSTM 神经网络耦合的月径流预测研究[J].中国农村水利水电,2022(2):76-81,89.

[16] HE Z B,WEN X H,LIU H,et al.A Comparative Study ofArtificial Neural Network,Adaptive Neuro Fuzzy InferenceSystem and Support Vector Machine for Forecasting RiverFlow in the Semiarid Mountain Region[J].Journal of Hy? drology,2014,509:379-386.

[17] YU X,ZHANG X Q,QIN H.A Data?Driven Model Based onFourier Transform and Support Vector Regression forMonthly Reservoir Inflow Forecasting[J].Journal of Hydro?Environment Research,2018,18:12-24.

【责任编辑 张 帅】

猜你喜欢

渭河流域
渭河水岸带土壤理化特征及其与重金属含量的关系
基于NDVI的渭河流域时空演变分析
甘肃省渭河流域韭菜产业现状及发展建议
基于DPCA方法对渭河流域降水—径流—蒸发序列的长程互相关性研究
基于RS/GIS 渭河流域植被覆盖时空变化特征研究
燕太子回国
渭河流域香菜夏秋无公害栽培技术
渭河流域粮食生产与灌溉农业发展的相互作用关系分析