基于ESMD-VMD-ESN二次分解组合模型的水位预测
2022-12-02桑宇婷
李 昂,张 坤,桑宇婷,毕 婉
(1.无锡瀚澜水利科技有限公司,江苏 无锡 214024;2.太湖流域水文水资源监测中心,江苏 无锡 214024;3.苏州市吴江区水利工程运行中心,江苏 苏州 215299)
可靠的水位预测对流域水资源调度、防汛防旱、河道管理、水利工程建设具有重要意义[1-3]。然而,随着气候变化、降水量及人类活动的影响,河流水位的非平稳、非线性特性进一步加剧,从而导致高精度的水位预测仍较为困难。因此,如何对复杂性强,波动性大的河流水位进行有效准确的预测,是目前亟待解决的问题。
水位预测常用方法为过程驱动模型,但过程驱动模型的使用过程较为复杂,受不同气候条件限制,且需考虑降雨、下垫面等多种影响水位变化的因素。近年来,随着大数据与人工智能的飞速发展,数据驱动模型凭借其只需模拟水位数据序列的变化规律进行水位预测的优势,被越来越多的学者用于水位预测。其中,人工神经网络通过模拟动物神经网络进行信息处理,具有自学习、高容错性等特点[4-5],因此被更多地使用于水位预测并取得了较好的预测效果,顾乾晖等[6]建立基于PSO-SVR-LSTM适用于具有复杂特性的水位预测中,屠泽杰等[7]采用EEMD-BP模型对短期余水位进行预测,要震等[8]建立基于遗传算法优化的Elman网络进行河流水位预测,王迎飞等[9]采用基于注意力机制的LSTM模型对长江汛期水位进行预测。而回声状态网络(ESN)作为一种新型神经网络,引入了储备池代替传统神经网络模型的隐藏层,解决了传统神经网络模型的局部极小和收敛慢的问题,其简单独特的训练方式可在一定程度上提高预测的精度[10]。
然而,河流水位序列包含多种频率信息的复杂特性,增大了单一模型的参数估计及数据学习困难,导致预测效果仍不理想。随着希尔伯特-黄与小波变换的发展,出现了“分解-预测-重构”模式的单次分解组合预测方法,即利用不同水文时间序列处理方法,如:小波变换(WT)、经验模态分解(EMD)、极点对称模态分解(ESMD)等方法将复杂的水位序列分解为多个包含不同频率信息的子序列,再通过单一预测模型进行预测重构,可比单一方法得到更为满意的结果[11-13]。相比于其他水文时间序列处理方法,ESMD不仅能够解决WT人为确定基函数的主观性及EMD的模态混叠问题,同时具有更高的分解效率,能够达到更好的平稳化及简化目的。但ESMD分解出的高频分量仍具有波动强烈且绝对值大的特点,受预测模型预测机理和适用性约束,高频分量的预测精度仍有不足,将会对整个水位序列预测效果产生影响。目前对于最高频分量预测精度的处理方式大多是去除最高频分量或重构时更改分量权重,但这些方式并未从根本上解决高频分量预测精度低的问题,且去除最高频分量易出现主要信号缺失问题[14]。
因此本文借鉴序列处理方法对原始河流水位序列分解的思路,采用变分模态分解(VMD)对最高频分量进行二次分解,VMD不仅可将较为复杂的最高频分量进一步转化为相对简单的多个子序列,且在保证分解效果的前提下,可以分解出较少的分量;再与预测性能较好的ESN模型进行组合,构成ESMD-VMD-ESN二次分解组合模型,同时以太浦河上游太浦闸月均水位序列为例进行预测,与单一ESN及一次分解ESMD-ESN模型进行对比,探究二次分解组合模型的适用性及有效性,提高太浦河入河水位预测精度,为沿线水利工程全年管护及水闸启闭等规划工作提供依据。
1 ESMD-VMD-ESN组合模型
ESMD-VMD-ESN组合预测模型采用“一次分解-二次分解-预测-重构”模式,首先采用ESMD将原始水位序列分解,得到有限个模态分量(Mode,M)及一个残余分量(Residual,R),解决水位序列的复杂性对模型预测精度影响[15-17];再将这些M分量中的最高频分量M1通过VMD进行二次分解,可通过分量中心频率确定VMD最优分解个数,进一步提取分量主要信息,得到若干变分模态分量(VM),简化M1分量[18-19];最后,由于ESN不同于传统神经网络,将隐藏层替换为储备池,储备池内包含大量神经元,从而具有较好的记忆功能[20],因此采用ESN对上述两次分解出的全部子序列进行预测并重构,得到最终预测值。通过两次分解后再预测的组合模式,可以最大程度剖析水位序列的变化特性,从而综合提高水位预测精度。ESMD-VMD-ESN组合预测模型具体计算流程见图1。
图1 ESMD-VMD-ESN组合模型预测流程
2 实例分析
2.1 月水位资料分析
太浦河是流域泄洪骨干河道,也是太湖向下游供水的重要通道。近年来,受多次强降雨和长时间台风的影响,太浦河高水位频现,水位呈现逐年上涨趋势,严重威胁沿河区域安全,因此能够准确预测太浦河入河水位情况,对及时采取防汛措施,保障地区及人民群众安全有重要意义。太浦闸水文站位于太浦河入河口处,长期为流域骨干工程太浦闸提供水文信息服务,其中水位数据在流域防汛抗旱、水资源调度与管理、水环境综合治理及供水安全保障等工作中发挥了重要作用。为了验证二次分解组合模型的在预测太浦河入河水位的适用性及有效性,针对近年来水位变化情况及趋势,本文采用太浦闸站2011—2020年近10年的月水位资料进行模拟验证,以期达到良好的月水位预测结果,为太浦河沿线汛期安全,水利工程管护及水闸启闭等规划工作提供数据支撑。
太浦闸月水位序列及其快速傅里叶变换(FFT)结果见图2,月水位序列线性拟合表明,太浦闸水位近十年呈现缓慢上升趋势,由于16年、20年太湖特大洪水,太浦闸16年及20年汛期水位明显提高;月水位序列的FFT变换结果显示,月水位序列包含多个主要的频率信息,分别为0.04、0.06、0.08、0.16、0.22、0.3、0.32、0.36 Hz,较为复杂,这导致目前单一的水位预测模型精度较差。
a)月水位序列
2.2 ESMD分解
为简化月水位序列,提高水位预测模型精度,采用ESMD将复杂的原始月水位序列分解为若干包含不同尺度信息的M分量及一个包含趋势信息的R分量,见图3,所分解出的分量从M1~R频率逐渐减小,波长逐渐变长。其中,M1频率最高,波长最短,相比于其余分量波动更加剧烈,与原水位序列最为相似;M2~M3波动程度虽有所减小,但频率仍较大;M4~M6可明显看出频率降低,波动程度减小,逐渐表现出一定的周期;R能够呈现水位变化趋势,即先上升再下降再缓上升趋势,总体为上升趋势,与水位线性拟合趋势相同,但能更细致地看出11年至20年的水位变化情况。由于16年、20年太湖发生特大洪水,太浦闸站在太湖入太浦河口处,16年呈现水位大幅上升趋势,后续17年至19年水量有所下降,20年又呈缓上升趋势,R所呈现的趋势符合实际情况,因此ESMD有着良好的水位信息分解提取能力。
a)M1
为了检验ESMD分解效果,对各分量进行FFT变换,结果见图4:各分量所包含的频率信息情况均不完全相同,即各分量可有效提取原始水位序列的不同信息,M1分量所包含的频率信息仍较多且较为复杂,主要频率为0.04、0.06、0.16、0.22、0.3、0.32、0.36Hz,与原始水位序列的频率信息分布基本相似,仍包含了较多的原始水位序列信息;M2~M3序列相比于M1频率降低,FFT变换曲线更为简单,且所包含的频率信息减少,分别为0.22、0.16、0.08 Hz;M4~M6的频率进一步降低,分别为0.08、0.06、0.04,除M1外,其余分量均只包含一个或两个水位序列中的主要频率信息,则ESMD可有效分解出原序列的主要及次要信息,降低原始水位序列的复杂程度。
a)M1
2.3 ESMD-VMD分解
由2.2中ESMD分解结果可知,ESMD分解出的最高频分量M1仍包含较多的频率信号,相比于其他分量更为复杂,因此本文采用VMD对M1进行二次分解,进一步提取最高频分量中混杂的频率信息,从而降低M1分量的复杂程度,进一步提高后续预测精度。同时为了能够体现看出二次分解效果,对分解出的各VM分量进行FFT变换,结果见图5:二次分解可有效将M1分量进一步分解为含有不同频率信息的分量,其中VM1~VM5所包含的主要频率分别为0.04、0.06、0.16、0.22、0.3、0.32、0.36,与M1所包含的频率信息相一致,且各分量均只包含一个或两个主要频率信息,即VMD分解可进一步简化并提取ESMD最高频分量M1的频率信息,为后续预测模型性能的提高奠定了基础。
图5 M1分量VMD分解结果及FFT变换曲线
2.4 预测结果分析
本文采用太浦闸站2011—2020年共120个月水位数据进行模拟验证,其中采用前108个月的数据作为模拟期对模型进行模拟训练,后12个月数据作为验证期来验证模型预测效果。得到各模型模拟期验证期预测结果见图6。
图6 各模型验证期预测结果对比
由图6可知,基于二次分解组合模型ESMD-VMD-ESN与实测值拟合程度最高预测效果最好,一次分解组合模型ESMD-ESN次之,单一预测模型ESN最差。其中,ESN模型在汛期,尤其是在7、8月水位大幅增加的时期,预测效果较差,其他月份的预测效果相对较好;2种组合预测模型相比于单一预测模型在7、8月的预测精度明显提高,且预测的水位变化趋势与实测值基本一致,但ESMD-ESN模型在3、4月以及10月预测精度与实测值仍有较大偏差。
为了更准确地分析这些模型的性能,本文采用威尔莫特一致性指数(WIA)、皮尔逊相关系数(PCC)、平均绝对误差(MAE)、均方根误差(RMSE)对验证期预测结果进行精度评价,结果见表1。
表1 各模型验证期预测指标对比
由表1可知,各模型预测结果的WIA值均可达到0.6以上,具有实际预测价值。3个模型中ESMD-VMD-ESN模型预测精度最好,ESMD-ESN模型次之,单一ESM模型最差,由于原始水位序列复杂,单一模型不能准确全面地学习水位序列中的信号特征,其WIA、PCC值最小,MAE、RMSE最大;一次分解模型ESMD-ESN能够有效分解提取出原始水位序列的信号特征,相较于单一ESN模型,WIA、PCC分别提高51%、11%,MAE、RMSE分别减小14%、45%,预测精度明显提高,但由于ESMD分解出的最高频分量M1仍包含较多的信号特征,M1的预测精度相对较低(图7),M1相比于其他分量,WIA及PCC最小,MAE及RMSE最大。而二次分解组合模型ESMD-VMD-ESN则能够有效解决一次分解中最高频分量M1精度仍较低的问题,进一步提高整体预测精度,相比于ESMD-ESN,WIA、PCC分别提高5%、10%,MAE、RMSE分别减小52%、50%,其中经VMD分解处理之后的最高频分量M1(VMD)与原最高频分量M1的精度对比见图8,与原最高频分量M1相比,M1(VMD)分量的WIA、PCC分别提高26%、61%,MAE、RMSE分别减小48%、39%,因此二次分解组合模型ESMD-VMD-ESN具有更好的预测效果。
图7 ESMD分解的各M分量预测指标
图8 M1分量与M1(VMD)预测指标
3 结论
本文构建ESMD-VMD-ESN组合模型,探究“一次分解-二次分解-预测-重构”二次分解组合模式的有效性。以太浦河上游太浦闸站2011—2020年月水位数据为例,并与单一ESN模型、一次分解组合模型ESMD-ESN进行对比分析,可知模型预测精度ESMD-VMD-ESN>ESMD-ESN>ESN,即ESMD可有效简化并提取水位序列信息,但其最高频分量M1的预测精度相比于其他分量仍较低,而通过VMD对M1进行二次分解后,预测精度可进一步提高。因此二次分解组合模式可以有效弥补单一预测模型及单次分解方法的缺点,是可行有效的,可根据预测结果及时了解短期水位变化趋势,为沿线水利工程全年管护及河流下游水闸合理调度提供依据。