基于EEMD-AR模型的丹江口水库年径流随机模拟与预报
2017-09-16练继建孙萧仲唐志波
练继建,孙萧仲,马 超,赵 明,唐志波
(天津大学水利工程仿真与安全国家重点实验室,天津 300072)
基于EEMD-AR模型的丹江口水库年径流随机模拟与预报
练继建,孙萧仲,马 超,赵 明,唐志波
(天津大学水利工程仿真与安全国家重点实验室,天津 300072)
基于水库历史年入库径流序列组分分析和识别,采用线性趋势回归检验法、有序聚类法、方差线谱法等方法,推求出序列趋势项、跳跃项及周期项等确定性成分,提出基于集合经验模态分解法(EEMD方法)的水库年径流自回归随机模拟模型(EEMD-AR),并应用于丹江口水库的年径流随机模拟和预报中。通过EEMD分解,解决了当丹江口水库历史年径流序列为非平稳序列时不能直接应用自回归模型(AR) 进行随机模拟和预报的问题。模拟结果表明,EEMD-AR模型能较好地模拟丹江口水库年径流序列并保持原历史序列的统计特性,且模型预报精度符合要求。
径流序列成分识别;EEMD-AR模型;径流随机模拟;丹江口水库
随着计算机技术的发展,水文随机模拟技术除最初的线性平稳随机模型之外,人工神经网络[1]、小波分析[2]、混沌理论[3]、Copula方法[4]亦被引入到随机模型中,并取得了较好的模拟效果。相较近来广泛应用于径流模拟的分布式水文模型[5-6],传统的线性平稳随机模型由于构造简单,在水文模拟中备受青睐,但一般仅适用于平稳序列的随机模拟,具有一定的局限性。集合经验模态分解法(EEMD方法)因其对非平稳序列具有较强的处理能力,被不少学者引入到径流随机模拟和预报领域[7-10]。章国勇等[7]通过建立基于EEMD方法的LSSVM组合预测模型和基于动态逼近搜索粒子群的LSSVM参数寻优方法,进行了江垭站的年径流预测和模型验证。Wang等[9]将EEMD方法结合人工神经网络模型进行年径流序列的随机模拟和预报研究,取得了较为理想的预报精度。
目前针对丹江口水库入库径流方面的研究主要集中于径流特征分析[11-12]和以月为时间尺度[13-15]的预报模型研究。然而,随着丹江口水库大坝加高和南水北调工程通水,针对丹江口水库月尺度入库径流模拟和预报方面的已有研究不能完全满足水库多年调节的径流输入要求。此外,由于丹江口水库历史年径流序列为非平稳序列,不能直接采用传统自回归模型进行随机模拟。基于此,本文考虑水库年径流年际间变化规律,在识别丹江口水库年入库径流序列成分的基础上,建立基于EEMD-AR的随机模拟和预报模型,开展丹江口水库非平稳年径流序列随机模拟和预报研究,以期为丹江口水库多年优化调度提供可靠径流数据。
1 研究思路和方法
1.1 研究思路
首先,对水库历史年径流序列进行成分分析和识别。其中,非周期成分中的趋势项采用线性趋势回归检验法、Spearman秩次相关检验法和Mann-Kendall检验法;跳跃项采用有序聚类法、秩和检验法和 Mann-Kendall 检验法;周期成分采用方差线谱法和累积解释方差图法进行检验。其次,对剔除趋势、跳跃及周期等确定性成分后的随机成分进行EEMD分解,并对分解后的各阶固有模态函数IMF(intrinsic mode functions)序列进行AR模型建模,残差序列进行多项式模拟,形成基于EEMD-AR的丹江口水库年径流随机模拟模型和预报模型,研究技术路线见图1。
图1 研究技术路线
1.2 研究方法
EEMD方法是在传统经验模态分解法(EMD方法)的基础上,通过添加有限的且非无穷小振幅的白噪声序列,从而改善传统经验模态分解法中的模态混叠[16],其分解步骤如下:
(1)
步骤2 将新合成序列yi(t)进行EMD分解并得到对应的各IMF分量cij和残差ri:
(2)
式中:cij为第i次EMD分解后的第j阶IMF分量;n为第i次EMD分解对应的IMF分量数;ri为第i次EMD分解得到的残差。
步骤3 重复前2个步骤N次(N为总体平均次数),得到N组新的合成序列及相应的各IMF分量和残差。
步骤4 将N组新合成序列分解后的各IMF分量取总体平均,得到最终的各IMF分量:
(3)
2 基于EEMD-AR的丹江口水库年径流随机模拟和预报模型
将1956—2009年丹江口水库年径流序列(图2)分成1956—2003年和2004—2009年两组,采用1956—2003年径流序列建立基于EEMD-AR的径流随机模拟和预报模型,采用2004—2009年径流序列进行模型预报精度检验。
作品改编权保护的历史之维 ..................................李 杨 06.32
图2 丹江口水库年径流序列(1956—2009年)
2.1 丹江口水库年径流序列成分分析
2.1.1 非周期成分识别
a. 趋势项诊断。采用Mann-Kendall检验法、Spearman秩次相关检验法及线性趋势回归检验法对丹江口水库年径流序列(1956—2003)进行趋势项检验,结果表明:Mann-Kendall检验法下丹江口水库年径流序列标准统计变量Z<0(Z=-1.73)且其绝对值小于临界值Z1-a/2=1.96。因此,丹江口水库年径流序列有一定的减小趋势,但是该趋势不显著。此外,Spearman秩次相关检验法计算得统计量T=1.75,线性趋势回归检验法计算得到统计量d=-0.42,其绝对值均小于自由度为n-2的t分布在5%显著水平下的临界值t1-a/2,n-2=2.01,表明Spearman秩次相关检验法及线性趋势回归检验法的检验结果与Mann-Kendall检验法一致(标准统计变量Z、统计量T和统计量d的计算可参考王文圣等的《随机水文学》[18])。
b. 变异项诊断。采用有序聚类法、滑动秩和检验法及Mann-Kendall检验法对丹江口水库年径流序列(1956—2003)进行跳跃诊断,各检验结果见图3~4。其中,有序聚类法选取检验结果中统计量S值的最小值点作为最可能变异点;滑动秩和检验法选取统计量U值超过临界值最多的点作为最可能变异点;Mann-Kendall检验法则选取统计曲线UB和UF在临界区间内的交点作为最可能变异点。由图3~4可知,3种不同检验方法识别的变异结果一致,丹江口水库年径流序列的最可能变异点为1990年。
图3 有序聚类法和滑动秩和检验法检验结果
图4 Mann-Kendall检验法检验结果
根据变异项诊断结果,对存在跳跃变异的序列进行预处理,即将变异点之后的序列加上变异前后两序列均值之差,从而剔除确定性成分中的跳跃项部分,使序列具有一致性[18]。
2.1.2 周期成分识别
对经过预处理后的丹江口水库年径流序列(1956—2003)采用方差线谱法和累积解释方差图法进行周期分析,见图5和图6。图5中占明显优势的振幅Aj所对应频率wj的倒数即为周期,图6中转折点对应的谐波个数即为周期数(横坐标标目m为谐波个数,纵坐标标目Bm为累积解释方差)。确定序列周期后,可根据式(4)确定序列的傅里叶系数(a0、aj和bj),如表1所示,并将其代入式(5)中以确定序列中的周期成分。
(4)
(5)
式中:a0、aj和bj均为序列傅里叶系数;wj为频率;l为谐波总个数;n′为序列长度。
图5 方差线谱
图6 累积解释方差
表1 剔除跳跃项后的序列周期计算结果及相应傅里叶系数
2.2 丹江口水库年径流序列EEMD分解
根据确定性成分识别成果,将原始丹江口水库年径流序列先进行跳跃项剔除预处理,即将跳跃变异点后序列值加上前后序列均值之差;在此基础上减去由式(5)得出的周期成分,从而剔除周期项,最终可得序列随机成分(趋势项不显著,不作处理)。对剔除确定性成分后的序列随机项进行EEMD分解和ADF平稳性检验,结果如下:
a. EEMD分解结果。采用EEMD法对处理后的丹江口水库年径流序列(1956—2003)随机项进行分解,总体平均次数N取为1 000次,噪声标准差为原始序列标准差的20%。经EEMD分解后的各阶固有模态函数IMF1~IMF4序列及残差如图7所示。
图7 丹江口水库年径流序列随机项EEMD分解结果
b. ADF平稳性检验。将IMF1~IMF4序列采用Eviews软件进行ADF单位根法检验,检验结果显示经成分剔除后的丹江口水库年径流序列的t值(-0.42)大于显著性水平为5%时对应的临界值(-1.95),且p值(0.53)大于0.05,因此其为非平稳序列,不能直接采用AR模型进行模拟。而经EEMD分解后的IMF1~IMF4序列的t值(分别为-7.06、-2.54、-3.26和-3.41)均小于显著性水平为5%时对应的临界值,且p值均小于0.05,即IMF1~IMF4均为平稳序列,可采用AR模型进行随机模拟。
2.3 基于EEMD-AR的丹江口水库年径流随机模拟
2.3.1 残差序列的多项式模拟
采用多项式对EEMD分解后的残差序列进行模拟,模拟结果如下:
Rt=6×10-5t3-0.012 7t2+1.721 2t+358.87
(6)
式中:Rt为残差项模拟值;t为年份序号。
2.3.2 IMF1~IMF4序列AR模型建立
在建立AR模型前,对IMF1~IMF4序列进行独立性检验,检验结果显示分解后的IMF序列均为相依序列,可采用AR模型进行随机模拟。
a. AR模型阶数确定。采用AIC准则对IMF1~IMF4序列进行模型阶数选择,并根据AIC值最小原则及相应的偏态系数Cs,最终选定IMF1序列采用正态AR(3)模型,IMF2序列采用偏态AR(4)模型,IMF3序列采用偏态AR(3)模型,IMF4序列采用偏态AR(4)模型进行随机模拟。
b. IMF1~IMF4序列AR模型建立。建立IMF1~IMF4序列对应的AR模型,其中AR(p)模型的数学表达式见式(7)[14],各IMF序列AR模型参数见表2,表中σ为序列标准差。
(7)
式中:μ为序列均值;φ1,φ2,…,φp为自回归系数;εt为纯随机序列。
表2 IMF1~IMF4序列AR模型参数
c. 最终模拟序列生成。将各阶IMF1~IMF4序列的AR模型采用Monte Carlo法进行随机模拟,并将模拟结果与残差项模拟结果求和,并在此基础上还原原序列中的确定性成分,即可得到大量丹江口水库年径流随机模拟序列,如式(8)和式(9)所示:
(8)
(9)
式中:x为最终模拟序列;xqd为确定性成分;yIMFi为第i阶IMF模拟序列;R为残差模拟序列。
2.3.3 模拟结果检验
表3 模拟结果检验
2.4 基于EEMD-AR的丹江口水库年径流预报
基于EEMD-AR的丹江口水库年径流预报模型与随机模拟模型表达形式大致相同,预报值为确定性成分(跳跃成分、周期成分)、IMF1~IMF4序列和残差R预报值的叠加之和,唯一区别是IMF1~IMF4序列的AR预报模型不包含随机项εt。采取预留的2004—2009年丹江口水库实测年径流来检验预报模型。丹江口水库2004—2009年的年径流预报结果如表4所示,预报精度均满足GB/T 22482—2008《水文情报预报规范》的精度要求,平均误差为9.54%,最大误差不超过18%。预报结果表明基于EEMD-AR的丹江口水库年径流预报模型可较好地预报未来年径流情况。
表4 年径流量预报结果检验
3 结 论
本文基于历史年径流序列进行序列成分识别,开展基于EEMD-AR的丹江口水库年径流随机模拟和预报。丹江口水库历史年径流序列(1956—2003)成分识别结果显示:①丹江口水库年径流有一定的减小趋势,但不显著;②水库年径流序列跳跃显著且最可能变异点为1990年;③水库年径流序列存在3.2 a和9.6 a的周期变化。
剔除趋势、跳跃及周期等确定性成分后的随机序列通过EEMD分解,较好地解决了非平稳序列不能直接进行AR模型随机模拟的问题。通过对EEMD分解后的IMF1~IMF4序列进行AR模型建模以及残差序列进行多项式拟合,建立基于EEMD-AR的丹江口水库年径流随机模拟模型和预报模型。结果表明,模拟序列各统计指标相对误差绝对值最大值不超过9%,能较好地保持原序列的统计特性;预报序列平均误差9.54%,最大误差不超过18%。因此,所提出的模型能较好地适应丹江口水库年入库径流序列的模拟和预报。
[ 1 ] 阎俊爱,钟登华.基于遗传算法的神经网络优化预测模型及其在年径流预报中的应用[J].水利水电技术,2003,34(6):1-4.(YAN Junai,ZHONG Denghua.Forecasting method of neural network optimization based on genetic algorithm and its application in annual runoff forecast[J].Water Resources and Hydropower Engineering,2003,34(6): 1-4.(in Chinese))
[ 2 ] 杜富慧.基于小波分析-模糊神经网络的径流预报模型[J].水利水电技术,2013,44(2): 5-8.(DU Fuli.Wavelet analysis-fuzzy neural network based runoff forecasting mode[J].Water Resources and Hydropower Engineering,2013,44(2):5-8.(in Chinese))
[ 3 ] 计亚丽.基于混沌理论的呼伦湖流域降雨径流时间序列预测分析[D].呼和浩特:内蒙古农业大学,2012.
[ 4 ] 周研来,梅亚东,张代青,等.一种新的径流过程随机模拟方法[J].水利水电科技进展,2011,31(3):9-12.(ZHOU Yanlai,MEI Yadong,ZHANG Daiqing,et al.A aew stochastic method for streamflow hydrographs[J].Advances in Science and Technology of Water Resources,2011,31(3):9-12.(in Chinese))
[ 5 ] 刘柏君,权锦,杨超慧,等.基于SWAT模型的青海省主要流域径流模拟[J].水资源保护,2016,32(6):39-44.(LIU Bojun,QUAN Jin,YANG Chaohui,et al.Simulation of runoff of major basins in Qinghai Province based on SWAT model[J].Water Resources Protection,2016,32(6):39-44.(in Chinese))
[ 6 ] 李致家,屈晨阳,黄鹏年,等.CASC2D模型与GSSHA模型在栾川流域的径流模拟[J].河海大学学报(自然科学版),2017,45(1):1-6.(LI Zhijia,QU Chenyang,HUANG Pengnian,et al.Simulation of runoff in Luanchuan Basin using CASC2D and GSSHA models[J].Journal of Hohai University(Natural Sciences),2017,45(1):1-6.(in Chinese))
[ 7 ] 章国勇,伍永刚,杨林明,等.基于参数优化的EEMD-LSSVM年径流组合预测模型[J].水资源与水工程学报,2013,24(6):1-5.(ZHANG Guoyong,WU Yonggang,YANG Linming,et al.EEMD-LSSVM model of combined forecast of annual runoff based on parameter optimization[J].Journal of Water Resources & Water Engineering,2013,24(6):1-5.(in Chinese))
[ 8 ] ZHAO X,CHEN X.Auto regressive and ensemble empirical mode decomposition hybrid model for annual runoff forecasting[J].Water Resources Management,2015,29(8): 2913-2926.
[ 9 ] WANG W,CHAU K,QIU L,et al.Improving forecasting accuracy of medium and long-term runoff using artificial neural network based on EEMD decomposition[J].Environmental Research,2015,139: 46-54.
[10] 马超,姜璇.基于EEMD-ANN的水库年径流预测[J].水电能源科学,2016,34(8):32-35.(MA Chao,JIANG Xuan.Annual reservoir runoff forecasting using ensemble empirical mode decomposition and artificial neuron network[J].Water Resources and Power,2016,34(8):32-35.(in Chinese))
[11] 郑晓东,鲁帆,严登华,等.基于小波分析的丹江口水库水文年度入库径流变化特征[J].水科学与工程技术,2011(2):1-3.(ZHENG Xiaodong,LU Fan,YAN Denghua,et al.Variation characteristics of the Danjiangkou Reservoir hydrological annual runoff based on the morlet wavelet[J].Water Sciences and Engineering Technology,2011(2):1-3.(in Chinese))
[12] 李响,邹宁,吕孙云.丹江口水库天然入库径流演变规律研究[J].南水北调与水利科技,2015,13(2): 206-210.(LI Xiang,ZOU Ning,LÜ Sunyun.Variation of natural inflow runoff in the Danjiangkou Reservoir[J].South-to-North Transfers and Water Science & Technology,2015,13(2): 206-210.(in Chinese))
[13] 冉笃奎,李敏,武晟,等.丹江口水库中长期径流量的多模型预报结果分析及综合研究[J].水利学报,2010,41(9): 1069-1073.(RAN Dukui,LI Min,WU sheng,et al.Research on multi-model forecasts in mid-long term runoff in Danjiangkou Reservoir[J].Journal of Hydraulic Engineering,2010,41(9): 1069-1073.(in Chinese))
[14] 王元超.丹江口水库中长期径流预报及水质水量联合模拟技术[D].北京:中国水利水电科学研究院,2015.
[15] 冯小冲,王银堂,刘勇,等.基于物理统计方法的丹江口水库月入库径流预报[J].河海大学学报(自然科学版),2011,39(3):242-247.(FENG Xiaochong,WANG Yintang,LIU Yong,et al.Monthly runoff forecast for Danjiangkou Reservoir based on physical statistical methods[J].Journal of Hohai University(Natural Sciences),2011,39(3): 242-247.(in Chinese))
[16] WU Z,HUANG N E.Ensemble empirical mode decomposition: a noise-assisted data analysis method[J].Advance in Adaptive Data Analysis,2009,1(1): 1-41.
[17] HUANG N E,SHEN Z,LONG S R,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proceedings of the Royal Society A:Mathematical Physical and Engineering Sciences,1998,454: 903-995.
[18] 王文圣,丁晶,金菊良,等.随机水文学[M].北京:中国水利水电出版社,2008:41,165-167.
StochasticsimulationandpredictionofannualrunoffintheDanjiangkouReservoirbasedonEEMD-ARmodel
LIAN Jijian, SUN Xiaozhong, MA Chao, ZHAO Ming, TANG Zhibo
(StateKeyLaboratoryofHydraulicEngineeringSimulationandSafety,TianjinUniversity,Tianjin300072,China)
Based on the analysis and identification of the annual runoff sequence components of the Danjiangkou Reservoir, deterministic components such as the trend term, the jumping term and the periodic term were derived by using linear trend regression analysis method, sequential cluster method and variance spectrum method, etc. A stochastic auto-regression model of annual runoff based on Ensemble Empirical Mode Decomposition (EEMD) was proposed (EEMD-AR) and it was applied to the stochastic simulation and prediction of the annual runoff in the Danjiangkou Reservoir. Through the EEMD decomposition, the problem that stochastic simulation and prediction by auto-regression (AR) model cannot be directly applied due to the non-stationary historical runoff sequence of the Danjiangkou Reservoir has been solved. The simulation results show that EEMD-AR model can simulate and predict the annual runoff sequence of the Danjiangkou Reservoir in a good forecast accuracy and it maintain the statistical characteristics of the original historical sequence.
Runoff sequence components identification; EEMD-AR model; runoff stochastic simulation; Danjiangkou Reservoir
国家重点研发计划水资源高效利用专项(2016YFC0402203)
练继建(1965—),男,教授,主要从事水利水电工程安全研究。E-mail: jjlian@tju.edu.cn
马超(1981—),男,副教授,主要从事水文水资源研究。E-mail: mac_tju@126.com
10.3880/j.issn.1006-7647.2017.05.003
TV124
:A
:1006-7647(2017)05-0016-06
2016-10-19 编辑:骆 超)