海河流域汛期降水量多尺度分析及预测研究
2017-12-01张治倩
魏 琳,徐 姝,张治倩
(1.海河水利委员会水文局,天津 300170;2.天津市气象台,天津 300074)
海河流域汛期降水量多尺度分析及预测研究
魏 琳1,徐 姝2,张治倩1
(1.海河水利委员会水文局,天津 300170;2.天津市气象台,天津 300074)
文章利用完全集合经验模态分解(CEEMDAN)方法,对海河流域汛期(6~9月)降水进行多尺度分析,并识别其演变模式,获得各本征模函数(IMF),然后结合利用最近邻抽样回归模型(NNBR)、自回归模型(AR)、神经网络模型等多种方法对分解的各模态进行建模,选出最佳模型进行预测。经过对比分析,各模态最佳模型分别为神经网络模型与AR模型。因此文章采用CEEMDAN与神经网络及AR模型相结合的方法对海河流域汛期降水进行预测,并且同回归模型及单一的NNBR模型的预测值作比较研究。结果表明文章采用的模型稳定性好,能合理的预测海河流域汛期降水演变趋势,提高中长期汛期降水预测精度,具有一定的应用价值。
海河流域;CEEMDAN;神经网络;AR模型;汛期降水;中长期预测
海河流域地处京畿要地,是我国重要的政治、经济、文化中心。从气候划分来看,属半湿润、半干旱大陆性季风气候区,受地形、气候等因素影响,降水量分布地带性差异十分明显。同时降水量年际变化很大,丰水年可达1000mm以上,枯水年仅200mm左右;年内分配很不均匀,80%左右集中在汛期(6~9月),且往往集中在几次强降雨过程。降雨相对集中,使流域洪水具有峰值高、峰型陡、一次性洪量大的特点。因此,准确预测流域汛期6~9月降水对于防灾减灾具有特别重要的意义。
水文现象随时间变化的过程称为水文过程或水文序列[1],降水是其中一种现象,分析降水序列可以揭示和认识降水过程变化特性,由于降水受诸多因素的影响,整个序列具有非线性、非平稳性等特点。国内外常用的预报方法有三类:确定性方法、随机方法及确定与随机耦合的方法。这些传统的方法假定系列是线性的,因此新的方法如小波分析、灰色系统模型、人工神经网络、投影寻踪等应运而生,这些方法具有一定的适用性,但也存在不同的局限性。为了准确预测海河流域降水趋势,本文采用具适应性噪声的完全集合经验模态分解(CEEMDAN)方法[2]进行分解对降水序列进行多尺度分析,该方法根据时间序列局部时变特征进行自适应地时频分解,解决了集合经验模态分解(EEMD)方法存在的问题,同时采用最近邻抽样回归模型(NNBR)、自回归模型(AR)、神经网络模型等多种方法对分解的各模态进行建模,各模态选出最佳模型方案,对海河流域汛期降水的演变模式进行预测,并与传统的回归模型及单一采用最近邻抽样回归模型(NNBR)的预测效果作对比评价。
1 研究方法
1.1 CEEM DAN的基本理论
经验模态分解(EMD)用于处理研究任意非平稳、非线性数据[3],比之前的平稳化方法更具有明显的优势,具有可适性、正交性、后验性、完整性等特点,与小波变换和傅立叶(Fourier)谱分析相比,该方法有一定的优越性,其中傅立叶(Fourier)谱分析不能反映出信号的瞬态信息,小波分析预先给定了基函数,不具备资料的自适性,在信号不平稳时会产生许多虚假的谐波。EMD方法最大的优点就是能够以自适应方式提取系列的各分量及变化趋势。该方法的实质上是对非平稳序列进行平稳化处理的过程,按照频率高低分解为有限个本征模函数(IMF),所分解出来的各IMF分量包含了原信号的不同时间尺度的局部特征信号。原始信号由所求得的IMF分量均为平稳信号,解决了非平稳序列处理成平稳系列的问题。
但EMD存在某些缺陷,局部特性可能会产生模态混淆(混频)的现象,从而导致时间尺度的丢失。集合经验模态分解法(EEMD)改进了这一缺陷,其原理与EMD类似,将原始序列填加了白噪声,此方法的重构系列中存在残留噪声并每次分解的模态个数可能不同。针对此问题 MarceloA.Colom inas等人提出了具适应性噪声的完全集合经验模态分解(CEEMDAN),解决了EEMD存在的问题。
1.2 CEEM DAN的计算步骤[2]
令Ek(·)为通过EMD产生的第k阶模态算子,M(·)为产生将要被进行分解的序列的局部均值的算子,w(i)为均值为零, 方差为 1的白噪声,x(i)=x+w(i),〈·〉是在实现中求取平均值的算子,可以看出 E1(x) =x-M(x) , 则:
(1)使用 EMD计算 x(i)=x+β0E1(w(i)) 的局部均值,以求得第1个残差[4]:
(2)在第一阶段(k=1)计算第一阶模态d1=x-r1
(3)将 r1+β1E2(w(i)) 的实现的局部均值的平均值作为第2个残差的估计值,定义第2阶模态为:
(4)对于 k=3,…,K, 计算第 k个残差:
(5)计算第 k阶模态:
(6)返回第4步计算下一个k。
2 汛期降水量的多尺度分析
采用海河流域61年(1956~2016年)汛期降水量序列(见图1),利用 CEEMDAN技术进行分解,其中,实现次数为2000,白噪声标准差取0.2,最大允许筛选的迭代次数取100。分解得到3个从高频到低频的不同尺度的模态(IMF)及一个趋势项,3个模态及趋势见图2~5。3个模态为汛期降水量序列在不同的尺度下的分解,而变化趋势项可看作汛期降水演变的总体平均趋势。对CEEMDAN分解的结果进行Hilbert变换,可以得到对应于不同模态分量的中心频率,进而求得各模态的平均周期,具体详见海河流域汛期降水各模态谱分析统计特征值表1。
图1 1956~2016年海河流域汛期降水量
图2 分解的IM F1模态图
图3 分解的IM F2模态图
图4 分解的IM F3模态图
图5 分解的趋势项图
表1 海河流域汛期降水各模态谱分析统计特征值
从图2~5及表1可以看出:海河流域汛期降水序列分解的各模态从IMF1至IMF3振幅越来越小,频率越来越低,周期越来越长。各阶模态的平均周期依次约为4、10、30年。从整个趋势项可以看出,近61年海河流域汛期降水有减少的趋势,但是从2010年以来趋势趋于平稳,从大的周期看来,海河流域汛期降水近期可能处于转折期,不排除有增加的可能性。由于降水受多种因素的影响,模态的周期可能与ENSO、太阳黑子、高原积雪等存在一定的关系,特别是ENSO事件对全球气候变化都有较为显著的影响,强的厄尔尼诺事件与我国长江流域汛期降水呈正相关关系,海河流域汛期降水也会受其影响。
同时,非平稳的海河流域汛期降水序列经CEEMDAN分解之后,各模态IMF均为平稳序列,蕴含着不同天气气候系统的多时间尺度,对应不同的气候层次。对于平稳序列的预测现已有多种方法。本文结合利用最近邻抽样回归模型(NNBR)、自回归模型(AR)、神经网络模型等多种方法对分解的各模态进行建模,选出最佳模型进行预测,然后将预测的不同模态进行叠加,对海河流域汛期降水量进行预测。
3 预报模型的建立及实例分析
采用海河流域1956~2016年汛期降水系列进行分析建模,将其中前55年(1956~2010年)作为检验期,后6年(2011~2016年)作为预测期。模型分别采用最邻近抽样回归(NNBR)、神经网络、自回归模型(AR模型)分别对以上分解的各模态进行建模及预测分析,利用以下所述的评价方法,选出各模态最佳模型,然后进行流域降水预测。同时本文将这一预测模型,与仅使用单一NNBR模型及自回归AR模型进行对比分析。各模型原理在这里不再介绍。
3.1 模型评价方法
在中长期预测中,评价模型的适用性可以采用拟优绝对值准则(MAE)、平均相对误差(MRA)和拟优平方和准则(RMSE)。本文采用该三种准则对模型的适用性进行评价。
(1)拟优绝对值准则:
(2)平均相对误差:
(3)拟优平方和准则:
式中, n-样本长度; x(i)、 y(i)-实测值和预测值。
判定依据为:平均相对误差MRA、拟优绝对值MAE、拟优平方和准则计算的RMSE越小越好。
3.2 各模态模拟结果分析
将获得的各IMF分量和趋势项数据分别采用最近邻抽样回归模型、AR模型、神经网络模型进行模拟及预测,率定期为1956~2010年,具体详见图6~8及表2。通过表2各评价指标可以看出,IMF1选择神经网络较为优,由于 IMF1的变幅较大,运用传统的AR模型较难取得较好的模拟效果,NNBR模型效果亦不尽如人意,高度非线性的人工神经网络模型能够有效的模拟分解的第一模态系列。由于第二模态及第三模态有较好的周期性及振幅较小,传统的AR模型也可以有较好的效果,对于具有自适应学习和非线性映射能力的神经网络来说,预测第二第三模态效果也比较好。因此,IMF1预测选用神经网络模型,IMF2及IMF3选用神经网络或AR模型均可。
图6 IM F1原始系列与模拟系列对比图
图7 IM F2原始系列与模拟系列对比图
图8 IM F3原始系列与模拟系列对比图
表3 各模态预测模型评价指标
3.3 汛期降水预测结果分析
为了简单工作起见,第一模态采用神经网络进行预测,第二及第三模态采用AR模型进行预测,趋势项进行线性预测,各模态数据叠加即为流域汛期降水的预测。预测效果同时与单一NNBR模型及AR模型进行预测结果作比较,模型总体评价指标详见表4,图9具体模拟与实测对比图可以看出,预测模型与实况较为接近,模拟效果较好。从表4各项指标可以看出,本文所建立的预报模型远远优于AR模型及NNBR模型,模型的平均相对误差为6%,根据情报预报规范属于甲级方案,有良好的预测性能,可用于工作实践中。各模型检验期2011~2016年预测结果详见图10及表5。
表4 不同降水预测模型评价指标
图9 1962~2017年海河流域降水汛期模拟与实况对比图
表5 海河流域汛期降水量实测值与预测值对比
由图10和表5经过6年检验期分析可以看出,6年预测的相对误差均在20%以内,仅2011年为13.4%,其余年份均在10%以内。因此无论是单一NNBR模型还是传统的自回归模型,其预测效果都不太理想,因此CEEMDAN-AR&&神经网络模型在水资源预测领域可行性良好。
图10 海河流域汛期降水量预测结果
4 结论
(1)作为EEMD的改进方法的 CEEMDAN可以将非平稳、非线性的序列转换为平稳序列,将之应用于海河流域汛期降水预测中,能够更好的提取降水的多时间尺度,经过分析得出,海河流域汛期降水存在约为4、10、30年的平均周期。从整个趋势项可以看出,近61年海河流域汛期降水一直处于减少的趋势,但是从2010年以来趋势减小较为平稳,从大的周期看来,海河流域汛期降水近期可能处于转折期,不排除有增加的可能性。
(2)根据分解的三个从高频到低频不同尺度的模态(IMF)及一个趋势项,分别采用AR模型及神经网络模型对各分量进行分析预测,预测2017年汛期海河流域降水量为444.7mm,属于正常偏多年份。该模型在海河流域汛期降水预测中具有显著的优越性,总体上要比NNBR模型及AR模型有更好的效果,预测性能良好。
[1]王文圣,丁晶,金菊良.随机水文学[M].北京:中国水利水电出版社,2008.
[2] MarceloA.Colominas, Gaston Schlotthauer, Maria E.Torres.Improved complete ensemble EMD: A suitable biomedical signal processing[J].Biomedical Signal Processing and Control 14(2014): 19-29.
[3]孙阳,陈元芳,程龙,等.基于 EEMD枯季入库径流预报分析[J].中国农村水利水电,2012(02):34-37.
[4]丁志宏,张金萍,赵焱.基于CEEMDAN的黄河源区年径流量多时间尺度变化特征研究[J].海河水利,2016(06):1-6.
[5]王文圣,向红莲,丁晶.最近邻抽样回归模型在水文水资源预报中的应用[J].水电能源科学,2001,19(02):8-10.
[6]汤成友,官学文,张世明.现在中长期水文预报方法及其应用[M].北京:中国水利水电出版社,2008.
[7]基于小波消噪的三江平原井灌区年降水时间序列预测模型[J].水利规划与设计,2012(05):20-23.
TV125
B
1672-2469(2017)10-0060-04
10.3969/j.issn.1672-2469.2017.10.017
2017-04-11
魏 琳(1985年-),女,工程师。