投影寻踪模型在降水量预测中的应用研究
2016-06-17邹平县水利局山东邹平256200
杨 楠(邹平县水利局,山东邹平256200)
投影寻踪模型在降水量预测中的应用研究
杨楠
(邹平县水利局,山东邹平256200)
【摘要】采用邹平县1952—2014年度降水量序列建立了基于神经网络的投影寻踪自回归耦合模型,并对该县2015—2017年降水量进行预测,预测结果令人满意。
【关键词】邹平县;投影寻踪;年降水量;预测
在降水量序列预测研究中,降水量数据基本不符合正态分布,需要从降水量数据内部提出其特征或结构,而基于神经网络的投影寻踪自回归耦合模型(BPPPAR)恰好解决了降水量预测研究中遇到的这些问题。基于神经网络的投影寻踪自回归耦合模型是在数据低维投影上进行的,该模型通过寻找有意义的低维投影,甩掉一些不重要变量的影响,从而不受它们的干扰和迷惑,较好地解决了降水量时序弱相依性、突变性和随机性等不确定性问题,准确地反映降水量变化规律,为降水量非线性时序预测问题提供了一条新途径。
1 投影寻踪自回归耦合模型
1)确定降水量时序预测因子。延迟k步的降水量时序自相关系数为:
式中:n为降水量实测时序{x(i})的容量;k=1~nk<[n/4]。根据R(k)的抽样分布理论,在置信水平1-α的情况下,当自相关系数值R(k)∉[-1-时则推断降水量时序{x(i})延迟k步相依性显著,x(i-k)可作为x(i)的降水量预测因子;否则降水量时序延迟k步相依性不显著。分位值ua/2可从正态分布表中查得。
式中:a为单位长度向量;θ为阈值。
3)对散布点,用基于正交多项式拟合,此时模型表达为
式中:r为正交Hermite多项式阶数;c是正交Hermite多项式系数,可用最小二乘法获得;h表示正交Hermite多项式。
4)优化投影指标函数。通过求解投影指标函数最小化问题来估计最佳a、θ、c值,即
本文应用基于实数编码的加速遗传算法来解决降水量时序高维全局寻优问题。
2 应用实例
现采用1952—2014年度邹平县降水量资料序列来建立BPPPAR预测模型,再对2015—2017年降水量进行预测,具体情况见表1。
计算该序列前4阶自相关系数R(k)和与之相应的上、下限R2(k)、R1(k)值,结果见表2,其中置信水平取70%。表2显示,只有R(3)、R(4)、R(5)、R(8)、R(9)、R(12)、R(13)、R(14)的相依性在置信水平70%的条件下是显著的,故这里预测x(i)的因子取x(i-3)、x(i-4)、x(i-5)、x(i-8)、x(i-9)、x(i-12)、x(i-13)、x(i -14)。把建模样本及进行标准化处理后依次代入式(3)、式(4)、式(5)和式(6),即得投影指标函数,然后用基于实数编码的加速遗传算法优化该函数,得指标函数最小值为2 145.8,多项式阶数为8,参数α、θ、c值分别见表3。
把参数α、θ、c值代入基于神经网络的投影寻踪自回归耦合模型中,进行拟合检验和预测,结果见表1。从表1可以看出,16个历史数据拟合相对误差绝对值的平均值为6.67%。邹平县年降水量序列的拟合结果见图1。
表1 邹平县年降水量序列实测值、BPPPAR模型的拟合结果和预测结果
表2 邹平县年降水量序列自相关系数及其上、下限值(置信水平)
表3 参数α、θ、c值
图1 BPPPAR模型对年降水量的拟合结果
3 结语
该模型仅利用邹平县年降水量时序延迟3、4、5、8、9、12、13、14步的相依信息得到令人满意的结果。较好地解决了邹平县降水量时序存在的非正态、非线性等不确定问题,为区域年降水量预测提供了一条新的途径,具有推广应用价值。
(责任编辑崔春梅)
【中图分类号】P456
【文献标识码】B
【文章编号】1009-6159(2016)-03-0034-02
收稿日期:2015-07-29
作者简介:杨楠(1980—),男,工程师