年径流预测模型对比研究
2018-10-14洪美玲何士华李秦
洪美玲 何士华 李秦
【摘要】本文在计算分析四道河子(三)站30年的实测径流深资料统计参数的基础上,分别建立自回归一阶和二阶模型、BP神经网络模型,通过MATLAB实现径流随机模拟和预测的过程。结果表明,自回归模型和BP神经网络模型预测精度均较高。但是自回归二阶模型与其他的模型相比较,其预测结果更接近实测资料,预测误差最小,精度更高,能够较好的预测该站点的年径流。
【关键词】自回归模型;BP神经网络;径流预测
0、引言
水文现象受气象条件、人类活动、城市化进程等因素影响。所以,水文信息具有不确定性、模糊性、不充分性等特性。水文径流资料在水利工程设计、水资源的规划和利用、防洪、治涝、抗旱等方面发挥着重要的作用。因此,中长期年径流预测是水文水资源研究的一个重要课题。
本文采用四道河子(三)站的实测年径流进行单因素预测,即分析年径流本身随时间的变化规律来进行预测。自回归模型、人工神经网络、灰色预测系统等模型已经较为成熟,在年径流预测的运用中各有其优缺点和适用性。本文采用这三种模型,对四道河子(三)站水文年径流资料进行预测和结果分析对比。
1、自回归模型AR(P)
自回归模型不仅能反映水文序列的统计参数特性,还能从水文现象物理过程的分析建立随机模型,自回归模型在水文上运用最为广泛。
1.3 AR(P)模型的建立
现有四道河子(三)站1981-2010年,共计30年的实测资料。经分析,径流资料具有代表性、一致性、可靠性。
本文以1981-2005年共25年的实测资料,模拟2006-2010年的年径流深,并与2006-2010年的实测径流深进行对比,判定模型的精度。计算1981-2010年实测资料的自回归系数,发现随着滞时数的增加,自回归系数值在0上下波动,逐渐趋向于0,呈“拖尾性”。
本文选用自回归模型的AR(1)和AR(2)模型来对该站的径流深进行分析对比。1981-2005年实测径流深的统计参数,见表1。
1.4 AR(P)序列平稳性验证与AIC准则
为了使AR(P)序列达到平稳,AR(P)模型中的参数必须满足平稳性条件。
经过验证,AR(1)模型和AR(2)模型都满足平稳条件,均为平稳随机序列。
根据AIC准侧,优先选择拟合残差量和参数数量两项之和的值最小的模型。对AR(P)模型,AIC准则为:
通过计算可知,AIC(2)较小,根据这一准则,可判定AR(2)较好。但是由于AR(1)和AR(2)的计算结果相差不大,说明两个模型没有显著差异,很难判定哪个模型更加接近实际的统计特性,还需进一步分析。
1.5 AR(P)模型的预测结果分析
按照模拟步骤,用已经建立好的AR(1)和AR(2)模型进行2006-2010年的年径流深预测,将两个模型的预测结果进行对比,可以看出,AR(1)模拟出的年径流深与实测值相比误差范围在4%以内,AR(2)模拟出的结果与实测值相比误差范围在1%以内,AR(2)模型的模拟结果误差更小,精度更高。
总体而言,AR(1)和AR(2)模型的预测值都能与实测年径流趋势保持一致,但是,结合上文中的AIC准则的计算值和预测误差,AR(2)模型更符合该站点的实际情况。同时,AR(1)模型虽然能用来描述实测年径流量的统计特性,但是在序列长度相当大并且序列为正态分布的情况下才是完全正确的。本文仅采用30年的实测长度,又属于偏态分布,因此,两个模型中选用AR(2)模型。
2 、BP神经网络模型
BP神经网络是一种包含输入层、隐含层和输出层的前向网络结构,其流程可分为BP神经网络模型构建、神经网络训练、神经网络预测三个步骤。现有四道河子(三)站1981-2010年30年的年径流深资料,将前25年的资料作为训练学习样本,后5年作为检测样本。经过不断的试运行,选择前10年作为输入样本,输入层为10,第11年作为输出样本,输出层为1,隐含层节点数选为5,所建网络模型为3层,模型结构为10-5-1,采用滚动式预测,模型预测结果,见表2。
从表2可以看出,该模型的预测值与实测值的误差控制在6%之内,模型有较强的拟合能力和自适应能力,表示出了输入与输出之间的非线性关系。
人工神经网络的建立,需要依靠大量的实测资料为基础,本文现有的资料年限较短,信息不充分,导致BP神经网络模型的训练学习能力降低。同时,对于BP神经网络模型,仅考虑年径流这一个变量时,输入层单元数和隐含层数难以确定,只能通过不断的试行来确定最佳参数,并且运用该模型预测后续年份的数据时,采用滚动式预测,造成模拟过程繁琐和预测的数据分布集中的现象。
从模型的运用情况分析,适当增加模型的输入层变量,例如蒸发,相对湿度、降雨等变量因子,或是先对年径流深数据进行小波分解分解出来的小波序列作为输入层,会更好地提高预测精度。
3、结语
本文利用四道河子(三)站1981-2010年30年的实测径流深的水文资料,通过上述各个模型分析对比可知,在综合考虑模型的建立、预测精度、实测数据的信息量等方面的基础上,AR(2)模型能够较好的反映实测序列,因此,四道河子(三)站的年径流预测可采用AR(2)模型。
BP神经网络模型在该站点的预测结果与实际年径流趋势基本保持一致,但是模型的建立繁琐,需要不断更新信息。在现有的实际资料不充分的情况下,不建议采取传统的BP神经网络模型。
自回归AR(P)模型具有时间相依和非常直观的表达形式,同时,模型的建立简单,应用方便,可以通过现有的较短的实测资料模拟预测出更长的水文序列。但是,影响水文序列的因素有很多,例如气象因素,人类活动的影响等,一般的,在建立AR(P)模型时,完全只依据数据资料来进行模拟,没有考虑其他影响因素。因此,在进行水文资料的模拟预测时,可以运用其他模型辅助运行,提高模拟水文序列的精确度。
4、参考文献
[1] 朱聪.径流中长期预测模型研究[D]. 成都:四川大学,2005.
[2] 王文圣, 丁晶, 金菊良. 随机水文学[M]. 北京: 中国水利水电出版社, 2008.
[3] 张云辉, 徐敏, 张莉莉. 自回归模型AR(P)在模拟年径流系列中的应用[J]. 水土保持应用技术, 2013, (3):14-15.
[4] 鐘明春. 夹江站年径流自回归模型的研究[A]. 中国水利学会2006年学术年会[C]. 2006, 313-318.
[5] 崔东文. 多隐层BP神经网络模型在径流预测中的应用[J]. 水文, 2013, 33 (1): 68-73.
作者简介:洪美玲(1993-),女,江苏南通人,硕士研究生,研究方向:水资源系统分析与可持续利用。