APP下载

基于ARIMA模型的贵州省农业总产值预测分析

2013-12-29张淇超

中国集体经济 2013年12期

摘要:贵州省农业总产值是反映贵州省农业生产的总规模和总水平的重要指标。文章利用时间序列分析理论,对1978年至2010年的贵州省农业总产值进行了分析,建立了ARIMA模型并以此对贵州省农业总产值做了分析与短期预测。

关键词:贵州省;农业总产值;ARIMA模型;短期预测

一、引言

农业总产值反映的是一个国家或地区农业生产的总规模和总水平。随着改革开放的深入,农业问题一直都是我国政府工作的重中之重。时间序列分析是用一段时间的一组属性数值发现模式从而来预测未来值,ARIMA 模型是较为常用的用来拟合平稳序列的预测模型。

二、ARIMA模型简介

ARIMA模型全称为差分自回归移动平均模型,又被称为Box-Jenkins模型或博克思-詹金斯法。模型的基本思想是:预测对象会随着时间推移而形成的数据序列被视为一个随机序列,用数学模型来近似描述这个序列,并认为该序列会按蕴含的规律遵循下去。这个模型被识别后就可以从时间序列的过去值及现在值进行外推,以此来预测未来值。而ARIMA模型在实证研究中被研究人员广泛运用于时间序列分析和模型预测领域。ARIMA模型研究的对象是平稳时间序列,因此对一个离散的时间序列进行建模时,应当首先考察其平稳性,再分析和判断时间序列的生成过程。根据生成机制的不同,ARIMA模型实包含3种类型的模型:

(一)AR模型

AR模型也称为自回归模型。它是通过过去的观测值和现在的干扰值的线性组合预测, 它是仅用时间序列{Yt}的不同滞后项作为解释变量的模型,其数学形式为:

Yt=?覬1Yt-1+?覬2Yt-2+?覬3Yt-1+......+?覬pYt-p+et

式中:p为自回归模型的阶数;?覬i(i=1,2,......p)为模型的自回归系数,et为误差,Yt为一个时间序列。

(二)MA模型

MA模型也称为移动平均模型。它是通过过去的干扰值和现在的干扰值的线性组合预测,它是仅用误差的不同滞后项作为解释变量的模型,其数学形式为:

Yt=et-θ1et-1-θ2et-2-θ3et-3-......-θqet-q

式中:p为模型平均移动阶数;θj(j=1,2,......q)为模型的移动平均系数;et为误差; Yt为观测值。

(三)ARMA模型

ARMA模型是自回归模型(AR)和移动平均模型(MA)的组合,构成了用于描述平稳随机过程的自回归滑动平均模型ARMA,数学形式为:

Yt=?覬1Yt-1+?覬2Yt-2+?覬3Yt-1+......+?覬pYt-p+et-θ1et-1-θ2et-2-θ3et-3-......-θqet-q

三、ARIMA模型的建立

(一)数据的选取

本研究选用贵州省1978年至2010 年农业总产值的统计数据,数据来源于《贵州省统计年鉴》,经整理后见表1。

令进出口总额为Xt,根据贵州省1978年至2010年农业总产值数据,在Eviews软件中建立时序图(见图1)可以看出,该折线图是向右上方倾斜的,表明此时间序列存在增长的趋势。所以贵州省1978年至2010年农业总产值的时间序列数据是不稳定的。

进一步对该时间序列进行单位根检验,从输出结果可知ADF检验p的值为0.9996,没有通过检验,因此{Xt}序列是非平稳的,因此先对数据做平稳化处理。

(二)数据平稳化处理

对贵州省1978年至2010年农业总产值时间数据取对数得,并进行二阶差分。并对二阶差分的数据作单位根检验。

对贵州省1978年至2010年进农业总产值时间序列数据取对数并进行二阶差分后,得到的ADF检验p的值为接近零,因此能通过检验,拒绝原假设。对处理后的数据作时序图(见图2),可知此图围绕某条水平线上下波动,数据无明显的上升或下降趋势,说明处理后的数据已经是平稳的,且d=2。

(三)参数的估计与模型的定阶

对处理后的数据作滞后16期的自相关(autocorrelation function,ACF)图和偏相关(partial autocorrelation function,PACF)图,如图3。

从该图可以看到,自相关函数在12步后截尾,所以q=12;偏自相关函数在12步后截尾,所以p=12。

对模型进行检验,由于常数项C没有通过显著性检验,即C对模型没有显著性影响故舍掉。AR(12)的p值为0.008,MA(12)的p值接近于零,均能通过单个系数的显著性检验;且拟合优度R2=0.827,拟合情况还算是可以的。因此,p=12,q=12,d=2处理后数据的模型为。由此得到的估计方程为:

D[D(logXt)]=-0.4353D[D(logXt-12)] -0.9408εt-12+εt①

(四)模型的检验

如果残差序列是白噪声序列即纯随机序列,则表明所建立的模型包含原序列的所有趋势,模型用于预测是合适的。反之,残差序列不是白噪声,说明残差序列中还有某种信息即还有规律,所建模型不合适,应重新建模。可以利用残差的自相关分析图直观判断,其准则是:残差序列的自相关与零无显著不同,或者说基本落入随机区间,残差序列为白噪声;反之残差序列不是白噪声。

由图4可以看出,所有Q值都小于检验水平为0.05的卡方分布临界值,最后得出结论:模型的随机误差序列是一个白噪声序列。

建立模型的目的之一是对未来值进行预测。对未来贵州省农业总产值进行预测前, 先检验模型的预测能力。模型的预测能力一般用平均绝对百分比误差(mean absolute percentage error,)度量, 它的计算公式如下:

MAPE=■·■■×100%

通过计算MAPE=1.106<10,说明模型的预测精度较高。通过实际值与预测值的拟合图可以看出(见图5),拟合情况是比较理想。

(五)对贵州省农业总产值的预测

通过估计方程①对2011年贵州省农业总产值的预测值为:D[D(logX2011)]=09,925234,经计算得出X2011=670.63亿元(2011年的实际值为655.30亿元),误差为2.33%。同时预测贵州省2012年农业总产值为773.85亿元。

四、总结

本文构建的贵州省农业总产值自回归预测模型,经统计检验估计方程整体显著性很好,由此证实了ARIMA模型是一种很好的短期时间序列农业总产值的预测方法,适用于贵州农业总产值的预测研究,可以为贵州农业经济发展规划提供决策依据。

值得注意的是,ARIMA模型的短期预测效果好,长期预测效果不好,尽管如此,与其他的预测方法相比,其预测的准确度还是比较高的。

参考文献:

[1]徐国祥,统计预测与决策(第二版)[M].上海:上海财经大学出版社,2005.

[2]张晓峒.计量经济学(第三版)[M].天津:南开大学出版社,2007.

[3]易丹辉.时间序列分析方法与应用[M].北京:中国人民大学出版社,2011.

[4]王燕.应用时间序列分析[M].北京:中国人民大学出版社,2005.

(作者单位:贵州大学经济学院)