ARIMA模型及其实证
2016-02-13郭淑妹郭杰
郭淑妹 郭杰
(解放军信息工程大学理学院,河南郑州 450001)
ARIMA模型及其实证
郭淑妹 郭杰
(解放军信息工程大学理学院,河南郑州 450001)
河南省生猪价格序列是一组依赖于时间变化的随机变量,可用ARIMA模型予以近似描述。基于此,运用2005-2015年河南省每月生猪价格数据,得到ARIMA(1,1,1)模型,经诊断检验与实证检验发现,模型预测精度较高,可用于河南省生猪价格预测。
ARIMA模型;价格;平稳序列;预测
1 ARIMA模型
如果平稳序列{yt}不仅与其过去时刻的自身值有关,而且还与其过去时刻的扰动项存在一定依存关系,那么这个序列{yt}就可以建立p阶自回归,q阶移动平均模型ARMA(p,q):
式(1)中,εt-1,εt-2,……,εt-q是yt的随机误差项,{εt}是相互独立的白噪声过程。
ARMA(p,q)模型只适用于处理平稳时间序列的预测,对于非平稳时间序列,不能直接用ARMA(p,q)模型描述,对于含有一定变化趋势的非平稳时间序列进行d阶差分后可应用ARMA(p,q),即建立ARIMA(p,d,q)模型。ARIMA模型全称为差分自回归移动平均模型[1],其具体过程如下。
①根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别[2],一般经济运行的时间序列都不是平稳序列。②对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理;如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于0。③根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。④进行参数估计,检验是否具有统计意义。⑤进行假设检验,诊断残差序列是否为白噪声。⑥利用已通过检验的模型进行预测分析[3]。
2 河南省生猪价格模型的建立和预测
2.1 数据来源
采用的数据来自2015年河南统计年鉴[4],样本区间是2005-2015年河南省每月生猪价格,记为时间序列{xt},使用分析软件Eviews8.0做出趋势图,如图1所示,可以看出河南生猪价格每月平均价格波动具有不稳定性,而长期趋势和循环变动趋势不是明显。
图1 河南省2005-2015每月生猪价格趋势图
2.2 平稳性检验
由图1可以看出,时间序列{xt}为非平稳时间序列,为了减小波动,对其对数化,由其序列图2可以看出,对数化之后序列仍然不平稳。对序列{xt}做ADF检验,检验统计量为-2.016 459,大于1%、5%、10%显著水平下的临界值如表1所示,表明该序列是非平稳的。对序列进行wt= lnxt对数化之后,对序列{wt}做ADF检验仍显示是序列非平稳的。
图2 河南省2005-2015每月生猪价格取对数趋势图
表1 {xt}ADF检验统计量
对{wt}进行一阶差分,令yt=wt-wt-1,对序列{yt}进行平稳性检验,检验结果显示,序列{yt}的ADF检验统计量为-7.973 106,小于1%、5%、10%显著水平下的临界值如表2所示,因而序列{yt}为平稳时间序列,确定d=1。
2.3 参数估计与模型选择
为了确定ARIMA(p,d,q)中的p,q,计算一阶差分后的序列{yt}的自相关图和偏自相关数据如图3所示。从图3中可以看出,序列1、2阶偏自相关系数超出±2倍估计标准差,2阶以后偏自相关系数在±2倍估计标准差以内,即偏自相关函数2阶以后截尾;同理,序列1阶自相关系数超出2倍估计标准差,2阶以后偏自相关系数在±2倍估计标准差以内,即自相关函数1阶以后截尾,结合自相关图和偏自相关图可初步确定p=1,q=1或q=2。
图3 {yt}的自相关图和偏相关图
模型确定为ARIMA(1,1,1),ARIMA(1,1,2)。计算不同p,q组合所对应的AIC值,当p=1,q=1时,AIC值为2.485 025;当p=1,q=2时,AIC值为2.748 736,前者值较小,所以确定模型为ARIMA(1,1,1)。
2.4 模型的检验
为检验模型对序列{yt}的拟合效果,检验模型对信息的提取是否充分,分别对序列的拟合值与残差进行了计算。通过对模型的残差序列进行单位根检验,发现ADF检验统计量为-11.200 22,明显小于1%、5%与10%显著性水平的临界值,这表明模型残差序列为白噪声序列(见表2)。由此可确定ARIMA(1,1,1)为平稳序列较为理想的预测模型。
表2 残差的ADF检验统计量
2.5 模型预测
对模型进行估计,得到表3。
因此,时间序列{yt}的模型为:
可推导出{wt}的预测公式为:
由此:
表3 模型估计
图4 预测值拟合图
根据{xt}的预测公式对2005年1月-2015年12月河南省生猪价格进行事后预测,预测结果见图4。从图4可看出,预测值在±2倍标准差之内,误差均方根与平均绝对误差很小,Theil不等系数接近于0,偏差比率,方差比率较小,协方差比率较大说明ARIMA(1,1,1)模型对河南省生猪价格预测效果较好。因此,ARIMA(1,1,1)模型可对河南省生猪价格进行预测。应用ARIMA(1,1,1)模型对2016年1-12月河南省生猪价格进行预测,预测结果表明,河南省生猪价格在2016年6月达到峰值,6月之后价格回落明显。
3 结语
河南省生猪每月价格序列为非平稳时间序列,是一组依赖于时间变化的随机变量,可用ARIMA模型予以近似描述。本文运用2005年1月-2015年12月河南省生猪价格建立了ARIMA(1,1,1)模型,经模型参数估计与诊断检验以及实证检验发现,预测相对误差较小,预测拟合度较好,可用于河南生猪每月价格预测。
[1]Adak S.Time-dependent spectral analysis of nonstation⁃ary time series[J].Journal of American Statistical Association,1998(444):1488-1499.
[2]Box G,Jenkins G.Time series analysis forecasting and con-trol[M].San Francisco:Holden Day Press,1970.
[3]俞天贵,邓文凭.基于ARIMA模型的中国煤炭消费量增长预测[J].统计与决策,2008(24):89-91.
[4]河南省统计局.河南年鉴2015[Z].北京:中国统计出版社,2016.
ARIMA Model and Empirical Analysis
Guo ShumeiGuo Jie
(Institute of Science,PLA Information Engineering University,Zhengzhou Henan 450001)
The pig price series of Henan province is a set of random variables depending on the variation of time,it can use the ARIMA model to approximate description.Based on this,this paper used the dates of Henan province in 2005-2015 monthly pig price,to get ARIMA(1,1,1)model.The diagnostic tests and empirical tests show that the model has high prediction accuracy and can be used to forecast the hog price in Henan province.
ARIMA model;price;smooth series;forecast
P207
A
1003-5168(2016)12-0078-03
2016-11-21
国家自然科学基金项目(41174005)。
郭淑妹(1981-),女,硕士,讲师,研究方向:应用统计。