基于ARIMA模型对销售总额的预测分析
2015-05-30李冬
李冬
[摘要]在自然科学和社会科学各研究领域中,大量决策问题都离不开预测,预测是决策的基础。近年来,ARIMA模型得到了极大的发展,越来越多的应用在各个领域的分析中,本文我们对某公司2000年1月到2008年12月的8种商品的销售总额的数据作为分析的样本进行分析,建模,预测未来三期的值。为了验证预测的准确性,我们去掉了后三期的数据,作为预测目标,以便对真实值与预测值进行有效的对比,结果预测基本准确,最终我们得出预测五期的增量。
[关键词]时间序列;ARIMA模型;预测
[DOI]1013939/jcnkizgsc201538095
1判断序列的平稳性
某企业商品的销售总额数据(数据见附录)的时序图见图1。
2对原序列进行差分运算
时序图显示该序列具有一个线性递增趋势。所以对原序列先做异步差分,提取线性递增趋势[2]。
xt=xt-xt-1
一步差分后的序列{xt}时序图,见图2:
时序图显示出差分后序列在均值附近比较稳定的波动。为了进一步确定平稳性,考察1阶差分后序列的自相关[3],可以看到在短期内1~5阶的区间内相关性急速增大,又急速减小,后期基本都小于二倍的方差,认为自相关图显示序列有短期的相关性,所以,可以初步认为一阶差分后序列平稳[4]。
3对平稳的1阶差分序列进行白噪声检验
对1阶差分后序列进行白噪声检验,结果如下:
Autocorrelation Check for White Noise
ToChi-Pr >
LagSquareDFChiSqAutocorrelations
641496<00001-0031-0265-0323-020701720358
12915412<000010188-0095-0367-027600840405
181372418<000010255-0173-0345-014900030360
241712324<000010196-0079-0207-0234-00070332
在检验的显著性水平取为005的条件下,所有的延迟阶数对应的p值都小于005,所以该差分序列不能视为白噪声序列。
4对平稳非白噪声差分序列拟合ARMA模型
从自相关图与偏自相关图来看,偏自相关值与自相关值都有一些值大于2倍的方差,所以认为序列相关图显示出不截尾性,考虑构造ARMA(1,1)模型拟合1阶差分后序列,但结果残差自相关检验结果中,LB统计量的p值都小于005,所以说模型不显著,还有可提取部分。
经过筛选,ARMA(2,3)模型显著,其参数估计如下:
Conditional Least Squares Estimation
StandardApprox
ParameterEstimateErrort ValuePr > |t|Lag
MA1,11557140106091468<000011
MA1,2-137403014833-926<000012
MA1,3036736010822339000103
AR1,11050350026254001<000011
AR1,2-100000002630-3803<000012
结果中显示其参数估计的T统计量的p值都小于005,所以参数估计显著。
5对残差序列进行检验
残差自相关检验结果如下:
Autocorrelation Check of Residuals
ToChi-Pr >
LagSquareDFChiSqAutocorrelations
6353100604-0041-00390111-0009-0070-0108
12904702499-00690062-0045-0143-00860093
18135313040810051-0107-00520075-01010058
2418621904816-0008004201450015-00350116
我们从结果中看到,所有的p值中都小于005,不能接受原假设,即残差不存在相关性,所以认为该拟合模型显著成立[5]。
6拟合模型的具体形式
模型拟合结果如下
ARIMA(2,1,3)模型为:
(1-105035B+1B2)(1-B)Xt=at(1-155714 B+137403B2-036736B3)
7ARIMA模型预测
FForecasts for variable sum
ObsForecastStd Error95% Confidence Limits
1052397799930254688-3532010083276097
1065606345433918242-10415079122541988
1072968000134254641-3745786196817863
从结果中我们可以,看到未来三期的预测值。
2008年10月销售总额增量为23977999元;
2008年11月销售总额增量为56063454元;
2008年12月销售总额增量为29680001元。
拟合预测图见图3:
图3中黑色带星为真实值一阶差分后的曲线,红色线为拟合曲线,绿色为95%的预测区间。
8结论
在本文中,我们将某公司2000年1月到2008年12月的8种商品的销售总额的数据作为分析的样本。为了验证预测的准确性,我们去掉了后三期的数据,作为预测目标,以便对真实值与预测值进行有效的对比。首先,对数据进行序列图的观察。通过观察,我们看到序列存在趋势因素,然后我们通过差分,去除此因素。通过对差分后数据的观察,以及相关系数图的观察确定为平稳时间序列,以及对偏相关系数图的观察,序列的白噪声检验,确认了序列符合建立ARMA模型的条件。然后,我们对数据行建模。通过t检验,以及残差白噪声检验,最终我们得出模型。最后,我们通过模型进行短期的预测。通过最后三期真实值与预测值的对比,相对误差都小于5%,我们可以认为我们的预测是比较准确的。在此基础之上,我们用全部数据进行分析,得出了未来五期的相对上一期的预测增量。
参考文献:
[1]陈兆国时间序列及其谱分析[M].北京:科学出版社,1998
[2]王燕应用时间序列分析方法[M].北京:人民大学出版社,2012
[3]詹姆斯·D汉密尔顿时间序列分析[M].刘明志,译.北京:中国社会科学出版社,1999
[4]Cleveland WP,Tiao GCDecomposition of Seasonal Time Series:A Model for the X-11 Program[J].Journal of the American Statistical Association,1986(71):581-587
[5]Maravall A,Planas CEstimation Error and the Specification of Unobserved Component Models[J].Bank of Spain—Service of Studios:92,325-353,199
[6]韩朝怡ARIMA模型和X-11过程在农民人均现金收入预测中的应用研究[J].中国市场,2015(25)