APP下载

基于ARIMA模型对某种重要化工原料价格变动的分析

2015-05-30屈晓阳

2015年50期
关键词:ARIMA模型

屈晓阳

摘要:在分析过程中,首先利用SAS软件绘制时序图,从整体上把握数据信息。再进行数据的预处理,发现该化工原料价格序列具有非平稳非白噪声的属性,说明该序列有值得提取的相关信息,同时考虑差分方法使序列平稳。

然后分别采取1阶差分和2阶差分并将得到的结果进行对比,从中选出相对最优模型为ARIMA(2,1,0)。接着对所选取的模型进行参数估计以及模型检验,发现ARIMA(2,1,0)模型对该化工原料价格序列建模成功。

最后根据建立的模型对该化工原料的价格进行未来五个月的预测以期得到有价值的信息。

关键词:ARIMA模型;SAS软件;差分平稳;序列预测

一、描绘时序图

针对某种重要化工原料1990年至2004年的月度价格作出时序图,从图中可以发现,该序列波动范围较大,并不在某一个常数值附近波动,同时显示出一定的趋势性。

二、时序特征分析

(一)描述性统计

由SAS编程可得到化工原料月度价格序列描述性统计的值,其中均值为215.3616,标准差为60.29508,该序列共有177个观察值。

(二)自相关图检验

作出化工原料月度价格序列的自相关图,其中横轴表示自相关系数,纵轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。可以发现,序列的自相关系数递的速度相当缓慢,直至延迟24期自相关系数也未衰减到零。同时,自相关图显示序列自相关系数长期位于零轴的一边,说明序列具有单调趋势。由以上的分析可知该序列为非平稳序列。

(三)纯随机性检验

由SAS可得到序列的纯随机性检验结果:

延迟阶数LB统计量的值 P值

6554.08<.0001

12731.53<.0001

18783.1<.0001

24801.66<.0001

检验结果显示,在各阶延迟下LB检验统计量的P值都非常小(<0.0001),所以我们可以以很大的把握(置信水平>99.999%)认为该序列属于非白噪声序列。结合前面的平稳性检验结果,说明该序列为非平稳序列,同时还蕴含着值得提取的相关信息。

三、差分平稳及模型确定

由于该化工原料月度数据表现出非平稳性,为了进一步的分析,下面对序列进行差分处理。

(一)1阶差分平稳

1、1阶差分平稳序列分析

作图可以看出,1阶差分已经达到了很好的效果。从时序图可以发现,序列不存在明显的趋势性或周期性,没有显著的非平稳特征。

白噪声检验结果显示,在各阶延迟下LB检验统计量的P值都很小(<0.02),所以我们可以以很大的把握(置信水平>98%)认为该序列属于非白噪声序列。再做出样本自相关图和样本偏自相关图,进一步确定模型平稳性并给拟合模型定阶。

从自相关图也可以看出自相关系数很快地衰减到零,延迟1阶后,自相关系数基本都在2倍标准差范围之内,故进一步确定该序列具有短期相关性,1阶差分序列平稳。再进一步考察自相关系数衰减到零的过程,可以看到自相关系数衰减到零并不是一个突然的过程,而是有一个连续渐变的过程,故认为自相关系数拖尾。

最后考察偏自相关系数衰减到零的过程,除了1~2阶偏自相关系数在2倍标准差范围之外,其他阶数的偏自相关系数都在2倍标准差范围内,这是偏自相关系数2阶截尾的典型特征。根据自相关系数拖尾,偏自相关系数2阶截尾的属性,初步确定拟合模型为AR(2)模型。

2、1阶差分序列定阶

(1)相对最优定阶。考虑人为定阶的主观性过强,利用SAS进行相对最优定阶,得到结果。最后一条信息显示,在自相关延迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARIMA(p,1,q)模型中,BIC信息量最小的是ARIMA(3,1,0)。

(2)参数检验。由检验结果可知,常数项和φ3项无法通过显著性检验,去除常数项得到新的检验结果。

结果发现,去除常数项后φ3项仍无法通过显著性检验,而去除φ3后参数均通过显著性检验,故认为此模型为ARIMA(2,1,0)。

(二)2阶差分平稳

未避免差分方法选择不当对模型建立造成的影响,下面对序列进行2阶差分,并将得到的结果与1阶差分的结果进行对比,从而筛选出较优模型。

1、2阶差分平稳序列分析

对比1阶差分时序图,可以看到2阶差分与1阶差分得到的结果并没有显著的区别。从时序图可以发现,序列不存在明显的趋势性或周期性,没有显著的非平稳特征。

白噪声检验显示,在各阶延迟下LB检验统计量的P值都很小(<0.0001),所以我们可以以很大的把握(置信水平>99.999%)认为该序列属于非白噪声序列。再做出样本自相关图和样本偏自相关图,进一步确定模型平稳性并给拟合模型定阶。从自相关图也可以看到,延迟3阶后,自相关系数基本都在2倍标准差范围之内,故进一步确定该序列具有短期相关性,2阶差分序列平稳。

再进一步考察自相关系数衰减到零的过程,可以看到自相关系数衰减到零并不是一个突然的过程,而是有一个连续渐变的过程,故认为自相关系数不截尾。

最后考察偏自相关系数衰减到零的过程,可以看到有明显的正弦波动轨迹,这说明偏自相关系数衰减到零的过程也是一个连续渐变的过程,故认为偏自相关系数不截尾。根据自相关系数不截尾,偏自相关系数也不截尾的属性,以及样本自相关系数与偏自相关系数的特征,初步确定拟合模型为ARMA(1,2)模型。

2、2阶差分序列定阶

(1)相对最优定阶。相对最优定阶得到结果的最后一条信息显示,在自相关延迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARIMA(p,1,q)模型中,BIC信息量最小的是ARIMA(2,1,3)。

(2)参数检验。由检验结果可知,常数项、φ2以及θ3项无法通过显著性检验,去除常数项得到新的检验结果。结果发现,去除常数项后φ2和θ3项仍无法通过显著性检验,下面进一步检验。在置信水平α=0.1下,参数全部通过显著性检验,故认为此模型为ARIMA(1,2,2)。

(三)1阶差分与2阶差分模型比较

下面将1阶差分和2阶差分得到的结果进行对比,利用SAS得到结果。从得到的结果可以发现,ARIMA(2,1,0)模型延迟各阶的LB统计量的P值均显著大于置信水平α=0.05,故该拟合模型显著成立。而ARIMA(1,2,2)无法通过残差白噪声检验。同时,最小信息量检验显示无论是使用AIC准则还是使用SBC准则,ARIMA(2,1,0)都要优于ARIMA(1,2,2)模型,故对于该价格序列来说,ARIMA(2,1,0)模型是相对最优模型。

综合以上的分析,确定该序列的拟合模型为ARIMA(2,1,0)。

四、参数估计

使用条件最小二乘估计,确定该模型口径为:

xt=εt1-0.34727B+0.23294B2Var(εt)=335.0896

或等价写为:xt=1.34727xt-1-0.58021xt-2+0.23294xt-3+εt

Var(εt)=335.0896

五、模型检验

残差白噪声检验参数显著性检验

延迟阶数LB统计量P值待估参数t统计量P值

63.970.410514.69<.0001

127.780.65042-3.090.0023

1814.450.5654

2419.50.6142

3024.750.6413

显然看出,拟合检验统计量的P值都显著大于显著性检验水平0.05,可以认为该残差序列为白噪声序列,即拟合模型显著有效。系数显著性检验显示两参数均显著。这说明ARIMA(2,1,0)模型对该序列建模成功。

六、序列预测

由上面的分析确定最终的模型为:

xt=1.34727xt-1-0.58021xt-2+0.23294xt-3+εtVar(εt)=335.0896

其中φ1=1.34727,φ2=-0.58021,φ3=0.23294

序列预测的计算过程如下:

(一)预测值的计算

已知x177=411,x176=420,x175=374,故178=1.34727x177-0.58021x176+0.23294x175=397.1594

179=1.34727178-0.58021x177+0.23294x176=394.4493

180=1.34727179-0.58021178+0.23294x177=396.7322

181=1.34727180-0.58021179+0.23294178=398.1563

182=1.34727181-0.58021180+0.23294179=398.119

(二)预测方差的计算

首先,根据Green函数的递推公式,算得

G0=1,G1=φ1G0=1.34727,G2=φ1G1+φ2G0=1.23493G3=φ1G2+φ2G1+φ3G0=1.11502,G4=φ1G3+φ2G2+φ3G1=1.09955

Var[e178]=G20σ2ε,Var[e179]=(G20+G21)σ2ε,Var[e180]=(G20+G21+G22)σ2εVar[e181]=(G20+G21+G22+G23)σ2εVar[e182]=(G20+G21+G22+G23+G24)σ2ε=2276.8551

(3)未来l步预测价格预测的95%置信区间为:

(177+l-1.96Var[e177+l],177+l+1.96Var[e177+l])

代入数值可得到计算结果如下:

序号 预测值标准差 95% 置信区间

178397.159418.3055361.2813433.0374

179394.449330.7136334.2517454.6469

180396.732238.1361321.9869471.4775

181398.156343.2548313.3785482.934

182398.11947.7086304.612491.6261

由SAS得到该序列拟合与预测图可以较为直观的看到模型拟合的结果,同时可以看到,随着预测期数的增加,预测方差出现增大的趋势。

七、模型评价

本文基于某种重要化工原料1990年至2004年的月度价格数据,充分利用应用时间序列分析的知识,成功建立ARIMA模型,并给出未来五个月价格的预测,希望能提取到尽可能准确的信息并对该方面的研究提供一定的帮助。

经过对比分析、各参数的显著性检验及模型的显著性检验,最后确定该化工原料1990年至2004年的月度价格序列为ARIMA(2,1,0)模型。该模型简单,可操作性强,并且与实际的结果符合的很好,可以帮助我们研究该化工原料价格走向,对未来的预测有一定的实际意义。(作者单位:辽宁大学)

参考文献:

[1]王燕. 应用时间序列分析[M]. 第三版. 北京:中国人民大学出版社, 2012.

猜你喜欢

ARIMA模型
基于时间序列模型的中国出口总额分析及预测
基于R软件的金融时间序列的预测分析
基于Eviews上证综合指数预测
基于ARIMA模型的河北省能源消费预测
基于ARIMA模型的沪铜期货价格预测研究
基于ARIMA模型的人民币汇率分析及预测
ARIMA模型在中国GDP预测中的应用
对我国进出口总额的预测
组合预测法在我国粮食产量预测中的应用
时间序列分析在财政收入预测中的应用