居民消费价格指数两种预测模型的比较
2015-01-03邢珺,张婷
邢 珺,张 婷
(对外经济贸易大学 国际经济贸易学院,北京 100029)
0 引言
CPI是反映一定时期内居民购买生活消费品及服务支出费用价格变动的相对指标。通过CPI可以观测居民生活消费品及服务项目价格的变化规律,为政府制定经济政策,稳定物价水平、实现经济增长、促进社会可持续发展提供科学的依据。
目前,我国的消费价格指数按对比基期不同,可以分为:以2000年价格为基期的指数(定基比),以上月价格为基期的指数(月环比),以上年同月价格为基期的指数(同期比),本年一月至报告期以上年同期价格为基期的指数(累计比)和以上年12月价格为基期的指数共五种。
谢佳利,杨善朝,梁鑫(2008)运用时间序列的几个不同模型,对我国居民消费价格指数(CPI)的变化规律进行了比较研究,通过对我国2001年1月到2007年8月的CPI值建立带有季节趋势的ARIMA模型,并将该模型的相对误差控制在1%以内。郭海(2011)在考虑传统假期因素的基础上,对用同期环比数据进行预测的结果进行修正。董梅(2011)通过建立VAR模型,从影响CPI的因素着手,对未来36个月的CPI走势进行定量预测,其结论为不会发生大规模通货膨胀。肖曼君等(2008)通过建立ARIMA模型分析,分析了1990~2007年的通货膨胀同期比数据,结果表明居民消费价格指数数据具有较长的滞后性。
之前学者对于CPI居民价格指数建立的ARIMA模型,由于其使用数据期限较短,所以避免了ARIMA模型在预测期限较长数据时的偏理性。然而,CPI左右衡量经济社会的重要指标,其随时间、季节等的变化而变化,故对CPI的趋势分析,应采取适宜较长期限结构的模型。基于此,本文将采用目前国家统计局公布的我国1990年1月至2014年的6月同期比月度数据,综合考虑数据的趋势性与季节性,建立具有季节调整的SARIMA模型与X-12-ARIMA模型进行预测分析,并验证相对于SARIMA模型,X-12-ARIMA调整模型在短期内具有较高的预测精度。
1 模型介绍
1.1 SARIMA模型
SARIMA模型(Seasonal Auto-regressive Integrated Mov ing Average,季节性差分自回归移动平均模型)是一种时间序列预测分析方法,它来源于自回归单整移动平均模型(ARIMA),能够采用Box-Jenkins的模型识别,估计和预测程序,能保障模型的预测精度而且很容易应用于实时预测。SARIMA模型的一般形式为:
Φ(B)Φ(BS)(1-B)d(1-BS)Dyt=c+θ(B)Θ(BS)εT
其中,S和D分别表示阶级周期的长度和季节差分的阶数;BS表示季节后移算子;Φ(BS)=1-Φ1BS)-...-ΦPBSP;Θ(BS)=1-Θ1BS)-...-ΘPBSP,P和Q的含义分别与ARIMA模型中的p与q的含义相同。上式所表示的SARIMA模型被记为SARIMA(p,d,q)(P,D,Q)S模型。
运用ARMA模型的前提条件是时间序列为零均值的平稳随机过程。对于包含趋势性或季节性的非平稳时间序列,需要经过适当的逐期差分及季节差分消除趋势影响,再对形成的新的平稳序列建立ARMA(p,q)模型进行分析。对于只包含趋势性的原序列,可表示为ARIMA(p,d,q)模型(求和自回归移动平均模型),如果原序列同时包含趋势性和季节性,则可表示为SARIMA(p,d,q)(P,D,Q)s模型(乘积季节ARIMA模型),d、D分别为逐期差分和季节差分的阶数,p、q分别为自回归和移动平均的阶数,P、Q分别为季节自回归和季节移动平均的阶数。
1.2 X-12-ARIMA季节调整模型
季节调整问题最初是在1919年由美国的经济学家提出的。1931年Macauley提出用移动平均比率法进行季节调整,成为了季节调整方法的基础。1954年,Shiskin在美国普查局首先开发出在可计算机上运行的程序,对时间序列进行季节调整,被称为X-1。此后,季节调整的方法每改进一次都以X加序号表示。
季节调整方法基于构成因素分解剔除原始数据中季节性因素,美国的X-11程序以及它的升级版本X-12-ARIMA程序使用最为广泛。在这些季节调整程序中,经济时间序列常常被分解为几个相互正交的构成因素:趋势--循环因素、季节因素和不规则因素。常用的主要有乘法模型、加法模型、对数加法模型以及拟加法模型等四种模型。
X-12方法的基本思路是假设时间序列Yt有趋势Tt—Trend、循环Ct-Cycle、季节St-Seasonal和不规则项It-Irregular等四部分的组成元素。为从Yt中消除季节因素St的影响,X-12采用了移动平均的方法。为改善序列Yt两端的不对称情况,加拿大统计局对X-12方法进行了改进,提出了X-12-ARIMA方法,也就是在采用X-12方法前,先使用ARIMA模型对序列Yt的两端进行了延伸。
由于X-12方法具有上述强大的季节调整功能,我们将尝试使用X-12季节调整方法对我国的消费价格指数作季节调整,并对居民消费价格指数进行预测。
2 实证分析
2.1 数据及变量说明
本文采取国家统计局公布的我国1990年1月至2014年6月的同期比月度数据,以1990年1月至2013年12月的数据为样本建立SARIMA模型与X-12季节调整模型,用2014年1月至2014年6月这6个月的数据为参照数据,用SARIMA模型与X-12季节调整模型进行预测,与真实数据比较,分析对比两种模型的预测精确度。
2.2 模型对比分析
2.2.1 SARIMA模型的拟合
(1)对原始数据进行平稳性检验
采用Eviews6.0软件,对同期比数据进行平稳性检验。主要采用两种方法检验该数据平稳性。一是直接观察序列的时序图(如图1,图2),可以看出该数据有一定的趋势,并且伴有季节波动;二是进行单位根检验,即ADF统计量检验,ADF统计量为-0.83,大于10%显著性水平下的临界值水平-1.61,即接受原单位根假设,原始数据CPI不平稳。依据以上两种方法检验均可判断该序列是非平稳的。
从图1可以看出,CPI在1994年下半年到1995年之间,发生了较快增长,随后从1995年下半年开始,CPI逐步下降,直到1998年开始,CPI微幅增长,到2004年至2005年,CPI遭遇小高峰,至2007年达到近些年来的最高点,随后下降,2013年又有上升趋势。
图1 同期比居民消费价格指数时序图
图2 序列CPI的相关图
(2)数据平稳化处理
从图中可以看到数据有一定下降的趋势,并伴随季节趋势,所以对数据先进行一阶普通差分,再进行十二步季节差分(即作d(CPI,1,12)变换),从而消除序列的长期趋势和季节波动,最终使数据平稳。经过这样的处理,数据的单位根检验结果如下:ADF单位根-6.69,小于1%显著性水平下的临界值-3.46,则拒绝原单位根假设,即处理后的数据不存在单位根,该数据平稳。
(3)模型的识别,定阶与参数估计
对于模型的识别,方法是观察平稳后的序列的相关图,如图2所示,该序列一,二阶偏自相关较高及相关系数较高,并且数据仍然具有一定的季节相关,因为滞后十二阶、滞后二十四阶与滞后三十六阶的AC值与PAC值明显增大。
可以判断该序列可能适应以下几种模型,分别对可能的模型进行估计,并做适应性检验,即观察残差序列是否为白噪声。通过检验分析,下列四种模型既可以通过参数显著性检验,又可以通过适应性检验,结果指标对比见表1。
图3 序列d(CPI,1,12)的相关图
表1 不同阶数模型的比较
上述模型对比得出,模型四AIC值最小,故模型四优于其他三个模型此时,AIC值最小,调整后的R2值最大,DW值接近2。得出的参数估计结果如下:
(1+0.93B)(1-0.719B12-0.367B24)(1-B)(1-B12)CPIt=-0.014+(1-0.394B-0.203B2)(1-0.886B12)Ut t=(25.61)(-13.62)(-7.85)(-0.75)(-5.56)(-3.23)(-9639.56)
(4)模型的拟合性检验及预测
为更进一步确定模型选择是否最优,需要进行拟合检验,方法是选择1990年1月到2013年12月的样本数据回归上述确定的模型,SARIMA(1,1,2)(2,1,1)12。然后利用模型预测2014年1月到2014年6月(共6个月)的数值并与已有的真值比较,观察预测值与真实值的偏离程度,从而确定模型的拟合效果。通过计算可得这6个月预测误差在10%以内,该模型的拟合效果一般好。预测结果见表2。
表2 2014年1~6月预测值
通过表2的预测结果,可以看到SARIMA模型预测结果存在一定的系统性偏差,预测结果低于实际值,可能因为模型选择主观性较强,且SARIMA适用于短期预测,对于稍长数据期限则导致预测精度下降。对于样本量的变化模型选择比较敏感。
2.2.2 X-12季节调整分析
时间序列数据是随时间变化记录的,它的变动是综合因素影响的结果,尤其是特殊时间段的影响,比如星期因素、节假日因素、季节因素等。X-12就是分解时间序列季节趋势,长期趋势以及不规则变动的一种重要方法,对居民消费价格指数的研究,也可以采用X-12分析,并在分析的基础上进行预测。对于影响时间序列的各因素综合作用的形式,通常有乘法模型、加法模型以及混合模型三种,其中乘法模型是最常用的。本文采用乘法模型,即CPI=T*S*I,其中T为长期趋势,S为季节因素,I为不规则变动。
通过软件内置运算程序可以对数据进行分解,关键是如何预测。预测总的思想是:通过软件将原始序列分解为CPI_SA(季节调整后的序列,也即长期趋势),CPI_SF(季节因子,也即季节因素),CPI_IR(不规则变动),然后分别对这三个被拆分的序列进行预测得SAF,SFF,IRF,最终CPI的预测值CPI=SAF*SFF*IRF。由于季节因子相对稳定,故SFF选择上年同期的季节因子值,下面着重预测SAF与IRF。
(1)长期趋势SAF的预测。
从长期趋势CPI_SA的时间序列图中可以看出曲线近似于一条抛物线,所以对数据进行抛物线拟合,得出结果如下:
可以看出虽然系数通过了检验,R2值较低,DW值接近于0,该模型明显存在自相关。故在模型中引入AR(1),重新估计,得到的结果中T2的系数不显著,将T2去除后估计结果如下:可以看出拟合效果很好,模型的自相关得到了消除,并且对残差做ADF检验知残差是平稳的,证明CPI_SA与时间T之间的相关关系是协整的:
最终确定模型为:
根据此模型对2014年1月到2014年6月的数据进行预测,预测结果见表3:
表3 CPI_SA的预测值
(2)不规则变动的预测.
通过观察不规则变动序列CPI_IR的相关图,可以看出其非白噪声。
从相关图还可以看出,该序列与其自身滞后十二阶的自相关系数和偏相关系数均比较大,且其滞后一阶和二阶自相关和偏自相关系数较大,经过模型试算,最终采取模型如下:
CPIt=1.00+(1-0.2655B2)(1-0.5193B12)et
图4 序列CPI_IR的相关图
t=(14463)(-4.191)(-8.956)
DW=2.1 F=45.51 R2=0.29
根据选择的模型对2014年1月到2014年6月的数据进行预测,预测结果见表4:
表4 不规则变动的预测值
(3)对CPI的预测
季节调整因子假设不变,故采取2013年的季节调整因子如表5所示:
表5 季节调整因子的预测值
根据以上的预测值对最终的CPI预测CPIF=SAF*SFF*IRF,得如下:
表6 X-12方法最终预测值
2.3 模型评价
两种方法对于原始序列的拟合效果都不错,都是可选的。从理论上来讲,SARIMA模型对于数据的拟合采取方式为提取样本数据包含时间信息,而X-12可以更好的刻画建立数据长期趋势模型,提取季节因子,对于不规则变动部分采取ARIMA模型的方式来估测数据,对数据的处理更完善,且更加稳定,从本例的预测值来看,SARIMA模型的预测误差在8%-9%之间,而X-12季节调整模型的预测误差在2.0%以内,其预测精度更高。下图为两种方法预测值的比较,从下图可以看出,SARIMA模型对于居民消费价格指数的估计,容易存在系统性偏差,如在本文中,SARIMA模型的估算结果,稳定的小于真实值,而X-12季节调整模型的估算结果,则与真实值服从相同的波动,故对于时间期限较长的数据,采用X-12季节调整模型容易得到更精确的估计结果。
图5 两种模型预测准确度比较
3 结论
价格指数时间序列通常不仅受到趋势性的影响,更主要的是受季节性成分的影响,目前主要采用ARIMA或者考虑季节调整的SARIMA模型进行预测。虽然SARIMA模型短期预测精度很高,预测值的相对误差可以控制在1%以内,但是随着时间序列数据的跨期增多,其长期预测效果一般,相对误差范围在10%以内。故可以采用X-12季节调整方法直接对价格指数类时间序列数据进行预测,该方法尽管一直以来被用来处理时间序列的原始数据,真正应用于预测的并不多,但通过本文的分析可以看到,直接采用X-12季节调整模型对于中长期数据的预测效果较好,其相对误差控制在2%以内。2014年,预计我国短期内将不会出现CPI的大幅波动,且CPI将高于同期比数据,短期内我国消费价格指数也不会出现大幅回落的情况,高于去年同期比的物价水平将持续一段时间。
[1]U.S.CensusBurean.X-12ARIMA Reference ManualVersion 012110,1~48[R],2002.
[2]David F F,Brian C M,William R.B,et al,New Capabilities and Methods of The X-12-ARIMA Seasonal Adjustment Program[J].Journal of Business and Economic Statistics,2002.
[3]Paul-Edelstein.Commodity Prices,Inflation Forecasts,and Monetary Policy[C].Working Paper,2007,(1).
[4]Dickey D A W A.Fuller“Likelihood Ratio Statistics for Autoregressive Time Series With A Unit Root,”[J].Econometric ,1981,(9).
[5]夏春.实际经济时间序列的计算、季节调整及相关含义[J].经济研究,2002,(3).
[6]郭海.基于月环比均值和翘尾因素的居民消费价格指数短期顶测[J].统计与决策,2011,(l).
[7]潘红宇.时间序列分析[M].北京:对外经济贸易大学出版社,2006.
[8]董梅.基于VAR模型的居民消费价格指数预测[J].统计与决策,2011,(1).
[9]易丹辉,数据分析与Eviews应用[M].北京:中国人民大学出版社,2008.
[10]谢佳利,杨善朝,梁鑫.我国CPI时间序列预测模型的比较及实证检验[J].统计与决策,2008,(9).