基于ARMA模型的恩格尔系数的分析与预测
2013-04-29蒋和
蒋和
摘 要:恩格尔系数是衡量居民消费水平的重要指标,而居民消费水平可以反映一个国家的经济发展状况。基于1978-2011年中国城乡居民家庭恩格尔系数的时间序列,建立ARMA模型,用Eviews软件进行拟合,对数据进行分析,并给出2012-2013年的预测值,预测结果表明我国城乡居民家庭恩格尔系数将进一步降低。
关键词:恩格尔系数;时间序列;ARMA模型;预测
中图分类号:F126.1 文献标识码:A doi:10.3969/j.issn.1672-3309(x).2013.08.61 文章编号:1672-3309(2013)08-133-03
改革开放以后,我国经济迅速发展,我们可以通过一些计量指标和经济规律,对我国经济的发展做出分析和预测。其中,德国统计学家恩斯特·恩格尔提出的恩格尔系数(Engel's coefficient),即食品支出占全部生活消费支出的比重,被世界各国广泛采用,主要用于衡量一个国家或地区居民的生活水平。恩格尔系数越大,一个家庭或国家越贫困;恩格尔系数越小,生活越富裕。根据国际粮农组织提出的标准,恩格尔系数大于60%属于贫穷,50%-59%属于温饱,40%-49%属于小康,30%-39%属于富裕,30%以下属于最富裕。
ARMA模型是一种确定型时间序列模型预测方法,其预测精度高于简单模型。本文结合1978-2011年中国农村和城镇居民家庭恩格尔系数的历史数据,运用ARMA模型建模,并进行预测,从而推断其未来趋势。
一、ARMA模型概述
ARMA模型(Auto-Regressive and Moving Average Model),即自回归移动平均模型,是由美国统计学家Box和英国统计学家JenkinsGM于20世纪70年代提出的时间序列分析模型,又称为Box-Jenkins模型。ARMA模型有3种基本类型,分别是
(1)n阶自回归模型(Auto Regressive Model),简称AR(n)模型:
<\\Ww-329725167ea5\本地磁盘 (E)\jjsj\2013年排版\201308\130841.tif>
(2)m阶移动平均模型(Moving Average Model),简称MA(m)模型:
<\\Ww-329725167ea5\本地磁盘 (E)\jjsj\2013年排版\201308\130842.tif>
(3)n阶自回归m阶移动平均模型(Auto-Regressive and Moving Average Model),简称ARMA(n,m)模型:
<\\Ww-329725167ea5\本地磁盘 (E)\jjsj\2013年排版\201308\130843.tif>
二、ARMA模型的建立
(一)数据平稳化处理
表1为1978-2011年中国农村和城镇居民家庭恩格尔系数,共34个样本。
表1 1978-2011年中国城乡居民家庭恩格尔系数
数据来源:《中国统计年鉴》。
根据表1的时间序列数据,运用Eviews6分别作出中国农村和城镇居民家庭恩格尔系数的时间序列图,分别记为序列{Xt}和序列{Yt}。
图1 1978-2011年中国城乡居民家庭恩格尔系数变化趋势
由图1所示,自改革开放以来,我国农村居民家庭恩格尔系数{Xt}和城镇居民家庭恩格尔系数{Yt}均呈现下降的趋势,故序列均为非平稳序列,需对原始数据进行差分处理,一阶差分后的序列图如图2所示。
图2 一阶差分后的序列图
由图2可以看出差分后的序列大致是平稳的,进一步地,需要通过ADF检验对一阶差分后的序列进行平稳性检验,ADF检验结果如图3、图4所示,经检验可知,ADF t-Statistic值分别为-5.255045和-4.657677,其绝对值大于显著水平为1%的临界值,故拒绝原假设,即数据一阶差分后是平稳的。
表2 序列{Xt}的ADF检验
表3 序列{Yt}的ADF检验
(二)模型定阶
模型的阶数可以通过平稳序列样本自相关函数(ACF)和偏相关函数(PACF)来确定。若平稳序列xt是自相关函数是拖尾的且偏自相关函数是截尾的,则序列xt是AR序列;若平稳序xt的自相关函数是截尾的而偏自相关函数是拖尾的,则序列xt是MA序列;若平稳序列xt的自相关函数与偏自相关函数都是拖尾的,则序列xtt是ARMA序列。
一阶差分后序列{DYt}的自相关图和偏自相关图都没有明显的截尾性,故应建立ARMA模型。采用Akaike提出的AIC准则和Schwartz提出的SC准则,对序列{DYt}的ARMA模型进行逐步比较定阶。由于经济变量一般都为1阶或2阶ARMA模型,因此选取4种模型进行比较,这4种模型分别为ARMA(1,1)、ARMA(1,2)、ARMA(2,1)、ARMA(2,2)。
利用Eiews软件分别建立ARMA(1,1)、ARMA(1,2)、ARMA(2,1)、ARMA(2,2)模型,把4个模型的检验结果汇总列入表4。比较可知ARMA(1,1)模型的AIC值和SC值均最小,决定系数R2较大,所以选择ARMA(1,1)模型,并估计其参数,结果见表5。
表4 模型检验结果
表5 参数估计结果
最终建立的模型为 <\\Ww-329725167ea5\本地磁盘 (E)\jjsj\2013年排版\201308\130852.tif>
对于序列{DXt},选取ARMA(2,2)模型对农村居民家庭恩格尔系数趋势进行拟合,其参数估计及检验结果见表6,最终建立的模型为
<\\Ww-329725167ea5\本地磁盘 (E)\jjsj\2013年排版\201308\130853.tif>
表6 模型参数估计及检验结果
(三)模型预测
为检验模型的预测结果,用所建立的2个模型对其相应的恩格尔系数2009-2011年进行预测,得到的预测值与实际值相比(见表7),其误差在2.5%内,即模型的精度较高,其预测结果比较准确。进而利用这两个模型对2012-2013年的恩格尔系数进行预测,结果见表8。
三、结论
研究结果表明,通过对农村居民家庭恩格尔系数及城镇居民家庭恩格尔系数数据的分析,得到基于ARMA模型的恩格尔系数的分析与预测模型。我国居民家庭恩格尔系数均呈下降趋势,模型预测的结果表明其将在未来几年进一步降低。然而,我们也可以看出城乡的消费差距始终处于较高的水平且在未来几年无法得到根本性的缩小。此外,全国各地消费习惯不尽相同,例如在发达城市,居民食品消费更加注重饮食的营养性、饮食结构的科学性和食品搭配的合理性,休闲食品、营养保健食品的消费在整个食品支出的比重越来越大,因此基于恩格尔系数的分析结果有其局限性。所以我们在利用恩格尔系数进行分析时,对于不同地区、不同时期的居民生活水平,应注意到居民消费结构的变化对于恩格尔系数的影响并进行深入的研究,进而得到更加具体的结论。
参考文献:
[1] 王振龙.应用时间序列分析[M].北京:中国统计出版社, 2010.
[2] 迟道才、张特男、吴秀明、张兰芬. ARMA模型在太子河流域年降水量预测中的应用[J].沈阳农业大学学报,2012,(06): 607-610.
[3] 范丽、扈立家.基于ARMA模型的云南省城乡居民收入差距分析和预测[J].安徽农业科学,2012,(19): 10283-10285.
[4] 卢小丽、何光.基于ARMA模型的四川省农村居民收入趋势预测[J].中国农学通报,2012,(05):110-114.
[5] 冯盼、曹显兵.基于ARMA模型的股价分析与预测的实证研究[J].数学的实践与认识,2011,(22):84-90.
[6] 王少飞.用恩格尔系数衡量居民生活水平的可行性研究[J].统计研究,2002,(06):19-22.