APP下载

国内年度GDP数据的贝叶斯时间序列分析

2017-03-16

信阳农林学院学报 2017年1期
关键词:后验贝叶斯年度

曹 静

(华南农业大学 数学与信息学院,广东 广州 510642)

国内年度GDP数据的贝叶斯时间序列分析

曹 静

(华南农业大学 数学与信息学院,广东 广州 510642)

利用改革开放以来的年度GDP数据,采用基于马尔科夫链蒙特卡洛(MCMC)算法的贝叶斯随机搜索方法进行模型选择,建立时间序列模型。结果表明,贝叶斯时间序列模型的预测精度优于文献中经常采用的ARIMA模型,在分析我国总体经济发展规律和变化趋势方面具有较好效果。

国内生产总值;时间序列;贝叶斯模型选择;马尔科夫链蒙特卡罗法

国内生产总值(Gross Domestic Product,GDP)是度量国内所有常住单位在一定时期内生产和提供的最终产品或服务的重要总量指标。一般来说,GDP会受到多种因素的影响,因此运用结构性因果模型分析和预测GDP比较困难,而将历年的GDP数据作为时间序列进行分析,则具有较强的可操作性和重要的现实意义。

近年来,许多文献利用时间序列方法对我国GDP发展规律进行研究。例如,王维国等(2010)将基于贝叶斯推断的多个突变点判断理论用于我国GDP序列数据的分析[1]。郭景威、李宏斌(2012)对1970~2009 年我国的人均GDP 数据建立ARMA时间序列模型[2]。陈家清等(2012)以改革开放30 年来我国国民生产总值(GNP)环比基数建立自激励门限自回归模型,并对模型进行贝叶斯分析[3]。已有文献采用的方法多数只能确定时间序列模型的最高阶数,而且所得模型一般包含不显著的延迟变量。同时,当候选子模型的个数较多时,传统方法在计算上会显得相当乏力。本文采用George 和 McCulloch(1993)提出的一种贝叶斯随机搜索变量选择方法(Stochastic Search Variable Selection, SSVS)[4]对我国改革开放以来的年度GDP数据(见表1)建立一个层次贝叶斯混合模型,由示性变量的取值选择模型中的滞后项,具有最高后验概率的子模型即为最优模型,其计算过程比较复杂,需要采用Chen, M. H., Shao, Q. M.和Ibrahim, J. G(2000)提出的马尔科夫链蒙特卡洛(Markov chain Monte Carlo, MCMC)模拟算法[5]对模型进行估计和选择。

1 国内生产总值

《中国国民经济核算体系(2002)》采纳联合国1993年公布的《国民经济核算体系》(SNA)的基本核算原则、内容和方法,因此1952年以来的年度GDP数据时间序列具有可比性。

表1 1978~2013年中国国内生产总值年度数据 单位:亿元

注:数据来自于国家统计局网站(www.stats.gov.cn)、《中国统计年鉴》和国家统计数据库(http://219.235.129.58)。

2 自回归模型的贝叶斯分析

利用基于MCMC算法的贝叶斯随机搜索模型选择方法,建立GDP年度数据序列的自回归AR(p)模型。设{xt}为原始数据, {yt}是对{xt}进行对数变换和一阶差分变换后的数据序列,它满足

yt=φ1yt-1+φ2yt-2+…+φpyt-p+εt

(2.1)

Y=Xφ+ε.

(2.2)

令Y0=(y0,y-1,…,y1-p)'是序列{yt}的初始值。我们视这些初始值为未知参数,并假定Y0的先验分布服从正态分布,即

Y0~Np(μ,∑).

(2.3)

引入变量γj,其取值为0或者1。变量γj的作用是当所选择模型没有包含yt-j项时,则γj=0;当所选择模型包含yt-j项时,则γj=1。假设

(2.4)

P(γj=1)=Pj,P(γj=0)=1-Pj.

(2.5)

Pj可被视为yt-j包括在模型中的先验概率。将(2.4)式改写成矩阵形式,有

φ|γ~N(0,DγRDγ),

(2.6)

这里γ=(γ1,…,γp)',R是先验相关矩阵,Dγ=diag(d1τ1,…,dpτp) 。若γj=0,则dj=1;若γj=1,则dj=cj。R一般取R=1或者R∞(X'X)-1。假定在γ给定条件下σ2的先验分布是一个逆Gamma分布,即

(2.7)

为了简化计算,选择υγ=υ和λγ=λ 。由贝叶斯原理,γ的后验分布为

π(γ|D)∞π(y|γ)π(γ),

(2.8)

3 年度GDP数据分析

3.1 年度GDP的贝叶斯分析

将SSVS方法应用到1978~2013年我国GDP数据序列,尝试利用MCMC算法模拟得到该时间序列数据的最大后验概率模型。表2是由贝叶斯SSVS方法得到的后验概率较高的几个模型及其后验概率。表3列出了根据模拟数据拟合的系数向量φ和变量γ的估计值。图1是由SSVS方法得到的最佳模型的参数φ1和相应的示性变量r1`的模拟轨迹图。

表2 遴选模型的滞后项及其后验模型概率

表3 系数 和拉丁变量 的贝叶斯估计值(括号内是标准差)

图1 最佳模型的参数和相应的示性变量 的模拟轨迹图

因此1982~2013年GDP变换数据{yt}的最佳自回归模型为下列AR(1)模型

yt=1.0028689yt-1+εt.

(3.1)

变换为原始GDP数据{xt}后的最佳模型为

log(xt)=2.0028689log(xt-1)-1.0028689log(xt-2)+εt,

(3.2)

采用模型(3.2)对原始数据进行预测,计算得到的平均绝对预测误差为

3.2 年度GDP的ARIMA模型分析

对我国GDP年度数据的对数变换序列zi=log(xi)进行ARIMA建模分析。图2是我国1982~2013年GDP总值的时间序列图和自相关图形。

图2 1978年至2013年中国国内生产总值时序图和自相关图

从PACF图可以看出,我国GDP数据变换后的序列具有4阶自相关特征。根据时序图和ARIMA模型结果,选择ARIMA(4,1,1)模型对数据序列{zi}进行拟合,所得模型结果为

zt=1.7872708zt-1-1.001398zt-2+0.7193049zt-3-0.6653182zt-4+0.1601425zt-5+εt-0.5334912εt-1

计算得到的平均绝对预测误差为

它略大于贝叶斯SSVS方法的平均绝对预测误差。

4 小结

将贝叶斯随机搜索变量选择方法应用到自回归时间序列模型,在分层贝叶斯模型框架下,给出相应未知参数的先验分布以及后验分布,并讨论了该方法的一些超参数设置的问题。特别地,我们将时间序列的初始值作为未知参数,使得整个贝叶斯推断基于初始值是无条件的。与ARIMA模型方法相比,本文所得最佳模型滞后项少且预测精度较高,说明本文方法可以更好地分析和预测我国GDP年度总量的发展趋势。

我们使用数据驱动(Data Driven)方法分析GDP数据,采用基于MCMC算法的贝叶斯方法建立我国GDP数据的时间序列模型,该模型的意义在于从定量关系上刻画GDP的发展规律和趋势并可用于短期预测。从模型结果可以看出,我国GDP在短期内将继续呈现持续增长的趋势,这符合我国GDP 发展现况。

需要指出的是,由于GDP的短期高增长是以资源的过度投入和环境的破坏为代价的,因此它的长期成本要高于正常的均衡增长。这说明中国经济在高速增长的同时还会遇到环境治理、国际金融危机等不确定因素的影响, 因此不能一味地追求每年都达到较高的经济增长速度, 要综合考虑未来几年的发展环境,制定科学合理的经济发展战略。

[1] 王维国,王 霞,颜 敏.时间序列多个突变点的贝叶斯推断——对我国GDP数据的实证分析[J].数学的实践与认识,2010(9):45-53.

[2] 郭景威,李宏斌.中国人均GDP时间序列的实证分析与预测[J].经济论坛,2012(3):9-12.

[3] 陈家清,张智敏,王仁祥.基于贝叶斯自激励门限自回归模型的中国GNP经济分析[J].统计与决策,2012(13):28-31.

[4] George E I,McCulloch R E, Variable selection via Gibbs sampling[J].Journal of American Statistical Association,1993(423):881-889.

[5] Chen M H,Shao Q M,Ibrahim J G.Monte Carlo methods in Bayesian computation[M].New York, Springer, 2000.

(编辑:唐 芳)

Bayes Time Series Analysis of Domestic Annual GDP Data

CAO Jing
(School of Mathematics and Information, Agricultural University Of South China, Guangzhou 510642, China)

Since the reform and opening-up of China's annual GDP data,in this paper, a Bayesian stochastic search method based on Markoff Montecalo (MCMC) algorithm is used to select the model,and set up time series model. Data analysis results show that, Bayes time series model is superior to the ARIMA model which is often used in the literature. It has a good effect on the analysis of the law of economic development and the trend of change in China.

GDP; time series; Bayes model selection; Markov Chain Monte Carlo(MCMC)

2016-07-12

教育部人文社会科学研究青年基金项目(15YJC790004).

曹 静(1981-),女,四川简阳人,讲师,硕士,研究方向:农村产业经济与制度经济、数理金融统计.

F224

A

2095-8978(2017)01-0035-04

猜你喜欢

后验贝叶斯年度
年度新锐之星
年度创意之星
年度
基于贝叶斯解释回应被告人讲述的故事
基于贝叶斯理论的云模型参数估计研究
一种基于最大后验框架的聚类分析多基线干涉SAR高度重建算法
基于贝叶斯估计的轨道占用识别方法
基于互信息的贝叶斯网络结构学习
基于后验预测分布的贝叶斯模型评价及其在霍乱传染数据中的应用
IIRCT下负二项分布参数多变点的贝叶斯估计