基于Bootstrap方法对我国民用汽车拥有量的实证分析
2016-04-08陈彩张健
陈彩 张健
摘 要:随着我国经济的蓬勃发展、能源生产的压力、全国公路建设、国家税收政策的调整、以及公路客、货运量的变化,人们越来越关注我国民用汽车拥有量与经济、能源、公路建设、税收、公路客货运量的关系。本文选取了我国民用汽车拥有量、人均国内生产总值、能源生产总量、全国公路里程、各项税收、公路客运量、公路货运量这几项指标,依据我国1990-2012年的相关数据,基于Bootstrap方法对我国民用汽车拥有量的影响因素进行了回归分析,结果表明,该模型优于采用逐步回归法的多元线性回归模型,预测误差率为0.14%;我国民用汽车拥有量主要受各项税收和公路货运量的影响最大。
关键词:民用汽车拥有量;Bootstrap方法;回归分析;预测
一、引言
改革开放以来,我国经济有了快速的发展,人们的生活水平不断提高。2001年入世以来,经济飞速的发展刺激了国内消费者的购买欲望,尤其在汽车方面。对我国民用汽车拥有量的分析一直很受关注,邝国良、曾铁成(2007年)采用1991~2005年中华人民共和国国家统计局公布的相关统计数据,得出广东省的民用汽车拥有量与其人均GDP和成品钢铁产量存在着一定的函数关系。韩雪、李潜(2012年)根据近二十年来国内多项经济指标,得出消费品零售总额、客运总量、石油消费量、金融机构货币供应量对我国民用汽车拥有量有显著影响。这些方法虽然能有效的找到显著的影响因素及它们之间的关系,但对于预测问题,都有一些缺陷,因为回归模型需要大量的历史数据,基于小样本进行回归分析存在的预测误差偏大。
Bootstrap方法可以避免上述方法的不足,能充分利用小样本数据,通过有放回的重抽样,扩大样本容量,同时能提高参数估计的精度。因此,本文将Bootstrap方法应用于回归分析中,对我国民用汽车拥有量与人均国内生产总值等变量之间的关系建立回归模型,并对我国民用汽车的拥有量进行了现状及预测分析。
二、我国民用汽车拥有量的现状分析
近年来,中国经济以年均10%以上的速度增长,稳定的宏观环境与良好的消费预期使得我国民用汽车拥有量呈现出前所未有的繁荣景象。国家和地区鼓励民用汽车消费政策的出台与实施,促使了相当一部分潜在购买力的释放,使得民用汽车拥有量大幅度提升。
在我国民用汽车拥有量中,载客汽车数量和载货汽车数量占据了绝大部分。民用汽车拥有量在1990年到2005年呈现较为缓慢的增长,在2006年以后呈现快速增长,尤其是与2011年相比,2012年增长了1576.77 万辆,其增长量几乎是1990年我国民用汽车拥有量的3倍。从民用汽车增长量来看,我国民用汽车拥有量的增长量在从1993年到1996年呈现下降趋势,从1997年到1998年又出现新一轮的增长量的下降趋势,从2008年到2009年增长量急速上升,从2010年开始到2013年,每年的增长量基本持平。
三、我国民用汽车拥有量的实证分析
民用汽车拥有量与经济发展、能源产量、全国公路里程、税收政策以及公路客货运量有着密切的联系。人均国内生产总值是衡量经济发展的重要指标,而直接影响汽车市场的是经济因素;石油、电力等能源的产量将直接影响民用汽车拥有量;公路建设的里程数目的多少、国家的税收政策也将影响民用汽车拥有量;交通运输中的公路客运量、公路货运量是对现实需求的直接反应,也是汽车市场发展的直接动力。通过定性分析,本文选取了1990~2012年间的人均国内生产总值(元)、能源生产总量(万吨标准煤)、全国公路里程(万公里)、各项税收(亿元)、公路客运量(万人)、公路货运量(万吨)六个指标作为影响我国民用汽车拥有量的主要解释变量,这六个指标分别用X1-X6表示。Y为被解释变量,表示我国民用汽车拥有量(万辆)。为了降低数据的数量级,缓解时间序列的异方差性,对各指标进行自然对数变换处理,建立多元线性逐步回归模型和引入bootstrap方法的回归模型进行分析。
(一)逐步回归法的回归模型
本文首先设定为如下的对数模型,进行回归分析。
lnYt = β0 + β1 lnX1 t + β2 lnX2t + β3 lnX3t + β4 lnX4t + β5 lnX5t + β6 lnX6t + μt (1)
运用R软件,选取1990~2011年的数据作为训练样本,建立回归模型。用2012年的数据作为检验样本,用于检验模型的预测效果。通过普通最小二乘法,得到的回归方程如下:
LnY =-4.700+0.116LnX1-0.049LnX2-0.024LnX3+0.587LnX4 -0.466LnX5+0.923LnX6
t值 -2.336 1.113 -0.262 -0.316 7.260 -1.784 4.925
P值 0.0337 0.2832 0.7965 0.7567 0.0000 0.0947 0.0002
R2=0.9989,F =2242,P =0.000
从上述结果可以看出,R2为0.9989,表明模型的拟合优度非常高;F检验对应的P值为0.0000,表明解释变量整体对我国民用汽车拥有量具有显著影响。但由于X1、X2、X3对应的t统计量的P值都相当高,不能通过显著性检验,因此初步判断解释变量之间可能存在严重的多重共线。为消除多重共线性,进行逐步回归分析,逐步回归方程如下:
LnY =-6.08661 + 0.59097LnX4 -0.20006 LnX5+0.77424 LnX6
t值 -6.343 14.487 -1.705 9.576
P值 0.0000 0.0000 0.095 0.0000
R2=0.9988,F =4818,P =0.000
(二)引入Bootstrap方法的回归模型
Bootstrap方法是通过对数据样本进行随机的、等概率的、有放回的重抽样,得Bootstrap样本组,以扩大样本容量,从而进行相应的统计推断。本文将Bootstrap方法应用到回归分析中,主要是通过计算参数估计的均值进行统计预测,具体算法如下:
Step1:从原始样本的数据对中,以1/n的等概率进行有放回的Bootstrap抽样,得到一个样本容量为n的Bootstrap样本。新的数据对也是由原始样本数据对组成,其中的样本可能重复出现也可能不会出现。进行重复抽样,直至得到B个Bootstrap样本。
Step 2:运用最小二乘法对每个Bootstrap样本进行回归分析,得到每个回归方程的系数β^ij,i=1,……7,j=1,……B。
Step 3:将第二步得到的β^ij,计算均值:
β^i=1B∑Bj=1β^ij
即得到基于Bootstrap方法的回归模型的参数估计值。
按照上述步骤,运用R软件得到基于Bootstrap方法的回归方程为:
LnY =-4.624+0.113LnX1-0.131LnX2+0.016LnX3+0.576LnX4 -0.462LnX5+0.978LnX6
(三)预测及两种方法结果的比较
在前面两小节,我们得到了我国民用汽车拥有量的回归方程,利用该方程可以对2012年的民用汽车拥有量进行预测,并比较逐步回归法和引入Bootstrap方法的效果。结果如下表:
从上表的对比结果可以看到,用Bootstrap方法比用逐步回归法得到的预测值更精确,说明基于Bootstrap方法建立的回归模型有更好的预测效果。综上分析,基于Bootstrap方法的回归模型对我国民用汽车的拥有量进行预测,取得了很好的预测效果,预测误差率仅为0.14%。我国民用汽车拥有量主要受各项税收和公路货运量的影响最大。该方法能更好地解释模型中的参数,同时提高了模型的准确度和预测精度。
四、结论
Bootstrap方法是通过重抽样的方法扩大样本容量,构造足够多的Bootstrap样本,对参数进行估计。Bootstrap方法能有效地弥补逐步回归法的不足,提高预测的精度,因此用Bootstrap方法对上述回归模型进行参数估计比采用逐步回归法更可靠。基于Bootstrap方法的回归模型对我国民用汽车的拥有量进行预测,取得了很好的预测效果。我国民用汽车拥有量主要受各项税收和公路货运量的影响最大。对我国民用汽车拥有量准确的分析和预测,可为交通管理部门提供更可靠的信息,及时制定出有效的措施,更好地规划交通。(作者单位:1.武汉大学数学与统计学院;2.河北经贸大学数学与统计学院)
参考文献:
[1] 邝国良,曾铁城,关于广东省民用汽车拥有量的计量经济学模型及其检验和预测,工业技术经济,2007
[2] 韩雪,李潜.关于我国私人汽车拥有量的计量经济学模型及其检验和预测[J].工业技术经济,2012,(9)
[3] 钱世超,中国轿车市场结构与企业行为研究, 上海社会科学院研究生毕业、学位论文,2005
[4] 李晓童,夏明月,林善冬,基于Bootstrap方法对北京空气质量的回归分析,河北北方学院学报,2014