影响公路客运量的因素分析
2015-12-10纪跃芝胡凡李纯净王纯杰
纪跃芝 胡凡 李纯净 王纯杰
摘要:本文选取了1978—2011年吉林省公路客运量及相关因素原始数据,分阶段建立回归模型,分析改革开放34年来公路客运量与相关因素之间的关系,并且从经济学角度对所建立的模型给出了合理的解释。
关键词:分段回归;显著性检验;回归诊断
中图分类号:G642.3 文献标志码:A 文章编号:1674-9324(2015)33-0073-03
一、前言
研究从改革开放至今的公路客运量发展变化,可以从国民经济发展的一个侧面了解到二十多年来的交通运输、公共事业建设、人民生活水平、社会生产、流通、分配、消费各环节协调发展等诸多现实经济问题,提升人们对经济发展的认识。
本文以公路客运量作为因变量y(万人),以地区人口x1(万人)、地区生产总值x2(亿元)、年人均可支配收入x3(元)、居民消费价格指数x4、道路路线里程x5(公里)、铁路客运量x6(万人)为影响公路客运量的主要因素,收集整理了1978—2011年吉林省公路客运量及相关因素原始数据,分阶段建立回归模型,分析改革开放34年来公路客运量与相关因素之间的关系,并且从经济学角度对所建立的模型给出了合理的解释。数据来自《吉林省统计年鉴2012》。
二、模型的确立及阶段的划分
(一)变量间相互关系分析
为了对34年来公路客运量的波动情况有一个全面了解,图1是各因素随年代变化的散点图。图2是两两因素比较的散点。
从中可以看出,数据呈整体上升趋势且有一定的规律性,大部分变量之间呈现出了线性关系,简单的直线回归并不能很好反映出数据的大致趋势。
从整体来看,随着时间的推移,各因素都呈现上升趋势,只是不同时期增长的速度明显不同。改革开放最初十年,各因素增速缓慢。1990年到1996年间,邓小平同志的南巡讲话对中国的经济改革与社会进步起到了关键的推动作用,使得中国经济骤然升温,公路客运量增速加快。1997年爆发的亚洲金融危机,使整个亚洲经济发展遇到了重大挑战,1997—1999年公路客运量增速放缓。从1998年开始,为应对亚洲金融危机,中央政府实施了以扩大内需为主的一系列宏观调控政策,公路客运量增加迅速。
为了更具体的考查变量之间的关系与规律性,我们用spss软件对数据作进一步相关分析,观察变量间的相关性,结果表明公路客运量与总人口、地区生产总值、平均每人全年可支配收入,居民消费价格指数、道路路线里程、铁路客运量的相关系数分别是0.865,0.967,0.980,-0.216,0.958,-0.708。由此可见公路客运量与总人口,地区生产总值,平均每人全年可支配收入,道路路线里程有高相关度性,与消费价格指数相关性较小。说明消费价格指数对公路客运量无显著影响,当然仅凭相关系数的大小是不能决定变量的取舍的,在初步建模时还是应该包含的。公路客运量与铁路客运量呈负相关,这是符合经济意义的,改革开放至90年代末,我国居民的收入还很低,一般认为乘了汽车就乘不了火车,所以呈现负相关,而在20年代以后,国民收入明显提高,乘坐汽车也可以乘坐火车,所以两者负相关不特别显著,仅为0.708。
(二)模型的确立
将原始数据取对数,做两两比较的散点如图3。
从图3可以看出,除因素x4,x6外,其他因素之间呈现明显的线性相关关系。因此,采用柯布—道格拉斯(Cobb—Dauglas)函数描绘公路客运量与相关因素之间的关系(简称C-D模型),数据取对数,建立线性回归模型。
(三)阶段的划分
从前面的简单分析已经知道,公路客运量增长趋势是分阶段的。由图1和图2不难发现,公路客运量的增长趋势分成两个阶段比较恰当。本文采用常用的AIC准则。具体定义如下:
基于1978-2011年对数数据,以及图1、图2,分别考虑以下两种情形:单个总体(不分段)、两个总体(分两段)。计算结果见表1和表2。
结果表明:两阶段情况下,AIC的值达到最小,R2的值达到最大,所以认为分成1978—1997年,1998—2011年两个阶段比较合理。
三、按阶段建立最优C-D模型
利用S-PLUS软件。根据建立的回归方程,计算预测平方和PRESS、赤池信息量AIC、残差标准差及自相关系数,进行比较。
(一)第一阶段:1978-1997年最优回归模型
取显著性水平α=0.05,经过比较,在通过回归方程和回归系数的显著性检验的方程中,均通过检验且指标最优的两个模型如表3所示:
从表3中可以看到,各项对应指标相差无几。
下面通过比较两者的方差扩大因子、绝对值最大的删除化残差、最大库克距离和最大杠杆值来选取最优自变量,以进一步确定这两个回归模型的优劣,结果见表4。
由表4不难看出,模型一中各因素之间不存在多重共线性,变量中也不存在异常值,模型二中因素之间存在多重共线性,因变量中存在异常值。因此,两者比较,模型一最优。
显著性检验结果如下:
(1)F=143.294,P值=0.000,复相关系数R=0.987,决定系数R2=0.974,说明x3,x4,x5,x6整体对影响显著。
(2)在回归系数的显著性检验中,p值均小于0.05,即每个变量对因变量影响显著。
(二)第二阶段:1998—2011年最优回归模型
做法同上。第二阶段:1998—2011年最优回归模型的最优模型为lny=11.0405+0.6678lnx2-0.5979lnx3
回归诊断结果如下:
(1)F=649.561,P值=0.000,说明回归方程通过了显著性检验,x2,x5作为整体,对y影响显著。复相关系数R=0.996,决定系数R2=0.991,说明回归方程高度显著。
(2)回归系数的显著性检验中,p值也均小于0.05,说明每个变量对因变量影响显著。
四、结论
从上述模型出发,可以清晰地了解改革开放以来吉林省公路客运量与其相关因素之间的关系。
1.改革开放以来,各因素都呈上升趋势,而且不同阶段影响公路客运量的因素有所不同,但是无论哪一阶段,道路路线里程都对公路客运量具有显著影响。
2.在1978—1997年改革开放最初的20年间,改革开放使我省经济增长呈现复苏态势,人均收入稳步增长,越来越多的人走出家门,或旅游,或打工,运输流通量也相应提高,致使公路客运量与铁路客运量增加,使得两者呈现相互竞争增长趋势。
居民消费价格指数,是一个反映居民家庭一般所购买的消费商品和服务价格水平变动情况的宏观经济指标,是用来反映居民家庭购买消费商品及服务的价格水平的变动情况,这一时期,居民消费价格指数的增长抑制了公路客运量的发展。
3.在1998—2011年的回归方程中,地区生产总值和道路路线里程成为影响公路客运量的两个因素。可以看出,随着地区生产总值的增长,公路客运量作为一项重要收入在地区生产总值中占有很大比例,影响着地区经济发展。
这一时期,道路路线里程x5的指数已经由-5.0952变为-0.5979,表明随着道路路线里程的增加,公路客运量仍在较少,但是,道路路线里程的增长对客运量的影响在明显减弱。一方面,说明随着人们生活水平的提高,乘长途汽车进行长途旅行成为了可能。另一方面,随着交通方式多样化(轻轨、高铁、动车),人们对于出行的选择也多样化,对于远途旅行,人们更青睐于选择高铁、动车、航空等方便、快捷、安全的交通工具。
在本文中,没有选取民航客运量作为影响公路客运量的因素,是基于两方面的考虑,一方面,吉林省的航空业是近几年才发展起来的,而且,由于机票票价相对来讲很贵,我省居民收入还比较低,一般人出差或旅游坐火车、汽车较多,因此,民航客运量对公路客运量不会有太大影响。另一方面,在《民航客运量及相关因素分析》(纪跃芝,数学的实践与认识,2012年12月)一文中[3],民航客运对铁路客运的冲击很小,因此,对公路客运的冲击更小。
总之,将34年来吉林省公路客运量及其影响因素的增长趋势分成两个阶段是合理的,即分成1978—1997年,1998—2011年,由此可见吉林公路客运量的发展历程。
参考文献:
[1]史宁中,陶剑.对中国经济增长趋势与人均生产总值、收入以及消费之间关系的研究:1978-2002[J].统计与信息论坛,2005,(6).
[2]何晓群,刘文卿.应用回归分析[M].北京:中国人民大学出版社,2004.
[3]纪跃芝,邓波,秦喜文.民航客运量及相关因素分析[J].数学的实践与认识,2012,(24).