APP下载

中国各省市旅游业影响因素的实证分析

2019-10-06陈清娟饶婉莹

新财经 2019年11期
关键词:多元线性回归旅游业影响因素

陈清娟 饶婉莹

[摘 要]随着居民生活水平的提高,旅游业迅猛发展并成为目前最具活力的产业之一。为了探究我国各省市旅游业影响因素的问题,文章利用国内旅游业1998—2016年的相关数据建立多元线性模型并基于EViews软件对模型进行回归、估计、检验、修正以及预测。结果验证了模型的有效性并得出了国内游客人数,住宿和餐营业增加值,居民消费水平是影响国内旅游业收入的主要因素的结论,从而为有关部门制定规划提供参考。

[关键词]旅游业;多元线性回归;影响因素

[中图分类号]F592.7

1 前 言

旅游业作为我国最具朝气的新兴产业之一,在20世纪90年代中后期开始得到跨越式发展,目前已经形成了世界上最大的国内旅游市场。面对旅游业带来的积极收益,地方政府期望通过加大投资旅游产业来带动区域经济转型升级。为了保证投资能带来明显的效益,使之成为各个省市新的经济增长点,需要找到影响旅游业发展的因素,对症下药,从而在激烈的旅游市场竞争中保持优势。

因此,文章对中国各省市的旅游业影响因素开展定量的研究对提升地方旅游产业质量,实现资源要素的高效配置具有一定的现实意义。

2 文献综述

目前,国内学者已经采用了不同的模型方法对旅游业影响因素的相关问题展开了诸多研究。如黄芬芬和胡宏昌[1]利用主分量曲线回归的方法建立了影响中国旅游收入因素的模型。具体到省份的研究,甘俊伟等[2]基于DEMATEL方法确定了对川藏旅游产业竞争力起关键性作用的因素。申鹏鹏等[3]等提出DEA-Malmquist指数二次分解模型并将其应用于江苏省旅游产业影响因素的探究。王兆峰和霍菲菲[4]基于VAR模型对湖南武陵山片区旅游产业生态效率影响因素进行了分析。

此外,就应用研究方面而言,学者们已经将多元线性回归模型应用在各个研究领域。比如,宋淑丽和齐伟娜[5]基于多元线性回归对黑龙江省农村剩余劳动力转移的问题进行了研究。付倩娆[6]通过在线样本更新的多元线性回归建立PM2.5含量预测模型。张朋远[7]将它用来探究影响职工工资的内部因素以及工资提升空间的影响因素。张福旺和苑会娟[8]通过散点图对影响空腹血糖的主要因素进行分析和确定。

3 理论模型

本文采用多元线性回归模型进行分析,它是由一组独立解释变量值X1,X2,…,XK預测一个或多个被解释变量Y的一种统计工具,反映了因变量随自变量变化时的平均变化程度。在满足经典假定的条件下,基于最小二乘法的原理可以建立有K-1个解释变量的多元线性回归模型的一般形式:

Yi=β0+β1X1i+β2X2i+…+βkXki+μi

i=1,2,…,n (1)

其中n是该多元回归模型的样本容量,k是它的解释变量个数,当k=1时,它被称为一元线性回归模型;当k≥2时,它被称为多元回归模型。μ是随机干扰项,代表了多数影响变化的微小因素集合,它是不能由现有变量决定的部分。β0是回归常数,在参数估计过程中该变量的样本观测值一直取1,因此通常被看成是一个虚变量的系数。βk是偏回归系数,可以解释为在其他因素不变化的条件下,解释变量Xj(对任意i的xji)的单位变动对被解释变量产生βj个平均单位值的影响。

4 数据来源及指标选取

该部分选取的1998—2016年的样本数据主要分为两种,其中宏观经济类数据来自《中国统计年鉴》,旅游类相关数据主要来自国家旅游局。另外,选取国内旅游收入Y(亿元)为被解释变量并选取几个相对重要的指标作为解释变量。它们分别是:

(1)铁路营运里程X1(万公里):国内旅游中占据主导地位的是铁路交通,因此本文选择铁路营运里程来描述国内旅客的远途出行情况和旅游目的地的可到达程度。

(2)就业人数X2(万人):就业人口表示有经济来源的人口数量,这些人更有能力承担旅游的花费,所以也将它作为一个解释变量。

(3)国内游客人数X3(万人次):国内游客人数指我国大陆游客一年内在国内旅游的总人次,它从数量上直接表现了国内旅游的规模和水平。

(4)住宿和餐营业增加值X4(亿元):旅途中的衣食住行是消费者必须支付的并且占据很大比重的花费。

(5)居民消费水平X5(元):居民的消费水平被认为是居民出游次数以及出游时消费能力高低的决定性因素。

(6)城镇人口X6(万人):城镇居民便捷的交通条件以及日益增长的精神需求增加了出行旅游的概率。

5 实证分析

5.1 模型的建立

为了研究影响旅游业发展的因素,收集了1998—2014年的相关旅游数据进行实证分析。根据Y与X1近似呈现线性关系的散点图,其余5个变量的散点图与X1类似,构建多元线性回归分析模型:

Y=C+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+μ (2)

利用EViews软件进行参数估计,可以得到模型估计的结果为:

Y= -136282.2+295.2786X1+2.291275X2+0.063358X3-1.938149X4+2.640438X5-0.826431X6

s=(22025.78)(258.7339)(0.386828)(0.008299)(0.312751)(0.227058)(0.141686)

t=(-6.187396)(1.141244)(5.923242)(7.634534)(-6.197094)(11.62894)(-5.832820)

R2=0.999794 S.E=162.4829 F=8083.889 DW=2.071798

由估计结果可以得出拟合系数R2为0.999794,修正的拟合系数为0.999670,F统计值为8083.889,这说明模型总体是显著的而且拟合的效果较好。当给定显著性水平α=0.05时,t分布表显示其临界值t0.025(10)=2.2281,可以看出X2,X3,X4,X5,X6都通过了t检验,这表明選定的这5个变量对国内旅游收入具有较好的解释作用。但是X1没有通过t检验,这种结果可能是由多重共线性引起的。

5.2 多重共线性检验

文章利用相关系数矩阵法来判断该模型是否存在多重共线性,可以发现各个解释变量的相关系数都在0.85以上(>0.8),因此可以判定该模型确实存在多重共线性。因此,采用逐步回归法对多重共线性进行修正,解释变量X1,X2,X6被剔除,因此模型修正为:

Y=C+β3X3+β4X4+β5X5+μ (3)

5.3 异方差检验

基于怀特检验法,本文对修正后的模型进行异方差检验。得到检验结果为nR2=15.87685,由于χ20.05(9)=6.919,χ20.05(9)=16.919>nR2=15.87685,因此模型中的随机误差项没有异方差性。另外,可以观察到nR2的相伴概率P值为0.0695,它大于给定的显著性水平α=0.05,则接受不存在异方差的原假设,因此无须用加权最小二乘法对其进行修正。

5.4 自相关检验

本研究利用杜宾—沃森检验法进行一阶自相关的检验可知DW值为1.957324。在给定显著性水平为α=0.05的条件下,因为dL=0.90

为了进一步验证结果,采用拉格朗日乘数检验法进行模型二阶自相关的检验,可以得出nR2的相伴概率(即P值)=0.8101>α=0.05的显著性水平,因此随机干扰项不存在自相关。此外,又因为RESID(-1)和RESID(-2)对应的P值分别为0.8711和0.8101,都大于显著性水平,也说明该模型不存在一阶和二阶自相关,因此不需要对其进行修正。综上,本文修正后的模型为:

5.5 经济意义检验

进一步对模型参数估计量在经济意义上的合理性进行检验。文章估计的参数β3=0.075891,表示国内游客每增加1万人,国内旅游收入增加0.075891亿元,说明游客数量对旅游收入的影响力度不大。β4=-3.271604表示当住宿和餐饮业增加值每增加1亿元,则旅游收入会减少3.271604亿元。说明旅游市场竞争激烈,投入过于饱和,反而会降低旅游业的收入。β5=2.440327表示居民消费水平每增加1元,会带动旅游收入增加2.440327亿元,说明消费对国内旅游收入的拉动作用很明显。

5.6 拟合优度检验

文章中可决系数0.999032和调整后的可决系数0.998809都比较高,说明该模型拟合的较好,即国内旅游收入的变动99.88%可以用国内游客人数,住宿和餐营业增加值,居民消费水平作出解释。

5.7 统计意义检验

可以看出F统计量的值为4473.347大于临界值F0.05(3,13)=3.41,故模型总体是显著的。但是这并不表示模型中每个变量的影响都是显著的,因此,有必要对每个解释变量进行显著性检验,即t检验。模型中X3,X4,X5的t统计量分别为5.012425,-18.24872以及7.332611,它们的绝对值都大于临界值t0.025(13)=2.1604,并且它们对应的P值分别为0.0002,0.0000,0.0000小于给定的显著性水平α=0.05。因此这几个解释变量都通过了t检验,说明国内游客人数X3,住宿和餐营业增加值X4,居民消费水平X5都对国内旅游收入Y具有重要影响,应保持在模型中。

5.8 模型预测

为了进一步检验该模型的准确性,本文利用我国旅游业2015—2016的数据进行预测,并与实际值进行比较。结合表1可以发现我国2015—2016年的旅游收入保持增长的趋势,并在2015,2016年分别达到33514.02亿元与37381.15亿元,这与实际值较为接近。因此该模型可以被认为是有效的并可以用来预估未来几年的旅游收入。

6 结论及建议

文章利用多元线性回归模型来研究我国旅游收入的影响因素并得到相关结论。

(1)国内游客人数,居民消费水平都与旅游收入呈现正相关的关系,而住宿和餐饮营业增加值则显示负相关,这显示了旅游业竞争激烈化,投入冗余的现象。

(2)铁路营运里程,就业人数,城镇人口这3个变量对旅游收入没有重要影响。因此各个省市在制定旅游业发展计划时可以降低在这些方面的投入。

(3)模型Y=-4415.391+0.075891X3-3.271604X4+2.440327X5对国内旅游收入具有较好的拟合效果,可以为相关人员在未来进行旅游收入预测时提供参考。

当然本文还存在一些不足之处,如由于数据缺失而使得研究仅限于进行到2016年,期望相关人员在今后可以收集到更多数据从而使得研究更加深入。

参考文献:

[1]黄芬芬,胡宏昌.中国旅游收入影响因素分析——基于主分量曲线回归[J].统计与管理,2015(2):46-48.

[2]甘俊伟,杨龙,李进军.基于DEMATEL的川藏旅游产业竞争力影响因素研究[J].干旱区资源与环境,2017(3).

[3]申鹏鹏,周年兴,张允翔,等.基于DEA-Malmquist指数二次分解模型的江苏省旅游产业效率时空演变及影响因素[J].长江流域资源与环境,2018.

[4]王兆峰,霍菲菲.基于VAR模型的湖南武陵山片区旅游产业生态效率影响因素分析[J].中南林业科技大学学报,2018,38(11):142-150.

[5]宋淑丽,齐伟娜.基于多元线性回归的农村剩余劳动力转移研究——以黑龙江省为例[J].农业技术经济,2014(4):104-110.

[6]付倩娆.基于多元线性回归的雾霾预测方法研究[J].计算机科学,2016,43(Z6):526-528.

[7]张朋远.基于多元线性回归模型下的工资及其提升空间确定的内部影响因素——以474位职员的工资为样本数据库分析为例[J].经贸实践,2018,240(22):46-48,50.

[8]张福旺,苑会娟.基于多元线性回归的空腹血糖影响因素分析方法[J].计算机科学,2018,45(S2):555-557

[9]白娜.影响现代旅游业发展的因素分析[J].中国市场,2016(25):233-234.

[10]刘超.区域旅游业竞争力评价模型的构建和影响因素研究——以北京市为例[J].中国市场,2015(29):59-63.

[11]张婷婷,李宏勋.基于因子分析法的我国沿海各省市旅游业竞争力比较研究[J].甘肃科学学报,2016,28(2):126-131.

[12]时浩楠.中国省域旅游业与城市化协调发展研究[J].合肥:安徽大学,2016.

[13]范恒瑞.中国省域旅游业主导性分析[J].南京:南京大学,2012.

[14]袁宇杰.中国旅游经济影响的省际差异与区域特征[J].山东青年政治学院学报,2012,28(1):114-119.

[15]王苡安.中国国内旅游业总收入的影响因素分析[J].中国集体经济,2019(2):14-16.

猜你喜欢

多元线性回归旅游业影响因素
云南出台20条措施,加快旅游业恢复
中国旅游业2017的风往哪吹?
基于组合模型的卷烟市场需求预测研究
基于多元线性回归分析的冬季鸟类生境选择研究
我国上市商业银行信贷资产证券化效应实证研究
环卫工人生存状况的调查分析
农业生产性服务业需求影响因素分析
村级发展互助资金组织的运行效率研究
基于系统论的煤层瓦斯压力测定影响因素分析
旅游业