APP下载

基于主成分回归的丽江国内旅游消费影响因素研究※

2019-12-13彭乃驰

武汉商学院学报 2019年5期
关键词:共线性丽江灰色

彭乃驰 党 婷

(云南大学旅游文化学院,云南 丽江674199)

世界旅游组织将旅游消费定义为游客使用或为其生产的产品和服务的价值。国内旅游消费作为旅游消费的一个重要组成部分,是促进经济增长的一个重要因素,对国内旅游消费影响因素的研究也是近年来旅游方面的学术研究热点之一。如文献[1]利用回归分析构建了旅游消费同收入等因素的函数关系。文献[2]利用VAR 模型考察了人口结构对旅游消费的影响。文献[3]用SYS-GMM方法分析出旅游消费与房价有正U 形关系。已有的研究认为国内旅游消费影响因素主要包含以下几方面:国内GDP、CPI、可支配收入、闲暇时间、客运量、房价、人口等。研究的方法主要有:多元线性回归模型、相关分析、主成分分析、VAR 模型与动态面板数据方法等。研究的被解释变量一般包含:国内旅游消费总量(即国内旅游总收入)或国内人均旅游消费。

地处云南的丽江是全国著名的5A 级风景名胜景区之一,有丽江古城、束河古镇与玉龙雪山等全国知名的景点。针对丽江国内旅游消费的影响因素,尝试作以下几方面的研究:1. 初步选取可能对丽江国内旅游消费有影响的21 个指标,并通过灰色关联度分析精简指标。2.对选择出来的指标利用主成分回归模型,从长期角度在定量上研究其与丽江国内旅游消费的关系。

一、研究方法

(一)灰色关联分析

灰色关联分析的基本思想是根据序列曲线几何形状的相似程度判定其联系的紧密性,其优点是对小样本、无规律数据也适用。设参考序列即被关联数据序列为X0(t),比较序列即关联数据序列为Xi(t),灰色综合关联度计算步骤如下:

1.计算绝对关联度

2.计算相对关联度r0i,所用公式与绝对关联度类同。只需Xi(t)将转换为

3. 计算综合关联度ρ0i=θε0i+ (1- θ)r0i,(i=1,…,m),θ 通常取0.5。

(二)主成分回归

主成分回归是将主成分分析与线性回归分析相结合的方法。主成分回归的基本思想可简单概括为:首先通过对经标准化处理的原始数据作正交变换产生若干个互不相关的新变量即主成分,根据方差的累积贡献率提取少数几个主成分并使其尽可能多的包含原始数据的信息;其次将得到的主成分作为自变量与因变量建立经典线性回归模型;最后将得到的回归模型中的变量还原为原始变量。主成分回归可以在一定程度上消除多重共线性的不利影响[4-5]。

本文的模型建立步骤为:

1.灰色关联分析。计算各个自变量与因变量之间的灰色综合关联度及自变量间的灰色综合关联度,对指标体系作精简。

2.相关性分析。再次分析所选自变量与因变量之间的线性相关性,线性相关性高说明建立线性回归方程是合理的。

3.多重共线性诊断。判定自变量间是否存在多重共线性。

4.主成分分析。对所选的因素作主成分分析,根据特征值大于1 的原则或方差的累积贡献率确定所提取的主成分个数,写出提取的主成分的的表达式,并计算主成分的得分。

5.利用主成分的得分建立因变量与所提取的主成分的经典回归方程。

6.利用因变量与所提取的主成分的回归方程及主成分的的表达式得出因变量与所选因素之间的长期均衡方程。

二、实例分析

(一)变量选取

相对于国内旅游消费来说,学者们对国内旅游需求的指标体系的研究更完善、所用的研究方法更丰富。如陶伟等总结出国内旅游需求的指标体系的两种分类方法,一是按宏观和微观分,二是按旅游流分[6]。旅游需求与旅游消费虽然在概念上并不完全等同,但是两者之间有着千丝万缕的关系:1.从经济学角度来看,需求包含消费需求与投资需求两部分,所以旅游需求包含了旅游消费,旅游消费是旅游需求的一个重要部分。2.从实际研究的被解释变量来看,两者的被解释变量有一定的重合,都有旅游总收入这个被解释变量。3.两者包含的影响因素指标有一定的重合,如国内GDP、可支配收入与人口等既是旅游需求的影响因素,也是旅游消费的影响因素。因此,本文在研究旅游消费的影响因素时,指标的初步选取参考了旅游需求的指标体系。

取丽江国内旅游消费总量(即丽江国内旅游收入)为被解释变量。对解释变量的选取,考虑到旅游消费与旅游需求的密切关系,借鉴相对较完善的国内旅游需求影响因素的指标体系,结合已有的国内旅游消费影响因素指标,并考虑数据的可收集性,从客源地经济、收入、人口、交通、社会保障状况,目的地经济、人口、交通、旅游资源、城市建设、环境保护状况方面进行指标的初步选择。客源地(以全国平均状况代替)初步选择8 个指标为:全国GDP、CPI、农村居民人均纯收入、城镇居民人均可支配收入、总人口、旅客运输周转量、私人汽车保有辆、城镇职工基本养老保险人数。目的地(丽江)初步选择13 个指标为:丽江地区GDP、CPI、公共财政预算支出、年末全市常住人口、全市城镇居民人均可支配收入、公路旅客周转量、机场保障航班、A 级旅游景点数、城市道路长度、建成区绿化覆盖率、城市建成区面积、城镇垃圾处理率、城镇生活污水集中处理率。依据数据的可获取性,收集了被解释变量及初步选择的21 个指标2008-2018 年的数据,数据来源于历年丽江统计公报与中国统计公报。

(二)主成分回归模型的建立

1.灰色关联分析。指标过多会使模型的建立、问题的分析变得复杂,且容易产生多重共线性、伪回归等不良后果,故采用灰色关联分析对初步选择的指标进行筛选。分析过程利用MATLAB 软件编程完成。首先,计算每个指标与被解释变量之间的灰色综合关联度,以0.4 为阈值,文中初步选择的21 个指标均入选。其次,以0.7 为阈值,对指标进行归类,共归为6类。最后,在每类中以与因变量灰色关联度最高为标准选择一个代表性指标,共选出6 个代表性指标。经该方法选择出来的6 个指标为:丽江城市道路长度/(公里)、公共财政预算支出/亿元、城镇生活污水集中处理率/%,全国城镇职工基本养老保险人数/亿人、总人口/亿人、CPI。将取出的6 个指标依次记为X1,X2,……X6,它们与被解释变量的灰色综合关联度分别 为:0.6040 、0.5335 、0.6030 、0.5255 、0.5026、0.5331。

2.相关分析。对丽江国内旅游收入与通过灰色关联分析选取出来的6 个指标作相关性分析,结果见表1。

表1 相关分析结果

从相关分析结果可见,被解释变量与通过灰色关联分析选取出来的6 个指标的Pearson 相关系数中有5 个大于0.6,它们与Y 有显著的线性相关性,只有X6与Y 不存在明显的线性相关性。由于本文所建的主成分回归模型本质上是线性回归模型,故后续建模过程中将指标X6剔除。相关分析结果表明:以X1,X2,……X5为解释变量建立主成分回归模型是合理的。

3.多重共线性诊断。使用灰色关联分析可精简指标体系,但是由于指标归类时阈值的确定具有一定的主观性,所以使用灰色关联分析不能完全消除解释变量间存在的多重共线性问题。因此,建立回归模型时仍需判断解释变量间是否存在多重共线性问题。多重共线性可用条件数法判定[7]。

条件数法:特征根λi的条件数,其中λm为最大特征根式。0<k<15 无多重共线性,10≤k<100 有较强多重共线性,k≥100 有严重多重共线性。

被解释变量与五个解释变量直接进行最小二乘多元线性回归,采用条件数法判定多重共线性,结果如表2。

表2 共线性诊断

条件数K6=3994.207≥100,表明变量间有严重多重共线性。虽然直接多元线性回归模型的调整后R 平方高达0.945,但是模型参数失去其意义,不能用来进行经济解释。为消除解释变量的多重共线性,故采用主成分回归模型进行建模。

4. 主成分分析。对五个解释变量作主成分分析,按特征值大于1 提取主成分,5 个特征值中只有第一个λ1=4.603>1,故只需提取一个主成分。第一主成分的贡献率为92.061%,已经包含了所有解释变量的绝大多数信息。方差贡献率见表3。

表3 方差贡献率

提取的第一主成分的表达式为:

其中ZXi为Xi标准化的数据。第一主成分中每个ZXi的系数都在0.3~0.5 之间,系数都较大,因此第一主成分同时包含了所有解释变量的重要信息。

5.主成分回归方程的建立。将被解释变量与提取的第一主成分直接进行最小二乘多元线性回归可得:

将(2)式代入(3)式,得

由该方程知,从长期来看丽江城市道路长度、公共财政预算支出、城镇生活污水集中处理率及全国城镇职工基本养老保险人数、总人口对丽江国内旅游消费的增长量都有正向影响。在其余四个解释变量不变的情况下,从第一个解释变量起改变某个变量一个单位,长期来说分别会使丽江国内旅游消费的增长量同向改变1.01、1.39、6.05、73.26、301.63 亿元。

三、结论与建议

利用灰色关联分析与主成分回归模型研究丽江国内旅游消费情况得出如下结论:(一)从初步选择的21 个指标中,发现丽江城市道路长度、公共财政预算支出、城镇生活污水集中处理率及全国城镇职工基本养老保险人数、总人口与丽江国内旅游消费有较强的相关性。(二)丽江国内旅游消费的增长量与丽江城市道路长度等五因素之间存在长期均衡关系。丽江城市道路长度等五因素对丽江国内旅游消费的增长量有长期同向影响。在其余四个解释变量不变的情况下,从第一个解释变量起改变某个变量一个单位,长期来说分别会使丽江国内旅游消费的增长量同向改变1.01、1.39、6.05、73.26、301.63 亿元。

基于以上结论的相关建议:(一)全国城镇职工基本养老保险参保人数、全国总人口对国内旅游消费的增长量有重要的正向影响,所以建议国家一是进一步关注老年人养老问题,加快养老保险改革的步伐,二是在二胎生育政策的基础上进一步放开生育政策,从而对国内旅游消费及国家经济状况产生积极影响。(二)丽江城市道路长度、公共财政预算支出、城镇生活污水集中处理率都是影响丽江国内旅游消费的重要因素,在这三个因素的共同作用下,将会对丽江国内旅游消费的增长量产生可观的影响。所以建议丽江市政府在不影响收支平衡的情况下,可以尽量增加预算支出,并且预算支出可以向城市建设方面的城市道路长度、城镇生活污水集中处理率两个方面作一定的倾斜。

猜你喜欢

共线性丽江灰色
丽江三朵节
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
银行不良贷款额影响因素分析
浅灰色的小猪
丽江的荒
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
灰色时代
她、它的灰色时髦观
云南·丽江