基于R语言的广西接待入境旅游人数分析
2021-06-02王赫
王赫
摘要:旅游业是第三产业中热门的新兴产业之一,旅游行业的发展不仅促进本地的经济增长,同时也可以激发相关行业的产业的活力。其中,接待入境旅游人数可以对本地旅游业的发展做出良好的说明。广西是我国极为重要的旅游省份之一。文章采用1995~2014年间广西统计年鉴的数据,使用R语言对使用数据进行描述性分析,数据可视化和回归分析,以此对广西接待入境旅游的情况做出分析。文章得到的结论如下:接待港澳台胞入境人数增长最快,当前数据已接近20年前的20倍;接待入境旅游总人数总体增速较快,但是其中接待外国旅客人数增速相对较缓。由回归分析可知,接待入境旅游人数与国际旅游外汇收入的关系呈正相关关系,且接待入境总人数每增加一人次,国际旅游外汇收入随之增加0.08274亿元。
关键词:接待入境旅游人数;描述性分析;数据可视化;回归分析
一、背景
随着近年来我国国民经济的不断攀升发展和综合国力的逐步增强,各地区来华旅游的意愿强烈,增势迅猛。旅游业也是第三产业中热门的新兴产业之一。旅游行业的发展可以促进本地的经济增长,也可以同时激发相关行业和产业的活力。其中,接待入境旅游人数可以反映本地旅游业的发展以及在各地区旅客心中的了解和认可程度。广西是我国极为重要的旅游省份之一,位于中越边境线之上,与越南接壤。整个省份囊括六大地貌,四大水系。广西是一个拥有悠久历史和漫长文化的省份,今广西的大部地区属于旧时的桂林郡以及象郡,是一个充满生机,景色优美,风情浓郁的城市。本文选取广西壮族自治区1995~2014年间重要年份的各地区入境旅游人数及相应年份的国际旅游外汇收入来分析来自各地区至广西旅游的旅客人次之间存在的关系。
二、数据分析
(一)数据清理
在对数据进行分析之前,首先徐娅对数据进行初步的处理和筛选,对数据缺失值进行识别,并对缺失值进行可视化操作。
(二)描述性分析
本文首先对各年份的广西接待各地区入境旅客人数的数据进行描述性分析,通过对各地区入境旅客人数的数据信息进行整理,分类和归纳,找出数据本身的特点特性和内在规律。本文选取均值、中位数等统计量来体现各数据的集中趋势。另外选取折线图来体现数据的变化,并利用这些图像来对数据分布进行比较。
1. 各个地区入境人数變化的折线图
折线图属于趋势类分析图表,可以呈现连续时间间隔上的连续数据中数量的增减变化的图表,能够显示数据变化的趋势。此处选用广西壮族自治区1995~2014年间重要年份的各地区入境旅游人数做折线图,以观察各地区入境旅游人数变化的增减性、变化程度以及数据变化是否存在一定的规律。
数据运行如图1所示。
由图1可以看出,由于数据缺失值,使得图像呈断裂状态,但仍然可以明显观测到,1995~2014年间广西接待入境旅游人数的增减性和变化趋势。不难看出,各地区至广西旅游人数均为明显的增长态势,但在2005年左右不约而同出现略微下降的状态。观察各个数据,可以看出其中以接待港澳和台湾入境旅游人数增长最为突出,2009年至今更是呈现高速率直线增长的态势。而接待越南入境旅游人数在总体保持上升态势的同时,近三年呈略微的下降态势。泰国、印度尼西亚、意大利和新西兰的入境人数变化较为相似,始终保持平稳上升的态势。
2. 对总人数和外汇收入做折线图
运行数据,得到图2。由图2可以了解到,1995~2014年间广西接待入境旅游总人数与外国游客人数皆呈明显的上升趋势,其数据均在2003年和2008年略有下滑,但很快反弹增长。由图像可知,接待入境旅客总人数较之接待入境的外国旅客数量增速更快更猛,以此可知港澳台胞由广西入境旅游的增势极猛,呈持续走高的上升态势。表明入境旅游在港澳台胞之中前景十分光明。
(三)回归分析
本文对2000~2014年间广西接待入境旅游旅客的总人数与国际旅游外汇收入之间是否具有关系做了探讨和检验。
回归分析是统计学中极其重要的一种数据分析方法,回归关系也是现实生活中普遍存在的一种关系。回归分析研究的主要对象是客观事物变量间的统计关系。其探究的内容是是否存在相关关系于设定的自变量与因变量之间,如果这样的相关关系存在,则希望找出可以表示自变量与因变量之间相关关系的数学表达式。在回归分析中,对自变量的连续性往往不做要求,但是因变量往往无法呈现离散型,通常都是呈现连续性的,而其实质上则是呈线性的。
本文以广西接待入境旅游旅客的总人数为自变量,以国际旅游外汇收入为因变量做一元线性回归分析。
1. 模型说明
ei表示(样本)残差或剩余项,ei也可以作为εi的估计量。茁赞2是Xi,Yi的函数,此处是一个随机变量;若Xi取一定值,则茁赞2是Yi的函数。
若自变量与因变量之间呈回归关系,则可以得到表达该关系的数学表达式。
2. 观察接待入境旅游人数与国际旅游外汇收入的关系
首先做两变量的散点图,初步观察自变量与因变量之间是否存在大概的相关关系,为接下来的回归分析做初步判断。得到的图像如图3所示。
由图3可知,接待入境旅游人数与国际旅游外汇收入的关系呈线性相关关系,且呈正相关关系。基于这样的初步判断,下面可以继续对两变量做回归分析。
3. 对接待入境总人数与国际旅游外汇收入进行线性回归分析
对接待入境总人数与国际旅游外汇收入做一元线性回归分析,得到以下结果:
可以得到接待入境总人数与国际旅游外汇收入之间的线性表达式为:
y=0.08274x-2.65507
因此可以验证,接待入境总人数与国际旅游外汇收入之间呈正相关关系,且接待入境总人数每增加一人次,国际旅游外汇收入随之增加0.08274亿元。
最后将回归模型与真实数据进行拟合可知,拟合效果较好,可以用该线性表达式对广西接待入境旅游总人数与国际旅游外汇收入之间的关系进行拟合。
4. 显著性分析
需要對方程进行显著性分析,以验证该关系式相关性的有效性。
由以上结果可知,T检验得到的自变量系数显著性标记判定为非常显著,截距系数为显著。F检验表示整个模型的显著性为非常显著。R2的相关系数检验可知,相关系数R2=0.9654,相关系数的修正系数为0.9605,非常接近1,说明模型的自变量与因变量高度相关,回归方程可通过显著性检验。
5.残差分析
对回归模型进行残差分析的操作,验证残差是否服从正态分布,对模型进行检验。
由以上结果可知,W= 0.84624,接近于1,p值= 0.06772> 0.05,验证该残差符合正态分布,认为模型正确。
三、结语
(一)结论
由整篇文章得到的数据可知,随着我国经济的不断增长,国内旅游业蓬勃发展的同时,国际旅游也在突飞猛进的拓宽其在国内外的影响力,接待入境旅游人数保持持续性增长,国际旅游外汇收入也保持持续性攀升,足以证明,广西壮族自治区的旅游业发展兴旺,更以此带动了其他行业的健康发展,引起了旅游方式的变化,更完善了食宿供应设施,激发了其余各个相关方面行业的提升动力。
(二)建议与意见
由文中处理数据所得到的结果可以看出,广西接待旅游人数近年来虽呈持续上涨的态势,但是其中以港澳台胞的增长为主,增速和增长人数并不均匀。说明入境旅游的比例还需调整,其间也有许多方面仍需改进。本文给出的措施主要有以下几点。
在保持生态健康、地区旅游业发展可持续的基础之上,多元化旅游消费结构,升级旅游消费水平。
加强旅游消费设施的建设,努力向良好的“衣食住行”的方向发展。
优化旅游消费方式,努力向探求文化和放松身心方向转型,降低浏览打卡式旅游比例,更好的在旅游期间展现我国浩瀚悠久、源远流长的历史文化。
加强文化输出和旅游形象建设,增强对境外旅客的吸引力。
参考文献:
[1]许洪杰,李均立.海南省旅游业收入对GDP贡献的线性回归分析[J].管理观察,2009(08):168-169.
[2]陶敏,刘攀.我国旅游业发展现状及问题分析[J].时代金融,2015(33).
[3]袁率夫.假日经济对GDP的贡献研究[J].企业研究,2013(18):193-194.
[4]魏小安,厉新建.旅游产业地位的统计视角思考[J].北京第二外国语学院学报,2000(05):2-7.
[5]宋子千,郑向敏. 旅游业产业地位衡量指标的若干理论思考[J].旅游学刊(04):27-30.
[6]佟玉权.我国出境旅游市场影响因素的逐步回归分析[J].市场论坛,2009(10):70-72.
[7]常红影.哈尔滨入境旅游市场客源分析与预测[D].哈尔滨:东北林业大学,2014.
[8]申振东,佘重阳.旅游业对我国社会经济贡献的回归分析[J].商场现代化,2009(03):260-262.
[9]程晓丽,王逢春.安徽省旅游产业发展与经济增长相关性分析[J].经济地理,2014(03):184.
(作者单位:广西师范大学)