世界自然遗产景区网络关注度与客流量相关性
——以四川省四姑娘山为例
2020-07-08陈倩,邓敏,2※
陈 倩,邓 敏,2※
(1.桂林理工大学 旅游与风景园林学院,广西 桂林 541004;2.中南民族大学 经济学院,湖北 武汉 430074)
根据中国互联网信息中心发布的第45次《中国互联网络发展状况统计报告》显示,截止2020年3月,中国互联网用户规模高达9.04亿,普及率为64.5%[1]。互联网的不断发展与壮大使得人们的生活越来越依赖于网络环境。在当前旅游业发展中,通过网络搜索引擎对旅游目的地进行信息检索已经成为了一种普遍性行为。游客通过信息检索辅助自己形成旅游决策,因此,从一定程度上来说,网络关注度能够较为真实地反映出游客的出游意愿,进而反映出景区未来的客流量。
一、研究回顾
国外将网络关注度运用到了各学科的研究领域中,其最常用的为谷歌趋势。谷歌趋势被用于分析通信、医药、健康、商业和经济等多个领域的各种变量,主要为描述和诊断性研究[2]。J. Ginsberg[3]等人利用Google搜索记录对网络用户密集区域的流感进行了预测。T. Dergiades[4]等人采用搜索引擎查询数据对旅游产品的消费进行了预测,并认为根据不同搜索语言和不同搜索平台对指数进行调整,有利于预测国际访问量。
国内网络关注度在旅游领域中的应用较广,主要包括百度指数、微博、马蜂窝等。网络关注度在旅游研究领域中常被用于研究旅游时空分布、旅游流等问题。马丽君[5]等人利用百度指数和客量数据提出了网络关注度的时空模型,并认为网络关注度和客流量之间存在较强的相关性。邹永广[6]等人用百度指数分析了旅游安全网络关注度的时空差异特征,认为地区经济发展水平、突发事件量等差异形成了网络关注度的差异。静恩明[7]等人以新浪博客游记为数据源分析了河北省A级景区网络关注度空间格局,发现各区域在旅游资源禀赋基础上,外源动力作用明显。生延超[8]等采用百度指数分析了网络关注度的时间差异和区域差异,认为收入、科学技术水平与游客满意度网络关注度之间呈正相关关系。
综上所述,网络关注度的研究主要集中在时空分布、旅游需求、空间差异等方面,对于客流量的研究相对较少。景区的客流量对于网络关注度存在时间上的滞后性,但目前的研究并未对滞后的周期形成统一结论[9]。具有不同特征的景区的滞后周期有所不同,部分学者在研究中直接引用前人的时间滞后周期,使得滞后性时间产生误差,进而导致研究结果产生偏差。因此,在探索景区客流量与网络关注度间的关系时,针对不同景区进行滞后期的确认十分必要。此外,多数学者所选取的关键词均是根据主观思维选取的,并没有准确把握景区旅游网络关注的热门关键词。
二、四姑娘山概况
四姑娘山位于四川省小金县,距成都约203公里,地处东经102°42′30″~102°58′40″、北纬30°54′16″~31°16′21″之间,属亚热带季风性气候。由于区内地形高差悬殊,随海拔高度的变化,山地气候变化明显,从保护区西南角的沃日河谷到主峰顶,形成复杂的气候垂直带谱。四姑娘山山形峻峭,是省内第二高峰,由于海拔高,山峰常年积雪,有现代山岳冰川,是四川大熊猫栖息地,为世界自然遗产,被划为国家级自然保护区。
四姑娘山早在1994年便被评定为国家重点风景名胜区,2000被评为国家首批4A级景区,2006年被联合国评定为中国大熊猫栖息地世界自然遗产的组成部分。每逢节假日,四姑娘山都会迎来大量的游客,根据《国家旅游局公告》(2015年第19号)的规定,四姑娘山风景名胜区游客最大承载量为1.8万人次/天①。从图1中可看出,在2015—2018年,四姑娘山的游客量呈现快速增长趋势,且上升的速率较高,2015年的最高日客流量为6 579人次,到2018年增长为17 071人次,其年平均增长率高达38.41%。虽在2019年有所下降,但根据近年来的发展趋势预测,未来国庆假期间其最高日客流量将超出它的最大承载力1.8万人次/天的范围。我国公民的假期具有较强的集中性,导致各大景区均出现阶段性、突发性游客暴涨现象,当客流量超出景区承载力范围时,将严重影响游客体验,并造成极大的安全隐患。为对景区的爆满现象加以适当的调控,对景区客流量的合理预测势在必行。本文采用线性回归的方式,利用网络关注度对四姑娘山景区的客流量进行初步预测,以便景区在客流量超出其最大承载力之前,采取恰当的措施,做到对人力、物力、财力资源的充分合理利用,保证游客的参观质量以及人身安全,并提高游客的旅游体验,避免景区游客爆棚而造成损失。
图1 四姑娘山2015—2019年国庆期间最大日客流量
三、网络关注度与客流量的特征
(一)数据来源与研究方法
百度是全球最大的中文网络搜索引擎,据相关研究表明,游客出行前使用的搜索引擎主要为百度,在各大搜索引擎中占比高达65.7%[10]。百度指数是基于百度大量用户的搜索行为形成的,表示一段时间中网民对某一内容的检阅数,是大数据时代衡量网络关注度的一大指标。为保证选取关键词的准确度,本文采用了站长工具的SEO关键词挖掘功能对四姑娘山进行关键词挖掘。从站长工具中获得其百度指数最高的搜索关键词主要为:“四姑娘山”“四姑娘山天气”“四姑娘山旅游攻略”和“四姑娘山门票”。本文选取了这四个关键词在2018年、2019年国庆节前后的百度指数作为原始数据。同时,从四姑娘山相关部门官网选取了其2015—2019年公布的日客流量为研究的数据源,并从中选取法定节假日作为研究时间段。
本文利用SPSS软件,以百度指数和客流量建立了回归模型,以确定网络关注度与客流量间的相关性,从而达到对客流量进行初步预测的目的。
(二)网络关注度特征
李山[11]等人认为景区客流量相对于网络关注度存在一定的滞后性,其滞后周期为1~2周。为确定四姑娘山滞后周期的准确值,本文扩大了网络关注度数据的收集范围,划定2018年、2019年两年中9月24日—10月7日为时间区间,详见图2。
图2 2018—2019年关键词百度指数
从图2中可看出,关键词“四姑娘山”的百度指数变化幅度较大,且与客流量呈现出较接近的变化趋势,而“四姑娘山天气”“四姑娘山旅游攻略”“四姑娘山门票”的变化幅度则相对较小。利用软件对四个关键词的百度指数,即因变量进行了相关性分析,发现五个指数间存在较大的相关性,故选取“四姑娘山”百度指数为代表。
(三)客流量特征
国家法定节假日的规定使得目前国内旅游出现了节假日旅游高峰的现象。在对四姑娘山官方公布数据进行统计分析之后发现,2018—2019年四姑娘山在我国的7个法定节假日期间(包含调休及连接的周末)的日均客流量如图3所示。从图中可看出,在这两年中,四姑娘山在国庆节的日均客流量为最大值。由此可知,国庆节为四姑娘山最有可能出现日客流量爆棚现象的时间段。因此,本文选取了国庆节日客流量作为四姑娘山客流量的研究数据,如图4所示。
图3 2018—2019年四姑娘山法定节假日平均日客流量(单位:人/天)
图4 2015—2019年四姑娘山国庆节日客流量(单位:人/天)
从图4中可看出,2015—2019年四姑娘山国庆期间客流量走势相似,客流量从国庆假第一天就已达到一个较高的水平,随后开始呈现出不断增长的趋势,到第三天时,达到了国庆期间日客流量的最大值,且在2018年已经接近于其景区日客流量的最大承载量1.8万人次/天。从图4可看出,其国庆假期的客流量除2017年受气候影响走势略有不同外,其余均呈现出倒U型的增长趋势。
(四)网络关注度与客流量的滞后期
由于客流量与网络关注度之间在时间上存在滞后性,为确定其滞后期,本文选取2015—2019年的数据,利用SPSS软件对不同滞后期的“四姑娘山”百度指数与客流量数据分别进行皮尔逊相关系数检验,结果如表1所示。当显著性水平小于0.05,视为拒绝原假设,表明两个变量之间显著相关,值越接近于0表示相关性越强。由此可知,2015—2018年滞后期为2天时的网络关注度变化趋势与四姑娘山日客流量变化趋势相关性最强,2019年则在滞后期为1天时相关性最强。从以上分析可知,四姑娘山客流量与其网络关注度之间存在1~2天的滞后期。
表1 四姑娘山不同滞后期百度指数与客流量相关性强度(显著性水平值)
根据上述结果,假设客流量与网络关注度之间存在相关关系,且两者间的滞后期为1~2天。选取2015—2018年每年的9月29日至10月5日和2019年9月30日至10月6日的“四姑娘山”百度指数作为自变量,选取2015—2019年10月1日至10月7日的日客流量作为因变量建立线性回归方程。
四、网络关注度与客流量间的相关性分析
(一)正态分布检验
本文借助SPSS分析工具,在对数据进行共线性检验之后,得出散点图发现两组数据存在很强的共线性,因而对其进行正态分布检验,详见表2。本次检测样本数仅为35组数据,因而以Shapiro-Wilk检测结果为准。由表2可知,四姑娘山与客流量的显著性水平分别为0.179、0.137,均大于0.05,不拒绝原假设,服从正态分布。为进一步验证其是否服从正态分布,对四姑娘山百度指数和客流量输出结果的标准Q-Q图进行分析,发现两组数据的标准Q-Q图中的点均接近中间的直线或在直线上,服从正态分布。
表2 四姑娘山百度指数与客流量的正态分布检验
注:*表示真显著性的下限。
(二)相关性检验
利用SPSS对四姑娘山网络关注度和客流量进行相关性检验,输出结果如表3所示。其显著性水平为0.000,小于0.05,拒绝原假设,即四姑娘山百度指数和客流量显著相关。
表3 四姑娘山百度指数与客流量的相关性分析
注:**表示在0.01级别(双尾),相关性显著。
(三)回归分析
经过以上检验之后,发现该两组数据存在线性关系、符合正态分布,且具有很强的相关性,符合回归分析的前提条件,因而对两个变量进行了回归分析。选择“四姑娘山”百度指数作为自变量,选择四姑娘山国庆假期日客流量为因变量,得出的回归模型如下:
Y=-1018.251+1.978X,R=0.663,R2=0.422。
(1)
其中,Y:四姑娘山日客流量;X:四姑娘山百度指数;R:相关系数;R2:拟合优度,R2是评价方程拟合优度的决定系数。该回归方程的R2值为0.422,表示回归方程的拟合程度在可接受范围内,回归值较接近观测值,较能体现观测数据的内在规律。从(1)式可看出,在四姑娘山国庆假期时的游客量与其对应的1~2天前的四姑娘山百度指数具有相关关系,客流量随着网络关注度的增长而增加。
(四)相关性分析
在当前网络信息十分发达的环境下,旅游者在出行前习惯利用搜索引擎对旅游目的地的相关信息进行检索。网络搜索指数的高低在一定程度上代表着网民关注度的高低。旅游者在出行前可通过网络搜索了解旅游目的地的相关信息,进而制定旅行计划,准备出行。经过SEO统计分析工具发现,旅游者出行前,主要会对旅游目的地的天气、交通、旅游攻略、住宿、门票、图片等信息进行检索,这些信息将会严重影响到旅游者的出行决策。即网络关注度在一定程度上会影响到景区的客流量,但该类影响有着相应的滞后性。游客往往会选择提前数天进行信息检索,从而决定是否出行。
受地理环境等因素影响,景区承载力有限,因而对客流量的控制十分必要。本文以四姑娘山为例,采用线性回归方式对景区网络关注度与客流量的关系开展研究,发现两者间存在线性关系。利用四姑娘山的网络关注度数据可以初步预测景区未来1~2天的日客流量。
网络是游客出发前对景区进行了解的渠道,旅行者在出行前通过网络信息检索辅助制定最终的旅行计划,网络关注度是旅行者出行前或出行中的一种预兆。本文以四姑娘山作为研究对象,利用站长工具、线性回归等研究方法,得出以下研究结论:网络关注度最高的4个关键词按关注度由高到低依次为:“四姑娘山”“四姑娘山天气”“四姑娘山旅游攻略”“四姑娘山门票”;国庆期间,四姑娘山客流量相对于“四姑娘山”百度指数存在1~2天的滞后期;旅游目的地的网络关注度与客流量之间存在相关关系。
为预防景区客流量超出其承载力范围,景区可通过建立景区网络关注度与客流量间的线性关系,对旅游旺季未来的客流量进行预估。同时,在客流量过大时,景区可采取相应调整措施,如门票预约、分时进入、限制进入、交通控制等措施,达到对景区的客流量进行提前预知和管控的目的,避免由于景区爆棚而造成损失。
注 释:
①数据来源:四姑娘山景区官网。