城市旅游流客源地分布及预测研究以南京市为例
2018-05-25文1蕾1刘培学
戴 文1,丁 蕾1,刘培学,马 莉
(1.南京财经大学 工商管理学院,江苏 南京 210023;2.南京大学 地理与海洋科学学院,江苏 南京 210093)
1 引言
在当前旅游研究的领域中,旅游流可以说是核心问题之一[1]。从本质上来说,旅游流是一种较为复杂的空间动态流[2]。狭义的旅游流是指游客流,而广义的旅游流还包括与游憩流相关的或应运而生的资本流、文化流、信息流等关联流。对旅游流而言,以游客在目的地的移动为主体的旅游客流的研究更是重中之重。
近年来,国内外越来越多的学者投入到旅游流的研究中,由浅逐渐深入。国外研究大多与旅游流的特征及其影响[3]、旅游流的空间移动规律[4]、空间移动的影响因素[5]以及旅游流的驱动力[6]有关。国内关于旅游流的研究则多集中于时空演变以及影响因素这一角度。研究内容涉及多方面,如旅游流的特征[7]、旅游流空间演变的规律[8]、影响旅游流空间扩散的因素[9]等。国内外学者较早开始重视旅游流客源地特征的研究,大多是从旅游目的地的角度研究旅游流的空间分布和结构,而对旅游流客源地分布,即旅游流流向目的地的动态规律方面研究较少。国际上的研究多着重于客源地与目的地之间的联系模式,通过时间序列模型、引力模型等来寻找最合理的客源地分布规律模型[10,11]。同时,国外还就旅游流的客源地分布影响因素进行了研究,从内在因素、外在因素以及综合因素三方面进行了分析[12]。国内对旅游流客源地分布也给予了一定的重视,保继刚、楚义芳等是国内研究的先驱。保继刚[1]对旅游流客源地分布的影响因素与特征进行了分析;吴必虎[13]对上海市民“一日游”的缘由进行了研究,发现市民出游受到距离、可达性、目的地旅游资源的吸引力等因素的限制。
在旅游流的空间预测方面,国内外起步较晚,因此研究结果相对较少。2001年,Witt、Kulendran[14]首先开发出了自相关模型,随后Webber[15]研究出了集聚模型。近几年,许多学者开始运用位移模式、效用最大化模型等不同的方法对旅游流进行了预测和计算。2005年,Kima[16]通过实证研究对旅游流的不同计算和预测方法进行了对比分析,总结出适合不同条件的预测方法。国内对有关预测的研究较少,比较有名的是保继刚[17]首次建立了可以预测全国各地前往北京的旅游流量数学模型,综合考虑了距离、文化程度和经济发展程度;李君轶[18,19]从数字足迹的角度研究了旅游流的空间变化,并运用Web和GIS对旅游流进行了预测研究,这是目前国内较为新颖的研究方向。
随着我国旅游业的迅速发展,国内大多数景区的游客量呈井喷式增长。在重要的节假日期间,有些景区的游客量甚至超出了景区的最大承载力。基于这种情况,如何找出最科学的方法,进而对景区游客量做出准确的预测,避免对景区环境造成破坏成为旅游景区发展中面临的重要问题。客源地分布的研究对景区合理开发旅游资源、解决旅游设施的空间布局问题是至关重要的。而对有关政府部门和相关旅游企业的决策者而言,正确了解目的地与客源地之间的关系,并对旅游流量进行准确预测是一件非常重要的事情。本文在前人研究的基础上,主要将重点放在从大数据视角对旅游流的空间扩散进行研究,并运用百度指数对旅游流进行了预测。
2 数据来源及方法介绍
2.1 数据来源与处理
南京市是国内较早投入使用智慧旅游项目的城市。“南京智慧旅游大数据运行监测平台”的数据监测范围较广,包括全市4A级以上的景区、景点和商圈、交通枢纽等40个点,本文的数据就来源于该平台。
本文就平台上2016年南京市旅游流的有关数据进行了分析,下载了境内的旅游流数据、具体景区的旅游流数据和旅游流客源地的数据。根据不同的研究目的,更改所下载数据的类型、包含的时间段,并对数据进行分类、整合、加工,从而对南京游客客源地分布规律、游客流量动态等方面进行深层次探索与挖掘。
本文将下载的节假日南京市外地游客统计数据运用软件SPSS19.0对客源地距离和旅游流量进行了回归,可以看出两者之间有着负相关关系;运用软件EXCEL(2010),将节假日与客流量进行归类、整理、回归、分析,得出两者存在正相关关系。
2.2 研究方法
基于南京市智慧旅游大数据运行监测平台提供的相关数据,本文主要采取了对比分析方法和聚类分析方法研究了南京市旅游流客源地的空间分布模式。对比分析方法主要用于揭示旅游流的客源地分布差异和时间分布差异,聚类分析方法主要用于研究几个重要节假日的旅游流客源地分布模式。在客流量预测方面,本文主要利用南京市旅游相关关键词的百度指数和利用格兰杰因果检验方法对百度指数和南京的实际游客量进行分析,从而建立自回归移动平均模型进行预测。
在本研究中,关键词的选择对预测模型的构建起到重要作用。由于研究对象的尺度存在差异,在关键词的选择时会有所不同。在数据整理阶段可知:某一具体景区游客量与该景区关键词的百度指数之间有较高的相关性;当研究尺度扩大至南京市总体游客时,其关键词的选择更加趋向于对南京市旅游的总体概括,对部分网络知名度较低的南京市景点不能全面覆盖,所以预测结果会产生一定的误差。
本文以南京市的总体游客量作为研究对象,通过分析与南京市旅客总量相关的关键词,建立了南京市总游客量的预测模型。本文通过构建的预测模型可以预测节假日期间各旅游景区的旅游流,有效避免了景区游客超出景区的最大承载力造成对景区环境的破坏,为各景区管理提供了相关决策意见。
3 节假日客源分布特征与动态变化
我国独特的节庆假日形成独具我国特色的节假日旅游流,本文以春节、元旦、“十一”等7个独特的节庆假日和几个节假日期间的旅游流为研究对象,通过对南京智慧旅游监测平台上2016年南京市各景区旅游流客源地的数据进行对比分析,探讨旅游流客源地的分布特征。
3.1 节假日南京游客源分布与距离衰减分析
从图1、图2可见,在重要的节庆期间,来南京市的游客在客源地分布空间上呈现出并非一种均衡状态。从区域来看,离南京市较近的长三角区域和珠三角片区的游客密度指数明显高于其他地方;而与此形成鲜明对比的是西北地区,密度指数相当低,且显著低于全国的平均水平。从省市来看,来南京市游客中的客源地密度指数较高的分别是江苏、浙江、上海。基于上述情况,可以推测出两个层次原因:一方面,交通不便利和气候不适宜阻碍了来南京市旅游的远方游客;另一方面,经济落后使西藏、新疆等外出的较少。总体来看,节庆期间来南京市旅游的游客发展呈现层次分布格局,即由长三角区域向周边、内陆递减,这进一步验证了距离衰减规律。
3.2 节假日长度对客源半径的影响
由于江苏省是南京市旅游的主要客源地,与其他省市相对比游客量远多于其他省市,所以在剔除江苏省的情况下,对比7类不同时段的节假日期间南京市各景区客源地地理集中指数G值和客源吸引半径AR值的结果发现,只有两天假期的中秋节G值为29.63,AR值为490.27km;具有三天小长假的端午、元旦、清明、“五一”的G值均在30以上,分别为30.48、36.94、35.86、35.26,AR值分别为138.99km、433.24km、425.88km、363.95km;具有7日假期的黄金周“十一”、春节的G值均小于30,分别为28.97、28.86,AR值分别为464.87km、541.30km。
综上可见(表1),中秋、“十一”、春节客源地地理集中指数G值偏小,客源吸引半径AR值偏大;三天小长假端午、元旦、清明、“五一”的G值偏大,客源吸引半径AR值偏小。由于2015年中秋节临近“十一”国庆节,居民出游行为在一定程度上受“十一”黄金周的影响。以上分析表明,除中秋节假期外,假期时间越长,南京市客源地地理集中指数的G值越低,客源吸引半径AR值越大,说明我国居民出游行为受到休假制度的限制,休假时间越长,居民出行距离越远,客源地吸引范围越广泛。
图1 南京市景区各节假日期间客源地游客量分析对比
图2 南京市景区节假日期间客流量距离衰减曲线
3.3 元宵灯会夫子庙客流特征
2016年南京市夫子庙元宵灯会于2月4日(腊月二十六)—2月25日(正月十八)举行,为期22天。根据从大数据平台获得的监测数据,分析研究2月1日至2月29日夫子庙游客量(图3),数据显示2月1日至2月3日期间,外地游客较少,日游客量低于1万人次;2月4日,夫子庙元宵节开幕当天,外地游客量激增,达到峰值的6.4万人次,且日游客量首次高于南京本地游客量的5.8万人次;春节期间,外地游客量有所增加,2月8日至2月14日期间,日游客量均达到1万人次以上,并于2月10日达到高峰的2.6万人次,此后日游客量开始逐步减少;2月22日(农历正月十五元宵节)外地游客量再一次达到高峰的5.4万人次,且日游客量在3万人次以上一直持续到2月27日,2月28日以后游客量开始逐步下降。
图4 夫子庙元宵节期间游客客源地分布
从元宵节期间夫子庙游客客源地分布来看(图4),外地游客客源地主要以长三角一带为中心,辐射至珠三角、环渤海片区、成渝片区和新疆地区;游客量排名前十的客源地依次是江苏、安徽、浙江、上海、河南、山东、广东、北京、新疆,分别占比95.9%、1.06%、0.43%、0.38%、0.32%、0.23%、0.23%、0.21%、0.13%。
4 基于百度指数的旅游流预测研究
在传统的预测中,数据大多来自统计年鉴或者统计公报,这些数据从收集、统计到公布需要较长的时间,存在明显的滞后性,数据也存在较大的误差。基于此类数据,即使研究者们采用最先进的预测方法和工具,也无法得到较准确的结果,因此极大地影响了预测的准确性。搜索引擎尤其是百度便成为网民重要的获取信息和服务的平台,利用后台记录的网络搜索数据来研究实际需求与网络关注度之间的联系,从而展开预测,有效避免了数据的滞后性和误差性,使预测结果更加有效、更加准确。
4.1 南京市总体游客量预测模型
通过以“南京+旅游要素”的结构选取与南京旅游相关的关键词(共14个),运用关键词挖掘工具如站长工具确定6个搜索量较高的关键词,分别为:南京旅游、南京机票、南京中山陵、南京夫子庙、南京酒店、南京旅游攻略。限于南京智慧旅游平台数据和百度指数的可获性与完整性,选取2015年6月1日到2016年5月1日的游客量数据。首先对时间序列数据进行单位根检验和协整检验(表2),检验时间序列的稳定性;其次用格兰杰因果检验方法对时间序列(6个关键词的百度指数和游客量)进行检验(表3),得出与南京市游客量存在因果关系的变量共4个:南京旅游(X1)、南京夫子庙(X2)、南京酒店(X3)和南京机票(X4)。
表2 ADF检验
表3 变量的格兰杰因果关系检验
在南京市总体游客的时间序列内,存在元宵节前后两天(2月23日和24日)游客人数极高的异常值(图5),为保证数据最佳的拟合效果,将这两天数据予以剔除。剔除后的数据具有较高的波动性,以此序列作为最终序列(游客人数Y)与四个关键词的百度指数进行拟合分析,构建预测模型的估计期为2015年6月1日至2016年4月31日。
图5 2015—2016年游客数量的变动趋势
本文通过将“滞后一期”与“滞后二期”的Y、本期直至“滞后二期”的各自变量对Y进行逐步回归(回归过程中保持常数项存在),剔除无效变量,加入显著变量,建立ARMA预测模型。通过不断测试,最终得到以下结果(括号中的值为变量t的值):
(1)
在10%显著水平下,检测的全部变量都是显著的,所以可以认为模型是有效的,且在自相关的LM检验中的F统计量为2.140079,对应概率值为0.1445,大于10%,接受了“不存在自相关”的假定,即认为该模型不存在着自相关,为有效的模型。
4.2 模型检验
通过方程1可知,预测客流量受到游客实际数量和关键词百度指数的共同影响。在其他因素不变的前提下,预测期前1天和前2天的实际游客数量(Y)、提前2天的“南京机票”百度指数(X4)、提前1天的“南京夫子庙”百度指数(X2)对预测期的游客量有正向影响。即该类数据的增加代表游客量的增加,且其影响程度主要受到前面系数的影响——提前1天的“南京夫子庙”百度指数(X2)影响最大,该数据的增加将显著提高南京游客,其次为提前2天的“南京机票”的百度指数(X4),最后是提前1天和提前2天的实际游客数量。相反,“南京机票”的当天百度指数(X4)、提前2天“南京夫子庙”(X2)的百度指数对预测期的游客量有负面影响。即该类数据的增加代表游客数量的减少,且其影响程度受到前面系数的影响 ——“南京机票”的当天百度指数影响最大,该数据的增加将显著降低当日游客,其次为提前2天的“南京夫子庙”百度指数。
利用方程1对样本时间外的2016年5月南京市总游客进行预测,现实游客数与预测游客数见图6。从图6可见,该模型具有良好的预测能力。由于平台数据在5月27号、28号、31号缺失,导致30号游客量无法预测,预测数据缺失或低于实际游客。
图6 2016年5月南京市级旅游人数与预测人数对比
5 讨论与结论
5.1 讨论
本文讨论了南京市旅游流节假日客源地分布特征,得出各节假日南京旅游流客源地距离衰减规律、节假日长度与客源的影响半径负相关等结论。在此基础上,利用百度指数,对各景区的客流量进行预测,并计算其漏损指数。即判定该方法预测的准确程度,合理预测各景区的高峰期,为景区发展提供了保证。同时,对有关政府部门以及相关旅游企业的决策者而言,及时准确的预测也为他们管理和保护景区提供了依据。
但本文依然存在着一些不足,如对客流量影响因素的研究不全面,没有充分考虑到天气因素、经济状况、交通便利程度等对客流量的影响;没有具体到每一天、每一时间的旅游流流量预测,不能预测实时客流量,实时找出应对措施,有时间差;基于百度指数的预测存在着一定的延迟和误差。因此,未来我们应进一步深入研究,以期找出更精确和便利的方法进行预测。
5.2 结论
本文基于南京智慧旅游数据监测平台,以南京市的旅游流为例,从微观角度探究了城市旅游流客源地的分布,利用百度指数对旅游流进行了预测。研究发现,旅游流受到多因素的影响。
具体的研究结论为:①南京市各明显的距离衰减倾向。即客源地距离越远,旅游流的流量越少,但在少数特定的地区,存在不同程度的波峰。②假期的长度与景区游客的集中程度负相关,与客源吸引范围正相关。即假日越长,景区游客集中程度相对越小,客源吸引范围相对越广,游客客源地相对越分散。反之,景区游客集中程度相对越大,客源吸引范围相对越小,游客客源地相对越集中(中秋节除外)。③传统的特色节日会带来旅游流量的激增,如南京特色节日夫子庙元宵灯会外地游客量在一两天达到高峰,景区严重超负荷,容易造成安全隐患,因此需要相关工作人员进行疏导。④由于距离南京的空间距离、交通成本、时间成本相对较低,旅游转换率较高等因素的限制,基于百度指数的预测,虽然比传统预测方法更准确。
参考文献:
[1]保继刚,楚义芳.旅游地理学[M].北京:高等教育出版社,1999.
[2]唐顺铁,郭来喜.旅游流体系研究[J].旅游学刊,1998,13(3)∶38-41.
[3]Prideaux B.Factors Affecting Bilateral Tourism Flows[J].Annals of Tourism Research,2005,32(3)∶780-801.
[4]Williains A T,Zelin Sky W.On Some Patterns of Internationals Tourist Flows[J].Economic Geography,1970,46(4)∶549-567.
[5]Haldrup M.Laid-back Mobilities∶Second-home Holidays in Time and Space[J].Tourism Geography,2004,6(4)∶434-454.
[6]Cho V.A Comparison of Three Different Approaches to Tourist Arrival Forecasting [J].Tourism Management,2003,24(3)∶323-330.
[7]黄泰,张捷.基于旅游流特征分析的旅游区域影响研究——以淮安市为例[J].旅游科学,2006,20(2)∶18-24.
[8]李志飞,夏磊.中国特殊时段旅游流时空分布特征研究——以“十一”黄金周为例[J].旅游学刊,2013,28(10)∶37-46.
[9]汪德根.京沪高铁对主要站点旅游流时空分布影响[J].旅游学刊,2014,29(1)∶75-82.
[10]Hagerstrand T.The Propagation of Innovation Waves[J].Human Geography,1952,(4)∶3-9.
[11]Huybers T.Modeling Short-break Holiday Destination Choices[J].Tourism Economics,2002,9(4)∶389-405.
[12]Yeong Hyeon Hwang,Ulrike Gretzel,Daniel R.Fesenmaier.Multi-city Trip Patterns:Tourists to The United States[J].Annals of Tourism Research,2006,33(4)∶1057-1078.
[13]吴必虎.上海城市游憩者流动行为研究[J].地理学报,1994,49(2)∶117-127.
[14]Kulendran N,Witt S F.Co-integration Versus Least Squares Regression[J].Annals of Tourism Research,2001,28(2)∶291-311.
[15]Webber A.Exchange Rate Volatility and Co-integration in Tourism Demand[J].Journal of Travel Research,2001,39(4)∶398-405.
[16]Kima J H,Moosa I A.Forecasting International Tourist Flows to Australia:A Comparison Between the Direct and Indirect Method[J].Tourism Management,2005,26(1)∶69-78.
[17]保继刚.引力模型在游客预测中的应用[J].中山大学学报(自然科学版),1992,31(4)∶133-136.
[18]李君轶.旅游数字足迹:在线揭示游客的时空轨迹[J].思想战线,2013,39(3)∶103-107.
[19]唐佳,李君轶.基于微博大数据的西安国内游客日内时间分布模式研究[J].人文地理,2016,31(3)∶151-160.