基于游线大数据的西北地区旅游流空间网络结构及影响因素
2023-11-13孙一鸣刘培学张建新魏瑞兵
孙一鸣,刘培学,张建新,魏瑞兵
(1 南京大学 地理与海洋科学学院,江苏 南京 210023; 2 南京财经大学 工商管理学院,江苏 南京 210023)
旅游作为区域贸易经济的重要组成部分,推动区域人流、物质流、信息流、资金流的有序流动,为区域的合作发展提供动力。旅游流空间网络是区域内旅游者流动模式在空间组织上的反映。陕西、宁夏、甘肃、青海、新疆五省区是我国具有代表性的旅游目的地区域[1],作为丝绸之路经济带上的重要廊道,受限于区域经济水平、资源禀赋、交通区位等条件的差异,西北地区的旅游业呈现出明显的不均衡特征,其区域旅游空间关系有待揭示。
旅游流作为旅游地理学的重要概念[2],是指旅游系统中由互相依存的各部分组成的具备特定流动规律的有机整体。旅游流系统包含信息流、旅游物流和旅游能流,其主体为旅游客流[3]。学者对旅游流的研究主要集中在5个方面:1)在旅游流时间分布方面,多采用时间序列建模方式对旅游流量进行统计和预测,分析旅游流的季节性变化特征[4]和影响因素[5];2)在空间分布特征方面,从全国、区域、省域、城市多尺度对旅游流的空间集聚和扩散进行研究[6-8],提出了单目的地、多目的地、环城游憩带、区域自组织等旅游流空间模式[9-12];3)在旅游流动力机制方面,国外学者提出了著名的推拉理论[13],国内学者从旅游者、旅游地和旅游交通等方面广泛探讨了旅游流的驱动因素[14-17];4)在流动效应方面,主要关注旅游流的空间场效应[18]和区域经济效应[19-20];5)在网络结构方面,主要采用引力模型[21]、复杂网络分析等方法对各尺度下的旅游流网络结构进行表征[22-25]。
与此同时,随着旅游业与互联网结合愈发紧密,诸多学者开始从流的整体特征出发,借助大数据分析揭示旅游网络体系,对流的结构进行解读[26-27]。基于移动互联网的大数据为旅游流及空间网络研究提供了新的研究思路,微博等社交媒体的签到数据[28]以及基于GPS轨迹等UGC数据的研究进一步加深了对旅游流空间的认知[29]。前人在旅游流时空分布、流动效应和网络结构等方面开展了一定研究,并逐渐考虑到与大数据结合的可能性,但现有研究多偏重于旅游市场和资源方面,立足于旅游者角度的大区域流动和目的地角度的网络结构及节点分析尚未得到深入探究。
基于传统数据和方法,区域内部的旅游流网络结构较难识别。因此,本研究选取西北地区作为研究案例地,利用在线平台游线大数据,识别网络整体特征,并深入挖掘区域内城市节点及目的地社群结构与旅游空间网络的互动关系,以期为西北地区旅游业发展和区域协同提升提供科学依据。
1 研究区概况
西北五省区包括陕西、青海、甘肃3个省份和宁夏、新疆2个自治区,共下辖51个地级市,土地总面积约308万 km2,占我国面积的31.9%;总人口约1.03亿人,占我国人口的7.4%。区内地理环境独特,人文景观丰富,既有大漠戈壁、冰川雅丹,也有草原牧场、原始森林,丝路文化、黄河文化、西夏文化、宗教文化等多元文化在此交融。西北五省区现有A级旅游景区1 572家,其中5A级36家、4A级395家、3A级889家,丰富的旅游资源带动区域内旅游业蓬勃发展,但区域内部旅游业发展水平差异较大,城市接待旅游者数量呈现明显西北少、东南多的空间特征(见图 1),旅游流情况与主要公路、铁路分布较为一致。新疆、陕西和甘肃旅游业发展相对较好,宁夏、青海旅游业仍处于较低水平。因此,以西北五省区作为案例地开展大尺度区域下旅游流网络及内部结构的研究具有实践意义。
图1 2018—2019年西北地区游客分布图Fig.1 Spatial distribution of tourists in Northwest China from 2018 to 2019
2 数据与方法
2.1 数据来源
1)旅游流在线订购数据。根据易观咨询发布的2019年在线旅游网站规模排行,携程网位列第一,能够一定程度反映西北地区真实的旅游流空间结构。利用Python编写爬虫程序获取2018年1月至2019年12月所有游线产品,分别以西北五省区旅游线路产品的具体信息和成交次数作为旅游流数据,并以“西北”“塞外”“丝路”“古城”等热门关键词为参考进行人工补充筛选可能遗漏的西北地区游线产品,并同步收集位于游线上所有目的地涉及的旅游景区门票价格。对游线进行规范化处理,把游线中涵盖的景区按所属地映射到所在城市,得到城市之间的对流数据。由于西北地区部分景区跨越多个地级市,考虑归属地时根据具体到达的景点来划分其所在城市。
2)旅游者评分、高品质酒店数据。携程网对于平台旅游者及入驻商家均有较为科学的评价层级及打分机制,因此本文旅游者评分、高品质酒店数量数据来源于携程网爬取数据。其中参照携程网酒店层级分类,将四星(钻)级(含)以上酒店数量作为高品质酒店。
3)各省市旅游资源等级和数量、公路客运量、第三产业从业人数及人均GDP等基础数据主要来源于各城市统计年鉴、旅游统计年鉴等。
2.2 研究方法
旅游者在不同城市节点之间转移扩散形成复杂的网络流动,而网络分析方法可以精确刻画复杂网络内部的各种关系,因此本文主要运用社会网络分析法,选取中心势、核心-边缘指标反映西北地区旅游流网络整体特征,选取中心性和结构洞指标衡量节点在网络中的地位[4]。
Louvain算法是一种依托于模块度优化的社区发现算法[4]。在旅游流网络中,连接较为紧密的城市节点可以被看成一个社区,Louvain算法能有效辨别网络的层级结构并进行社区划分,其关键是探究社区在节点改变后的模块度变化。模块度变化的计算公式为
式中:m是网络中总边数;ki是所有与节点i连边的权重之和;ki,in是社区内所有节点与节点i连边的权重之和;∑in表示社区内部边权重之和;∑tot表示社区内部的边权重之和与社区间连边权重之和的总和。
3 结果与分析
3.1 整体网络结构及空间特征分析
由表1可知,2018—2019年西北地区有效游线共2 408条,总出行159 396人次,根据游线首访城市所在的省份对游线产品进行分类展示。从起点省份来看,陕西省出发的游线产品数量和人数最多,多为省内短途游。新疆维吾尔自治区游线数量多、出游时间最长。甘肃省出游半径为五省区最长。青海省游线数量少,但出游人数多,茶卡盐湖和青海湖为其吸引大量旅游者。宁夏回族自治区面积较小,游线数量和出游人数相对较少。
表1 2018—2019年西北地区分省游线属性表Tab.1 Product attribute of provincial tourism line in Northwest China from 2018 to 2019
表2 不同阈值下西北地区旅游流网络拓扑特征Tab.2 Characteristics of tourism flow network under different thresholds in Northwest China
西北五省区旅游流总体特征见图2,旅游流网络呈现出多核心、多形态的复杂结构,整体结构相对松散,网络内部极不均衡。从西北地区总体旅游流网络结构来看,河西走廊居于核心,内部联系紧密;陕西、新疆较为边缘,内部相对稀疏。
图2 西北地区旅游流总体特征图Fig.2 Overall characteristics of tourism flow in Northwest China
图3 西北地区旅游流核心-边缘特征图Fig.3 Core-edge characteristics of tourism flow in Northwest China
图4 西北地区目的地社群空间分布图Fig.4 Spatial distribution of destination communities in Northwest China
根据城市间路径流量差异,按照Iij≤1、≤10、≤50、≤200、≤1 000、≤5 000分为不同层次,分析不同流量阈值控制下的网络特征(表 2)。结果表明,随着流量控制值的增加,旅游网络的中心势不断降低,网络的结构越来越简化,最终只有少数核心节点和主要路径,网络的核心-边缘特征明显。
3.2 旅游区域社群及节点角色分析
3.2.1 核心-边缘特征分析
对网络特征和拓扑结构的分析发现,西北地区的旅游流存在明显的核心-边缘特征,具有两头轻-中间重的网络空间格局。利用核心边缘模型计算整体旅游流的核心度,选取核心度值大于0.2为核心区、0.1~0.2为半边缘区、0.05~0.1为边缘区,其他地区是旅游吸引能力较弱、难以吸引大量旅游者前来开展旅游活动的游离区域。
通过图 3可以看出,西北地区旅游流网络核心集中在中部地区的弧形廊道上,这条廊道东起银川、中卫,跨过兰州,连接到甘肃东部、青海北部成片聚集区;廊道两侧和外围分布着大量半边缘区,半边缘区外是边缘区域,串联起整个甘青宁地区。具体来看,新疆和陕西两地内部各分布着一个核心区域,西安是陕西旅游流网络的绝对核心,其余城市在网络中地位较为边缘;新疆维吾尔自治区的旅游流中有着较为合理的层级结构,即一个核心区,周围多个城市有着较强的旅游吸引能力,形成较为庞大的半边缘区。
3.2.2 旅游目的地区域社群结构分析
进一步利用Louvain社区发现算法划分出西北五省区内部的社群(图 4)。根据不同规模,西北五省区城市网络结构共分为8个社群,可分为3个等级。第一等级为甘青宁、甘南、甘肃-宁夏旅游社群,以兰州为核心的甘青宁旅游社群是典型的条带状旅游区,兰州、银川、西宁是区域内重要的节点城市,串联起整个旅游区,中卫、酒泉、张掖、海北、海西等是次级核心,辐射带动着周边城市。第二等级为陕西北、西安-渭南、陕南旅游社群,以西安为绝对核心的陕西旅游社群内部连接较为松散,西安和区域内其他城市联系紧密,但其余城市彼此间联系较少;陕西旅游区对外和甘青宁廊道上的城市联系较为紧密,和甘南的陇南等市也有一定联系。第三等级为北疆、南疆旅游社群,以乌鲁木齐为核心的新疆旅游社群内部连接紧密,环形旅游带发挥重要作用;克拉玛依市、巴音郭楞蒙古自治州、伊犁哈萨克自治州和吐鲁番市是区域内重要的旅游节点,新疆旅游区和甘青宁廊道上城市联系较为紧密。
进一步分析西北地区8个社群的外部联系强度可以发现,丝绸之路廊道上的城市占据核心地位。甘南地区以甘南藏族自治州为核心,内部联系较为紧密,且是外联四川的重要通道。甘肃-宁夏社群中银川是核心旅游节点。西安-渭南游线处在陕西旅游社群的核心位置,辐射陕西西北部和南部城市。新疆北部和南部两个社群内部联系紧密,但对外联系相对较弱。
从内部联系看,各社群内部表现出较强的空间邻近性和行政地域性,旅游流在空间上呈现距离衰减的特征。省会城市和区域核心城市有着较强的影响力,在交通、经济和旅游资源上一般也占据着优势,进而导致旅游流在空间上的行政藩篱效应。
3.2.3 旅游城市网络节点角色界定
根据城市间旅游者移动方向的频率排序,图5给出了排名靠前的城市间游客流向弦图。最频繁的旅游者单向流动是从西安市到渭南市,占总旅游流的7.38%;其次是西宁到海南藏族自治州,占比为4.68%;此外西安→延安、酒泉→嘉峪关、西宁→海西、兰州→西宁的流向频次也较大。
双向流动反映着城市间流动的合作关系,西安-渭南、西安-延安之间表现出最密切的双向联系,西安在这两组双向联系中表现出较为支配的地位;酒泉-嘉峪关、海西-海南、乌鲁木齐-吐鲁番、兰州-酒泉之间的双向流动频次也较大。西北地区核心流动主要围绕西安、酒泉、嘉峪关、兰州、西宁、海南、海西、乌鲁木齐等地展开。西安是西北地区最大的旅游目的地,区位优势明显,对外辐散能力较强;西宁、海南、海西位于青海湖沿岸,是青海湖环线上互相流通的3个重要旅游目的地;兰州、酒泉、嘉峪关是丝绸之路廊道上的重要节点,在廊道上交互密切。
集散能力、占据中心位置、中介能力是节点控制网络的关键要素。一般来说,集散能力越强大,越接近网络中心,对其他节点的中介效应越强大,节点在整个网络发挥的作用越重要。分别使用度数中心度、接近中心度和结构洞衡量节点在网络中的支配作用,在客流量大于10的旅游流网络中,剔除不满足分析要求的城市(地区),对29个代表性的城市(地区)进行讨论(表3)。
表3 西北地区城市旅游网络节点结构指标Tab.3 Network node structure indicators of tourism cities in Northwest China
接近中心度显示西北地区网络中心主要在甘青宁地区,新疆和陕西的城市相对远离网络中心。西北地区各节点的集散能力差异较大,兰州市、西安市、乌鲁木齐市度数中心度高,能辐射到较多的城市,是陕西、甘青宁、新疆地区的集散中心。西宁市、银川市在社会经济、政治地位上优势明显,中卫市、酒泉市在旅游市场和交通区位上优势明显,这4个城市在旅游流网络中是次级集散中心。海西、张掖在甘青宁地区连接大量节点,克拉玛依、伊犁哈萨克、吐鲁番、巴音郭楞在新疆地区是环线的重要节点城市,甘南和青海、陕西联系较为密切,这7个城市是西北地区旅游网络中较为重要的集散地。
结构洞表示两节点间存在非冗余的联系,可为其占据者提供信息和控制利益。分析可见,西安、兰州和中卫在西北地区旅游流网络体系中占据着明显的结构洞优势,有效规模明显高于其他节点,对外冗余联系少,能够自由运用结构洞,处在网络结构中的枢纽位置。乌鲁木齐、西宁、酒泉的节点规模较高,但效率相对较低,冗余联系较高,不可替代性稍低;银川、巴音郭楞、甘南效率高,是重要的区域中转中心。
综合节点三方面的能力来看,兰州市、西安市、乌鲁木齐市是核心节点,处在整个网络较为中心的位置,有较强的扩散集聚能力,承担着中转站作用,是最重要的旅游目的地和中转站。中卫市、酒泉市、西宁市、银川市是次级核心节点,与核心节点联系紧密,是核心节点的重要辅助,借助核心节点和自身的影响力,搭建出旅游流网络的框架。海北藏族自治州、海西蒙古族藏族自治州、克拉玛依市、张掖市、巴音郭楞蒙古自治州、伊犁哈萨克自治州、甘南藏族自治州、吐鲁番市等8市(州)是重要旅游节点,依附于核心节点和次级核心节点。阿勒泰地区等其余14市(州、地区)属于一般旅游节点,有着一定的旅游资源,但辐射能力较弱。
3.3 旅游流影响因素分析
城市间旅游流的形成是自然、社会、经济、文化等多因素相互作用的结果,城市间旅游活动的交互是区域内要素协同运行的结果。结合西北案例地实际情况,本文借鉴相关研究[27-34],将西北地区旅游空间网络结构影响因素归纳为旅游资源禀赋、旅游接待能力、地区经济水平、交通基础设施等方面。旅游资源禀赋是目的地旅游吸引力的重要因素,考虑到旅游资源丰度及品质,借鉴以往学者测量方法,采用资源禀赋值[31]对目的地旅游资源禀赋进行测度;同时基于游线映射结果,计算旅游者对目的地所含旅游景区的评分均值,反映旅游者对目的地旅游资源的感知程度。旅游接待能力是目的地旅游发展的保障,本文采用第三产业从业人数及高品质酒店数量加以表征。地区经济水平是目的地旅游接待能力的重要保障,本文采用人均GDP和位于各省区游线上的景区门票价格均值加以展现。交通基础设施是旅游者成功抵达目的地的重要基础[34],去除多元共线性的影响,本文以公路客运量作为量化指标。由于以上指标单位不同,考虑到分析的科学性,将相关数据转化为标准分数后导入处理。基于此,本文建立多元回归模型,对西北地区旅游流影响因子进行分析。
西北地区城市间旅游者流量为被解释变量(Y),解释变量分别为资源禀赋值(X1)、旅游者评分(X2)、第三产业从业人数(X3)、高品质酒店数量(X4)、人均GDP(X5)、景区门票价格(X6)、公路客运量(X7),多元回归模型表达式为
Y=α+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+β7X7+ε。
统计分析结果见表4。模型整体拟合度较高,调整后的R2为0.594,方差分析显示模型可信度较高。
表4 西北地区旅游流影响因素回归分析系数Tab.4 Regression analysis coefficients of factors affecting tourism flow in Northwest China
具体来说,在旅游资源禀赋方面,目的地资源禀赋值对西北地区旅游目的地旅游流具有显著的正向作用。这说明西北地区旅游资源自身优越性成为旅游者到访的重要原因,丰富的旅游资源数量和优越的资源品质提升目的地旅游吸引力,推动西北地区区域发展。旅游者评分对西北地区旅游流无显著影响,这可能是由于当前西北地区旅游产品尚未形成较为成熟的旅游者评价体系,现有旅游者评分多为零散自发性的体验反馈。
从旅游接待能力方面来看,高品质酒店数量对西北地区旅游流有显著的正向作用,第三产业从业人数无显著影响。这表明西北地区产业结构的优化在旅游产品的升级改造方面起到了促进作用,高品质酒店的正向影响体现出西北地区旅游目的地较高的经济发展质量满足了旅游者不断提升的旅游体验需求,对旅游客流形成了拉力。
从地区经济水平方面来看,人均地区生产总值和景区门票价格均与西北地区旅游流呈正向关系。人均GDP在一定程度上反映了目的地经济系统发展程度,对旅游产业的营商环境及旅游吸引物建设和资源利用能力产生直接影响。景区门票价格对旅游客流具有正向影响,门票价格在一定程度上反映了旅游资源品质及其发展程度,相对较高的价格往往表征更完善的旅游环境及更具吸引力的旅游产品。
此外,从交通基础设施方面来看,公路客运量对西北地区旅游流具有显著的正向影响。交通是区域旅游发展的前提条件,由于旅游资源具有不可移动性,目的地交通的通达性影响着旅游者的出行方式和游线选择,成为旅游流的重要吸引因素。
4 结论与建议
4.1 结论
本文基于旅游线路的网络订购数据,以西北五省区旅游目的地为研究对象,构建旅游流关系矩阵,分析各节点及其网络特征,提炼流动模式,得出以下主要结论。
1)西北地区旅游流整体网络结构较为松散,密度较低,内部存在不均衡性,具有明显的核心区和边缘区。边缘区主要集中在新疆西部、陕西大部分地区和甘南地区;核心区主要分布在河西走廊,内部联系密切。
2)区域内少部分节点掌握着绝对的网络权力,节点层级分明。兰州市、西安市、乌鲁木齐市3个节点中心性高,控制力强,旅游流集聚能力突出,与其他节点联系紧密。中卫市等4市是次级核心节点,与核心节点联系紧密,发挥重要辅助作用。海北藏族自治州等8市是重要旅游节点,依附于核心节点和次级核心节点,在区域旅游发展中起着重要作用。阿勒泰地区等14市(州、地区)属于一般旅游节点,有着丰富的旅游资源,但辐射能力较弱。
3)西北旅游网络围绕着核心节点组成三大社群,三个社群内部又组成8个次级社群。各社群内部构成表现出较强的空间邻近性和行政地域性,新疆、陕西各自组成一个社群,甘青宁地区打破了地域隔离,共同组成一个社群。次级社群中,河西走廊旅游区处于核心位置,北疆旅游社群、南疆旅游社群呈现出明显的环线特征。
4)西北地区旅游流受到旅游资源禀赋、旅游接待能力、地区经济水平、交通基础设施等多方面的影响。其中,资源禀赋的优越性是西北地区旅游目的地的重要吸引力,旅游接待能力和地区经济水平是旅游流的关键拉力因素,交通基础设施对于西北地区旅游线路布局和区域发展具有重要意义。
4.2 建议
旅游流反映目的地与客源地之间的互动,通过内部结构的探究有助于把握旅游活动的复杂现象和机制。以往的旅游流研究在网络结构特征方面已有较为丰富的研究成果,在尺度方面主要关注宏观国内外和微观省市层面,本文在此基础上展示了区域内社群结构及城市节点角色对旅游空间结构的刻画能力,进一步丰富了分析维度,更好地指向了中观区域性的旅游流流动特征及空间组织体系。
我国西北地区是中华文明和古代文明的发祥地之一,周边与中亚、北亚诸国接壤,具有重要的战略地位。当前西北地区旅游发展主要依赖自然资源的原生引力,随着旅游需求的迭代,单一资源优势在大量旅游者涌入所带来的负效应中逐渐消弭,区域基础设施建设有一定滞后性,在可持续发展层面遇到挑战。本文从旅游流网络结构入手,深入挖掘西北区域内城市节点及目的地社群结构,剖析空间复杂网络内部的层次结构,有助于厘清区域发展层级。在此基础上,对西北地区区域及地方旅游发展提出以下建议。
第一,加强节点体系建设,强化以西安市、兰州市和乌鲁木齐市为核心节点的辐射作用,挖掘三地现有节点形态特征,发挥枢纽能力,并根据区域和城市间的联系强度和未来联系潜力合理布局综合交通网络。其中,西安市作为陕西旅游社群的绝对核心,应充分发挥其对于社群内部连接的黏性,并以其为抓手加强与甘青宁廊道及甘南等地区的联系。
第二,转变思维方式,通过整合资源和主题提炼打造一批区域深度示范性旅游产品,挖掘多重功能产品,关注边缘节点布局,开发符合旅游者新型需求的高科技、深体验文旅产品,从旅游者需求出发变被动接待为主动引导,通过互联网社交媒体等途径打破宣传时空壁垒,发挥西北地区多元化的旅游发展潜力和城市排他性品牌优势。
第三,优化各区域的政策对接,推进区域间合作。发挥区域社群的集成优势,以链状节点布局网状空间流动为最终发展目标,推进典型区域的客源对接,整合交通节点和信息中心的复合功能,结合游线模式特征规划区域间协同框架,铺设单一化→区域化→整体化发展路径,形成西北地区旅游全域发展模式。
此外,本文主要采用游线大数据对西北五省区旅游流空间结构进行剖析,形成对区域内部流动特征及具体节点挖掘的中观新视角,在一定程度上可以反映西北地区旅游目的地与旅游者行为的空间关系。但囿于数据收集等方面的困难,缺乏对旅游者自身属性特征的刻画,在未来研究中可更为全面地探究旅游者时空行为变化与目的地发展特征的关系,为旅游产业提升与区域协同发展提供更多可能性参考依据。