基于网络大数据的杭州市旅游流网络空间结构特征研究※
2023-09-04窦宇李健
窦 宇 李 健
(浙江农林大学风景园林与建筑学院,浙江 杭州 311302)
随着信息技术、通信技术的不断更新迭代发展,人流、物流、信息流、交通流、资金流等在互联网的推动下能够在全球各地流动,这种流动让原本以地理空间为基础的经济组织结构发生了改变,旅游流则是各种旅游关系构成的社会网络组织。互联网的不断发展使得在线旅游平台(Online Travel Agency)可以提供景区流量数据、游客轨迹信息、客流量变化、旅游消费数据等结构化数据信息及游客评价等非结构化数据信息,因此利用好OTA平台的大数据,对于进一步挖掘区域旅游流量变化、空间变化和深入了解游客行为规律有着十分重要的作用。近年来新冠疫情所导致的游客感知、旅游动机以及旅游资源的利用率等影响直接作用于旅游流的空间结构变化,这也为旅游流的研究带来了全新的视角。本研究利用网络大数据获取近年来OTA平台的游客游记数据,对杭州市旅游流网络空间结构进行分析研究,希望了解区域旅游的发展方向,帮助其发挥当地旅游资源的优势,因地制宜地设计旅游线路并制定合理的旅游发展战略,推动旅游业的健康发展。
1 旅游流网络空间结构研究概况
旅游流网络空间结构可以体现旅游目的地各个旅游节点间的关系,从而能够反映出游客的空间状态,在研究旅游线路组织和节点开发建设等方面有着重要的作用。目前国内关于旅游流网络空间研究起步不久,处于不断丰富的阶段,研究内容涉及多个方面。从研究范围或者研究尺度来看,学者们分别研究了大洲、省域、市域、县域、流域及城市群等尺度下的旅游流网络空间结构特征。任浩科基于网络游记表征的旅游信息流,从新冠疫情对旅游流的影响视角,研究了疫情后宁夏旅游流网络结构的演化特征[1];马丽君以网络关注度为样本,研究了高铁沿线城市旅游流网络结构,并得出高铁对旅游流网络结构在客源地、目的地、旅游资源等方面的影响[2];丛丽综合运用网络数据、地理空间分析等方法,对全国2 100条红色旅游路线及其旅游流网络结构特征进行分析,为我国红色旅游景区的合理规划提供了借鉴意义[3]。
国外学者对于旅游流网络空间结构的研究相对较少,主要通过复杂网络理论及其应用研究旅游目的地利益相关者之间以及网络结构两方面的网络关系。对于旅游流空间结构的研究,最早可以追溯到Smith的《作为空间过程的创新扩散》一书中。旅游流空间结构的研究涉及距离衰减、中心度、空间集聚等方面,如Justyna通过空间数据分析技术,使用空间关联指标结合聚类分析方法识别和衡量旅游流空间集聚“区域间”效应。[4]Mckercher将游客流动的空间结构划分为领域结构模式和线路结构模式,研究两种模式下影响游客行为的因素。[5]
梳理旅游流及社会网络分析法的相关文献,能够看出现有的旅游流研究已形成相对成熟的理论并与地理学科有着深层次的交叉,跨学科研究成果众多。研究方法方面,从早期的定性研究到现阶段以定量定性相结合为重点的研究,模糊综合评价法、函数模型法、熵值法等计量统计方法及Gis空间分析法在旅游流的研究中逐渐成熟,但总体来说具体应用时仍较为单一。研究尺度方面,涉及出入境、国家、区域、省域、城市及县域多个层面的研究,研究成果较为丰富。随着互联网OTA平台的不断发展,聚焦于城市尺度的研究越来越多,也越来越深入,具有时间跨度的时空对比研究逐渐增多。数据来源方面,从早期的官方统计年鉴、问卷调查到现如今的互联网大数据如OTA平台、微博签到等,数据获取方式已呈现多元化,为日后的旅游流研究提供良好的示范。
2 研究区域、数据处理及研究方法
2.1 研究区域
杭州市地处东部地区,为浙江省省会,是浙江省的经济、文化、科教中心,全市下辖10区2县1县级市。2022年杭州市常住人口1 237.6万人,地区生产总值18 753亿元。截至2022年3季度,全年旅游休闲产业增加值为1 068亿元,增长4.5%,旅游总收入1 055.02亿元,旅游总人数为6 204.3万人次。杭州市旅游资源丰富,人文古迹众多,特别是在西湖周边存在大量的自然景观及人文景观,构成了独特的旅游吸引物体系。随着全域旅游的开展,杭州市游客总体接待量逐年攀升,但是新冠疫情的暴发对杭州市的旅游业产生极大的影响。因此研究近年来杭州市旅游流的网络特征,有利于后疫情时代确定杭州旅游业发展路径,优化杭州市旅游空间结构,对杭州市旅游业可持续发展有着重要意义。
2.2 数据处理
基于头部OTA平台如携程网、马蜂窝、途牛及去哪儿等,利用大数据采集工具对杭州市游记进行采集,从中提取杭州市的旅游流流量及流向数据,作为旅游流网络结构的基础数据。数据采集的时间范围为2019年1月1日至2022年12月31日,共采集2 856条相关游记。具体数据处理步骤如下:(1)进行数据清洗,最终得到有效游记1 841条;(2)确定候选节点,共确定了157个游客到访节点作为候选范围,包括111个A级旅游景区及游客热衷的46个网红景点和商业区等非传统景点;(3)提取游记节点,利用Python编写提取节点的程序代码,在海量的游记正文中按顺序提取出游客到访节点,由此顺序在各节点间形成旅游路径,即旅游流;(4)赋值矩阵转化,对提取出节点进行矩阵转换,首列为起点,首行为终点,起点与终点存在联系,即赋值为“1”,无联系则赋值为“0”;(5)二分矩阵转化,游客到访频率前50名的节点,利用Ucinet软件确定断点值为“1”对矩阵进行二值化转换;(6)构建旅游流网络空间结构。
2.3 研究方法
2.3.1 社会网络分析法
社会网络分析是一种连接微观(个体)和宏观层次(群体)的社会学理论工具,通过统计学的定量分析工具研究社会网络中各种社会单位构成联系的结构及特征。刘军编著的《整体网分析——Ucinet软件使用指南(第三版)》详细阐述了社会网络分析中各个评价指标的计算方法。本研究以近几年杭州市旅游流为研究对象,通过度数中心度、中间中心度、接近中心度、结构洞、核心边缘、网络密度、凝聚子群等指标分析杭州市旅游流在主要到访节点之间的流动特征以及网络结构特征。
2.3.2 空间分析方法
空间分析是对地理空间现象的定量研究,是GIS的核心。GIS空间分析是指在GIS中对地理空间数据进行关于地理对象空间位置、空间分布、空间形态及其形成和演变特征的定量分析,此外还能够对分析结果进行可视化呈现,推动信息系统技术广泛应用于各行各业。本研究利用ArcGIS10.6软件中的空间分析功能,对杭州市旅游流的空间结构进行可视化表达,利用软件中的反距离加权插值功能及点转线功能分析杭州市旅游流空间格局的特征。
3 结果与分析
3.1 网络结构特征分析
通过Ucinet软件分析近年杭州市旅游流网络结构特征,利用度数中心度、接近中心度、中间中心度、结构洞、核心—边缘结构、凝聚子群指标进行杭州市旅游网络结构的特征分析,具体见表1。
3.1.1 度数中心度分析
节点的度数中心度大小直接反映了该节点与其他节点之间联系的强弱,能够衡量哪些节点位于网络结构中的中心地位[6]。杭州旅游流网络结构中节点度数中心度平均值为3.020,是指近几年杭州市旅游流中每个到访节点平均和另外3.020个节点产生旅游流动联系。从标准差来看,内外型度数中心度的标准差分别为3.917和2.950,存在一定的差异但差值在1以内,说明游客偏好集中在某些知名景点,旅游流网络均衡性有待进一步提高。
从整体来看,扩散辐射型节点共有14个,以西湖、良渚、湘湖、太子湾公园为代表,此类节点通常承担分流作用,将旅游流从该节点分流扩散至其他节点;吸引聚集型节点共有19个,以千岛湖、雷峰塔、九溪为代表,此类节点具有较强的吸引作用,能够将游客流量从其他节点引入到该类节点中;平衡型节点共有17个,以西溪湿地、河坊街、七里扬帆为代表,此类节点无须依赖其他节点也能拥有一定的游客量,同时也可承担一定程度的分流作用,旅游流的流入与流出比较平衡。
3.1.2 接近中心度分析
节点的接近中心度直接反映了该节点与其他节点之间通达程度的高低,能够衡量节点与到达其他节点的距离远近[7]。杭州旅游流网络结构中内外接近中心度的平均值分别为6.198和10.470,区域内节点间通达程度不高。从标准差来看,内外型接近中心度的标准差分别为3.549和2.881,波动性较小,但节点间的通达度存在一定程度上的差异。
西湖、千岛湖、大运河、雷峰塔、九溪、良渚、西溪湿地、植物园等节点内外接近中心度均比较高,是杭州市网络结构中的核心节点,在旅游流中处于中间位置,具备优越的通达度。而杭州乐园的内外接近中心度极低,说明其通达度和可达性都很低,往往被游客忽视,容易成为网络结构中被孤立的节点,这有可能是因为疫情的影响,导致此类游客聚集型的节点游览量急剧下降。净流出型节点以茶叶博物馆、灵山风景区、胡雪岩故居、龙门秘境为典型代表,具备很强的通达度,易于前往其他节点,一般充当旅游流中的流出点;当节点内向型接近中心度远大于外向时,这类节点为“净流入型节点”,以下姜村、文渊狮城、钱王祠为代表,自身缺乏吸引力,依赖于其他节点游客的流入,难以成为游客在进行旅游线路规划时的首选目的地。
3.1.3 中间中心度分析
节点的中间中心度大小直接反映该节点在旅游流网络结构中的重要性、活跃度以及对其他节点的控制力[8]。当某节点作为中间节点时,经过该点产生联系的节点越多,其连接线条(即路径)也就越多,体现了该节点的中转功能。杭州旅游流网络结构中的节点中间中心度的平均值为66.550,表示平均每个到访节点将会充当66.550次中转站;标准差为204.351,节点中转能力差异明显。中间中心度最高的是西湖,高达1 326.793,说明西湖在旅游流结构中是绝对核心枢纽节点,作为流入和流出点时承担着最重要的中转作用,对于其他节点拥有极强的控制力,在整个网络结构中占据主导地位。
通过观察,发现高于中间中心度均值的仅有西湖、千岛湖、大慈岩、九溪、良渚、大运河、严子陵钓台、南山路、虎跑公园这9个节点,这些节点大部分是传统景区,长期以来积攒了较高的人气,依靠其自身丰富的自然人文旅游资源、便捷的交通条件以及良好的区位条件成为旅游流网络结构中重要的枢纽节点。中间中心度为0的节点包括灵山、天子地、龙门秘境、严州古城、钱王祠等共有19个节点,这些节点几乎不具备中转功能,游客也很少逗留,在网络结构中存在感低,处于被支配的地位,依赖其他核心节点带来旅游流。
3.1.4 结构洞分析
结构洞是指在社会网络中互相不存在联系的节点所形成的空位,简单来说就是在网络中节点没有产生相互联系的现象。结构洞的大小反映了节点在旅游流网络的竞争力以及可替代性的强弱。西湖、千岛湖、雷峰塔、良渚等节点的有效规模和效率值均排在前列,表明这些节点的结构洞优势明显,具备较强的竞争力,难以被其他节点替代,能够吸引大量游客流入。但是这也会导致游客扎堆现象的出现,特别是在节假日时期,游客的蜂拥而至会使节点周边的交通压力剧增、环境承载压力增大、社会事件高发(如犯罪事件、踩踏事件等)。因此需要对此类节点周边的交通设施加以完善,做好旅游旺季的分流、引流,保护生态环境并加强社会治安维稳工作,减少社会事件的发生频率,做到社会、自然和谐发展,同时带动周边节点的发展,推动区域旅游的可持续发展。而如塘栖古镇、武林广场、啤酒小镇、钱塘江大桥、钱王祠、文渊狮城等节点有效规模低、效率低、限制度高,说明其几乎没有任何结构洞优势,极易被替代,高度依赖其他核心节点带动。因此需要对该类节点进行旅游规划,加强开发、整合线路并进行营销宣传工作,增加与周边核心节点的联系与合作,逐步提升其吸引力。
3.1.5 核心—边缘结构
核心—边缘结构主要用来分析网络结构中各节点间的联系程度,将网络结构分为两个区域——核心区和边缘区,通过对网络结构中各节点的区域划分来分析核心区和边缘区的依赖关系。利用Ucinet软件中的核心边缘分析功能,可以得到各个阶段的核心—边缘节点、分块邻接矩阵和密度矩阵,通过整理可以得到表2。
表2 核心区、边缘区节点分布及密度
通过表2可知,核心节点有10个、边缘节点40个,其中核心节点分别是西湖、西溪湿地、千岛湖、雷峰塔、河坊街、大运河、宋城、湘湖、良渚、九溪。核心区中节点之间的联系密度为0.4;边缘区中节点之间的联系密度为0.027;核心节点和边缘节点之间的联系密度则处于0.080~0.102之间。核心区节点自身之间的联系密度大于边缘区节点,存在明显的旅游流网络结构的分层现象,此外核心区和边缘区的节点交流频率低、互动较弱。总体来看,杭州市旅游流网络结构呈现出高度集中性,其辐射扩散作用明显,但是需加强核心区与边缘区以及边缘区内部节点之间的联系,推动旅游流整体网络结构的均衡可持续发展。
3.1.6 凝聚子群
凝聚子群是指社会网络中的小群体,这些小群体具有某些共性,且组成群体中的个体存在一定的联系。在旅游流网络中,研究其凝聚子群可以了解网络结构中各节点的集群状态及联系,一般从彼此关系的便捷性、各到访节点间的可达性、凝聚子群内节点的联系的频率及密度等方面来分析,通过Ucinet软件中的CONCOR功能整理得到三级凝聚子群分区图(见图1)。子群3、5、7、8各自内部的联系密度分别为0.117、0.45、0.55和0.50,说明人们可以小范围、短距离的出行,子群内部阶段在地理位置上较为接近且旅游资源重复率比较低,即使在杭州市小范围、短距离的旅游出行也能释放人们的旅游出行欲望。除此以外,子群1与子群3、4,子群3与子群1,子群8与子群5都有着远高于平均水平的联系密度,这与子群间节点地理位置相近有着一定关系。
图1 凝聚子群成员聚类树形图
3.2 空间结构特征分析
3.2.1 节点流量空间分布格局
对杭州市旅游流中的游客到访节点进行反距离加权插值,将节点位置数据导入至ArcGIS中,并关联其游客到访频次数据,利用统计分析中的反距离加权插值法进行分析,并对其结果进行重新分类,得到杭州市节点流量空间分布格局,根据游客到访频次的空间插值结果由低到高可将杭州空间分为1~5种类型。
第5类空间主要分布在以西湖、千岛湖、良渚、通天河等节点为核心的区域。西湖、千岛湖周边区域为第4、5类空间范围,也是人们较爱前往的目的地。除此以外,良渚、严子陵等节点也成为区域到访频次较高节点。第4类空间分布以桐庐县天字地和严子陵钓台、建德市东西部、临安天目山等区域为典型代表,这主要是因为杭州市全域旅游工作的推动以及后疫情时代旅游业发展政策的扶持,出现了如“畅游杭州一票通”等引导性营销手段,吸引游客前往杭州西部,帮助旅游业恢复,同时推动了旅游业的可持续发展。
总体来看,杭州市旅游流流量以西湖、千岛湖的流量为最大,并向周边地区辐射扩散。西湖及其周边节点处于全市的核心位置,该地区到访频次最高是因为其旅游资源丰富,知名度高,千岛湖因为优美的自然风景成为人们的休闲胜地。临安区天目山、余杭区良渚、桐庐县严子陵钓台及垂云通天河周边地区的游客到访频次也较高,成为区域次级核心节点。钱塘区大部、萧山区南部、富阳区大部、临安区东西部及淳安县西部地区节点游客到访频率较低。整体来看,杭州市节点流量分布情况自西向东呈现出三低两高相间式分布。
3.2.2 流动路径空间分布格局
通过匹配各个节点的经纬度能够确定各节点的地理位置坐标,将其投影至ArcGIS中,确定旅游线路的起点、终点及经过节点的位置以便明确旅游流流向,关联各节点的到访频次数据作为旅游流流量,利用ArcGIS工具箱中数据管理工具的“XY转线”功能对杭州市旅游流流动路径空间格局进行可视化呈现,得到图2。通过自然断点的分级方法,线条的颜色及粗度代表不同级别的旅游流流动强度,根据线条承载的流动强度大小由低到高将流动级别分为一级到五级。
图2 杭州市旅游流流动路径分布图
如图2所示,旅游流流动空间格局共有112个节点和579条流动路径。包括9条四级流动、17条三级流动、147条二级流动及406条一级流动。四级流动主要包括东部“西湖—雷峰塔/西溪湿地/满觉陇/宋城”“宋城—良渚”,中部“严子陵钓台—瑶琳仙境”,西部“千岛湖—天子地/啤酒小镇”三条主要线路。三级流动包括“西湖—千岛湖”,东部主城区“西湖—大运河/河坊街/九溪/良渚/西泠印社/城隍阁”,中部“大奇山—瑶琳仙境—严子陵钓台”,西部“千岛湖—森林氧吧”“灵栖洞—大慈岩”。东部主城区承载着大规模、高强度的旅游流流动;西部淳安县千岛湖、中部桐庐县瑶琳仙境均与周边节点的流动有所提升,特别是与南部各节点之间加强了联系,形成了区域闭合的旅游流流动;北部以临安区天目山为核心节点,保持和东部主城区节点之间的流动,并加强与临安区内部大明山景区的联系,但是与西部淳安县千岛湖的流动较弱。近年来杭州市旅游流的分布总体呈现出以东部西湖、中部通天河、西部千岛湖和北部天目山为流动核心节点的“多点式分布”,流动分布更为均衡。
杭州市旅游流流动路径呈现出多节点、小规模、短距离特征的流动模式,这在一定程度上推动了区域旅游的快速发展,让平时到访频率较低的节点得到了发展机会,因此这些节点需要抓住机会加强宣传,并与核心节点加强区域合作产生一定吸引力,促使游客重游或者推荐他人前来游憩。
4 结论与建议
4.1 结论
4.1.1 杭州市旅游流节点网络结构特征
雷峰塔、河坊街、大运河、西溪湿地、千岛湖等节点流量大,自身吸引力较强,结构洞优势明显,具有极强的不可替代性,一直处于旅游流的核心区域。部分节点如动物园、杭州乐园和浙江大学未能承受住疫情的冲击,被逐渐边缘化。但区域核心节点的成长得到了人们的关注和青睐,相比疫前扎堆前往西湖这类传统节点,天目山、大慈岩、严子陵钓台、瑶琳仙境等非主城区的郊区节点流量得到了提升,区域核心节点的引流效果突出,杭州市旅游流节点的流量分布更加均衡。
4.1.2 杭州市旅游流整体网络结构特征
杭州市旅游流网络结构中节点之间的联结频率较低,游客游玩路径中涉及的节点数量较少。疫情对于旅游流的负面影响十分显著,旅游流的流动受到约束。杭州市旅游流整体网络的中心化程度较高,核心节点之间具有密切联系。短途旅游得到青睐,边缘区域节点不断丰富。子群内部节点以及与其他子群的联系密度存在着一定差异,层级结构特征明显。疫情的影响导致凝聚子群的分布与组合受核心节点的控制减弱,受到地理位置的影响作用加强,分布更加均衡,形成“一超多强”——以西湖主城区为整体网络核心,千岛湖、天目山、通天河为区域核心的层级结构,多极化发展明显。
4.1.3 杭州市旅游流空间结构特征
在节点流量分布上,主城区西湖、淳安县千岛湖为到访频次最高区域,并以二者为核心向周边不断衰减扩散,说明西湖、千岛湖为核心区域,区域内节点联系最多、流量最大。小规模、短距离的出行得到人们的青睐,这加剧了本地游客市内游的频率,原本到访频率较低的节点受到了人们的关注,部分流量开始向非核心节点转移。节点流量自西向东呈现三低两高相间式分布。“三低”在地理位置上对应为淳安县西部、富阳区大部、钱塘区大部地区;“两高”对应为淳安县千岛湖景区—建德市西部—桐庐县中部地区以及以西湖为核心的主城区节点分布区域。在旅游流流动路径的分布上呈现多点式分布,由往日的大规模、长距离、集中流向知名度较高的传统核心旅游景区转变为小规模、短距离、分散流向区域小众核心景点,但依旧主要集中在少数高级别相邻节点之间。
4.2 建议
4.2.1 节点优化
杭州市旅游流网络结构中,节点之间存在明显的层级结构。因此可将到访节点划分为核心节点、区域核心节点、潜力节点和冷门节点4个不同类型。对于核心节点,需进一步完善旅游接待基础设施的建设,加强景区的分流引流工作、社会治安管理工作以及公共卫生工作,保证游客的旅游质量。对于区域核心节点,要加强与核心节点的交流,承接核心节点的流量,增加游客在区域游憩中的旅游时长。对于潜力节点,要加强与区域核心节点的联系,加强基础设施如交通、接待等设施的建设,同时做好宣传工作,进行差异化定位,吸引游客的二次重游,保证可持续发展。对于冷门节点,需要加强与核心节点合作,完善交通条件,增加其可进入性,同时挖掘自身的文旅特色,加强宣传工作,做好市场细分,先吸引部分游客前来游玩,做好口碑建设。
4.2.2 网络优化
完善交通网络的布局,构建以旅游通道为主体的旅游交通服务网络,连接更多的节点,能够增强旅游流节点之间的联系密度以及网络规模;另外通过建立旅游专线连接距离较近的节点,可以扩大区域旅游的选择范围,提升冷门节点的可进入性,完善区域旅游一体化的交通网络体系。因此,可以利用错位竞争合作模式、“攀附”发展合作模式推动核心区域与边缘区域的互补完善,提升流动强度。除此以外,还要加强信息网络的建设,构建集景点宣传、咨询发布、产品预订等功能于一体的智慧信息平台,使得游客获得多样化的相关旅游资讯,做好旅游规划。
4.2.3 空间优化
受疫情影响,杭州市旅游流的节点流量由原有的集中在以西湖为核心节点的主城区部分转移至天目山、通天河、千岛湖等区域核心节点,节点流量的分布更加均衡,形成了多级发展的趋势。针对节点流量分布格局上的变化,可以区域核心节点为中心,划定不同主题类型的旅游片区,带动片区内节点的发展,稳固片区旅游流,提升整体旅游流的均衡性。根据旅游流流动路径的分布特征,以区域核心节点为起始点进行连接,形成区域旅游发展轴带,通过对旅游发展轴带的建设,提升交通可达性以及沿途基础设施的建设,推动主城西湖核心区域与区域核心区的联动,更好地发挥核心节点的辐射作用,如此将有利于分流引流工作的有序性开展,同时能够增加整体旅游流的活力,提升空间分布格局的均衡性。