APP下载

基于数字足迹的广州市旅游者时空行为特征研究

2022-10-08王润源程绍文

资源开发与市场 2022年10期
关键词:游记景点时空

王润源,程绍文

(1.华中师范大学 城市与环境科学学院,湖北 武汉 430079;2.中国旅游研究院武汉分院,湖北 武汉 430079)

0 引言

旅游者的时空行为是旅游地理学研究的热点问题。当前,信息技术深刻地影响着人们的出游方式和旅游行为,许多游客从网络获取、分享和交流旅游信息,为旅游者行为研究提供了大量开放和易获取的数据源。人们在各类社交媒体、网站发布的行程信息即产生“数字足迹”[1]。“数字足迹”是人们在网络上或其他信息系统上所留下的与其行为相关的信息,通过对这些信息的分析可以反映出用户的某些行为现象和规律[2]。在国外,Girardin 等[3]较早采用旅游数字足迹,通过在Flickr 社区上收集的4280 名拍摄者在佛罗伦萨拍摄并公开分享的带有地理信息的照片,利用地理可视化方法揭示了游客集中区域和时空流向。在我国,李君轶[4]最早提出“要利用旅游数字足迹数据开展游客时空行为的数字足迹模型、游客旅游行为的时空规律、高效的旅游行为智慧化支持机制和旅游目的地空间结构优化研究,以揭示游客的时空轨迹。此后,学者借助各大旅游平台、网站获取游客的“数字足迹”对其时空行为进行分析的研究不断增多。如:有学者以省域、城市或景区为研究案例地,基于带有地理信息的照片[3,5]、手机信令[6]、网络游记[7-9]、微博签到数据[10,11]、微信“朋友圈”[1]等开展旅游者时空行为模式及特征研究;也有学者利用旅游数字足迹探讨了旅游者旅行的“时空体验流”特征,分析了旅游者的时空行为与难忘旅游体验[12]和 情 绪[13]、保 护 教 育 感 知[14]、游 客 旅 游 消费[15]之间的关系,或将GPS 或GIS 空间分析技术应用于旅游者时空行为研究,进行旅游热点分析和网络分析,从海量数据中发现规律,进而提升对旅游者行为的认识[16]。

城市是重要的旅游目的地,随着城市旅游化发展,旅游深刻地改变着城市的发展,但目前对城市旅游者的空间行为研究却十分有限[17]。传统上,人们主要是通过问卷调查方法来研究城市旅游者空间行为,但调查方法样本量小,无法在城市旅游者的空间行为数据中同时注入时间和空间属性,调查数据也缺少准确性和有效性[18]。网络大数据可为城市旅游研究提供充分的时间和空间数据,提示和反映城市大规模游客流的时空模式。利用网络大数据研究城市旅游者时空行为分析对厘清城市旅游空间结构,优化城市规划布局,加强城市旅游吸引要素与服务设施之间的联接配套,进行高效的智慧旅游目的地和智慧城市管理具有重要意义[18]。目前,学术界基于数字足迹研究了青岛[8]、北京[13]、马德里[17]、南京[19]、成都[20]等城市的旅游者时空行为特征,有学者利用网络数据分析了北京、西安、重庆、苏州、广州城市夜间旅游游客体验[21]。

广州市是国家和粤港澳大湾区中心城市,是华南地区的海陆空交通中心。作为国内重要的旅游城市,广州拥有丰富的旅游资源,3A 级以上景区共69个。2019 年,广州市接待过夜游客6773.15 万人次,旅游业总收入4454.59 亿元[22]。当前,广州旅游业正处在转变发展方式、转换增长动力的关键时期,如何提升服务质量,满足游客多样化的需求,是增强其旅游竞争力面临的重要问题[23]。截止目前,对广州游客的研究主要集中在游客体验质量、满意度和旅游地形象和旅游影响感知等方面(如李培奇等[24]对广州流溪河国家森林公园生态体育旅游者的行为进行了定量研究),鲜见探讨广州城市旅游者的时空行为及城市旅游空间结构的研究文献。本文基于网络大数据,采集旅游者数字足迹数据,运用文本分析与GIS空间分析方法对来穗游客的时空行为特征进行了探究,以期为广州城市旅游规划管理和高质量发展提供理论依据和决策参考。

1 数据采集与研究方法

1.1 数据采集

本文数据来源于马蜂窝网站,该网站是我国著名的旅游社交平台,拥有众多用户,许多游客在此实时发布旅游游记、攻略、点评等信息[25]。采用八爪鱼采集器,以“广州市”为关键词,从马蜂窝网站进行网络游记数据采集,游记数据时间范围为2016 年1 月1 日至2021 年4 月30 日。基于下列标准对获取的原始游记样本数据进行筛选:①游记内容完整,出现明确的出游时间和游玩天数,且时间范围必须在2016年1 月1 日—2021 年4 月30 日之间。②游记内容出现旅游景点,能判断游玩顺序,且至少有两个及以上的旅游节点信息。③剔除带有商业营销和推荐的游记。最终筛选出有效游记1863 篇,同时爬取相应游记中的出发时间、出行天数和同伴类型,建立广州市旅游者时空行为特征数据分析库。在此基础上,依据用户的行程日期顺序确定旅游流流向,以此分析游客出行时的旅行轨迹。

1.2 数据预处理

由于低频率旅游节点的分析意义较小,因此不纳入本文统计分析。部分旅游节点存在包含关系,如长隆野生动物世界、长隆水上乐园、长隆飞鸟乐园在统计时归为长隆旅游度假区,广东省博物馆、广州图书馆、广州大剧院在统计时归为花城广场,广州博物馆、五羊雕像、中山纪念碑在统计时归为越秀公园。此外,参考刘益等[25]的研究,将珠江夜游也归于旅游节点。

1.3 研究方法

内容分析法:内容分析法是将非系统和非定量的符号内容(如文本、图像、图片等)转化为定量数据,并针对数据里面的内容进行定量分析、判断与推理,是文献研究中经常采用的一种方法[26]。本文借助ROST Content Mining 6 文本分析软件对游记文本进行了详细分析。首先,对相关网络游记文本进行筛选整合;其次,利用软件对网络游记进行分词处理;第三,对分词处理后的文本进行词频分析,同时对游记内容进行语义网络分析,结合词频分析和语义网络分析结果来揭示游客在广州市的旅游行为选择特征。

核密度分析:核密度分析可反映地理要素空间的分布规律,本文采用核密度分析法探究游客在广州市的空间集聚特征。计算公式为[27]:

赫芬达尔指数:运用赫芬达尔指数分析不同同伴类型的游客在游玩季节分布上的集中程度,计算公式为[28]:

式中:Pi为第i 个季节某一同伴类型游客的数量占该同伴类型游客总数的比值。H 值越接近于1,表示该类型游客在出行季节的选择上越集中;反之,则越分散。

2 游记高频词汇与语义网络分析

基于游记内容,运用ROST Content Mining 6 软件进行词频和语义网络分析,采用停用词表与自定义词表排除无意义的词汇,同时对某些相似词汇进行合并,最终生成前30 个高频词统计表(表1)与语义网络分析图(图1)。结合表1 和图1 可见,这些高频词汇和语义网络图直观体现了游客在广州吃、游、行、住等方面的行为特征。

在饮食方面,表1 中出现“好吃”“味道”“早茶”“美食”“餐厅”等众多相关的高频词汇。其中,早茶是广州饮食文化中最重要的一环,来广州饮早茶是游客十分青睐的旅游行为选择。在语义网络分析图中,节点词越靠近,表示它们之间有着越密切的关系[8]。从图1 可见,与饮食相关的节点词与中心词“广州”邻近,再次印证了“吃”是游客在广州的重要行为,“食在广州”的印象深入人心。在景点选择上,“沙面”“上下九步行街”“广州塔”“石室圣心大教堂”“陈家祠”等是广州游客选择最多的游览景点。在语义网络中,“建筑”与多数旅游景点词相近,说明游览景点中各种特色建筑是游客在广州又一重要的旅游行为特点。游客游览的主要景点中既有陈家祠那样的古典广式建筑,也有石室圣心大教堂那样的哥特式建筑,还有广州塔那样的现代化地标建筑,这些旅游资源丰富了广州的旅游形象。在出行交通选择上,“地铁”的词频远高于“步行”“公交”“打车”,说明地铁是游客游览广州最主要的交通方式,从侧面体现了广州发达的地下交通网络系统。在住宿上,游客主要的选择是“酒店”,且在语义网络中该节点词和“地铁”这一交通方式和“沙面”“广州塔”“石室圣心大教堂”“陈家祠”等景点距离较近,说明游客更倾向选择在景点周边或靠近地铁站的酒店,以方便第二天的游览。此外,“晚上”与“广州塔”和“上下九步行街”邻近,说明游客喜欢在夜间游览这些景点;“拍照”一词也是游客旅游行为的重要特征词,可见游客在旅行时习惯用照片进行记录。

表1 广州旅游游记高频词Table 1 High frequency words in Guangzhou online travel notes

图1 广州旅游游记语义网络Figure 1 Semantic network of online travel notes for Guangzhou

3 广州游客时间行为特征分析

3.1 月度特征

根据游记中提取的时间信息对广州游客出行月度特征进行分析。受新冠肺炎疫情的影响,全国旅游业在2020 年初遭遇重大打击,对游客的出行选择造成了影响。因此,提取2020 年5 月—2021 年4 月游记的时间信息探究疫情后游客出行的月度特征,并与总体的月度特征进行对比分析(图2)。由图2可知,总体研究时段上广州游客出行有3 个高峰时间段,分别是2 月、4 月和10 月,对应春节、劳动节、清明节和国庆节几个假期,说明节假日是游客来广州旅游的高峰时段。但受新冠疫情的影响,疫情后游客出行的月度特征发生了一定变化,原本高峰时间段的2 月出现旅游人次的“低谷”,这主要是由于2021年春节假期邻近时人口流动增大,给各地防疫带来了极大压力,许多地区纷纷倡导“非必要不出省”“就地过年”,由此影响了旅游地的客流量。直到3 月,游客流量出现明显回升,4 月成为客流量高峰期,旅游人次占比最大,而剩余时间段与总体趋势较为吻合。

3.2 季度特征

在季节特征分析上,依据中国气象局的划分标准,春季为3—5 月,夏季为6—8 月,秋季为9—11月,冬季为12—2 月。为进一步分析同伴类型对游客出行时间的影响,结合马蜂窝网站所提取的游客同伴类型,将其划分为个人、朋友/同学、情侣/夫妻和家庭/亲子4 种。通过对最终网络游记文本中提取的时间属性数据的统计分析(图3),广州客流主要集中在冬季,其次是春季和秋季,夏季的旅游人次最少。出现此现象的原因与广州“夏季高温多雨,冬季温和少雨”的亚热带季风气候有关:夏季户外温度较高,不适宜外出游玩;冬季,广州相较于全国大部分地区较为温暖,吸引了众多游客。4 种伴侣类型出行时间与总体季节特征较为相似,冬季所占的比重最大,夏季所占的比重最小,仅在春秋两季有所差异。

图3 广州游客出行季度特征Figure 3 Seasonal characteristics of tourists in Guangzhou

为进一步探究不同同伴类型出行季度特征的差异,根据公式(2)计算了不同同伴类型游客游玩季节分布上的赫芬达尔指数。可以发现,家庭/亲子游类型的游客赫芬达尔指数最大(H = 0.323),随后依次是情侣/夫妻(H =0.274)、朋友/同学(H =0.264),个人游的季节集中指数值最小(H = 0.260)。家庭/亲子游的出行人数较多,出游时间的选择受限较大,一般选择在节假日旅游。冬季的时间段孩子正逢寒假,大人也有春节假期,且此时广州气候适宜,因此家庭游的游客会更集中在此时间段出行。个人既可以利用节假日出游,也可以利用周末进行短期游,出游时间选择上更加自由,因此个人游在旅游的季节选择上相对更分散。

3.3 出行天数特征

对游客总体和不同伴侣类型游客的出行天数进行统计分析(图4),结果显示:游客在广州的停留时间整体偏长,主要为3—5d,占比超过72.82%,说明广州旅游资源丰富,许多游客要花费较长的时间进行游览和体验。从游客同伴类型看,朋友/同学、情侣/夫妻的日度特征与总体特征类似。个人游类型中,“一日游”的比重较高,达到33.15%,69.56%的个人游游客到广州游玩的天数在3d以内,说明个人游的游客更偏向短期旅游。与此相反,家庭/亲子游的游客集中在长期游,出行天数在5d及以上的游客占比达41.09%。

图4 广州游客出行天数特征Figure 4 Characteristics of travel days of tourists in Guangzhou

4 广州游客空间行为特征分析

4.1 景点空间分布和游客空间集聚特征

经过数据整理,最终得出32 个来穗游客到访的景点(表2)。运用百度地图查询广州游客主要到访景点的坐标,以广州市行政区划矢量图为底图,将整理后的各景点坐标系导入ArcGIS 软件,形成游客到访景点的空间分布图(图5)。同时,以旅游人数为统计字段,对广州市各个景点进行密度分析,得到游客到访景点的密度分布图(图6)。

图5 游客到访景点空间分布Figure 5 Spatial distribution of tourist attractions

图6 游客空间集聚密度分布Figure 6 Spatial concentration density distribution of tourists

表2 广州游客到访景点频率统计Table 2 Statistical ranking of the occurrence frequency of online travel nodes in Guangzhou

结合表2 和图5 可知,游客到访景点的分布具有明显的空间差异性,主要集中在荔湾区、越秀区、天河区和海珠区等中心城区。其中:荔湾区和越秀区是广州著名的老城区,拥有众多历史文物古迹和民国时期建筑,区域内有着众多老字号,是品尝地道广州美食的重要去处;天河区是广州的商业和文化中心,交通便利、基础设施完善、高楼众多;海珠区旅游景点类型丰富,广州塔、海珠湖湿地公园、琶醍啤酒文化创意艺术区等各具特色。近郊区的白云区、黄埔区和番禺区等由于距离市中心较远,交通不便,其到访景点数量明显少于上述3 个核心区。远郊区的增城区、花都区和南沙区由于开发历史较晚、知名度低、基础设施相对落后、旅游景点匮乏、游客数量较少、游记中游客提及稀少,故未纳入统计。这也反映出广州远郊区的旅游发展与中心城区和近郊区有着巨大的差距,尚未形成城郊一体的旅游发展格局。

从图6 可知,广州游客的空间密集特征与到访景点空间分布类似,呈现“城市中心区高,城市边缘区低”的特征,集聚的密度值大致由中心城区向外围减少。其中,在越秀区和荔湾区的交界处和天河区的西南部形成较大范围的集聚中心,该集聚中心内景点众多、知名度高、交通便捷,吸引了大量游客。而在番禺区的北部与南部、黄浦区与海珠区的交界处和白云区的南部也形成了小范围的集聚,这些集聚区的景点包括长隆旅游度假区、黄埔军校旧址纪念馆、岭南印象园、白云山风景区等,受中部集聚中心的辐射带动作用,具有一定的客流量,但集聚程度远低于中部地区。

4.2 日间和夜间游客的空间集聚特征差异

为了解游客在日间和夜间出游的差异,以18:00为界,对日间游客(游客旅游活动主要发生在白天,截止18:00 结束)和夜间游客游客(18:00 以后开始游玩)的出游行为特征进行统计(表3),并运用ArcGIS软件进行密度分析,可直观揭示广州游客在日间和夜间集聚特征差异(图7 和图8)。由表3 可知,日间和夜间游客主要的旅游节点有明显差异。在日间,游客多喜欢造访人文历史类景点,这些景点在夜间多数不开放,排名前三的沙面、石室圣心大教堂和陈家祠,其频率均超过10%。此外,还包括中山纪念堂、西汉南越王博物馆、黄埔军校旧址纪念馆等。夜间,游客最喜欢游玩的景点和活动包括广州塔(频率达到26.53%)、珠江夜游、长隆旅游度假区、花城广场、海心沙、琶醍等,这些景点提供夜游活动项目和服务,游客夜间去这些景点旅游会有更好的游玩体验,广州的灯光节也主要在这些景点展开。从图7 和图8 可见,日间游客主要集聚在荔湾区和越秀区,而夜间游客集聚中心主要集中在海珠区、天河区和越秀区。此外,广州日间游客的集聚密度明显高于夜间游客,其密度差异可以达到10 倍,说明广州夜间旅游发展有较大的发展空间。

表3 日间和夜间游客主要到访景点Figure 3 Day and night tourists mainly visit tourism attractions

图7 日间游客空间集聚密度分布Figure 7 Spatial concentration density distribution of tourists in daytime

图8 夜间游客空间集聚密度分布Figure 8 Spatial concentration density distribution of tourists at night

4.3 游客旅游轨迹特征

本文基于数据库中的游记内容,提取每个游客在广州市的旅行轨迹,运用ArcGIS 软件进行可视化表达(图9),并采用ROST软件的社会网络分析和语义网络分析功能构建广州游客旅游流网络结构(图10)。图9 和图10 中,线条的粗细代表了旅游流量的大小,线条越粗,旅游人次越多,反之则旅游人次越少[8]。

图9 广州游客旅游轨迹空间分布Figure 9 Spatial distribution of travel trajectory in Guangzhou

图10 广州旅游流网络Figure 10 Network of tourism flow in Guangzhou

从图9 可见,广州游客的旅游轨迹存在明显的区域差异,其旅游轨迹主要围绕荔湾区、越秀区、天河区、海珠区4 个中心城区为中心向周围辐射,这4个区域集中了广州最精华的旅游资源,且区域内交通便利,形成巨大的旅游流量;而白云区、黄埔区、番禺区的景点距离中心城区较远,客流量较少。

从图10 可见,沙面为一级节点,该景点知名度高、周边交通便利,兼具娱乐观光和休闲就餐的功能,因此游客的旅游活动主要围绕其展开。石室圣心大教堂、上下九步行街、广州塔、陈家祠为二级节点,一级节点和二级节点之间联系较密切,形成庞大的客流量。越秀公园、北京路步行街、中山纪念堂、中山大学南校区、西汉南越王博物馆、花城广场、永庆坊、海心沙公园、中山大学南校区、红砖厂创意园为三级节点,这些旅游节点有一定的客流量,且与一、二级节点存在较为紧密的联系。而永庆坊、黄埔军校旧址纪念馆、西关大屋、长隆旅游度假区、白云山风景区为旅游的四级节点,其客流量明显少于一级和二级节点。

5 结论、建议与讨论

5.1 结论

本文以广州市为例,以马蜂窝网站游客分享的网络游记为基本数据源建立数据库,运用内容分析与GIS空间分析和可视化的方法探究了广州游客的旅游行为特征。主要结论如下:①广州游客旅游行为选择具有多元性,游客不仅喜欢品尝广州美食,还喜欢游玩广州各具特色的建筑。出行选择上,地铁是游客出行的主要交通工具;住宿选择上,广州游客旅游消费行为具有选择上的集聚性,出于便利原因,游客更倾向于以景区景点为中心来选择住宿酒店,也更倾向于去距离地铁站点较近的景区游玩。②不考虑疫情因素,受气温和假期的影响,游客喜欢在冬春和秋季来广州旅游,表现为冬季最旺,春秋次之,夏季则为淡季。家庭游的游客喜欢在冬季特别是寒假、春节期间来广州旅游,出行天数较长,多在4d 以上;个人游游客的季节分布更为分散,多为3d 以内的短期游。疫情的出现改变了广州旅游的月度分布特征,作为旅游高峰的2 月不再成为旅游高峰月。③由于广州中心城区的景点数量远多于近郊区和远郊区,因此游客的旅游活动空间主要集中在中心城区,即越秀区、海珠区、荔湾区和天河区,游客空间聚集具有明显的极化特征。此外,日间游客主要在荔湾区和越秀区集聚,夜间游客则在天河区、海珠区和越秀区集聚。④游客旅游流网络主要围绕沙面、石室圣心大教堂、上下九步行街、广州塔、陈家祠等旅游节点向外展开,其中,一级节点和二级节点联系紧密,相互间的客流量大。

5.2 建议

基于研究结论,为实现广州旅游的优化发展,提出以下建议:①积极推动餐饮与文旅结合。“美食”是对广州游客重要的吸引要素,政府应扶持具有广府特色的餐饮企业,充分借助各大新媒体平台(如微信、微博、抖音等)加大宣传营销力度,打造一批网红品牌和餐饮店,提升知名度,吸引更多的客流量;线下可推出美食旅游线路,如沙面—上下九—荔枝湾涌—陈家祠—永庆坊一线的荔湾区美食文化之旅。同时,各景点应依据自身特色和周边餐饮点的集聚情况,建设美食文化区或美食街,丰富游客的旅游体验。②积极发展夜间旅游经济。广州夜生活丰富,天河区、越秀区和海珠区等夜间客流量大的区域,可依托珠江夜景、广州塔、花城广场、北京路步行街等夜间旅游热点开展丰富多彩的夜游活动,鼓励周边餐饮、娱乐场所延长营业时间,打造多个夜间旅游消费区,以吸引更多的游客集聚。③建立区域旅游合作网络。荔湾区、越秀区、天河区和海珠区四大区域游客聚集程度高,旅游景点之间联系度较高,应强化这些区域各景点之间的合作,推出多条旅游线路,打造区域性旅游消费集聚区。对于旅游发展较落后的区域,一方面要加大资金投入,完善基础设施,提高各景点间的通达性;另一方面应充分发挥片区联动的作用,通过联动营销的方式引导游客从高聚集区向周边扩散,提高客流量,同时加强中心城区与近郊区、远郊区间的人文、商贸和交通联系,以推动整个广州旅游发展空间格局及质量的提升。

5.3 讨论

本文基于社交媒体发布的网络文本大数据对游客时空行为特征进行研究,突破了传统问卷调查的形式,迎合了当前旅游者行为研究潮流。但研究也存在不足之处:首先,受旅游者文化水平和可能的记忆偏差、日记习惯的影响,游记文本质量难免参差不齐,影响了数据的有效性。后期应结合多种数据源,如手机信令、微博签到数据GPS 定位数据等进一步掌握游客的时空轨迹数据,使研究结果更加全面。同时,如何将互联网大数据与GIS 时空数方法进行深度结合,分析总结出游客行为基本规律以指导区域旅游发展,将是未来研究的重点。其次,研究内容不够深入,研究结果仅从整体上反映了广州游客的时空行为特征。虽然本文分析了不同同伴类型游客在时间行为上的特征,但是仍不够全面,对目的地旅游发展的参考价值有限。今后的研究可采用线上与线下结合的方式搜集数据,从游客个人特征(如年龄、性别、受教育程度等方面)探讨不同类型旅游者的时空行为特征及差异。最后,本次研究数据从马蜂窝网站进行爬取,数据来源较为单一,缺乏多样性,对研究分析会产生一定的影响。未来应拓宽数据面,从多个旅游网站进行数据搜集和筛选,确保数据的代表性和一般性。

互联网时代,如果将网络大数据与GIS 时空分析方法进行深度结合,分析总结出游客行为的基本规律以指导区域旅游发展,将是未来研究的重点。2019年底出现的新冠肺炎疫情给人们的生产生活带来了巨大的冲击与变化,也给人们外出旅游观光带来了不利影响。疫情发生后,游客的时空行为特征会发生怎样的变化,目的地将采取怎样的措施来应对这种变化,以促进疫后旅游业的恢复与发展,这同样是未来值得研究的方向。

猜你喜欢

游记景点时空
跨越时空的相遇
假期后,景点在干什么你想象不到
地心游记(十)只剩我一个人
玩一次时空大“穿越”
寻梦环游记
寻梦环游记
打卡名校景点——那些必去朝圣的大学景点
超市游记
时空守护者之宇宙空间站
时空之门