APP下载

基于旅游足迹的中国游客赴日温泉地行为分析

2021-03-09刘欣高成广

旅游纵览 2021年1期

刘欣 高成广

摘 要:信息时代下,游客通过互联网不仅可以获取旅游地的相关信息,也可以将自身旅游经历感受以游记、评论、攻略等方式发布在网络上,这些旅游数据包含了大量的时空信息,能反映游客时空行为轨迹,被称为“旅游数字足迹”。本文选取赴日本温泉地旅游的中国大陆游客数据,使用Python在携程、马蜂窝等旅游网站进行旅游数字足迹爬虫,对游客赴日本温泉地的旅游数字足迹进行时间与空间分布分析,总结游客的时空行为规律。

关键词:日本温泉地;旅游数字足迹;游客时空行为

中图分类号:F713.55 文献标识码:A

引言

Web2.0时代伴随着数字化与信息化技术的发展,游客可以随时随地在互联网获取旅游信息,分享旅游体验,智慧旅游、旅游信息多元化成为旅游产业发展的必然趋势。越来越多的研究人员利用互联网数据作为研究对象,通过各种途径获取游客的旅游数字足迹,加以提取分析,最终得出相关旅游特征,并以此指导旅游产业的发展[1-2]。

一、数据采集

(一)温泉地选择

本文选取日本温泉地为研究样本。日本温泉的集群效应明显,形成了完整的温泉产业链,且日本温泉文化氛围浓厚。日本的温泉旅游份额占日本整个旅游业的50%,其温泉旅游发展的经验值得借鉴[3]。

(二)数据获取

笔者在对比了国内多个旅游网站后,选取去哪儿、携程、马蜂窝、同程、途牛和新浪作为游记爬取的平台,这六大平台市场份额相加占总市场的70%,基本上可以覆盖国内游客的大部分旅游信息。携程是国内旅游网站中的佼佼者,在2019年《中国在线旅游厂商交易规模指数》中排行第一,是目前在线旅游网站中市场份额最大的网站。马蜂窝近年来的活跃用户也在大幅增长。除了景点、酒店评论,这些旅游网站还以游记发布的方式,分享旅游心得,记录旅游足迹。

本文将使用Python编写代码分别在去哪儿、携程、马蜂窝、同程、途牛和新浪官方网站爬取游客的游记及评价数据,其中爬取字段为游记标题、游记内容、旅游地、出游时间。进行游记及评价数据爬取后,共获得初始样本1 292篇。由于初始样本中,存在一定量的无效样本,因此需对样本进行筛选。根据以下两条标准对游记样本进行筛选:①样本中必须涉及日本温泉目的地的内容;②游记样本能完整展示明确的旅游目的地、出行时间、停留天数。除此之外,剔除广告痕迹太重、多网站重复发表、纯粹图片组成与研究无关的样本,最终筛选符合研究样本标准的906篇有效样本。

二、数据分析

(一)游记数据预处理

为了提高研究样本的质量与研究的准确性,需要在进行数据分析之前,对有效样本进行预处理。首先,将爬取到的游记文本分别统一保存为Excel文件和TXT文本,把表情、图片和多余的特殊字符等要素删除。其次,进行同义词的替换,将“由布院”“由布岳”“汤布院”统一替换为“由布院”,“泡温泉”与“泡汤”统一为“泡汤”,等等。最后,将游记中的日语翻译成中文,将繁体汉字统一转换为简体汉字,英文单词翻译为中文。

对有效文本进行内容处理后,使用微词云网站进行词频分析,首先,将TXT文本复制到网站上,进行文本分词;其次,对分词后的文本单词进行挑选,将缺乏具体象征意义的数词、连词、形容词、副词等词语及标点符号剔除,只留下能反应旅游热点的名词及部分动词,其中名词不包括方位名词和时间名词;最后,将分析结果以Excel格式保存下来,得到旅游足迹数据库。

(二)时间格局分析

1.出游时间分析

基于旅游足跡数据库,可从中提取出旅游时间、停留时间、旅游人数及旅游轨迹等信息,从而对赴日本温泉地游客的时间信息进行分析[4]。将爬取的游记数据中的出游时间字段单独分析,分别得出图1出游季节分析和图2出游月份分析,由此可以得出赴日游客的旅游时间变化特征。日本与我国华北地区所处纬度带相近,使用的季节划分方式大体一致,依据气象划分法,将一年12个月划分为四季:3月至5月为春季,6月至8月为夏季,9月至11月为秋季,12月至2月为冬季。

由图1可知,冬季赴日本温泉地旅游的国内游客最多,其占比高达40%,夏季出游的游客最少,占比仅为14%,选择秋季出游的游客相对较多,占总出游样本的27%,春季出游的游客占比为19%,旅游者出游时段呈现出较强的季节性。冬季气候严寒,泡温泉可以取暖强身,是最适合泡温泉的季节;春季,日本的樱花相继开放,是最佳的赏樱季节,秋季是日本传统的赏红枫季节,均能吸引一部分游客前往目的地观光旅游。

由图2可知,数据在一年中出现5个波峰,分别为1月、2月、4月、10月和12月,占比均在10%以上,说明赴日本温泉地旅游的游客主要集中于这5个月出行。其中10月份数据为全年最高峰值,这一时间段赴日游客占比高达15%,其主要原因是10月初为中国国庆小长假,是国内游客出游的旅游黄金周。第二个峰值出现在2月份,所占比例为12%,中国传统春节假期在2月份,且2月为冬季,是泡温泉的理想时间。选择在6月、7月和8月赴日温泉地旅游的游客较少,在5%左右。

均差是指每个月数据值与月平均值之间的距离,借助均差可以比较清晰直观地分析出赴日温泉地游客的出游时间特征,笔者发现3月、5月、6月、7月和8月共5个月的均差为负值,1月、2月、4月及9~12月共7个月的均差为正值[5]。赴日游客恰好集中在秋冬季节,呈现出较强的季节性特性。为进一步分析赴日本温泉地客流的时间特征,并考虑国内假期因素的影响,引入峰值指数G分析出游集中程度。现有研究表明,集中指数G可以有效衡量旅游流在时间分布的整体集中程度,本文将出游时间分为6个时间段:H1“双休日+年假”、H2小长假、H3黄金周、H4寒暑假、H5日本赏樱赏枫季与H6其他时间,并统计每个时间段的游客规模。如果赴日本温泉地游客在上述6个时间段内完全均匀分布,则G=40.82。通过计算可得,游客赴日本温泉地时间的集中指数G=45.86,大于40.82,说明赴日本温泉地客流在时间上分布较为集中。

2.出游停留天数分析

笔者对国内赴日温泉地游客的停留时间进行统计,结果如图3所示,国内游客在日本温泉地停留时间从1~15天不等。停留天数少于5天的游客样本占比为7.6%,其中,停留1天的游客占比最少,仅为0.6%,停留2天和4天的游客均占比2%。停留天数在5~10天的游客数量最多,占比达84.4%,停留5天、6天和8天的游客样本占比均超过20%,停留超过10天的游客占比为8%。综上所述,国内赴日本温泉地游客大都在日本停留5~8天,旅游者平均停留时间较长。针对次结果,可以解释为:首先,赴日旅游为出境游,所需旅游时间比国内游更长,且游客一般选择在7天长假出游;其次,温泉旅游一般以过夜的形式为主,日本温泉地的集中分布及与其他旅游资源(如赏樱等)相结合,使国内游客的逗留时间更长。

(三)空间格局分析

1.到访温泉地偏好分析

笔者根据采集的旅游数字足迹计算样本中日本温泉地出现的频次及其所占比率,初步反映游客对日本温泉地的旅游偏好。旅游节点出现频次越高,表明该温泉地被游客提及频率越高,越受游客欢迎[6]。对微词云分词后的Excel词频数据进行处理,挑选出温泉地名,并按照提及频次进行排序。部分游客同时前往多个温泉地,因此温泉地名每在样本中被提及一次,其频次就记为1次。

游记样本数据统计到多个日本温泉地,基于研究的篇幅和实际意义考虑,保留排名前20的温泉目的地作为分析对象。各节点出现频次差异较大,提及频次超过1 000的温泉地有2个,提及频次大于500而小于1 000的有5个,其他温泉地被提及频次均小于500。排名前十的温泉地分别为箱根、登别、由布院、别府、地狱、城崎、伊豆、热海、草津、下吕,均为日本传统的温泉旅游目的地,其浓厚的温泉文化氛围,深受游客喜爱。其中,箱根被提及频次1 595,占比16.44%,排在首位,登别和由布院分列二、三位,其提及频次的占比仅次于箱根,分别为12.56%和9.84%。以上前三位温泉地占比达38.84%,占排名前20的温泉地提及频次总和的1/3,别府、地狱、城崎和伊豆占比分别为7.52%、6.37%、6.15%和6.02%,其余温泉地被提及比率均小于6%。

2.游客感知词汇分析

游记样本数据中提取的有关温泉的高频词汇,代表了游客对日本温泉地的感知印象,能够在一定程度上反映温泉地的总体形象[7]。将微词云中导出的分词数据表格进行人工筛查后,剔除词频小于1的词语,综合考虑篇幅、研究可信度等问题后,本文选取频数排在前30的高频词作为研究对象(表2)。由表2可知,在赴日游客的样本数据中,日本温泉地的总体形象按照频次从高到低分别是“温泉”“酒店”“泡池”“价格”“体验”。频次最高的词汇是“温泉”本身,其中,游客主要关注“温泉水”“温度”“干净”“味道”“地热”“硫磺”“疗效”“碳酸”等。“泡池”“汤池”“浴衣”“SPA”“养生”“按摩”等词汇的提及频次也较高,表明泡池的设计及相关服务项目亦是游客关注的方面。其他高频词汇包括住宿(酒店)、花費(价格)、购物、美食、交通、温泉地其他景点(景点、樱花、建筑)等方面,反映了游客对温泉地的关注不仅限于温泉本身,其配套服务设施同样重要,樱花、红枫等日本热门旅游项目可作为吸引游客的辅助手段。

三、结语

本文以日本温泉地为例,选取赴日本温泉地旅游的中国大陆游客数据为基础,使用Python在携程、马蜂窝等旅游网站进行旅游数字足迹爬虫,对游客赴日本温泉地的旅游数字足迹进行词频分析和可视化分析,总结出游客的时空行为规律。研究结果表明:在时间格局上,40%的游客选择在冬季赴日本温泉地旅游,游客最多的月份是2月和10月,大部分游客在温泉地停留时间5~10天,赴日游客出游集中秋冬季节,呈现出非常强的季节性特征。由于温泉旅游的特殊性,游客在出游时间和停留时间的选择主要受气温、假期的影响。在空间格局上,游客到访排名前10的温泉地依次为箱根、登别、由布院、别府、地狱、城崎、伊豆、热海、草津、下吕,游客到访日本温泉地总体呈现出“大分散,小聚集”的空间分布格局,到访温泉地主要位于日本南部地区。在游客感知方面,泡温泉是游客出访的首要目的及最关注的部分,其次是有关目的地的服务设施部分,注重游览体验、温泉地的其他活动,如赏樱花等也对游客有一定的吸引力。

参考文献

[1] 李君轶.旅游数字足迹:在线揭示游客的时空轨迹[J].思想战线,2013(3):103-107.

[2] 杨敏,李君轶,杨利.基于旅游数字足迹的城市入境游客时空行为研究:以成都市为例[J].旅游科学,2015(3):59-68.

[3] 叶萍,刘晓农.日本温泉旅游产业发展及对我国的启示[J].老区建设,2019(18):12-18.

[4] 陈子微,姚建盛.基于旅游数字足迹的游客时空行为研究:以南京市玄武区为例[J].软件,2020(5):179-183.

[5] 查晓莉,陆林.基于旅游数字足迹的访沪国内旅游者时空行为研究[J].旅游研究,2017(4):63-73.

[6] 罗秋菊,梁思贤.基于数字足迹的自驾车旅游客流时空特征研究:以云南省为例[J].旅游学刊,2016(12):41-50.

[7] 张琦,陈珂,马发旺,等.基于数字足迹的乡村旅游形象感知研究:以沈阳市周边乡村旅游点为例[J].农业经济,2018(3):33-35.