APP下载

基于数据挖掘的桂林旅游目的地投射-感知形象对比研究

2022-08-01张艳波闫慧洁

现代计算机 2022年11期
关键词:网络分析旅游网游记

张艳波,闫慧洁

(桂林旅游学院,桂林 541006)

0 引言

作为旅游研究中的热点,旅游目的地形象在潜在游客的旅游决策中扮演着重要角色。旅游城市对于旅游目的地形象传播越来越重视,不断提高旅游目的地形象才能更好地满足消费者的旅游需求。旅游目的地形象感知研究最初是利用问卷调查法,学者使用的是七点和五点式量表对美国犹他州、蒙大拿州、科罗拉多州和怀俄明州等4个州的旅游感知形象进行结构性测量。国内学者通过调查研究节事活动对旅游目的地形象的影响,以及使用五点式李克特量表对周庄旅游形象进行了研究。付业勤等以携程旅游网的游客评论为样本,利用内容分析法研究了鼓浪屿的旅游形象,建立了旅游形象评价体系分析类目,为完善和提升鼓浪屿旅游形象提供了理论依据。张琦等将旅游目的地形象划分为认知形象、情感形象和推荐意向等3 个方面。谭红日等收集去哪儿旅游网和携程旅游网攻略频道的大连游记建立基础数据库,利用ROST Content Mining 软件对抓取的网络文本内容进行数据挖掘,研究大连游客旅游形象感知,得到了以大连为核心的语义网络分析可视化图、大连游记内容的高频词汇,并进行了百度指数验证分析。陈天琪等以杭州西溪国家湿地公园为例,在携程网抓取2956条游客评论建立基础数据库,结合线下的问卷调查,综合分析了游客对于杭州西溪国家湿地公园的旅游形象感知,并提出了针对性的对策和建议。网络数据的广泛使用为旅游目的地城市形象完善和提升提供了充分的理论依据。随着GPS 等嵌入式设备的普及,图像的时间信息和位置信息成为旅游时空分布特征研究的热点。但是这些也仅仅是针对图片相关的一些文本信息进行分析,即对图片的元数据进行分析而非图片本身。因此,基于文本的旅游目的地形象研究仍然具有很大的研究价值。国外学者利用网络文本数据对旅游目的地投射形象和感知形象进行了对比研究。近些年,国内学者也开始了对旅游目的地投射形象与感知形象的差异性研究,并提出了相应的解决方案。总体来看,国内学者对于旅游目的地形象的双向感知研究偏少,且主要以旅游照片的数据挖掘为主。

综上所述,本文利用Python 爬虫技术收集桂林旅游官方微博的133620 字网络文本内容、马蜂窝旅游网的50 篇游记和携程旅游网最新的75 篇游记,利用ROST Content Mining 软件深入挖掘评论内容,对桂林景区旅游目的地投射-感知形象进行对比研究,探索旅游目的地形象的提升策略。

1 研究区域与方法数据

1.1 研究区概况

2021 年4 月26 日,习近平总书记考察桂林时指出,“老百姓的幸福感来自哪里?就来自良好的生活环境”,“要坚持以人民为中心,以文塑旅、以旅彰文,提升格调品位,努力创造宜业、宜居、宜乐、宜游的良好环境,打造世界级旅游城市”。桂林市位于广西东北部,是世界著名旅游城市,全市下辖6区10县、代管1个县级市,全市总面积2.78 万平方公里、常住人口为493 万人。桂林旅游资源丰富,2019 年旅游总收入1874.25 亿元,是我国重要的旅游目的地。

1.2 研究方法

内容分析法在旅游形象感知研究中取得了丰富的研究成果,受到众多旅游研究者的喜爱。内容分析法是一种对不系统的、定性的文字和图像等进行客观的、系统的、定量的分析方法。内容分析法主要通过问卷调查和网络文本数据综合分析将桂林游客感知研究内容转化成定量、系统的数据。本文利用ROST Content Mining 软件的功能性分析、文本处理、可视化等功能进行文本挖掘,对从桂林旅游官方微博收集到的133620 字网络文本内容、马蜂窝旅游网收集的50 篇游记和携程旅游网收集的75 篇游记分别进行系统化的统计分析、词频分析、社会网络和语义网络分析等。由于文本篇幅过长,仅对官方微博数据和马蜂窝旅游网收集的50 篇游记分别进行语义网络分析可视化图的对比分析。首先进行文本分词处理,去除无意义词,添加特有的自定义词语再对高词频的词语进行统计。其次,利用微词云进行可视化展示,词频较高的词语会以较大的形式呈现,词频越低的词语显示出来的字体越小。最后进行社会网络和语义网络分析等。以此对桂林景区旅游目的地投射-感知形象进行对比研究,为桂林旅游目的地形象提升提供理论支持。

1.3 数据来源

桂林旅游官方微博拥有粉丝数270858 和微博数6100。携程和马蜂窝旅游网都是国内知名的综合旅游平台,旅游攻略丰富、游记内容详实,多为游客的真实感受。本文利用Python 技术,抓取桂林旅游官方微博文本数据、马蜂窝旅游网攻略频道的50 篇桂林游记和携程旅游网攻略频道最新的75 篇桂林游记,整理得到133620 字官方微博网络文本内容和245876 字游记内容建立基础数据库。此外,课题组联系桂林当地旅游公司在2021 年7 月开展了桂林旅游目的地形象感知问卷调查,收集有效调查问卷680份,对网络平台数据进行了充分的补充,对游客的感知体系进行了充分的调查。

2 结果与分析

2.1 高频词汇分析

利用ROST Content Mining 软件对网络文本数据进行中文高频词分析,得到了投射形象与感知形象高频词汇对比表(表1),主要包括名词、形容词和动词,其中最多的为名词。

表1 投射形象与感知形象高频词汇对比表

投射-感知形象构建了旅游目的地形象的双向影响力,旅游目的地管理部门的投射形象和游客的游后感知形象对于潜在游客的游前决策至关重要。通过高频词汇的对比研究,阳朔、漓江、象鼻山、龙胜和桂林山水等基本认知形象并不存在差异,体现了“桂林山水甲天下”的旅游特色。桂林旅游官方微博投射形象更注重多元化、国际化,而游客感知形象相对比较具体。官方投射形象更加注重传统节日春节、“壮族三月三”、“国庆”等重大节日,壮族风情、文化旅游、东南亚风情、东盟博览会等也是宣传的重点,而游客更关心景区吸引物、景区服务质量和交通设施等因素。

在旅游景区的宣传上,官方更集中在“桂林”、“阳朔”、“龙胜”、“兴安”、“恭城”、“资源”等不同地区的旅游目的地推荐,游客由于旅行时间有限或景区自身知名度不高等原因,更倾向于“桂林”、“阳朔”、“龙胜”等更传统和知名度更高的景区游览。因此,游客感知桂林的景区主要集中在“西街”、“遇龙河”、“世外桃源”、“千古情景区”、“十里画廊”和“兴坪古镇”等阳朔景区,桂林市区的景区主要有象鼻山、东西巷、芦笛岩、两江四湖、日月双塔和正阳步行街等,除此之外游客去的最多的就是龙脊梯田。

在游客感知高频词汇中未出现贬义词,褒义词汇主要有“不错”、“好吃”、“喜欢”、“美景”等,体现了游客对桂林景区的旅游评价比较满意;动词体现了游客的游览方式,比如“漂流”、“竹筏”、“徒步”、“游船”等词汇;在交通出行方面,“高铁”、“包车”、“大巴”、“机场”等词语词频较高,大量游客选择高铁或者航班出行,在到达桂林后再选择大巴车或者包车旅行,在旅游景区内主要采取徒步旅行或者游船、漂流等方式游玩;在特色美食方面,高频词汇有“桂林米粉”、“啤酒鱼”、“美食”、“好吃”。由此可见,桂林米粉和阳朔啤酒鱼是游客感知桂林旅游最深刻的美食,“好吃”体现了游客的满意评价。游客感知的其他高频词汇有“酒店”、“住宿”、“路线”、“天气”等,这些也是游客关注的热点。

综上所述,桂林旅游管理部门投射形象旨在塑造“桂林山水”、“文旅融合”、“全域旅游”等旅游形象,游客感知形象则更加复杂多变、生动具体。利用微词云将桂林旅游投射-感知形象高频词汇分别进行可视化展示(见图1)。在词云图中,词频较高的词语会以较大的形式呈现,词频越低的词语呈现出来的字体越小。

图1 官方投射形象高频特征词云图(a)与游记感知形象高频特征词云图(b)

2.2 语义网络分析

利用ROST Content Mining 软件对网络文本数据进行语义网络分析,得到了官方投射形象语义网络分析可视化图与游客感知语义网络分析可视化图(见图2)。由于文本篇幅过长,仅选取马蜂窝旅游网桂林游记的网络文本内容进行分析。语义网络分析可视化图呈现发散状,直线经过的地方产生相应的联系。

在图2马蜂窝旅游网桂林游记语义网络分析可视化图中,联系较为紧密的是阳朔的“遇龙河”、“世外桃源”、“兴坪古镇”、“十里画廊”景区和桂林市区的“日月双塔”、“两江四湖”、“正阳步行街”景区。除了旅游景区之外,语义网络分析可视化图中联系比较紧密的有“机场”、“包车”、“高铁”、“住宿”、“酒店”、“民宿”、“行程”等交通方式和住宿形式。桂林旅游官方微博和马蜂窝旅游网两个不同平台数据的对比分析,在语义网络分析方面实现了很好的对比,也使得桂林旅游目的地形象的研究内容更加全面。桂林旅游官方投射形象以“桂林”、“旅游”为核心,以“文化旅游”、“世界旅游”、“论坛”、“漓江”等为次核心。结合高频词汇分析,在旅游形象宣传上官方投射形象更加注重多元化、国际化、全域化,以及博览会、论坛等大型旅游活动推荐形式,在项目级别、文化内涵、文旅融合和旅游特色项目上都有一定的体现。

图2 官方投射形象语义网络分析可视化图(a)与游客感知语义网络分析可视化图(b)

2.3 旅游形象感知

利用“旅游交通”、“旅游吸引物”、“旅游环境”、“旅游活动”和“旅游评价”等基本涵盖桂林旅游投射—感知形象的各个要素,综合构建旅游形象评价体系。从官方投射形象部分高频词来看,“航空”、“高铁”等交通方式出现的频次最多,“文化”、“漓江”、“山水”、“公园”是官方宣传最集中的旅游吸引物。与游客感知形象不同的是,官方投射形象更注重“桂林”、“阳朔”、“资源”、“兴安”、“恭城”等不同旅游目的地的宣传,全力打造全域旅游模式。传统节日“春节”、“壮族三月三”、“国庆”等重大节日,壮族风情、文化旅游、东南亚风情、东盟博览会等也是宣传的重点。从游客感知的旅游吸引物来看,阳朔景区的“十里画廊”、“遇龙河”、“兴坪古镇”和“20元背景图”最为突出,“桂林山水甲天下,阳朔山水甲桂林”,大部分游客是慕名而来,并表现出了重游和推荐的意愿;在旅游交通和旅游环境方面,游客给出了不错的评价。部分景区和路段在假期高峰期出现了拥堵的情况,少部分游客表示“太堵了”;在旅游活动方面,游客提及最多的是“漂流”、“徒步”、“演出”等词汇;游客的游后评价总体较好,高于预期。少部分游客表示“圈起来当景点”、“一般”、“商业化严重”,景区在旅游吸引力和旅游服务意识方面有待提升。

表2 桂林旅游目的地投射—感知形象体系及语义文本特征词对比

3 结论展望

3.1 结论

本研究利用Python 爬虫技术抓取桂林旅游官方微博文本数据、马蜂窝旅游网攻略频道的50 篇桂林游记和携程旅游网攻略频道最新的75篇桂林游记,整理得到133620 字官方微博网络文本内容和245876字游记内容建立基础数据库。使用ROST Content Mining 软件提取桂林旅游目的地投射—感知形象的高频词汇,利用微词云绘制高频词云图;利用ROST Content Mining 软件的社会网络和语义网络分析功能建立官方微博和网络游记语义网络图可视化图;运用内容分析法解析桂林旅游形象的内容和主题,探索桂林旅游目的地投射—感知形象;利用ROST Content Mining 软件对网络游记内容进行逐个挖掘,探索旅游目的地评价体系,整理出桂林旅游目的地投射—感知形象体系及语义文本特征词对比分析表。

从网络文本内容分析结果来看,官方投射与游客感知形象具有一定的差异。官方微博更注重多元化、国际化,而游客感知形象相对比较具体。官方投射形象更加注重传统节日春节、“壮族三月三”、“国庆”等重大节日,壮族风情、文化旅游、博览会等也是宣传的重点,而游客更关心景区吸引物、景区服务质量和交通设施等更为具体的因素,这与投射形象与游客感知形象的高频词汇和语义网络分析可视化图也基本相符。阳朔、漓江、象鼻山是大部分桂林游客的“打卡地”,桂林景区和阳朔景区在高频词表里面基本各占一半,这也体现了“桂林山水甲天下,阳朔山水甲桂林”,游客对于桂林市区景区和阳朔景区同样关注。在阳朔、漓江、象鼻山、龙胜和桂林山水等基本认知形象方面,官方投射与游客感知形象不存在差异,这也体现了“桂林山水”的旅游特色,凸显“漓江”、“喀斯特”地貌等一系列得天独厚的桂林山水资源旅游优势。

3.2 启示

游客对于“桂林山水”旅游形象有着一定的固定印象,而对于“壮族三月三”、“东盟博览会”、“文化旅游”等官方着重宣传的旅游资源、旅游活动感知几乎没有体现。在美食体验方面,“桂林米粉”、“阳朔啤酒鱼”同样广为人知,而“恭城油茶”、“全州醋血鸭”、“荔浦芋扣肉”等桂林本地美食鲜有游客提及。因此,在“桂林山水”特色旅游前提下,应着力打造文化旅游、民族旅游和全域旅游类旅游产品,借助“桂林山水”旅游优势,引导游客对桂林旅游的全方位感知。

本研究选取了携程旅游网最新的75 篇游记和马蜂窝旅游网的50 篇游记,结合桂林旅游官方微博整理得到245876 字游记内容和133620 字桂林旅游官方微博网络文本内容建立基础数据库,对于旅游照片数据的分析有所欠缺。桂林市目前正在全力打造世界级旅游城市,针对国际游客在桂林的时空分布和旅游形象感知有待探讨和研究。

猜你喜欢

网络分析旅游网游记
基于交通运输业的股票因果网络分析
低轨卫星互联网融合5G信息网络分析与应用
地心游记(十)只剩我一个人
驴妈妈旅游网的困境:屡陷盗刷事件 售后有待改进
寻梦环游记
寻梦环游记
超市游记
大数据时代的网络评论数据处理技术应用
台旅游网推“太平岛赏月”
北京水上乐园 任你玩