APP下载

基于大数据文本分析的旅游目的地情感形象研究
——以舟山旅游地为例

2020-10-31

关键词:网络图目的地负面

俞 萍

(浙江国际海运职业技术学院 海洋旅游学院,浙江 舟山 316021)

Hunt[1]于1971 年提出了旅游目的地形象的概念,从营销传播的角度看,旅游目的地形象是旅游者获得的有关旅游目的地信息在旅游者心目中形成的综合性的感知评价,是目的地选择决策的重要参考变量。作为旅游目的地形象感知的阶段,情感形象是游客对旅游目的地的感情性认识,是游客对旅游地的偏好程度。Russel[2]基于情感测量模型,将旅游目的地情感形象划分成四个维度,以此确定游客对旅游目的地形象的情感评价。通过情感形象评价分析,了解游客对旅游地偏好的要素,有助于旅游地进行更好地形象定位,扬长避短,突出特色,从而得以持续健康地发展。

新媒体作为一种结构性的力量,使旅游目的地和游客之间有了更为畅通广阔的信息沟通平台。受益于新媒体时代大数据研究的蓬勃发展,旅游目的地形象研究的数据类型也得以丰富,研究路径得以拓展。[3]

本文在以往学者研究的基础上,建立旅游情感分析词库,将游客对旅游地的情感形象认知量化,进而进行旅游地的情感形象评价分析。相较于传统的问卷抽样调查方法受限于调查时间、调查对象的主观性、调查的样本量等,基于网络新媒体平台的大数据分析可以较为准确地反映游客对该旅游地的偏好和情感评价,丰富旅游目的地形象测量体系,也为旅游地的营销和发展建设提供依据。

一、研究区域概况

舟山是我国第一大群岛,位于我国东南沿海,拥有丰富的旅游资源,被称为“海天佛国、渔都港城”。境内共有佛教文化景观、山海自然景观和海岛渔俗景观千余处,包括我国四大佛教名山之一的5A 级旅游景区——普陀山,以及嵊泗列岛、岱山岛、桃花岛、东极岛等风景名胜区。观海景、尝海鲜、游海水、玩海沙、拜观音、祈健康成为舟山旅游的独有魅力。2018 年舟山全年实现旅游总收入942.2 亿元,旅游接待人数6321.4万人次。[4]

近年,顺应移动互联网发展的趋势,舟山旅游也不断利用网络平台开展了各种形式的营销,但在此潮流中,更精确地了解游客对舟山旅游地的偏好、评价和兴趣,即对舟山旅游地的情感形象如何,是开展精准营销的前提。

二、数据采集与处理

(一)数据的采集

百度搜索风云榜以网民的每日搜索行为作为数据基础,能较为直接、客观地反映大众的兴趣和需求。根据百度搜索风云榜中各旅游网站的排名,位于前三位的分别是携程旅行网、蚂蜂窝网和去哪儿网排名(截至2019 年5 月20 日)。因此,本文采集的数据来源于这三个知名的旅游网站。确定数据采集网站后,利用网络爬虫工具抓取有关舟山旅游目的地的游记数据,截至2019 年5 月22 日,共抓取14 681 条游记数据,其中携程旅行网7 396 条,蚂蜂窝网5 604 条,去哪儿网1 681 条,总计136 万多字。所获游记文本主要来自于2016 —2019 年。

(二)数据的清洗

为保证研究的科学性,对这些数据进行清洗去噪,修改错别字,去除缺失的、空白的、广告营销类以及无关叙事类的数据。清洗后,游记数据缩减至14 565 条。

(三)情感分析词库的构建

情感词能够体现旅游者对一个旅游地的情感倾向,直接表达了他们对该旅游地的好感程度和心理感受,是判断旅游目的地情感形象的重要依据。情感词在一定程度上能够体现游客对该旅游目的地的重游意愿。

本次研究首先大量读取网络文本,将旅游专属的情感词汇逐一提取,构建基本的情感分析词库,共计词汇294 个,涵盖舟山旅游目的地各景点景区、餐饮、住宿、交通、购物、娱乐活动等各方面。知网(HowNet)于2007 年在其官网发布了“情感分析用词语集(beta 版)”(sentiment)。该词库共包含中文词语(词形)91 016个和英文词语(词形)85 295 个,涵盖正面情感词语、正面评价词语、负面情感词语、负面评价词语、程度级别词语和主张词语各6 项。本研究对HowNet 情感词库进行修正,删减部分在特定语境下的情感用词、具有二义性的词以及生僻词(如媢、昶、侻等),并结合此前建立的游记文本情感词库,合并成本研究所用的情感词库,最终所构建的完整词库共包含2 268 个词汇。

三、情感评价高频词分析

采用Gooseeker 软件对情感词库进行分词及词频统计。先将游记数据文本导入软件的分词系统,软件自动分词,得到词语列表和分词效果表,然后筛选词语,并添加自定义词(修正后的hownet 词汇),最后导出词频统计表,得到词频统计结果。表1 为前120 位高频情感词。

表1 情感评价高频词统计表

由表1 可见,在120 个高频情感词中,除13 个负面词汇外,其余107 个均为正面词汇。

在排名前十的高频情感词中,只有第5 位“贵”一词是负面词汇,这表明游客对舟山旅游目的地以积极情感、正面评价为主。其中,“好”、“可以”、“不错”、“值得”、“喜欢”等词反映了游客对舟山旅游地总体的积极情感形象感知;“美”、“干净”、“方便”、“自然”、“壮观”、“安静”、“新鲜”、“清新”等词反映了游客对舟山的景区景点、环境、交通、食物、空气等方面的积极心理感受。

负面评价词汇虽较少,但“贵”、“商业”、“脏”、“不方便”、“乱”、“挤”等负面情感词汇反映了部分游客对舟山旅游地在收费价格、环境卫生、交通设施、景区容量等方面的心理感受,是舟山旅游发展应引起重视的方面。

四、游客对舟山旅游地情感形象评价分析

在文本数据中,否定词、程度副词、转折词等词汇会对情感评价起到加强语气或者否定的作用。Hownet词库共收录了219 个中文程度级别词语,划分为六个等级:极其(extreme) 、最(most)、很(very)、较(more)、稍(-ish)、欠(insufficiently)、超(over)。本研究依据此等级划分,并根据需要,对这些语义逻辑词赋予相应的权值,具体见表2。

根据此规则,对采集到的每一条游记的情感词进行得分计算,得出该条游记的正负极性。共得出正面评论12 056 条、中性评论1 453 条、负面评论1 056 条。正面评论所占比例为82.77%,可见游客对舟山旅游目的地的情感评价是以正面评论为主。

(一)对各景区情感评价的分析与比较

对舟山各主要景区的情感评价进行统计分析,结果显示,普陀山、朱家尖、东极岛三个景区获得的正面评价比例较高,均超过80%;同时,其负面评价比例也较低。桃花岛和嵊泗列岛的正面评价比例相对较低,而负面评价比例均超10%。具体见表3。

表3 游客对舟山各景区情感评价比较

普陀山获得的评论数最多,其正面评价比例远高于其他景区,而负面评价比例也最低。这与普陀山作为中国四大佛教名山之一以及国家5A 级景区有关,其丰富的自然资源、深厚的文化底蕴、悠久的历史以及较为完善的旅游服务设施和良好的旅游环境获得了游客的认可和好评;而在如今快节奏的现代社会,普陀山浓厚的禅意氛围也正符合旅游者净心静心的偏好与诉求。

朱家尖以其平坦的沙滩和细软的沙质、优美的滨海环境以及海上和海滩活动赢得口碑,其正面评价比例位列第二。其负面评价主要来自于对周边大排档的价格、沙雕观赏的时间限制、《印象普陀》表演缺少特色等方面,此外还有对海水颜色和水质存在误解。因舟山位于长江、钱塘江、甬江三江入海口,泥沙俱入,使得舟山海域的颜色不如三亚等地呈现蓝色,但据国家生态环境部公布的《沿海城市海水浴场水质公报》显示,舟山朱家尖浴场的水质为“优”,在游泳适宜度上为“最适宜”。[5]

东极岛相较普陀山和朱家尖两个风景名胜区,虽然其旅游资源不如前两者丰富,也未经成熟的开发,在基础设施、旅游服务配套等方面也并不完善,但正因其原始和淳朴的特性,以及纯净、自然的风光,让游客对其产生好感。因此也获得较高的正面评价比例,其负面评价比例也较低,仅次于普陀山。

桃花岛和嵊泗列岛的正面评价比例分别位列后两位。游客对这两个景区的自然景色虽也都给予了积极的肯定,但其负面评价比例均超过了10%。对于桃花岛的负面评价主要集中于其宣传和实景的落差;嵊泗列岛由于其沙滩等级略低于朱家尖的沙滩,加上地理位置偏远、配套服务设施等方面不够完善,负面评价比例最高。

(二)游客对舟山旅游地的总体情感特征

本文采用武汉大学沈阳教授团队研发编码的内容挖掘软件ROST CM6,对采集的数据进行量化处理,进行“社会网络与语义网络分析”,生成关键词,共现矩阵词表和语义网络图,用于进一步分析游客对舟山旅游地的正负面情感评价的结构与特征。网络图中,节点代表高频要素,节点之间的连线表示要素间的联系,位置的远近代表关系的疏密程度。

总体情感评价语义网络图反映了游客对舟山旅游地各方面的关注,以“普陀”为核心关注点,涵盖舟山旅游地的旅游活动、旅游交通、旅游美食、旅游资源等吸引物要素,表明这些因素均能引起游客对舟山旅游地的情感评价,见图1。

图1 游客对舟山旅游地总体情感评价语义网络图

由语义网络图可见,游客的网络图以核心高频词“普陀”作为单一中心节点,与多个要素相关联。从目的地看,“普陀”(普济寺、南海观音、三大寺庙)、“朱家尖”、“沈家门”、各岛屿以及东极的“庙子湖”、“东福山”等都是游客关注的景区景点,“寺庙”、“建筑”、“沙滩”、“海水”、“沙子”等高频词反映了游客对这些资源要素的关注;从旅游活动看,“拜佛”、“烧香”、“佛教”等词汇反映了游客来舟山所偏好的宗教文化类活动,“景色”、“游泳”体现了游客对观光、滨海休闲活动的关注;“海鲜”一词体现了游客对这一旅游吸引物的关注;而码头、时间、交通、方便等词汇反映了游客对舟山旅游交通要素的关注。

(三)游客正面情感评价的因素分析

在识别出游客总体情感评价关注点的基础上,进一步分析游客对舟山旅游地正面情感评价和负面情感评价的关注点,探索正负面情感评价分别所产生的缘由。

游客对舟山旅游地正面情感评价的因素主要集中在以普陀为核心节点的相关要素中,反映了游客对舟山各项旅游资源要素的肯定和偏好,包括舟山的自然景观、人文景观、历史文化内涵和礼佛活动等方面。正面评价语义网络图中出现的词汇均反映了游客对舟山旅游地产生正面情感评价的来源;与核心关键词越靠近的要素,表明其与正面评价的关联度越高,见图2。

图2 正面评价语义网络图

从正面评价语义网络图可见,正面评价关键词的一级网络是“普陀”这个词,表明普陀是舟山旅游地最有吸引力的景区;其他景区如“朱家尖”、“沈家门”、东极的“庙子湖”、“东福山”等词也出现在网络图中,但在图中的位置依次渐远,说明这些景区也能让游客产生正面评价,但评价的关联度依次减弱。此外,“桃花岛”、“嵊泗”景区未出现在正面评价网络图中。

从链接的密集程度看,与一级网络“普陀”紧密相关的是“观音”、“佛教”、“道场”、“普济寺”、“佛国”、“景点”等词,反映出这些要素是让游客产生正面情感评价的核心内容。

从景点类型来看,“景色”、“地方”、“风景”等词语反映了游客正面情感评价的关注点,表明舟山的这些自然旅游吸引物是让游客产生正面评价的重要因素;“佛教”、“佛国”、“寺庙”、“观音”、“道场”等词语表明舟山的人文旅游吸引物在决定游客产生正面评价中的作用;“香火”、“拜佛”、“虔诚”、“每年”等词语反映了舟山的礼佛活动也是游客正面评价的主要来源。

此外,“沙滩”作为一个高频要素,也有诸多相链接的词语,如“沙子”、“干净”、“海鲜”、“海水”等词语,表明舟山的沙滩也是游客产生正面评价的重要来源,但它还未能像“普陀”一样成为一级核心关键词。

(四)游客负面情感评价的因素分析

负面评价语义网络图中的词汇均反映了游客对舟山旅游地产生负面情感评价的因素。游客对舟山旅游地的负面情感评价因素集中在以“普陀”和“门票”为核心节点的相关要素中,同时还出现了其他多个高频词汇,反映出游客对舟山旅游地多个方面的负面情绪。同时,个别在正面情感评价中出现过的要素,同样也成为负面情感评价的因素,见图3。

图3 负面评价语义网络图

根据负面评价所构建的语义网络图,“普陀”、“门票”两个词构成了一级核心关键词。可见,“普陀”作为核心吸引物不仅是正面情感评价的核心要素,同样也是负面情绪的核心来源,结合与此相链接的“排队”、“码头”、“时间”、“收费”、“门票”、“景点”等词,表明普陀山景区的可进入性、拥堵程度以及门票价格是造成游客负面情绪的重要因素。同时,“码头”作为一个高频要素,除了与它相关联的“普陀”一词外,还与“排队”、“时间”、“小时”、“景区”等词语链接,进一步表明游客对景区的可进入性和拥堵的不满。这可能是由于舟山作为海岛旅游地,岛与岛之间的交通工具主要为快艇、渡船,而普陀山旅游常年旺季,人流量大导致,因此如何在提高景区的可进入性的同时又科学地控制景区游客容量,是亟待完善的问题。

而同样作为一级核心关键词的“门票”,不仅与“普陀”相关联,而且与“南沙”、“游泳”、“景区”、“景点”、“收费”、“寺庙”等词条相关联,并且与“每个”、“进去”、“还要”、“不值”等词语相链接,表明各景点门票收费也成为游客负面评价的核心因素之一。

在旅游吸引物方面,除了普陀外,“沙滩”、“地方”、“岛上”、“海水”、“景点”、“景区”等也成为高频词,表明这些方面同样是导致游客产生负面情感评价的重要因素。从旅游景区来看,在正面评价网络图中出现过的“普陀”、“朱家尖”、东极的“庙子湖”、“东福山”等景区,在负面评价网络图中也均有出现,同时“嵊泗”景区也出现在了负面评价网络图中。

此外,“海水”这个高频词链接了“沙子”、“垃圾”、“游泳”、“收费”、“门票”等词语,并链接了负面评价词“失望”,反映了游客对于沙滩环境、游泳体验、门票价格等方面的不满。“服务”和“态度”两个词语也出现在负面评价网络图中,但位置较远,表明这两项虽不是游客负面评价的核心要素,但也是游客负面评价的来源之一。

五、舟山旅游地发展建设启示

根据游客对旅游目的地的情感评价分析,可以了解旅游地的情感形象和存在的问题。一些负面情感词汇反映了舟山旅游地在价格收费、环境卫生、交通设施、景区容量等方面存在的问题,具体表现为:

1.热点景区在旅游旺季时容量负荷过重,拥堵程度较大,进出景区需要较长时间的排队等候;偏远景区如东极岛、嵊泗列岛,配套服务设施还不够完善,交通不便,地域组合分散,可进入性也相对较差。

2.门票与物价对于游客来说仍然过高,除了各景区景点的门票收费外,往返的岛际交通费、景点间的公交车费、景区内的物价水平等总体来说都不低;此外,朱家尖和沈家门的大排档价格对于游客来说也是一项不小的旅游消费开支,且各处排挡价格不一。

3.朱家尖景区的旅游产品较为单一,目前仍局限于滨海浴场、沙雕观赏,体验性不足,与其他旅游地的滨海旅游产品具有一定的同质性;同时,由于舟山所处的客观地理因素,游客对海水颜色和水质存有误解;沙滩的环境卫生也存在一定的问题。

4.桃花岛景区的影视旅游产品的宣传和实景存有落差,旅游产品缺少互动和体验,层次不高,武侠文化挖掘不足。

5.正面评价的一级网络只有“普陀”一词,表明正面评价产生的核心要素较为单一,可见舟山旅游产品的多样性仍然不足。

上述发现为舟山旅游地的发展建设提供了一些启示:

1.在环境和设施方面,偏远地区如东极岛、嵊泗列岛需完善其配套旅游服务设施,同时改善其交通通达性和景区的可进入性,通过多种平台发布可进入的交通路线和船期信息;而旅游热点地区如普陀山,应在景区游客容量上进行进一步科学合理的调控;朱家尖需加强浴场环境卫生的管理,同时在旅游营销过程中,应就海水浴场的水质进行发布和宣传。

2.应加强各景区的物价管控,规范旅游市场的价格行为,比如门票、海鲜大排档的价格。近年来舟山实行旅游惠民季活动,在一定时间实行景区门票、交通票的优惠政策,并与其它省市联合开展旅游互惠,拉动了旅游消费,应进一步构建旅游价格长效惠民机制,实现游客和旅游地的双赢。

3.朱家尖和桃花岛景区均应创新其旅游吸引物要素,从观光型向体验型转变,开发有特色、有体验性的旅游活动产品。朱家尖可以推出面向不同游客层次的亲水产品,如面向青少年的“海洋环境保护和海洋科普研学”活动、面向年轻人的动感酷炫的水上体育运动,面向家庭的水上趣味亲子活动等;桃花岛应启动其影视旅游的互动属性,如提供剧本、道具、服装、美术等服务,让游客进行一段金庸剧的沉浸式体验;进行全程的实时拍摄或者微电影的拍摄制作,深入挖掘武侠文化的当代价值。

4.各景区在个性形象上应提炼与明确自身鲜明的特色,并加强宣传。如东极岛应保持其最受游客好感的几个特质,即原始、自然、淳朴;嵊泗列岛侧重其美丽海景、渔家乐体验以及慢生活等特点;而普陀山在保持其原有人文和自然资源优势的同时,应突出其禅意修心的特点,深度开发相关的旅游产品。

5.合理引导人流的空间移动,利用景区间不同的资源特点和空间结构,加强组合宣传,以其不同特点吸引游客;同时加强景区间的交通联系,建立热点景区与相邻景区景点相组合的风景网点系统,以使人流空间移动相对均衡。

通过研究也发现,游客在舟山的旅游活动主要为佛教文化活动、观光旅游、滨海休闲旅游三大类,对于更高层次的自尊、自我发展和自我实现需求的旅游活动尚在探索和发展中,而后者应是舟山旅游今后产品设计和营销策略制定过程中的发展重点,比如开发设计更关注内心需求的修心之旅,更追求原始自然的养心之旅,更体现冒险精神的海岛探险之旅等。

猜你喜欢

网络图目的地负面
恋爱中的城市
迷宫弯弯绕
动物可笑堂
正面的人和负面的人
11个自由贸易试验区将启用新版负面清单
网络图的计算机算法研究
课堂教学难点突破策略探究
控制算法理论及网络图计算机算法显示研究
叙事文的写作方法