基于文本挖掘的峨眉山风景区旅游形象感知
2020-03-07庄小丽程仕菊常雪萍
庄小丽, 程仕菊, 常雪萍
(中国地质大学(武汉) 经济管理学院,湖北 武汉 430074)
一 研究综述
旅游地的竞争日趋激烈,形象作为吸引旅游者、创造地方识别(place identity)的核心因素,是目的地竞争优势的核心来源[1]。感知形象是旅游者对旅游目的地的总体印象和综合评价,关乎潜在旅游者是否选择该旅游目的地[2-6]。因此,是否占据“游客正面评论”高地对于旅游地来说至关重要,直接影响当地的口碑宣传效果,甚至影响景区接待率[7]。随着网络信息技术的发展,旅游者能通过网络自由真实的表达对旅游目的地的印象和看法,潜在旅游者能从这些网络文本中获取有用信息,学者们可利用网络文本信息研究旅游地形象。可见点评、攻略、游记、博客、微博等网络文本信息资源逐渐彰显出巨大价值[8]。网络口碑的分析有利于旅游地及时发现旅游者的诉求,从而促进旅游产品和服务质量的改进,减少游客抱怨,树立良好的旅游地形象和声誉。因此,基于网络文本信息挖掘研究旅游地形象显得尤为重要。
与传统调查问卷相比,网络文本能够更真实、广泛地反映游客对目的地形象的感知[9]。纵观国内外,网络文本对旅游地形象感知影响的研究已逐渐显现,Soojin&Choia等使用定性(文本挖掘和专家判断)和定量(相关分析)方法对抽样网站的文本和图像进行了内容分析,鉴别了不同旅游网络平台所呈现的澳门旅游目的地形象[10];Clemens& Költringer等通过自动化Web内容挖掘提取目的地品牌认知和形象[11];Marine-Roig通过社交媒体分析旅游博客和旅游者的在线旅游评论,研究了巴塞罗那的在线形象,突出了大数据分析对识别旅游目的地形象的作用[12];王永明等从驴评网、途牛网、驴妈妈等网站搜集网络评价的帖子,运用内容分析法研究凤凰古城游客旅游地意象感知特征和意象结构[13];赵咪咪等通过搜取新浪博客、携程网、马蜂窝等旅游网站上的评论及游记,采用网络文本分析法对白云森林公园的旅游形象感知进行了研究[14];方雨等使用火车采集器采集网络社区服务平台“百度旅游”中的武汉点评,采用文本分析法分析旅游者对武汉市旅游目的地形象的感知[15]。
综上,已有文献所涉及的研究样本多以游记、博客、在线点评为主,其中游记、博客的创作需要花费大量的时间及精力,这对于旅途疲惫的游客来说是不小的负担,因而导致游记、博客的数据量有限,无法获取海量游客评价,难以更好反映旅游者诉求。另一方面,2018年10月国内知名旅游虚拟社区马蜂窝陷入数据抄袭事件[16],使得游记的真实性有待商榷。而微博作为国内最大的社交媒体平台,用户可以随时公开发布简短文本,海量的数据背后反映着人们真实的个人偏好,通过挖掘和分析大量微博评论,可以更好捕捉人们对景区的评价和感知。目前基于微博评论数据来研究旅游地形象感知的内容相对较少。关于旅游形象感知研究,学者们使用的数据采集工具多以火车采集器、八爪鱼、瑞雪采集云为主,本文通过Python软件获取旅游地的微博签到数据,一方面,丰富了旅游感知研究数据采集手段和网络文本数据获取来源;另一方面,运用ROST Content Mining、UCINET软件对签到数据的评论信息进行整理,所得出的旅游形象感知维度是对理论的进一步丰富和扩展,充实和完善了理论框架;值得一提,节点中心性是衡量各节点在网络中重要程度的关键指标,目前大多研究忽略了这一要素,本文采用节点中心性中介数中心性对网络文本高频词汇进行排名,丰富了景区旅游形象研究内容,可帮助景区直观、客观的了解核心资源,提高景区核心竞争力。
在2015年国庆期间央视曝光峨眉山景区出现强制购物现象[17],2018年峨眉山舍身崖一个月内发生了3起自杀事件,2019年峨眉山景区被文化和旅游部通报批评并责令整改,都给峨眉山风景区旅游形象带来了负面影响,影响潜在游客的到访行为[18],峨眉山景区迫切需要了解游客对景区的旅游形象感知,因此,基于文本挖掘研究峨眉山风景区旅游形象感知,首先,能帮助景区了解游客的反馈,完善景区反馈评价体系;其次,景区通过游客的评论能了解自己的核心竞争力,便于开展精准营销,吸引潜在游客;最后,研究结论与建议能为景区发展提供有益参考,促使景区在满足游客需求前提下提升景观质量,完善游憩设施,树立良好的旅游目的地形象。
二 研究方法设计
(一)研究区概况
峨眉山坐落于四川省峨眉山市,距离市区6 km,是我国四大佛教名山之一,也是以生态保护、游览欣赏、宗教朝拜、教育科研、康体健身为主要功能的山岳型国家级风景区。以浓厚的佛教文化和“高出五岳,秀甲天下”而闻名,素有“峨眉天下秀”之美誉[19]。学者们多以此为案例地进行研究,刘宇从当前峨眉山地区茶文化旅游资源及资源开发入手,探究峨眉山地区茶文化旅游资源特色及开发的具体路径[20];倪珊珊等结合室外调查与室内分析研究旅游干扰对峨眉山景区内植被与土壤性质的影响[21];张莹等以泰山、峨眉山等七座名山为例,分析旅游舒适度对气候变化的响应[22]。检索文献发现,目前对峨眉山景区旅游形象感知研究比较匮乏,基于此,本文以峨眉山风景区为例,通过分析整理峨眉山的微博签到数据,研究游客对峨眉山风景区的情感态度及旅游形象感知,既能弥补相关领域的空白,也能为现阶段景区改善旅游形象提供借鉴。
(二)网络文本内容分析法
内容分析法是美国传播学家Bernard Berelson提出的对大量象征性的材料进行系统和量化研究的一种新方法,是社会科学家研究方法的补充[23]。随着目的地形象结构的变化,测量方法和技术也发生了变化[24]。定性方法的使用日益被认为是一种有益的补充,因为定性方法揭示了用定量方法难以获得的目的地整体形象[25-27]。随着网络上文本数据的丰富和可用性的增强,内容分析法更多被应用于研究目的地形象和其他旅游现象。基于网络文本的形象质性测评研究成为了热点[28]。
本研究主要运用ROST CM6文本数据挖掘软件(ROST Content Mining System)[29]进行分析。该软件是辅助人文社科研究的大型免费计算平台,是一种可以进行内容挖掘的系统软件,可对网页、博客、论坛、微博等网络信息进行中英文词频分析、社会网络和语义网络分析、情感分析、流量分析、相似分析、网络环境分析、聚类分析、分类分析、情感分析等,深度挖掘相关文本内容、进行知识再处理[30]。
(三)数据来源与处理
1.数据来源
微博是中国最大的信息发布、传播和交流的社交媒体平台。根据新浪微博数据中心的旅游报告:2017年10月31日到2018年10月31日,微博月活跃用户达到4.31亿,同比增长19.39%;日活跃用户达到1.9亿,同比增长19.5%。搜索国内旅游目的地次数4.7亿次,搜索人数4 641万;国内旅游目的地签到次数858万,签到人数402万人;国内旅游目的地发博数量5.5亿篇,发博人数高达8 169万。全国5A级景区官博影响力中峨眉山景区排到第六位(1)数据来源于“2018移动互联网时代旅游社交资产大数据报告”。。本研究数据主要来源于新浪微博的旅游者签到数据,通过Python调用微博开放的API接口获取数据。首先,根据峨眉山市主要旅游景区和交通枢纽共选择118个POI点,最终获取8 580条游客签到信息,时间跨度从2017年1月1日到2018年12月31日。
2.数据预处理
由于所获取的数据样本较大,为了使数据更加精炼,明确,本文对所爬取的数据进行预处理,包括以下步骤:
(1)数据整理。本文研究样本为所获取信息中的签到内容,所以首先剔除只有图片、视频、表情等显著不相关的条目,以减少误差,最终剩余7 729条数据,存储于Excel中;为了更好的对样本数据进行分析整理,将筛选出的7 729条数据文字部分复制到Word文档,在Word文档中删除含有数字、标点符号、英文缩写、段落符号等与中文词频分析无关的要素;除此之外,将网络文本中表达同一含义的词进行修订,例如将网络文本中出现的“峨眉”“眉山”,统一修订成“峨眉山”,并修订网络文本中的错字,例将“金鼎”修订为“金顶”。最后,将文本保存为TXT文本格式,作为本研究的数据基础。
(2)分词。随后,使用ROST Content Mining软件对所保存的TXT文本进行分析处理。先用软件中的“分词”功能将所有句子分成单独词汇,对于分词结果中仍存在错误分割的情况,则将这类词汇修正合并、添加到自定义词表中再次进行分词。
(3)词频分析。在词频分析之前,设置过滤词表,将对研究无实际意义的副词、冠词、介词、代词和连词、标点符号等添加到过滤词表,例如“我们”“吧”等游客常提到但与研究无关的词。最后运用词频分析功能,条件设置为“不输出单字”,得到前100个高频词作为分析依据。
三 结果分析
(一)高频词分析
本研究运用ROST Content Mining软件对选取的微博文本进行分词处理和词频统计,并将词表进行过滤、归并,从关于峨眉山风景区的微博评论中提取出前100个高频词汇。从词性上看主要由名词、动词和形容词组成,其中以名词为主,体现在地点、风景、饮食、旅游项目等方面,动词反映游客的参与活动,形容词主要表现在游客感受、心情方面。对高频词进行分析得出,除城市、景区名称外,“日出”“云海”“太阳”“猴子”等词排名靠前,说明游客关注峨眉山风景区特色风景;“菩萨”“普贤”“大佛”“佛教”等词表明峨眉山“佛教圣地”特色形象让游客印象深刻; “祈祷”“平安”“保佑”“祈福”等词反映游客到景区主要目的是祈求平安幸福;“金顶”“七里坪”出现频率高于其他景点,表示两个景点深受游客关注;“爬山”“温泉”“登顶”“拍照”“婚礼”说明景区内体验项目多元化;“朋友”“周末”“孩子”“妈妈”“新年”等词反映游客对出行时间和出行对象的选择,多数游客选择在周末和节假日与家人、朋友一起出行。“好吃”“馋嘴”“火锅”“牛肉”“阿胶”等词反映景区周边特色饮食丰富,受到游客喜爱。可将提取的高频词分为景区特色风景、游客出游目的、游客活动方式、游客体验评价四类。其中景区特色环境占比最高,占整个词汇的22%,说明峨眉山景区因其清晰定位,使游客对景区景点、风景印象深刻,关注度高,评价多围绕此展开。其次是游客的出游目的,占整个词汇的20%,说明峨眉山佛教名山地位是吸引游客的重要因素,游客出游的一个动机就是为了祈福,也表明佛教文化资源是发展旅游业的有机组成部分(表1)。
(二)情感分析
情感态度可以直接反映游客对景区的印象,是游客的直接感受。游客情感态度一般分为积极态度、中性态度、消极态度三类。通过运用ROST Content Mining软件分析微博点评样本中带有情感色彩的词汇,可得知,46.06%的游客对景区印象持积极态度,对景区内自然景观和宗教文化比较满意,包括“开心”“欢喜”“值得”,代表性表述为“不虚此行”等;但16.82%的游客持消极态度,认为景区服务和规划管理方面没有达到要求,影响游客对景区的整体印象,主要包括收费不合理,交通不便利、景区售后服务差等方面;此外有37.12%的游客对景区印象持中性态度。综合而言,持积极态度的游客占比最大,持消极态度的游客占比最小,说明大部分游客对景区是满意的,然而,仍有37.12%的游客持中性态度,说明景区有大量需要提升的空间。
表1 峨眉山风景区网络文本高频词汇
(三)语义网络分析
使用UCINET软件进行语义网络分析,得出以下可视化图形(图1)。图1呈发散状,从中心向周围发散,直线经过之处会产生相应联系,线条密度越大,说明共现频率越高。由图可知,“峨眉”“峨眉山”“开心”等词汇位于核心位置,评价多围绕此展开,体现了游客对景区的关注点、印象点,也体现景区性质和主要内容。“普贤”“金顶”“佛光”“云海”“温泉”等词汇处于次核心位置,是对核心位置进一步的认知和发展,说明景区内特色景点让游客记忆深刻。最外层及外围位置,是对核心位置和次核心位置的进一步延伸和补充。通过语义网络的3层结构,能直观观察到景区吸引物体系,为景区未来改善旅游形象提供借鉴和帮助。
图1 样本语义网络分析
(四)中心性及旅游形象感知
社会网络分析中,节点中心性等价于该节点与其他节点的连接使其具有的显著性[31],是衡量各节点在网络中重要程度的关键指标,主要包含介数中心性、度中心性和接近中心性[32],参考前人研究成果[33-34],本研究选取介数中心性作为分析高频词的主要指标。介数中心性(betweenness centrality)衡量各节点对信息的控制程度,节点介数中心性指数越大,该节点在网络中的影响力越大,是游客们关注的重点[26]。UCINET软件处理后得到微博评价文本中节点介数中心性排名前11位的词汇(表2)。
(五)旅游形象感知构成
根据峨眉山风景区网络文本高频词汇(表1)与网络文本高频词汇介数中心性排名(表2),可知峨眉山风景区旅游形象感知构成主要表现在以下5个方面。
1.景区环境
随着生活水平的提高,游客对景区环境的要求日趋严格,景区环境是影响游客选择景区旅游的重要因素。由表1~表2可知,“鲜花”“天气”“仙境”“蓝天”“绿叶”等是与峨眉山景区环境相关的高频词汇,说明景区内部植被覆盖率高,空气清新,有着良好的生态环境。经济社会快速发展,使快节奏、压力大的生活成为大部分人的生活常态,人们迫切需要“释放”,风景优美,气候凉爽的峨眉山为人们提供了一个放松心灵的场所,吸引游客慕名而来。“美好”“完美”“值得”等高频词可看出游客到峨眉山风景区旅游能得到很好的放松,对景区环境感到满意。
表2 网络文本高频词汇介数中心性排名
2.佛教文化
在游客选择旅游目的地的过程中,文化因素是游客对旅游地形象感知的重要组成部分,会影响游客的决策行为[35]。一个景区能否深入人心,被游客铭记,与景区文化背景的发掘程度密切相关[36]。峨眉山是国内知名佛教名山,景区内建筑、绘画等都展现出宗教文化的浓郁气息,吸引游客慕名前来,因此“金顶”“菩萨”“普贤”“大佛”“佛光”“报国寺”“禅院”等是与峨眉山景区相关的高频词汇。此外,由表1~表2可看出,游客对“祈祷”“平安”“健康”“祈福”“成功”“保佑”等词汇多次提及,表明峨眉山的佛教文化深入人心,大部分游客相信峨眉山“佛教圣地”的特色地位,都会进行祈福,寄托心里的美好愿望。
3.服务设施
餐饮是保证游客旅游行程能够持续进行的基础要素,游客在旅游目的地的饮食状况直接影响游客对该次行程的满意度评价。“火锅”“牛肉”“味道”“阿胶”等词汇被游客重复提及,表明餐饮是峨眉山景区重要的一部分。“好吃”“美食”等高频词汇说明游客对景区餐饮质量方面较为满意,多为正向评价,但也有游客表示价钱偏高。从高频词汇中可发现“酒店”深受游客关注,有游客评价“峨眉山风景优美,酒店住宿环境很好。”“峨眉山景区附近最好酒店没有之一,细节非常棒。”说明景区食宿基本能满足游客需求。另外,在高频词统计中“猴子”位于前十五位,被游客多次提及,但许多游客表示“峨眉山猴子咬人是常有的事”“峨眉山猴子特坏,咬人”。这些评价反应出游客在峨眉山景区人身安全缺乏保障,景区安全服务设施不到位,需改进。
4.户外活动
峨眉山景区风景秀丽,气候凉爽,海拔适宜,为游客提供了户外运动的好场所。游客能在景区内开展多样化的旅游体验活动,例如“爬山”“徒步”“拍照”“索道”“婚礼”等。“登顶”“坚持”“身体”等高频词汇反映锻炼身体、休闲娱乐是游客到峨眉山景区旅游的主要目的。
5.气象景观
旅游景点是景区发展的核心资源,特色旅游景点能使景区脱颖而出,吸引游客。“金顶”“云海”“日出”“佛光”是峨眉山景区的高频词汇,说明这些景点受到游客的欢迎。但在评论中,很多游客表示非常遗憾,原因有以下两点:其一,峨眉山金顶是观看峨嵋四大奇观的最佳地点,但是大部分时间金顶上人潮拥挤,游客没有好的观赏环境,对景区满意度下降,有游客评价“人山人海,节假日别去了,排队八小时,游玩十分钟”,间接表明景区在处理游客与景区承载力关系之间还有所欠缺,可以进一步改善;其二,“云海”“佛光”等气象奇观受气候条件限制,并非时时有,未能观赏奇观的游客会感到遗憾。
四 结论与建议
(一)研究结论
研究运用内容分析法对峨眉山风景区网络文本内容进行挖掘整理,分析了游客对景区旅游形象感知维度,并探讨了游客的情感态度,主要结论如下:
(1)通过对峨眉山风景区高频词汇、语义网络、游客情感态度进行分析发现,游客对景区的旅游形象感知主要由景区环境、佛教文化、服务设施、户外活动、气象景观5个维度构成。
(2)从点评样本中所提炼的100个高频词汇主要涉及景区景点、景区活动,游客对景区基础设施、景区环境和旅游服务的评价。前10%的高频词汇是关于旅游景观、宗教文化的相关内容,说明峨眉山风景区自然景观和特色佛教文化是游客关注重点,给游客留下了深刻印象。
(3)整体形象方面,积极情绪词汇出现频次占比46.06%,表面游客对峨眉山风景区整体形象感知持积极态度。尤其对空气质量、四大奇观、环境、餐饮美食等较为满意。说明景区在风景营造、景点宣传、环境保护上取得了一定成效,“美景”“仙境”“享受”“值得”等高频词汇是游客对峨眉山风景区持正向情感的体现。
(4)从“爬山”“登顶”“温泉”“朋友”等词汇可发现峨眉山景区提供能满足游客休闲娱乐、户外体验活动需求的场所,是游客前往景区旅游的一个重要原因。
(5)有16.82%的游客对峨眉山风景区的旅游形象感知持消极的态度,主要表现在以下5个方面:①游客认为景区门票、交通票以及景区内食宿价格偏高,超出心理预期范围;②景区服务和规划管理方面没有达到要求,影响游客对景区的整体印象,主要包括交通不便利、景区售后服务差等方面;③景区内安全服务设施不到位,猴子伤人事件时有发生;④“佛光”“云海”等奇观受到气候条件限制,到景区旅游的游客不一定能观赏到;⑤在节假日,景区内游客爆满,游客需要花大量时间在购票、乘车上,游玩时间短,另外,游客拥挤会影响观赏效果。
(二)发展建议
游客对景区满意度评价是景区所关注的焦点及改善的方向,而游客的满意度最直接体现在游客对景区的感知上[37]。依据游客对峨眉山风景区的评价及峨眉山风景区现实处境,本文提出以下建议,希望能对景区改善旅游形象、吸引潜在到访游客提供借鉴。此外,峨眉山风景区是集自然风光与佛教文化为一体的山岳型风景名胜,以下建议同类型景区适用。
(1)充分利用新媒体,正视负面新闻,整改调整。目前,新媒体营销是景区展现自己的重要渠道。峨眉山风景区的自媒体营销亦取得不俗成绩,如峨眉山景区旅游微电影《峨眉来电》上线后,一个月时间点击量就已突破300万人次,吸引了游客到景区旅游,尤其在黄金周期间,游客人数爆满。景区面对强制购物、游客自杀、被文化和旅游部通报批评并责令整改等负面报道,应在第一时间利用景区新媒体优势向公众做出回应,使负面影响降到最低。另外,景区在采取措施解决问题方面应听取多方意见,展开调研,以免得不偿失,例如,2019年11月,为解决游客在景区“摄身崖”(原名“舍身崖”)轻生,峨眉山风景区安装防轻生玻璃墙,不少游客表示“不和谐”“别扭”“不自然”。
(2)保持特色优势,强化积极形象。峨眉山是我国世界文化与自然双重遗产,不仅拥有深厚的佛教文化和大量珍贵文物,还有以“雄、秀、神、奇、灵”著名的自然景观,为游客提供了一个既可以了解佛教文化,又可以开展多项旅游体验活动,休闲娱乐的场所,受到游客的好评。建议景区对现有自然景观加以维护,加强监管,防止游客不恰当行为对景区自然景观造成破坏,搞好保护与开发之间的关系,防止过度开发,充分发挥特色佛教文化资源。另外,很多游客将景区看作为爬山、徒步等活动的理想场所,景区可举行相关的主题活动,吸引游客,让游客参与,但景区应做好相应的安保措施。
(3)“佛光”“云海”等奇观受到气候条件限制,到景区旅游的游客不一定能观赏到,不少游客表示十分遗憾,建议景区通过开发特色旅游产品,举行特色旅游活动方式,从游客的体验感出发,弥补游客遗憾。
(4)改善服务设施。旅游服务设施是游客对景区满意与否的重要指标,影响游客对旅游目的地形象感知。因此,景区理应完善旅游基础设施,提高服务质量,达到游客的满意值。首先,部分游客认为景区门票、交通票以及景区内食宿价格偏高,建议景区在了解游客需求基础上,结合景区发展现状、景区内食宿经营者的意见对价格进行适当调整,以满足游客期望值。其次,节假日游客人数多,即使景区实行全新购票系统,但大部分游客仍表示在购票、乘车时会浪费大量的时间,建议景区适当增加票检通道以及观光车辆,满足游客需求。另外,景区内时有发生猴子伤人事件,影响景区形象,景区应对内完善安全防范措施,如在猴子出没地区设置醒目的提示牌,沿路增派工作人员,或每天固定时间段由专业人士对猴子进行投喂,如若景区猴群数量太多,也可适当进行分流;对外进行公关,挽回景区形象。
(5)当前的竞争是服务的竞争,景区工作人员位于服务第一线,服务态度好坏直接影响游客对景区满意度评价。有游客表示,峨眉山景区内仍然有部分工作人员服务态度需提高,为此,建议景区对工作人员进行统一培训,并对工作人员进行量化考核。
(6)加大宣传力度,积极拓展海外市场。根据所爬取的新浪微博LBS位置签到数据发现,峨眉山景区游客多为省内居民,国外游客较少,为此,建议景区拓宽宣传渠道,加大宣传力度,宣扬景区特色景点、特色活动,积极与国际旅行社等合作,拓宽海外市场,吸引国外游客,为景区创收。