APP下载

基于网络文本分析的太姥山旅游目的地形象感知研究

2021-07-03李惠英沈德福

关键词:太姥山目的地景区

李惠英 沈德福

当前旅游者利用在线旅游平台获取旅游目的地的相关资讯渠道呈多元化趋势。越来越多的人选择在网站上传的“游记”、“攻略”。这在很大程度上提升旅游者在旅游过程中的互动性和体验性,而利用现代信息化的技术,将旅游资源进行整合,主动感知旅游相关信息,才能为广大游客量身定做,从而提供合适、符合游客需求的旅游产品及服务[1]。

在查阅了与宁德太姥山相关的文献后,发现对太姥山形象感知方面的研究相对较少,近年来基于网络文本分析对旅游目的地形象感知研究的这个课题比较热门。因此,本研究在借鉴前人研究方法的基础上,对太姥山的旅游目的地形象感知进行网络分析,探索太姥山旅游目的地形象感知和管理,对于促进闽东旅游经济的发展具有一定的积极意义。

一、国内外研究文献回顾

近年来,国内关于网络文本挖掘的相关文献研究路径不断延伸扩展。肖亮,赵黎明(2009) 以利用多种途径提取样本,利用ROST Word Parser 软件对网络文本进行高频特征词提取,提炼出台湾旅游形象主题,发现两岸传播的台湾旅游目的地形象存在一定差异[2]。孙小培(2011) 根据携程网的759 条关于上海的游客评论作为研究对象,通过构建满意度指标系统和运用内容分析法,得出游客对上海旅游的关注度和满意度[3]。张珍珍,李君轶(2014) 通过问卷调查和网络评论两种途径获取游客对西安旅游形象的感知研究,通过数据分析、网络文本分析等方法,从多角度对两组数据进行对比分析[4]。何孟艳,张言庆,吴明玉(2017) 以携程网上的邮轮游客评论作为文本数据,使用ROST Content Mining 分析软件提取高频特征词后并进行社会网络分析,以了解中国母港邮轮游客的感知属性;并获取中国邮轮游客的满意度及相关维度[5]。邓宁,钟栎娜,李宏(2018) 以收集图片为研究样本,利用计算机进行文本分析,从认知形象、情感形象两个方面对北京在线旅游形象进行了探究,并取得不错的成果[6]。在旅游资源同质化现象比较严峻的局势中,掌握游客对目的地形象感知的真实情况,以此提高景区自身核心竞争力显得十分重要。这些研究对各种旅游产品满意度或形象有相对细化的研究案例,但对于福建省旅游景区的形象研究尚不多见。本文以网络文本方式进行太姥山的旅游形象研究,一是了解游客对景区规划和管理的评论,二是为地区旅游资源的网络宣传做基础性的工作。

二、研究设计

1、数据采集思路

在现有的旅游网站中,因携程网用户流量大,其业务包括提供全方位旅行服务、旅游咨询,主要有游记、点评等UGC 板块,且太姥山点评的相关数据也较多,相对于其他网站来说游客评论更活跃,便于选取所需的数据样本。本文基于携程网上关于太姥山游客点评的网络文本,其基本思路是:一是运用GOOSEEKER分析软件筛选、提取出点评中的高频特征词、频数,初步了解游客在太姥山旅游的所感所知;二是进行社会网络分析后,得出点评中高频词之间的交互关系,进一步整理归纳出类目表并进行分析;三是对游客点评数据进行情感分析,了解游客在太姥山旅游的感受,以期能帮助景区管理者统一协调景区各个方面的建设管理,加强太姥山旅游形象营销。

2、样本数据的采集与确定

在携程首页栏中以“太姥山”作为关键词进行搜索,利用八爪鱼爬虫软件抓取点评数据。整理后发现,携程网搜索关于“太姥山”的点评总共有3449 条,综合评分4.7 分(满分5 分),其中景色4.7 分、趣味4.5 分、性价比4.5 分。好评率占94.2%(因“社交积极倾向”,乐观评价偏多),经过条件筛选选取了2019年1 月1 日-2020 年4 月8 日期间的旅游点评集。为了确保数据的有效性和研究结论的严谨性,对采集到的数据逐条进行人工浏览和筛选,剔除与主题无关以及相关性低的点评、甄别和处理宣传广告类、无效文本类等多余的内容,最终获得有效点评440 条。

三、数据分析和处理

1、高频特征词分析

将样本通过GOOSEEKER 集搜客进行关键词提取,经进一步筛选后得到有意义的关键词及其频数,频数大小代表其重要程度,频数越高,游客的关注度越高[7],如表1 所示。

表1 太姥山旅游游客感知的高频特征词

表1 中这些排名前五十的高频词汇,在一定程度上反映出游客对太姥山旅游形象的关注点,词性包括名词、形容词等。而名词数量最多,主要涉及到资源、环境;形容词主要是用来表达游客的态度、情绪;动词主要反映游客参观游览的行为。前50 个高频词是游客对景点感知中较突出的部分,这些词集中反映了景区形象属性特点和游客的参观旅游活动行为体验特征。为了能更直观地表达太姥山游客点评的注重点,本文将表1 中列出的前31 位关键词在线生成词云图(图1)。图中字体的大小反映其关注度的大小,可以得出“太姥山、一线天、葫芦洞、方便、风景、值得、不错、门票”等是游客点评关注的热点。

图1 关键词在线生成词云图

2、类目创建

为了对太姥山形象感知进行更准确地分析,本文从5 个主类目和10 个次类目对表2 的关键词进行整合归类(见表2):

表2 太姥山形象感知类目表

旅游吸引物:太姥山风景区最吸引游客的是一线天和葫芦洞,景区的景色最为出彩的是奇特的象形石头以及山洞,游客感知强烈。

旅游环境:太姥山旅游定位是以自然资源为主,人文资源为辅。游客注意力集中在旅游环境,游客印象最深刻的是景区内的自然环境,而游客的负面评价节点集中在社会环境的感知,例如山容山貌“卫生”、“垃圾多”和“人挤人”、“不太安全”等。另外,游客对文化环境较少提及,感知较弱。

旅游设施与服务:游客对景区内基础设施、旅游服务等方面评价甚多,比如景区内爬山钻洞对体能要求高、标识不明显和门票价格偏高等,这些问题是游客较为关注的点,景区管理者应重视并着手改进和完善。

旅游体验:游客比较关注观光、体验、购物,希望多创新,开发多样化的娱乐项目。

旅游评价:游客评价以正面评价为主。

3、旅游要素分析

吃住行游购娱是旅游业中的六大要素,游客对旅游目的地形象的感知主要集中在此[8],如图2。

图2 旅游六要素

吃:福鼎地方风味饮食独特、种类多样,但游客主要提起当地小吃,网友的评论中有“畲族特色的乌米饭”、“正宗的福鼎肉片,酸辣够味”、“山上没有饭店,都是流动小商铺,漫天要价”和“小吃品种比较单一”,说明太姥山的饮食留给游客的感知较弱。

住:从文本分析出旅游者留在旅游目的地过夜的情况较少,既可以选择山上的酒店,也可到太姥山脚下秦屿镇中留宿。“住宿”一词导出高频数值为8,部分游客住宿后表示“装修陈旧”、“不够干净卫生”。这表明太姥山住宿方面的硬件设施可能存在不足。

行:关于交通的高频词数为23,包含“高速、景交大巴、自驾车、动车”等交通性词汇,这是游客赴太姥山旅游的基本交通方式。但是作为国家5A 级旅游景区,太姥山旅游交通建设较显落后,尤其对于不是自驾游的散客来说较为不便,自由行游客可以根据个人偏好设计线路,而从动车站-秦屿镇-太姥山集散中心-太姥山的交通方式耗费大。整体而言,游客对太姥山周边的交通感知形象不高,可能还需要政府和景区管理者进一步考虑和完善无障碍旅游快速通道,因为便利是提升游客满意度的重要指标。

游:相关词汇出现频数多,一方面是游客对爬山、钻洞等活动感知强烈,相关词汇频繁出现;另一方面是热门旅游景点凸显,如葫芦洞、观海栈道、一线天、国兴寺等;尤其是太姥山的云雾、日出、云海、太姥娘娘、寺庙、白茶种植等旅游资源,都给游客留下了较好的印象。

购:高频词中甚少出现相关词汇。查阅相关资料后发现,在中国太姥山风景名胜区官网以及太姥山微信公众号未设有“购物”栏目,只是简单介绍太姥山及周边的特产,如产于太姥山的白茶、绿雪芽茶等。这说明相关产品的知名度还不够高,并未得到旅游者的高度关注。

娱:文本中未出现相关词汇。太姥山景区须结合市场需求和实际情况,除了刺激的飞拉达项目外,探索旅游资源并进行深度开发。

此外,作为世界地质公园,虽未出现相关地学知识教育的词汇,但“海上仙都”、“仙境”相关词汇频频出现,表明太姥山的自然美景得到了较好地宣传,游客感知度强,也说明太姥山长期宣传的形象深入人心。而“洞”一词排在高频词第4 位,表明与文化、赏象形石相比,钻洞的乐趣更吸引游客注意。再者,“门票”、“贵”等词汇出现频率非常高,价格是旅行者做旅游决策的重要因素,大多数游客对价格都比较敏感。

4、情感分析

情感分析作为当前自然语言处理领域中最为活跃的研究方式之一[9],是对点评文本中带有感情色彩的主观性词汇进行分析、处理、归纳的过程,一般分为积极、中性和消极。本文对点评进行情感分析,判断游客的情感倾向值,并分析出用户对太姥山形象感知的情况。根据定义的规则,将情感值设定为(-1,1)区间,首先对收集的评论进行细分选择,通过细分点评的文本,并进行逐句的情感分析,其结果才更准确。-1、0、1 分别对应负面、中性、正面,将选中的评论进行数值统计并计算出每条细分内容的情感倾向得分结果,如表3:

表3 情感得分值和评论文本

情感分析能够直接反映出游客对旅游目的地的印象,游客的积极情绪可以反映出游客对旅游目的地表示满意,认同感高,消极情绪则反应出游客对旅游目的地持有不满的态度。据此可以精准地提出改善措施,提升旅游目的地形象。

旅程结束后,游客通常都会对旅游景点的形象感知进行回顾,统计情感得分结果(表4):

表4 太姥山总体形象质性分析结果

5、太姥山总体形象感知和重游意向分析

在太姥山旅游目的地网络评论中,比较突出的感知形象词汇有:“山清水秀”、“秀美”、“独特”、“壮观”和“仙境”。也有游客游完太姥山之后给予较高的评价,代表性评价是“体味山海大观的意境,感受太姥山峰险之绝。”

在太姥山总体认知中,另一个突出的感知形象是“累”。不少游客通过“与期望不符”和“恶劣天气”等因素促使游客产生消极的情感形象感知。有游客游后表示“九鲤湖很让人失望,真景和图片差异太大”、“寺庙多的景区基本是垃圾,路牌,指示牌混乱,价格太高了,最好的看点就是山上的石头,其他观光区大部分是拼凑充数的”、“就有点小雨,山上起雾很大,啥都没看到。”

根据收集的网络文本,发现在游后的评论、反思中,表示再重游的意愿很弱。样本中含“下次还会再来”“推荐”等词汇,且明确表明重游和愿意推荐的的点评数据仅35 份,在总数440 条评论中所占比例较低,这反映了游客对太姥山重游的意向并不高。尽管观光型景区的重游意愿低是行业实情,影响重游意向的因素很多[10][11],但太姥山作为5A 级景区,在景区规划、人性化管理等方面还存在诸多需要提高的地方。为了景区的长远发展,太姥山旅游管理者及相关从业者应探寻其中缘由。为刺激游后再消费行为,可利用各类调研了解此类游客的真实需求,采取丰富产品多样性、价格优惠等激励手段充分调动其重游的积极性[12]。

四、结论

1、本研究基于网络文本分析方法,从携程网上选取宁德太姥山景区在线评论为研究样本,运用八爪鱼软件抓取网络数据,以软件GOOSEEKER 提取关键词分析到建立类目分析。结果发现游客对太姥山风景区质量评价较高,前50 高频词反映了太姥山主要景点及形象特点,高频词提到的景点有一线天、葫芦洞等,提到的形象特征有海上仙都、空气和雾;情感分析中积极评价占比为50.4%,集中于景区质地和整体体验,以“风景很好”、“春暖花开”、“山清水秀”等评语为主;其负面评价占比8%,集中于景区规划和服务管理,以“累”、“指示牌混乱,价格太高”等评语具有代表性。本文通过当前热门的网络评价分析太姥山旅游形象感知,了解到太姥山在整体质地和体验方面具有较高的观赏价值,而在基础设施规划及人性化服务方面有待提升,在基础规划中要增设高品质的集欣赏和体验性的景点,在服务方面加强游憩管理的效能和制度建设。

2、本研究在网络文本研究方法上也存在一定的局限性:一是仅以携程网单个时间段点评作为样本来源进行网络文本分析。而目前的抖音、快手等平台用户分享旅游的话题越来越多,可以作为旅游网络文本的源材料;此外单时间段很难看到景区在规划和管理中的进步;其次,用作太姥山分析的点评数据量较少,这些样本集进行系统的统计和分析时,其结果与游客当时真实的想法可能存在一定的偏差。今后通过多种方法继续研究,以期更全面了解旅游目的地形象游客感知的变化。

注释:

[1]徐晓兵:《“智慧旅游”可助推兰州旅游产业升级》,《兰州日报》,2014 年1 月24 日。

[2]肖亮、赵黎明:《互联网传播的台湾旅游目的地形象——基于两岸相关网站的内容分析》,《旅游学刊》2009 年第3 期。

[3]孙小培:《基于网络评论的目的地游客满意度研究》,华东师范大学硕士论文,2011 年。

[4] 张珍珍、李君轶:《旅游形象研究中问卷调查和网络文本数据的对比——以西安旅游形象感知研究为例》,《旅游科学》2014 年12 月第6 期。

[5]何孟艳、张言庆、吴明玉:《基于网络文本分析的邮轮旅游体验感知研究》,《旅游论坛》2017 年第6 期。

[6]邓宁、钟栎娜、李宏:《基于UGC 图片元数据的目的地形象感知——以北京为例》,《旅游学刊》2018 年第1 期。

[7] 李加军:《基于景点在线评论的网络文本分析——以广州增城白水寨景区为例》,《山西经济管理干部学院学报》2019 年第1 期。

[8]田青、于淼、徐梗:《基于网络文本分析梵净山游客感知形象研究》,《农村经济与科技》2016 年第15 期。

[9]林群:《情感纳入媒介地理学中的考察》,浙江大学硕士论文,2011 年。

[10]张伟伟、张玙璠、赵忠君:《基于网络文本分析的南岳衡山旅游形象感知研究》,《怀化学院学报》2018 第12 期。

[11]刘梦圆:《基于网络文本分析的南京市旅游地形象感知研究》,南京师范大学硕士论文,2017 年。

[12]程柯:《武陵源景区游客感知形象的满意度管理实证研究》,《衡阳师范学院学报》2006 年第12 期。

猜你喜欢

太姥山目的地景区
恋爱中的城市
白蝶
云南发布一批公示 10家景区拟确定为国家4A级旅游景区
迷宫弯弯绕
太姥山地质遗迹资源以及人文历史
『摘牌』
“摘牌”
某景区留念
太姥山之夫妻峰
如何正确理解与认识风景名胜区规划