APP下载

游客的目的地感知是如何形成的?

2022-03-22史达张冰超衣博文

旅游学刊 2022年3期
关键词:文本挖掘

史达 张冰超 衣博文

引用格式:史达,张冰超,衣博文. 游客的目的地感知是如何形成的?基于文本挖掘的探索性研究[J]. 旅游学刊, 2022, 37(3): 68-82. [SHI Da, ZHANG Bingchao, YI Bowen. How is tourist destination perception formed?Exploratory research based on text mining[J]. Tourism Tribune, 2022, 37(3): 68-82.]

[摘    要]游客感知是旅游目的地管理的重要研究領域。以往研究多基于扎根理论对素材进行人工编码并归纳出范畴,或以对中介变量的假设检验来讨论其形成机制。文章以大连市5家著名景区的10万余条游客评论为资料来源,首先根据游客评分,对评论文本进行正负情感维度划分;然后以TF-IDF和TextRank两种算法对景区游客文本评论抽取关键词,并遵循诠释性研究的范式,提炼出游客正负感知的子范畴和关键范畴;随后,利用LDA主题模型方法测算出上述游客正负感知范畴的权重次序。在此基础上,最终梳理出游客目的地感知形成过程的故事线。研究结果表明:(1)游客感知的表征因素、效用因素、结构因素和特征因素等范畴内蕴含着复杂的正负情感双重维度,并呈现出动态演变的特征。(2)游客感知范畴内的正负情感主题具有显著的差异性。(3)游客正负感知之间的转换和调整,动态演绎出游客对目的地的最终认知与情感。文章建构了游客的目的地感知形成的动态过程,拓展了情感细粒度在游客感知理论的深度,同时拓宽了游客感知理论研究方法的边界。

[关键词]游客感知;文本挖掘;质性分析;感知范畴

[中图分类号]F59

[文献标识码]A

[文章编号]1002-5006(2022)03-0068-15

Doi: 10.19765/j.cnki.1002-5006.2022.03.012

引言

游客借助在线评论平台分享旅游体验信息,表达自己对旅游目的地的真实感知,已经成为旅游活动的常态[1]。对于旅游目的地而言,这些海量的游客评论内容蕴含着极有价值的感知信息,传递出游客对旅游目的地的真实感知和情感评价,同时也是反映游客目的地体验的重要信息来源。因此,精准识别这些游客感知已成为旅游目的地城市品牌建设的首要任务[2]。

游客感知作为研究旅游者心理和行为的起点,是游客感觉和知觉的综合体,通过多感官体验目的地旅游资源、旅游环境等信息所获得的心理认知过程[3],也是游客将外部的目的地旅游信息转换为内在思维的过程[4]。由此可见,游客感知是一个过程,并建立在旅游者与目的地的关联和互动的基础之上。那么,这个过程是如何演化的呢?游客感知从始至终总是“爱”或“憎”吗?一个给出高分评价(结果)的游客,就没有“不开心”的时刻吗?Court和Lupton指出,游客感知的形成和变化在于旅游者对目的地旅游信息内容的处理方式[5]。一方面,目的地作为信息源具有无偏性;另一方面,旅游者对于目的地旅游信息的接收和处理具有差异性和能动性,进而导致各异且变化的游客感知的形成。因而,对游客感知形成过程的研究就要求充分考虑到旅游者体验的动态性及其情感态度之差异性。

现有对游客感知形成机制的相关研究,多采用基于深度访谈的扎根理论、民族志等定性方法。扎根理论作为质性研究的重要方式,主要是对访谈资料的编码以及概念的梳理和范畴的提炼。这些访谈资料通常是连续性、较长篇幅的,而对片段化的资料通常不予考虑。经验性的观察发现,大量游客评论事实上均是“只言片语”,而非整理规范的“旅游攻略”。这些碎片化的评论,可能反映了游客在旅游体验过程中的动态情感变化,但通常都被过滤处理[6]。对于完整形态的长篇幅旅游攻略,除了可能是业内知悉的“水军软文”之外,这些长评论集中反映了那些愿意发表观点的旅游者的看法。从统计学的角度看,其代表性存在着内生性的偏差。

依循“在原始资料的基础上发现问题,并探寻问题的解决方法”的质性研究范式,在海量原始碎片资料的整理和阅读环节,借助成熟的计算机文本挖掘算法,辅助研究者进行质性编码,既突出机器算法处理大数据的特点,又充分发挥质性研究在资料观察和深入思考方面的优势[7]。在质性研究中,研究者的知识性和智能性为两个不可或缺的前提条件。鉴于数据处理技术已经在围棋、作曲、现代诗创作等对“智人”要求极高的领域的成功应用,数据挖掘方法应当胜任“文本”这类相对比较简单的数据处理对象。其实,质性研究的工具近几年也开始较多采用ROST、Leximancer等语义分析软件对互联网文本进行分析,这已经显示出研究者在研究方法上寻求外延和拓展[8]。但是由于ROST算法是固化的,通常只是对词频进行描述性统计,高频词普遍集中在地名或者景点名并以静态结果为主,淡化了游客感知的关键词汇和情感变化,可能导致研究结论偏差[9]。而TF-IDF1此类成熟的算法能很好地挖掘出游客真实感知的统计特征,深入分析游客感知体验结果的情感细粒度[10]。而且这些算法及其优化版可以在多个编程软件中被随时调用,非常便于非计算机专业人士使用。

对于“游客感知形成过程”的定量研究而言,通常借助中介变量的方式来发现哪些因素影响了游客感知的形成过程[11-12]。这些数量较少的定量研究,虽然局部揭示了某些因素在游客感知形成过程中扮演的角色,但并未全画面展示游客感知形成过程的动态性,尤其是游客感知蕴含的多维度的复杂情感。另外,这些研究主要采用问卷调查数据。这类数据获取方式存在数据样本量小、调查成本高、问项有限等问题,致使研究结论存在一定的局部性和主观色彩[13]。传统的问卷调查方式也无法细致深入探讨游客感知内部的情感细粒度问题。

鉴于此,本文拟基于质性分析的研究规范,借助文本挖掘算法辅助研究者对游客的目的地感知形成过程进行探索性研究。首先,以海量游客评论文本作为研究素材,结合TF-IDF与TextRank算法2提炼游客正负面感知范畴,识别出游客真实的感知体验结果;然后,以此为游客感知体验的关键因素,通过LDA主题模型3深入探讨游客感知各范畴内部的情感主题差异,解析出游客感知范畴内的重要度权重,更好呈现出游客感知的复杂情感维度;在此基础上,细致刻画出游客正负面感知的动态变化与调整,梳理出游客的目的地感知形成的脉络。

1 相关研究进展

1.1 游客感知及形成过程研究

国内外学界多以旅游体验价值来界定旅游感知的内涵。郭安禧等以实体价值、经济价值和学习价值3个维度构建游客的感知价值[14]。同样地,Choi和Choi以韩国为研究区域,研究旅游体验价值对目的地认知和情感的影响[15]。再者,Qiu等通过游客对非物质文化遗产的感知,以此建构对于旅游目的地的整体看法和态度[16]。更具体地,Shao等[17]、Gretzel和De Mendonca[18]通过研究旅游目的地品牌的视觉和言语标识等符号,指出游客对符号标识的解读进一步影响到游客感知目的地品牌的过程。

在上述探讨游客感知内涵的基础上,国内外相关文献也对游客感知所表征的现象、内容进行了较为系统的研究,相关研究主要集中在影响因素和感知过程两个领域。其中,已有影响因素的研究大多聚焦于旅游者和目的地层面。在旅游者层面主要是个体特征[19]、兴趣偏好[20]、旅游动机[21]和媒体宣传[22]等方面对旅游者决策的影响。在目的地层面的研究主要体现在目的地特征[9]、旅游环境[23-24]、服务与管理[25]、旅游资源[26]等方面,认为游客感知是旅游者与目的地关联和互动之中生成的对于目的地的认识和看法,是旅游者对于目的地情感态度的一种反映[27]。游客与目的地关联与互动的过程就是具有个体特征的游客建构目的地认知和情感的过程,主要是目的地的信息性、互动性、个性化属性对游客的满足[28]。简言之,这些研究的成果丰富,方法规范,场景全面,普适性强,因此这些重要的研究结论被用于支撑本文后续的故事线梳理和理论提炼。

在为数不多的对游客感知形成过程的研究中,从研究方法的视角观察,可较清晰地分为定性和定量研究两類。其中,定性研究方法主要以扎根理论为主。早期多以单一的实地访谈资料或者问卷为主,如高军等通过12个入境城市的623句问答的外国游客负面感知的单一访谈材料编码提炼出7大范畴和22个小范畴,构建入境游客负面感知过程[29]。熊伟和胡洋采用问卷的方式,探讨游客对非营利理念的感知过程[30]。此后,扎根研究逐渐开始采纳网络文本资料,并将访谈资料和网络文本结合使用,如高楠等利用103篇访谈和4707条网络点评探讨旅游意象感知过程,归纳总结出13个感知范畴[31]。张红梅等结合实地访谈资料和网络文本等多资料源,通过扎根方法提炼归纳出7个游客感知范畴[32]。此外,也越来越常见质性研究仅采用网络文本信息,如白丹等通过采集携程网评论3480条和大众点评网2145条游客点评,利用扎根方法归纳出5个主范畴和32个范畴,建构遗产目的地的游客感知评价过程体系[33]。王君怡等以26篇网络长游记文本为资料来源,采用扎根理论的方法提炼出8个主要范畴和19个对应范畴,探讨目的地旅游形象的认知过程[34]。上述研究尽管涉及了游客感知过程,但仍在于提炼游客感知范畴,感知过程通常并非研究的重点。此外,研究资料尽管已经较为广泛地结合多种素材,但在编码后主要体现的仍是游客感知的静态结果,对于游客感知动态过程的研究依然少见,对于游客感知情感差异性的研究仍显不足。

在定量方法方面,多数学者采用问卷调查的方法,利用因子分析、回归分析和结构方程模型等方法,探讨游客感知形成过程的关键变量[19]。因子分析方法是早期研究中经常采用的方法。楚义芳通过该方法处理42份专家问卷,提炼游客感知过程的变量,构建目的地开发评价体系[35]。张宏梅等利用因子分析探讨1070份问卷蕴含的游客对目的地形象的感知过程,识别出游客感知目的地认知形象、情感形象和整体形象的关键变量[36]。王岚等运用因子分析研究532份问卷,生成游客感知的4大公因子范畴,构建目的地可进入评价体系[37]。回归分析主要用于研究游客感知过程的差异关系,蒋长春通过481份问卷研究国内外游客感知红色文化的差异[38]。刘智兴等通过442份问卷,探讨5个关键因素对于游客感知过程的影响差异[39]。直到结构方程模型作为主要分析工具且引入中介变量之后,定量研究才开始较好地用于呈现形成过程。李静等通过711份中外游客问卷,研究构建游客风险感知过程模型[40]。类似地,陈书星利用游客感知的326份问卷,以行为因子为中介变量,探讨影响游客认知形象到情感认可的游客感知过程[12]。综上,与定性研究相类似,这些定量研究仅重在游客感知因素的测量,尚未对游客感知的动态演变和情感特征有深入探究。此外,尽管上述研究的问卷量有大幅度增加,但大量数据并非大数据。大数据的基本要求是海量的且无法用常规软件处理的数据集合。而上述问卷数据在数量的量级上和形态上均未达到大数据的门槛。

总之,对于游客感知过程的研究,无论是定性还是定量研究,均集中在游客感知范畴的提炼归纳。在资料来源上,虽都开始采用网络评论,但处理方法仍延续常用的方式。因此,现有研究对于实际场景中的正负情感交互调整的动态过程审视不足,对于情感特征分析的细粒度仍较为粗略,对于游客感知的内在形成机制的变化性还关注不够。基于此,本文拟采用文本挖掘方法辅助诠释范式分析,基于海量信息提炼和归纳游客感知的关键因素,并重点关注游客感知过程的情感变化。

1.2 旅游文本分析技术

旅游者通过社交媒体或者在线网站生成的文本数据在旅游领域的应用逐渐上升[41-42]。就文本分析方法出现的时间顺序而言,大致包括人工编码、ROST语义分析、文本挖掘算法等3种方式。人工编码仍是重要的文本分析方式,也不可能完全被机器编码所替代。同时,鉴于游客文本信息的海量化,研究者已经开始较为频繁地采用ROST语义分析工具,实现高频词处理和语义网络图。虽然ROST软件一定程度上避免了研究者的主观因素和预设想法,但存在较严重的效度问题[43]。ROST语义分析以关键词、主客观词语为参考或者根据词典进行词频统计,常造成专属名词和常用词语的词频过高,未能深度挖掘出评论主题,比较容易忽略评论中有用的信息,增加了后续分析的误差。比如在对北京故宫的文本研究中,出现词频最高的是“故宫”和“北京”[8]。而实际上,这两个高词频可能并非游客的关注点,只不过在评论过程中,需要多次强调两个地理位置而已,游客真正关心的可能是“雪景”或“留念”。类似地,在天门山景区的游客情感特征研究中,词频最高的是“天门山”和“景区”[9],可能导致本应是网络关联中心词的“游览”或“索道”被弱化,由此造成研究结论可能出现偏差。那些本应被突出的关键因素由于算法的原因极易成为研究盲点。

相比之下,文本挖掘算法不直接基于词频来判断文本中的关键词,从而可以避免上述弊端并比较精准识别出文本中最有代表性的关键词[44]。鑒于游客在线评论文本是一种典型的非结构化数据,文本挖掘算法的优势在于能够快速地处理海量的非结构化信息,并且深度挖掘出文本隐藏的内容,这对于研究游客感知显得尤为重要[45]。根据工作重点的不同,目前文本挖掘方法大体有3类:第一类是抽取关键词和关键短语。关键词语的抽取是文本处理的基本工作。TF-IDF和TextRank两种常用的成熟算法,针对游客评论文本信息主观色彩浓厚、信息相对冗杂的特点,可获得对评论文本中心思想有概括的关键词语,准确识别出游客的真实思想[46]。第二类方法是主题建模。该方法主要用于挖掘游客评论文本数据的主题并进行归纳操作[47]。主题建模常通过“降维技术”来消除多重语义和术语的歧义,将评论文本和语料库中隐藏的维度显现出来。本文将采用比较常用的LDA主题建模方法。第三类是情感分析。情感分析是自然语言处理领域的重要任务,研究最广的问题是情感分类问题[48]。因此,本文根据研究目标的递进性,逐次采用上述3种方法对文本进行挖掘,并对文本挖掘出的关键词和关键短语进行情感分类,判断游客评论文本表达的正负面的情感类别,最终识别出游客的情感变化过程。

1.3 游客感知的情感维度

旅游者情感的维度构成在旅游者情感体验中占据极为重要的位置[49]。探析游客感知体验情感维度的研究多通过访谈、问卷等方式,针对旅游者对目的地主客观事物的情感评价结果,集中探讨测度游客感知的积极或者消极情感维度[50]。例如,Hosany和Gilbert的研究指出旅游者的目的地感知情感主要由快乐、爱、惊喜3个维度构成[51]。黄潇婷研究开发设计“痛苦-快乐”情感维度的问卷量表来测度旅游者的情感体验[52]。随着学者们对游客感知体验中情感维度的分析不断深耕,越来越多的学者开始关注旅游者情感的粗粒度和细粒度。粗粒度情感一般用于判断文本整体的情感极性;细粒度情感多被用于判断游客对评论对象中具体属性或维度的情感[53]。情感细致化研究逐渐在旅游感知体验中占据重要地位。如Nawijn等探讨黑色旅游情境中以痛苦、同情和积极为代表的旅游者情感维度,并解析出痛苦情感维度包含5种负向情绪,积极情感维度包含4种正向情绪,同情情感维度则介于正负向情绪之间[54]。国内学者李君轶等则以8类积极情感、8类消极情感和4类中性情感构建旅游者情感轮,进一步细化旅游者情感维度,比较全面理解游客的情感体验[55]。上述研究多通过研究者对旅游者的访谈或问卷资料进行归纳演绎,解读出旅游者的情感倾向和特征。

随着计算机技术在旅游者情感细粒度研究中的深入应用,通过“贴情感标签”来区分旅游者情感维度,成为深入研究旅游者情感体验差异的常用方式。例如李春晓等将游客评论数据事先贴上正负向情感两类标签,然后分别挖掘游客正负面情感体验的关键因素和情感特征差异[13]。与之类似,Liu等通过中国游客对澳大利亚目的地的在线评价,以情感词典的方式为旅游者“贴情感标签”,据此探讨中国游客的情感画像以及与国际游客的情感特征差异[43]。“贴情感标签”实际上是借助大数据技术探究旅游者感知体验的情感维度,有利于呈现出旅游者正负面情感的细粒度和动态变化[56]。同时,基于大数据技术探讨游客感知的情感维度有利于深入理解旅游者的行为特征和表达倾向,在很大程度上刻画出旅游者的内在心理机制,是对旅游体验的深入剖析[49]。本文拟在“贴情感标签”的基础上,进一步关注情感的变化。因为如果仅从旅游体验结果上看,旅游者似乎总是“爱憎不变”,始终处于某种情感的稳态,而这与惯常的旅游体验中情感变化的丰富性并不一致。因此,本文拟注重游客情感维度的差异化,并以此为基础,关注旅游者“爱憎”转换的动态情感过程。

2 研究设计与实施

2.1 数据收集说明

携程网与去哪儿网拥有用户数量超过1亿,具有海量的游客评论数据。两个平台均采用5分制的评级打分机制,评价层级分明。因此,本文将其作为游客感知数据来源平台。同时,选择大连市作为研究区域,主要是因为大连是我国著名的旅游城市,游客体验评论数据丰富,原始资料的代表性好,易于形成普适性较强的研究结论。目的地选取了大连市评论数量最多且百度指数关注度最高的5个著名景区,分别是金石滩风景区、老虎滩海洋公园、棒棰岛风景区、星海广场、圣亚海洋世界。再者,考虑到游客感知的时效性和建模所需的原始材料数量,本次数据选取2018年1月至2020年1月的游客评论文本。剔除掉无用和杂乱的评论信息,总共收集到用于文本挖掘的游客评论文本174 667条。

从原始材料的信度看,游客在线评论信息可被视为具有独立意义的文本内容,是游客真实感知的表达,具有良好的内在信度[57]。从原始材料的饱和性要求看,在整理分析资料的过程中,本文不断反省已有资料是否存在缺陷或者不足。本文在初期仅收集了携程网的数据,鉴于目的性抽样的逻辑在于选择信息丰富的案例来进行深度研究,研究者从中可以获得很多对研究目的至关重要的信息[58]。后又补充收集了与携程网打分机制类似,但用户群体不同的去哪儿网数据。最后通过对2018—2020年相关评论的随机浏览以及长篇幅评论的重点阅读,认为新的素材已不再提供新的信息,原始材料达到饱和。

为保证研究的效度,研究团队发现游客评论信息与研究者基于经验性的预判基本一致。同时本文采用了三角互证法。三角互证法要求采访者从不同的视角,让不同的受访者去分析评价同一现象或问题,他们观点之间的一致性和差异性对研究的结果都极为重要。本研究从游客(当地和外地)、景区管理者两个方面来搜集关于游客感知问题的观点。由于研究团队已经与当地景区管理者建立起了信任关系,因此获取了较全面和真实的信息。同时,研究团队在2020年9月中旬至10月中旬在上述5处景点,与游客进行非正式访谈,获取相关信息。经比较两方对该问题的看法,发现与网络评论文本信息一致,网络文本信息可靠有效。

2.2 数据初步处理

(1)数据分析步骤说明

本研究遵循质性研究的规范并结合网络评论文本的特点,按照如下步驟开展研究:首先,对文本进行提纯,以获得合格的文本数据;其次,对游客评论文本先贴上“情感标签”,划分正负面的游客情感评论,以此区分游客的感知状态;然后,进行研究一,利用文本挖掘方法进行关键词提取,该项工作类同于开放式编码;接着,研究者通过诠释性研究来理解关键词阐发的意义,再对这些关键词进行子范畴归类,并总结出范畴。子范畴与范畴的提炼均由研究者人工进行。研究一虽然归纳出关键词,但并不知道其重要性的差异。在大多数研究中,通常将开放式编码默认为权重相等。已有一些研究通过人工统计的方式,计算子范畴在某文本中的比例[59],但仍未能获得各编码相互间的重要程度。故研究二以研究一所梳理出的4个范畴为基础,进一步呈现出游客正负两种感知情绪中各关键词(编码)的重要性区别。此外,研究二的另一个作用在于,通过更换算法再次验证研究一的关键词提取是否准确。最后,在上述研究的基础上,研究三梳理出游客感知形成过程的故事线。

(2)数据提纯

由于通过网络爬虫收集的游客评论文本不可以直接使用,故处理文本信息之前首先对文本作中文匹配,只保留游客评论的文字部分。其次,进行数据去重,删除游客评论中部分重复的文本,提高文本分析效率。再次,删除缺失数据。收集的游客评论的完整文本理应包括游客昵称、游客评分、游客评价、评价时间4个维度,但是实际上对于每条游客评论文本可能存在维度不全的情况,导致部分游客评论无效失真等问题,影响到文本的信度和效度。此外,游客评论内容中字数特短的语句,可能无法正确表达出游客的真实感受,也比较难提炼出有效的特征项和关键词。借鉴赵宇晴等的经验,删除少于或等于4个字的评论文本[60]。最后,去除无效文本。游客评论文本包含大量并没有实际意义的停用词和特殊名词,如“的”“了”等。这些无效文本会降低文本挖掘的准确性,属于文本分析中的“噪音”。

(3)数据标签

本部分对游客评论文本“贴情感标签”。从游客的打分结果看,各分值分布不均衡,1分和2分的评论数比较少。因此,为提高游客评论文本的平衡性,本文借鉴李春晓等的方法[13],采用合并少数的方法将游客评分为1分和2分的划分为负面情感数据,将评分是5分的划分为正面情感数据,将评分3分和4分的划分为灰色数据,其中灰色数据是指好坏参半的游客评论,游客感知的情感差异区分度不高,由此删除灰色数据。具体分布见表1。

由表1可知,5个目的地景区的游客评分的均值和标准差均比较稳定,说明游客评论信息能够较好反映出游客感知的基本结构与内容。此外,在5个目的地景区的正负情感数据与灰色数据的数量占比上,星海广场的正向情感的感知占比最高,表明游客认可程度较高。棒棰岛风景区的负向情感的感知占比最高,表明游客对棒棰岛风景区的感知体验相对其他景区较低。

2.3 数据阐释框架

内容分析法不适合解读文本挖掘算法得出的关键词,因此,借鉴诠释性研究范式[61-63],通过研究者的浸入,对游客正负面感知的关键词和关键短语进行阅读与理解,有助于明确上述关键词在一个更一般性的语境中所能阐发的意义。由于国内外研究多基于“途径-目的”理论[64-68]范式对游客感知进行归类,故本文依据该理论对机器编码结果进行梳理和诠释。“途径-目的”理论多从“属性-结果-价值”的链条,强调目的地产品或服务属性与游客价值之间的关系,将目的地属性视为达到目的的方法,反映出游客价值趋向。而游客体验结果作为目的地属性与游客价值之间的桥梁,将游客对目的地属性的体验结果与游客价值联结起来[64]。具体而言,属性层是旅游目的地的产品或服务;结果层描述出游客通过目的地产品或服务属性产生的体验结果;价值层刻画出游客个人价值观和理性状态[65]。对于旅游者来说,游客价值源于旅游体验结果,旅游体验结果体现在游客对目的地属性的感知评价,是游客价值的主要决定因素[66]。张宏梅等认为,根据“途径-目的”范式,目的地游客感知价值存在“目的地属性-目的地体验结果-旅游者的价值观和终极状态”这一层次关系,而且将目的地属性与目的地体验分层次分析,更具有指导意义[67]。特别地,对于上述“属性-结果-价值”链条中的价值的衡量,多数研究采用Zeithaml对顾客价值的定义,认为顾客价值是顾客感知到的利益与其在获取产品或服务时所付出的成本进行权衡后对产品或服务效用的总体评价[68]。本文将采用此概念,因为该定义强调了顾客对于成本的权衡,突出了动态比较的心理过程,与本文的研究目的相吻合。

综上,本文主要依据“途径-目的”范式,将旅游目的地的特征、环境、资源与管理等因素所赋能的目的地产品、服务等属性作为互动基础,将旅游者与目的地属性的关联互动生成的游客评论当作感知体验结果,进而探索以情感维度为表征的游客感知。

3 基于游客评论文本挖掘的探索性研究

3.1 研究一:提炼游客感知的关键词和关键短语

关键词语或主题词汇是情感特征探析的基本元素,蕴含着旅游者的特定情感倾向,表达出旅游者的情感定向[69-70]。TF-IDF与TextRank两种算法常结合使用,交叉验证游客评论内容的关键词,可以弥补单一算法挖掘关键词时准确性和全面性的不足,从而清晰地呈现出游客的真实感知。TF-IDF的核心思想是:字词的重要性随着其在文件中出现的次数成正比增加,但同时会随着其在语料库中出现的频率成反比下降。一般情况下,关键词出现频率越大,TF值就会越大,其在文档中所占的比重就会越多,重要性也就越高[71]。但文本评论内容包含较多无意义的通用词语和专属名词以及特定地点词语,削弱了游客评论中其他关键词的重要性,而逆向文本频率IDF则反映出关键词的普遍程度。因此,TF-IDF算法有助于提高重要关键词的权重。同样地,TextRank算法主要通过词语之间的相邻关系构建网络,然后计算每个网络节点的Rank值,最终通过排序Rank值提炼出关键词。TF-IDF算法对于语料库的依赖程度大,而TextRank算法可以直接对游客评论素材逐条进行分析,进而得到关键词。因此,通过结合利用TF-IDF与TextRank算法共同提炼游客评论的关键词,将关键词拓展成主旨更清楚的关键短语,进一步验证游客评论关键词的信度和效度[72]。

因此,本文抽取出游客评论内容前5个高频关键词和关键短语,如表2所示1。

(1)正面感知子范畴提取

金石滩风景区出现频繁的游客正面感知在于孩子,孩子的体验是游客感知的焦点。老虎滩海洋公园的关键词和关键短语主要表现在动物表演类词语较多,说明游客对于海洋公园的动物和植物类资源感知较深。独特的海洋资源景观是棒棰岛的景区特色,游客对于棒棰岛的海滩、海水、海景产生深刻的感知。星海广场的跨海大桥、城堡酒店和海鸥是目的地特色,尤其是城市夜景深受国内外游客的喜爱。圣亚海洋世界的海洋极地环境和动物表演是圣亚海洋世界主打的特色项目,也是游客直接感知所在。

(2)负面感知子范畴提取

金石滩风景区负面感知集中于导游、海滩、门票、垃圾、沙子,反映出金石滩风景区存在景区导游管理、游客数量和景区卫生等问题。老虎滩海洋公园负面感知聚焦于表演、设施、门票、工作人员等,结合景区设施旧、工作人员态度差、收费多等问题的感知,说明景区的管理不到位,同时游客对于景区表演节目、票价和收费等问题不满意。棒棰岛风景区负面感知围绕着管理、司机、观光车、接待、站岗,特别是景区的司机、观光车、接待、站岗特权等问题表现出景区的管理秩序和服务问题。星海广场的负面感知主要是啤酒味道、景色失望、管理乱、音乐吵、浴场垃圾等,说明景区的管理和卫生存在一定问题。圣亚海洋世界的负面感知的排队等待久、表演多、场馆远等,侧面反映出景区的产品规划和管理问题。

(3)子范畴归纳

上述通过文本挖掘得到的关键词和关键短语,类似于开放性编码经初步概念化得到的编码结果。为保证本文基于海量碎片化的文本进行挖掘的结果与人工编码结果之间不出现偏差,本文将通过TF-IDF与TextRank两种算法抽取游客评论内容获得的高频关键词放宽到前50个,然后选用部分长篇幅网络评论,采用人工贴标签和概念化的方式,得出与50个高频关键词基本类同的概念。因此,笔者基于理解关键词和关键短语阐发的意义归纳出12个子范畴。其中,将游客正面感知的子范畴归纳为目的地及旅游资源体验、情感体验等,将游客负面感知的子范畴归纳总结成情感体验、生态环境等,详见图1。需要指出的是,游客正面和负面感知在归纳和范畴化之后,并未分别得出完全一致的子范畴,故其区分度相较于人工编码更细腻,更有助于对感知形成过程的深入探究。

(4)游客感知范疇归类:基于“途径-目的”理论

首先是属性层次。从上述5个景区的产品属性看,均与海(自然景观)密切相关,有的侧重于观赏(如星海广场、棒棰岛),有的侧重于主题公园(如老虎滩、圣亚)。从目的地属性看,大连市内交通便利,气候怡人。从结果层次看,游客感知的正面结果占比比较高,负面结果占比低,且主要集中在少数几个维度(表1)。从感知价值层面看,既有“景色不错,有趣好玩,性价比高,游玩一体,特别是极地海洋馆表演,值得游客观赏,水城别具一格,在其他地方没有类似场,总体超赞。”(Q2154)这样的正面利益所得,也有“景色很一般,也没啥可玩的,全是人,景区标识差,五一也不限流,390多的门票,还不如随随便便找个海边走走。景色一般,可玩性低,性价比低,有待改进。”(Q1234)之类的负面损失。

基于游客感知体验结果而对感知范畴的诠释,主要基于如下阶梯法的思考顺序展开:旅游目的地的哪些因素产生了吸引力?游客从不同的旅游景区获得了哪些收益?这些收益为什么重要?即,由具体的旅游目的地属性抽象到产品或服务属性的体验结果,再进一步抽象到结果生成价值,自下而上地演绎出游客感知的多层次动态过程。根据郭安禧等[73]和李艳[74]的研究,目的地属性主要包括吸引物属性、体验属性、旅游服务属性以及个性化属性等方面。因此,本文所归纳的自然资源、生态环境和人文特色等子范畴主要为目的地吸引物属性,独特的海洋资源和特色人文活动(如啤酒节)聚合出以海景和地标等为代表的正向的盛宴收益,但是也产生喧闹、卫生等负面收益,正负收益主要聚焦在目的地有形与无形的吸引物的表现形式,故归纳为表征因素。而目的地及旅游资源体验、情感体验等子范畴主要为目的地体验属性,多样的吸引物带动浓郁的娱乐休闲氛围,提升游客以喜欢、开心、高兴等为代表的正面情感体验,相反,单一的情景剧和重复的舞台节目降低游客体验,带来表演不好、体验不佳的负面收益。这些正负面收益常为游客的主观效用判断,因此归纳为效用因素。另外,景区管理、景区规划、辅助服务、内外交通、时间安排等子范畴主要为目的地旅游服务属性,目的地整合管理和服务的规范与标准,满足游客对于景区管理、服务接待、环境卫生、基础设施等主要与辅助服务的要求,为游客打造出纪念品多、购物方便、时间便利等正面优质服务,同时也表现出设备旧、态度差、接待坑人、管理差等的多层级管理与服务问题,带来游客负面收益。这些涉及目的地景区管理与服务的问题呈现出多层级、多方面的结构性特征,因此归纳为结构因素。最后,游客特征与景区特征等子范畴主要为个性化属性,以孩子为代表的亲子与家庭旅游,多关注孩子的兴趣和个性带来的孩子适合、孩子开心等正面收益。而以特权站岗、司机车多、海岛小等为代表的景区特征,则引致游客的负面收益。李春晓等将游客个体特征与景区特征合并为特征因素,作为游客感知范畴的因素[13]。本文也将其归纳为特征因素。因此,本文最终将12个子范畴合并成为表征因素、效用因素、结构因素、特征因素等4个感知范畴。这4个范畴为“目的”,它决定哪些“结果”(子范畴)是游客所关注的,最终决定哪些“目的地属性”(关键词和关键短语)是重要的(图1)。

3.2 研究二:基于LDA主题模型的游客感知范畴差异

研究一已完成对游客感知范畴的归纳并总结出4个范畴,本部分将采用LDA主题模型对游客感知因素的重要性进行排序。LDA主题模型的核心思想是将文本的主题以概率分布的形式呈现出来,然后对各个主题在文本中的关系进行聚类与降维,从而计算出主题的权重[7]。鉴于以往相关质性编码研究并未考量各范畴在正负感知上的不同,故研究二将在研究一的基础上,对同样的研究文本进行主题抽取并赋权,试图探寻游客感知范畴内部的关键概念之间的相对重要度(表3)1。

研究二呈现出游客感知范畴内蕴含的正负面情感特征的差异性。如表3所示,在表征因素方面,游客感知的正面情感维度占据绝对主流地位,其中以表演、动物多、浴场等为前5位的正面感知情感主题的权重远高于负面感知情感主题,从而表达出游客对旅游目的地特色和现代化的旅游资源的正向情感维度。类似地,在效用因素方面,以旅游资源与游客情感的正向体验为主,凸显出以很棒、开心等为代表的游客正向情感维度,而以喧嚣与不值当等负面情感维度权重较小。上述两个因素的负面情感关注点少、权重小,在情感体验中的存在感较弱。而游客感知的结构因素主要表现为以游客负面情感维度为主。游客感知负面情感维度以遮阴少、辛苦、场馆远等主题为主,负面情感主题主要聚焦于基础设施、景区规划、导游服务和景区管理以及内外交通等管理与服务层面,负面情感主题比较聚集。而结构因素的正面感知主题的权重虽相对较小,但仍有一定话语权,表达出部分游客对于景区购物条件和当地的服务尚可接受。在特征因素方面,游客感知的正负面情感主题权重差距相对较小,主要原因可能在于特征因素的客观性,其中游客负面感知因素以站岗多、不让进、司机车多等主题为主,一定程度上表达出游客对旅游景区限制问题的不满,未能及时分流且告知游客。而游客正面感知的情感主题主要以孩子、场馆多等为主,且孩子所占权重最高,很大程度说明亲子旅游对于特征因素的正向情感影响较大。因此,在不同的感知范畴内,有的正面情感占绝对主导权;有的负面情感为主要因素,但正面情感也在发挥作用;还有的正负面情感较为均衡。所以,研究二反映出游客感知范畴内部正负面情感存在不同程度的分歧,表达出游客感知情感维度的复杂性。

3.3 研究三:建构游客感知形成模型

承前所述,在提炼出游客感知范畴的基础上(研究一),结合游客感知范畴内部情感主题的重要性差异(研究二),将这些范畴围绕着游客正负面感知的动态发展进行关联,并根据1.1部分整理出的游客感知内涵的重要研究成果,梳理出游客感知形成过程的故事线,最终构建出游客感知形成模型。

(1)旅游者与目的地的关联与互动

已有研究表明,游客感知形成过程始于旅游者获取目的地信息,旅游者与目的地之间的关联和互动是游客获取信息的关键所在,也是游客感知形成过程的基础环节[67]。旅游者在获取目的地信息之后,通过对目的地信息内容的处理生成对于目的地的游前印象。同时,旅游者在旅游过程中与目的地之间的关联与互动为游客感知提供更加深入和全面的信息,其主要体现于旅游者与目的地特征、環境、服务与管理、旅游资源之间的关联与互动。如“去大连带孩子值得去的地方,让宝宝可以充分了解海洋世界。(X1202)小孩子的游玩天堂。(Q5547)确实很漂亮的小岛,景色宜人,闹中取静,值得来走走看看!带父母一起来的,慢慢逛也不累。”(X15228)“清澈的海水,秀丽的风景,孤立于海中的棒棰岛,度假胜地,跟网上宣传的差不多。”(Q57907)也就是说,旅游者对于目的地旅游信息的接受与处理方式导致游客感知形成和变化。因而,对于游客感知形成过程的研究需要充分考虑到旅游者与目的地之间的全程关联与互动,并以此产生的游客对于目的地的正面感知和负面感知。

(2)游客正负面感知的动态变化

旅游者正负面感知的动态变化是游客感知形成过程的核心环节,是决定游客感知体验结果的重要过程。准确地说,通过对游客正负面感知因素比较和调整的理解,诠释出旅游者与目的地的关联与互动过程,并解构出游客感知体验结果的意义。在很大程度上,借助对游客正负面感知因素的观察与解读,探寻和阐发游客感知的意义,增进对旅游者复杂动态情感的理解。具体而言,旅游者正是通过比较正负面感知因素,调整对于旅游目的地的认知与情感。这意味着,旅游者正负面感知的比较和调整是感知体验结果的关键所在,游客正是通过正负面感知因素之间的动态比较与调整,塑造游客的认知与情感,以此判定旅游目的地的旅游体验。对于游客正面感知而言,主要分布在旅游目的地的表征因素、效用因素和特征因素;如“金石滩延绵30多公里长的海岸线,汇聚了巧夺天工的地质奇观,如惟妙惟肖的大象吸水、大鹏展翅、猛虎扑食、恐龙吞海、贝多芬头像等,尤以龟背石震撼世界地质学界。”(X21475)“不愧是国宾级的,一下车就是海边,深呼吸,夹着海水的空气感觉立马把人的五脏六腑给清洗了一遍。海水非常干净。看着远处海天合一的景色,撑把遮阳伞一点都感觉不到热。建议到大连的朋友一定要去棒棰岛看看。”(X12005)负面感知大多体现在旅游目的地的效用因素、结构因素和特征因素等,主要是结构因素。如“金石滩度假区面积很大,需要搭乘景区大巴进入,景区内有多个小景区,有的比较坑,万福鼎景区就是一个,进去后巴士陪伴的导游会让你去测字然后让你交钱,很坑人的。”(Q42371)游客正负感知出现交叉意味着旅游者对于目的地大多处于正负面感知胶着的复杂状态。因而,进一步辨识出游客正负面感知孰轻孰重就显得尤为重要。再者,“比较”着重于关注游客正面感知与负面感知之间的动态变化,彰显出游客复杂的情感状态。而“调整”则是游客通过比较正负面感知得出新的结果。如“看以前的照片,觉得海滩变小了很多,里面基本上是一个人为修缮的大公园,可以拍照游玩,景色还行,好像也有一些宾馆,可以入住,个人觉得没什么意思。但是宝贝第一次看大海,比较激动,看到孩子高兴,我也比较满足,下次还带孩子来。”(X20145)此处表现出游客由负面到正面的调整过程。如“海水比较清澈,人也不是太多,沙滩比较大,看起来挺不错的,但离市区较远,如果单独只为来这里的话不太值得,不如在市区内的海水浴场玩玩就可以了。”(Q14967)而在此处体现出游客由正面到负面的调整过程。因此,旅游者正负面感知的动态变化彰显出游客对旅游目的地复杂的认知与情感,是建构游客感知的重要条件。

(3)游客感知的建构

游客感知的动态变化正是游客正负面感知相互比较和调整过程的结果,比较并调整后的游客感知塑造游客对于旅游目的地的认知与情感。这意味着,旅游者在旅游过程中不断对目的地正负面感知进行比较,调整游客对于目的地的评价和体验结果。如“起初到了以后感觉挺好的,景点比较多,景色挺美。只不过确实不需要买联票,地质公园才适合去看一下的,其他几个馆并不好,如果不是特别喜欢石头蜡像之类的,真的没有必要买联票。”(X4169)“园区人景挺好,体验比较好,但是园外很窝心。当地地痞垄断出租车,多倍抬高车价,欺压游客,给大连城市旅游抹黑。”(Q2453)更确切地说,游客正负面感知的差异是旅游目的地游客感知形成过程的根本原因。

總之,游客感知是一个过程,是建立在旅游者与目的地的关联和互动基础之上的。游客感知形成过程是旅游目的地正负面感知相互比较和调整的结果,是决定游客对旅游目的地认知与情感的重要过程。在此主要是通过比较游客正负面感知因素的重要性和优先度,形成游客对于目的地的动态感知,真实地反映出游客在整个旅游过程中心理活动的动态变化。基于此,在充分考虑前述研究和游客感知范畴的基础上,建构游客感知形成模型(图2)。

4 研究结论与讨论

4.1 研究结论

本文通过计算机算法辅助研究者处理游客评论大数据,并遵循质性研究的范式提炼出游客感知范畴。不同于以往研究,本文细致地考察游客感知内部的正负情感主题数量和权重,描绘出游客感知范畴的情感词频和语义背后的深层次细节。研究发现,游客的目的地感知是动态演变的,游客感知子范畴内部的正负情感特征促成蕴含游客感知主范畴的析出。此外,游客感知形成过程包括旅游者与目的地的关联与互动、游客正负面感知的动态变化、游客感知建构3个过程,且3个过程之间存在相互联系。其中,旅游者与目的地的关联与互动是游客感知形成过程的基础环节,游客正负面感知的动态变化是游客感知形成过程的核心环节,是游客感知动态变化的根本原因,游客感知建构是游客感知形成过程的结果。

本研究探索发现和提炼出海量数据背后的关键概念和范畴,尝试拓宽质性研究的原始材料的数量,一定程度上可改善质性研究的主观性和内生性。此外,本研究刻画出游客心理的内在活动和情感特征,比较精准识别出游客的情感态度,呈现出游客感知差异的动态演进规律,有利于拓展游客感知理论的深度,具有一定的理论意义和实践价值。

4.2 研究不足与展望

本文通过对旅游目的地游客评论信息进行文本挖掘,识别出游客感知范畴和情感差异,尽管得到游客的正负面感知的关键要素,但是对于游客感知差异的演变趋势可能受限于时间跨度的影响。首先,本研究的数据搜集完成于2020年1月初。原计划进行的后续数据补充和现场调研,受大连市两次疫情的影响,直到2020年9月份旅游业基本恢复后才进行。其次,质性研究强调研究者对于语言材料的高度敏感和充分理解,本文并非奢望使用文本挖掘算法替代人工编码,而是借助机器算法辅助研究者对海量文本进行编码工作,但未能将同一资料的文本挖掘与人工编码的分析结果进行比较研究。这将是本文在后续研究中着力解决的一个重要问题。

此外,本文主要围绕游客评论文本的单模态数据进行探索性研究,后续如果能够同时处理图片、音视频等多模态数据,会使得游客的目的地感知过程的研究更充分。再次,因为游客感知过程是一个心理活动,后续研究还可借助认知神经学等相关理论,采用眼动、脑电等设备进行实验研究,可能会发现更有深度的结论,这也是本研究后续努力的方向。最后,本文主要对单一案例(大连市)进行探索性研究,尚未采用多案例进行验证与补充,研究结论可能缺乏其他案例的佐证和完善,而多案例研究在研究情境还原和故事演绎方面具有显著优势。考虑到研究结论的普适性,后续研究将拓展到多案例研究,拓宽本文研究结论的边界,进一步深化理论贡献。

参考文献(References)

[1] MA Y, XIANG Z, DU Q, et al. Effects of user-provided photos on hotel review helpfulness: An analytical approach with deep leaning[J]. International Journal of Hospitality Management,2018, 71: 120-131.

[2] 王丽娜, 李华. 入境旅游者对中国旅游目的地形象的负面感知研究[J]. 世界地理研究, 2019, 28(06): 189-199. [WANG Lina, LI Hua. Research into the negative perception of inbound tourists on the tourism destination image in China[J]. World Regional Studies, 2019, 28(6): 189-199.]

[3] 吴小根, 杜莹莹. 旅游目的地游客感知形象形成机理与实证——以江苏省南通市为例[J]. 地理研究, 2011, 30(9): 1554-1565. [WU Xiaogen, DU Yingying. Empirical study on perceptive image formation of tourists on tourism destination:A case study of Nantong, Jiangsu province[J]. Geographical Research, 2011,30(9): 1554-1565.]

[4] DECROP A, SNELDERS D. A grounded typology of vacation decision-making[J]. Tourism Management, 2005, 26(2): 121-132.

[5] COURT B, LUPTON R A. Customer portfolio development: Modeling destination adopters, in actives, and rejecters[J]. Journal of Travel Research, 1997, 36(1): 35-43.

[6] FANG B, YE Q, KUCUKUSTA D, et al. Analysis of the perceived value of online tourism reviews: Influence of readability and reviewer characteristics[J]. Tourism Management, 2016, 52: 498-506.

[7] ZHANG W, FESENMAIER D R. Assessing emotions in online stories: Comparing self-report and text-based approaches[J]. Information Technology & Tourism, 2018, 20(1): 83-95.

[8] 周欣琪, 郝小斐. 故宮的雪: 官方微博传播路径与旅游吸引物建构研究[J]. 旅游学刊, 2018, 33(10): 51-62. [ZHOU Xinqi, HAO Xiaofei. Snowy scenery in the Forbidden City: Communication and construction of a tourism attraction using Sina Weibo[J]. Tourism Tribune, 2018, 33(10): 51-62.]

[9] 刘逸, 陈欣诺, 保继刚, 等. 游客对自然和人文旅游资源的情感画像差异研究[J]. 旅游学刊, 2019, 34(10): 21-31. [LIU Yi, CHEN Xinnuo, BAO Jigang, et al. Tourists’ emotional evaluation between natural and cultural attractions[J]. Tourism Tribune, 2019, 34(10): 21-31.]

[10] LITVIN S W, GOLDSMITH R E, PAN B. A retrospective view of electronic word-of-mouth in hospitality and tourism management[J]. International Journal of Contemporary Hospitality Management, 2018, 30(1): 313-325.

[11] 于鹏, 张宏梅. 韩国国家形象感知与旅游意向研究——以中国潜在旅游者为例[J]. 旅游学刊, 2016, 31(12): 62-75. [YU Peng, ZHANG Hongmei. An empirical study on South Korea country image perceptions and tourists’ travel intentions: A case study of potential Chinese tourists[J]. Tourism Tribune, 2016, 31(12): 62-75.]

[12] 陈书星. 城市湿地生态旅游感知形象的影响因素——以广州市南沙湿地为例[J]. 城市问题, 2018(1): 46-55. [CHEN Shuxing. Influencing factors of the perceived image of urban wetland ecotourism: Taking Nansha Wetland in Guangzhou as an example [J]. Urban Problems, 2018(1): 46-55.]

[13] 李春晓, 李辉, 刘艳筝, 等. 多彩华夏: 大数据视角的入境游客体验感知差异深描[J]. 南开管理评论, 2020, 23(1): 28-39. [LI Chunxiao, LI Hui, LIU Yanzheng, et al. Research on the differences of inbound tourist perceived experience based on text mining[J]. Nankai Business Review, 2020, 23(1): 28-39.]

[14] 郭安禧, 郭英之, 李海军, 等. 旅游者感知价值对重游意向影响的实证研究——旅游者满意和风险可能性的作用[J]. 旅游学刊, 2018, 33(1): 63-73. [GUO Anxi, GUO Yingzhi, LI Haijun, et al. Empirical research on tourists perceived value influence to revisit intention: The role of tourists’ satisfaction and risk probability[J]. Tourism Tribune, 2018, 33(1): 63-73.]

[15] CHOI H, CHOI H C. Investigating tourists’ fun-eliciting process toward tourism destination sites: An application of cognitive appraisal theory[J]. Journal of Travel Research, 2019, 58(5): 732-744.

[16] QIU Q, ZHENG T, XIANG Z, et al. Visiting intangible cultural heritage tourism sites: from value cognition to attitude and intention[J]. Sustainability, 2020, 12(1): 132.

[17] SHAO J, YI S, SHEN Y, et al. Research on the influence of emoji communication on the perception of destination image: The case of Finland[J]. Travel and Tourism Research Association: Advancing Tourism Research Globally, 2020, 19.

[18] GRETZEL U, DE MENDONÇA M C. Smart destination brands: semiotic analysis of visual and verbal signs[J]. International Journal of Tourism Cities, 2019, 5(4): 560-580.

[19] 劉建国, 黄杏灵, 晋孟雨. 游客感知: 国内外文献的回顾及展望[J]. 经济地理, 2017, 37(5): 216-224. [LIU Jianguo, HUANG Xingling, JIN Mengyu. Research progress and enlightenment of tourist perception[J]. Economic Geography, 2017, 37(5): 216-224.]

[20] 索志辉, 梁留科, 苏小燕, 等. 游客体验视角下开封旅游目的地形象研究——基于网络评论的方法[J]. 地域研究与开发, 2019, 38(2): 102-105. [SUO Zhihui, LIANG Liuke, SU Xiaoyan, et al. Visitors experience and tourism destination image in Kaifeng city: Based on Internet comment text[J]. Areal Research and Development, 2019, 38(2): 102-105.]

[21] 钟士恩, 徐彩霞, 颜丙金, 等. 从个体旅游到群体旅游: 共同在场下的城市家庭亲子旅游行为研究[J]. 人文地理, 2020, 35(1): 141-149. [ZHONG Shien, XU Caixia, YAN Bingjin, et al. From individual tourism to group tourism: The tourist behavior of urban family parent-child tourism[J]. Human Geography, 2020, 35(1): 141-149.]

[22] 胡家镜, 万秋, 吕兴洋, 等. 古镇慢旅游特质要素识别与分析——基于游客体验的视角[J]. 资源科学, 2019, 41(3): 467-474. [HU Jiajing, WAN Qiu, LYU Xingyang, et al. Characteristic elements of ancient town slow tourism: Based on tourist experiences[J]. Resources Science, 2019, 41(3): 467-474.]

[23] 白凯. 非物质文化遗产的保护与旅游利用[J]. 旅游学刊, 2019, 34(5): 1. [BAI Kai. The protection and tourism utilization of intangible cultural heritage[J]. Tourism Tribune, 2019, 34(5): 1.]

[24] 滕茜, 杨勇, 布倩楠, 等. 基于网络文本的景区感知及互动研究——以上海为例[J]. 旅游学刊, 2015, 30(2): 33-41. [TENG Qian, YANG Yong, BU Qiannan, et al. Research on the perception and interaction of tourist attractions in Shanghai based on web texts[J]. Tourism Tribune, 2015, 30(2): 33-41.]

[25] 余构雄, 曾国军. 都市旅游体验的一个理论探索——以广州珠江夜游为例[J]. 经济管理, 2019, 41(6): 140-156. [YU Gouxiong,ZENG Guojun. Study on the experience of urban water night cruise: A case study of Pearl River in Guangzhou[J]. Business and Management Journal, 2019, 41(6): 140-156.]

[26] 谢双玉, 刘琪, 龚箭, 等. 城市形象感知对旅游满意度的影响——基于武汉市旅游者的调查分析[J]. 地域研究与开发,2019, 38(2): 106-111. [XIE Shuangyu, LIU Qi, GONG Jian, et al. Impacts of tourist perceived city image on their satisfaction: A survey and analysis based on Wuhan tourists[J]. Areal Research and Development, 2019, 38(2): 106-111.]

[27] 徐小波, 赵磊, 刘滨谊, 等. 中国旅游城市形象感知特征与分异[J]. 地理研究, 2015, 34(7): 1367-1379. [XU Xiaobo, ZHAO Lei, LIU Binyi, et al. Study on perceived image of Chinese tourist cities[J]. Geographical Research, 2015, 34(7): 1367-1379.]

[28] JEONG M, SHIN H H. Tourists’ experiences with smart tourism technology at smart destinations and their behavior intentions[J]. Journal of Travel Research, 2020, 59(8): 1464-1477.

[29] 高军, 马耀峰, 吴必虎. 外国游客感知视角的我国入境旅游不足之处——基于扎根理论研究范式的分析[J]. 旅游科学, 2010, 24(5): 49-55. [GAO Jun, MA Yaofeng, WU Bihu. Defects of China’s inbound tourism from foreign tourists’ perspective: An analyze based on ground theory research paradigm[J]. Tourism Science, 2010, 24(5): 49-55.]

[30] 熊伟, 胡洋. 旅游者对旅游“非营利”理念的感知研究——基于扎根理论[J]. 旅游科学, 2012, 26(2): 67-76. [XIONG Wei, HU Yang. Research on tourists’ perception of “nonprofit philosophy” in tourism development: Based on the grounded theory[J]. Tourism Science, 2012, 26(2): 67-76.]

[31] 高楠, 王馨, 马耀峰, 等. 石窟型世界文化遗产地旅游意象研究——以云冈石窟为例[J]. 干旱区资源与环境, 2016, 30(9): 203-208. [GAO Nan, WANG Xin, MA Yaofeng, et al. The tourism images of Yungang Grottoes: A world cultural heritage site[J]. Journal of Arid Land Resources and Environment, 2016, 30(9):203-208.]

[32] 張红梅, 龙嬿升, 梁昌勇, 等. 葡萄酒旅游目的地品牌形象影响因素扎根研究——以贺兰山东麓为例[J]. 中国软科学, 2019(10): 184-192. [ZHANG Hongmei, LONG Yansheng, LIANG Changyong, et al. Study on the influencing factors of brand image of wine tourism destination based on grounded theory: An example of Helan Moantain’s east foothill[J]. China Soft Science, 2019(10): 184-192.]

[33] 白丹, 马耀峰, 刘军胜. 基于扎根理论的世界遗产旅游地游客感知评价研究——以秦始皇陵兵马俑景区为例[J]. 干旱区资源与环境, 2016, 30(6): 198-203. [BAI Dan, MA Yaofeng, LIU Junsheng. Evaluation of the tourists’ perception to the world heritage tourism destination based on grounded theory[J]. Journal of Arid Land Resources and Environment, 2016, 30(6): 198-203.]

[34] 王君怡, 吴晋峰, 王阿敏. 旅游目的地形象认知过程——基于扎根理论的探索性研究[J]. 人文地理, 2018, 33(6): 152-160. [WANG Junyi, WU Jinfeng, WANG Amin. Process of the tourist destination image elements: An exploratory study based on grounded theory[J]. Human Geography, 2018, 33(6): 152-160.]

[35] 楚义芳. 旅游地开发评价研究[J]. 地理学报, 1991, 58(4): 396-404. [CHU Yifang. A study on the evaluation of tourist areas in China[J]. Acta Geographica Sinica, 1991, 58(4): 396-404.]

[36] 张宏梅, 陆林, 章锦河. 感知距离对旅游目的地之形象影响的分析——以五大旅游客源城市游客对苏州周庄旅游形象的感知为例[J]. 人文地理, 2006(5): 25-30. [ZHANG Hongmei, LU Lin, ZHANG Jinhe. The influence of an analysis of the perceived distance on tourism destination image: A case study of the perceived image of tourist in five origin cities on Zhouzhuang, Suzhou[J]. Human Geography, 2006(5): 25-30.]

[37] 王岚, 张捷, 曹靖, 等. 游客感知视角下的旅游地可进入性评价研究——以九寨沟风景区为例[J]. 人文地理, 2010, 25(2): 144-148. [WANG Lan, ZHANG Jie, CAO Jing, et al. A study on the evaluation of the accessibility of a tourist destination from the perspectives of tourists’ perception: A case study of Jiuzhaigou Nature Reserve[J]. Human Geography, 2010, 25(2): 144-148.]

[38] 蒋长春. 国内游客对红色文化感知的差异性研究——以延安红色旅游为例[J]. 河北大学学报(哲学社会科学版), 2013, 38(4): 75-80. [JIANG Changchun. The Study on the difference of the red cultural perception of domestic tourists: Taking Yanan red tourism as an example[J]. Journal of Hebei University (Philosophy and Social Science), 2013, 38(4): 75-80.]

[39] 刘智兴, 马耀峰, 李森, 等. 基于游客感知-认知的北京市旅游形象影响因素评价研究[J]. 干旱区资源与环境, 2015, 29(3): 203-208. [LIU Zhixing, MA Yaofeng, LI Sen, et al. Evaluation on the factors influencing the tourism image of Beijing based on tourists’ cognition and perception[J]. Journal of Arid Land Resources and Environment, 2015, 29(3): 203-208.]

[40] 李静, PEARCE P L, 吴必虎, 等. 雾霾对来京旅游者风险感知及旅游体验的影响——基于结构方程模型的中外旅游者对比研究[J]. 旅游学刊, 2015, 30(10): 48-59. [LI Jing, PEARCE P L, WU Bihu, et al. The impact of smog on risk perception and satisfaction of international and domestic tourists in Beijing[J]. Tourism Tribune, 2015, 30(10): 48-59.]

[41] KIM J J, FESENMAIER D R. Measuring human senses and the touristic experience: Methods and applications[M]//Analytics in Smart Tourism Design. Cham: Springer, 2017: 47-63.

[42] ZHANG H, WU Y, BUHALIS D. A model of perceived image, memorable tourism experiences and revisit intention[J]. Journal of Destination Marketing & Management, 2018(8): 326-336.

[43] LIU Y, HUANG K, BAO J, et al. Listen to the voices from home: An analysis of Chinese tourists’ sentiments regarding Australian destinations[J]. Tourism Management, 2019, 71: 337-347.

[44] LI X, LAW R, XIE G, et al. Review of tourism forecasting research with internet data[J]. Tourism Management, 2021, 83: 104245.

[45] 涂建軍, 何汉林. 基于语义分析的降维特征提取[J]. 情报学报, 2014, 33(9): 952-958. [TU Jianjun, HE Hanlin. Dimension decreased feature extraction based on semantic analysis[J]. Journal of the China Society for Scientific and Technical Information, 2014, 33(9): 952-958.]

[46] 陈君同, 古天龙, 常亮, 等. 融合协同过滤与用户偏好的旅游组推荐方法[J]. 智能系统学报, 2018, 13(6): 999-1005. [CHEN Juntong, GU Tianlong, CHANG Liang, et al. A tourist group recommendation method combining collaborative filtering and user preferences[J]. CAAI Transactions on Intelligent Systems, 2018, 13(6): 999-1005.]

[47] 孙彦鹏, 古天龙, 宾辰忠, 等. 基于多重隐语义表示模型的旅游路线挖掘[J]. 模式识别与人工智能, 2018(5): 462-469. [SUN Yanpeng,GU Tianlong, BIN Chenzhong, et al. Travel routing mining based on multiple latent semantic representation model[J]. Pattern Recognition and Artificial Intelligence, 2018(5): 462-469.]

[48] JIN B, YANG H, SUN L. A treatment engine by predicting next-period prescriptions[C]//Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. ACM, 2018: 1608-1616.

[49] 陈钢华, 李萌. 旅游者情感研究进展: 历程、主题、理论与方法[J]. 旅游学刊, 2020, 35(7): 99-116. [CHEN Ganghua, LI Meng. Research on tourist emotions: Development process, topical themes, theories, and methodology[J]. Tourism Tribune, 2020, 35(7): 99-116.]

[50] KIRILENKO A P, STEPCHENKOVA S O, KIM H, et al. Automated sentiment analysis in tourism: Comparison of approaches[J]. Journal of Travel Research, 2018, 57(8): 1012-1025.

[51] HOSANY S, GILBERT D. Measuring tourists’ emotional experiences toward hedonic holiday destinations[J]. Journal of Travel Research, 2010, 49(4): 513-526.

[52] 黄潇婷. 基于时空路径的旅游情感体验过程研究——以香港海洋公园为例[J]. 旅游学刊, 2015, 30(6): 39-45. [HUANG Xiaoting. A study of tourists’ emotional experience process based on space-time path: A case study of ocean park in Hong Kong[J]. Tourism Tribune, 2015, 30(6): 39-45.]

[53] 刘逸, 保继刚, 朱毅玲. 基于大数据的旅游目的地情感评价方法探究[J]. 地理研究, 2017, 36(6): 1091-1105. [LIU Yi, BAO Jigang, ZHU Yiling. Exploring emotion methods of tourism destination evaluation: A big-data approach[J]. Geographical Research, 2017, 36(6): 1091-1105.]

[54] NAWIJN J, ISAAC R K, LIEMPT A, et al. Emotion clusters for concentration camp memorials[J]. Annals of Tourism Research, 2016, 61: 244-247.

[55] 李君轶, 纪星, 李振亭. 欧美旅游者在秦始皇帝陵博物院的情感体验时空变化[J]. 人文地理, 2018, 33(3): 129-136. [LI Junyi, JI Xing, LI Zhenting. Study on spatio-temporal variation of western tourists’ emotional experiences: A case study of Qin Terra-Cotta Warriors and Horse’s Museum[J]. Human Geography, 2018, 33(3): 129-136.]

[56] VALDIVIA A, LUZÓN M V, HERRERA F. Sentiment analysis in tripadvisor[J]. IEEE Intelligent Systems, 2017, 32(4): 72-77.

[57] XIANG Z, DU Q, MA Y, et al. A comparative analysis of major online review platforms: Implications for social media analytics in hospitality and tourism[J]. Tourism Management, 2017, 58: 51-65.

[58] PATTON M Q. Qualitative Evaluation and Research Methods[M]. London: SAGE publications, 1990: 81-106.

[59] 褚玉杰, 趙振斌, 任珮瑶, 等. 寻找精神家园: 边地旅游的概念模型与实证[J]. 旅游学刊, 2020, 35(1): 133-145. [CHU Yujie, ZHAO Zhenbin, REN Peiyao, et al. Seeking spiritual home: The conceptual model and empirical study of borderland tourism[J]. Tourism Tribune, 2020, 35(1): 133-145.]

[60] 赵宇晴, 阮平南, 刘晓燕, 等. 基于在线评论的用户满意度评价研究[J]. 管理评论, 2020, 32(3): 179-189. [ZHAO Yuqing, RUAN Pingnan, LIU Xiaoyan, et al. Study on user satisfaction evaluation based on comment[J]. Management Review, 2020, 32(3): 179-189.]

[61] 谢彦君. 旅游研究方法[M]. 北京: 中国旅游出版社, 2018: 102-118. [XIE Yanjun. Tourism Research Methods[M]. Beijing: China Travel & Tourism Press, 2018: 102-118.]

[62] 謝彦君, 胡迎春, 王丹平. 工业旅游具身体验模型: 具身障碍、障碍移除和具身实现[J]. 旅游科学, 2018, 32(4): 1-16. [XIE Yanjun, HU Yingchun, WANG Danping. The embodied experience model of industrial tourism: Embodied obstacles, obstacles remove and embodied realization[J]. Tourism Science, 2018, 32(4): 1-16.]

[63] 谢彦君, 于佳, 王丹平, 等. 作为景观的乡愁: 旅游体验中的乡愁意象及其表征[J]. 旅游科学, 2021, 35(1): 1-22. [XIE Yanjun, YU Jia, WANG Danping, et al. Nostalgia as a landscape: The nostalgic image and its representation in tourist experiences[J]. Tourism Science, 2021, 35(1): 1-22.]

[64] 厉杰, 张新安, 田澎. 途径-目的理论在顾客价值分析中的应用[J]. 管理学报, 2010, 7(6): 851-855. [LI Jie, ZHANG Xinan, TIAN Peng. The means-end theory in customer value analysis[J]. Chinese Journal of Management, 2010, 7(6): 851-855.]

[65] 卢东, 曹忠鹏, 张洁媛. 游客顾客价值形成机制研究——以访澳内地游客为例[J]. 华东经济管理, 2015, 29(4): 115-123. [ LU Dong, CAO Zhongpeng, ZHANG Jieyuan. Study on the formulation mechanism of visitors’ customer value: Evidence from Mainland tourists in Macau[J]. East China Economic Management, 2015, 29(4): 115-123.]

[66] WU T C, LIN Y E, WALL G, et al. A spectrum of indigenous tourism experiences as revealed through means-end chain analysis[J]. Tourism Management, 2020, 76: 103969.

[67] 张宏梅, 洪娟, 张文静. 旅游目的地游客感知价值的层次关系模型[J]. 人文地理, 2012, 27(04): 125-130. [ZHANG Hongmei, HONG Juan, ZHANG Wenjing. The hierarchy relationship model of tourists perceived value on tourism destination[J]. Human Geography, 2012, 27(4): 125-130.]

[68] ZEITHAML V A. Consumer perceptions of price, quality, and value: A means-end model and synthesis of evidence[J]. Journal of Marketing, 1988, 52(3): 2-22.

[69] 刘逸, 保继刚, 陈凯琪. 中国赴澳大利亚游客的情感特征研究——基于大数据的文本分析[J]. 旅游学刊, 2017, 32(5): 46-58. [LIU Yi, BAO Jigang, CHEN Kaiqi. Sentimental features of Chinese outbound tourists in Australia: Big-data based content analysis[J]. Tourism Tribune, 2017, 32(5): 46-58.]

[70] 金家华, 吴浪涛, 张婷婷, 等. 基于情感分析的外卖商家评分研究[J]. 管理学刊, 2020, 33(2): 66-75. [JIN Jiahua, WU Langtao, ZHANG Tingting, et al. Research of scoring for takeout merchants based on sentiment analysis[J]. Journal of Management, 2020, 33(2): 66-75.]

[71] YE Q, LAW R, LI S, et al. Feature extraction of travel destinations from online Chinese-language customer reviews[J]. International Journal of Services Technology and Management, 2011, 15(1-2): 106-118.

[72] WANG H, ZHANG F, HOU M. Shine: Signed heterogeneous information network embedding for sentiment link prediction[C]//Proceedings of the Eleventh ACM International Conference on Web Search and Data Mining. New York: ACM, 2018: 592-600.

[73] 郭安禧, 郭英之, 孫雪飞, 等. 国外旅游目的地吸引力研究述评与展望[J]. 世界地理研究, 2016, 25(5): 153-166. [GUO Anxi, GUO Yingzhi, SUN Xuefei, et. al. A literature review of tourism destination attractiveness[J]. World Regional Studies, 2016, 25(5): 153-166.]

[74] 李艳. 符号互动论下文化遗产旅游体验价值生成研究——以西安城墙为例[D]. 西安: 西北大学, 2019. [LI Yan. Research on Cultural Heritage Tourism Experience Value Generation Based on Symbolic Interactionism: A Case Study of Xi’an City Wall[D]. Xi’an: Northwest University, 2019.]

[基金项目]本研究受辽宁省社科基金项目“基于深度挖掘的用户情感特征图谱研究”(L20BGL025)资助。[This study was supported by a grant from the Social Science Foundation of Liaoning province (to SHI Da) (No. L20BGL025).]

How is Tourist Destination Perception Formed?

Exploratory Research based on Text Mining

SHI Da1, ZHANG Bingchao2,3, YI Bowen1,2

(1. Surrey International Institute, Dongbei University of Finance and Economics, Dalian 116025, China;

2. School of Tourism and Hotel Management, Dongbei University of Finance and Economics, Dalian 116025, China;

3. School of Management, Shandong Technology and Business University, Yantai 264005, China)

Abstract: Tourist perception is an important research field in tourism destination management. Previous studies have mostly applied grounded theory to code data manually and summarize the relevant categories; alternatively, they have examined the formation mechanism by hypothesis testing of mediating variables. The present study used as its data source over 100,000 text comments by tourists related to five famous scenic spots in Dalian, China. We applied text-mining methods with machine coding; in that way, we were able to identify and refine the categories related to tourist perception, and we built a process model for the formation of that perception.

We first employed two unsupervised algorithms (TF-IDF and TextRank) to encode the text comments of tourists regarding scenic spots; we refined and summarized the key categories of the tourists’ perceptions. Subsequently, we applied the LDA topic model method to organize the hierarchy and priority of the tourist perception categories; we analyzed the weight order of the tourists’ positive and negative perception factors. Adopting that approach, we were able to summarize the process model of the formation of the tourists’ perceptions; we were able to describe in detail the dynamic evolution trend and governing factors related to the formation of tourists’ perceptions.

Our findings were as follows. (1) The categories of tourists’ perceptions were mainly concentrated on representation factors, utility factors, structural factors, and characteristic factors. (2) we observed significant levels and priorities in the perception category of tourists; that was mainly reflected in the weight difference between their positive and negative perception factors. (3) Through the contrast between positive and negative perceptions, tourists dynamically adjusted their perceptions and emotional attitudes related to destinations. This study expands the methodical approach to tourist perception research; it provides a valuable reference for developing modern, experiential scenic spots in tourist destinations.

Keywords: tourist perception; text mining; qualitative analysis; perception category

[責任编辑:刘    鲁;责任校对:吴巧红]

[收稿日期]2021-03-22; [修订日期]2021-05-18

[作者简介]史达(1973—),男,江苏吴江人,博士,教授,研究方向为旅游目的地管理、旅游大数据及旅游者心理和行为,E-mail:shidadufe@126.com;张冰超(1990—),男,山东青岛人,博士研究生,研究方向为旅游者心理和行为,E-mail:zbingchao@126.com,通讯作者;衣博文(1994—),女,辽宁大连人,博士研究生,研究方向为旅游者心理和行为。

1932501186239

猜你喜欢

文本挖掘
基于贝叶斯分类器的中文垃圾短信辨识
基于潜在特征的汽车评论要素挖掘
基于评论信息的淘宝服装类评分体系优化
数据挖掘技术在电站设备故障分析中的应用
基于LDA模型的95598热点业务工单挖掘分析
文本数据挖掘在电子商务网站个性化推荐中的应用
从《远程教育》35年载文看远程教育研究趋势
基于文献的中西医结合治疗脑梗死药物使用情况分析
基于改进Hadoop云平台的海量文本数据挖掘
慧眼识璞玉,妙手炼浑金