APP下载

UGC数据在旅游消费领域的研究:回顾、应用与展望

2023-12-18李佩镅周诗敏

中国商论 2023年22期
关键词:消费者文本旅游

李佩镅 周诗敏

(海南经贸职业技术学院国际旅游学院 海南海口 570100)

1 引言

在数字经济发展的今天,网络和社交媒体的繁荣已极大改变了游客出行的选择方式,越来越多旅游者通过阅读他人在线评论的信息来计划其旅行并做出购买决定。这些通过现实游客上传的文本、图片等原创信息,称为用户生成内容(简称UGC)。在理论研究中,UGC指的是在网络媒体平台由消费者原创的,并与其他浏览者分享信息或观点的内容,能够影响受众对目的地的态度、出行意向甚至行为决策,因此逐渐成为国内外研究者关注的对象。

近年来,采用UGC数据的实证研究陆续出现,并刊登在旅游领域的诸多核心期刊,比如《旅游学刊》《Journal of Travel Research》等。然而,这些研究大多拘泥于某景点、某酒店等UGC数据的单一视角,或是从携程、推特等单一平台获取数据,抑或是采用网络文本挖掘等单一分析技术,缺乏系统的梳理与总结。鉴于UGC数据在旅游研究领域实践和理论层面的重要性,本文基于实证研究数据,在文献分析的基础上,对UGC数据运用于旅游领域的研究进行回顾与梳理,以期为推动UGC数据在国内旅游消费领域研究中的应用提供参考。

2 UGC数据在旅游消费领域的研究回顾与梳理

目前,UGC数据被视为大数据的重要类型,已被广泛运用于旅游行业的研究中。既有研究表明,旅游领域中对UGC的研究主要分为三类:第一,博客、游记攻略、产品消费评论、商家回复等在线文本数据;第二,照片共享网站、社交平台及产品评论中上传的图片等在线图片数据;第三,消费评论中体现的评分、点评时间、购买类型等其他线索数据。

2.1 文本数据

社交媒体和在线旅游预订平台为游客提供了充分传播各种旅游相关信息及分享旅游体验的平台,现实游客不仅可以表达其满意或不满情绪,还可以分享其旅行观点和经验,为潜在游客提供有价值的信息。这些由文本格式构成的数据类型,传达着现实游客的某种主观感受,这一类型的数据统称为在线文本数据,主要包括:社交平台上的游记攻略、交易平台上的评论文本数据及商家回复的文本数据。

游记攻略文本数据记录着人们的旅游故事和旅游感受,文字篇幅较长,主要针对旅游推荐和旅游情感分析。比如,在旅游推荐方面,Xu等 (2015)通过抓取海量游记数据提取出热门信息,为人们去哪里玩、玩什么等提供建议。再比如,针对游客情感分析方面,Kahlil和Zhong(2016)则从来自Twitter的非结构化数据中总结出度假村推文中的综合情绪。

旅游交易平台上的评论文本数据表达着现实游客对旅游产品的态度,主要用于测量游客满意度,这一类的研究集中在酒店、景点与餐厅的研究。其中,酒店在线评论文本数据的关注程度最多,可能是因为预订酒店是旅游出行前最为关心的问题。首先,从酒店数据样本的来源来看,国外学者的样本主要来源于TripAdvisor、Booking等平台,而国内学者则从携程网、游多多旅游网等平台抓取数据样本。从上述的文献来看,酒店评论探讨了在线文本信息对消费者决策的影响因素,为酒店管理者了解消费者需求提供了相关建议。其次,关于景点在线评论探讨的则是游客体验与目的地形象之间的关系,研究结论对改善景区管理及目的地形象塑造有一定的帮助。最后,餐厅的在线评论数据不仅能在某种程度上体现游客的旅游满意度,还可以帮助管理者了解游客的用餐偏好。

既有研究表明,消费者发布在线评论主要是因为他们在旅游消费体验中感到非常满意或是非常不满意。比如,在酒店消费情境中,酒店经理可以在响应客户投诉时提供各种类型的补偿,针对消费者的评论内容进行道歉回复也是补偿的一种方式。例如,Zhang等(2019)关注酒店的负面评论下商家回应的内容如何影响潜在游客的态度与决策,从主题匹配的角度考察了个性化管理回应对评分提高的影响。此外,除了对评论正负面效价的探讨外,研究者建议酒店管理者不仅要留意识别意见领袖,寻找可能合作的机会,还要在对评论回应时注意旅游者的类型,比如回复家庭旅游者和商务住客应各有侧重。

2.2 图片数据

除了在线文本数据外,在线图片数据,即游客上传的图片包含丰富的用户、地点和时间等有用信息,为研究旅游目的地形象的构建、游客分享行为和旅游营销提供了新的视角。因此,非结构化类型的在线图片数据在旅游研究中引起了越来越多学者的关注。

从某种意义来说,图片可以理解为目的地形象的压缩,因为相比文本、声音等其他形式的信息,视觉图像对人们的记忆和态度的影响更加显著。游客在社交媒体中上传的照片代表他们个人对旅游目的地的感知、体验甚至是情感。因此,学者对在线图片数据的抓取研究,实际上是为旅游目的地形象的传达或构建提供了一种新的方法。例如,Deng和Li(2018)认为在线图片数据越来越成为潜在游客形成旅游目的地形象的有效载体,他提出了一种基于机器学习的模型,从观众的角度选择照片元素,并协助目的地营销组织进行照片选择;Yu等(2019)则通过对Instagram上的帖子进行照片数据挖掘与分析,揭示了游客对我国大湾区的视觉色彩印象。

在游客分享行为的研究中,图片数据主要来源于三个图片共享平台,即Flickr,Instagram及Pinterest。具体而言,Zhang等(2019)根据照片中的地理信息,将不同感知主题的游客认知地图进行可视化处理;Yu等(2021)以Instagram平台为样本,探讨了不同类型的旅游照片与消费者参与度(点赞与评论)之间的关系;Song等(2016)通过爬取分析日本游客在Pinterest平台中上传的照片,研究其旅游兴趣与行为的差异。随着我国移动互联网的迅猛发展,国内的社交媒体也在不断崛起,例如小红书等鼓励以照片分享为主的社交平台,因此在未来的研究中,可以更多地关注国内的后起之秀。此外,在线图片数据被运用于旅游营销的研究,以旅游电商平台的营销为例,图片数据主要来源于携程网及TripAdvisor,学者均揭示了酒店体验中图片这一非文本元素的重要部分。

2.3 其他线索数据

在旅游电商平台或社交平台上,一个完整的评论内容除了评论文本和照片外,可能还包括星级打分、评价者信息等其他线索数据,这些内容同样会影响消费者的搜索行为及购买决策。例如,酒店评论中体现的星级打分越高,越能增强消费者的预订意愿。这是因为星级打分在某种程度上体现着评价者对入住过程的满意程度,分数越高代表体验过程的满意度越高。已有研究表明,评论中打分值增加10%将提高酒店销售额的5%。再比如,评价者的专业程度会影响其他消费者对该评论的有用性感知,评价者的专业度越高,浏览者会认为其经验越丰富,该评论的可信度自然就高于其他非专业评论。

3 UGC数据在旅游领域研究的分析方法前沿

3.1 机器学习技术的分析方法

正如前文所述,消费者上传的在线图片数据不仅传达着游客的兴趣和喜好,还传递着如旅游活动和行为等额外的信息。在这些数据的处理中,学者采用了一些先进的方法,如机器学习,通过从帖子图片中解码有意义的信息,使营销人员更好地了解游客的行为。例如,Xu等(2015)在全球定位系统(GPS)的基础上,提出了一种利用机器学习的推荐系统,根据旅游地点的纬度和经度来发现游客的偏好。从以往的研究来看,在旅游研究情境中,学者采用传统机器学习技术的研究主要包括聚类、回归及分类的分析方法。

第一,聚类分析,指的是将研究对象进行分组,使同一组中的对象彼此之间比其他组中的对象更相似。这一分析方法减少了稀疏性问题,是分类社交媒体内容的一种常用机器学习技术。例如,Sun等(2019)基于带有地理标记的照片,通过聚类文本信息构建游客偏好,并据此提供个性化推荐。此外,狄利克雷分配模型作为聚类分析方法之一,也被运用于旅游行业的研究。例如,Guo等(2017)使用 LDA 的方法,从266,544 条在线评论文本中挖掘出影响酒店客户满意度的因素。第二,与以聚类分析为主的无监督学习模式有所区别,回归与分类分析归属于有监督的学习模式,这是一种有人工干预的建模方法,目的是识别输出结果的正误性。其中,随机森林、线性模型等属于回归分析中的常用算法。在机器学习中,随机森林是多个决策树的集成,基于样本进行训练并预测的分类器,投票产生分类结果。例如,Ray等(2021)运用随机森林的算法,对Tripadvisor平台的酒店评论数据集进行情感分析,并为酒店管理者创建了一个酒店推荐系统。第三,分类分析方法包括支持向量机、朴素贝叶斯等算法,其中支持向量机是一种适用于非线性数据和高维空间的算法(例如,视觉图片中的像素研究)。旅游的研究者广泛运用了这些算法,在文字识别、图像识别方向发挥着较为重要的作用。例如,Zhang等(2019)运用支持向量机的算法,对大量评论文本分析后,分别对酒店商家回复策略及国家地质公园的管理提供建议;Sun等(2019)同样运用了支持向量机的算法,但研究对象从文本数据换成图片数据,结合用户发布的地理标记照片,帮助目的地管理者构建用户偏好图谱。对于图片数据的研究,学者还试图采用朴素贝叶斯分类器根据照片的相关性对照片进行排序,证实了社交平台上的照片对目的地形象建设的有用性。

3.2 计算机深度学习

面对互联网时代带来的旅游信息过载问题,深度学习模型可用于图像、文本和自然语言的处理,通过高效处理大规模数据,深入发掘其中蕴含的复杂模式和规律,实现旅游领域的智能化管理和游客体验的精细化提升。

首先,旅游推荐方面,深度学习模型可以通过大量的用户行为数据洞察游客兴趣和需求,在景点与线路等关键信息上为游客提供高质量的个性化推荐服务,为旅游企业制定营销策略和开发新产品提供参考。例如,Cheng和Su(2022)开发了一种基于深度学习的旅游景点推荐模型,可以有效降低预测误差,提高旅游景点推荐效率。其次,旅游需求分析方面,深度学习模型具备发掘海量文本中潜在信息和规律的能力,可以高效提取旅游数据中的需求信息。例如,Bi等(2021)基于序列图像生成、图像特征提取和模型训练组成的时间序列成像模型,根据历史旅游需求数据预测未来旅游需求。再次,旅游智能问答方面,深度学习模型可以通过海量的问答数据,提升智能交互体验。例如,Ayelet等(2019)以问答论坛为平台,通过如TripAdvisor等基于旅游指导的游客所需信息,开发新的多维模型,为游客提供改善交通等相关信息。深度学习模型在旅游智能交互的应用进一步满足游客的咨询需求,为旅游企业弥补人工服务的缺陷,提高服务效率。最后,旅游监管方面,深度学习模型可以通过检测异常数据、识别异常行为,提高行业管理效能。例如,Yue等(2019)提出了基于显著时空特征和稀疏组合学习的旅游视频异常事件检测模型,能够通过旅游视频在复杂运动场景中进行实时异常检测。

深度学习技术与大数据的结合为旅游产业注入了新的动力,逐渐成为旅游大数据研究的热点,在旅游数据分析、智能系统开发和业界管理等方面展现出巨大潜力。数据科学不仅揭示了游客的时空运动,还有助于目的地营销人员在个性化旅游服务和数字营销方面的发展。

4 UGC数据在旅游行业中的应用

4.1 UGC数据作用于潜在消费者

UGC数据正在改变人们的消费方式,通过提供真实可信的消费体验信息,帮助潜在消费者做出更明智的选择,在影响潜在消费者态度与购买意愿方面发挥着重要作用。

第一,UGC数据可以减少信息不对称。在购买旅游产品或服务前,消费者无法真正知悉其质量和价值,UGC数据如在线评论可以填补这一信息空白。许多研究表明,消费者更信任其他消费者的评论,潜在消费者可以通过浏览其他消费者的真实体验,对产品有更全面和准确的了解,降低对未知商品的不确定性,进而减少购买风险,吸引更多潜在消费者对产品或服务的关注。第二,UGC数据有助于消费者做出主动、动态和个性化决策。UGC为消费者提供海量信息,促使其不再局限于企业提供的标准化信息中,可以根据真实需求和兴趣,选择性浏览相应内容,快速发现有用的信息及寻求最匹配的产品,促使消费决策更加动态与灵活。同时,新兴的解析技术可以基于消费者的兴趣和历史行为,挖掘出其潜在的关注点进行内容推送,进一步简化选择过程,满足个性化需求,提高决策效率。第三,UGC数据能够满足消费者的社交需求。信息性、社交互动性和趣味性影响着消费者对社交媒体的依恋,人们热衷于在社交媒体中表达自我、分享体验和感受,这些数据内容能够为潜在消费者提供较高的娱乐价值。UGC数据所体现的真实体验同时可以让潜在消费者产生共鸣,更能唤起消费者的信任,进而影响其态度和购买意愿。一旦消费者完成购买决策,往往会表现出较高的信息共享意图,在社交媒体中分享自身观点的可能性大大增加。

综上所述,UGC数据不仅可以为潜在消费者提供丰富的信息支持和“社交+分享”的购物体验与消费模式,还能从认知和情感两方面影响潜在消费者的心理和行为,促进旅游销售的提高与转化。

4.2 UGC数据作用于旅游管理者

数字时代和社交媒体的兴起深刻改变着人们的旅游方式,在线文本、在线图片等UGC数据信息记录着游客的真实体验,能够为旅游产业提供宝贵的市场情报和有价值的顾客洞察,是制定营销策略、改进产品和服务质量的重要依据。

在旅游UGC文本数据的研究中,景点、住宿和饮食最受游客关注。例如,目的地管理者可以根据景点评论,分析不同游客群体对本地景点、交通等情况的评论,改善景点管理;酒店评论可用于评估和改善酒店的电子口碑;餐厅评论可用来判断旅游满意度。因此,旅游企业会定期收集和分析顾客在去哪儿网、携程、新浪微博等平台的评论,监测企业产品和服务质量,以不断改善游客体验,提高整体旅游满意度。此外,旅游日记和游记等UGC数据记录了游客真实的旅行故事和感受,许多管理者采用数据挖掘技术分析大规模的游记文本,自动挖掘最受欢迎的旅游景点、最佳的旅行路线、最值得体验的项目和有效的旅游时间表等,以产生个性化的旅游推荐。

UGC图片数据也是旅游企业和目的地监测游客兴趣和体验的重要渠道。游客上传的照片包含丰富的与用户、地点和时间相关的有用信息,通过对UGC图片的内容进行分析可以发现最受游客欣赏和热捧的景点或活动,为研究游客行为、旅游推荐与营销和景区管理提供参考。例如,Zhu等(2020)探讨了在线图片质量对游客旅游意向的影响,有效地引起用户对旅游产品的兴趣与偏好。因此,旅游企业可通过评论、博客、图片等UGC数据洞察顾客兴趣与需求,改进产品和服务,提高服务质量和游客满意度。同时,可广泛应用于旅游数字营销、检测网络口碑和热点话题,扩大品牌影响力,推动口碑营销。

5 现有研究评析与未来研究展望

当前,UGC数据在旅游行业的应用已成为研究热点,现有研究主要聚焦于UGC数据对企业营销管理及对消费者决策的影响,但UGC在旅游消费领域的拓展研究和分析技术发展仍有很大的空间。

第一,现有部分研究样本量有限,容易产生偏差,可能导致分析结果与实际情况出现相反结论。因此,未来研究应采用更大规模的样本数量,利用海量真实UGC数据探究其对企业发展和消费者行为的作用机理。

第二,现有研究主要采用传统的文本分析和情感分析技术,难以深层次理解UGC数据的意义与价值,尤其是在线照片数据研究。UGC数据量巨大,内容非结构化,未来研究可以丰富分析手段,引入更强大的大数据挖掘技术,如人工智能、计算机深度学习、知识图谱等前沿分析方法,获取其蕴含的丰富信息。

第三,现有研究可以从海量数据中提取有价值的知识,但UGC应用转化的研究较少,如UGC目的地形象感知的研究主题多停留在现象描述阶段,如何在实践中利用研究结论推动目的地具体运营的研究有待加强,未来研究可注重UGC数据在具体业务场景的应用研究。

第四,UGC现有的旅游研究多集中在旅游推荐、旅游需求分析、消费者心理与行为分析等方面,但UGC数据具有应用于如旅游监管与应急、旅游突发事件与预警系统等研究领域的潜力。此外,可密切关注UGC数据应用面临的挑战。例如,数据真实性与可信度、消费者隐私与商业利用、网络舆论的引导与应对等, 这些存在的隐患与风险值得深入研究。

猜你喜欢

消费者文本旅游
消费者网上购物六注意
在808DA上文本显示的改善
基于doc2vec和TF-IDF的相似文本识别
知识付费消费者
旅游
悄悄偷走消费者的创意
悄悄偷走消费者的创意
文本之中·文本之外·文本之上——童话故事《坐井观天》的教学隐喻
如何快速走进文本
出国旅游的42个表达