新冠肺炎疫情前后游人感知比对研究
——以武汉东湖风景区为例
2022-06-09李娅琪裘鸿菲
李娅琪,裘鸿菲
(华中农业大学,湖北 武汉 430070)
2020年新冠肺炎(COVID-19)疫情的爆发,对社会经济秩序产生了严重影响,也推动了人们价值观与生活方式的转变,城市公共绿地作为公众日常生活中不可或缺的空间环境,对城市居民产生的健康效益[1-2],在疫情之中越发得到公众重视[2]。后疫情时代,人们对于城市公共绿地的使用也随生活方式的转变而发生了相应的变化[3],对这一变化进行分析研究,是探索未来常态化疫情防控下城市公共绿地建设之策的必经之路[4-5]。
网络文本分析法指以网络数据为主要信息,使用相应的文本挖掘技术,进行深入、客观、系统及量化的分析研究[6]。目前网络文本分析法在各行各业都得以广泛应用,许多学者通过网络评论文本分析对评价者的行业使用现状进行研究[7-8]。而在风景园林学科中,以社交网络平台短文本(如微博、Twitter等)[9]、旅游网站游记文本(如马蜂窝旅游网、去哪儿网等)[10-11]以及点评网站评论文本(如大众点评网等)[12-13]为数据来源而进行的游客满意度与旅游形象感知相关研究最为广泛:R.A.Plunz et al[14]通过Twitter评论数据来分析游人对纽约市公园的满意度;J.Zhu et al[14]对疫情期间北京市公园内外的游客微博进行情感分析,以此衡量疫情期间居民对城市绿地的需求度;张瑞等[7]则使用网络文本与IPA模型相结合,对上海辰山植物园的旅游形象感知进行研究。现阶段,已有学者通过网络文本分析探究了疫情期间游人对公园的使用,但尚无探讨疫情前后游人使用方式的转变。因此,本研究运用网络文本分析法,分别研究疫情前后的游人使用现状并进行对比分析,探究疫情之后游人对公共绿地的使用方式存在哪些变化。
1 材料与方法
1.1 研究区概况
武汉东湖生态旅游风景区(下文简称东湖风景区)位于湖北省武汉市中心城区(图1),是首批国家重点风景名胜区、国家5A级景区。风景区总面积88 km2,包括听涛、磨山、落雁、吹笛、白马、渔光、喻家山8个景区,兼具旅游观光、休闲度假、科普教育等功能,年接待游客数量百万人次,在武汉市城市绿地系统居于十分重要的地位。
1.2 数据采集及预处理
以大众点评网作为数据来源,选取2020年4月8日(武汉市解封日)至2020年12月31日内对于武汉市东湖风景区的评价内容作为疫情后的景区评价文本,人工去除重复评论和无意义的评论后共计1 139条;为避免季节对游人评价的影响,选取2019年同一时间段内的评价作为疫情前的景区评价文本,去除重复和无意义的评论后共计1 206条。
根据后续对于文本的情绪分析与特征分析要求,对评论文本进行分词与去停用词处理,使用Jieba分词工具将每项评论长文本分为词语,分词后的文本会含有一些与景区评价不相关的词汇或是无具体意义的网络符号如“◆”“★”等,需要利用停用词表对文本进行去噪处理。本研究使用的停用词表整合了哈工大停用词、四川大学机器智能实验室停用词和百度停用词,共6 916个。文本的分词与去停用词处理皆使用python代码在pycharm软件内实现。
1.3 数据分析
1.3.1 关键词提取 关键词通常为一个或多个能够描述文档主题信息的词语或词组[16]。本研究使用TF-IDF算法来提取评论文本中的关键词。TF-IDF(词频-逆文档频率)是一种常用的信息检索和文本挖掘加权技术。它的主要原理是单词在一篇文章中的重要性与它们在文章中出现的次数TF(term frequency,公式中表示为TF)成正比,与它们在语料库中出现的次数IDF(inverse document frequency,公式中表示为IDF)成反比(式1~式3),一个单词的TF-IDF值越大说明其重要性越强。使用python分别对预处理后的疫情前后东湖评论文本进行TF-IDF值计算,人工剔除掉TF-IDF值小于0.005的词汇,再剔除剩下词汇中的无意义词汇如“况且”“真的”“地方”“小时”等,提炼出能代表疫情前后评价的关键词。
(1)
(2)
(3)
式中:n表示文本中的单词总数;n(X)为文本中单词X的总数;N为整个语料库中包含的文本数量;N(X)为整个语料库中包含有词汇X的文本数量。
1.3.2 关键词聚类分析 K-Means算法(K-均值算法)是一种基于划分方法的经典聚类算法[17],即通过比较样本之间的相似性,将较为相似的样本划分到同一个类别中。对关键词进行聚类分析,能够多维度、多层次地分析评论文本中的关键性信息,从而更好地挖掘游人使用风景区的特征。本研究基于关键词的TF-IDF值,使用欧几里得距离衡量样本之间的相异度,采用K-Means算法分别将疫情前后评论中提取的关键词聚类为5类。
1.3.3 情感趋势计算 文本情感分析,又称意见挖掘(opinion mining),是指对带有情感色彩的主观性文本进行采集、处理、分析、归纳和推理的过程[18]。通过自然语言处理和文本分析技术,情感分析可以用于分析得出人们对某一对象的观点、情绪、态度。
本研究采取基于情感词典的文本情绪分析法,以台湾大学的通用中文情感词典NTUSD清华大学李军中褒贬义词典TSING,知网How Net情感词典为数据基础,使用由搜狗新闻语料加训练的Word2vec对原有情感词典进行了扩充,并且识别了句子中的强调词和否定词,构建新的情感词典。包括对应以分值代表情绪强弱的程度副词表、否定词表、消极情绪词表与积极情绪词表。通过该词典计算每条评论的情绪分值(式4)。
(4)
2 结果与分析
2.1 疫情前后关键词对比
分别计算疫情前后评论文本中单词的TF-IDF值并对结果进行筛选,最后得到疫情前评论的关键词337个,疫情后评论的关键词456个。TF-IDF值越大说明词汇重要性越强,选择其中TF-IDF值前20的词汇作为重要关键词(表1、表2),对比分析疫情前后游人评论中的重要关键词变化(表3),发现疫情后的游人评价中新增了“疫情”“东湖之眼”“天气”“骑车”“朋友”“摩天轮”“野餐”“还好”这8个重要关键词,而减少了“西湖”“景点”“武汉市”“面积”“很大”“旅游”“推荐”“磨山”这8个重要关键词。
表1 疫情前游人评论的重要关键词Table 1 Important keywords for tourists' comments before the outbreak of COVID-19
表2 疫情后游人评论的重要关键词Table 2 Important keywords for tourists' comments after the outbreak of COVID-19
表3 疫情后游人评论的重要关键词变化Table 3 Changes of key words in tourists' comments after the outbreak of COVID-19
根据疫情前后的重要关键词变化分析可知,疫情后游人普遍都会提及“疫情”相关信息,新增设的“东湖之眼”摩天轮是游人的重要关注点,“骑车”“野餐”成为游人疫情后游玩的重要活动,“天气”可能是影响游人游玩的重要因素。
2.2 疫情前后关键词聚类对比
使用K-Means算法将疫情前后游人评价的关键词聚类为5类,选择每类前15个关键词作为类别特征词。根据聚类结果自定义分类标签为“风景区印象”“内外交通”“游人关注点”“观景感受”与“游人活动”5类(表4、表5)。对比疫情前后5类中的特征词,甄别其中相似词汇,统计疫情前后5类特征词中的重复特征词数与不重复特征词数量(图2)。发现疫情前后游人对于东湖景区的风景区印象变化最小,其次是游人活动变化、游人游玩感受变化与在景区的内外交通方式变化,而游人对景区的关注点变化最为明显。
表4 疫情前关键词分类Table 4 Keyword classification before the outbreak of COVID-19
表5 疫情后关键词分类Table 5 Keyword classification after the outbreak of COVID-19
具体分析疫情前后重复特征词(表6),显示游人对东湖风景区的区位、面积、性质的印象没有改变,疫情前后都出现的“落雁”与“吹笛”两词,代表了游人感知的代表性景区为落雁与吹笛景区。内外交通方式中,“公交”和“共享单车/自行车”2种游人出行方式没有发生变化。东湖风景区内的“荷花”“环境”“空气”以及游客的“心情”是游人疫情前后的共同关注点。疫情前后,游人始终认为游玩东湖风景区能带来“放松”“喜欢”“好看”“美丽”“惬意”“舒服”的游玩感受。“骑行/骑车”“拍照/拍拍”“跑步”“溜达/走走/散步”等游人活动没有发生变化,“晚上”是疫情前后游人的共同活动时间段。
表6 疫情前后特征词变化Table 6 Change of feature words before and after the outbreak of COVID-19
对疫情前后的不重复特征词分别进行分析(表6),可发现疫情后“听涛”取代“白马”成为游人认知的代表性景区之一,而“生态旅游”成为新的风景区印象标签。在内外交通方式中,疫情前风景区内部游览车(“电瓶车/观光车/游览车”)和“步行”这2种交通方式在疫情后转变为“地铁”和“开车”;在游人关注点中,疫情前风景区内的“樱花”景观、“景色”“湖水”“设施”、游玩成本(“免费”)等是游人的主要关注点,疫情后风景区内的防疫管理条例(“疫情”“口罩”“扫码”等)、“空气”质量、新增景点“东湖之眼”(“东湖之眼”“蓝牙”“空调”)、“工作人员”服务以及游玩成本(“门票”)是游人的主要关注点;在游玩感受的变化上,疫情前后都显示出正面的情感倾向,疫情后游玩感受中出现了“浪漫”“情侣”“粉色”等词汇,主要彰显了游人对于新设立的“东湖之眼”摩天轮景点的游玩感受;在游人活动上,疫情前的“打卡”“游船”活动在疫情后则变化为“野餐”“欣赏”“索道”“滑道”等活动。
基于疫情前后关键词聚类分析发现,疫情之后游人对于东湖风景区的风景区印象、内外交通方式、游人关注点、游玩感受以及游人活动皆发生了改变,其中变化最大的是游人关注点,变化最小的是风景区印象。风景区印象的变化主要体现在对代表景区的认知变化上,特征词显示疫情后游人认知的代表景区由白马景区变更为听涛景区。内外交通的变化主要体现在疫情后,园内游览观光车不再是主要园内交通方式之一,这与疫情后东湖风景区的管理相关;而自驾“开车”成为到达风景区的外部主要交通形式之一。游人关注点的变化主要体现在风景区疫情管理条例与景点上,特征词显示,疫情后园内的防疫管控成为游人主要关注点,而游人关注的主要景点不再是“樱花”景观,而是2020年园区新开放的“东湖之眼”摩天轮景点,另外值得注意的是“呼吸”以及“空气”2个特征词揭示了疫情后游人有比较强烈的户外呼吸新鲜空气的需求。游玩感受的变化主要体现在新增了许多与“东湖之眼”景点相关的游览感受,这与景点的宣传定位是一致的。游人活动的主要变化则是,疫情后游人的自发性活动由“打卡”景点转变为“野餐”以及“欣赏”美景,这可能与外来东湖风景区旅游的游人数量减少有关,而游人的主要消费性活动由“游船”变更为“索道”和“滑道”。
2.3 疫情前后情感趋势对比
根据上述的算法设计,采用Python程序编写代码实现评论的情感得分计算,根据其分值统计总体情感趋势。当评论情感值低于0,即sentiment value(d)<0,这条评论被记为消极评价,当sentiment value(d)=0,则被记为中性评价,当sentiment value(d)>0,被记为积极评价。最后统计得出,疫情前关于东湖风景区的大众点评评价共有1 063条积极评价,约占88.14%;70条消极评价,约占5.80%;73条中性评价,约占6.05%(表7)。疫情后的评价中有1 002条积极评价、58条消极评价、78条中性评价,分别所占百分比为87.97%、5.09%、6.85%(表8)。同时,将积极评价与消极评价按照情感值得分分为一般、中度、高度3个层次,最后统计得到疫情前后一般积极评价、中度积极评价和高度积极评价分别占积极评价总数的76.45%、10.03%、1.66%与78.67%、7.81%、1.49%;一般消极评价、中度消极评价和高度消极评价分别占消极评价总数的5.72%、0.08%、0.00%与5.09%、0.00%、0.00%。
表7 疫情前东湖风景区游人评论情感趋势Table 7 Emotional trends of tourists' comments in the East Lake Scenic Area before the outbreak of COVID-19
表8 疫情后东湖风景区游人评论情感趋势Table 8 Emotional trends of visitors' comments in the East Lake Scenic Area before the outbreak of COVID-19
相较于疫情之前,疫情后的评论文本中积极情绪占比略微下降,而中性情绪占比略微提升;在积极情绪分层统计中,情感值在0~10之间的一般积极评论占比有所上升,而情感值在10~20之间的中度积极评论占比则有所下降。根据疫情前后游人评论情感倾向对比折线图(图3),发现疫情前后游人的情感趋势并没有发生明显变化。
3 结论及讨论
3.1 结论
从游人对东湖风景区的网络评价中可知,疫情前后游人对于风景区的情绪倾向并没有发生明显变化,整体仍呈现积极态度。说明游人对于东湖风景>区的满意度并没有受到新冠肺炎疫情的影响。
疫情后,游人对于风景区的使用方式发生了较明显的变化,主要体现在:公共交通譬如公交车与风景区内游览车不再是游人主要交通方式之一,开车成为游人到达景区的主要外部交通方式之一;风景区内的防疫管理条例成为游人重要关注点;呼吸新鲜空气成为游人反复提及的游憩需求之一;“东湖之眼”摩天轮是疫情后游人评价的重要对象,情侣可能是“东湖之眼”的主要使用人群,多数游人表现出了对于“东湖之眼”的积极情绪,并对其相关服务设施进行了评价;疫情后,野餐、磨山景区的索道与滑道等活动比疫情前的打卡、游船活动更受游人欢迎。
3.2 讨论
东湖生态旅游风景区作为国家5A级景区,是武汉市的代表景点之一,为武汉及周边市民提供了日常锻炼、休闲游玩、放松心情的自然场所。后疫情时代,游人对于城市绿地的使用发生了一定的变化,东湖风景区的管理建设也需要随之适应变化。通过疫情前后游人对东湖风景区的网络评论文本分析对比,建议从以下几个方面进行提升。
防疫管理人性化,加强相关信息传播。后疫情时代,风景区内的防疫管理是景区管理的重中之重,也是游人游玩过程中最为关注的问题。一方面,需要景区对游客严格执行防疫条例,避免疾病的公共传播风险;另一方面,景区需要人性化地调整防疫管理条例以满足游人的游憩需求。疫情后,游人呼吸新鲜空气的需求、开展“野餐”等户外聚集活动的需求等更为强烈,这与普遍的公共防疫管理(公共场所佩戴口罩、不聚集等)有所矛盾之处,如何平衡游憩需求与防疫管理,建立适应于风景区的防疫管理条例并能迅速使公众知情是风景区需要考虑的重要问题。
适应游人交通方式,提升风景区内外交通基础设施服务。疫情后,游人的交通方式发生了较大的变化,更多的游人选择自驾到达景区和骑行这一方式进行游园,这对景区的停车设施以及行车管理等提出了新的要求。风景区需要对游人机动车与非机动车停车需求现状进行评估,对园内自行车特别是共享单车停泊点进行管理规定,以便于游人更好地到达及使用风景区。
优化重点景点的配套设施,增强服务质量。通过网络评论文本分析发现,东湖风景区内部分景点如“东湖之眼”“滑道”“索道”等受到了游人的重点关注,且其配套服务设施(如“东湖之眼”的空调设施、蓝牙音响等)是游人评价的主要内容,是影响游人评价的重要因素。风景区应针对游人诉求,完善景点的配套服务设施以便于游人使用,从而提升景点的服务质量。