APP下载

游客对国家中心城市5A级景区空气质量的情感分析

2021-06-01和泽海

市场周刊 2021年5期
关键词:空气质量景区中心

和泽海,张 峰,卢 晔

(1.江苏师范大学,江苏 徐州221116;2.徐州医科大学,江苏 徐州221004)

旅游业对自然资源、生态环境和气候条件有着严重依赖性,空气作为旅游目的地的重要自然资源,其质量影响着游客的旅游行为选择以及对旅游目的地的情感体验。方叶林等提出环境污染主要包括大气污染、水污染以及固体废弃物污染,其中游客对空气污染感知度最强。Zhang等通过对北京潜在游客的问卷调查发现多数游客已感知到雾霾给健康带来的风险。雾霾引起的空气质量问题对旅游目的地城市的影响不容小觑,程励等采用网络问卷的形式对雾霾天气较为严重的城市进行调查,获知雾霾天气对城市居民旅游目的地的选择倾向产生了显著的负面影响。和Pfister对曼谷的空气污染和澳大利亚的臭氧消耗进行研究发现,在游客看来前者的风险与危害是远高于后者的。这些研究为本研究提供了重要的范式引导,然而,当前研究主要集中于空气质量对旅游者选择旅游目的地的影响,研究所用的数据主要来自传统的问卷形式,研究所应用的对象主要是国家或单一的城市。

在社交媒体时代海量的线上数据为游客情感研究提供了数据资源,与此同时,在线文本分析技术为文本的挖掘与分析提供了保证。对社交媒体数据进行情感分析、提取公众意见可为游客体验旅游环境的情感倾向性研究提供新的视角。情感分析(sentiment analysis,SA),又称为倾向性分析或意见挖掘,是对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。目前,情感分析的方法主要是基于机器学习的方法和基于情感词典的方法。已有研究认为基于机器学习的方法比基于情感词典的方法更可靠。此外,在常用的机器学习方法支持向量机(support vector machine,SVM)、朴素贝叶斯(naive Bayes,NB)和人工神经网络(artificial neural network,ANN)中,被证实第三者的结果最为精确。

挖掘旅游大数据所包含的游客情感以探讨游客感知环境质量的专题研究已经引起了学界高度的关注。张思豆和李君轶运用词典匹配方法分析微博大数据,探究了游客情感与空气质量的关系。Saura等运用Python开发的算法对瑞士酒店目的地环境的推特评论进行探究,提出空气质量对目的地环境具有重要作用。Becken等运用词汇匹配方法测算了大堡礁旅游生态环境评论的情感值。然而,从认知或情感的角度分析游客对空气质量风险感知的成果仍较少。鉴于此,论文以赴国家中心城市5A景区的游客为例,以微博数据为素材,运用人工神经网络这一机器学习方法进行情感分析,探究游客对空气质量的情感倾向,归纳和揭示出游客对国家中心城市空气质量的情感特征。

一、研究区域概况

国家中心城市是具备空间、人口、资源和政策优势,且在政治、经济、文化等方面具备辐射和集散功能,能够引领区域发展的城市。目前为止,已经确定了北京、上海、天津、广州、重庆、成都、武汉、郑州、西安9个国家中心城市。选择九大国家中心城市为案例地,主要原因包括:①国家中心城市是中国城市旅游的典型代表,对研究游客对我国城市旅游目的地空气质量的情感感知具有重要意义。②九大国家中心城市分布于国家东、南、西、北、中不同区域,有助于研究游客情感空间动态变化特征。③国家中心城市5A景区数量多,游客量大,评论数据丰富。④国家中心城市空气质量较差,且国家中心城市作为城市群和区域内的核心城市,游客对其空气质量的关注度较高。表1列出了九大国家中心城市2018年空气质量状况及城市概况。

表1 九大国家中心城市2018年空气质量状况及城市概况

续表

二、研究方法

论文首先利用ROST EA对数据进行辅助处理,计算出文本句子的极性比例。ROST EA是武汉大学沈阳教授团队研发的用于情感分析的软件,此软件基于情感词典抽取文本情感词,对文本情感值进行计算,根据情感值的正负判断文本情感倾向,可将情感划分为积极情绪、中性情绪和消极情绪3种类型。

其次,通过编辑Python3.0程序调用Boson平台的基于中文语料的半监督的ANN这一机器学习方法测算篇章文本情感值。使用该方法的原因如下:一方面,Boson平台的语义语料库是根据微博、论坛等渠道的数据自动构建的,且在分析时设置URL参数语料库为微博语料库,因此可以实现与微博数据的无缝对接;另一方面,该方法不仅能有效识别一般性词汇的情感,还能识别特殊的专有名词、俚语、网络用语的情感来挖掘出文本隐藏的情感,且该方法的训练语料库规模宏大,因此基于人工智能算法的ANN方法具有较高的准确率。表2为Kirilenko等给出的情感分析评估准则的含义,公式(1)~(4)为根据表拟定的评估准则的计算公式。其中,准确率(A)表示检测结果中正确的话题数量与检测结果的总话题数量的比率。精度(P)表示检测结果中正确的某类极性的话题数量与检测结果为同类极性的话题数量的比例。召回率(R)表示检测结果中正确的话题数量与被测试集中应有的话题数量的比率。F1值集合了精度和召回率这两个评价参数描述了算法的总体优劣。

表2 三元情感分类结果混淆矩阵

通过Python 3.0编写计算机编程语言处理时,先是调用Boson平台上ANN方法分析篇章级评论文本,最后再批量输出景区的情感数据。情感值在0和1之间且正负形象临界值为0.5,根据等距原则拟定等级标准如下:非常差(0~0.100)、很差(0.101~0.200)、差(0.201~0.300)、较差(0.301~0.400)、稍差(0.401~0.500)、稍好(0.501~0.600)、较好(0.601~0.700)、好(0.701~0.800)、很好(0.801~0.900)、非常好(0.901~1)。

三、数据来源

微博数据具有规模巨大、更新速度极快、形式多种多样以及价值性高的特点,为情感分析提供了重要研究数据源。论文以“空气”+“景区名称”为关键词,通过八爪鱼网络爬虫工具在微博社交平台上对全国5A景区进行旅游评论搜集,并进行人工去噪,最终获得2011年1月1日至2018年12月31日232个5A级景区的36737条评论,共计2886457字。去噪过程如下:首先,删除重复评论;其次,考虑到微博账户除个人外,还包括政府机构、企业、媒体等组织机构,而网络舆情传播的观点是来自公众的,故剔除来自组织机构的信息;然后,删除没有情感特征以及无意义的评论;最后,统一数据格式。

四、结果分析

ROST EA采用情感词典方法可对所有评论句子的三元极性占比给出一个总体性判断,而Boson平台上的ANN这一机器学习方法则可测算带有时空信息标签的每条评论的情感值。故采用ROST EA为辅、ANN为主的混合研究方法进行情感分析。

(一)ROST情感分析

采用ROST EA对九大国家中心城市的所有评论进行情感倾向性比例测算,结果表明:积极情绪、消极情绪、中性情绪的评论分别占总评论数的77.99%、17.82%、4.19%,积极倾向评论数约为消极倾向评论数的5.5倍。可看出,游客对国家中心城市的评论总体情感倾向为积极倾向。对具有积极情绪的评论进行分段统计,结果显示,一般、中度、高度强度的评论数分别占总评论数的26.12%、22.97%、28.90%。由此可知,游客对国家中心城市的积极情绪略微偏高。对具有消极情绪的评论进行分段统计,一般、中度、高度强度的评论数分别占总评论数的9.60%、3.17%、0.45%。可见,游客对国家中心城市的消极情绪强度偏低,主要以轻度的负面情绪为主,极端负面评价较少。

(二)ANN情感分析

1.九大中心城市情感值对比分析

通过编写Python代码调用Boson平台上基于人工智能算法的ANN方法,测算篇章级文本的情感值。国家中心城市的情感值统计结果见图1,结果显示:整体的波动范围在“较好”与“很好”之间,游客情感值波动范围较小,最高情感值与最低情感值仅相差0.175,游客对九个国家中心城市的情感倾向差异较小,属于“好”等级的城市有5个。此外,游客对国家中心城市的平均情感值为0.751,属于正面中间的“好”等级,其结果与上文ROST EA计算出的情感倾向大体相吻合,均为好中略微偏上的程度。由此可知,总体上,游客对国家中心城市的情感倾向以正面为主,对国家中心城市空气质量的情感体验度相对较高。

空间上,九大国家中心城市分布于国家东南西北中不同区域,东部地区(上海、广州)的平均情感值低于西部地区(成都、重庆)的平均情感值,北部地区(北京、天津、西安)的平均情感值低于南部地区(上海、成都、重庆、广州)的平均情感值,总体呈现出“东低西高、北低南高”的特点。该特点与全国城市空气污染表现出的“东重西轻、北重南轻”空间格局相一致。此外,中部地区城市(武汉、郑州)平均情感值略高于东部地区(上海、广州),也与东部和中部地区空气质量低于西部地区的实际情况相符。可见,游客的情感体验在一定程度上能够反映出真实的生态环境质量。同时也反映出国家中心城市作为城市群和区域内的核心城市,在区域内具有极强的代表性。(图1)

图1 九大国家中心城市情感值排名

时间上,游客对国家中心城市5A景区的微博评论数除2013年出现爆发性增长外,整体呈稳定增长趋势。该趋势与微博用户的持续增长有关,也说明了游客对空气质量的关注度日益提升。自2013年1月PM2.5首次成为气象部门霾预警指标,“雾霾”一词一度成为网络热搜,空气质量问题引发了人们大量的关注,由此推断出2013年有关空气质量微博评论数的爆发性增长与其有较强的相关性。

2011~2018年游客对国家中心城市5A景区空气质量的情感值分别为0.790、0.721、0.743、0.776、0.780、0.748、0.752、0.739,均为“好”等级。考虑到2011年评论数量过少,仅有219条,且出现了异常兴奋值,故剔除。图2显示,2012~2018年游客对国家中心城市5A景区空气质量的情感值整体呈波动上升趋势,但上升幅度较小,仅为2.5%。其中,2015年的情感值最高,2012年的情感值最低,最高值比最低值高8.2%。生态环境部发布的中国环境状况公报显示,除2016年外,2012~2018年间全国空气质量都较前一年总体向好,这一实际情况与2012~2015年情感值呈上升趋势,而2016年情感值较2015年明显下降相吻合。然而,游客的情感值并没有伴随着空气质量的改观而稳步上升,不仅上升幅度小,且在2018年情感值又一次出现下降。据中华人民共和国生态环境部官方网站(http:∥www.mee.gov.cn/)统计,2018年全国338个地级以上城市中,空气质量达标的仅占35.8%。虽然2012~2018年中国空气质量有一定的提升,但我国空气污染问题仍面临着严峻挑战。雾霾的出现、纪录片《柴静雾霾调查:穹顶之下》的播出、国家有关生态保护政策的出台……使人们对空气污染更加敏感。此外,伴随着大众旅游的兴起,人们更加追求高质量的旅游经历,因而对空气质量的标准也愈加严格。由此可知,游客情感与空气质量具有一定的相关性,但空气质量的略微改善并不能够引起游客满意度质的飞跃,伴随着游客对生态环境的日益关注,人们对空气质量提出了更高的要求与期望。

图2 2012~2018年国家中心城市空气质量情感值和评论数

2.九大中心城市情感值在全国的位置分析

通过上述方法测算全国省份的情感值以及评论数。游客对全国5A景区的微博总评论数为36737条,其中对国家中心城市5A景区的微博评论数为5802条,占全国评论数的15.8%。在全国省份(自治区、直辖市)评论数中四个直辖市北京、上海、重庆、天津的评论数分别排在第7、第22、第25、第30位。剩余五个中心城市武汉、广州、西安、成都、郑州的评论数分别占其所在省份湖北、广东、陕西、四川、河南的55.4%、50.9%、49.7%、28.6%、2.1%。可知,游客对国家中心城市5A景区的空气质量关注度较高。

从全国范围看,游客对国家中心城市的空气质量情感体验度相对较低。游客对国家中心城市5A景区空气质量的平均情感值为0.751,比对全国5A景区空气质量的平均情感值低0.034。四个直辖市天津、重庆、北京、上海的情感值在省份(自治区、直辖市)排名中分别排第7、第10、第26、第31位,北京和上海的情感值均低于全国平均值,且上海的情感值在所统计的31个省份(自治区、直辖市)中为倒数第一。剩余五个中心城市武汉、广州、西安、成都、郑州的情感值均低于所在省的情感值。

3.九大中心城市景区情感值比较分析

从景区维度对国家中心城市5A级景区的情感值进行对比分析发现:游客对空气质量的感知与景区类型具有相关性。总体上,自然景观类景区的情感值高于人文景观类景区的情感值。在30个5A级景区中,人文景观类景区有18个,自然景观类景区有12个。其中,人文景观类景区的平均情感值为0.731,属于“好”等级,自然景观类景区的平均情感值为0.807,属于“很好”等级。人文景观类景区中,上海科技馆和东方明珠广播电视塔的情感值最低,分别为0.578和0.630,导致上海整体的情感值较低。自然景观类景区中,重庆占7个,且排名前四的景区均位于重庆,使重庆整体的情感值较高。

图3 人文景观类5 A级景区情感值

图4 自然景观类5A级景区情感值

五、结论与讨论

(一)结论

首先,情感分析表明,游客感知到的空气质量以正面形象为主,随着时间的推移,这种形象呈波动上升趋势,在空间上则表现出“东低西高、北低南高”的特点。时间上,2012~2015年情感值呈上升趋势,2016年情感值较2015年明显下降与实际空气质量年变化相吻合,此外,2016~2018年情感值呈波动下降的趋势表明游客对空气质量愈发严格;空间上,游客对国家中心城市的情感体验呈现出“东低西高、北低南高”的特点,与全国空气污染特征相吻合,表现出九大中心城市在区域内极强的代表性;总体上,游客对国家中心城市的情感值在全国范围内较低与城镇化程度较高的地区大气污染程度明显高于城镇化水平较低的地区情况相吻合。综上,从不同层面研究游客对空气质量的感知对揭示游客的情感特征具有有效性。

其次,景区类型是影响游客情感值的重要因素。从景区维度研究游客情感体验,发现自然类景区比人文类景区更能够激发游客的积极情绪。本研究认为多维度分析游客情感影响因素对了解游客情感体验和目的地建设具有重要意义。

最后,中国九大中心城市的空气质量已成为游客的重要关注对象,对游客体验满意度的提升具有重要意义。然而,从全国范围看,游客对国家中心城市的空气质量体验感相对较差,因此,旅游供给双方均需保护空气环境。具体来说,在供给侧方面,可通过制定大气环境治理等方面的措施来改善空气质量,进而提升城市旅游形象,促进目的地的良性发展;对需求侧的游客而言,则需培养环境风险感知意识,减少对空气质量带来负面影响的不良行为。需要指出的一个重点是,在景区层面,情感值的高低可比较准确地反映目的地的空气质量,所以在方法上除传统意义的物理监测之外,可发挥情感值的感应器作用,利用社会监测方法以监督环境,通过以人为本的服务方式达到人类与自然环境和谐共处的目的。

(二)讨论

第一,真实的空气质量与游客的情感体验具有相关性,游客对国家中心城市空气质量的关注度较高,但从全国看游客对国家中心城市空气质量的体验却不尽如人意。国家中心城市是我国城市群的核心,也是我国对外开放的“名片”,提升空气质量进而增强游客对国家中心城市的情感体验具有重要意义。

第二,在运用ROST EA进行情感倾向性测算时,由于运用的不是有关空气质量评价的词库,故在测算情感值时有一定的偏差,论文只进行了文本情感比例分析,后续研究若能构建有关空气质量评价的词库,将有助于提升从词汇角度进行情感分析的准确率。

第三,结果分析方面,游客情感体验受多方面因素的影响,论文仅考虑了空气质量和景区类型因素,未来可对游客情感因素进行多维度分析。

猜你喜欢

空气质量景区中心
乌海市雾对空气质量的影响
在打造“两个中心”中彰显统战担当作为
云南发布一批公示 10家景区拟确定为国家4A级旅游景区
『摘牌』
“摘牌”
既要靠近制造中心,也要靠近科研中心 人工智能如何“聪明”地行进
一切以人民为中心
某景区留念
先定中心后搭配