基于社交媒体数据的城市公园景感评价
2022-03-10郑天晨朱捷缘王辰星荣月静卢慧婷
郑天晨,严 岩,章 文,朱捷缘,王辰星,荣月静,卢慧婷
1 中国科学院生态环境研究中心, 城市与区域生态国家重点实验室, 北京 100085 2 中国科学院大学, 北京 100049 3 比利时根特大学地理系,根特 9000 4 武汉理工大学资源与环境工程学院, 武汉 430070
城市公园作为城市居民与自然生态系统互动的场所,为城市居民提供了户外休闲与活动的空间[1—2],并提供着重要的生态系统文化服务。生态系统文化服务(CES)指人类通过精神满足、认知能力的发展、思考、娱乐和审美体验而从生态系统中获取的非物质收益[3]。城市公园的文化服务可以提升城市居民的身体素质,如增强骨骼、肌肉与心肺功能[4],降低疾病风险[5—6],也促进了城市居民的心理健康,如减少压力[7],缓解焦虑[8],促进形成良好社会关系[9—10],居民对文化服务的需求日益增加[11]。
城市公园的文化服务的价值实现在于城市居民对文化服务的感知,因此,基于景感生态原理对城市公园的文化服务进行评价与改进则尤为重要。景感生态理论[12—13]以可持续发展为目标,基于生态学的基本原理,从自然要素、物理感知、心理感知、社会经济、过程与风险等相关方面,研究土地利用规划、建设与管理的科学。从个体感知的角度而言,景感生态原理强调在规划、管理与决策中对人类所处的自然环境要素以及人类的物理感知、心理感知等方面进行考虑[14]。通过城市公园景感评价,可探究公园现状对居民个体的影响,充分考虑在公园休闲的居民个体的感知感受,进一步满足居民的需求[15],并提升居民的景感满意度。
随着现代信息技术和人们生活方式的发展,尤其是互联网技术的普及,社交媒体作为大众获取信息、发布观点的平台,存在着大量由用户参与的,对人物、事件、产品等有价值的评论信息[16],是评估个人情绪、感知、观点和兴趣的广泛数据来源[17]。社交媒体数据易于获取、时间跨度长、数据量大[18],体现了用户对特定活动场所的具体感知和感受。因此,基于社交媒体数据对城市公园进行景感评价,可以掌握大量居民个体对城市公园的感知、感受信息,进而探究影响居民休闲体验的关键要素,有助于推进景感的营造,从而达到保持、改善和增加生态系统服务的目的,将人与生态系统服务紧密联系起来[19]。
本文构建了基于社交媒体数据进行城市公园景感评价的框架,通过生成感知与要素词库,识别用户发布的评论中存在的感官感知及其关联要素,进而基于情感分析判断用户对所访问公园的满意度,并以玉渊潭公园为例,进行了实证评价。
1 数据与方法
1.1 城市公园景感评价框架与流程
城市公园的景感评价包括景感要素的重要性评价及满意度评价。本文构建了基于社交媒体数据进行城市公园的景感评价的框架与流程(图1)。通过识别指定公园的高频特征词,对景感评价指标体系进行调整;通过生成感知感官与公园要素词库,对文本数据中各项景感要素指标进行识别与统计,作为景感重要性评价结果;对文本进行情感分类,结合各景感要素指标的出现频率,以消极评论比例作为各景感要素的满意度评价结果。
1.2 研究区概况
本文选择北京市综合性公园之一玉渊潭公园作为研究区。玉渊潭公园位于北京市海淀区,占地面积132.38hm2,其中水体面积为 59.72hm2。园内分布有多个景点,包括樱花区、湿地区、运动休闲区和文化展示区等四个主要功能区,并设置有完善的基础设施,可以购买多种食品及饮料。公园特色景点樱花园,是国内最大的樱花专类园之一。除樱花外,公园内配置有多样化的植物,以水杉、柳为主的落叶树种和雪松为主的常绿树种作为骨干植物,少量种植连翘等花灌木,部分道路两侧栽植有一、二年生草本花卉三色堇等。通过植物围合出了多个小型活动空间,每个空间设计有不同的路面材质,包括水泥、石材、木质等。园内比较开阔的空间多集中在水边,水域内养殖了野鸭等动物,但其他区域动物比较稀少,很少听到鸟鸣等动物的声音。此外,玉渊潭公园在举办樱花文化活动、鲁冰花展等特色活动时,访问量极高,尤其在热门景点会聚集大量人群。
1.3 数据与处理
1.3.1数据的获取与预处理
首先,设定“关键词”为样本公园的名称,提取社交媒体中与研究对象相关的信息。本文以用户发布的微博评论作为数据来源,以“玉渊潭”为关键词,利用爬虫工具对2018年9月30日至2019年9月 29日的相关微博数据进行爬取,获取数据17975条。
自动爬取的社交媒体数据通常存在大量噪声数据,因此,需对文本数据进行噪声数据的剔除。在本文中,首先根据评论发布账户信息剔除了由公共账户发布的新闻信息、广告宣传信息及说明类文字,仅保留由个人用户发布的原创内容。用户发布的评论中,部分评论以图片内容为主,往往文字描述过于简短(如仅包含公园名称、所在地点);同时,也存在内容虽提及了玉渊潭或玉渊潭公园、但实际描述内容或评价对象与公园关联不大的评论。以上数据均视为无效数据,需要进行剔除。因此,本文在保留文本中随机抽取20条文本数据进行人工判定其是否为有效数据,并进行无效数据的剔除,若存在无效数据,则重复以上操作,直至随机抽取的数据均为有效文本数据。最终获得有效文本数据12612条。
1.3.2词库生成与指标设计
相比英文词语之间由空格间隔,汉语书面语中的汉字逐个排列,词语之间没有明显间隔,若要对其进行信息处理,应对等距排列的汉字串序列进行词的切分[20]。因此,需使用分词工具对获取的文本数据进行分词处理,将原始连续文本拆分为词序列,并过滤其中无实际含义的词语,即停用词。本文选择采用结巴分词工具,对微博文本数据进行了分词处理并去除停用词。随后,对文本数据进行词频分析,提取文本中的高频特征词汇并生成词汇频率表。为避免歧义,本文在高频特征词的统计中,未统计单字出现的频率。
进而依据感知指标体系[14],围绕个体的感官感知与公园的设计要素两个方面,对高频特征词进行类别判定,分别形成感官感知与公园要素词库。其中,感官感知包括视觉、听觉、嗅觉、触觉等类别,公园要素包括人、植物、水体、动物、道路、阳光、风、设施及景观可识别性等类别。本文将出现频率高于10的特征词进行了筛选并逐条阅读,判断其是否属于感知感官及公园要素中的各类别范畴,并按照类别进行标签标注,围绕各标签生成感官感知与公园要素词库。同时,基于玉渊潭公园的性质与特点,对指标体系进行了调整,增加了味觉感官感知类别,剔除了公园中不存在的水声、接触水等指标,并将难以通过词库识别的空间感、噪声、异味等指标剔除,形成了基于社交媒体数据的玉渊潭公园景感评价指标(表1)。
表1 玉渊潭公园景感评价指标
1.3.3文本分割与情感分类
社交媒体数据文本中的每条内容往往含有多个维度的感官感知,体现着对样本公园的综合感知情况。因此,需要通过对每条文本数据进行段落分割,最大限度保证每条文本数据中的公园设计要素与感知感官的对应。本文按5%的比例对采集的社交媒体样本数据进行了人工信息识别,结果显示,75.28%的用户发表的评论涉及景感要素比较单一,仅包含一种类型的景感要素;少部分用户发表了较长篇幅的评论,对自己的游园经历进行具体描述,评论内容包括了多种景感要素。在这些评论中,61.54%的文本注重标点符号的使用,因此,本文采取通过“。”“?”“!”“…”等标点符号进行文本分割的方式,以保证大部分要素与感知感官的对应。
然后,基于感官与要素词库,对分割后的文本数据进行感知感官及其对应要素的判定。具体方法为:依据感官感知词库,首先分别筛选文本中存在视觉、听觉、嗅觉、触觉、味觉等感官感知词汇的文本,进而根据公园要素词库,对各类别文本中是否含有相关词汇进行判断。最终获取8178条存在感知感官及对应要素的数据作为有效样本数据。
文本情感分析又称意见挖掘,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程[16],可用于识别公众情绪、预测产品销售、衡量客户满意度等[21]。其中,情感极性分类是情感分析的基本任务[22],旨在基于用户发布的书面文本,挖掘用户对特定产品或服务的观点,并进行文本情感倾向的划分[23]。对公园的景感满意度进行评价仅需获取用户对所访问公园的情感倾向,利用情感分析工具对有效文本数据进行情感极性判断,获取积极与消极两类情感判断结果。本文选择调用腾讯云自然语言处理API接口对文本数据进行了情感极性分类。
1.4 感知评价模型构建
重要性-绩效分析(IPA)方法由Martilla和James提出,用于对比顾客消费前的期望和消费后的感知实绩以及对各属性绩效表现状况的综合评价[24—25]。自20世纪90年代初,IPA分析法开始广泛应用于服务性行业[26],包括服务满意度评价[27]、地区吸引力分析[28]、旅游政策制定[29]及景区满意度评价[30]等。在满意度调查中,IPA方法要求受访者对指定调查对象的各项指标从重要性和满意度两个方面来进行评价,形成IPA矩阵。IPA矩阵以游客期望程度(重要性)为横轴,游客的满意程度(表现性)为纵轴,并以总平均值作为X-Y轴的分隔点,将空间划分为四个象限,各象限意义为:第一象限为继续努力发展区域;第二象限为无需过多改善区域;第三象限为缓慢改进区域;第四象限为需要重点改进区域。
利用IPA方法,基于社交媒体文本分析结果,进而对公园景感满意度进行评价。其中,景感要素对用户感知的重要性通过各要素出现频次进行衡量,用户对各景感要素感知的满意度通过消极情绪文本在文本数据中的占比表征。具体方法为基于情感分析结果筛选各感官感知及其关联要素,并基于指标体系进行各指标对应文本数量的频率统计;同时,针对各指标分别进行消极情感文本的数量统计,以消极文本比例衡量用户对该要素的不满意程度。
考虑到各景感要素之间等级的多层次划分[14],在引入IPA方法的同时,对指标的重要性和不满意度等级均进行了重新划分,分别以指标重要性、不满意度统计频率的下四分位数、上四分位数作为低-中、中-高等级划分标准,据此形成亟待改进、次要改进、低优先级、继续保持、过度开发五个级别的感知评价模型(图2)。基于感知评价模型可确定公园改进策略的优先级别。
2 结果
由各类感官感知评论数量可知(图3),用户对视觉感知的需求明显高于其他感官感知的需求,对触觉感知的需求相对偏高,对听觉感知与味觉感知的需求相对偏少,对嗅觉感知需求最小。在满意度方面,用户在与味觉感知和听觉感知等感官感知相关的评论中消极评论占比最高,与触觉感知和嗅觉感知相关的评论中消极评论占比偏高,而对视觉感知的消极评论占比最小。
图2 感知评价模型[14]Fig.2 Perception assessment model
图3 基于感官的景感重要性及满意度对比 Fig.3 Comparison of landsense importance and satisfaction based on five senses
由各景感要素感知评论数量可知(表2),用户对观赏植物、人群干扰、景观可识别性和观赏水景的重视程度明显高于其他景感要素,而明显不重视的景感要素包括动物声、动物接触、播报声和植物气息。在用户的满意度评价中,人声、动物声、感知风和食品售卖等景感要素的消极评论比例偏高,而景观可识别性、感知阳光、观赏水景和观赏植物等景感要素的消极评论占比偏低。
表2 各指标评论文本比例
图4 北京玉渊潭公园感知评价模型Fig.4 Perception assessment model of Yuyuantan Park, Beijing
由感知评价模型可知(图4),不存在亟待改进的景感要素,次要改进的景感要素为人群干扰、路面接触、食品售卖、感知风、观赏动物、人声、植物声、观赏道路景观,可以继续保持的景感要素包括景观可识别性、观赏植物、感知阳光、观赏水景;而过度开发的要素包括动物声、动物接触、播报声和植物气息。
3 讨论
3.1 玉渊潭公园景感评价结果分析
北京玉渊潭公园的景感评价案例研究表明,视觉在城市公园的感知体验中依然占据主导地位,触觉感知次之,而居民普遍不重视听觉感知,这与先前的研究结果一致[14]。而嗅觉在距离型感知器官中可发挥作用的尺度最有限,导致了嗅觉感知指标相对缺失,而在社交媒体数据中嗅觉感知的体现同样偏少,可见感官的发挥作用的尺度会显著影响其感知情况。作为北京市综合性公园之一,玉渊潭公园为城市居民提供了食品、饮料售卖等服务,本文仅设置了“食品售卖”一项味觉感知指标,由于指标数量有限,结果显示居民对味觉感知体验的重视程度相对偏低。
对景感要素而言,在玉渊潭公园内,植物、周边人群、景观可识别性和水体的视觉感知是最重要的景感要素之一,显示出城市居民对亲近自然、远离人群干扰的需求以及对公园特色的关注。与先前结果有较大差异的是,基于社会调查的结果表明居民对动物声音比较重视[14],然而,在社交媒体数据中,用户很少提及对动物声音的感知,这可能与用户在玉渊潭公园中感知动物声音比较困难有关。
基于研究结果,主要围绕访问者的视觉、听觉感知,道路的视觉、触觉感知等方面,对玉渊潭公园提出以下设计与管理建议,以促进景感营造:
访问者:通过完善公园景观与设施布局,适量增设游憩设施,提高公园游客承载量;加强公园管理技术与手段,运用物联网技术,建立景感满意度生态风险管理平台[14,31—32],对公园人群密度进行实时监测,引导居民合理规划游园路线。
动植物:合理配置园区植物,适当增加常绿灌丛的栽植种类与密度,为居民提供避风、隔音的小尺度休闲空间;保证园内小型野生动物栖息地面积,为居民提供更多观赏动物的机会。
人工设施:依据居民需求增设公园零售商品及游乐设施种类,并合理设定价格;丰富主干道路景观,并结合指示牌引导居民选择合适的游园路径。
3.2 社交媒体数据在城市公园景感评价中的应用前景
相比传统社会调查,基于社交媒体数据对城市公园文化服务进行景感评价,耗时短,可获得大量样本数据,并且往往体现着用户对城市公园的综合感知情况,可获取用户对特定活动场所更为具体的感知和感受,并识别最影响居民体验的景感要素。同时,社交媒体数据的综合性也体现了对心理感知识别的可能性,后续研究可围绕社交媒体数据中用户的评论,对多种感知进一步识别与区分,构建包括物理感知、心理感知等方面的综合性感知评价指标体系。
然而,由于中文文本的特征,在利用社交媒体数据进行城市公园文化服务的感知评价时,依然存在需要进行优化的方向。首先,噪声数据的剔除依然比较困难。新闻文本、广告等非个人用户发布的信息的剔除难以通过机器学习的方法进行识别,依然需要人工判断,这在利用大量数据文本进行景感评价时是难以实现的。其次,尽管社交媒体数据量非常大,可用于景感评价的样本依然十分有限,这表明基于感官感知的识别依然比较困难,需要对感知与要素词库进一步扩充,并基于大数据分析方法,对感官感知及其对应要素进行识别训练。此外,部分评论文本篇幅较长,内容复杂,含有较多的感官感知与公园要素词汇,需要进一步改进基于词库进行景感要素的识别方法,保证感知与要素的对应关系。
4 结论
基于景感生态原理对生态系统文化服务进行评价,是扩展文化服务研究深度的新思路。本文构建了基于社交媒体数据的城市公园景感评价框架和流程、评价指标以及信息提取方法,并以北京玉渊潭公园为例进行了实证评价。结果表明,城市居民更关注在城市公园中的视觉感知体验,触觉感知次之,而居民普遍不重视听觉感知,这与先前通过社会调查方法得到的研究结果一致;其中,植物、周边人群、景观可识别性以及水体的视觉体验受到了大多数居民的重视;最后基于感知评价模型提出了玉渊潭公园的设计与管理改进建议。基于社交媒体数据进行城市公园景感评价的优势在于数据获取耗时短、数据量大,并且可以获取用户对特定活动场所更具体、更直接的感知和感受,有助于更具有针对性的改进建议的提出;此外,社交媒体数据的综合性为识别居民访问公园时的心理感知提供了可能性,为基于景感生态理论的城市公园综合感知评价提供了数据基础。然而,相比社会调查方法,社交媒体数据在城市公园文化服务的景感评价中依然具有局限性。首先,噪声数据的剔除主要依赖于人工识别,当数据量过大时往往难以实现;其次,景感要素指标的识别需要更有效的识别方法与覆盖范围更广泛的词库。但是,随着信息技术的发展与互联网用户的不断增加,通过社交媒体获取的数据与社会调查数据之间的差异逐步缩小,基于大数据对城市公园进行景感评价将具有更高的可操作性,是景感生态理论与文化服务评价的发展方向之一。