基于文本情感分析的城市公园使用感知评价研究*
——以重庆36个公园为例
2022-09-15韩贵锋
叶 林 江 伦 韩贵锋
0 引言
十四五期间,我国社会经济以推动高质量发展为目标,要求持续提高城市治理温度和精细化水平,聚焦人民需求,增进人民福祉[1]。居民物质层面的需求和福祉随着社会发展水平的不断提升,已经有了显著改善;相应地,精神层面的满足感、幸福感、获得感的需求也与日俱增[2]。公园作为城市重要的休闲游憩空间,可以有效减少用户心脑血管等疾病的发生概率[3]、降低抑郁和焦虑风险[4],增加思维创造力、身体活力和积极情绪[5],对居民精神生活品质的提高有显著作用。因此,针对居民需求,建设人性化的公园,增加居民使用频率和满意度,提升用户体验显得尤为重要。
1 相关研究讨论
既有研究大多使用“感知”一词来描述用户访问公园过程中产生的认知、获得的体验和产生的情感[6-7]。影响用户感知的各类因子,称之为感知要素。相关研究大致从两个视角开展研究,一是聚焦“感知”这种极具主观色彩的心理感受本身,通过访谈、虚拟环境模拟(VR)、眼动追踪技术、心电信号测量等方法尝试提升公园访客心理和生理满意度指标[8-11];另一种则侧重“感知结果”,以使用者给出的评价为研究对象,分析公园建设运营中的优势和短板,最终落实在通过有效规划改善物质空间,促进使用者的良好体验。
基于改善人居环境,提升城市居民幸福感和获得感的目的,本文选取第二种研究视角。这一视角下的相关探讨受研究手段、研究对象等因素的影响,对感知要素及其影响力的认识存在差别,如刘瑞雪(Liu)发现公园规模、娱乐设施、景观、植被维护、环境清洁、标识系统、空气质量等9个要素影响感知,其中标识系统影响最大[12];李念等认为,自然文化资源、门票和配套设施服务是影响感知的主要要素[13];万凯文(Wan)发现公园自身特征(规模、类型等)影响显著,而各类设施影响较弱[14]。可见,相关研究呈现的结论差异较大,无法形成合力有效指导建设实践。
笔者认为,究其原因有两点:一是样本选取不足,由于样本公园数量少、类型单一,缺乏大规模、全覆盖研究基础,难以获得通用结论。如,不同类型公园的感知体验存在明显差异,森林公园以感知自然景观为主,而体育公园的健身设备影响体验;二是研究方法局限,以往研究多采用问卷调查、现场访谈等社调方法,问题设计很大程度上依赖研究者的认知和经验[8,11],不能完整而有效地获取用户感知信息,要素提取和分析由此产生偏差。
近年来,基于互联网社交媒体数据的公园感知研究逐渐兴起,针对上述问题,运用大数据技术获取用户海量评论数据,深度学习技术则为更加全面客观地评估用户感知和为公园的建设运营情况提供可能[10-15]。这种新兴的技术方法通过构建网络模型模拟人脑神经系统对文本进行分析、倾向判断并自动学习优化模型输出等,能高效分析和处理信息[13-15]。如黄健翔(Huang)结合凯文·林奇《城市意象》的规划理论与深度学习方法,发现社交媒体中地点词频通常与用户对景点的评价、好感度、与日常生活的关联性有关[15]。相关研究仍然存在一定不足,如大部分研究使用预置语料库的软件(ROST CM6等)进行浅层次的词汇聚类分析和词频统计,准确性和实用性较低[16-17],并且具体方法多针对不同场所空间绘制感知热力图[18-19],仅停留在对公园感知的整体概括性描述,没有聚焦到关键感知要素,无法引导针对用户感知的规划设计实践。而深度学习方法通过构建网络模型模拟人脑神经系统进行情感分析、特征抽取,并自动学习优化模型输出[20-22],可以大幅提高分析的准确性和针对性。
为此,本文以重庆市36个公园为例,在使用大数据技术获取公园用户海量信息的基础上,针对不同公园类型,采用百度智能云平台深度学习模块,提取并分析用户评论中的感知要素及其倾向(积极或消极)。并通过分析要素感知频率(要素词频占总评论数量的比例)与感知倾向的关系,挖掘影响感知的关键要素。最后以此为依据,提出相应的公园优化设计策略,指导公园规划建设。
2 研究样本与方法
2.1 公园选取与分类
重庆地处中国西南部,属于亚热带季风性湿润气候,主城区山体、河流、森林资源丰富,景观多变,造就了多样化的公园类型。此外,受建造年代、质量标准和地形起伏的影响,公园服务水平差异较大,用户形成各异的体验和感受[23]。本研究选取居民访问程度及点评数量较高的36个城市公园作为研究案例,主要分布在巴南、大渡口、九龙坡、沙坪坝、南岸、江北、渝中、渝北8个城区(图1),占地规模在1.07~220 hm2之间不等。从分布地域、样本数量、尺度和类型上,可以较完整地反映主城区公园的整体状态。
图1 重庆主城区36个公园类型及分布Fig.1 types and distribution of 36 parks in the central area of Chongqing
根据国标《城市绿地分类标准》(CJJ/T 85—2017)对公园绿地分类依据,并结合公园规模、绿化率、景观类型(地质地貌、湿地森林等)及主要功能(科普教育、休闲游玩、健身锻炼等),将36个公园分为七类:地质公园、生态公园、儿童公园、体育公园、纪念性公园、综合公园、游园(表1)。
表1 36个公园类型划分Tab.1 park classification
各类型公园评论数量分布如下图所示(图2),评论数量在101(同景公园)~2784条(壹华里夜景公园)之间。其中22个公园评论数量小于300条,占比55.6%,为本研究的主要样本区间;10个公园评论数量300~1000条,占比27.8%;6个公园评论数量大于1000条,占比16.7%。总体而言,各公园的评论数量存在差异,但均超过100条评论,包含的感知信息较为丰富,数据量足以支撑从中分析不同类型公园的感知特征。
图2 公园评论数量Fig.2 number of park reviews
2.2 研究方法
本文首先通过网络爬虫技术获取大众点评网站公园用户评价数据,使用python软件对评论文本进行分句预处理,然后通过Excel提取感知要素关键词,并采用百度深度学习技术进行文本情感分析。最后结合SPSS统计分析,提取影响感知的关键要素,进而指导规划实践。具体流程可以分为“数据爬取与分句处理—感知要素提取和倾向分析—关键感知要素分析”三个部分(图3)。
2.2.1 数据爬取与分句处理
本研究共获取公园评论22355条,包括公园名称、用户ID、评分、评论文本、评论时间等内容(图3)。经人工删除无关评论后,获得有效评论20258条,247.15万字符。接着使用python语言split方法将长文本分句,以保证后续要素提取和感知倾向分析的独立性,分割符号采用中文语境中惯用结束符号“。”“!”“……”。获得独立评论分句69776条,所有数据经筛选后导出至Excel数据库。
图3 分析流程图Fig.3 analysis flow chart
2.2.2 感知要素提取和倾向分析
2.2.2.1 感知要素提取
首先,在Excel中采用搜索关键词的方式,提取每个分句中包含的感知要素,分析高频词语特征。借鉴敬峰瑞等人的经验,划分为4个类型:景观要素、设施要素、环境要素、规模地形要素[24-25],包含自然景观、人文景观,服务设施、公园规模、气温气候、绿化覆盖等共10个感知要素(表2)。
表2 感知要素类型划分Tab.2 classification of perception elements
然后,计算要素感知频率,即用户对要素的关注程度,值越高,关注度越高。一般用要素感知频率高低表示要素关注度高低。要素感知频率计算公式:
其中,Fij是i公园j要素的感知频率,Cij是j要素词频,Ci是该i公园评论总条数。
2.2.2.2 用户感知倾向分析
通过调用百度智能云API的方式对分句文本进行情感倾向分析(图5)。情感倾向分析在计算机人工智能领域又称文本情感分析(text sentiment analysis)、倾向性分析、意见抽取、情感挖掘等[36],指通过计算机技术对带有情感色彩的主观性文本进行分析、处理、归纳和推理,挖掘和分析文本的观点、情感、极性,并对文本的感知倾向做出分类判断[37-39]。查阅百度情感倾向分析算法说明,并结合实际分析结果,总结4个相关参数(表3),分别是感知类型(sentiment)、置信度(confidence)、积极感知概率(positive_prob)、消极感知概率(negative_prob)。一般而言,积极感知概率取值越靠近0,越消极;越靠近1,越积极;消极感知概率则相反;置信度值越高,分析结果越可信,反之越不可信。
表3 百度智能云平台情感倾向分析参数Tab.3 text sentiment analysis parameters of Baidu Intelligent Cloud Platform
图5 百度智能云平台情感倾向分析窗口Fig.5 sentiment analysis window in baidu cloud platform
另外,积极感知概率与消极感知概率之和为1,感知类型也可以通过积极感知概率值确定,可以将这几个参数简化为“积极感知概率”一个参数,为避免混淆,采用“感知倾向”作为简化后的参数名称。本文筛选置信度>0.5的数据进入下一步统计分析,最终建立感知要素和感知倾向数据一一对应关系,结果如下表所示(表4),为后续分析二者相关性以及不同类型公园的感知特征,并提取影响总体感知水平的关键要素打下基础。
2.2.3 关键感知要素分析
影响公园总体感知水平的要素众多,而用户一般仅针对自己关注的要素发表评论,形成大量空值。因此,无法通过回归分析提取各要素对总体感知的影响力但从感知频率和感知倾向的相关性入手,则可以提取出随着使用者关注程度增加而感知倾向快速变化的要素,它们能大幅影响使用者体验,正是影响总体感知水平的关键。
因此本研究采用SPSS25.0对各要素的感知频率和感知倾向进行皮尔逊相关性分析,提取二者相关性系数绝对值大于0.2,且显著性系数小于0.05的要素,作为关键影响要素,并展开分析。共得到6个关键要素,其中4个显著正相关,2个显著负相关。
3 城市公园感知分析
3.1 公园感知特征
统计分析不同要素感知频率程度及感知倾向,可以发现不同感知要素引发的关注程度差异较大,但总体偏积极。此外,用户对不同类型的公园具有截然不同的感知特征。
3.1.1 不同类型要素感知特征
要素感知频率代表用户对要素的敏感程度,发现景观要素>规模地形要素>环境要素>设施要素(图6)。从要素的可见性和可用性分析,景观要素通常由鲜花、林木、草坪等自然景观和亭台楼阁、雕塑小品等人文景观组成,作为各类公园的主体部分,是用户游览公园的主要观赏对象,极易引发高度关注[26];规模地形要素、设施要素可见性中等,用户一般需要预判公园规模和地形起伏,决定游览路线,依赖设施调整体能消耗,可用度较高;而水质、绿化覆盖率等环境要素可见性较强,可用性较弱;三者引发中等程度的关注。
从感知倾向来看,总体均偏积极。积极倾向排序为:环境要素>景观要素>规模地形要素>设施要素(图6)。公园空气质量、绿化覆盖、水体水质等生态环境要素积极倾向最高,体现了用户对公园的价值判断,即看重公园带来的自然价值[27];自然景观是公认的积极感知来源,如鲜花能诱导用户产生愉悦的情绪,树木创造安静私密的林下空间和远离城市喧嚣的感受[26,28],历史遗迹、神话传说、名人故居等人文景观有利于传播地域文化,建立认同感和归属感[29];公园规模和地形起伏则影响用户的访问决策和游览舒适度[30],在地形起伏较大的重庆,此类要素积极感知倾向不高;休息设施、娱乐设施、照明设施等是使用公园的支持系统,其完善程度和保养维护构成了用户对公园管理运营情况的判断,拥有良好照明条件、设备齐全的公园更受青睐,维护不佳则容易引起消极感知,此类要素是消极感知的重要来源之一[31-32]。
3.1.2 不同类型公园感知特征
对每条完整评论的感知倾向得分进行统计,并按公园类型归类,发现综合类的公园感知更积极,而儿童类公园最低。排序为综合公园>游园>纪念性公园>生态公园>体育公园>地质公园>儿童公园(图7)。总体来说,单一功能的公园表现较差,在感知表现上不如综合公园。对各要素感知倾向分析发现(图8),纪念性公园在公园环境要素上表现略差,主要因为绿化覆盖率不高,因此导致缺少遮荫树木,导致日晒,降低使用体验;生态公园在设施要素上积极程度较低,因为生态公园主要是森林公园和湿地公园,设施布局、数量和维护上欠佳;体育公园因为设施陈旧和收费导致体验较差;地质公园和儿童公园因为设施陈旧、餐饮和门票费用高等诸多原因导致评价较差。
图7 不同类型公园综合感知倾向Fig.7 comprehensive perception tendency of different types of parks
图8 不同类型公园要素感知倾向Fig.8 perception tendency of elements in different types of parks
各类型公园的感知频率也有其感知特色(图9、表5)。其中儿童公园最容易感知的是设施要素,是因为儿童来公园游玩主要使用旋转木马、小火车等娱乐设施,因此关注度最高;体育公园的设施感知频率也较高,同样是因为访问目的主要是使用运动器材锻炼身体,对设施的依赖性较大[33];其他公园最容易感知到的是景观要素,因为景观和良好的生态环境是吸引访客前来的重要原因[27]。感知倾向分析中,应当重视最不积极的要素,因为这类要素往往是造成用户不满的原因。七类公园显示出了某些共性,设施要素和规模地形要素最消极,显示重庆公园建设中存在共同的短板:地形因素容易导致疲劳和行走障碍,设施陈旧缺乏维护也较为常见。
表5 不同类型公园感知特征Tab.5 perception characteristics of different types of parks
图9 不同类型公园要素感知频率Fig.9 perception frequency of elements in different types of parks
3.2 关键感知要素提取
通过SPSS相关性分析发现并不是要素感知频率越高,感知倾向就愈发极化,共存在正相关、负相关、不相关三种情况。正如前文所述,并非所有感知要素都十分关键。随感知频率增加而导致感知倾向快速变化的要素,能大幅影响使用者的总体感知水平,是公园建设运营中应当重点关注的对象。而感知频率与感知倾向相关性不强的要素,仍需根据具体情况做进一步分析讨论。相关性分析结果如下表所示(表6),同时绘制各要素感知频率平均值、感知倾向平均值以及对应相关性系数图,以对各感知要素作简要对比(图10)。
表6 要素感知频率与感知倾向相关性Tab.6 correlation between the frequency of factor and perception tendency
正相关。随着关注度的增加,感知倾向越来越积极,主要包括感知自然景观、绿化覆盖率和公园规模和声音气味四种。这类感知要素容易给用户留下良好的印象,在所有样本数据中感知倾向十分积极(图10),是促进正向体验的重要着力点。如前文所述,自然景观往往能带给用户良好的视觉体验,自然景观越吸引人,则感知越积极[34-35],因此提升自然景观设计精美程度是促进积极感知的有效途径;从绿化覆盖角度来看,公园最常见的就是花草绿植,容易引起用户的重视,可以通过在主要游览路线或公园地形制高点增加绿视率来增强正向感受[36];公园规模感知频率与积极感知有弱正相关,通过设计手段,使小公园在视觉效果上变大,有助于提升积极感知;声音气味主要指鸟鸣和花香,清脆的鸟鸣让人感觉到悦耳[37],可以悬挂木制鸟巢,吸引小鸟筑巢繁育,增加鸟类数量和种类。桂花、栀子花最为常见,但花期不长,适当增加香味花卉种类以延长赏花时间,进而改善游园氛围[4,38]。
负相关。随着关注度的增加,感知倾向越来越消极,包括公园服务设施和地形起伏,二者虽在总体样本中表现积极感知倾向,但和强正相关要素存在显著差距(图10),是公园补齐短板的关键。对设施良好、起伏较小的公园,使用者一般会给予积极的评价,但容易被忽视[39]。如地形起伏要素,大学城中央公园、动步公园、渝高公园等地势平坦的公园,相关词频均为0,关注度极低;高低起伏比较适度时,关注度较低,但会带来视觉上的美感,以及步行体验上的新奇感觉,如嘉陵公园(感知频率0.006,感知倾向0.99)、沙坪公园(感知频率0.008,感知倾向0.94)。而当设施数量不足、陈旧甚至出现安全隐患,或地形陡峭、坡坎较多时,使用者的关注度快速上升,不安全感和疲惫感极易诱发负面评价[39-40]。如当地形起伏极大,壹华里夜景公园(感知频率0.41,感知倾向0.53),则会因为体力耗损过快而导致游玩体验大打折扣。针对上述问题,提高停车设施、娱乐设施以及餐饮设施的完善程度和安全保障,及时维护和更新[41];同时对需要爬坡和梯坎较多的公园,合理规划游览路线、增加休息设施可以改善感知印象。
图10 关键要素感知频率平均值、感知倾向平均值及对应相关性系数Fig.10 average perception frequency and perception tendency of key elements and their correlation coefficient
4 讨论与展望
在相关研究的基础上,本文在通过百度深度学习建立感知要素和感知倾向对应关系,分析感知频率与感知倾向变化的相关性,挖掘影响总体感知的关键要素。从分析方法和思路上做出一定改进,但仍然在要素的适用性和全面性以及细分程度上存在缺憾,期望后续研究能加以弥补,运用新技术手段或改进研究方法进一步完善研究结论。
从研究方法来看,本文提取感知要素关键词时采取Excel搜索的方法,虽保证了精准度,但工作量较大,效率不高。而当前以谷歌、百度为代表的互联网巨头在深度学习领域仍处于发展阶段,关键词提取和文本情感分析都有较大的完善空间。尤其是针对不同领域算法和基础语料库的完善,将大大提高结果的精度和分析的效率,研究结论对实践的指导将更具有针对性。
从要素的适用性来看,本文以重庆主城中心区的36个公园作为研究对象,研究对象数量足够多,对公园类型、感知要素也尽可能做到细分。提取的10个影响要素中,景观类型、公园环境等要素对几乎所有公园具有普适性。然而,公园仍有其强烈的地域和文化环境特征,如地形起伏这一要素对地势平缓的公园并不适用,对公园整体感知的影响可能远不如山地城市公园这样强烈。在后续研究中,根据实际情况,可适当增删个别要素。
从要素全面性来看,影响感知的要素也远不仅限于公园内部。已有研究表明,老年人和低收入者对公园的需求更为强烈[42],而女性对空间私密性和安全性更加敏感[43];甚至公园与住所的邻近度、选择的交通方式、交通通达程度等都影响对公园的评价和好感度。另外自然山川、两江交汇以及鳞次栉比的高楼形成的壮丽城市景观也会影响人群在临江公园与地形制高点公园的使用感知。因此,在针对个体公园分析时,应该增加使用者、通达方式、城市环境等考量因素。尽可能全面把握和分析公园感知,并更有针对性地提升某些群体的使用感受。
从研究的精细度来看,要素细分程度可进一步提升。对于同一公园,其公园环境安静还是喧闹会因内部人群活动(广场舞、乐器弹奏)、人流量以及外部交通噪声等因素共同作用形成,这些因素相对稳定,一般不会发生周期性变化,带给使用者的感知影响较为一致,可以直接根据相关性分析结果得出其是关键感知要素的结论。而对于感知周期性变化的要素,如不同季节,冷暖形成相反的感知结果,对感知频率没有影响,但对总体感知倾向不可避免形成一种“中和效应”,即由“极化”趋向“中性”。进一步分析要素感知频率与感知倾向的相关性则可能会弱相关,造成关键感知要素的提取遗漏,这也是本文不足之处。鉴于重庆夏季闷热多雨、冬季寒冷潮湿,而春秋两季气候较为宜人,可在后续研究中将气候进一步细分为冬夏、春秋两个细分要素展开分析,将会提升研究精细度和规划实践适用度[44-45]。
5 总结
本文针对重庆市7种类型共36个公园的大众点评公园评论,共提取10种感知要素,并通过百度深度学习模块进行文本情感分析,统计其感知倾向。结果表明,公园景观和环境要素最容易被感知,基础设施类要素则通常被忽视;环境类要素通常给使用者带来最积极的体验,其次是景观要素,规模地形和设施类要素则容易引发消极感知。此外,本文分析了不同类型公园的感知特征,发现引发关注的要素存在差异,如在体育公园容易感知到设施要素,而在其他类型公园对设施的关注通常较低。另外,在景观良好和功能综合的公园里,用户更容易获得积极感知,功能单一的公园则表现较差。同时,7类公园存在设施缺乏更新维护和地形起伏较大的共同短板。在此基础上,通过分析要素感知频率与感知倾向的相关性,提取自然景观、绿化覆盖、公园规模、声音气味、服务设施、地形起伏共6种影响用户体验感知的关键要素。如容易引发关注的绿化覆盖等感知要素通常促进积极感知,而公园服务设施等要素容易引发负面评价。
总体上,本研究对于全面而真实地测度和评估公园感知具有积极意义,将用户的体验与公园规划管理的景观建设、基础设施维护等具体实践相结合,针对性地改善使用效果,希望能有效提高用户满意度和人居幸福指数。
图表来源:
图1-3、6-10:作者绘制
图4:鹅岭公园. 大众点评网站[EB/OL]. [2022-05-22]. https://www.dianping.com/shop/H8pcvRT7ES2jhMZd.
图4 大众点评用户评论示例Fig.4 example of comments from Dianping
图5:情感倾向分析定制. 百度智能云[EB/OL]. [2022-05-22]. https://console.bce.baidu.com/ai/?_=1660911520619&fromai=1/ai/nlp/overview/index.
表1-2、4-6:作者绘制
表3:情感倾向分析. 百度AI开放平台[EB/OL]. [2022-05-22]. https://ai.baidu.com/ai-doc/NLP/ zk6z52hds.