声景数字化发展与公园场景应用的技术路径初探
2022-05-21沈金辉许晓青周淑均
沈金辉 王 瑾 许晓青* 周淑均 刘 芳
(1.伦敦大学学院巴特莱特建筑学院,伦敦 WC1E6BT;2.同济大学建筑与城市规划学院,上海 200092;3.上海建科工程咨询有限公司,上海 200032)
人类生活空间的声环境正随着社会发展产生很大变化,影响了人们的生活健康。声景作为探索人对声音感知的学科正在快速发展,并为改善声环境作出贡献,对当代城市发展和生态保护具有积极作用。为了对声环境进行调查和优化,需要必要的技术手段来处理大量数据。目前数字化技术的发展为声景研究提供了新视角和要求。数字技术可以提升声景研究效率和精确性,并形成更直观的表示法对声景中的舒适度感知指标进行可视化。本研究综述了国内外数字化技术在声景领域应用的4个方面,包括声音采集和再现、声音处理和分析、声场模拟和评估、声景感知的可视化。重点综述了重要支撑性技术、处理原理以及评价等方面。以公园的声景感知地图为例,详细阐述了声景地图的技术路径及其相关的可视化和智慧调控,同时也讨论了有待进一步优化的声景感知地图计算模块。其中舒适度预测模型可在小型公园的局部环境中根据实际情况更新与模型调整,从而提高舒适度模拟的精确度,并随着采集技术和模拟技术的发展,舒适度模拟模型也将进一步迭代。此外,也可根据舒适度和声级地图,设置感控调节模块,真正实现智慧公园的及时性、可视化、人性化。基于此,对数字化技术在声景领域的应用作出了若干总结和探讨,如各项技术仍需完善方面,如何面对未来技术、气候和生活方式改变等,以期为未来声景研究提供参考信息和新的视角。
声景;声景感知;数字化;声景地图;建成环境
随着交通方式和工业生产的发展,人类生活空间的声环境产生了很大变化。日渐严重的噪声污染,正在潜移默化地损害人类的健康。声景(Soundscape)一词,最初由地理学家Granoe提出,并于1929年出现于《纯粹地理》中[1]。20世纪60年代末,音乐作曲家Schafer将声景这个概念传播到了整个欧洲,从而使声景成为了一个新的研究领域[2-3]。并且,Schafer通过在世界声景项目中记录欧洲一些村庄的声音变化,将声景研究拓展到了生态保护领域[4-5]。声景被定义为一个或多个人在特定语境中对声学环境的感知、体验或理解[6],并非像传统的声学那样强调对声环境物理性质的研究[7],也并非像噪声研究一样,仅仅只研究对人和生物产生影响的声源及其解决措施,而是一门依托于科学、社会学和艺术学三者交叉的学科。声景的研究包括在声学和心理声学领域中探索声音的物理特性,以及人脑对声音的反应机制;从社会学角度入手探索人类如何处理声音以及声音如何影响人类行为;从艺术尤其是音乐角度了解人类如何为向往的生活创造理想的声音环境[2]。
在当今城市中,噪声控制技术的发展无法抵消噪声源的持续增加,这也使得人们对舒适声环境的需求不断增加[3]。因此,需要一种新的方法来评估声环境质量,把声音视为一种资源加以保护,在降噪的同时寻找并保护有利于整体声环境的声源,而不是将声音视为一种废物,以声压级来评价声音是否为噪声[8]。同时声景也对健康、文化和经济三方面有很大的影响,如提供支持性社区声环境,促进参与健康活动,丰富自然人文景观的文化属性,以及通过提供健康和文化价值间接提高地区经济价值,降低反社会行为的成本和不必要的降噪行为。
近年来随着声景研究逐渐受到国内外重视,声环境质量的研究方法正在逐渐丰富。而数字化技术在声景研究和实践中扮演着越来越重要的角色,多种算法和数据处理技术应运而生,提高了声音收集的效率和精确性,优化了声景的分析计算能力,形成了学科交叉视角下新的分析方法,并不断激发出声景研究领域的新视角[8]。国外对声景数字化的研究早于国内。如在2009年,Yu和Kang[9]就已利用人工神经网络(ANN)处理主观评价数据,并预测生成测试地点的声景舒适度评估图。国内李春明和张会[10]在2017年借助移动设备开发了参与式声景数据收集程序。本研究通过对现有声景数字化技术应用的分析,讨论其如何在声景研究中发挥作用,从声音采集和再现、声音处理与分析、声场模拟和评估以及声景感知的可视化4个部分综述了数字化技术在声景领域的应用,并以城市文化公园声景地图为例对声景地图技术进行了深入分析。
1 声景数字化的相关技术发展
1.1 声音采集和再现
随着声景研究近年来的快速发展,对声音采集和再现的效率及精确性要求越来越高,而录音、互联网和虚拟现实技术的完善对声景研究各方面都有明显的提升。在生物声音收集工作中,大量的专业录音设备和分析系统涌现出来,可针对不同的野外环境进行声音采集和深入研究分析,同时也出现了专注于超声波探测和记录的专业仪器,可以采集蝙蝠等生物的特殊频率声音。此外,为应对野外环境的长期声学监测,自动记录系统的出现有效减少了研究者在野外的工作时间,并避免了人类观察所带来的影响[11]。在现如今互联网快速发展的背景下,网络用户也在为互联网不断地提供大量数据。目前智能手机中的GPS传感器和麦克风都可作为数据收集的硬件基础,因此,可参与式声景采集也逐渐成为一种可能性。Hara等[12]开发除了利用智能设备收集声音的安卓应用程序外,还对14名参与者进行了声音收集实验。手机设备可通过GPS、基站或Wi-Fi网络获得高精准的位置信息,参与者通过手机操作对行走过程中遇到的声音进行录制、分类和注释,最终可将收集到的声音以图标的方式按类型在地图上进行可视化。由于声景研究关注个人或群体在环境或语境中的感知[8],而视觉环境信息的缺乏会对声景研究造成一定影响。因此,越来越多的虚拟现实技术被应用于声景研究中,360度的相机和环绕声录音的搭配能够实现具有极强互动感和沉浸感的视听体验,非常适合对还原真实性和体验感有较高要求的声景研究[13]。欧洲研究委员会所资助的声景指数(SSID)项目正在采用360度视频和一阶或高阶环绕声的同步记录方式对欧洲城市声景环境数据进行收集。这种虚拟现实的技术可帮助研究人员更真实地记录空间的原始环境并进行重现和声环境评估,尤其对于一些无法进行问卷调查的环境[14]。相对于现场环境评估,虚拟环境虽然没有绝对地还原真实,但也避免了现场评估中的一些不可控因素,如温度、湿度、日光等[13]。
1.2 声音处理与分析
声景研究时常需要对声音数据库进行分析,深度学习和地理信息系统逐渐分别被应用到对声音数据的分析处理中。在研究城市生态声环境的过程中,由于城市环境的复杂性,生物声音的录音会受到非生物声音的影响,目前将机器学习应用于生物多样性监测的研究越来越多[14]。Fairbrass等[15]基于卷积神经网络(CNN)的深度学习系统开发了Citynet,可测量城市中的生物声音和人类活动声音,其训练的模型可识别基于多个声学特征的生物声音,精度高于现有最先进的鸟鸣声检测软件Bulbul,并有希望将这个系统集成到物联网,形成更大规模的城市环境评估系统。同时Aodha等[16]还开发了一种同样基于卷积神经网络的蝙蝠声学信号检测软件,其在搜索阶段的回声定位调用功能的性能优于现有其他算法。这些研究在一定程度上都表明了深度学习对处理声音数据的精确性和应用前景。为对城市声环境进行进一步的分析研究,将声音数据制作成声景图是非常有效的一种方式。Liu等[17]在对多城市地区的声景时空变化研究中使用了Grass软件生成声景图,其优势是将不同声源在空间上的相互影响可视化,并以此法证实了景观指数和声景要素之间的密切关系,其中归一化植被指数(NDVI)和景观形状指数(LSI)是最重要的两个因素,也证实了声景制图技术是研究城市声景生态学的有效工具。康健等[18]采用基于GIS的普通kriging插值法(Spherical Semivariogram)生成了与感知属性相关的城市声景图,其交叉验证的误差接近于0,这也进一步表明了声景制图技术的精确性。
1.3 声场模拟和评估
大量的数字化程序和算法被应用于声景模拟和评估中,并拓展出新的研究方法。Hao等[19]选取荷兰阿森地区的12个地点并基于噪声映射技术进行鸟鸣声的空间声级分布模拟,然后使用空间声级矩阵的Matlab程序进行计算,再使用Depthmap程序根据空间句法理论对建筑和城市系统进行可视性分析,其结果验证了城市形态参数,例如绿地周长和建筑平面面积分数(Building Plan Area Fraction)是优化鸟鸣声和视觉环境的有效措施。康健[20]在研究被建筑包围的广场声环境特征时,开发了辐射度模型和图像源模型进行模拟,证明了广场的空间参数对其声环境的具体影响。而Yu等[9]基于人工神经网络(ANN)预测潜在人群对城市开放空间声景观质量评价的计算机模型,生成了声级评估图和声学舒适度评估图。虽人工神经网络模型的有效性已被证实,但由于城市开放空间复杂的物理和社会环境,很难建立一个适用于所有案例的通用模型,仍需建立更复杂的模型来进一步改进。
1.4 声景感知的可视化
在声景研究中,人对声环境的感知和理解是非常重要的一部分。主观评价法是常用的手法之一,可以用问卷的方式获取人们对声环境的感知评价。为了更清晰地了解分析人们对整体区域的感知情况,需将人们的感知评价进行可视化,形成一个以用户为中心的声环境监测和管理声景图模型,这有利于智慧城市的形成,不断提升市民的参与感[18]。康健等[18]构建了智慧城市声景图模型,将问卷调查的数据进行基于GIS的可视化处理,生成了6种情绪的声音感知地图,包括愉悦、平静、动荡、烦恼、混乱和单调。此外,Aiello等[21]建立的基于社交媒体数据所生成的声景感知评价地图,则提供了一种廉价的大规模城市声音追踪的方式,研究收集整理了关于声音和情绪的两组词语库,并将其作为搜索词在Flicker网站上分别搜索关于声音和情绪的图像标签,获取图像所在地理位置,通过比较图像的地点得出推论:有音乐声的街道与强烈的喜悦悲伤情绪紧密相关,而有人声的街道与平常的喜悦和惊喜联系到一起,而恐惧和愤怒经常出现在有机械声的街道上。
2 公园声景地图数字化应用
随着城市环境中噪音对人类健康和社会福祉的负面影响加剧[22-24],公园已被视为健康及可持续城市的基本要素。公园作为城市绿色基础设施,是人们日常休闲娱乐、户外游憩的重要载体,对生态环境和社会利益发挥着重要作用[25-26]。特别是在当前全球疫情防控的大环境下,人们对于在公园中娱乐交流、舒缓压力、疗愈身心的需求日益增加。因此城市公园对疫情防控和维持公众身心健康具有积极意义[27]。此外,良好的视觉环境和声音环境能共同提升公园的舒适度[28]。因此,人们对声环境的感知成为公园规划设计的重要因素。
声景地图不仅能够全面有效地描述城市公园的声景,还可以作为分析公园声景的有效方法,为城市公园声景的记录和治理提供新的途径。国外许多公园已经开始进行声景监测和声音数据库的建立等[29],声景地图也被作为引导公园游园的重要工具,但其数字化呈现和智慧调控依然有一定的缺陷。基于此,以虚拟数据进行模型模拟,探讨声景数字化手段如何辅助公园感知认知和评价。
2.1 声景地图应用于公园
公园声景舒适感知的研究,主要包括声级测量、计算与存储,声景感知地图、声级感知地图空间插值计算等,上述模块均进行了数字化的研发,并将其与公园的数据底座系统连接。通过对声音环境信息的采集、多源数据的处理生成噪声图。基于前序研究,在预测模型的基础上[30],将声景感知地图和声景地图部分,重点纳入人流密度、建筑平均高度和NDVI三个指数。声环境数据采集、声景地图依托游客手持电子设备及游园APP搭载;相关计算、存储、空间插值等内容依托数据底座。声景地图以可视化的方式呈现,实现一小时更新,从而及时有效引导游客游园。鼓励人们作为声景资源的一部分参与其中,成为实现声景科普教育的有效途径。同时公园可依据动态模型,对声景感知进行优化和调控,作为公园实现智慧监管的有效手段。
2.2 声景数字化主要功能及相关技术
公园声景地图数字化调控主要通过声景地图可视化和智慧调控实现。声景地图可视化是将声级大小、舒适度进行采集、计算,并叠加地理信息地图,以可视化的方式呈现;在对公园声音、舒适度监测的同时,利用声光装置(灯光、声掩蔽)等景观手段调节声音环境和舒适度感知。其中,实现其主要功能的声景感知计算模块主要包括声级采集及计算、舒适度计算、空间插值计算三个方面。技术难点在于连续等效A声级的计算、依据客观数据对人类舒适度感知的拟合、空间插值函数的选取。此文化公园声景地图的技术路径(图1)分为三个部分。
图1 应用所在文化公园声景地图技术路径Fig.1 The technical path of the soundscape map of the cultural park where the application is located
2.2.1 声级采集及计算——利用音频文件计算声压级
首先,通过监控设备或移动端采集音频文件,同时附上坐标、时间、wav格式音频文件,形成表格。其次,针对采集的公园绿地噪声信号,对其进行时域和频域分析,以图形直观展示声压信号的波动情况,得出公园绿地噪声信号各频率成分及频率分布情况。对数据进行处理,探讨一种频域A计权、计算瞬时A声级、求解公园绿地噪声信号连续等效A计权声压级的算法,并基于python软件平台对噪声信号进行时域分析、频谱分析、等效连续A计权声压级分析的仿真实现[31],计算过程如图2。最后将计算结果输出为excel表格(.csv),增加“声级(dB(A))”字段。
图2 等效连续A声级计算流程图Fig.2 Flow chart of equivalent continuous A sound level calculation
2.2.2 声音处理与分析——利用景观指标计算舒适度
基于前序研究基础[30],通过典型相关分析,筛选影响公园声景感知的景观特征指标,得到声级与景观特征主观舒适度模型公式(1):
其中,p为人口密度(人/km2),H为区域内的建筑平均高度(m),LURg为绿地(m2)利用占比。
采集典型区域内(200 m×200 m)动态数据(声音采集WAV(统一点位))、人群密度和静态数据(建筑平均高度、植被健康指数NDVI),然后形成坐标、时间、声级(dB(A))、人群密度(人/km2)、建筑高度(m)、植被覆盖率信息表格,最后进行数据计算,根据预测模型计算舒适度,输出坐标、时间、舒适度信息表格。
2.2.3 声景感知的可视化——空间插值形成感知地图
在多种空间插值函数中选取普通克里金算法(Kriging),模拟ArcGIS空间插值功能。克里金是依据协方差函数对随机过程或随机场进行空间建模和预测(插值)的回归算法。空间插值算法根据采集处理后的点计算整个公园区域连续的值。由第一步声音采集及计算和第二步景观指标计算舒适度所得的表格数据,预测区域内的声级值(图3)、舒适度值(图4),并将输出结果分级,以Imshow函数输出示意图。
图3 声级地图Fig.3 Sound level map
图4 舒适度地图Fig.4 Comfort level map
3 讨论与建议
基于上述综述与典型研究案例可知,数字化技术已逐渐成为声景研究中不可或缺的有效手段。录音、互联网和虚拟现实等技术的出现和更新确保了数据采集的准确性、高效性和全面性。卷积神经网络、Grass GIS等算法为声音识别和可视化提供了新方法,提高了声音识别和分类的准确性,将多种庞大的数据浓缩于声景图中,方便研究者进行分析和处理。同时,各类声环境模拟的算法使得研究者可以仅通过计算机模拟的方式对声环境和城市空间的关系进行研究。应用最前沿的技术对声音舒适度评估进行探索,如利用人工神经网络对问卷调查的数据进行研究,从而建立可以预测地区声音舒适度的模型。另外,关于声景感知可视化的研究也在逐步进行中,有利于促进智慧城市的以人为本。
在面向公园的研究中,声景感知地图计算模块还需要在园区中选取适当的位置进行更为真实和贴切的模拟计算。其中舒适度预测模型可选取小型公园进行更加深入的研究,结合公园实际情况进行更新与调整,以达到更加准确的舒适度模拟。随着采集技术、模拟技术的发展,舒适度模拟将会是一个更新迭代的过程。未来对感控功能的研发与拓展,可根据舒适度和声级地图,设置感控调节模块(如声光联控),真正实现智慧公园的及时性、可视化、数字化和人性化。
虽然目前的数字化技术已经逐步应用到声景研究中并取得了不错的效果,但如何更广泛地、准确地将这些技术应用到研究中还在不断探索中。例如利用互联网收集数据的音频质量参差不齐和收集规则的不完善[12],虚拟现实仍无法彻底还原真实世界的其他环境变量[13],神经网络训练的模型只适合应用于特定场地[9],以及城市声景感知可视化仍无法做到对城市进行实时监测[18]。未来新工业革命、气候变化和生活方式的改变,都会给声景的研究发展带来挑战[8],如智慧城市的发展、城市传感器的普及,让声音场景的实时智能调控成为可能[18];气候变化给环境带来一系列变化,甚至改变生物多样性、城市形态和文化,这些都会影响声源、声音传播和声音偏好[8];疫情推进了居家办公的工作方式,使得建立室内声景评估体系的需求不断增长[32]。因此,未来声景研究所面临的不仅是完善目前的声景数据收集、处理、评估和可视化,还面临着未知挑战。
注:文中图片均由作者绘制。