信息流介入公共空间活力营造
——基于城市公园的大数据循证分析
2023-08-01魏迪陆毅汪原胡兴
魏迪 陆毅 汪原* 胡兴
城市公共空间承担着市民们的日常活动,为城市中不同层次社会关系提供交往与融合的平台,容纳丰富多元的城市生活,是城市品质的重要体现[1]。
在现代城市发展新格局下,大量城市更新与再开发规划设计已着眼于营造空间活力,且提升公共空间活力已成为建设人本城市的关键目标之一[2]。公共空间(如公园、广场)为市民提供多种积极社会效益,如缓解压力、促进身体活动与社会交往等[3]。因此,厘清高活力公共空间的形成原因与演变机制,有助于政策制定与设计决议以营造空间活力,进而建立良好的公共健康福祉。近年来,若干定性与定量研究已聚焦公共空间活力营造,公共空间及其周边多类建成环境与社会因素,包括区位特征、可达性、公共空间特征,已被证实显著影响空间活力[2]。
依托于城市基础设施与信息通信技术,人类开始步入以信息为主导的社会阶段,时空关系发生了新转向。在移动式的地理媒介(geomedia)①及其信息网络支持下,城市已被塑造为媒介内容与网络连接“无处不在、无时不在”的媒介空间,并使信息流(information flows)成为城市日常生活中的重要组成部分[4]。信息流指基于当代信息通信技术与基础设施,通过地理媒介发布与阅览的数字信息[4-5]。个体会在当代日常行为中留下多类信息流(如评论、照片、定位),反过来这些信息流也会对集体行为产生进一步的影响[6-7]。
然而,鲜有研究聚焦信息流对公共空间活力的影响。在移动互联网时代,与日常生活紧密相伴的信息流,可能导致建构空间边界的传统结构(如建筑、街道、植被)对当代城市活力与社会交往的影响日渐式微,而由信息流带来的去中心化、分散反复且跨越时间空间的传播模式,将无形地重塑公共空间活力营造的整体过程[4,7]。
在此背景下,本研究尝试将信息流视为显著影响城市公共空间活力、但尚未被讨论的重要因素,聚焦信息流对公共空间活力的影响,并讨论一个重要的学科问题:在移动互联网时代,信息流如何介入、影响,抑或重塑当代公共空间活力的形成机制?
1 研究进展
1.1 影响公共空间活力的既有因素:区位特征、可达性、公共空间特征
区位特征包括混合功能与密度、人口密度与社会经济地位[2,8-10]。区位中良好的功能混合(如土地利用熵)为市民提供多种功能服务,具有高活动潜力[2,11-12];较高居住人口密度具有营造高活力空间的天然优势[12-13];周边适宜的高密度(如建筑密度、建筑高度、功能密度等)与高社会经济地位的区位具有更高的吸引力,可以促进公共空间活力营造[14]。
可达性一般采用交通基础设施与拓扑空间结构测度:交通基础设施通常由道路密度、公共交通站点密度、交通服务设施密度(如停车场等)量化[12];拓扑空间结构通常由基于拓扑与图论法的空间接近度(closeness)、中间度(betweenness)量化,用于测度潜在可达性[15]。此外,公制的接近度(如距离市中心的距离)也通常被视为影响可达性的要素之一[15]。
公共空间特征包括空间尺度、设施配置与景观绿化。空间尺度(如面积、形态与界面等)作用于场所认知,影响空间活力[2,16];良好的设施配置(如公厕、服务中心等)影响市民出行意愿与停留时长[14];丰富的景观绿化(如植被、水体)具有提升访客心理健康[2,17]、提供空间围合或遮挡以及改善空间热舒适的潜力[2,12-13],对公共空间的活力营造有促进作用。
1.2 影响公共空间活力的潜在因素:信息流
移动互联网时代的信息流,已成为城市日常生活中重要的组成部分[4]。其中,基于Web 2.0 模式的用户生成内容(user generated content, UGC)②是当代城市居民日常生活密切相关的信息流。截至2022 年,全国有超过10.2 亿用户在各社交媒体上日常阅览、创造与分享UGC[18]。去中心化的传播模式令UGC 成为传播电子口碑的有效途径,其各项属性包括评分、情绪值和曝光度,已被证实对行为决策有显著影响[6,19]。
近年来移动互联网时代的城市空间逐渐引起学者关注,相关研究聚焦于区域尺度的空间效应、城市尺度的空间特征以及城市新空间的形成机制。例如,方鹏飞等[20]基于UGC 数据探索城市网络营销的空间效应对城市等级体系的影响;项婧怡等[21]使用UGC 数据测量城市内“网红空间”的空间分布特征;罗震东等[22]以外卖工厂为例讨论新城市空间的演变机制。然而,鲜有研究关注移动互联网时代的城市公共空间。
因此,本研究聚焦信息流与城市公共空间,在控制关键变量后,定量揭示信息流对城市公共空间活力的效应,并剖析移动互联网时代公共空间活力营造的内在规律与机制。
2 研究方法
2.1 研究对象选取
城市公园是城市公共空间的一种重要类型,是集聚活力、促进社区联系、提供自然环境和文化娱乐等方面的重要场所[3]。因此,本研究以城市公园及其相关UGC 作为研究对象,选择深圳市共125 个对公众开放超过一年的公园作为样本公园,样本公园分布在深圳市城市边界内,涵盖多种公园类型,总面积约200.59 km2(图1)。公园的矢量边界由百度地图应用程序接口(application programming interface, API)获得,并用高德地图卫片进行二次校准。
1 样本公园的空间分布Spatial distribution of sample parks
2.2 数据获取与变量计算
2.2.1 城市公园活力值变量
既有多个城市研究已验证百度基于位置的服务(location-based service, LBS)数据可准确描述空间活力,并在近年来广泛应用于相关研究中[2,12,23-24]。因此,本研究采用百度LBS 热力图栅格数据测度样本公园内人群活动的时空特征。参考既有研究实验设计[2,12,23-24],数据收集时间为2021 年11 月27 日—30 日(周六至周二),该时间段内全市气候适宜,无雨,且无新冠肺炎病毒相关的出行管控政策。在调研时间段内,每天的07:00—21:00 每隔2 h 使用百度地图API 收集一次样本公园内的LBS 栅格数据(空间分辨率为1 m × 1 m)。参考既有研究[12,23-24],在使用样本公园边界裁剪LBS 栅格数据后,采用ArcGIS Pro 2.8.1 软件的栅格计算器计算公园内每个LBS 像元③的数值,以代表每个像元内的相对活动人数。本研究以4 天共32 个时段内各公园LBS数据的平均值作为城市公园活力变量(因变量)。
2.2.2 UGC 变量
本研究以5 个中国主流社交媒体平台(新浪微博、大众点评、携程、快手、抖音)上与公园相关的UGC 作为信息流样本。使用Python 代码结合Scrapy 网络爬虫框架与BS4包开发了多线程爬虫,在遵守隐私与数据安全法规的前提下进行数据收集。本研究考虑了时序关系,于2021 年11 月13 日—26 日(即公园活力数据收集前2 周)进行UGC 数据收集。
上述UGC 可分为地理位置与非地理位置2 类。新浪微博、大众点评与携程的地理位置UGC 包含用户主动上传的签到位置与目的地页面,用户可直接点击位置链接或目的地页面阅览地理位置UGC,故笔者爬取了125 个样本公园呈现在社交媒体页面上的所有地理位置UGC。此外,本研究也收集了新浪微博、快手与抖音上的非地理位置UGC,这些UGC 一般仅包含公园关键词,用户需要通过关键词搜索或应用程序推送来阅览UGC,故笔者将城市名与公园名作为关键词,爬取了所有呈现在社交媒体平台的非地理位置UGC。
综上,本研究共收集了316 929 条与样本公园相关的UGC,可分为3 组地理位置UGC与3 组非地理位置UGC,并按照下述操作对数据进行筛选:1)考虑到关键词搜索的模糊搜索机制,按照城市名与公园名对非地理位置UGC 进行二次筛选;2)基于Python 代码批量剔除仅包含标点符号、网页地址(URL)、数字、表情符号和非中文的UGC;3)批量剔除剩余UGC 内的URL、表情符号和非中文符号;4)批量剔除少于2 个字的UGC,因为较少字数容易误判情感倾向;5)人工剔除与公园不相关的UGC。最终,共剩余155 463 条UGC 作为本研究的样本UGC。
鉴于每条UGC 元数据记录了多项信息,故本研究使用UGC 元数据批量计算了各公园在不同社交媒体平台的UGC 评分、情绪值与曝光度。公园所有UGC 评分的平均值作为UGC 评分变量(仅大众点评与携程的UGC携带评分)。UGC 的潜在情绪值采用百度提供的基于自然语言处理的预训练情绪分析模型(ai.baidu.com/easydl/nlp)来评估,该模型近年来被多次用于批量评估中国社交媒体UGC 文本的情绪值,既有研究已证实其准确度[25-26]。每条UGC 文本的情绪值范围为0~2.00,分别代表极端消极与极端积极情绪,本研究以公园所有UGC 文本情绪值的平均值作为UGC 情绪值变量。UGC 的曝光度通常由阅览量量化,但并非所有UGC 提供阅览量数据。鉴于用户通常阅读UGC 后才进行评论,在检验了UGC 阅览量和评论数的高相关性后,使用评论数来估计曝光度,并以公园所有UGC 评论数的平均值作为UGC 曝光度变量。
2.2.3 控制变量
多组变量需要被控制以检验UGC 对公共空间活力的效应。控制变量包括区位特征、可达性、公共空间特征,并采用Python 代码、ArcGIS Pro 软件、Google Earth Engine 平台与sDNA 空间句法模型进行计算(表1)。
表1 控制变量的筛选与计算Tab.1 Selection and calculation of control variables
2.3 回归模型建构
本研究使用R(v4.0.3)软件进行模型建构。采用分层线性回归模型,在控制关键变量后,量化UGC 对公共空间活力的标准化效应。模型建构前进行了多重共线性检验,所有变量的方差膨胀系数(variance inflation factor, VIF)均小于5。为细致探寻不同UGC的属性对空间活力的效应差异,本研究共建构4 个模型。模型1 仅包括既有影响公共空间活力的控制变量;模型2~模型4 则分别加入UGC 的评分、情绪值与曝光度变量以分别检验其对公园活力的效应。据Shapiro-Wilk 检验,所有回归模型的残差均为正态分布,验证了上述模型的稳健性。
3 结果与分析
3.1 信息流与空间活力特征
各样本公园UGC 属性的箱形图表明,不同公园的UGC 评分、情绪值与曝光度有所不同(图2)。95% 样本公园UGC 的评分处于3.00~4.85 区间内,平均值为3.95,反映出使用者对公园评价总体呈现好评。UGC 的情绪值分布与评分类似,95% 的总情绪值>1.00(即为积极情绪),处于1.16~1.91 的区间内;总情绪值均值为1.70,表明访问公园的用户总体呈现较高的积极情绪。95%UGC 的平均曝光度处在0~141.0 区间内,平均值为23.3,这表明相较于评分与情绪值,不同公园间的UGC 曝光度差异更大。
2 样本公园UGC 属性的箱形图Box plots of UGC attributes of sample parks2-1 样本公园总UGC 评分Total UGC score of sample parks2-2 样本公园总UGC 情绪值Total UGC sentiment value of sample parks2-3 样本公园总UGC 曝光度Total UGC exposure of sample parks
调研时段样本公园的活力值变化数据表明,样本公园在工作日与休息日的活力值随时间变化具有差异(图3)。工作日公园活力峰值时段为09:00—13:00 与15:00—19:00。休息日公园活力峰值时段与工作日类似,但相较于工作日,休息日活力值波动幅度更大,且休息日峰值显著高于工作日峰值。
3 调研时段样本公园的活力值变化Changes in the vitality values of the sample parks during the survey period
对各公园的活力值与UGC 各属性进行空间落位,得到了各公园的活力值及其UGC 评分、情绪值、曝光度的空间分布图(图4)。深圳市各区均有高活力公园,其中,南侧(南山区、福田区、罗湖区)与西侧(宝安区)的高活力公园较多。此外,UGC 评分与情绪值呈现出类似的空间分布:高值聚集于地图南侧(南山区、福田区与罗湖区)。相较于评分与情绪值,UGC 曝光度则呈现出了不同的空间分布:高曝光度的城市公园在深圳市城区中的分布更随机。
4 样本公园的活力值与UGC 属性的空间分布Spatial distribution of the vitality values and UGC attributes of sample parks
3.2 信息流对公共空间活力的显著效应
分层线性回归模型揭示了各影响因素对公园活力的标准化效应(表2)。模型1 的调整后R2(决定系数)为0.822,其中多个区位特征、可达性与公共空间特征变量对公园活力具有显著效应。
表2 分层线形回归模型结果Tab.2 Results of multi-level linear regression model
在模型1 的基础上,模型2 加入了UGC评分变量,模型的调整后R2增加至0.875,且R2变化的方差分析结果显著(p<0.001)。结果表明,在控制其余变量后,UGC 的评分对公共空间活力具有积极且显著的效应,且各UGC 显著评分变量的标准化效应平均值在UGC 三类变量中最高,为0.181。
在模型1 的基础上,模型3 加入了UGC情绪值变量,模型的调整后R2增加至0.864,且R2变化的方差分析结果显著(p<0.001)。与UGC 评分变量类似,UGC 情绪值对公共空间同样具有显著效应,UGC 显著情绪值变量的标准化效应平均值为0.135。
然而,即使部分UGC 曝光度变量对公园活力有显著效应,模型4 的R2提升不显著(p>0.050),意味着曝光度对公园活力的促进作用可能弱于UGC 评分与情绪值变量。
此外,不同类型UGC 呈现出了显著差异(图5)。地理位置UGC 几乎所有变量均对样本公园活力具有正向的显著效应,而非地理位置UGC 变量均不具有显著效应。
5 不同类型UGC 的标准化效应Standardized effects of different types of UGC
4 讨论
4.1 公共空间活力的影响因素分析
基于分层线性回归模型,可以辨析各因素对公共空间活力的影响程度。模型1 揭示了区位特征、可达性与公共空间特征的显著效应,这与既有研究结果一致:区位中适宜的混合度与密度、良好的交通基础设施配置与空间拓扑结构以及公共空间中丰富的景观绿化与良好的服务设施,将显著提升公共空间活力[8, 12, 16]。
然而,在加入信息流变量后,模型对公共空间活力的拟合程度显著提升,且信息流的评分、情绪值与曝光度变量有显著效应,这表明信息流是除区位特征、可达性与公共空间特征外,可能影响当代公共空间活力的重要因素。
具体而言,模型2、模型3 的结果揭示了UGC 评分与情绪值的显著效应,且UGC评分效应高于情绪值。完善的城市基础设施与地理媒介令市民可以无时无刻发布与阅览UGC,使UGC 的潜在情绪值影响集体出行行为,进而使影响公共空间活力成为可能。而评分一般位于社交媒体页面上较为明显的位置,故相较于阅读UGC,评分可能更受人们青睐,因它便于人们对多个公园快速比较并做出出行决策。
模型4 中虽然有部分曝光度变量显著,但相较于模型1 整体提升不够显著。这可能是由于带消极情绪的高曝光度UGC 削弱了人们对目的地公园的出行欲望,从而降低了模型中UGC 曝光度对公园活力的效应。因此,相较于曝光度,评分与情绪值更适合作为考察信息流影响公共空间活力的变量,应受到重点关注。
此外,地理位置UGC 变量对公园活力具有显著效应,这意味着人们在做公园出行决策时,可能更受地理位置UGC 的影响。地理位置UGC 发布时一般要求在场或距离目的地一定半径内,UGC 内容也更与公共空间相关。这些内容包含空间使用者的情绪、观点与评价,并可能会进一步影响未来人们的出行决策。因此,相较于非地理位置UGC,应关注地理位置UGC 对公共空间活力带来的潜在影响。
4.2 信息流介入公共空间活力营造的机制推断
本研究以城市公园与UGC 为例,试图量化当代信息流对公共空间活力的影响,并推断信息流介入公共空间活力营造的机制。在移动互联网时代,发布、阅览信息流已成为日常生活的重要部分,并无形中影响着城市居民的行为决策[6,19]。实证结果也进一步证实本研究的假设:信息流可能已成为影响公共空间活力营造的重要因素;信息流的评分、情绪值、曝光度,均可能影响公共空间的活力营造。
用户为了分享游览公共空间的观察与情感,会发布相关的信息流(图6)。这些信息流会瞬时同步至其他用户的媒介终端,并聚合成公共空间的电子口碑[6]。通过阅览信息流,这一电子口碑可能会进一步影响其他用户的出行决策,进而形成公共空间人流与活力集聚。
6 信息流介入公共空间活力营造的机制推断Inference of the mechanism of information flow intervention in the creation of public space vitality
本研究推断信息流介入公共空间活力营造存在以下2 种机制。1)信息流影响即将出行访客的出行决策。信息流的情绪值与评分是影响电子口碑的重要变量[19]。本研究结果表明,更积极的情绪与更高的评分会为公共空间营造更好的电子口碑,反之亦然。因此,信息流的情绪值与评分会提升访客对特定公共空间的好感和访问意愿,使访客在多个公共空间中选择电子口碑更高的空间,进而形成活力聚集。2)信息流吸引额外访客前往公共空间。信息流曝光度越高,表明更多用户已阅览公共空间的信息流,并可能被该信息流所吸引。信息流曝光度变量的显著结果与既有研究一致[27],更高的信息流曝光度会影响个体行为,尤其是影响对特定目的地的出行决策。换言之,正是信息流中与公共空间相关的积极内容(如图片、文字、视频等),诱发了访客对公共空间的访问意向,进而提升公共空间活力。
5 结论与展望
本研究聚焦城市公共空间相关的信息流,以深圳市125 个城市公园及其UGC 为例,量化信息流对公共空间活力营造的影响,研究发现:1)信息流的介入对公共空间活力产生了显著的积极效应;2)相较于情绪值与曝光度,信息流的评分对公共空间活力的积极效应更强;3)几乎所有地理位置信息流均对公共空间活力有显著效应,但非地理位置信息流没有显著效应。
本研究结果证实了研究假设:相较于既有研究对公共空间中建筑物、街道、植被等静态因素的关注,当今公共空间同时被信息流这一动态流变因素影响。作为一种新技术构成的技术系统,信息流正催生出一种网络化与去中心化的社会交往关系。有必要在当代技术系统的反复迭代与动态交互中,进一步反思人、技术与城市的关系,以重新理解城市公共空间活力营造的当代性。
诚然,本研究以多源时空大数据为基础,可基于较大样本量探寻潜在的普适规律,但本研究仍存在3 点局限:1)本研究基于百度LBS 数据测度公园活力,但是该数据无法采集到公园使用者的个人数据(例如年龄、性别等),未来需要借助问卷等方式,对个体的社会人口状况、信息流与公共空间活力展开讨论,以完善信息流介入公共空间活力营造的理论建构;2)本研究仅以深圳市125 个城市公园作为研究样本,但不同城市语境下影响公共空间活力的因素可能具有差异[13],未来研究应展开多城市或多区域对比,以探寻不同语境下信息流对公共空间活力营造的效应差异。3)因横截面数据④的限制,本研究无法基于数据得出进一步的因果结论,未来应采用如自然实验等方式来验证因果关系。
注释(Notes):
① 地理媒介被描述为现代城市中与不同媒介平台的空间化过程紧密相关的新技术条件,如智能手机、智能手环、移动电脑、LED 城市屏幕等。
② 用户生成内容指互联网平台或其他开放性媒介的内容由其用户贡献生成,即用户通过平台将原创性内容展示或提供给其他用户。
③ 像元,亦称像素点或像元点,即影像单元(picture element),是组成栅格数据的最小单元。
④ 横截面数据(cross-sectional data)指通过观察样本在同一时间点或同一时间段截面上的各特征变量的观测值。
图表来源(Sources of Figures and Tables):
文中图表均由作者绘制,其中图1、4 的地图底图使用OpenStreetMap 生成。