基于深度学习的商业综合体空间超链接分析
——以三里屯太古里和北京APM 为例*
2022-02-03吴韶集胡一可
吴韶集,胡一可
引言
当前,建立具有预测能力的空间模型来辅助建筑设计的方法被广泛采用,其基础在于获取数据。空间句法理论兴起于20 世纪70~80 年代[1],国内已有大量的文献对其进行介绍[2-4]。既有研究证明,空间句法理论适用于建筑尺度,利用行人流量数据分析空间句法模型是重要的研究方法之一[5-8]。过去常采用人工计数法获得行人流量数据,不仅对人力要求高,且数据精度较低。随着新技术的出现,为解决该问题提供了新的工具。深度学习是一种特殊的机器学习算法,其通过在计算机中构建多层感知器结构实现对非线性信息的处理[9],也被视为未来技术发展的重要趋势[10]。在当前的建筑学领域,深度学习也得到了一定程度的运用[11]。本研究利用基于深度学习的计算机视觉算法解决路径实测人流量数据。其也是本文解释空间超链接现象的实测数据基础。
空间超链接是由盛强、杨滔等提出的一种解释当代都市交通系统连接机制的概念[12,13]。具体而言,通过当代交通方式的变革,越来越多非人类自然运动路径将人从一个空间直接输送到目的地,从宏观上来看,其出发点和目的地就像被链接在一起,表现为已有的功能空间分布和人流量情况的改变。利用空间句法可证明在城市尺度上存在着空间超链接的现象。在建筑尺度上,同样具有不依赖人类自然运动[14]方式的路径,如电梯、自动扶梯等,其也符合空间超链接路径的定义,其对建筑内部空间系统的影响尚未可知。随着中国经济社会的发展和消费者生活水平的提高,商业综合体的数量和规模大幅度增加[15]。对其内部空间的超链接效应进行分析有助于建筑师理解建筑中的人群分布影响因素。
本研究以三里屯太古里和北京APM 为例,探究其内部空间的空间超链接现象。本文试图解决两个问题:一为商业综合体中是否存在空间超链接现象;二为不同类型的空间超链接路径有何区别,及解释这种差异出现的原因。
1 相关研究综述
本文回顾三类既有研究:(1)回顾对于空间超链接现象的研究;(2)说明利用空间句法分析三维空间系统的可行性;(3)追溯利用深度学习算法获得实测人流量数据的方法。
当前,对空间的超链接现象的研究集中在城市领域。2012 年,Alain Chiaradia 等对伦敦地区的街道网络和地铁网络进行研究,发现将地铁系统和地面道路系统采用“一体化”建模的方法效果好于分散建模分析的方法[16]。2015 年盛强、杨滔等明确提出空间超链接这一概念[5]。当前针对空间超链接现象的分析集中于城市尺度上,建筑内部空间超链接机制对人群分布影响尚未可知。对商业综合体空间超链接机制的分析可帮助建筑师理解建筑中人群分布背后的原因。
当前大多数空间句法的实证研究局限在二维层面上。在三维层面中使用空间句法进行的研究包括两类:针对街区尺度的研究包括张灵珠和Alain Chiaradia 以香港中环地区的多层步行系统为例,证明使用完整的三维模型有助于得到更精确的选择度与城市活力区分布之间的关系[17]。Gerhard Bruyns 等以香港为例提出使用线段模型对具有高层建筑的街区来进行分析的方法[18]。针对建筑内部空间的研究有盛强等分析了王府井地区的三个建筑案例验证了空间句法对于建筑内部空间的分析能力[19]。庄宇、张灵珠等对上海3 个商业综合体使用轴线模型进行分析,并发现使用多元线性回归分析法得出的模型可更好的反映人群分布情况[20]。这些研究证明了在三维层面进行空间句法分析具有可行性。
本文使用Yolo-v3(You Only Look Once)进行行人检测,其是一种由Farhadi 和Redmon 在2018年提出的基于深度学习的目标检测算法[21]。而后使用DeepSORT(Simple Online And Realtime Tracking With A Deep Association Metric)算法执行人群追踪任务,其由Wojke 等在2017 年提出[22],是2016 年提出的SORT算法的改进版本[23]。利用该算法,章坚武等提出了一种实时智能人流统计方法,其准确率约为92%[24]。Chan、Suandi 等使用该方法在复杂的城市建成环境中对车辆进行多目标追踪任务[25]。这些既有研究证明利用深度学习算法可有效的计算出一段视频中的实测人流量数据。
2 研究方法
本文研究方法可分为三个步骤:首先计算研究对象的选择度。而后在研究场案例路径上选取观察点拍摄视频,并利用基于深度学习的计算机视觉算法统计实测行人流量,以此为基础得出建筑中的人群分布情况。最后基于人群分布情况进行多元线性回归分析并对空间超链接现象进行解释。分析程序使用Python 编写代码,使用Tensorflow 和Keras 为深度学习库,OpenCV 为视频处理库,Pandas 为数据处理库,Statasmodel 为统计学分析库。
2.1 选择度计算
基于Bill Hiller 提出的方法,本文使用线段模型代表研究对象的空间结构[26],建模采用了“一体化”建模思路。与传统的空间句法建立的无向网络模型不同,本研究参考了Wu 和Feng 等的研究[27,28],利用Rhino/Grasshopper平台建立了有向网络模型,即其中有路径仅能单向通行,这会影响计算任意两条线段间的最短路径,继而影响到选择度的计算结果。具体而言,自动扶梯具有单向性,行人在其中运动时具有方向性;电梯具有耦合性,其多个出入口之间两两连接可得多条路径,但若其中任意一条发生故障,则其他路径无法被使用。当建立线段模型时,将与自动扶梯节点相连接的边设定为有向边,将电梯设定为单独的节点。本文的研究案例中具有两种类型的空间超链接路径,即自动扶梯和电梯。
本文使用拓扑距离、米制距离和角度距离的全局选择度来评估建立的线段模型[29]。选择度描述一个空间单元处于其他任意两个空间单元最短路径上的潜力,一个空间单元的选择度越大,其被该建筑中行人“偶然”穿过的可能性也越大[19]。本文利用实测人流分布数据分析商业综合体的空间超链接现象,故选择选择度来表征人在建筑中的理想步行活动空间分布情况。
2.2 实测人流量数据计算
传统的人群计数方法依赖于研究者的目测计量,这种方法虽简单易行,但当人流量较大时无法准确计量人群数量,导致数据误差[30]。为解决这一问题,本研究采用了基于深度学习的计算机视觉算法计算通过每个观察点的人群流量。
2.2.1 使用迁移学习训练Yolo-v3 模型
本文使用Yolo-v3 检测视频中的人群,其运算速度较快,可满足快速检测大量视频的需求[31](图1)。因为Yolo-v3 模型自带的预训练模型检测俯瞰视角人群效果不佳,故采用迁移学习的方法训练模型。迁移学习是一种小样本监督学习策略[32],其通过神经网络模型参数共享,可将预训练好的神经网络模型嵌入到其他任务模型之中,这样就能以较低的成本实现精度较高且适用于新场景的新模型。
图1 (a) 标注数据;(b)Yolo-v3模型结构及各部分功能
第一步为标注数据。本研究采用的数据集包含756 张使用lableImg 标注的图像,其均为研究现场拍摄所得。按照6∶2∶2的比例将数据集分为训练集,验证集和测试集。
第二步为训练模型。由于数据集较小,故在训练模型时采用随机多尺度训练法,即在训练神经网络时,随机调整输入的图片的尺寸和方向,该方法可提高训练模型的鲁棒性和准确度[33]。在本研究中,共训练了该模型1000 次。最后得出的模型精确率P 为96.4%,召回率R为88.2%,可以满足后续研究的需求。
2.2.2 从视频获取实测行人流量数据
基于上节获取的Yolo-v3 模型所构建的DeepSORT算法可获取一段视频中通过的行人数量(图2、3)。其可分为以下三个步骤。
图2 DeepSORT 算法流程图
(1)行人检测。该步骤使用了Yolo-v3 算法来确定视频每一帧画面中行人的位置,并获得对应的检测框。而后可获取四个数据,分别为每个检测框中心的横坐标u、纵坐标v,检测框的大小r 和长宽比h。
(2)行人追踪。对视频相邻帧中的行人进行匹配,可确定视频中通过的行人数量。具体而言,首先使用一个8 维的向量 (u,v,r,h,u*,v*,r*,h*)来代表一个检测框在某帧画面的状态,其中u*、v*、r*和h*分别为不同帧之间u、v、r 和h 的运动速率。而后利用匈牙利算法匹配不同帧画面的检测框。
(3)行人计数。采用上述两个步骤处理一段视频可得到该视频中出现的行人数量Nn,而后通过OpenCV 获得该段视频的时长Tn。通过二者计算即可获得这一观察点的实测实测人流量数据(公式1)。最后导出得出的实测行人流量数据,将其作为后续数据分析的基础数据。
图3 (a) 使用Yolo-v3 算法进行行人检测;(b) 使用DeepSORT算法进行行人追踪;(c) 行人计数
2.3 多元线性回归分析
本文使用选择度表征理想人群空间分布情况,由于其他因素的存在,如空间超链接现象,会导致实测行人流量数据与选择度空间分布有所差异。因此通过计算实测人流量数据和选择度二者的相关性,来判断是否可以用选择度直接表征研究对象的人群分布情况。具体方法为建立一元线性回归方程(ULR)并计算其决定系数R2,R2越大,则二者的相关性越强1)。
既有研究证明,商业综合体的人群分布与楼层有关[34]。为排除楼层要素的影响,建立了多元线性回归方程(MLR)来判断人群分布与楼层之间的相关性。使用的自变量包括选择度C 和与路径所处的楼层有关的变量,若一条路径位于某一楼层则该值为1,反之为0。
在排除楼层影响后,判断空间超链接效应对人群分布的影响。具体方法为建立多元线性回归方程,本研究采用的自变量为三类:一为选择度C,代表人群理想空间分布情况。第二类与空间超链接现象有关,包含两个自变量:一为是否为扶梯H1,若路径为扶梯该值为1,反之为0;二为是否为电梯H2,若路径为电梯则该值为1,反之为0。第三类与路径所处的楼层有关,具体数量与所分析的建筑有关。最终可得到如下两个多元线性回归方程,前者用于分析三里屯太古里,后者用于分析北京APM:
方程2 中b0-b7,方程中3b0-b10为自变量的回归系数,N 为路径的人流量,ε 为残差值。而后对方程进行F 检测和T 检测:F 检测判断该方程整体的可靠性,T 检测判断该方程各个自变量是否具有显著性2)。
3 案例分析
我国的商业综合体可分为两类:集中式和街区式[35]。本文分别各选取两类商业综合体的典型代表进行分析:前者为三里屯太古里,后者为北京APM(图4)。三里屯太古里建筑面积17.2 万m2;建筑共五层,其中地下一层、地上四层(由于第四层为店铺内部空间,无公共路径,故未在建筑第四层设置观察点)。其内部有17 部电梯和29 部自动扶梯。北京APM 建筑面积约14 万m2;建筑共7 层,其中地下1 层、地上6 层。其内部有17 部电梯和29 部自动扶梯。
3.1 选择度空间分布特征
本节使用前5%、前10%和前25%三个分位数可视化三里屯太古里和北京APM 的选择度空间分布(表1、2)。
表1 三里屯太古里选择度分布表
表2 北京APM 选择度分布表
三里屯太古里和北京APM 的选择度分布可清晰显示出其空间路径结构,对三里屯太古里而言,三者的差异则主要体现在垂直空间分布差异性的程度上:拓扑选择度在楼层间的差异最小;米制选择度分布在楼层之间的差异最大,其高选择度路径大多分布于地面层;角度选择度分布在楼层间的差异介于上述二者之间,其最大的特点是能够有效的标识出电梯的分布情况。对北京APM 而言,三者的差异主要体现在对公共路径的识别能力上,其中拓扑选择度的识别能力最强,角度选择度次之,米制选择度最差。
3.2 现场调研及相关性分析
对三里屯太古里现场调研四次,时间为2020 年10月24 日,11 月8 日、11 月15 日和12 月6 日。对北京APM 现场调研两次,时间为2021 年5 月21 日和23 日。在三里屯太古里设置102 个观察点,拍摄了视频346 段;在北京APM 设置62 个观察点,拍摄了视频193 段。为消除误差,每个观察点至少拍摄三段视频(图4)。视频拍摄设备为佳能EOS-600D。
图4 利用拍摄视频测算实测行人流量数据
首先对两个研究案例实测人流量数据与选择度进行相关性分析:三里屯太古里选择度与实测人流量数据决定系数R2分别为0.169(拓扑选择度)、0.349(米制选择度)、0.111(角度选择度);北京APM 的R2分别为0.417(拓扑选择度)、0.306(米制选择度)、0.377(角度选择度)。结果说明二者的相关性较低,直接使用选择度并不能解释实际人群分布情况。
而后由图5(a)可得,楼层与实测人流数据具有相关关系,建筑首层的平均实测人流量最大。引入与楼层相关的自变量并建立多元线性回归方程,结果可得三里屯太古里的R2的值分别为0.577,0.647,0.527;北京APM 的R2的值分别为0.589,0.667,0.588。这一结果较上一步骤对应的R2值变大,说明建筑中的人群分布与楼层有关,因此在分析空间超链接现象时需要排除楼层要素的影响。
最后引入与空间超链接相关的自变量进行多元线性回归分析。结果表明,三里屯太古里的决定系数R2分别为0.697、0.769 和0.645,即利用修正后的模型能够分别解释建筑中69.7%、76.9%和64.5%的人群分布状况;北京APM 的R2为0.714、0.729 和0.763。其均较前两个步骤的R2有了较大提高,这说明空间超链接现象对两个研究案例的人群分布产生了影响。
对三个模型进行F 检验,三里屯太古里的F 值分别为64.53、108.7、48.11;北京APM 的F 值分别为18.32、23.94、19.28,其显著性系数p 均约为0(p<0.05),故这6 个模型均具有统计学意义。下一步对6 个模型的自变量进行显著性分析(表3、4)。结果表明,在这些模型中,所有空间超链接现象的参数H1、H2均具有统计学意义。
表3 多元线性回归分析结果
将预测模型中各个自变量的贡献(t 值)进行比较(表6)。可得在所选择的所有自变量中,选择度对于行人流量的分布影响最大;与空间超链接现象相关的两个参数中,自动扶梯的影响大于电梯(H2均大于H1);且在三个模型当中,自动扶梯的斜率值均为正值,而电梯的斜率值均为负值。
3.3 空间现象解释
本节使用多元线性回归法分析上文提出的两个研究问题:(1)商业综合体中是否存在空间超链接现象;(2)不同类型的空间超链接路径的区别及原因。
针对前者,根据本文3.2 一节得出的多元线性回归模型可发现两个研究案例的电梯和自动扶梯均对其人群分布产生了影响,故可得出在商业综合体中存在空间超链接现象的结论。
针对后者,由图5(b)可得,两个案例中自动扶梯的平均实测人流量数据均大于电梯;由图6 可得,电梯的平均选择度大于自动扶梯的平均选择度。虽然电梯的空间位置承载行人的潜力更大,但实际上实测结果与预测值相反。多元线性回归模型中H1的回归系数小于0,H2的回归系数大于0 也正是为了拟合这一现状。这说明电
梯的人流量小于等选择度的普通路径,而自动扶梯与之相反。造成这一现象的原因有二:一为电梯能够搭乘的人数有限,如三里屯太古里中电梯标定的最大载客量为13 人。这导致电梯能达到的人流量上限较低。而自动扶梯与电梯相反,其能承载的人群数量远大于电梯。二为电梯上下客需暂停运行,而自动扶梯上下客不需要停止运行,这导致电梯的运行效率低于自动扶梯。因此即使电梯的平均选择度高于自动扶梯,但由于二者运行机制的不同,导致自动扶梯表现出对人流量起促进作用,而电梯则与之相反。
表4 北京APM 多元线性回归分析结果
表5 预测模型自变量对人流量的贡献排序
图8 (a) 楼层与实测人群流量数据统计;(b) 空间超链接路径的实测人群流量数据统计
图9 电梯与自动扶梯的平均选择度计
通过对两个案例进行对比,可发现北京APM 模型与空间超链接相关自变量对人流量的贡献大于三里屯太古里;且前者H1、H2 间的差距较小,这说明北京APM 电梯和自动扶梯对行人的影响差异较小。其原因与二者的楼层有关,北京APM 楼层数大于三里屯太古里,当行人需要前往较高楼层时,更可能搭乘电梯而非自动扶梯。
4 讨论
在研究方法上,自20 世纪中后期以来,人文主义的思想逐渐回归建筑学领域[36],快速发展的技术为设计师理解人在建成环境中的行为提供了条件[37]。本研究采用基于深度学习的计算机视觉算法克服了既有获取实测行人流量数据方法的缺点,能够以较低成本获取精确的实测人群流量数据。在未来,由于本文采集行人流量数据的方法便捷,所需要的设备较少且操作简单,因此其也具备大规模推广的可能性。
当前,随着中国城市化进程的加深,商业综合体数量迅速增长。面对井喷式的大规模建设浪潮,商业综合体的设计需要更为科学的理论支持[38]。本文分析了商业综合体的空间超链接现象,发现自动扶梯可增强人流,电梯则与之相反;且随着商业综合体楼层数量的增加,空间超链接效应对人群分布的影响越大。这为建筑师进行实践提供了一定的依据,当设计商业综合体时,合理选择和布置空间超链接路径可直接对建筑中的人群分布产生影响,如将自动扶梯布置于更高选择度的位置时,建筑内部的行人流量会得到提高;建筑师也应当合理设置建筑的楼层数,建筑的层数越多,就越应当考虑空间超链接效应。
本研究具有以下两点不足之处:(1)Yolo-v3 算法存在着误检测问题,DeepSORT 算法存在遮挡下ID 转换的问题,因此计算出的行人流量同真实数据存在一定的偏差,这需要对算法进一步调整和优化来解决。(2)本文目前对两个研究案例进行分析,所获得的结论仍较为初步,更深入和更广泛的研究尚待进行。后续的研究也将扩大研究范围,从而获得更为准确和普适的结论。
结语
本文以空间句法理论为基础,以三里屯太古里和北京APM 为研究对象,通过使用多元回归分析法获取选择度和实测人流量数据之间的关系,来对商业综合体内部空间的空间超链接现象进行解释和说明。这种基于深度学习的空间超链接分析方法可以为未来的商业综合体的设计和改造提供理论支持。
本研究发现:(1)商业综合体中存在两种类型的路径可产生空间超链接现象;(2)在电梯和自动扶梯两种具有空间超链接效应的路径中,相对于选择度所预测的人流量空间分布情况,自动扶梯具有增强人流的作用,而电梯则与之相反;(3)商业综合体的楼层越高,则空间超链接现象对人群分布情况的影响越大。
图、表来源
文中图、表均为作者绘制。
注释
1)R2 值为统计学的线性回归决定系数,其用于回归方程自变量和因变量之间是否存在相关关系,R2<0.5,两者不相关;0.5<R2<0.7,两者存在相关关系;R2>0.7,两者之间显著相关。
2)F 检测验证该方程整体的可靠性,当检测得出的p 值小于0.05 时,则该方程成立。T 检测验证该方程各个自变量是否具有显著性,当检测得出的p 值小于0.05 时,则对应的自变量具有显著性。