计算机视觉技术在城市街道空间设计中的应用
2017-11-28胡一可丁梦月王志强张可
胡一可 丁梦月 王志强 张可
计算机视觉技术在城市街道空间设计中的应用
胡一可 丁梦月 王志强 张可
计算机视觉技术在工程工业和日常生活中已经得到广泛应用,但尚未深入城市设计领域。其精准监测的优势既能避免人眼观察的偏差,又不会像便携式测试仪器一样对被测试者造成心理困扰而导致实验误差。城市街道空间承载着市民丰富的日常生活,是研究行为——空间关联的绝佳场所。将计算机视觉技术引入城市街道空间研究是一项新的尝试。不同于传统的肉眼观察感知或单张图片分析的方法,该技术意在通过对连续的摄录视频进行帧间差值分析以得出精确的行为——空间关联图像,准确客观地分析并还原人群的空间行为模式,进而从人群空间行为的层面指导城市街道空间设计,推动城市公共空间精准化设计与研究的发展。
风景园林;街道空间;计算机视觉技术;人群行为
计算机视觉技术是用机器代替人眼对目标进行识别、跟踪和测量,并进一步完成图形处理和分析的技术,目前在工程工业和日常生活中已经得到广泛应用,如交通导航、现场勘测、自动化生产、虚拟现实等许多领域。当前该技术在城市中的应用主要分为两大方向:低视角场景——主要应用在城市安防监控、行车记录仪拍摄等方面;高视角场景——无人机航拍、卫星影像图等。为了满足应用的需要,计算机视觉技术在提高视觉精度、扩大测量范围、简化操作过程和视觉识别智能化等方面不断探索且发展迅速,能够根据应用的需要及时进行针对性的调整和改进。然而,计算机视觉技术尚未应用于城市公共空间设计领域。
1 研究现状
基于行为——空间的城市公共空间研究正逐渐向定量化和精确化方向发展,目前,空间句法、手持GPS、图像采集等技术方法已经处于应用阶段。
基于空间句法的城市公共空间研究:对街道网络建模方法进行分析并测试该原则的适用性(戴晓玲,2010);利用空间句法理论的凸边形分析方法分析公园的空间组织特征(翟宇佳,2016);通过行为注记法获得运动类型和空间分配情况等数据,形成 GIS 行为地图,应用空间句法量化城市公园内部活动空间组织特征(侯韫婧,赵晓龙,张波,2017)。空间句法在城市公共空间中的应用多集中于中观尺度,对空间特征进行分析、提出建议,研究没有精准到人的空间行为。
基于GPS的城市公共空间研究:利用GPS对物质空间与行为之间的关联性进行了定性和定量的研究(叶鹏,等,2012);分析了基于GPS技术的行为规律研究的进展,并预测GPS未来的发展潜力(刘嘉伟,2015);利用GPS跟踪设备获得游客的空间分布数据,结合GIS网络分析确定服务设施的最优配置(李渊,等,2017)。在进行GPS应用实践的过程中,GPS装置的携带会对试验参与者的心理产生一定干扰,进而左右其空间行为,在一定程度上影响试验的客观性。与此同时,GPS应用实践受天气影响较大。
图像采集:通过实地拍照的方法对游人数量及行为进行统计(谭少华,等,2015);利用图像采集法对上海24个社区公园的儿童活动区进行特征研究(孙晓莉,等,2016);利用鱼眼相机对人群进行运动估测(胡学敏,等,2017)。图像采集数据受拍摄者的主观因素影响较大,较难囊括全面的人群行为类型。
计算机视觉技术在城市公共空间研究中的尝试:瞿涛(2016)从大量的视频数据中学习不同行为的时空特征,以符合人眼的视觉特征;朱梦哲等(2017)利用计算机技术中的三维模型检测、判断行人是否有徘徊行为。
计算机技术的发展使处理海量视频监控数据成为可能,并且避免了传统人工处理可能出现的遗漏、误差等情况。近年来,为了维护社会治安,城市中的大街小巷遍布摄像头,形成几乎覆盖城市所有区域的“天眼”系统,但数据无法供研究工作使用。因此,该项技术在城市公共空间设计领域的应用需要相应设备支持并合理选择场地进行摄录。
2 城市街道空间
2.1 城市街道空间的内涵
城市环境被城市建筑外墙划分为建筑空间及外部空间。在建筑外部空间中,除山林河湖、自然保护区、农林用地等城市自然空间,人们对其他外部空间进行一系列规划、设计和修建以供城市居民公共使用,其中城市街道所占比重最大,在很多城市中超过80%[1],承载了大部分城市公共活动。
城市街道空间是城市居民日常生活的重要载体,承载了历史与当今的各类活动,如政治事件、大众狂欢、生活情景、社交活动、观光购物等。随着城市的不断发展,人们的物质精神生活愈发丰富,这就对城市街道空间提出了更高的要求。使用性质和功能单调的城市街道逐渐难以满足城市居民的使用需求,功能复合式的城市街道开始成为发展趋势。城市街道不再是传统意义上仅供交通工具通行的二维线性平面,而开始被视作承载社交与生活功能的三维立体空间。
城市街道囊括了丰富的物质要素,被视作“家”的延伸,城市居民绝大部分公共生活的空间体验均在城市街道中发生。与此同时,人们对城市街道空间的体验是一个动态的过程[2],不同宽高比(D/H)的街道拥有不同的空间感受。因此,在城市街道的规划和设计过程中需要兼顾使用者的实际使用需求与心理感受。
城市街道空间能给人带来丰富的体验和感受,是由大量通行性、停留性、体验性、功能性及生态性的空间形态组合而成,城市街道空间的开合收放、起伏转折之中蕴含了独特的城市印记,也承载着城市形成与发展的历史。现今城市活力难以提升,根源在于城市街道空间缺乏活力。科学地采集活动行为数据、对人们的空间使用习惯和心理进行分析、有针对性地指导城市街道空间的规划和设计可有效激活城市活力,在这方面,计算机视觉技术的引入意义重大。
2.2 城市街道空间的类型
为了便于结合计算机视觉技术研究人群行为与空间的关系,城市街道空间可以分解为线性步行空间、庭院节点、街头绿地、广场节点4种类型(图1)。许多闲逛和玩耍活动是在凹陷处进行的[3],“平面上凹凸的微小变化……在三维空间中却产生了很大的影响”[3]。这些“凹陷处”“凹凸的微小变化”在街道中即为作为空间节点的广场、街头绿地和与街道直接或间接发生关系的庭院(没有围墙或有镂空围墙、可参与的庭院或可观赏的庭院),还包括由于临街建筑错落布局而形成的空间,这些都是街道体验序列中的组成元素,都应纳入城市街道体系当中。
2.3 城市街道空间的构成要素
城市公共空间的构成要素对行为活动有很大影响,可分为物质和非物质2部分。其中,物质部分主要指街道上的各类设施(表1)[4]。经过设计的设施、标识等要素有时也可以成为小品。
ZHANG Ke, who was born in 1993 in Tianjin, is a master student in the School of Architecture, Tianjin University (Tianjin 300072).
1 街道空间类型示意图Types of street space
表1 街道物质构成要素图表Tab. 1 Material elements of street space
当然,城市中的移动元素,尤其是人及其活动,与静止的物质元素是同等重要的[5]。人是城市空间的主体,没有人及其活动,城市公共空间就没有任何意义。因此,除了物质层面的要素以外,城市公共空间中人和某些类型的活动也应当成为空间要素(图2)。
3 计算机视觉技术应用于行为——空间的研究
3.1 操作步骤
根据实践经验,应用计算机视觉技术分析人群行为轨迹的操作步骤如图3。
3.1.1 选取场地
根据调研目的合理选择场地,在充分预调研基础上,安排摄录的时间段、摄像头架设点,并对天气变化等突发情况做出预案。
3.1.2 选取适当地点进行视频摄录
确定人群活动发生的具体位置和所覆盖的范围,判定影响因素。影响行为发生的要素分为两大方面:实体空间和物理环境(风、光、热等)。人的行为习惯和其他相关影响因素也应纳入考虑范围。基于计算机视觉技术中的视频处理技术,划定需要观测的范围,结合实际情况确定摄像头架设的位置、间距等。
3.1.3 视频预处理
对摄录成段的视频进行预览,对没有完全覆盖场地的视频应重新摄录;对于摄录过程中因机身抖动或天气原因等导致未能固定视点的视频也需重新摄录(视点固定可以排除植物、建筑、水体等外部因素对视频分析的干扰)。用After Effects对截取的视频进行处理,根据分析需要添加模糊、裁边等效果,以降低噪点。
3.1.4 视频处理,得到行为轨迹
首先提取视频帧,根据需要提取10Hz、 25Hz或30Hz速率(这几种速率较常用)的视频帧。然后抽取一定数量的视频帧,对这组视频帧进行全局分析(图4)。做视频偏移的帧间预测,分析相邻两帧或几帧的差异,定量分析视频中运动物体的运动方向和速率,以得到一组具有累积性的运动轨迹图像。需要指出的是,全局分析视频时域时并不对单个人的行为做分析,也不对单个人进行检测和跟踪。
2 城市街道空间构成要素示意图The picture of urban street space elements
3 行为原型生成技术路线图The steps of getting the behavior prototype
4 视频处理流程图The process of video processing
如果分析单个人或一组人(多个人)的行为对场景的依赖,那么需要对单个人或者对一组人分别进行检测。对单个人的检测和跟踪首先要框选或通过视频分析框出所要研究的对象,在相邻两帧之间通过滑动窗口或者提取关键框的方式,提取框选内容的特征,根据特征最接近的原则,匹配出后一帧中对应前一帧的框,以此类推。一组人与单个人类似,只需要特定区分出每个人的特征即可。具体操作步骤为:框选——特征提取——特征匹配——确定下一帧的框的坐标。其中,特征提取的方法有传统算法、SIFT、HOG等;也可以运用深度学习(处理图像、文本、音频等信息的一项技术)的预训练模型和对应的网络提取。候选框的选取方法为滑动窗口遍历整个视频帧,特征差异最小的图像即为匹配视频帧(图5)。
3.2 人群行为轨迹生成原理
每一段视频都可以截取出无数视频帧。对视频的处理实际上就是对按一定顺序排列的视频帧序列进行处理。分解视频后按分析需要,有规律地抽取一定数量、一定序列的视频帧。
接下来,子程序就会对运动目标进行检测和跟踪。最基本的操作方法就是利用帧间差值进行识别和跟踪,也就是利用计算机来识别和跟踪各个帧之间能感知到的明显的视觉运动。针对不同的视频设置不同的帧间隔进行差值,该方法的原理是:空间运动的物体(即视频中的人)在成像平面的每一帧中都有相应的瞬时速度,利用视频帧序列中框选区域的物体在时间域上的变化以及相邻帧之间的关联来发现当前帧与上一帧(或作为参照的第一帧)之间的对应关系,从而计算出相邻帧之间框选物体的运动数据。同时,程序还会在原始图片中具体标记出检测的具体位置,以便进行比对。程序还支持对检测目标进行不同的标记,比如用点、用轮廓或者用矩形框标记,并连续显示出来。
5 检测、跟踪技术流程图The process of checking and following
4 行为与空间的联系实践
4.1 实践说明
本次实践旨在对计算机视觉技术在街道空间设计中的运用进行探索性实践。在信息采集过程中,架设机器进行视频采集时应当注意:首先,保证视频影像覆盖全部预选公共空间,确保场地内全部信息的收集,避免人为数据采集时可能产生的主观影响导致数据误差;其次,实验设备的使用可能引起行人的注意,而造成其行为的改变,因此在拍摄时应当尽量减小设备的噪声,避免数据误差。
如今城市内的天眼监控系统、航拍影像、卫星监控系统等均可以有效地进行数据信息的采集,但以上城市监测系统尚未应用于城市公共空间设计领域,现阶段无法对该部分信息进行共享使用。因此在实践之前,应当在满足数据采集基本要求的情况下合理地进行场地的选择和机器的架设,尽可能削减误差,从而保证试验数据的实时性、准确性和合理性。
本次实践选取天津大学校内3处典型街道空间进行信息采集,所选场地具备人进行各种行为活动的可能性。与此同时,所选场地四周有高层建筑物,满足了机器架设的基本条件,可随时对采集的数据进行收集、处理和反馈,以减少试验误差。
4.2 场地预调研
数据采集之前首先对所选场地内的人群行为活动现状进行分析,广场和庭院空间四周为低层楼房围合,给人们的心理感觉更私密、安全,使用群体主要为在校师生、教师家属等。主要发生的行为活动有:步行通过、散步、休息、看书看报、与他人交谈、小团体有组织的文娱活动等。使用群体、年龄、时间安排等都相差不大。调研在一天中分多个时段拍摄,尤其是上下课高峰期、下午4∶00至晚上8∶00、中午和清晨。
4.3 实践1——固定相同视点及视角
前期准备:佳能M6相机、DV、三脚架。
场地:天津大学内一处“广场节点”式公共空间(图6)。
录像及拍摄地点:高层楼房3层以上高度,固定机位,俯拍。
时间:2017年4月,不同时段拍摄了9段视频,每段10分钟。
天气状况:晴朗。
行为的空间动态轨迹分析:图7。
轨迹分析初步结论:根据分析图所示,确定视点后用三脚架固定机位,在3层楼高的10m处斜俯视,基本能把调研范围全部收入镜头中。利用前述方法和步骤进行人群行为分析,红色拖尾流线代表行人运动轨迹,在靠近楼房和花坛夹缝处均有行人行走通过,没有停留行为。
实践优化设想:同一视点、固定视角的拍摄只能得到模糊的运动数据,斜俯视分析较难得出准确的坐标定位,设想在下一个实践中,在保证调研范围被镜头全部收入的条件下改变视点的高度,以探寻新的结果。
4.4 实践2——改变视点高度
前期准备:佳能M6相机、DV、三脚架。
场地:天津大学内一处“庭院节点”式公共空间(图8)。
录像及拍摄地点:高层楼房3层以上高度,固定机位,俯拍。
时间:2017年4月,不同时段拍摄了9段视频,每段10分钟。
天气状况:晴朗。
行为的空间动态轨迹分析:图9。
轨迹分析初步结论:根据分析图所示,拍摄过程中变换了2次视点位置,雪松种植坛的大小和位置有些变化,但基本能把调研范围全部收入镜头中。利用前述方法和步骤进行人群行为分析,红色拖尾流线代表行人运动轨迹(可以在分析过程中调换成其他颜色,但红色显示效果更清晰,因此选用红色流线代表行人运动轨迹),在种植坛周围任何方向、路线都有行人经过,细线轨迹代表行人距离镜头较远,宽度较大的轨迹可能表示该轨迹同时运动的行人数量较多。右下角的停车棚对视线有遮挡。
6 空间1 平面图The site plan of No.1 space
7 空间1 行为的空间动态轨迹The behavior dynamic trajectory of No.1 space
实践优化设想:有斜角的俯视会造成行人由于远近而大小不一的情况,对分析结果有一定程度的干扰,并且同一方向的视角出现遮挡时,会漏掉行为轨迹的有用信息。因此设想在下一个实践中,能否进行一次90°垂直地面的俯视拍摄分析;另外,从不同高度、不同方向全方位拍摄场地,以探寻新的结果。
4.5 实践3——改变视点位置、改变视角
前期准备:佳能M6相机、大疆精灵3 standard(dji phantom 3 standard)。
场地:天津大学内一处“广场节点”式公共空间(图10)。
录像及拍摄地点:广场上空20m、25m、30m高度,固定机位,90°俯拍、斜30°、45°俯拍。
时间:2017年7月,不同时段拍摄了4段视频,每段20分钟。
天气状况:晴朗。
行为的空间动态轨迹分析:图11。
轨迹分析初步结论:根据分析图所示,第一组为20m高度30°斜角俯拍图,第二、三组为30m高度90°垂直俯拍,第四组为25m高度45°斜角俯拍。利用前述方法和步骤进行人群行为分析,这次我们加入了时间维度的效果,可以从一组分析图中看出人群行为轨迹在时间轴上的变化。红色拖尾流线代表行人运动轨迹,可以清晰看出广场上人的活动呈两极分化状态——一类是有明显的通过性目的,运动轨迹清晰肯定;一类是毫无目的在广场闲逛(这里一些行人为步行通行,一些为骑自行车通行,分析图中没有对是否使用交通工具加以区分,但后期如果分析需要细化,通过编程和技术改进是可以实现的),运动轨迹呈现杂乱无章的状态。
4.6 实践总结
在3组实践中,我们对视点的高度、位置以及视角都做了调整性的实验,实验工具涉及单反、DV、无人机,视频分析主要使用计算机视觉技术中视频时域关系分析的方法,包括帧间差值、光流、运动向量等。在保证调研范围全部覆盖且无遮挡的情况下,高视点(在本组实验中指20m以上高度的视点)得到的分析数据相比低视点(在本组实验中指10m高处的视点)更直观;越接近垂直90°角度的俯拍,人群行为运动轨迹越清晰肯定,并可以结合实际测量得出一系列衍生数据,如各时间点运动坐标、运动速度、活动时长等;对调研场地进行多角度同时拍摄能够得到比单一角度固定视点更全面、有效的分析数据。
8 空间2 平面图The site plan of No.2 space
9 空间2 行为的空间动态轨迹The behavior dynamic trajectory of No.2 space
5 结语
城市公共空间是计算机视觉技术应用于城市设计的最佳切入点。在探索过程中,应当将街道视作具有体验性和领域感的三维空间,把握城市公共空间在实际使用层面和心理调节层面上的多重意义。分析和了解人的使用需求和使用心理,始终从城市公共空间使用者的角度出发考虑问题。
在现阶段的实践中需要考虑各类影响因素,如架设点的选取最好在10m高度左右或以上,要能清晰拍摄单个人的行为;又如预处理的工作量增大,由于街道上树木遮挡等原因,可能导致行为拍摄不连续,需要调整架设点重新拍摄等。视频监控介入城市公共空间、辅助实现高精度运动检测的方法弥补了相机拍摄图片不连续的缺憾,对公共空间的活动几乎没有干扰,也不会对被试者造成心理负担而出现不可控的误差。
计算机视觉技术在城市公共空间中的实际应用仍然处于探索阶段,现有的城市监测系统尚未与城市公共空间设计领域进行有效的学科交叉和信息数据共享,因此在数据获取方面还需研究课题组设法解决,对于实验预期结果以及验证工作,需要与计算机视觉技术相关技术人员合作,共同进行有针对性的测试、研发。计算机视觉技术在城市公共空间中的应用具有很大潜力,有助于街道空间的优化提升,为精准化的城市街道设计和研究提供参考。
注释:
①垂直界面构成要素分为第一轮廓线和第二轮廓线两类,分类方法参考芦原义信《街道的美学》。
②图1~6、8、10为作者自绘;图7、9、11为宋晓林绘制。③表1为作者自绘。
10 空间3 平面图The site plan of No.3 space
11 空间3 行为的空间动态轨迹The behavior dynamic trajectory of No.3 space
[1] National Association of City Transportation Officials. Transit Streets Design Guide[M]. Washington, DC: Island Press, 2016.
[2] 邱书杰. 作为城市公共空间的城市街道空间规划策略[J].建筑学报,2007(3):9-14.
Qiu Shujie. Urban street space planning strategy as urban public space[J]. Architectural Journal, 2007(3): 9-14.
[3] (加)简·雅各布斯.美国大城市的死与生[M].金衡山,译.南京:译林出版社,2005:77;32;43.
Jane Jacobs. The Death and Life of Great American Cities[M]. Jin Hengshan, Translation. Nanjing: Yilin Press, 2005: 77; 32; 43.
[4] 胡一可,丁梦月.解读《街道的美学》[M].南京:江苏凤凰科学技术出版社,2016.
Hu Yike, Ding Mengyue. Interpreting ofStreet Aesthetics[M]. Nanjing: Jiangsu Phoenix Science and Technology Press, 2016.
[5] (英)克利夫·芒福汀.街道与广场[M].张永刚,陆卫东,译.北京:中国建筑工业出版社,2004:114.
Cliff Munfortin. Street and Square[M]. Zhang Yonggang, Lu Weidong, Translation. Beijing: China Architecture amp; Building Press, 2004: 114.
(编辑/任京燕)
The Application Potential Research on Computer Vision Technology in Urban Street Spaces
HU Yi-ke, DING Meng-yue, WANG Zhi-qiang, ZHANG Ke
Computer Vision Technology has been widely used in the engineering industry and daily life, but not yet deep into urban design. The advantage of its accurate monitoring can avoid the deviation of the human eye observation, it does not bring the experimental error to the tester as a portable test instrument. Urban street space is one of the most important urban public spaces, carrying the rich daily life of the citizens, is a great place to study the association of behavior and space. The introduction of computer vision technology into urban street space design is a new attempt, different from traditional methods of human eye observation or image analysis. The purpose of this paper is to obtain the accurate behavior spatial association image by analyzing the frame difference between the successive video cameras, and to promote the development of precision design and research of urban public space.
landscape architecture; street space; computer vision technology; crowd behavior
国家自然科学基金面上基金项目“基于人群行为分析的城市型风景名胜区边界城市空间原型研究”(编号51678394/E080202);高等学校学科创新引智计划资助项目“低碳城市与建筑创新引智基地”(编号B13011);天津市艺术科学规划一般项目“天津城区历史环境保护与再生研究”(编号E14006)
TU986
A
1673-1530(2017)10-0050-08
10.14085/j.fjyl.2017.10.0050.08
2017-07-26
修回日期:2017-08-25
胡一可/1978年生/男/辽宁大连人/天津大学建筑学院副教授/研究方向为风景旅游区规划设计、城市公共空间设计、风景建筑设计等(天津300072)
丁梦月/1995年生/女/河南周口人/天津大学建筑学院风景园林学专业在读硕士研究生(天津300072)
DING Meng-yue, who was born in 1995 in Zhoukou, Henan province, is a master student in the School of Architecture, Tianjin University (Tianjin 300072).
Fund Items: National Natural Science Foundation of China “Research on Urban Space Prototypes near the Boundary of Urban National Parks Using Crowd Behavior Analysis” (No. 51678394/E080202); The 111 Project “Low Carbon City and Building Intelligence Base” (No. B13011); Tianjin General Plan of Art and Science Project“Research on Conservation and Regeneration of Urban Historical Environment” (No. E14006)
HU Yi-ke, who was born in 1978 in Dalian, Liaoning province, is an associate professor in the School of Architecture, Tianjin University. His research focuses on scenic spots planning and design, urban public spaces design, landscape architecture design (Tianjin 300072).
王志强/1989年生/男/内蒙古多伦人/天津大学建筑学院在读博士生研究生/研究方向为城市公共空间设计、建筑设计及其理论等(天津300072)
WANG Zhi-qiang, who was born in 1989 in Duolun, Inner Mongolia province, is a Ph.D. student in the school of Landscape Architecture, Tianjin University. His research focuses on urban public spaces design, architecture design and theory (Tianjin 300072).
张可/1993年生/男/天津人/天津大学建筑学院风景园林专业在读硕士研究生(天津300072)