基于多源大数据的城市公园游憩使用和规划应对研究进展
2021-04-19李方正宗鹏歌
李方正 宗鹏歌
0 引言
在大数据迅速发展和不断成熟的背景下,伴随着地理信息系统(GIS)、遥感、数据可视化和社交网络媒体的迅速发展,风景园林规划设计受到了巨大影响,大数据及其技术使得风景园林行业正在经历前所未有的挑战和机遇。当今社会,人们对城市公园的游憩使用需求不断增加,人们在繁忙的工作和生活之余,更加渴望感知自然。大数据可以直接记录人的各种行为和感知,尤其是游憩使用行为和对公园游憩使用的感受,并且可以将人的游憩使用情况进行可视化处理,从而指导公园游憩规划研究。随着社会经济的发展,人们进出公园的方式更加多样化,这对公园的服务功能提出了更高的要求。城市公园游憩使用情况明显受到公园可达性强弱、服务范围大小的影响,而掌握其关键影响因素有助于规划设计师更科学地进行城市公园的规划应对,提高公园使用率。本研究以大数据支持下的城市公园游憩使用研究为主线,通过Web of Science、知网文献索引文数据库对SCI文献、中文核心期刊刊登相关文献进行总结,系统阐述了城市公园游憩使用大数据的类型,从游憩使用、可达性、服务范围和规划应对4方面总结了大数据支持下城市公园游憩和规划应对的研究进展以及研究方法,以期为风景园林学科下城市公园游憩使用领域的研究与实践提供新思路和参考。
1 城市公园游憩使用大数据类型
随着云计算、互联网等技术的兴起,数据正在爆炸式增长和积累,大数据时代随之到来[1]。一般认为大数据指的是大规模、超大规模的数据集,因可从中挖掘有价值的信息而备受人们关注[2]。大数据可以空间化记录城市公园游人的游憩行为,根据其来源可分为直接上传数据和间接上传数据两大类,进而还可以细分为5个不同中类和多个小类 (表1)。
表1 城市公园游憩使用大数据类型Tab. 1 Big data types used in urban park recreation use
1.1 直接上传数据
直接上传数据是指人们通过社交网络或网络媒体等平台,主动上传的点评、照片、签到等数据。主动上传数据包括社交网络数据和网络媒体数据两大类。
1.1.1 社交网络数据
社交网络记录了大量的用户使用信息,如时空信息、情感信息以及语义文本信息等[3],通过对数据的筛选和挖掘可以将其中一部分信息用于城市公园游憩使用规划的前期分析和使用后评价。其中常用的社交网络数据来源于微博、推特(Twitter)、脸书(Facebook)、微信等社交媒体网站或App,通过抓取游客的签到数据和主观点评数据获取公园游憩使用信息。李方正等[4]通过分析微博社交平台的签到数据,对中国287个地级以上城市的13 759个公园的使用情况进行评估;周伟奇等[5]利用微博免费提供的地理签到数据,量化并比较北京不同类型公园的游客数量,并对其影响因素进行分析;王波等[6]利用微博签到数据,从时间、空间、活动3个层面对南京市城市活动空间的动态变化进行分析,并根据变化进行活动区域划分。
1.1.2 网络媒体数据
网络媒体数据可以直观地反映数据出现频率和对签到地点的正负面评价[7],主要包括搜索引擎数据、网络照片数据、网络评论数据、网络消费数据等。网络媒体数据往往带有较为强烈的个人情感色彩,因此运用在城市公园游憩使用方面的网络媒体数据主要有游客评价、游人满意度等较为主观的评价数据。王鑫等[8]以北京市大型郊野公园为研究对象,提取大众点评网上对其的热点评论词,通过词频分析,将公园的社会影响进行可视化分析;谢瑶等[9]通过搜索引擎检索记录对上海市153个公园的游憩功能进行研究分析,为优化公园游憩功能建设提供参考性建议;李春明等[10]借助带有地理参考信息的照片对游人的时空行为进行研究。
1.2 间接上传数据
间接上传数据是各种数据平台对人们的使用数据信息进行保留,而非人们主动上传到网络的数据。其数据来源可以分为交通传感数据、位置服务数据、地图与兴趣点(points of interest, POI)数据等。
1.2.1 交通传感数据
交通传感数据是与居民移动相关,城市内部、城市之间交通相关的各类传感信息数据[11],它包含非常丰富的居民活动信息,主要通过公交车、出租车、地铁等交通工具的刷卡或打卡数据来获取人们的出行时间、地点和路线,以辅助判断人们通勤出行情况以及绿道等绿色空间的规划。李方正等[12]通过将公交刷卡数据与人口出行分布规律进行耦合分析,辅助绿道规划选线;龙瀛等[13]利用公交IC卡的刷卡数据对北京职住关系和通勤出行进行分析。
1.2.2 位置服务数据
位置服务,又可称为定位服务,由卫星定位系统和移动通信网络联合实现[14]。位置服务数据作为POI数据的深度补充,可以帮助规划师和设计师理解城市运行状况并反映人口行为和分布规律,已成为与风景园林规划紧密结合的一种数据类型[14-15],常见的位置服务数据类型有移动手机信令数据、腾讯出行大数据、移动位置数据等。由于手机的普及,此类数据具有普遍性和大众性,能为公园游憩研究提供游客的时空信息,在辅助研究城市公园的选址、公园游憩使用的影响因素以及促进绿地公平等方面具有重要意义。方家等[16]借助手机信令数据对上海市城市公园的供需服务进行分析,为公园规划和选址提供了参考建议;李方正等[17]以北京市40个郊野公园为研究对象,利用腾讯出行大数据对公园游憩使用的影响因素进行分析。
1.2.3 地图与POI数据
大数据时代的电子地图所涵盖的空间信息比纸质地图更丰富,而POI数据是电子地图上能够抽象成点的地标,如超市、小区、医院等[14]。地图与POI数据是公园规划的基础素材,通过地图尺度的精细化,这些数据可以准确反映各种物理空间,进一步可以精准客观地判断出游憩使用对象的工作底图、游憩使用的影响因素,以指导规划分析。如可通过判断周边商业设施状况,利用周边的交通站点判定交通的可达性等。张丽等[18]利用2组地理数据描述武汉市57个城市公园的使用情况,研究结果表明百度POI数据比微博签到数据更能描述武汉市城市公园的游憩使用情况;戚荣昊等[19]借助百度POI数据对城市中的人群分布和活动强度进行量化研究,为今后的公园服务范围判定提供优化建议。
2 城市公园游憩研究内容
理清城市公园游憩使用内容,对于合理进行城市公园规划应对,实现公园可持续发展至关重要。本研究从游憩使用、可达性、服务范围和规划应对4个方面对公园游憩使用研究内容进行分析。
2.1 多尺度公园游憩使用研究
公园的游憩使用情况直接或间接反映城市公园的使用频率、受喜爱程度等信息。因此随着大数据技术的不断发展,学者们在不同空间尺度上,利用大数据、使用多种指标开展公园游憩使用研究。首先,在公园尺度方面,单个公园研究对数据要求更加精准细致,因此应注意大数据与传统数据的差异,王志芳等[20]分别从社交媒体数据和传统调查数据入手,研究对比2种数据在北京市奥林匹克森林公园游憩使用的差异。学者通常还选择特定类型公园进行游憩使用研究,李方正等[21]针对北京市40个典型的郊野公园,利用腾讯出行大数据,结合现场调研方式,运用核密度、地理探测器等多种分析方法研究不同公园在使用方面的差异以及影响郊野公园使用的因素;李方正等[22]还运用腾讯出行签到数据对北京市中心城区的58个社区公园的使用特征及影响因素进行分析。随后有学者将公园游憩使用研究扩展到针对同一城市的所有公园游憩使用的对比研究,周伟奇等[23]通过使用社交媒体免费地理标记的签到数据,量化比较北京市不同类型公园的访问量,并利用多元线性回归模型分析影响公园游憩使用的因素。李方正等[22]运用核密度、基尼系数等分析方法对北京市中心城区绿地的游客分布进行时空分析,得出不同类型的公园在工作日和周末的游客分布情况。随着数据挖掘技术的提升,游憩使用逐渐拓展到更大尺度,李方正等[4]通过分析微博签到数据,对中国287个地级及以上城市的近万个公园的使用情况进行评估,并使用多元线性回归模型对影响公园游憩使用的因素进行分析。
其次,在游憩使用的指标上,学者分别对公园游憩使用总量、使用密度、使用感受进行研究。李方正等[4]利用微博签到数据对公园游憩使用总量、游憩使用密度进行统计,对数据进行筛选、分类后绘制公园游憩使用密度图;王鑫等[24]通过词频分析技术对北京森林公园的网络评价信息进行采集和分析,获取公众对公园使用的感受以及大众关注的热点,进而更好地指导公园规划。网络大数据与以往的传统数据相比,具有获取快速、高效,内容广泛,数据基数大的优点,但是社交媒体数据本身也会对数据的真实性和偏向性产生影响。例如微博的使用主体以中青年居多,这使得数据信息具有明显的偏向性,即以反馈中青年的游憩使用感受为主;在进行游憩使用频率的数据统计时可能会产生误差等,因此需要结合调研数据或更多源的数据来支撑全年龄段的公园游憩使用研究。
2.2 精细化公园游憩可达性研究
公园的可达性直接影响其游憩使用情况,通过研究公园可达性为提升公园分布合理性提供科学依据。传统公园可达性研究主要基于官方实地调研统计的土地利用数据、各街道行政区划图和人口数据:魏治等[25]结合当地街道人口统计数据。街道行政区划图、城市绿地等传统数据对公园可达性进行探究。学者开始结合多源大数据对交通传感数据、公园数据、游人位置数据等进行收集和删选,并将删选后的数据进行可达性分析计算,对公园游憩可达性进行了更加精细化的研究。秦华等[26]基于网络分析法,以重庆市万州区为例对其城市山地公园的可达性进行研究,并针对其存在的问题提出解决策略;凌自苇等[27]通过最小累积阻力模型计算深圳市宝安区2个居住组团内的公园可达性,并利用房价划分居住区级别,通过叠图来统计和评价组团内不同级别居住区的公园可达性;徐承栋等[28]基于网络分析法,通过计算可达性指数和服务强度,从空间布局和居民使用2个层面对云南省普洱市城市规划区游憩绿地可达性进行分析;方家等[16]以移动手机信令数据作为数据源,探究上海不同绿地可达性的差异,发现在周末和工作日,人们的旅行距离具有差异(图1)。随后,可达性的研究逐渐多元,城市绿道等线性绿色空间也成为重要研究类型:芦迪等[29]以美国巴尔的摩市“TCB”绿道为例探索绿道可达性和使用者活动强度之间的相关性,验证了绿道可达性的强弱直接影响绿道的使用;胡明星[30]以江阴市澄江街道为研究对象,采用修正重力模型,判断江阴绿地系统规划前后绿地可达性的差异。在滨水景观方面,邬峻等[31]以武汉市为例,分别研究居民到达就近滨湖景观空间的可达性程度和在机动车交通方式下到达各滨湖空间的可达性水平,并归纳其影响因素。由于不同类型的城市公园所吸引的人群不同,因此在计算公园可达性时,如何结合公园类型和人群出行特征差异提升可达性计算精度,成为可达性研究的重要趋势。
1 上海市居民周末和工作日的出行距离分布[16]Distribution of travel distances in Shanghai on weekends and weekdays[16]
2.3 精准化游憩服务范围研究
公园游憩服务范围处于动态变化之中,理清其识别、空间衰退和流动情况有利于提高公园规划的公平性。在传统研究中,学者通过调查问卷等方式研究各类型公园的服务范围,骆天庆等[32]以上海市为例,通过对其社区公园进行取样调研,剖析其服务范围、公园内活动空间构成和游憩设施配置的现状问题,从而指导社区公园游憩服务体系的构建和完善;刘金川等[33]以上海市杨浦公园为例,分别运用数据推算法与实证定点法2种方法检验经典理论与现有标准确定下的大城市区域性公园服务范围差异,进而指导公园服务体系规划。随着大数据的出现,学者可更精准地定位使用者的起始位置和获取更大量的样本数据,提升服务范围判定的精准化。郭思慧等[34]以移动手机信令数据为基础,对北京城市公园进行服务范围判定,同时结合多元线性回归模型分析各因素对北京公园服务范围的影响。刘文平发现公园游憩服务范围具有衰退特征,随着空间距离的增加,公园的游憩服务出现衰退现象[35](图2)。刘文平等[36]借助核密度分析法和曲线回归模型模拟等方法,利用三维制图解析公园游憩服务辐射距离、服务时长与服务人数的时空关系,同时发现在一定的游憩服务范围内,游客流动、服务范围与服务的空间流动相关[37]。游憩服务范围研究为城市公园空间分布和管理决策提供了可借鉴的方法,使城市公园与居民生活联系得更加紧密。目前对其服务范围的研究更多聚焦在空间上,较少涉及不同时间特征下的游憩服务范围的差异性,这为我们全面认识公园服务范围构成、流动和衰退带来一定局限性。此外服务范围研究主要集中在大、中尺度公园的研究上,而针对小尺度公园的研究较少。
2 武汉市部分公园游憩服务KDE特征[35]KDE features of recreational services of selected parks in the city of Wuhan[35]
2.4 科学性公园规划应对研究
理清公园游憩使用的影响因素,有利于规划师更好地进行规划应对。大数据的出现对于全面理清规划设计对游憩服务的影响提供了重要的科学数据支撑。影响公园游憩使用的因素包括内因和外因,即公园内部的设计因素和外部的规划因素。在内因方面,李方正等[4]通过微博签到数据对中国城市公园游憩使用情况进行评估,发现增强公园边界空间对提升公园游客吸引力有重要影响;张塞等[5]通过地理标记签到数据比较城市公园游憩使用的访问数量,发现公园规模对公园游憩使用具有积极影响。在外因方面,李方正等[38]通过对北京市中心城区208个绿地的游客分布进行分析,发现公园周围的商业设施和交通便利性对公园游憩使用具有显著影响,其中商业设施是影响公园游客分布的主导因素;郭思慧等[34]通过对北京城市公园服务影响因素分析,发现不同时间段公园受欢迎程度的影响因素有明显差异。基于以上影响因素研究,学者提出不同的规划应对。李方正等[4]通过微博签到数据对中国城市公园游憩使用情况进行评估,提出建设“公园综合体”、关注公园周边设计,用几个小型社区公园代替单一的大公园等都可以提高公园使用率,进而增加公园游憩使用频率;刘文平等[35]对武汉市城市公园游憩服务的空间衰退进行分析,提出扩大公园规模和增强某些设施的可用性,如草坪、操场和公园周围的商业娱乐设施来吸引更多的游客,以提高公园的游憩使用效率。同时,大数据可在一定程度上直接辅助规划过程。李方正等[12]基于北京市公交刷卡数据分析人口出行分布规律,结合北京市土地现状进行绿道规划方法研究,从而直接指导城市绿道规划。由于数据分析和研究过程与规划设计的基本制图单元具有一定差异,如何更精准地对接规划设计过程是规划应对研究的关键难题。
3 城市公园游憩研究方法
大数据分析是指导公园规划的关键[39],对于规划设计师来说,正确使用大数据处理的技术方法不仅能从数量和空间的角度研究公园游憩使用情况,还能客观地将不同人群的需求以可视化形式表达出来,从而揭示公园游憩使用的影响因素,指导未来的城市公园规划。下文从游憩使用、可达性、服务范围和规划应对4个方面介绍当前城市公园游憩研究方法(表2)。
表2 常见研究方法分类Tab. 2 Classification of common research methods
3.1 从数据可视化到游憩使用表达
城市公园游憩使用研究方法主要分为可视化方法和统计分析方法。数据可视化技术可直观反映不同公园的游憩使用信息[40],借助特定的软件工具以图表、地图等更加直观的图形方式展现数据信息[41],让分析者更清楚地理解公园游憩使用情况。在空间可视化方面,利用RGB颜色技术,通过不同颜色层级直接清晰地反映公园游憩使用人数和密度;而核密度估计分析法不仅可以反映公园游憩使用强度,还能进一步识别其服务范围的空间衰退情况。在文本可视化方面,可以利用词频分析法,将关键词进行词频分析从而得出公园游憩内容中最受游客欢迎的游憩词频频度等信息。在三维可视化方面,可以利用Sigmaplot软件对不同公园游憩使用情况进行三维制图(图3),从三维空间维度对其游憩使用特征进行可视化表达。
3 三维制图:公园游憩服务辐射距离、服务时长与服务人数时空关系[36]Three-dimensional mapping: the space-time relationship between the radiation distance, service duration and the number of visitors[36]
数据的统计分析主要是利用各类软件工具挖掘大数据中的有用信息[42],公园游憩使用数据的统计分析通常可以直接表征游憩使用的特征,进而理解其差异性。在空间差异方面,利用基尼系数可以衡量公园游憩使用在空间分布的聚集程度;在数量差异方面可利用直方图,得到公园游憩使用量的多少;再利用K-S检验分析游客在公园游憩得到的签到数据与官方统计数据之间的正态性,进而为下一步的统计分析工作做准备。另外一种常见方法是通过ArcGIS软件,利用栅格化处理将游憩使用量进行图层处理,进而利用3D模拟技术从三维空间的角度对数据结果进行展示。总之,在大数据迅速发展的今天,转换数据分析思维,主动利用新兴科学技术和软件工具[42],将有助于我们更好地对公园游憩使用情况进行预测和总结。
3.2 从出行模拟到可达性判定
提升可达性,促进城市居民快速便捷地进入城市公园,这是公园规划和管理的重要研究方向。常见的可达性计算方法包括欧氏距离法、高斯两步移动搜索法、统计指标法、网络分析法、最小距离法、引力模型法,这些方法均通过一定的出行模拟来判定公园的可达性。统计指标法[43]将公园可达性简化为指标享有量,对某特定区域内的公园面积大小、数量和人均公园面积等指标进行评价,间接反映公园可达性的程度。而网络分析法[43]以具体的某种交通方式为基础,以道路网络为依据,计算该种出行方式的交通阻力值,以表征其可达性;引力模型法[43]对公园服务能力和潜力进行考量,运用函数公式表达公园可达性。部分研究将可达性研究方法拓展到计算出行距离,欧氏距离[35]是指欧几里得空间中2个坐标点之间的直线距离,通过POI等多种数据类型测量居民从出发地到目的公园之间的2点距离;最小距离法[43]以计算居民出发地点到目标公园之间的最短直线距离来体现公园的可达性强弱;高斯两步移动搜索法[25]则更加综合考虑城市公园游憩与人口出行规律之间的关系,通过建立高斯方程进行公园可达性评价。
3.3 从大样本起始位置识别到服务范围计算
城市的快速发展导致城市公共服务供需失衡,因此有必要通过具体研究方法对公园服务范围及其影响因素展开研究,来提高城市公园游憩使用率。服务范围计算的关键是识别使用者的起始位置(origin-destination, OD)。类似的研究方法有标准差椭圆分析工具、核密度估计法、网络分析法等。其中标准差椭圆分析工具是判定游憩服务范围的重要依据,它可以从数学和几何关系上确定游憩范围;核密度估计法可以用来估计不同类型公园到居住区的路线密度;网络分析法[44]即以交通大数据为基础,利用实际路网计算公园的服务范围。
3.4 从影响因素判定到规划应对
城市公园规划应对需要从海量的数据中判断不同数据之间的相关性,从而指导规划。数据的相关性需要经过数学分析和提炼才可能转化成明确的数字关系[45]。因此我们必须对数据进行相关性判断,才能理清影响公园游憩使用的影响因素,从而更好地辅助设计者进行规划。类似的技术方法有最小二乘模型、地理探测器、Spearman相关分析、多元线性回归模型等,它们都能判断多种变量之间的亲密关系进而得出相关性判断。从线性相关角度来看,最小二乘模型和多元线性回归模型都可以通过寻找潜在影响因素,得出外部规划因素和公园内部设计因素对公园游憩使用的影响。从空间角度来看,地理探测器可以判断不同因素影响空间差异,有助于设计人员从空间层面定量研究各影响因素对公园游憩使用的影响。
4 大数据支持下的城市公园游憩研究发展趋势
大数据已逐渐成为公园游憩使用和规划应对领域的重要研究依据,但总体来说依然处于探索阶段。大数据在城市公园游憩使用和规划应对方面会呈现出下列3个发展趋势。
1)公众参与式数据的融合会促进城市公园游憩使用研究中数据类型趋于多元化,数据样本趋于精细化。首先,随着大数据技术的发展,会有越来越多不同类型的大数据来支撑公园游憩使用研究;公众科学的出现也将产生更多的人本数据来支撑公园游憩使用研究。公众参与地理信息系统(PPGIS)、可穿戴式设备、眼动仪等产生的精细化人本数据将会更精准地反映游客的游憩位置及游憩感受,进而为公园游憩使用研究提供更强有力的数据支撑,在一定程度上解决大数据精度问题。此外,医疗数据、交通数据、文化数据也会成为公园游憩使用研究的重要数据来源。
2)精细化大数据将会支撑城市公园游憩使用时空尺度的延展性。目前关于城市公园游憩使用研究主要集中在大、中尺度上,对于小尺度公园的研究相对较少,如何通过精细化数据及数据清洗来进行小尺度公园游憩使用研究将成为未来研究的突破重点。由于城市居民交通距离的增加,精细化评估工作和居住空间的公园使用差异,即评估不同时间段公园暴露人口是未来热点议题,将会对进一步指导精细化规划提供重要科学依据。
3)城市公园游憩研究从公园游憩使用拓展到公园游憩景观感知及其服务评价。在未来,会有更多用来表达人们景观感受的游憩数据被主动上传至网络[46],如何结合已有微博、推特、微信等位置服务数据,增加更丰富的感受和感知信息,构建公园感知监测系统将会成为指导公园精细化设计的热点研究方向。
图表来源(Sources of Figures and Tables):
图1来源于参考文献[16];图2来源于参考文献[35];图3来源于参考文献[36];表1~2由作者绘制。