基于多源大数据的北京大型郊野公园的影响可视化研究
2016-10-10王鑫李雄WANGXinLIXiong
王鑫 李雄*WANG Xin LI Xiong
基于多源大数据的北京大型郊野公园的影响可视化研究
王鑫 李雄*
WANG Xin LI Xiong
近年来北京的大型郊野公园建设发展迅速,有效的改善了城市环境质量,以北京大型郊野公园为研究对象,基于多源大数据,利用核密度法和词频分析技术对北京大型郊野公园的实施进行评价,研究显示大型郊野公园对城市空间有明显影响,较好的城市郊野公园的边界应该与人群聚集的边界相接,在这样更有利于吸引大量人流进入公园;二是大型郊野公园具有多重社会功能,具有广泛的社会影响力。
数字景观;郊野公园;大数据;可视化
Fund Item: Supported by “the Fundamental Research Funds for the Central Universities(BLX2015-31)” and “ the Program of the Co-Construction with Beijing municipal government ”.
1 引言
随着城市的快速发展,大型郊野公园日益成为公园建设的新热点,大型郊野公园一般占地面积较大,以近自然的植被、水体环境的营造为主,具有显著的生态功能。在城市核心区用地高度紧张的今天,这类公园是进行游憩活动的主要区域,能够对城市产生影响作用,这种作用是一种对城市物质空间和社会产生的持续性影响。因此如何展示出郊野公园与城市的这种关系,成为需要解决的问题。
在传统规划中,由于受到数据采集能力的限制,对于大型郊野公园的这种影响作用很难清楚表达,主要有两个方面的问题,第一是大型郊野公园周边用地都在快速的建设,周边城市空间的变化程度复杂,这种影响关系很难通过某几个参数简单描述;第二随着交通便利程度的提高,远距离的游人也会聚集到郊野公园周边,扩大了郊野公园的影响范围。因此需要从更宏观的角度,将大量的不同类型的数据通过可视化的方法反映出来,从而得到更加直观的分析结论。
2 多源大数据类型与可视化
多源大数据类型的选择是决定大型郊野公园影响可视化的关键要素,选择数据的类型不仅要包括空间信息数据:例如卫星影像
修回日期:2016-02-08数据、POI点数据;还要包括人们对该公园的使用后的评价:例如从大型点评类网站获取的评价内容。具体的评价数据包括《北京市绿地系统规划(2004-2020)》,《北京城市总体规划(2004-2020)规划说明书第二分册》;DigtalGlobe卫星影像(分辨率0.5m/像素);BCL实验室提供的2013年新浪微博POI数据;大众点评网中对大型郊野公园的相关评价信息;空间数据的处理主要依靠ENVI5.1和ArcGIS10.2软件。
目前通过多源大数据进行城市绿地影响的研究还比较少,该研究方法通过多源大数据的整合、分析,显现出郊野公园空间对城市多方面的影响的程度 (图1)。随着科技的发展,多源大数据的获取更为便利,目前可以通过大家的手机等移动终端采集个人空间坐标的定位信息;通过卫星获取遥感影像快速得到地物信息;通过互联网获得人群对某事物进行评论的信息;将这些数据进行处理,最终形成可视化图。
3 北京大型郊野公园的空间影响可视化
近年来北京在城市建成区和新城地区建造了多座大型郊野公园,比较具有代表性的是北部城市建成区的奥林匹克森林公园和南部新城的南海子公园,其用地都是对城乡结合部的村镇建设用地进行整理连片之后,再进行森林环境恢复和营造,最终建成的大型郊野公园。但由于各种原因,这些公园在建设后,对城市的影响效果并不相同。
3.1基于核密度法对大型郊野公园的影响可视化
核密度法(Kernel Density)①是一种计算空间中点的密度的计算方法。核密度法常用于分析空间中点聚集的紧密程度。并能将不同位置上发生聚集的差异的程度在空间中连续表现出来,由于在真实情况下的人群活动所表现出来的空间聚集会具有一定的趋势性,所以通过核密度法能够分析出在一个时间段内人员在空间中的聚集趋势。假设大型郊野公园对周边人群具有吸引作用,那么它的吸引作用会通过这种方法在空间中体现出来,这种吸引趋势的影响会从侧面反映出绿地空间对城市的影响。核密度分析图与城市遥感影像图的叠加可以在城市空间上体现出核密度随距离变化的情况,可以显示出密度值较高的区域位于城市空间的位置,以及密度值衰退的边缘区域,显示出空间影响的结果。
3.2城市建成区大型郊野公园的空间影响可视化
城市建成区大型郊野公园周边城市基础设施完备,分布多片大型居住区和商业区,可达性较强。试以奥林匹克森林公园作为评价的典型样本,通过多源大数据体现出大型郊野公园对于该区域中人群分布的影响。
北京奥林匹克森林公园面积6.8km2,2008 年7月投入运营,是北京平原地区最大的公共郊野公园,其中南园面积3.8km2,北园面积3km2,南园主要景观有大型人工湖泊、人工湿地、山体、森林,北园主要景观为人工混交林。该公园位于北京城市传统中轴线最北段(中轴线贯穿天安门、紫禁城、景山),北京市第一道绿化隔离带中,属于朝阳区管辖。奥林匹克森林公园周围三面是居住和商业用地,西南侧是国奥村、北沙滩一号院、中国科学院小区、安翔里;东南侧是慧中北里第二社区、安慧里;东侧是北苑居住组团;西侧是林萃西里。北侧连接东小口森林公园。居住区容积率较大,居住人口多,同时奥林匹克森林公园南入口是地铁8号线站点,周边公共交通便利。奥林匹克森林公园免费向公众开放,游人量非常大,公园设施的使用率高,据朝阳区政府网站统计,2014年春季节假日日均入园人数达到10万人以上,高峰期达到16万人以上。
奥林匹克森林公园巨大的人流量体现出了大型郊野公园的影响力,通过可视化的方法可以直观展示出影响的程度。从公园周边新浪微博签到POI点云的空间分布来看,奥林匹克森林公园周边的人群活动主要集中在西南、东南两个方向,西北和东北方向人群活动较少,可以看到在公园西南部人群活动聚集程度较高,因为这里是南园的主停车场,也是主要的公交站点(图2)在北园地区POI点云形成的边界紧贴公园红线,说明奥林匹克森林公园对周边的人群有集聚作用,使人群集中流动到奥林匹克森林公园的方向。根据新浪微博签到POI点的核密度分析显示,奥林匹克森林公园的西侧和东侧形成了两个大的人群活动聚集集团,以西南方向和东南方向最为明显。而奥体森林公园在这两个聚集集团之间形成了一个开阔的中间地带,对两个聚集团形成了分隔,“稀释”了人群的聚集作用(图3)。
3.3新城大型郊野公园的空间影响可视化
新城地区的大型郊野公园开发建设多早于周边的城市建设,该类大型郊野公园周边城市基础设施建设还不够完备,居住区和商业区多为正在规划或建设,交通条件相对较差,通过多源大数据体现出大型郊野公园对新城的影响作用,反映出新城人群吸引的程度。试以南海子公园作为评价的典型样本,通过多源大数据可以体现出这种类型的郊野公园在建成后面对的人流量较少的情况。
南海子公园用地位于大兴区东北部南五环南侧,大兴区旧宫镇南侧,亦庄新城西侧,这里在历史上属于皇家宫苑“南海子”的范围。南海子公园是目前北京最大的湿地公园,规划面积为7.86km2。2010年9月一期工程建设完毕,一期工程位于图4中细红线范围内,面积为152.4hm2,在公园内营造近自然森林景观,主要景观由大型人工湖泊、湿地、森林、独具特色的麋鹿饲养基地“麋鹿苑”组成。南海子公园东西两侧的土地主要规划为居住用地,北部五环路一侧为旧宫镇工业用地,公园南侧为政府办公预留地。
这种先于周边城市空间建设,提前规划的大型郊野公园对周边的新城会带来比较大的影响。通过核密度分析法分析北京市域新浪微博签到POI数据大数据的空间分布特征,发现在北京东南四环和五环之间的这一地区人群聚集强度很大,反映的是南海子公园附近最大的居住组团:北部的旧宫镇组团和东侧的亦庄组团,说明这一地区有大量的人群活动(图4),应该对于利用郊野公园有大量需求。
但是根据作者实地调查发现,南海子公园的游客只以自驾前往的市民和周边乡镇居民为主,周边新城的居民比较少。从公园周边新浪微博签到POI点云的空间分布来看,南海子公园周边的人群活动主要集中在西北和东北两个方向,西南、东南两个方向人群活动较少。西北旧宫镇组团和东北亦庄组团形成的POI点云边界远离南海子公园边界,即东北部的凉水河和西北部的南五环。根据新浪微博签到POI点的核密度分析显示,南海子公园的西北方和东北方有两个比较大的人群活动聚集集团,南海子公园与这两个组团相互平行,两个聚集集团的边缘都远离南海子公园的边界(图5), 这种现象的产生推测可能和南海子公园的区位有一定关系,该公园用地属于新城建设区域,新城的城市人口的聚集和形成一定的规模还需要一段时间。目前开放的南海子公园一期公园均与旧宫镇居住组团和亦庄组团有一定的距离,西北旧宫镇组团的人群要进入南海子公园需要跨过南五环,亦庄新城的的人流要进入南海子公园需要跨过凉水河,通勤距离较远。南海子公园南门距离最近的地铁亦庄线荣京东街站5.89km,最近的瀛海庄公交站离公园南门3.22km,公园东部边界距离凉水河东岸亦庄新城1.3km。而原有的旧宫镇组团和亦庄组团的居民并不需要通过这么长的距离到达南海子公园,就可以享受到位于更近距离的公园的游憩环境。例如旧宫镇北部就有旧宫碧海公园、旺兴湖郊野公园、宣颐公园三座大型公园;亦庄新城西北部就有国际企业文化园、宏博公园、镇海寺郊野公园三座大型公园。从公园周边新浪微博签到POI点云的空间分布来看(图6),人群都沿着这些公园的边界聚集,这说明这些公园对旧宫居住组团和亦庄居住组团的居民有较强吸引力。
4 北京大型郊野公园的社会影响可视化
4.1大型郊野公园的社会影响可视化的意义
大型郊野公园不仅可以对城市空间产生影响,还具有社会效益,北京市大型郊野公园是政府投资建设的具有社会公益性质的公共空间,均免费开放,使用者涵盖社会各阶层。因此可以通过人群在评价网站所做的评价作为分析依据,通过网络信息搜索程序对2008年至2015年4月的大众点评网上的数据进行收集,提取了北京比较具有代表性的四座大型郊野公园的语言评价信息,通过这些语言信息可以得到大型郊野公园建设后的社会影响可视化图。根据哈佛大学教授G.K.齐普夫所提出的词频分布定律(law of distribution for word frequencies),该定律认为文章中单词的频次(f)与其排列的序号(r)之间有固定的比例关系,即如果有一个包含n 个词的文章,将这些词按其出现的频次递减地排序,那么序号r和其出现频次f之积fr,将近似地为一个常数,即fr=b,(式中r=1,2,3,…)。通过对大型郊野公园评价前20词频排序,词组序号和词频的乘积都在2 500上下浮动,符合词频分布定律,说明对网络词频的统计是有意义的(表1)。
表 1大型郊野公园评价前20词频排序
4.2基于词频分析技术的大型郊野公园的社会影响可视化
利用大众点评网,提取2008年11月至2015年4月北京市主要的四座大型郊野公园的评价信息共3537条,通过ROSTCM6软件进行词频分析,将词频前300的词组出现的次数按频度大小顺序(表1),可以发现词频排序的结果符合统计学中幂律(PowerLaws)和帕累托分布(Pareto)特征(20%和80%定律)。用比较通俗的“长尾理论”对词频的分布进行解释,“长尾理论”的核心是单个冷门的需求虽然总量较少,但是各种冷门需求的类型却非常丰富,表明大型郊野公园在满足游憩需求外,还可以满足社会中各类型人群的各种复杂需求,这些需求尽管冷门,但是种类繁多,涵盖社会各阶层,在统计图中形成一条“长尾”(图7),体现出大型郊野公园的社会影响的广泛性。
通过词频分析发现,占总样本量10%以上的词组依次是“公园”(91.49%)、“地方”(31.1%)、“免费”(25.47%)、“环境”(25.36%)、“空气”(17.98%)、“适合”(17.36%)、“森林”(17.08%)、“方便”(12.78%)、“帐篷”(11.87%)、“周末”(11.76%)、“门票”(11.17%)、“北京”(10.23%)。按照词组构建语境进行使用者的需求分析可以得出以下语义解释。社会对北京的大型郊野公园要求是交通“方便”,易于到达,门票免费,不让使用者产生经济负担,环境要好,公园内部空气清新,适合开展各种游憩活动。搭帐篷是大型郊野公园进行的特色活动,郊野公园提供了所需的场地(图8)。
大型郊野公园的主要使用者可以从以下词组显现:如“孩子”(9.73%)、“朋友”(7.61%)、“游客”(2.71%)、“游人”(2.54%)、“老人”(2.4%)、“小孩”(2.37%)、“家人”(2.04%)、“一家人”(1.84%)、“小朋友”(1.75%)、“全家”(1.72%)这说明大型郊野公园对于家庭的良性作用,为家庭休闲活动提供了空间。
对于大型郊野公园的实施用地评价比较重要的词组是:“方便”(12.78%)、“附近”(7.94%)、“离家”(3.62%)、“周边”(1.64%)。说明实施用地应该尽量靠近居住区,易于抵达。
5 结论
北京市大型郊野公园与城市空间有一定的影响作用,通过对郊野公园及周边的多源大数据的可视化反映出两个特点:一是大型郊野公园对城市空间影响明显,比较好的郊野公园的边界应该与人群聚集的边界相接,在这样更有利于吸引大量人流进入公园;二是大型郊野公园具有多重社会功能,能够满足社会不同阶层人群的需求,具有广泛的社会影响力。
注释:
①核密度分析的计算公式如下:
f(s)是以 作为自变量的核密度计算函数, 是空间距离变化的阈值, 为空间权重函数, 代表某一最大的密度值区域,在远离 的过程中密度值不断减小,至到距离达到阈值 时密度值降为0,较小一些的 值可以使密度分布结果中出现较多程度的变化,得到比较丰富的密度变化信息。
[1]禹文豪,艾廷华.核密度估计法支持下的网络空间点可视化与分析[J].测绘学报,2015,44(1):82-90.
[2]杨沛儒.生态城市主义——尺度、流动与设计[M].北京:中国建筑工业出版社,2010:9.
[3]张浪.特大型城市绿地系统布局结构及其构建研究[M].北京:中国建筑工业出版社,2009:2.
[4][美]克里斯•安德森.长尾理论[M].北京:中信出版社,2006.
[5][美]约翰•霍兰.涌现:从混沌到有序[M].上海:上海科学技术出版社,2006.
The Research of the Impact of the Large-scale Country Park in Beijing Based on Multi-source Data
These years, the large-scale country park construction has developed rapidly, which greatly improved the urban environment. With the multi-source data, the land implementation of large-scale country park located at the plain region of Beijing is evaluated by the adoption of Kernel Density and Word Frequency Analysis. The result shows that the large-scale country parks obviously affect the city environment. The boundaries of country parks had better be close to the boundaries of the crowd mass, to draw more people to the park. Besides, the large-scale country park has various social functions.
Digital Landscape; Country Park; Big Data; Visualization
中央高校基本科研业务费专项资金资助(BLX2015-31)和北京市共建项目专项共同资助
TU986
A
1673-1530(2016)02-0044-06
10.14085/j.fjyl.2016.02.0044.06
2015-12-24
王鑫/1985年生/男/贵州人/北京林业大学园林学院风景园林设计教研室讲师(北京 100083)
李 雄/1964年生/男/山西人/北京林业大学园林学院院长,教授,博士生导师(北京100083)
邮箱:bearlixiong@sina.com