基于城市网络空间的POI分布密度分析及可视化
2015-07-04王爽李炯天津市测绘院天津300381
王爽,李炯(天津市测绘院,天津 300381)
基于城市网络空间的POI分布密度分析及可视化
王爽∗,李炯
(天津市测绘院,天津 300381)
摘 要:根据数字城市与空间信息基础平台的建设需要,以地理学第一定律为理论依据,给出核密度估计与网络核密度估计方法,对欧式空间和道路网络空间下的城市POI设施分布特征进行实验分析,探讨其分布规律,并以可视化形式展示POI的分布热点、密度、趋势等分布特征,从宏观上获取城市基础设施的分布规律,为城市规划和管理提供决策支持。
关键词:分布密度;网络空间;POI;核密度估计;可视化
1 引 言
随着近年来现代信息技术取得的快速发展,数字技术与网络技术对城市生活的影响已经深入到各个方面,城市规划、建设与管理正在发生历史性的变革,城市三维建模与可视化等数字城市技术已经成为主要的发展方向。数字城市的核心部分——空间信息平台为城市信息化提供了统一的数字平台,解决了空间数据的高效共享与互操作,实现了数据资源的共建共享。然而,数据库中所隐藏的丰富知识远远没有得到充分的发掘和利用,数据库的急剧增长和人们对数据库处理和理解的困难形成了强烈的反差,导致“人们被数据淹没,但却饥饿于知识”的现象[1]。面对日益丰富的空间数据,如何深入开发利用城市泛在空间的信息资源,从中提取隐含的知识、空间关系和特征,发现人们未知的各种空间规律和趋势,在共享集成之后将信息内容由基本的地理现象分布转移到深层次的特征规律信息挖掘,从而进一步提升其服务附加值,为城市建设管理各部门提供高层次的智能化信息服务,是“数字城市”发展领域所面临的重要问题之一,也对现代测绘地理信息技术提出了新的挑战[2]。
城市基础设施(Urban Infrastructure)是城市中为顺利进行各项经济活动和其他社会活动而建设的各类城市生存和发展所必须具备的工程性基础设施和社会性基础设施的总称。作为城市政治、经济、文化活动中所产生的物质流、人口流、交通流、信息流的庞大载体,城市基础设施已成为当今城市赖以生存和发展的重要基础条件[2]。城市POI数据涵盖了城市各类公共基础设施的位置信息与属性信息,本文对城市POI点设施的分布特征进行分析,并利用多种可视化形式展示分布热点、密度、趋势等分布特征,同时从宏观上获取城市基础设施的分布特征,为城市规划、管理提供决策服务。
2 空间点模式分析的理论与方法
现实世界中许多地理实体或现象都可以抽象为点对象,并用点图反映它们的空间分布规律,如ATM机分布图、商业网点分布图等。据统计,每4个空间分布中就存在一个点模式分布,它主要关注空间点实体的位置特征,尤其是分布特征和相互关系,而且每个点模式分布都有它自己的一套特定标准。根据美国地理学家Tobler的地理学第一定律——“任何事物之间都相互关联,但是距离相近的事物比距离相远的事物之间的关联更加紧密”[3],可知地理事物或属性在空间分布上互为相关,且存在集聚(Clustering)、随机(Random)、规则(Regularity)分布[4]。如图1所示:
图1 三种点模式的分布类型
描述参量是对空间分布的数字化描述,根据郭仁忠[2]和艾廷华[4]对于空间点模式分布特征的研究,表达点群空间分布特征的描述参量主要有分布范围、分布密度、分布中心和分布轴线4个参量。
常用的点模式分析方法主要包括样方法、最近邻距离法、核密度估计法等[5]。
在样方法中,每个样方单元内点的数量被看做它的属性,最终通过统计规律得出点的空间分布特征。然而,这种方法由于在样方尺寸、样方方向、样方原点的选择上都具有不同程度的主观臆断性,因而容易造成原始数据信息的丢失。
最近邻距离法的基本思想是首先测出每个点与其最邻近点之间的距离,然后将量测值与某种理论模式中的最近邻点之间的距离值进行对比,从整个研究区域的角度来测定点集分布特征。最近邻距离法在计算中存在研究区域范围边界界定的影响问题,因此研究者需要对研究区域边界进行限制校正[6]。
为了弥补样方法具有丢失部分数据信息的缺点,一个较好的解决方法就是与样方法中逐个单元进行计算的方法(如图2a所示)不同,而是考虑在一个移动“窗口”中每个区域单元内点的数量,分别以各空间位置处的点为圆心,选择固定的区域半径得到它们的密度估计值(如图2b所示)。这比从假定的固定正方形样方中获得的整个研究区域内密度值的变化显得更加平滑。这种方法即可近似看成是一种核密度估计的方法,它的结果具有渐变性和揭示细部特征的优势。
图2 样方法与核密度估计法示意图
核密度估计是一种非参数估计的方法,它主要被应用于对随机变量的密度函数进行计算,回归函数的形式具有任意性,变量的分布约束也相对较少,具有较强的适应性。核密度估计函数通过以下几个步骤在研究区域内构造一个表示点群密度变化的平面:首先,将网格置于研究区域及点群分布之上;然后用一个移动的三维函数观察每个单元,计算搜索半径内每个点的权重值;最后通过求每个位置的圆表面的权重值之和计算得到格网单元的密度值[5]。
核密度估计可以由下式计算得出:
λ(s)表示位置s处点的密度,r表示核密度估计的搜索半径(只有在点实体r半径范围内的部分才用于计算λ(s)),k表示点i在与点s距离dis处的权重。k通常被建模为一个dis与r比值的函数(称为核函数)。核密度估计法采用考虑“距离衰减效应”的模型函数,所有以s为中心、r为搜索半径内的点都根据它们与s的距离来决定权重的大小,最终总计为s处的密度值。结果相比于选择一个在搜索半径r范围内所有点的权重相等的统一函数,能够获得一个既能够保持整体结构特征且具有高质量的概率密度估计结果[7]。
许多函数都可以用作核函数来考虑“距离衰减效应”的权重k值,如高斯函数、四次函数、二次函数、负指数函数等。其中,最常使用的核函数包括高斯函数、四次函数和最小方差函数。
3 网络空间下POI点的分布密度分析及可视化
3.1城市网络空间分析
距离是空间分析的基础,在传统的地理信息系统空间分析中,除路径通达采用最短路径距离(Dijkstra’s) 外,空间统计、分布密度分析、Voronoi图空间剖分、聚类分析和空间关联等还是基于欧式距离即直线距离。
欧式距离的几何度量方法是将空间分析区域视作均质空间,然而在城市空间度量中,距离与旅行代价不呈线性关系而且呈各向异性,表现出明显的非欧几何特点。尤其是对于大量依附于泛在的城市道路网络空间分布的城市基础设施,比如学校、医院、银行、超市等,这些基础设施的入口均与道路相邻,它们的服务功能以及相互联系均依赖于网络路径的传导方式。若仍然采用欧式距离对其进行空间分析,就会忽略城市空间通达与连接都是沿着道路网络路径的事实,因而很难真实客观地反映实际情形。
虽然有大量潜在的需求,但相关的统计方法一直很少。其原因归结起来主要包括以下几个方面:
(1)详细的道路网络上点的位置数据(如道路网络上的交通事故发生点等)不容易获取;
(2)管理以道路网络空间为载体的数据非常困难;
(3)道路网络上的计算比欧式平面上的计算困难。
近年来,这些技术难题已经逐渐被解决,详尽的空间网络数据可以从互联网中获取,一些面向用户友好的地理信息系统(如ArcGIS)解决了道路网络数据的管理问题。然而在计算方法方面,尽管一些初步的研究已经可以在相关文献中找到,但是网络空间分析的理论统计方法还远远落后于前两者所取得的进步。
城市网络空间分析将欧式空间下的概念、方法转移到城市道路网络空间并作相应的改善,用网络空间代替欧式空间针对点群的分布特征进行研究,可以得到更加准确与合理的结果,具有重要的研究意义和广阔的应用前景。
3.2网络空间分布密度计算
由于在网络核密度估计中,核密度函数中的距离被定义为网络中的最短路径距离,从而能够更加准确、敏感地表达城市POI基础设施沿城市道路网络分布的细部特征,因此本文采用核密度估计法进行计算。
根据网络空间的线性特征,可以将核密度估计表示为:
与平面核密度估计法计算单位区域内点的密度不同,上式通过计算网络栅格即单位长度内点的密度来获得估计值。平面核密度估计法中提到的三种核函数(高斯函数、四次函数、最小方差函数)同样适用于网络核密度估计法且结果基本一致。许多已有的核函数估计法研究表明核函数的选择对点模式分布结果的影响要小于距离衰减阈值r产生的影响。r值可以控制点密度分布的平滑程度而成为最重要的影响因素,r值越大,密度分布就表现得越光滑。距离衰减值的确定需要考虑两个主要因素:一个是研究的尺度问题,较小的距离衰减值可以揭示密度分布的局部特征,而较大的距离衰减值则可以在全局尺度下使热点区域体现得更加明显;另外还要考虑设施点之间的离散程度问题,距离衰减值应与设施点的离散程度呈正相关,对于稀疏型的点设施分布应采用较大的距离衰减值,相反对于密集型的点设施则应考虑较小一些的距离衰减值才能得到令人满意的核密度分析结果[6,7]。
网络核密度估计的主要算法如下:
(1)创建一个基于网络弧段的线性参考系统。将两个相邻道路交叉口之间的线段以及道路交叉口与相邻道路端点之间的悬挂线段均分割成网络弧段。如果两个交叉口之间有多条连接,则每条连接都被看做是各自单独的网络弧段。
(2)将每条网络弧段用一个定义的网络长度即网络栅格(相当于二维栅格中的一个栅格单元)分割成基本的线性单元,两个网络栅格之间的交点被称为网络节点。同二维栅格中的像元分辨率一样,它可以影响点密度分布的局部细节特征。网络栅格的使用不仅有助于密度估计中规则分布位置的系统选择,而且可以通过提高计算效率使得网络核密度估计的应用更加切实可行。
(3)通过建立网络栅格之间以及网络栅格和网络节点之间的网络拓扑关系构造一个完整的由网络栅格组成的网络栅格数据结构。
(4)建立所有网络栅格的中心点。
(5)选择一类发生于网络空间的点模式开始进行网络核密度分析。
(6)对于每个点实体,找到与它直线距离最邻近的网络栅格,与一个网络栅格邻近的点实体总数成为该网络栅格的属性,属性非零的网络栅格可以被定义为发生元。
(7)定义一个搜索半径r,即网络距离衰减阈值。
(8)计算每个发生元的中心点到网络距离衰减阈值r内所有相邻网络栅格中心点的最短路径距离。此处需要注意的是所有路径距离小于r的相邻网络栅格都应被考虑其中。
(9)在每个发生元以及它的所有相邻网络栅格的中心点处,基于所选择的核函数、网络距离和发生元的点实体数计算其密度值。
(10)在与发生元的距离小于阈值以内的每个网络栅格的中心点处,合计来自不同发生元的密度值之和,并将总密度值分配给该网络栅格。对于其他网络栅格,密度缺省值为零。
网络核密度估计法相比于平面核密度估计法,在以下几个方面存在显著差异:①网络空间取代欧式空间被看做点集的上下文;②距离衰减阈值和核函数都是基于网络中的最短路径距离而非传统的欧式直线距离;③密度以单位长度网络栅格而非单位区域进行量测。
由此产生的分布特征结果也是有所差别的,平面核密度估计产生的是二维的结果,网络核密度产生的是一维的量测,因此平面核密度估计法容易造成过度探测聚类的模式(如图3所示)。基于道路网络距离建立的核密度算法更适合城市空间设施的分布特征、分布模式、影响范围和服务功能的研究。
图3 两种方法产生的聚类效果对比
3.3可视化表达
空间信息可视化表达的原始空间数据仅仅能够回答“在何处”与“有何物”的问题,而要进一步得到“为什么”和“怎么样”的内容则需要再对数据进行深度的加工。通过空间数据挖掘分析的手段,得到空间数据的空间特征、分布模式、影响因素等空间知识,并利用空间知识可视化工具进行合理有效的可视化表达。可视化作为现代地图的核心,对数字城市进行空间知识可视化,可以通过将地图可视化功能作为探索分析工具去发掘空间知识,从而实现了地图功能从信息传播到知识发现的进步。
道路网络空间下的点设施密度可视化需要采取多种不同可视化策略以反映网络空间的线性特征。通常与线性要素相关的可视化参量主要包括三种,即线的颜色、线的宽度和高度[8],如图4所示。可视化表达可以通过其中一种参量、两种参量或者三种参量的结合来共同实现。
图4 网络空间的几种可视化参量[6]
为了突出城市道路网络的空间载体特征,本文将网络核密度估计的结果以三维立体的形式进行可视化。将密度值作为z值,将线状道路网络转换为墙状的道路网,通过墙状路网高度上的高低起伏可以形象地表现出设施点沿道路网络分布的聚集程度和分布热点。另外,为了视觉观察效果更加直观明显,还对该墙状路网进行分级设色,如图5所示。
图5 墙状路网效果图
考虑到分布密度在城市空间分析、规划、管理等领域所起到的辅助决策作用以及可视化的美观性和完整性,将上述可视化成果与城市的行政区划图相结合以展示和检验城市的总体规划布局以及不同城市空间区域的职能划分,同时也可以将道路等级信息以覆盖于墙状路网之上等形式加到密度计算结果之中,以便于分析道路等级与城市基础设施分布之间存在的隐含关系。最后按密度值将立体墙的高度进行比例拉伸得到全局密度效果图,在不丢失空间分布密度特征的前提下,对于分布稀疏数据的立体墙进行适当的放大拉伸,以突出其分布热点和局部对比效果。
图6 三维可视化局部效果图
3.4实验分析
本文从深圳市POI点数据中分别选取城镇居民点、长途汽车站、垃圾回收站三种不同分布特征(密集型、稀疏型、随机型)的代表性城市基础设施数据,结合深圳市道路网络数据,运用核密度统计的方法进行网络路径空间下的密度分析实验,得到以下实验结果。
图7 城镇居民点密度图
图7为呈聚集型分布的城镇居民点密度图。由图可知:①其最密集区域主要集中在深圳市西南部的南山、福田、罗湖三个区,即城市布局结构规划图[9]中的前海和福田——罗湖两个城市主中心。另外,在总体规划的“三条轴”区域也分布有较密集的城镇居民点。②城镇居民点在高级公路周围密度较低,多分布于城市主干道和次要道路上。这种分布既符合城市居民的生活习惯又能满足城市居民出行的便利要求。
图8 长途汽车站密度图
图8为呈稀疏型分布的长途汽车站密度图。在城市的东、中、西部几个分区均有适当数量的长途汽车站分布,密度墙的高度尽管经过拉伸处理但仍显现出比较低矮的特征,没有出现高度突出的密度墙,说明它的分布比较分散,密度比较稀疏。由于长途汽车站属于城市交通设施,需要考虑整个城市空间的需求,聚集分布容易造成交通拥堵同时也不利于人们的乘车出行,稀疏型的分布可以供生活在不同区域的市民就近选择也可以满足城市交通需求,既缓解了交通压力又不会造成城市建设资源的过度浪费。
图9 垃圾回收站密度图
图9为呈随机型分布的垃圾回收站密度图。城市各主要区域空间处密度墙的高度基本相同,呈现随机分布的特点。垃圾回收站作为市政网点的内容之一,与居民的生产生活息息相关,随机型分布可以照顾到居住在不同区域的城市居民,有利于垃圾的及时清理和回收,并保证城市环境的整洁。
4 总 结
本文从网络空间路径距离出发对城市基础设施分布密度进行分析,弥补了欧式空间忽略道路连通性的不足,运用符合地理学第一定律的核密度法保证了空间分布的连续性和变化的渐进性。结合城市地理、城市规划相关知识,从宏观层面对城市基础设施的分布特征进行讨论,得到如城镇人口集中分布于的城市繁华地区,汽车站等交通设施沿道路呈稀疏分布,垃圾回收站等市政网点呈随机分布等定性结论,结果与城市总体规划方向相契合。本研究可为城市管理与规划、宏观决策、大众服务和“智慧城市”建设等领域提供更加科学合理的技术支持与服务。
参考文献
[1] 周海燕,王家耀,吴升.空间数据挖掘技术及其应用[J].测绘通报,2002,11(2).
[2] 郭仁忠.空间分析[M].武汉测绘科技大学出版社, 2000.
[3] Miller H J.Tobler's first law and spatial analysis[J].Annals of the Association of American Geographers,2004,94 (2):284~289.
[4] 艾廷华,刘耀林.保持空间分布特征的群点化简方法[J].测绘学报,2002,31(2):175~181.
[5] 毛政元,李霖.空间模式的测度及其应用[M].科学出版社,2004.
[6] Okabe,Yamada.The K-Function Method on a Network and Its Computational Implementation.Geographical Analysis, 2001,33(3):271~290.
[7] Xie Z,Yan J.Kernel density estimation of traffic accidents in a network space [ J].Computers, Environment and Urban Systems,2008,32(5):396~406.
[8] McCormick B H,DeFanti T A,Brown M D.Visualization in Scientific Computing[J].Computer Graphics,1987,21(6): 973~982.
[9] 深圳市规划和国土资源委员会,深圳市城市总体规划(2010-2020).http:/ / www.szpl.gov.cn/ xxgk/ csgh/ csztgh/201009/ t20100929_60694.htm,2010-09-29.
Analysis and Visualization of POI Distribution Density Based on Urban Network Space
Wang Shuang,Li Jiong
(Tianjin Institute of Surveying and Mapping,Tianjin 300381,China)
Abstract:According to the construction needs of the digital city and spatial information infrastructure platform,kernel density estimation and network kernel density estimation methods based on the first law of geography are introduced.The distribution characteristics of urban POI facilities in Euclidean space and road network space is analyzed and explored experimentally.Through displaying hotspot,density,trend in a variety of visual methods,we can achieve the macro distribution characteristic of urban infrastructures and provide the decision service for urban planning and management.
Key words:distribution density;network space;POI;kernel density estimation;visualization
文章编号:1672-8262(2015)01-21-05中图分类号:P208.2
文献标识码:A
收稿日期:∗2014—10—15
作者简介:王爽(1989—),女,硕士,助理工程师,主要研究方向:地图制图与地理信息服务。
基金项目:国家“863计划”资助项目(2012AA12A404)