POI数据辅助下的泸州市城市地块用地类型现状快速判断与验证*
2020-01-10辜寄蓉吴修月黄志勤冯义从方从刚
辜寄蓉,吴修月,黄志勤,冯义从,方从刚
(1.四川师范大学地理与资源科学学院,成都 610101;2.四川省国土资源厅信息中心,成都 610072;3.成都市国土资源信息中心,四川成都 610032)
0 引言
当今是一个大数据时代,丰富的数据获取渠道和大规模的数据量为城市研究和城市管理带来了新的机遇[1]。城市地块是城市土地功能和人类活动的载体。城市地块用地类型的判别,在传统数据环境下主要通过土地供地类型或城市规划类型来确定,这两种方法都是规划时点时对地块未来的利用状况进行的设计与安排。现在城市发展日新月异,城市地块用地类型的变化也是非常迅速的,如何快速捕捉城市地块用地类型的变化,只有辅以对变化敏感的网络大数据,通过对大数据的挖掘,建立基于大数据的用地分类方法,快速精准地对地类进行识别,实现对城市土地的精细化管理。
网络大数据是指“人、机、物”三元世界在网络空间(Cyberspace)中交互、融合所产生并在互联网上可获得的大数据[2-4]。目前可以通过网络平台中的专业软件、GPS、网络日志等工具来采集诸如兴趣点(Point of Interest,POI)数据、智能手机数据、公交智能卡数据、签到数据、出租车轨迹数据等开放式的网络大数据,其丰富的数据获取渠道和大规模的数据量为智慧城市的研究工作提供了保障。
在此背景下,国内外一些学者突破传统的用地类型识别方法,使用开放路网数据、出租车活动的GPS数据、地理位置标签等居民数字足迹实现对土地利用类型的动态感知[5]。Toole等[6](2012)利用波士顿地区大约60万匿名用户的移动电话的呼叫详细记录(CDR)数据,分析了居住用地、商业用地、工业用地、公园等其他用的时空特征,以此来推断城市用地类型。Hollenstein 等[7](2013)通过获取800万个Flikr网站上公开的有位置、时间等信息的图像数据来确定伦敦、芝加哥悉等6个城市的核心区域。龙瀛等(2014)提出了利用OSM数据和POI自动识别来描述地块的方法,其中利用路网数据划定地块边界,POI数据来识别生成地块的开发密度、功能、混合使用程度以及人类活动。池娇等[8](2016)利用POI数据的类型划分出武汉市都市发展区的城市功能区进行划分及可视化。梁军辉等[5](2016)在分析海量出租车GPS数据与城市用地类型之间的相关关系的基础上,对深圳市福田区城市土地利用类型进行动态感知。大数据的应用较好地避免了因为“数据孤岛”所导致的研究数据缺乏的问题,使得研究数据不在限于部门或行业的数据;同时由于大数据来源丰富、更新快速的特点,也使得研究的角度更丰富,可以更好地支撑如规划实施验证等问题。当前基于大数据对城市用地分类的理念和方法进行革新,已成为研究的重要方向[2-4]。
1 数据来源及数据处理
泸州是地处长江上游的地级市,位于四川省东南部,长江和沱江的交汇处。由于研究区域最好具有丰富的城市道路网和较完整的城市用地规划以及聚集的城市活动这样的特征,我们选取了泸州市城市规划中所定义的中心城区范围中的核心区域作为研究区。研究区包括泸州市的江阳区和龙马潭区的部分区域。
文章利用开放道路数据(OSM)和兴趣点(POI)数据对泸州市中心城区的核心区域进行城市用地地块类型的识别与分析。该研究中涉及的大数据包括ESRI公司的开放路网数据Open Street Map(OSM),腾讯公司的开放兴趣点数据Point of Interest(POI)。为判断POI数据对城市地块用地类型分类结果的准确性,我们利用地籍数据进行了用地分类的划分,将两者的划分结果进行对比分析。
1.1 POI数据处理
互联网地图的兴趣点是面向大众的。如谷歌、百度等网站允许市民提供他们自己感兴趣地点的描述和这些地点的位置信息,其POI信息基本包含人们日常需要了解的信息。由于POI数据分类并不支持进行城市用地类型的判别,因此,一方面要在对POI数据进行清理,形成与城市用地分类(GB50137-2011)的对应关系;另一方面,一个城市地块上会有多个不同类型的POI点,研究建立了一种测算方法,将多类型POI点汇总为一种城市土地利用类型。
该研究中收集的POI来自腾讯地图(截止2016年6月),并根据腾讯地图的POI分类关键词进行了重新分类(图1)。共分为15大类,150个二级类,二级类中可能包含三级类。每条POI记录中包含经度、纬度、名称、地址、电话、类别6个属性。
为进行城市用地类型识别,需要将POI分类与城市用地分类标准相匹配,得到POI分类与城市用地分类的映射关系。同时对原始POI数据中,存在类别误分数据进行清理。其中,POI数据中与仓储物流有关的点大多是一些物流公司、快递服务点,属于“公司企业”分类,与城市用地分类标准中所规定的“仓储用地”的定义不符。因此,取消此城市用地类型。具体分类映射关系图如图2所示。
1.2 路网数据处理
路网地图数据是构建城市地块的不可缺少的支撑。该研究中,城市现状路网数据来源于ESRI公司的OpenStreetMap(http://www.openstreetmap.org/获取时间2016年2月),数据精度1∶1万,其提供的道路网数据中包括名称、类型、长度等属性。由于泸州是二级城市,其OSM数据只包括了部分主干道、次干道和铁路等,而城市内部街道的路网数据不完整。研究中,使用天地图上下载的高清影像图(1.194 3m,17级)对研究区的城市内部道路进补充和修正,并将OSM数据集中的双线道路处理为单线道路。研究区道路网成果如图2所示。
构建通畅的信息交流渠道。政府等相关部门应该及时有效地对食品企业进行安全教育培训及指导,鼓励社会力量和企业积极参与到食品安全建设的工作中,从而有效构建信息披露途径。同时,企业在政府、社会企业的监督和管理之下,需要向社会公众和监督部门及时披露食品安全信息,一旦发生安全问题应该及时利用媒介向公众道歉,做好公关处理和善后工作。
图2 研究区道路分布
1.3 地籍数据处理
地籍数据是通过对每一宗地(由界址线包围的土地)的土地权属、位置、界址、数量、质量以及利用状况进行调查和测量后绘制而成的地图数据[8]。由于城市用地地块大于城镇地籍图斑,研究以城市用地分类标准(GB50137-2011)为准则,建立土地利用分类与之的映射关系(图3)。研究区内,各类用地的面积汇总见表1。
图3 地籍数据与城市用地分类映射关系
该文将利用泸州市第二次土地调查形成的地籍数据与POI数据得到的结果进行对比,检验POI数据得到的城市用地类型精度。
2 用地类型判定
该文以街区为研究对象,利用网络大数据中的POI数据和开放路网数据,对城市地块进行划分,判定城市地块用地类型,并进行验证。具体的技术流程如图4所示。
图4 技术流程
图5 城市地块
2.1 提取城市地块
地块是指可辨认出同类属性的最小土地单元,即内部特性和区位条件相对均匀的土地区域,是评定和划定土地级别的基本空间单位[9]。在不同的尺度上,地块表现为不同的形式,其面积可大可小[11]。该文中的地块是指在街区尺度上,经由城市道路所划分出来的城市地块。城市地块划分步骤为:①在OSM数据的基础上绘制并创建研究区路网线图层;②对创建的线图层进行数据检查和道路修剪,去除没有与其他道路相连接的街道,确保道路数据图层具有完整的拓扑连接关系,具体结果如图5所示;③根据城市道路设计规范设定道路缓冲宽度:主干路(35m)、次干路(25m)、支路(15m),从而形成道路的面图层;④利用道路的面图层对研究区进行擦除处理,其形成的剩余空间则为城市地块,共计372个。具体的城市地块划分结果如图6所示。
2.2 基于POI数据的用地类型判别
考虑到某些POI点分散在城市街道上,未处于相邻的地块内,因此对2.1中获取的城市地块,设立10m的缓冲区,以便能囊括更多的POI点。
分别统计每个地块及缓冲范围内,不同类型的POI数量。对每个地块单元,构建指标频数密度(frequency density,FD)和类型比例(category ration,CR)来识别地块用地类型[12-14],计算公式为:
(1)
(2)
表2 POI数据地块类型
式(1)、(2)中,i表示POI类型;ni表示地块单元内第i种类型POI数量;Ni表示第i种类型POI总数;Fi表示第i种类型POI占该类型POI总数的频数密度;Ci表示第i中类型POI的频数密度占单元内所有类型POI频数密度的比例。
研究中将类型比例值是否超过50%作为判断单元用地类型的标准。当某一地块单元中某种类型的POI比例占到50%及以上时,根据图1所确定的POI与城市用地类型的映射关系,判定该地块单元的城市用地类型;而当单元内所有类型的POI比例均没有到达50%时,判定该地块单元为混合地类;当单元内不包含POI,即类型比例为空值时,判定该地块单元为无数据区。分类结果如图6所示,统计结果如表2所示。
图6 POI地块类型识别图 图7 地籍数据地块类型识别图
2.3 基于地籍数据的用地类型判别
将该区域的地籍数据与2.1提取的城市地块进行叠加,计算研究区不同地块上不同类型地籍数据的面积占比(A)和类型比例(R),计算公式为:
(3)
(4)
表3 地籍数据地块类型
式(3)、(4)中,i表示地籍数据的类型;si表示某地块单元内地块中第i种类型地籍数据的面积,Si表示i种类型地籍数据的总面积;Ai表示第i种类型地籍数据占该种类型地籍数据的比例;Ri表示第i中类型地籍数据的频数密度占单元内所有类型地籍数据频数密度的比例。
将研究中类型比例值是否超过50%作为判断标准。当某一地块单元中某种类型的地籍数据比例占到50%及以上时,根据图2所确定的土地利用分类与城市用地类型的映射关系,判定该地块单元的城市土地用地类型。当单元内所有类型的地籍数据比例均没有到达50%时,判定该地块单元为混合地类。当单元内不包含地籍数据,即类型比例为空值时,判定该地块单元为无数据区。分类结果如图7所示,统计结果如表3所示。
3 判定结果验证
将2.2和2.3中两类判别结果进行对比,统计分析其分类结果的一致性和差异性。
3.1 一致性验证
分类结果一致性的统计是以POI分类结果为基准,统计地籍数据分类结果中与POI分类结果相一致和不一致的地块个数和类型,建立地块用地类型一致性判断矩阵统计,具体统计结果如表4所示。
表4 地块用地类型一致性判断矩阵
图8 空间分布差异图
3.2 典型区域验证
由表4可以看出:①POI识别的无数据区地块中有67%的地块被地籍数据识别为居住用地的地块;②POI识别的居住用地共有69个,而地籍数据识别的居住用地地块共有175个;③POI识别的公共管理与公共服务设施用地与地籍数据识别的同类地块有一定的差距。POI将一部分地籍数据判定的公共管理用地识别为混合用地,而POI判定的公共管理与公共服务设施用地被地籍数据多数判定为居住用地和商业用地等;④POI识别的商业服务设施用地地块中,绝大多被地籍数据识别的为居住用地地块;⑤POI识别的类型为绿地的地块比地籍数据识别的地块多出接近一半,且相同的地块也较少,不一致的地块主要表现在地籍数据判定为居住用地和商业用地的地块中;⑥POI识别的交通设施用地地块与地籍数据识别的交通设施用地地块完全不重合;⑦POI识别的混合用地地块有74个,而地籍数据识别的混合用地地块只有9个;⑧POI数据中关于物流仓储的数据多为快递公司或物流公司等点位信息,且网络中POI的分类体系中没有明确的物流仓储这一分类,因此城市用地类型中物流仓储用地缺失。通过地籍数据可识别出该类用地的地块。一致性对比统计结果显示,地块类型一致的地块仅有72处。将这72处用地进行空间对比,可以发现,分类结果一致的地块在研究区中分布的比较零散,研究区中的绝大部分地块的分类结果都不一致,分布对比结果如图8。对研究区中的以下两个区域(红色区域和黄色区域)进行对比分析。
由图9和图10对比可以看出,分类不一致的地块主要集中在研究区的中部、东部以及河道以南区域。中部区域(红色圈)是泸州市主城区的核心区域,这里人口分布密度高,经济活跃,经历史的积累聚集了大量的商业服务设施,这一区域的商业繁华,是大型购物中心、商业街区的聚集地。从POI的分类结果中可以看出,该地区主要是由商业服务设施用地和工业用地组成,但是地籍数据的分类结果中该地区的绝大部分地块均为居住用地。
从图11和图12对比可以看出,黄色区域在POI识别结果中显示多为混合用地类型的地块以及少量的居住用地地块;而在地籍数据的识别中,这一区域的地块类型多为单一类型的地块,主要以工业用地、居住用地和公共管理与公共服务设施用地为主。
图9 红色区域POI 分类结果 图10 红色区域地籍数据分类结果
图11 黄色区域POI数据分类结果 图12 黄色区域地籍数据分类结果
4 总论与建议
土地利用规划和城市规划的用地地块,在实际使用过程中,都会不同程度与规划用途产生差异。因此分析结果中,基于POI数据的城市地块识别结果与基于地籍数据的城市地块识别结果存在很大的差别,这个结果是正确的,正说明了实际用地过程中形成的土地利用类型与规划时的预判出现了较大的差异。一方面说明了规划的刚性有余,而弹性不足;另一方面也说明在城市用地监督执法中的执法力度不够,监控方法落后,无法快速捕捉到用地类型超越规划的变化。
POI点有准确的空间位置信息和丰富的属性信息,主要是表征城市地块中不同实体的真实使用状况,可以较准确地判定快速发展的城市进程中的城市用地类型,能较为真实反映城市地块的现实使用状况,可为规划实施的效果、效益评价提供决策依据。
通过该次研究,发现POI数据在实际的应用中存在的缺陷和不足,主要体现在以下几方面:(1)POI数据作为点状数据源,不同的POI点表征的实体对象面积不同,而实体对象的占地面积对该地块的用地类型有着重要的影响。在该次研究中,仅使用POI的数量来判定地块的用地类型,未能考虑到POI点所代表的占地面积的多少对用地类型识别结果的影响。(2)POI数据分布不均,且存在无POI的地区。在该次研究中,研究区中的某些边缘区域中,由于公众兴趣度低,没有采集相关的兴趣点,导致分类结果中存在较多的空值区。另外,城市中心区、商业发达区域的POI点数据多,且分布密,又造成判定的混合用地类型比较多的问题。(3)研究区域本身的社会、经济发展状况也对数据收集产生了比较大的影响。泸州是四川省的二级城市,其数据的丰富度、准确度,都赶不上成都市,甚至绵阳市、德阳市,因此前期数据收集工作是非常重要的。