基于兴趣点数据的南昌城市功能区识别
2022-06-27邓志杰王毓乾
李 岳,邓志杰,王毓乾,3*
(1.东华理工大学江西省数字国土重点实验室,330013,南昌;2.东华理工大学测绘工程学院,330013,南昌;3.自然资源部环鄱阳湖区域矿山环境监测与治理重点实验室,330013,南昌)
0 引言
城市功能区是城市或开发区实施城市规划、提供功能的基本空间单元[1-2]。科学合理的功能区规划是实现城市长远发展目标的关键。传统城市功能区划分主要基于研究调查与专家评价等方法,主观性极强。另外,遥感技术在城市功能区划分也有应用[3-4],但数据获取成本高,数据处理繁琐、时效性差。城市兴趣点(Point of interest,POI)是一类地理空间大数据。POI数据记录地理实体的空间信息和属性信息,包括实体的名称、地址、坐标、类型、评价等。其优势是信息覆盖面广,数据量大,便于定量分析。POI能够真实地反映各类社会经济活动[5],较好地满足了精细化城市空间布局[6]的要求,为城市功能区的识别提供了独特视角。高晓路等学者利用POI数据并结合Densi-Graph分析方法,界定了城市群的生长边界[7];雷志成使用GIS空间分析软件对来自百度地图的POI数据进行可视化分析,识别出了城市边缘区空间范围[8];张慧杰等人通过挖掘轨迹数据与POI语义分析,对具有一定特征的轨迹点进行相关密度聚类,从而识别城市功能区[9];池娇等基于POI数据对武汉都市发展区的功能用地进行了定量识别与可视化[10];窦旺胜等以济南市内5区为例,基于POI地理空间数据,构建频数密度和类型比例,识别济南市内5区城市功能用地并对识别结果进行了评价[11]。
利用POI进行城市功能区识别具有可行性,然而大部分研究城市用地功能时往往以城市主城区整体作为研究区域,缺乏对不同区县的单一用地以及混合用地的分析讨论。基于此,以南昌市内6区为研究对象,首先基于POI数据运用频数密度、类型比例等指标对城市单一功能用地和混合功能用地进行识别,统计不同区县不同功能用地占比并比较分析,构建混淆矩阵检验识别结果,并结合南昌市网络电子地图进行对比分析。
1 研究区与实验数据
1.1 研究区及单元划分
南昌市位于江西省中部偏北,是全省政治、经济、文化、科教和交通中心,总面积7 402 km2。本文选择划分四边形网格作为研究基本单元,规则格网能够保证研究单元相同,得到的计算结果分布均匀,网格单元大小对结果影响较大。网格规模越小,越能够显示城市功能细节,但实体建筑有不同的占地面积。考虑到现实中,大部分POI面积小于500 m2,同时借鉴已有的相关研究经验[12-13],将网格大小设定为500 m×500 m,总计有29 484个网格单元(图1)。研究所有数据统一转换为阿尔伯斯圆锥等面积投影。
图1 研究区网格图
1.2 POI数据来源和预处理
本文的POI数据来自高德地图平台,通过高德开放平台API (https://lbs.amap.com/)爬取。研究爬取的POI数据共271 572条, 获取时间为2020年2月。POI数据属性包括名称、类型、经度、纬度、地址和行政区6个字段。POI原始数据涵盖了23大类,每一大类又包括若干中类和小类。参照相关研究[10],选取与城市功能相关的15大类POI作为研究数据,利用Excel、Stata等软件对数据的筛选、清洗,剩余总计94 636条。由于高德官方分类并无单独的住宅区类别,需自行筛选,因此本文对居住用地未做单独区分,将其归类为商业服务业设施用地。如图2所示,将城市功能用地划分为公共管理与公共服务设施用地、商业服务业设施用地、工业用地、交通设施用地与绿地与广场用地共5种。
图2 POI数据分类
实体建筑被抽象为POI数据的过程中被忽略了占地面积。然而在实际生活中,不同建筑实体的占地面积差异很大,功能区单元内POI实体的占地面积对该单元功能性质有重要影响。此外,公众对各类POI显著程度的理解对单元的功能性质也有重要影响,本文参考赵卫锋[14]的公众认知度调查,其中公众对大型商场的认知度最高,其次是交通枢纽,而小区的认知度最低。根据POI实际的占地面积和公众认知度对南昌市各类POI赋予相应的分值,区间为1~100,将所有POI与权重分值相乘,最终得到研究所用的POI数据。如某网格单元原有POI有5个,其权重值为20分,在数据处理后该单元的POI数量为100个。
2 城市功能定量识别方法
本文在每个研究单元内构建POI频数密度(frequency density, FD)和类型比例 (category ratio, CR)指标用以识别500 m网格单元的城市功能,计算公式如下:
(1)
(2)
式中:i表示POI的类型;ni是网格内i种类型POI的数量;Ni表示i种类型POI的总数;Fi代表i种类型POI占该类型总数的密度;Ci表示i类型POI密度占所有类型POI密度的比例。
通过式(1)、式(2)计算每个网格单元的频数密度和将类型比例对城市功能进行判别分析。以Ci是否达到50%作为判断网格单元功能性质的标准。当网格单元内Ci达到50%及以上时,将该网格单元划分为“单一功能区”,其用地类型由该POI类型而定;当所有类型的POI比值都未达到50%时,将该网格单元划分为“混合功能区”,混合性质取决于类型比值前3的POI类型;无任何数据的网格划分为“无数据区”。
3 识别结果与精度评价
通过POI识别的城市单一功能区和混合功能区的总体分布如图3所示。总体呈同心圆的形式分布,单一功能区共4 187个网格,其分布介于城市郊区与城市核心之间,多数位于经济开发区、新建区、南昌县等外围行政区,在城市外围也有大量的零散单一功能区分布,基本是由于乡镇及交通线的POI数据导致;混合功能区主要分布在城市核心地带,共901个网格,大多集中于东湖区、西湖区、青云谱区及红谷滩区的沿江地带;无数据区的分布则位于非城市地带。
图3 南昌市单一功能区、混合功能区及无数据区
3.1 单一功能区
由于南昌市郊县地区包括安义县、进贤县和南昌县的单一功能区和混合功能区网格数量较少,本文仅以南昌市6个中心城区为主要对象,分区统计各个区内的单一功能网格数量,统计结果如表1所示,单一功能区的分布如图4所示。从数量上看新建区的各类单一功能用地分布皆是最多,新建区由于面积较大且包含梅岭景区与众多的乡镇,因此各类用地的分布都是数量较多且分布较为散乱。除新建区外,公共用地分布最多位于青山湖区,多集中于江西农业大学、华东交通大学、江西财经大学等地带,由于该区高校众多且分布较为集中,配套的各类科教文化设施也较多且集中;商业用地较多的是红谷滩区和青山湖区,分别是43个和34个,由于红谷滩区是2019年新设区,该区定位是金融商务区,且区内有南昌大学、南昌航空大学等规模较大的高校;工业用地多分布于城市周边,集中于新建区与青山湖区两个外围且面积较大的区,分别为289和138个;交通用地主要沿城市内外的各大交通干道分布,其数量基本与各区的管辖面积成正比;绿地与广场主要集中于各大景区、高校、湖泊及赣江沿江一带;从总数上看最少的是商业用地,共196个,最多的是交通用地,共656个。
表1 各区单一功能区分布统计/%
图4 南昌市中心城区单一功能区分布
从表1单一功能用地百分比分布情况可知,青山湖区工业用地占比最高为28%,青云谱区绿地占比最高为35%,其余4区城市功能用地占比最高的皆为交通用地,从大到小的顺序为西湖区、东湖区、新建区和红谷滩区,分别为45%、44%、32%和28%;西湖区绿地占比最低为11%,其余地区城市功能用地占比最低的皆为商业用地,从大到小的顺序为红谷滩区、新建区、青山湖区、青云谱区和东湖区,分别为14%、9%、7%、7%和1%。
3.2 混合功能区
混合功能区共有10种混合情况,分别由混合单元内占比前3的POI类型组成,例如,交通用地、公共用地、商业用地混合简称为“交公商”。混合功能区的分布如图5所示。混合功能区最多位于青山湖区共227个,东湖区最少72个,其余区从多到少是新建区、红谷滩区、青云谱区和西湖区,分别为117个、95个、91个、81个。从分布上看,混合功能区基本都集中于城市中心地带。城市是一个复杂的体系,在城市功能完善的中心地带,各类POI种类丰富,既使在500 m×500 m的尺寸内,也很少有单一的POI类型能代表整个区域的用地情况。混合功能用地基本覆盖东湖区、西湖区、青云谱区等核心城区的繁华地段,在红谷滩区沿江分布,在新建区、青山湖区等较大的区重点围绕各大高校、政府机构及商业街区分布。10种类型中,100个单元以上的类型从多到少以此为“交公商”“公工交”“工公商”,数量分别为255、129、114。不到100个单元的用地类型从多到少依次为“工交商”“公商绿”“交公绿”“工交绿”“交商绿”“工公绿”“工商绿”,分别为76、42、23、18、15、12、7。最少的是“工商绿”用地,最多的是“公商交”用地。商业用地多与公共用地和交通用地混合,工业用地则多与绿地、交通用地、公共用地混合。数量较多的混合类型中多有公共用地、商业用地、交通用地参与。
图5 南昌市中心城区混合用地分布
各区混合功能区百分比分布情况如表2所示,整体而言,“交公商”“公工交”和“工公商”混合功能用地占比较高,包含绿地的混合功能区占比较低,绿地属性POI中景区公园较多,占地面积较大,多为单一功能用地。各区县占比最高的混合用地皆为“交公商”用地,这说明城市核心区域多以交通、公共和商业混合用地为主。
表2 各区混合功能区分布统计/%
3.3 识别结果验证
在单一功能区随机选取60个样本单元建立混淆矩阵评价单一功能区的识别精度,并选取南昌市代表性区域验证识别结果。评价指标包括总体分类精度和Kappa系数。抽样网格样本的总体精度为85.00%,识别结果较高。Kappa系数为0.80,当Kappa值介于0.60~0.80时,分类精度较高,说明结果可信。真实城市用地功能结果参照高分辨率影像信息及相应网格对应的高德地图中所显示的地名、地物等属性信息。通过目视解译及属性信息查询,发现误分的样本单元为不同功能区之间的相邻区域,造成城市功能区识别与实际功能用地的不一致。兼具部分公共服务功能的工厂园区在 POI 重分类与功能识别中可能会被划分为商业服务业用地,此外,绿地中同时承载公共服务功能、商业功能与交通功能,在城市功能识别时被划分为其他功能区。
为检验混合用地识别结果的准确性,选取南昌市3个典型区域,对区域内及周围样本单元的高德地图卫星图像进行目视解译,将基于POI的城市功能识别结果与目视解译结果进行对比验证其准确性。
表3 各类用地样本混淆矩阵
3.3.1 东湖区八一广场 八一广场是南昌市的繁华地段,也是南昌市的知名景点之一,如图6所示,标识为A区,八一广场被识别为“交公商”混合用地,是交通服务、公共服务和商业活动密集区域。A区西北部绿色单元为单一功能绿地,对应八一公园,其余皆为混合功能用地,类型多为“公商绿”“交商绿”,商业特征与绿地广场特征明显,总体符合实际。
图6 八一广场识别结果对比图
3.3.2 昌北国际机场 昌北国际机场是南昌市重要的交通枢纽,如图7所示,对比区域标识为B区,B区内部基本由单一功能用地组成,内部最多的蓝色单元为交通设施用地,与机场的功能吻合。同时,B区中南部的蓝灰色和黄色单元为公共用地和商业用地,其位置对应为机场配套的宾馆、餐馆等设施。机场周围存在大量黑色单位为无数据区,总体识别结果与实际吻合。
图7 昌北机场识别结果对比图
3.3.3 南昌火车站 南昌火车站是中国铁路重要综合枢纽站之一,如图8所示,对比区域标识为C区,C区被识别为“交公商”混合用地,火车站作为重要交通设施,内部包含了酒店和商业设施,与火车站的功能相符合。C区周围皆为混合用地,类型多为“工公商”和“交公商”,火车站西部是住宅区、企业公司、学校和商业活动密集的区域,东北部是一条快速路,周围有大量酒店和商业店铺,总体上识别结果与实际相符合。
图8 南昌火车站识别结果对比图
4 结束语
城市的快速演变为城市规划和管理带来了新的挑战,划分城市功能区,对城市进行分区管理,则为城市规划者和管理者提供了一种新的思路。本文基于高德地图POI数据对南昌市进行单一功能区和混合功能区识别,结果表明基于POI数据的方法在分析城市功能区的分布特征与城市功能配置方面有较好效果,南昌市的混合功能区主要分布在城市核心地带,以交通、公共和商业混合用地为主,占比17.71%;单一功能区在南昌市分布最多且集中分布于城市郊区和城市核心之间,占比82.29%。然而,考虑到POI的时效性,并且存在少部分虚假数据,POI等互联网空间大数据仍存在不完全性和不确定性。此外,网格尺度的划分可能对城市功能区分析结果造成影响,根据不同城市的发展程度提出自适应的网格尺度划分有利于对于城市功能有更好的理解。