APP下载

多源数据协同下的城市建成区边界提取进展

2022-08-25邓昊键李恒凯

地理信息世界 2022年4期
关键词:建成区灯光边界

邓昊键,李恒凯

江西理工大学 土木与测绘工程学院,江西 赣州 341000

0 引 言

改革开放以来,中国城市经济快速发展加速了城市建成区的扩张。城市建成区是城市人口最密集、经济活动最频繁的区域。中国政府颁布《国家新型城镇化发展规划(2014-2020)》中明确提出要优化城市布局及形态、规范新城新区建设、改善城乡接合部环境等要求,中国各级政府也积极展开城市管理和规划等工作[1]。在城市规划设计研究院发布的《城市规划基本术语标准》(GB/T 50280—98)中对建成区这一概念阐述为:城市建成区是城市行政区范围内非农业生产建设的区域,建成区的边界也是城市的农业用地与非农业用地之间的界限[2]。当前,对建成区的提取与监测的难度在于建成区边界的判定。由于相关文件对建成区概念没有明确的定义,导致不同的学者对建成区的理解存在差异[3]。城市建成区是一个复杂的系统,具有边界模糊的典型特征[2]。随着经济发展、人口聚集,城市建成区的边界在不断动态扩张变化[4],使得城市中建成区与非建成区的边界难以界定[5]。因此,无论基于何种数据、采用何种方法提取的建成区边界都是相对的[6]。

虽然城市建成区的边界存在动态性、相对性,但无论是在现阶段还是在未来,对该领域的研究仍将具有深刻而又重要的意义。从研究理论上看,城市建成区边界识别是完善城市研究体系,支撑城市地理研究的基础性研究之一。从实践指导来看,通过精确提取城市建成区边界可以直接反映城市扩张[7],为有关部门的城市化评估、城市规划与调控提供参考。在城市建成区边界提取研究中,CROFT 在20 世纪70 年代末较先运用夜间灯光数据来提取城市建成区[8]。此后,许多学者都开始尝试利用夜间灯光数据提取一些城市的建成区边界。同期,一些陆地卫星影像数据也开始被应用于城市扩张监测、建成区边界提取等方面。在21 世纪初,具有高空间分辨率、丰富光谱信息的高光谱影像数据的出现为实现城市建成区边界的精确提取奠定了基础。而随着大数据时代的到来,蕴含空间位置信息的POI 数据被应用于建成区边界提取的研究中,进一步提高了边界提取的精细度。本文以研究采用的数据为主线,从数据处理、技术方法、应用研究及存在的问题等多方面进行归纳总结,对研究方向、热点进行展望,以期为未来建成区边界识别、提取相关研究提供参考。

1 城市建成区边界提取的数据与方法

1.1 夜间灯光数据与城市建成区边界提取

夜间灯光数据是在夜间无云条件下,通过传感器对地表中的居民地、港口等发出的灯光辐射进行收集、记录的数据[8]。由于建成区中的人口密度、人类活动的强度远大于非建成区,在夜间灯光数据中,建成区与非建成区的DN 值差异显著。基于此优势,许多国内外学者将夜间灯光数据广泛应用于对城市建成区的提取。常见的4 种夜间灯光数据产品(表1)。其中,美国国防气象卫星搭载的线性扫描业务系统(Defense Meteorological Satellite Program/Operational Linescan System,DMSP/OLS)、索米国家极轨道伙伴关系卫星搭载的可见光红外成像辐射仪(National Purchasing Partners-Visible Infrared Imager Radiometer Suite,NPPVIIRS)和珞珈一号夜间灯光数据被一些学者广泛应用于研究中,而火石夜间灯光数据为中科院遥感地面站基于NPP-VIIRS 传感器的夜光月度产品处理所得,该数据的时序较短,相关研究采用较少。同时,为了削弱夜间灯光数据在时序上的不稳定性以提高建成区提取精度,一些学者[9-19]尝试对研究区域的夜间灯光数据进行校正(表2)。

表1 研究中常用的夜间灯光数据Tab.1 Details of nighttime lighting data used in the study

表2 现有对夜间灯光数据校正的研究Tab.2 Existing research on nighttime lighting data correction

1.1.1 提取建成区边界的方法

通过总结、归纳前人的研究成果,发现当前提取建成区边界的灯光阈值主要有以下3 种方法。

1)突变检测法。建成区的灯光强度大且呈完整的多边形连续分布,而非建成区的灯光强度小,灯光形状呈零星状分布。当较完整的多边形与零星状灯光交接变化处即为建成区的边界[20]。IMHOFF 等人利用美国地区灯光数据进行多次尝试后发现,城市建成区内部不会随着夜间灯光DN 值增加而表现为破碎状,而是仍然保持完整的多边形状[21]。

2)经验阈值法。按照夜间灯光数据的特征和基于前人的经验设定阈值,超过阈值且呈多边形形状的像元集合作为建成区。其中,SUTTON 借用经验法,通过研究城市边缘距离,提取城区面积,来建立人口密度模型[22]。而陈晋等使用前人开发的经验阈值判别程序,利用DMSP/OLS夜间灯光数据构建灯光指数探究中国城市化过程[23]。

3)参考比较法。设定一系列的阈值,提取出建成区结果与政府发布的统计数据及影像数据作比较,把误差最小时的阈值作为最佳阈值。有学者利用参考比较法对美国6 个州的建成区进行提取,发现50 为美国城市建成区边界提取的最佳阈值[24]。HENDERSON 等利用夜间灯光数据对北京、拉萨城市的建成区进行提取,并辅以较高分辨率的影像数据进行比较,发现北京、拉萨建成区分割的最佳阈值分别为30 和19[25]。

1.1.2 利用夜间灯光提取建成区的不足

1)夜间灯光数据分辨率较低。如DMSP/OLS 夜间灯光数据分辨率为1 km,合成的NPP/VIIR 夜间灯光数据分辨率为0.5 km,珞珈一号数据分辨率为0.13 km,分辨率远低于被用于研究城市土地动态检测的Landsat 系列、SPOT 系列等陆地卫星。当夜间灯光数据被作为单一研究数据源时,往往造成城市建成区边界提取的精细度较低。

2)夜间灯光存在像元饱和问题。如DMSP/OLS 夜间灯光数据饱和度为63,当像元DN 值饱和时,就无法反演实际夜间灯光增长量。针对DMSP/OLS 灯光数据存在的饱和问题,一些学者开展研究,以减少夜间灯光饱和对研究结果的影响。如HARA 等提出基于灯光像元DN 值频率分布的去饱和方法[26],LETU 等基于不变目标的去饱和方法[27],LU 等提出基于辅助参数的去饱和方法[28]。

3)受研究区域人口规模、城市等级及城市不同发展阶段的影响,研究者不能将某城市建成区的提取阈值作为通用标准。由于最佳灯光阈值往往是动态变化的,应构建基于城市人口、建设用地、GDP 等多因子变化的模型,以预测城市建成区边界阈值随时间的变化。

4)由于常用夜间灯光数据(表1)在传感器参数及时间序列上不具有一致性和可比性,需建立相应拟合校正模型,才能进行大跨度、长时序的研究。如DMSP/OLS数据成像时间为1992-2013 年,为非辐射定标的稳定灯光影像,像元为相对亮度辐射值。而NPP/VIIRS 数据成像时间是2012 至今,像元DN 值是经辐射定标处理所得。虽然梁丽等[29]使用多种模型对DMSP/OLS 与NPP/VIIRS 两种数据进行校正、拟合,但模型的最小均方误差根(RMSE)为8.33,两种夜间灯光数据之间的校正、拟合的效果仍存在较大偏差(表3)。

表3 DMSP/OLS 与 NPP/VIIRS 数据拟合结果及参数Tab.3 Data fitting results and parameters of DMSP/OLS and NPP/VIIRS

1.2 陆地卫星影像数据与城市建成区边界提取

陆地卫星影像数据具有连续性强、覆盖范围大、实时采集等特点,是当今动态监测城市最有效的数据源,被广泛应用于城市建成区边界的提取。当前,使用陆地卫星影像数据提取建成区边界主要是基于像元或研究对象的差异进行提取,研究方法包括:监督分类、非监督分类、人工神经网络分类法、归一化建筑指数法、三指数合成法、主成分分析法和基于光谱知识的信息提取模型法等[30-31]。本文根据研究采用的陆地卫星影像数据分辨率不同,将数据分为高分辨和中低分辨率分别进行概述。

1.2.1 高分陆地卫星影像数据的建成区边界提取

近年来,具有地物纹理信息丰富、成像光谱波段多等优势的高分辨率影像数据被大量应用于城市建成区边界提取的研究中。其中,李海江等利用边缘检测算子、滑动窗口算法及神经网络分类等方法提取出高分影像中建成区的边缘密度、纹理特征的两种合理区,对两种合理区的数据进行“与”“或”操作后实现建成区边界的提取[7]。但上述的算法对裸土、耕地混合区的建成区边界提取精度较低。针对此问题,邓刘洋等引入土地利用类型标准差信息,有效区分城市建成区与周边耕地的边界[2]。梅立琴利用高分影像中建成区与非建成区在光谱特征、局部关键点特征和纹理特征上的差异,提出融合多核学习、多尺度融合和多假设投票等方法对建成区及其边界进行检测。该方法检测的建成区完整性和正确率度都超过85%[32],但高分影像数据难以获取,很多高分影像数据需要购买。高分影像是近10 年才开始普及,缺乏历史存档数据,对于开展长时序的城市建成区研究存在困难。

1.2.2 中低分辨率陆地卫星影像数据的建成区边界提取

空间分辨率较低的Landsat、MODIS 系列陆地卫星影像数据由于方便获取,被许多学者广泛用于建成区提取的研究中。徐涵秋等利用归一化建筑指数(Normalized Difference Built-up Index,NDBI)和IBI 指数(Index-Based Built-up Index,IBI)相结合提取二值影像,将多模型相结合提取二值影像上的连通区域,根据城乡结合体的临界像元划分条件,对连通区域进行检测,提取出建成区边界及范围[33]。胡月瑶基于Landsat 影像数据,使用修正的归一化建筑指数(NDBI)先提取建成区的大致范围,再使用影像聚类法剔除建成区中的裸土区域,最后利用多种形态学运算和形态学偏重建方法对建成区边界进行形态重建及平滑处理[34]。由于植被受物候影响大,使用归一化植被指数(Normalized Difference Vegetation Index,NDVI)提取建成区的边界时提取的精度受季节影响的大。马丹等使用多种影像分类方法先大致地提取建成区范围,再借助多时相NDVI轨迹图数据,对提取的建成区进行修正,结果表明修正后的建成区总体精度提高了3.54%[35]。归一化建筑指数(NDBI)公式如下:

式中,NDBI为归一化建筑指数;SWIR1、NIR分别为遥感影像的短红外波段、近红外波段。

这些研究都是基于建成区与非建成区内部纹理特征差异或像元光谱差异,但也存在以下不足之处:在中低分辨率影像数据中,建成区边缘与裸土的光谱特征相似,所以在两者交错分布区域存在建成区边界提取精度不高的问题;部分研究以NDVI 为数据源构建提取的模型缺少对植被在季节、气候上变化的考虑,造成模型的通用性不强;大气状况等因素对影像影响大,容易出现像元混合问题。一些学者通过构造纹理波段的方法和改进分类算法实现对建成区边界的提取,取得了较好的研究成果。这些方法应用在高光谱影像上忽视了地物丰富的光谱信息,存在数据处理工作量大、模型运算时间长的问题。

1.3 POI数据与城市建成区边界提取

POI 是一种具有地理标识的空间大数据,含有名称、划分类型、地理位置等信息,被广泛应用于建成区提取的研究中。由于受聚类效应及规模效应的影响,建成区与非建成区内部的POI 点密度差异明显,建成区的POI密度稳定且显著高于非建成区。当将POI 数据作为提取建成区的单一数据源时,如果研究区域建成区与非建成区的边界过渡区的POI 核密度值变化平缓,则存在边界的POI 核密度阈值难以确定的问题。同时,由于各城市实际的POI 密度及POI 种类不同,造成已有研究中的POI 核密度阈值的通用性不高。

在利用POI 数据对建成区边界提取研究中,许泽宁等人提出的Densi-Graph 分析法(图1)最具代表性[36]。该方法是对分类后的POI 点数据集进行核密度分析,模拟POI 在城市空间中的分布形态。再根据POI 点的实际核密度和不同的研究问题,动态地设置带宽R,通过Densi-Graph 分析法对建成区的边界进行识别。最后根据核密度等值线的疏密程度及等值线间距确定城市建成区边界的阈值。同时,为了提高研究方法的适用性,将城市结构划分为单中心型、鱼眼型、字母型、单中心城市向农村过渡型4 种类型,根据每种城市结构的特性再进行建成区边界阈值的调整[36]。此后,一些学者都沿用Densi-Graph分析法确定建成区边界提取的密度阈值[37-38]。还有学者对该方法的分析步骤进行改进,如王善辉对车流轨迹数据进行二维密度格网插值密度分析,再构建多分辨率格网密度等值线对城市建成区进行提取[39]。

图1 Densi-Graph 分析法提取建成区流程Fig.1 Densi-Graph method to extract the process of built-up area

Densi-Graph 分析法公式如下:

POI 数据也存在局限性。当前,城市建成区扩张速度较快,而POI 数据更新速度较慢,可能导致研究结果存在一定的迟滞性;研究者爬取的POI 数据种类、数量不同,可能造成提取的建成区范围有误差;研究前期需投入较多时间和精力到前期POI 数据的预处理中,需对POI 数据进行大量的数据清洗、投影转换等工作。

1.4 多源数据融合的城市建成区边界提取

使用单一数据提取城市建成区边界时,因研究数据的局限性,研究者很难准确地提取建成区的边界。当前,基于多源数据提取建成区边界的主要思想是低粗取,高细化,即利用低分辨率的数据提取建成区大致边界,再使用高分辨率的数据进行精细提取。一些学者基于这一思想,融合了陆地卫星影像数据、POI 数据、夜间灯光等多源数据对建成区边界进行提取,也取得较好的研究成果。

1.4.1 POI数据与夜间灯光数据相融合

POI 数据具有精确的属性信息和空间位置信息,在建成区与非建成区的边界具有明显的突变特征,其优势可弥补夜间灯光数据的空间分辨率低的不足。而夜间灯光数据是通过传感器获取地表的灯光强度,可以弥补POI 数据种类不全的劣势。郑洪晗等先基于夜间灯光数据提取出深圳市建成区大致范围,再利用POI 数据核密度值提取建成区精细边界,并对边界进行相交计算、形态学运算,融合后提取的边界更能真实地反映深圳市建成区的边界[37]。厉飞等基于POI、珞珈一号和NPP/VIIRS 夜间灯光数据,利用构建的NTL&POI 综合指数与景观格局指数相结合提取城市建成区[38]。与使用夜间数据作为数据源的研究相比,该方法提取建成区精度提高了3%以上,研究结果也更好地反映了建成区的空间形态。上述研究表明,融合POI 数据与夜间灯光数据对建成区边界进行提取,不仅可以提高精度,也能更好地反映建成区的空间形态。

1.4.2 多源光学遥感数据相融合

在中低分辨率的陆地卫星影像中,建设用地与裸土区分难度大。而建成区边界存在大量建设用地与裸土交错分布。研究者基于中低分辨率影像数据提取建成区边界,提取精度往往不高。针对此问题,一些学者加入辅助数据进行优化。如王若曦等基于DMSP/OLS 数据,先利用腐蚀和开运算提取建成区大致边界,再引入Google Earth 高分影像对基于Landsat 影像提取的建成区进行修正,经修正的建成区边界精度达到89.7%[40]。相同思路的还有宋金超等人,在研究中还引入坡度数据与城市形态分类规则[41],进一步提高了边界提取的精度。

另一种研究思想是在没有辅助数据的前提下,充分挖掘现有夜间灯光或者陆地卫星影像数据的信息。如柴宝惠等在夜间灯光数据中采用阈值法提取出天津市建成区的大致范围,再采用多元变差函数和多波段的纹理特征对夜间灯光提取的建成区范围的影像进行分类[42]。虽然此方法可以有效地区分建成区边缘的裸土与建设用地,但存在分类方法复杂、模型运算量大的问题。为了减少建成区边界提取的工作量,刘智丽等将归一化建筑指数(NDBI)和城市夜间灯光指数(BANUI)相结合提取包头市的建成区,通过土地利用调查数据进行精度验证发现,该方法提取的建成区边界总精度可达93.61%[43]。上述的两种研究方法虽然有些差异,但数据融合后所提取的建成区边界精度高于使用单一数据源提取的精度。

1.4.3 多源光学遥感数据与大数据相融合

由于光学遥感数据与大数据都具有各自的优势与特点,一些学者也将二者相结合应用于建成区提取的研究中。如LI 等利用POI、夜间灯光数据和基于影像数据反演的地表温度数据构建城市建成区提取指数[44],该指数克服夜间灯光数据和低分辨率的局限性,有效提高了建成区提取的准确性。一些学者基于夜间灯光数据、POI、道路网和植被数据构建一个新的指数,并将该指数与动态阈值二分法相结合提取城市建成区[45]。该方法直观且易于实现,对于大规模提取建成区的效率较高。也有学者基于手机信令数据先识别出城市人类活动空间,再引入POI 数据、遥感影像数据和土地调查数据判断城市建成区的空间扩张或收缩情况[46]。虽然建成区提取中采用多源数据,会增加数据处理的工作量和难度,但能保留了建成区边界的细节结果,使提取的建成区边界更具有连通度。同时,不同数据的空间分辨率呈梯度等级分布,可以满足研究人员多尺度提取建成区边界的需求。

多源数据融合提取城市建成区的边界也存在不足之处。当采用数据的空间分辨率差异较大时,不同数据提取建成区的相交边界存在较大间隙,如采用分辨率为1 km 的DMSP 数据与分辨率达米级的POI 数据,二者提取的边界存在百米级甚至是千米级的间隙;多源数据提取的建成区边界存在的差异,需更精细的数据对研究结果进行辅助验证;多数据融合提取的建成区边界存在较多的要素破碎,需采用平滑规则或形态优化方法对边界进行处理。BELLENS 等[47]提出形态学偏重建算法被一些学者[37]用于对建成区边界要素的形态优化(图2)。

图2 建成区边界形态学处理Fig.2 Morphological processing of the built-up area boundary

2 结 论

本文回顾城市建成区边界识别的研究历程,总结出三大研究趋势:一是越来越多高分辨率影像数据被应用到研究中;二是多源数据相融合,一些学者将陆地卫星影像、夜间灯光以及其它空间大数据相结合,利用各数据的优势提高建成区边界提取的精度;三是研究者不断完善建成区提取的技术方法,不断扩大建成区提取的空间范围。

当前,学术界对建成区边界概念本质的认识存在一定的模糊性,是造成建成区边界识别困难的主要原因之一。虽然《城市规划基本术语标准》对建成区进行了定义与解释,但边界定义与解释仍不够详细。一些学者根据也对建成区的定义进行扩充,但扩充的定义存在一定矛盾性,矛盾与争议之处为是否将城乡结合部归为建成区。部分学者认为应将城乡结合部归为建成区,因为此区域具有城市经济联系密切、人口流动量大的特点。另一部分学者认为城乡结合部建设用地呈零散形态分布,其形态与结构高度与农村相似。

本文的观点是不可以简单地将城乡结合部整体划分为建成区或非建成区,应制定一个划分体系对城乡结合部的内部进行细分。划分体系可以由经济发展程度、人口密集程度、单位面积内的建设用地面积、公共设施完善程度和土地用途等多评估指标组成。此外,建成区边界识别方法及研究数据源的差异,也是影响建成区或非建成区划分差异的重要原因。

猜你喜欢

建成区灯光边界
基于类NPP-VIIRS夜间灯光数据的粤港澳大湾区城市建成区时空动态特征
合肥市建成区综合物种指数及本地木本植物指数研究
守住你的边界
POI和植被修正的夜间灯光城市指数提取建成区的研究
拓展阅读的边界
今晚的灯光亮了天
探索太阳系的边界
2013—2018年金普新区建成区空间形态扩张规律
来一场灯光派对
意大利边界穿越之家