APP下载

基于矢量数据的城市建成区范围提取方法

2016-09-02姚君兰胡斌斌

测绘通报 2016年5期
关键词:建成区栅格预处理

姚君兰,王 红,2,胡斌斌

(1. 湖北大学资源环境学院,湖北 武汉430062; 2. 区域开发与环境响应湖北省重点实验室,湖北 武汉 430062)



基于矢量数据的城市建成区范围提取方法

姚君兰1,王红1,2,胡斌斌1

(1. 湖北大学资源环境学院,湖北 武汉430062; 2. 区域开发与环境响应湖北省重点实验室,湖北 武汉 430062)

城市建成区在城市规划中具有重要的研究价值,目前建成区的提取方法局限在“两证一书”和遥感技术提取。基于此,依据城市建成区概念核心要求,本文提出了一种基于矢量数据的城市建成区范围提取方法,为城市建成区范围提取探索新思路。试验以1∶5万的矢量基础地理数据为例,对经过预处理后的城市面状居民地要素进行基于密度的聚类分析,将密度较大的居民地地区作为建成区主体部分,并经过膨胀和腐蚀等栅格处理得到模板。使用模板得到用于表示城市建成区范围的新居民地要素,经过基于TIN的边界提取和优化,得到最终的城市建成区范围。

城市建成区范围;密度分析;栅格处理;TIN

城市建成区标志着城市不同发展时期建设用地的状况,对其准确的提取是研究城市扩展变化和城市驱动力分析的关键[1-2]。《城市规划基本术语标准》(GB/T 50280—98)[3]中提到:“城市建成区在单核心城市和一城多镇有不同的反映。在单核心城市,建成区是一个实际开发建设起来的集中连片的、市政公用设施和公共设施基本具备的地区,以及分散的若干个已经成片开发建设起来,市政公用设施和公共设施基本具备的地区;对一城多镇来说,建成区就由几个连片开发建设起来的,市政公用设施和公共设施基本具备的地区所组成。”《中华人民共和国城市规划法》[4]在对城市规划区的解释和说明中指出:“建成区是城市建设连片,基础设施和公用设施到达的地区,它是城市规划区的核心部分,城市规划区远远大于建成区范围。”由此可得出城市建成区具有3个特性:①变异性:城市建成区依据城市建设规划,不同城市同一时间、同一城市的建成区范围都是不相同的,尤其是目前各省还未有统一的城市建成区范围的标准;②相对集中性:根据上述相关概念可知城市建成区是指城市范围内分布相对集中的地区;③不规则性:城市建成区要依据城市规划来建设,城市建成区范围小于城市规划范围,对于尚未建成的区域的居民地区域不能算入城市建成区范围内,因此其范围是不规则的。

当前各城市相关部门对城市建成区范围统计的方法集中在“两证一书” 法和遥感技术提取方法。

“两证一书”法目前在各大城市统计城市建成区中经常使用,虽统计计算相对简单,但数据统计过程出现的误差不可避免且存在未建设先统计的情况,以及标准[3-4]在各个城市统计运用中不一致等问题。遥感影像成像速度快,遥感技术提取城市建成区范围的方法多样,且借助多种遥感影像处理软件能快速提取。目前在城市建成区提取中,多数遥感提取方法从提取居民地相关方法演化而来,因遥感影像数据的成本、遥感影像数据的处理难度和基于遥感影像的城市建成区范围提取尚未有统一的标准,还未能实现普及应用,利用遥感技术提取建成区技术仍在发展过程中。本文依据城市建成区的概念,提出一种基于矢量数据,结合密度分析和基于TIN原理的边界提取,得到城市建成区范围的新方法。

一、试验研究

1. 数据准备及流程

试验数据是按照1∶5万矢量基础地理数据生产标准生产的矢量数据,依照项目标准建立规范化的居民地属性表,并准确录入适量数据的相关属性。这些居民地要素的现实属性可能是用于住房、公司、商场等,在居民地要素属性表中存放用途的属性类型。本试验基于上述内容完成建库,以实现城市建成区范围提取为目的,ArcGIS软件操作为技术支持,制定的试验流程如图1所示。

图1 试验操作流程

2. 数据预处理

数据预处理是实现面状居民地要素由点状居民地要素表示的过程,要求尽量避免数据损失。试验过程通过ArcGIS软件进行操作,操作流程如图2所示。

图2数据预处理流程

首先对面状矢量数据进行栅格化,栅格单元大小为3 m。栅格化后的栅格影像采用中心点法对输入栅格数据集的每个栅格单元进行矢量化过程,这些点将定位于它们所代表的栅格单元的中心,实现栅格图像转点状要素处理过程。原始数据与预处理后的结果对比如图3所示,其中(a)表示的是原始居民地要素的分布情况,(b)表示的是经过预处理后的居民地要素用点状要素的表示情况。

图3 原始数据与预处理结果对比

由图3分析可得,数据预处理过程避免了数据损失过多的问题,如果原始面状居民地要素占地较大,预处理结果包含的点数据则较多,因此数据预处理过程最大限度地保证了原始数据分布特征且为后续分析进行了数据准备。

二、城市建成区范围提取

1. 基于点密度的聚类分析

空间聚类作为聚类分析的一个研究方向,是指将空间数据集中的对象分成由相似对象组成的类。同类中的对象间具有较高的相似度,而不同类中的对象间差异较大[5]。根据城市建成区特点之一的相对集中性,对经过预处理后的点状居民地要素进行基于点密度的空间聚类,以密度作为相似度,将高密度区域以簇的形式选取出来,这部分高密度的簇在很大程度上就属于城市建成区。

DBSCAN[6]算法是一种典型的基于点密度的空间聚类算法。它从对应点的估计和密度分布发现一些簇,能够发现任意形状的簇并且可以有效地处理噪声,聚类速度快,可以作为增量聚类算法[7]的基础。

将预处理得到的点状居民地要素进行基于点密度的聚类分析。试验中默认密度分析半径计算方式为输出空间参考中输出范围的宽度或高度的最小值除以30。为确认密度分析半径变化对计算所得的密度值是否造成较大影响,试验过程中使用默认分析半径72.2 m和人为设置分析半径100 m进行结果对比,分析结果如图4所示。

图4 基于点密度的聚类分析结果

根据图4(a)和(b)对比可知,密度分析的半径对于分析结果造成的影响不是很大,密度较大的区域能被清晰地聚类。颜色较深的部分是城市居民地密度较大的区域即城市中较集中的区域,颜色较浅的部分接近于非城市建成区部分,从颜色的深浅上区分了城市建成区和非城市建成区。

2. 栅格处理

(1) 二值化

点密度分析结果生成的结果是栅格影像,需将城市建成区与非城市建成区进行区分。二值化是栅格图像处理中最常见的一种方式,但是区分城市建成区和非城市建成区的阈值仍需要手工多次调节确定。为实现阈值选取的合理化,试验中用于确定二值化阈值的算法是迭代法[8-10],算法原理如下:

1) 选择一个初始阈值T(j),通常为整幅影像的平均灰度值,j是迭代次数,初始值设置为0。

3) 计算两个区域各自的平均灰度值。

4) 计算新的阈值

5) 令j=j+1,重复步骤2)—步骤4)操作,直至T(j+1)与T(j)的差小于规定值或j达到最大的迭代次数。

依据上述算法操作自动生成试验二值化过程的阈值。依据阈值对密度分析结果进行重分类,将大于阈值的影像值赋值为1,小于值的影像值赋值为0,二值化结果如图5所示。

图5 二值影像图

二值化的过程对城市建成区与非城市建成区进行一个初步的界定,通过图5的二值影像可以得知,值为1的区域是城市建成区的主体部分,其余值为0的部分为非城市建成区。

(2) 膨胀和腐蚀

二值影像图中,城市建成区边缘存在部分碎屑,且局部存在空缺,需要利用数学形态学中的膨胀和腐蚀进行进一步的栅格清理。

在数学形态学中,数字图像被看成是二维(或三维)离散欧氏空间Z2(或Z3)上的一个集合,即A⊂Z2,集合中的每一个元素代表数字图像中的一个点。

腐蚀操作将所有小于结构元素的图形部分消除,即对边缘部分进行剥离操作,使边缘宽度减少一定的宽度。而膨胀操作会使原有图像在边缘部分得到扩展,同时使图像中间小于结构元素的空洞得到填充。将腐蚀和膨胀运算按照一定的规则一起使用,可以在去噪中得到很好的应用。

开运算的计算过程为先腐蚀后膨胀。腐蚀运算使图像中尺寸小于结构元素的孤立噪声和毛刺噪声得到消除,膨胀运算则可使经过腐蚀后线条变窄的图像得以恢复;反之,闭运算是先膨胀后腐蚀。闭运算的结果使图像中宽度小于结构元素的空洞得到填充[11]。

栅格清理使用ArcGIS软件中的ArcScan工具,先用开运算除去二值影像中不必要的碎屑部分,再使用闭运算填充内部空缺部分。对影像中的值为1的区域进行连通检测,最后对满足条件的连通区域进行重分类,原始值为0的区域赋值为NoData,原始值为1的保持不变。栅格清理操作流程如图6所示,处理后的范围结果如图7所示。

图6 栅格清理操作步骤

图7 栅格处理后的范围

经过一系列的处理得到图7的范围,可以作为原始点状居民地要素筛选的模板,提取出用于表示城市建成区范围的新点状居民地要素。

3. 边界生成

使用图7所得范围作为模板提取图3(b)中原始点状居民地要素,得到新的点状居民地要素。新的点状居民地要素用于表示城市建成区范围,不需要进一步的数据损失,点状数据的分布形状基本上确定了城市建成区的范围边界。试验中使用基于TIN三角网的边界范围生成方法,操作流程如图8所示。

图8边界生成操作步骤

描绘出的TIN数据区域导出成矢量数据,即可作为居民提取的边界范围。描绘的具体过程为:使用ArcGIS软件中3D分析工具生成新点状居民地要素的TIN三角网,描绘TIN数据区的三角网最大边长值由 TIN 中视为有效数据区的区域内结点的平均间距来确定,可通过测量有效区域内的距离,试验中以210 m作为三角网最大边长,进行TIN三角网范围调整。调整过后的TIN三角网边界就是城市建成区范围,如图9所示。

图9 实例数据城市建成区范围

三、结束语

本文旨在利用已有的1∶5万矢量基础地理数据,以数据损失最小为原则控制预处理操作,以合理性为原则对矢量居民地数据进行密度分析,密度较大的区域经过栅格处理后的数据作为城市建成区提取的模板,并结合TIN三角网得到沿着居民地走向的城市建成区范围。本文提供了一种城市建成区范围提取新方法,解决了目前城市建成区范围统计主要依据“两证一书”法统计的局限性和遥感影像数据不足的情况。随着越来越多的国家基础地理数据公开,基于矢量数据的城市建成区范围提取应用会更为广泛。

本文仍需后续进一步试验验证,由于试验数据限制,在试验过程中参数控制多为从理论出发去人为控制,后续研究中将着重解决不同区域建成区范围提取中参数的自动化处理,范围精度有待于进一步核查确认。

[1]顾娟,陈军,张宏伟.基于遥感影像的居民地提取研究综述与展望[J].计算机工程与应用,2007,43(30):1-4.

[2]张雪峰,杨晏立,何政伟,等.苏、锡、常建成区遥感方法提取及城市扩展分析[J].测绘科学,2011,36(2):113-115.

[3]中华人民共和国建设部.城市规划基本术语标准:GB/T 50280—98[S].北京:中国标准出版社,1998.

[4]中华人民共和国规划法[EB/OL].[2015-11-08].www.mohurd.gov.cn/cjda/cjdazcfg/200611/t20061101_3863.html.

[5]席景科,谭海樵.空间聚类分析及评价方法[J].计算机工程与设计,2009,30(7):1712-1715.

[6]ESTER M, KRIEGEL H P, SANDER J, et al. A Den-sity-based Algorithm for Discovering Clusters in Large Spatial Databases with Noise[C]∥Proceedings of the 1996 2nd International Conference on Knowledge Discovery and Data Mining.Portland:AAAI Press,1996:226-231.

[7]ESTER M, KRIEGEL H P, SANDER J, et al. Incremental Clustering for Mining in a Data Warehousing Environment[C]∥Proceedings of the 24th Very Large Data Bases(VLDB) Conference.New York:[s.n.],1998:323-333.

[8]GONZALES R C, WOODS R E.Thresholding in Digital Image Processing[M].[S.l.]:Pearson Education,2002.

[9]LUESSI M, EICHMANN M, SCHUSTER GM,et al.Framework for Efficient Optiomal Multilevel Image Thresholding[J].Journal of Electronic Imaging,2009(18):4-13.

[10]LAI Y K,ROSIN PL.Efficient Circular Thresholding[J].IEEE Trans.on Image Processing,2014,23(3):992-1001.

[11]JENSEN J R. Introductory Digital Image Processing:A Remote Sensing Perspective[M].New Jersey:Prentice Hall,2001.

Urban Built-up Area Extraction Based on Vector Data

YAO Junlan,WANG Hong,HU Binbin

10.13474/j.cnki.11-2246.2016.0162.

2016-02-02

国家自然科学基金(41301516);测绘地理信息公益性行业科研专项项目(201412014)

姚君兰(1993—),女,硕士生,研究方向为地图表达。E-mail:15927069253@163.com

P208

B

0494-0911(2016)05-0084-04

引文格式: 姚君兰,王红,胡斌斌. 基于矢量数据的城市建成区范围提取方法[J].测绘通报,2016(5):84-87.

猜你喜欢

建成区栅格预处理
多源数据协同下的城市建成区边界提取进展
求解奇异线性系统的右预处理MINRES 方法
POI和植被修正的夜间灯光城市指数提取建成区的研究
基于邻域栅格筛选的点云边缘点提取方法*
2013—2018年金普新区建成区空间形态扩张规律
高COD二噻烷生产废水预处理研究
基于A*算法在蜂巢栅格地图中的路径规划研究
长沙市望城区建成区公园绿地现状结构分析与评价
基于预处理MUSIC算法的分布式阵列DOA估计
不同剖面形状的栅格壁对栅格翼气动特性的影响