APP下载

一种新的基于高分辨率全色影像的城市建成区边界提取算法

2015-05-08李海江刘耀林谭荣辉邱丽娟

测绘通报 2015年7期
关键词:全色建成区纹理

李海江,刘耀林,谭荣辉,邱丽娟

(1.武汉大学资源与环境科学学院,湖北 武汉 430079;2.武汉大学地理信息系统教育部重点实验室,湖北 武汉 430079)



一种新的基于高分辨率全色影像的城市建成区边界提取算法

李海江1,2,刘耀林1,2,谭荣辉1,2,邱丽娟1,2

(1.武汉大学资源与环境科学学院,湖北 武汉 430079;2.武汉大学地理信息系统教育部重点实验室,湖北 武汉 430079)

针对城市建成区在高分辨率全色影像中的特点,提出了一种城市建成区边界提取的新算法。该算法首先基于边缘检测算子提取城市建成区的边缘密度特征,然后基于灰度共生矩阵和神经网络算法提取其纹理特征,最后结合多种数学形态学的方法提取出城市建成区边界。最后以武汉市为例,采用资源三号全色影像对比传统提取算法与本文提出的新算法,结果表明本文算法精度有明显提高,提取正确率能达到90%以上,且误判率和漏判率较低。

边缘检测算子;灰度共生矩阵;神经网络;数学形态学;资源三号卫星全色影像

一、引 言

城市建成区的范围反映的是一个城市发展的规模,是城市规划中一个十分重要的指标。城市建成区的面积是计算城市的人口密度、公共设施水平、城市单位面积产值和城市扩张系数等一系列指标的基础[1]。准确提取城市建成区边界是研究城市空间格局变化、城市扩张和城市驱动力分析等问题的关键,对城市经济发展、城市规划、土地资源管理等许多方面有着重要的作用[2-5]。

目前关于城市建成区范围的概念还没有统一的标准,不同学者对城市建成区的理解也存在差异[6-10]。王颖芳对建成区的概念作了深入分析,认为建成区前缀以“城镇”为宜,具体可以细化为“城区建成区”和“镇区建成区”,其范围的提取需要在遥感影像提取的基础上根据外业调查等数据进行修正[1]。在仅以遥感影像为数据源进行研究的前提下,本文所述的“城市建成区边界”仅指通过遥感影像提取的城市建成区边界,即城市行政辖区范围内实际建设发展起来的、相对集中分布的城镇建设用地的边界。

以往通过人工方式提取城市建成区边界虽然准确率高,但效率低且成本耗费大,导致了数据更新延迟等问题。近年来关于全色影像上城市建成区的提取研究逐渐增多,这些研究中所指的“城区”和本文所指的“城市建成区”内涵一致。这些方法大致可以分为两类。一类是基于区域增长算法的半自动提取方法,它首先需要人为确定城市建成区的数目,为每一块城市建成区人为设置种子点或区域,其算法的关键在于确定用于分割识别的相似性判据[11-13]。这类算法对居民地这类单一类型的提取效果较好,但城市建成区是由建筑物、道路、绿地、水域及空地等多种地物类型相互延续、相互交错而构成的复杂混合体,仅通过选择种子并设置合适的阈值进行区域生长十分困难。另一类方法则主要是基于分类的思想,根据光谱和纹理特征进行分类并作进一步处理以达到提取城市建成区的目的。文贡坚等采用分层方法,首先根据纹理能量测度提取出候选区域,然后使用建筑物的直线方向特性和边缘密度特性进行提取,但该方法只适于单个中心且空地与水域面积较少的全色影像[14]。陈雁等针对中低分辨率影像的纹理特征,提出基于模糊集理论和贝叶斯准则的分类算法,算法速度较快,但该算法对高分辨率影像的效果未知[15]。陈洪等使用Gabor滤波的方法,自动确定最佳中心频率来检测城区,是一种非监督分类方法,无须训练样本,但该方法需要计算多个中心频率下整幅影像在4个方向上的滤波,这对一个城市区域大小的高分辨率遥感图像而言运算量太大,不适用于城市建成区边界的提取[16]。

针对以上方法存在的问题,本研究提出了一种针对高分辨率全色影像的城市建成区边界提取新算法。该算法首先分别提取出城市建成区的边缘密度特征和纹理特征;然后结合数学形态学方法提取出城市建成区边界;最后以具有多个中心且具有较大水域面积的武汉市为例,采用资源三号全色影像进行试验以验证该算法的有效性。

二、城市建成区的全色影像特点

城市建成区在全色影像中主要具有如下特点[14-15]:

1) 平面区域的连通性。城市建成区表现在全色影像中是一个或多个二维平面区域,每个区域具有连通性,且连通面积通常较大。

2) 边缘密度特征显著。由于城市建成区内除去少部分空地、水域和植被等,大部分是建筑物,其分布和走向通常比较规律且具有丰富的边缘点信息,因而城市建成区的边缘密度值往往比非城市建成区大得多。

3) 纹理特征显著。人肉眼能直观地识别出全色影像中的城市建成区,其重要原因是城市建成区具有特定的纹理特征。通常而言,城市建成区相对于其周围区域灰度变化通常更加剧烈,相邻像元的灰度反差效果更加明显,纹理更加粗糙。

三、方 法

1.纹理特征提取

在全色影像中,纹理表示影像显示的重复性结构,反映了灰度的空间变化,是遥感图像目标识别的一个基本特征[17]。目前常用的纹理描述法主要分为统计法、结构法和频谱法3种[18]。其中灰度共生矩阵(gray level co-occurrence matrix,GLCM)属于统计方法中的一种常用方法,它反映了不同像元相对位置的空间信息,在一定程度上也反映了纹理影像中各灰度级在空间上的分布特性[19-20]。

为了避免灰度级数较大而引起的GLCM维数太大,在求GLCM之前一般将灰度级压缩为一定级数,一般将灰度级设为16级。此外还需设置计算的步长、方向及扫描窗口的大小。为了充分利用影像的分辨率信息,将步长d设为1。扫描的窗口越大,得到的纹理信息越不清晰,且计算时间越长,试验中选择3×3大小的窗口进行计算。纹理方向一般设为0°、45°、90°和135° 4个方向,试验中取这4个方向的均值进行计算。

表1 灰度共生矩阵纹理特征统计量

2.神经网络分类

本研究使用误差反向传播前馈网络,即BP(back propagation)网络,其包含1个输入层、若干个隐含层和1个输出层。对于3层BP网络的结构,如果输入层、隐含层和输出层的单元个数分别为n、q、m,则该3层网络可表示为BP(n,q,m),利用该网络可实现n维输入向量Xn=[X1X2…Xn]T到m维输出向量Xm=[X1X2…Xm]T的非线性映射。BP网络采用误差反向传播算法,能根据输出值与目标输出计算误差,再由误差根据某种准则逐层修改权值,如此反复使误差达到指定要求[21]。

BP网络输入层是作为外部数据进入网络提供的接口,节点个数为输入变量个数,本研究基于8个纹理特征进行神经网络分类,因此输入层的神经元节点数设为8。输出层的节点数取决于需要分类数,本研究需要分为城市建成区和非城市建成区两类,故将其设为2。隐含层是神经网络中最为重要的部分,主要负责从输入样本中提取特征。由于任何在闭区间内的1个连续函数都可以用单隐含层的BP网络逼近,因此本研究中使用单个隐含层。隐含层节点个数的选择是一个十分复杂的问题,节点太多会导致学习时间过长、误差不一定最佳,也会导致容错性差等问题。本研究中采用如下经验公式[22]确定

(1)

式中,n表示输入层的节点数,为8;m表示输出层的节点数,为2;a是1到10之间的常数。取a=4,则隐含层的节点数设为7。

3.算法流程

本文的算法流程如图1所示。

图1 城市建成区边界提取算法流程

1) 预处理。参考城市行政区边界,对影像进行裁剪,使其保留只属于行政区内的影像;然后对影像作直方图均值拉伸处理,使影像具有更好的表现力。

2) 边缘密度特征提取。考虑城市建成区的结构特征,对影像的边缘密度特征进行提取,其流程如图2所示。设影像大小为R×C,首先对影像进行分块,将其划分为N×N(试验中取N=128)大小的若干个子区域影像,然后利用边缘检测算子(试验使用Canny算子[23])提取出城市建成区的边缘点,再分别计算每个子区域影像的密度ρ

ρ=m/N2

(2)

式中,m表示该子区域影像中的边缘点个数。对每个子区域影像,设置一个阈值T(试验中取T=10%),当密度ρ不小于该阈值时视为城市建成区边缘密度的合理区,否则视为非城市建成区。将边缘密度合理区像元值设为1,非城市建成区设为0,即

(3)

式中,b[i][j]表示边缘密度合理区b的第i行第j列的像元值,i=1,2,…,R;j=1,2,…,C。

图2 边缘密度特征提取流程

3) 纹理特征提取。对于预处理的影像,首先将影像量化,再采用滑动窗口算法计算每个像元所在窗口的灰度共生矩阵值,进而计算出8个纹理特征值(见表1)。这样每一个纹理特征均为一幅影像,将这8幅影像合成为8个波段,得到纹理特征影像,用于下一步的分类,其流程如图3所示。

4) 神经网络分类。将得到的纹理特征影像采用神经网络分类法分为城市建成区和非城市建成区两类。试验选取的两类训练样本各有1280个点,学习率为0.1,循环次数为5000次。对于分类得到的任意像元c,若属于城市建成区则赋值为1,否则为0,即

(4)

式中,c[i][j]表示纹理特征合理区c的第i行第j列的像元值,i=1,2,…,R;j=1,2,…,C。

图3 纹理特征提取流程

5) 与操作。将边缘密度合理区和纹理特征合理区进行与操作运算,得到城市建成区的候选区,即对以上得到的边缘密度合理区b和纹理特征合理区c,取

(5)

式中,d[i][j]表示城市建成区候选区d的第i行第j列的像元值,i=1,2,…,R;j=1,2,…,C。

6) 提取中心区域。以上步骤得到的城市建成区候选区往往不是封闭、完整的区域,而会显得比较破碎,区域之间存在缝隙和空洞,因此考虑采用密度过滤的方式对密度较大的区域进行填充。首先对影像再次进行分块处理,将其划分为N2×N2大小,这里的N2应比步骤2)中的N要小,试验取N2=32。依据式(2)统计每个小区域的密度ρ,设置阈值T2(试验中取T2=0.8),依据式(3)进行计算,将城市建成区中心区域像元值设为1,非城市建成区设为0,即

(6)

式中,e[i][j]表示城市建成区中心区域e的第i行第j列的像元值,i=1,2,…,R;j=1,2,…,C。

7) 或操作。将城市建成区候选区和城市建成区中心区域进行或操作运算,所得到的区域即为城市建成区的大致区域,即对以上得到的城市建成区候选区d和城市建成区中心区域e,取

(7)

式中,f[i][j]表示城市建成区的大致区域f的第i行第j列的像元值,i=1,2,…,R;j=1,2,…,C。

8) 面积过滤与区域空洞填充。以上步骤得到的城市建成区会存在许多小图斑,根据城市建成区的区域连通性特点,这些图斑需要过滤掉。采用区域连通算法[24]统计每个区域的面积,设置面积阈值M,将面积小于M的区域过滤掉,这样得到的区域会因为城市建成区中的小湖泊、草地等而存在“空洞”。为了得到完整的城市建成区,采用基于数学形态学的区域填充算法将其中的“空洞”填充。

9) 边界修整与提取。步骤8)得到的边界可能会由于边缘密度的过滤使其部分边缘呈锯齿状,因此可以采用数学形态学中腐蚀(erode)和膨胀(dilate)算子进行修整。本文先用膨胀算子将边界扩展,然后用腐蚀算子将城市边界收缩,使得到的城市建成区边界较为平滑。最后采用基于数学形态学中针对二值影像的边缘提取算法得到城市建成区的边界,并运用GIS工具将栅格格式的城市建成区及其边界转换为矢量格式。

四、试验与分析

本文的研究区为湖北省武汉市。武汉市地处华中腹地,位于东经113°41′~115°05′,北纬29°58′~31°22′。武汉市河网水系纵横交错,且湖泊众多,贯穿的长江和汉江将武汉市划分为武昌、汉口和汉阳3镇。试验采用的数据是2012年7月资源三号卫星的全色影像,其空间分辨率为2.1 m,纹理和几何信息十分丰富,影像的尺寸大小为19 100像素×16 055像素,如图4(a)所示。

图4 试验过程

笔者根据本文算法对该影像进行城市建成区边界的提取。图4为试验过程中的一些中间结果。图4(b)为根据原始影像提取的边缘密度合理区,其中白色区域表示合理区,黑色区域代表非合理区;图4(c)是采用神经网络分类得到的分类图,即纹理特征合理区,白色区域表示合理区,黑色区域代表非合理区;图4(d)的白色区域是进行面积过滤、空洞填充后得到的城市建成区。算法最终得到的结果如图5(a)所示。

图5 试验结果与对比

为了验证本文算法的有效性和准确性,尝试将本文算法的试验结果与区域增长算法和陈雁等提出的快速模糊分割算法[15]提取结果进行比较。

区域增长算法以灰度标准偏差作为城市建成区特性描绘子进行提取, 但提取的城市建成区区域较小,十分破碎,且由于每个区域均需要人工设置种子点,难以自动化提取,故未能提取出整个城市建成区。快速模糊分割算法参考文献[15]采用局部平稳性LC和相关性COR作为特征向量进行分割,得到的城市建成区结果如图5(b)所示。图5(c)是根据原始影像进行人工目视解译得到的城市建成区。

试验采用识别正确率、误判率和漏判率3个指标来定量衡量算法的提取效果。其中,识别正确率表示正确识别的像元占原始影像实际城市建成区像元的百分比;误判率指错误识别为城市建成区的像元占原始影像实际城市建成区像元的百分比;漏判率采用未识别出的城市建成区像元占原始影像实际城市建成区像元的百分比来表示。

表2为快速模糊分割算法与本文算法的精度对比表。数据表明,快速模糊分割算法的算法识别率仅为73.3%,且误判率和漏判率较高,分别为30.5%和10.7%,这说明该算法不太适合处理高分辨率影像;而本研究的算法识别正确率达到了91.2%,误判率为5.2%,漏判率为4.1%。与快速模糊分割算法相比而言,本文算法的识别正确率有明显的提高,误判率和漏判率也有较大的改善,提取的精度更高。

表2 精度对比表

五、结束语

本文针对高分辨率全色影像,提出了一种基于纹理分析与神经网络的城市建成区边界自动提取新算法。试验结果表明该算法能有效提取出城市建成区边界,且与适合中低分辨率的快速模糊分割算法相比,本文算法的识别正确率更高,误判率、漏判率更低。但本文算法在提取的精度方面还有进一步提升的空间,且所提取的城市建成区仍需根据外业调查等数据作进一步修正,这也是需要进一步研究的地方。

[1] 王颖芳.城镇建成区边界界定方法研究及应用[D].杭州:浙江大学, 2012.

[2] 王伟.济南市城区土地利用空间格局演化与优化研究[D].济南:山东师范大学, 2004.

[3] 朴妍,马克明.北京城市建成区扩张的经济驱动:1978-2002[J].中国国土资源经济,2006(7): 34-37.

[4] 刘文锴,杨磊库,梁洪有,等.Landsat卫星遥感影像在焦作市建成区扩展变化监测中的应用[J].河南理工大学学报:自然科学版,2009,28(4): 445-448.

[5] 孙雁,刘志强,王秋兵,等.1910年以来沈阳城区土地利用空间格局变化[J].中国土地科学, 2012(9): 41-47.

[6] 牟凤云,张增祥,迟耀斌,等.基于多源遥感数据的北京市1973—2005年间城市建成区的动态监测与驱动力分析[J].遥感学报,2007,11(2):257-268.

[7] 陈淑兴,韩波,柯长青,等.济南市建成区扩展的时空特征及驱动力分析[J].地理空间信息,2009,7(5):117-120.

[8] 张雪峰,杨晏立,何政伟,等.苏、锡、常建成区遥感方法提取及城市扩展分析[J].测绘科学,2011,36(2): 113-115.

[9] 王跃,程丹.苏州建成区范围界定及形态分析[J].苏州科技学院学报:自然科学版,2011,28(3): 70-74.

[10] 李天华,马玲,杨武年,等.应用遥感和GIS技术提取城市建成区及驱动力分析——以南京市为例[J].测绘科学,2007,32(4): 124-125.

[11] BINS L S, FONSECA L M G, ERTHAL G J, et al.Satellite Imagery Segmentation: a Region Growing Approach[J].Simpósio Brasileiro de Sensoriamento Remoto.1996(8): 677-680.

[12] 路威,张占睦.多尺度几何信息分割算法在居民地提取中的应用[J].信息工程大学学报,2003,4(2): 54-57.

[13] 苏俊英,曹辉,张剑清.高分辨率遥感影像上居民地半自动提取研究[J].武汉大学学报:信息科学版,2004,29(9): 791-795.

[14] 文贡坚,李德仁,叶芬.从卫星遥感全色图像中自动提取城市目标[J].武汉大学学报:信息科学版,2003,28(2): 212-218.

[15] 陈雁,万寿红,龚育昌.全色遥感图像中城区的快速模糊分割算法[J].计算机应用,2008,28(12): 3112-3115.

[16] 陈洪,陶超,邹峥嵘,等.一种新的高分辨率遥感影像城区提取方法[J].武汉大学学报:信息科学版,2013,38(9): 1063-1067.

[17] 阮秋琦.数字图像处理学[M].3版.北京: 电子工业出版社, 2013: 352-353.

[18] 刘晓民.纹理研究综述[J].计算机应用研究,2008,25(8): 2284-2288.

[19] 陈美龙,戴声奎.基于GLCM算法的图像纹理特征分析[J].通信技术,2012(2): 108-111.

[20] HARALICK R M, SHANMUGAM K, DINSTEIN I H.Textural Features for Image Classification[J].IEEE Transactions on Systems, Man and Cybernetics,1973,SMC-3(6): 610-621.

[21] 陈明.MATLAB神经网络原理与实例精解[M].北京:机械工业出版社, 2013: 156-166.

[22] 汤红忠.基于神经网络的车牌识别系统研究[D].湘潭:湘潭大学, 2004.

[23] CANNY J.A Computational Approach to Edge Detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 1986,PAMI-8(6): 679-698.

[24] Di STEFANO L, BULGARELLI A.A Simple and Efficient Connected Components Labeling Algorithm[C]∥Proceedings of IEEE International Conference on Image Analysis and Processing.Venice:IEEE,1999.

A New Algorithm of Urban Built-up Area Boundary Extraction Based on High-resolution Panchromatic Image

LI Haijiang,LIU Yaolin,TAN Ronghui,QIU Lijuan

李海江,刘耀林,谭荣辉,等.一种新的基于高分辨率全色影像的城市建成区边界提取算法[J].测绘通报,2015(7):36-41.

10.13474/j.cnki.11-2246.2015.0206

2014-06-09

李海江(1991—),男,硕士,主要研究方向为地理信息系统与遥感影像处理。E-mail:942535021@qq.com

刘耀林。E-mail: yaolin610@163.com

P237

:B

:0494-0911(2015)07-0036-06

猜你喜欢

全色建成区纹理
多源数据协同下的城市建成区边界提取进展
POI和植被修正的夜间灯光城市指数提取建成区的研究
三星“享映时光 投已所好”4K全色激光绚幕品鉴会成功举办
2013—2018年金普新区建成区空间形态扩张规律
海信发布100英寸影院级全色激光电视
基于BM3D的复杂纹理区域图像去噪
浅谈书画装裱修复中的全色技法
使用纹理叠加添加艺术画特效
长沙市望城区建成区公园绿地现状结构分析与评价
TEXTURE ON TEXTURE质地上的纹理