基于图割与阴影邻接关系的高分辨率遥感影像建筑物提取方法

2017-01-10施文灶毛政元

电子学报 2016年12期

施文灶，毛政元

(1.福州大学空间数据挖掘与信息共享教育部重点实验室，福建福州 350002；2.福建师范大学光电与信息工程学院，福建福州 350108；3.福州大学地理空间信息技术国家地方联合工程研究中心，福建福州 350002；4.福州大学福建省空间信息工程研究中心，福建福州 350002)

施文灶1,2,3,4，毛政元1,3,4

高空间分辨率遥感影像的建筑物自动提取能够加速城市基础地理数据库的更新进程.建筑物提取方法存在的一个亟需解决的问题是建筑物轮廓难以准确提取.本文通过建筑物的阴影特征和图割提出一种在高分辨率遥感影像中识别与提取建筑物的方法.首先，基于势直方图函数检测阴影；然后，以长宽比和矩形度作为约束条件从图割结果中筛选出候选分割对象；最后，利用开运算、膨胀和腐蚀分别对阴影进行处理，计算处理后的阴影和候选分割对象之间的邻接关系得到建筑物及其轮廓.为了验证本文方法的有效性，选取PLEIADES影像中6幅具有代表性的子图像进行试验，结果表明本方法的平均查准率和平均查全率分别达到92.31%和74.23%.

遥感影像；阴影；图割；建筑物提取

1 引言

高分辨率遥感影像信息提取是图像处理领域中的热点问题，建筑物提取是其中的难点.现有文献中有关从高分辨率影像中提取建筑物较有代表性的方法有：(1)基于区域分割的方法.先通过将遥感影像分割成若干个独立的对象，再根据建筑物自身的几何形状和空间位置等特征提取具体的建筑物目标[1]，分割算法的质量是影响提取精度的重要因素，利用现有的分割算法直接提取建筑物难以得到满意的结果；(2)基于辅助知识的方法.通过挖掘遥感影像中的颜色[2]、阴影[3]、纹理[4]、几何结构[5]等特征，并结合LiDAR[6]、SAR[7]或DSM等三维数据提取建筑物[8]，但此类数据一般较难获取或成本较高，因此，研究利用颜色、阴影等信息提取建筑物将更有实用价值；(3)基于边缘提取的方法.利用边缘提取算法得到建筑物的边缘，根据空间关系对边缘线段进行分组，搜索平行线，进而搜索符合建筑物空间结构和轮廓的矩形，得到建筑物的位置[9]，在建筑物独立和结构较为简单的情况下效果较好，但在边缘提取和直线跟踪拟合等步骤中使用了较多阈值，难以同时适应不同的建筑物类型和成像条件，实用性受到限制.

针对高分辨率遥感影像提取建筑物现有相关研究成果的不足，本文在图割中同时利用几何结构、颜色特征和边缘信息提高分割质量，最大程度地挖掘二维高分影像中的信息，提出一种基于阴影和图割、更加高效与鲁棒地自动识别和提取建筑物的方法.

2 算法原理

本研究的算法流程如图1所示，主要包括基于图割的候选分割对象提取、基于势直方图函数的阴影提取和基于邻接关系的建筑物提取三个部分.

2.1 阴影提取算法

阴影和非阴影的分割关键在于确定一个合适的阈值，而传统的分割方法大多采用人工设置.本研究在文献[10]的基础上，提出一种基于势直方图函数的自动阴影提取算法.

设I=[f(i,j)]M×N为M×N的灰度图像，G为灰度级，I的灰度统计直方图函数H(k)计算公式为：

(1)

(2)

根据阴影的灰度级较低的特征，通过构造势直方图函数的一阶差分自动确定分割阈值，如式(3)所示.

P(k)=PH(k+1)-PH(k),k∈{0,1,2,…,G-1}

(3)

将P(k)中第一个由负到正的阶跃点作为阴影提取的自动分割阈值T.

从I=[f(i,j)]M×N中提取的阴影为：

(4)

2.2 图的构造及权值计算

本研究在传统图割理论的基础上，利用高分辨遥感影像的像元空间关系和对象边缘等信息，提出一种适用于高分辨率遥感影像的分割方法.

对于M×N的遥感影像I，构造图G=(V,E,W)，将I中的各个像元作为图的顶点，所有顶点的集合记为V；若像元之间的距离不大于r，则通过一条边进行连接，所有边的集合记为E；邻接矩阵W用于测度具有连接关系的两个像元的相似性，即属于同一对象的可能性，像元m和n之间的边的权值w(m,n)通过式(5)计算.

(5)

权值w(m,n)的设置决定分割的效果，本研究利用位置、灰度值和边缘三种特征计算边的权值.

(1)位置.利用位置的权值WD通过式(6)计算.

(6)

两个像元在空间位置上越邻近，WD越大，越有可能属于同一对象.

(2)灰度值.利用灰度值的权值WI通过式(7)计算.

(7)

其中，Ii表示像元i的灰度值；σI表示全局灰度值方差.两个像元的灰度值越接近，WI越大，越有可能属于同一对象.

(3)边缘.通过距离和灰度值计算的权值进行后续的图割有利于连接对象的断裂部分，但由于高分辨率遥感影像地物复杂，即表现出纹理多样，若仅用距离和灰度值计算权值继续分割可能会导致分割效果不好，而通过边缘特征能够直接地分割两个对象，本研究的边缘检测算法采用基于梯度的方法.利用边缘的权值WE通过式(8)计算.

(8)

其中，line(m,n)表示像元m和n之间的连线；edge(x)表示与边缘相交的line包含的x的边缘梯度幅值；σE表示提取的全局边缘梯度幅值方差.如果两个像元之间的连线没有与边缘相交，则WE很大，越有可能属于同一对象.

对以上三个权值进行合并，且考虑边缘特征对于建筑物的提取具有决定性的作用，因此需要体现边缘权值WE的主要作用，构造像元m和n之间的连接边对应的权值WM(m,n)为：

+βWE(m,n)

(9)

归一化图割及相应特征向量的求解过程可参考文献[11].

2.3 建筑物提取算法

基于图割对象与阴影邻接关系进行建筑物的提取，具体处理流程如图2所示.

在提取候选分割对象和阴影对象的基础上，首先用数学形态学方法对阴影对象进行处理：

(1)开运算处理.目的是为了减小与建筑物阴影具有相似光谱特征的植被阴影及小面积人工地物的干扰，可以提高建筑物对象的查准率；

(2)膨胀处理.对开运算处理后的阴影对象进行膨胀处理.目的是为了弥补候选分割对象提取的不准确性，保证阴影对象和对应的建筑物有一定的重叠部分，可以提高建筑物检测的查全率；

(3)腐蚀处理.对开运算处理后的阴影对象进行腐蚀处理.目的是为了防止阴影本身被当作建筑物，可以提高建筑物提高的查准率.

然后，将与膨胀处理后的阴影对象有重叠部分的候选分割对象判定为候选建筑物，将与腐蚀处理后的阴影对象有重叠部分的候选分割对象判定为阴影，将候选建筑物减去阴影得到建筑物对象.

3 试验与分析

3.1 数据和评价方法

本研究的试验数据为深圳市2012年11月6日的PLEIADES影像，分辨率为0.5m，从中选取6幅具有代表性的测试影像，尺寸均为400像素×400像素，编号分别为#1～#6.为了测试本研究方法对大规模影像的适用能力，另外选取一幅尺寸为3000像素×2000像素的测试影像，编号为#7.

分别采用式(10)～(12)的查准率Precision、查全率Recall和F1分数(将查准率和查全率联合量化为一个数值，取值越大，表明算法性能越好)[12]，对每幅测试影像进行评价.

(10)

(11)

(12)

其中，TP(True Positive)表示本算法和人工标注法均提取到的建筑物数量；FP(False Positive)表示本算法检测到而人工标注法未检测到的建筑物数量；FN(False Negative)表示本算法未检测到而人工标注法检测到的建筑物数量.

3.2 参数分析与取值

本算法包括3个步骤，其中所涉及的6个参数的含义如表1所示.

表1 参数及描述

以图4(a)的#1测试影像作为分析对象为例，得到算法的查准率、查全率和F1分数随6个参数的变化曲线，如图3所示.

由图3可见，上述6个参数对算法性能的影响均有一定的规律性，即参数中变化过程中有某一取值区间均能使算法性能达到最高并且稳定，同时对图4中#2～#6的测试影像也进行同样的参数变化分析，均能得到与图3相似的曲线，据此可确定使总体性能达到最佳的参数值(表2).

表2 参数设定

3.3 试验结果与分析

用本研究算法结合表2的参数取值对7幅测试影像进行建筑物提取，结果如图4所示，其中黑色边缘包含的区域代表TP建筑物的数量，实心圆代表FP建筑物的数量，即误检数；空心圆代表FN建筑物的数量，即漏检数.计算得到的性能结果如表3所示.

表3 算法的性能数值表

如图4(a)～4(f)所示，6幅测试影像中的大多数建筑物都能被正确提取，表明本研究算法能适用于不同形状、尺寸、颜色、分布及具有周围地物干扰的建筑物提取，表3中列举的数据也证明了这一点，综合6幅测试影像的平均查准率和查全率分别为92.31%和74.23%，F1分数为82.29.可以发现，#2、#3、#4和#5测试影像的查全率较低，约为70%，拉低了综合的平均查全率，其原因在于#2测试影像中有3处建筑物是由互成角度的矩形组成的，在分割算法中无法满足长宽比和矩形度的约束条件而导致漏检；#3测试影像顶部的3个没被提取到的建筑物是由于其阴影没有包含在影像中，在计算阴影对象和周围建筑物的重叠关系时造成漏检；#4测试影像是最具挑战性的测试对象，由于建筑物和背景之间的对比度不明显且建筑物之间分布较为密集，导致分割效果不好，所以造成较多建筑物的漏检；#5测试影像查全率较低的原因是有3个建筑物被影像边界分割成不完整的片段，同样在分割算法中无法满足长宽比和矩形度的约束条件而导致漏检.另外，#6测试影像只有75%的查准率，与其他5幅查准率均高达90%以上的测试影像相差较大，因为其中两个被误检的对象刚好邻近阴影且能够满足长宽比和矩形度的约束条件，所以被检测为建筑物.

比较6幅测试影像的F1分数，其中#2和#4测试影像的F1分数不到80%，说明本研究算法用于对包含较多非矩形或无法通过矩形组合的建筑物提取以及对比度较低、分布较为密集的建筑物提取还存在一定的局限性，但对于多数的场景具有较好的提取效果.

从图4(h)和表3中#7测试影像的性能分析结果看，当应用于图像范围大、地物复杂、干扰多的场景时，本研究算法同样能保持较高的性能.

3.4 方法对比

基于#1～#6测试影像，将本文方法与利用分割和阴影的建筑物提取的方法进行对比，结果如表4.其中，方法1为利用水平集进行分割的建筑物提取方法[9]；方法2为基于不变颜色特征和阴影的建筑物提取方法[13].

表4 方法对比

由表4可知，在总体算法性能F1分数方面，本文方法比方法1和方法2均有提高，其中，方法1具有较高的查全率，但查准率相对较低，其原因在于方法1的水平集初始曲线由均匀分布在整幅影像上的圆形组成，当建筑物边界较为明显及分布较为稀疏时，能够较好地检测到建筑物，相反，活动轮廓线难以准确收敛至建筑物边界；方法2先利用不变颜色特征进行分割，需要预先提取红色建筑物(为了保证满足此前提条件，随机将6幅测试影像中的两处建筑物进行红色填充)，方法2达到93.33%的查准率，但条件要求较为苛刻，不利于实际应用.

4 结论

本文针对高分辨率遥感影像提出了一种基于阴影和图割的建筑物提取方法，利用阴影和分割对象之间的邻接关系筛选并提取建筑物，为建筑物提取提供了一种有效的新方案.试验结果表明，本文提出的方法可以同时高效、准确地提取矩形建筑物或由若干矩形组合形成的不规则形状建筑物的位置和边缘，突破了现有建筑物提取方法存在的只能提取建筑物位置或用矩形简单拟合其轮廓、需要人工设置大量参数等方面的局限性，能更好地适应城市建筑物变化检测等涉及复杂场景的应用需求；此外，本文的方法还具有参数调校更加简便的优势.如何评价建筑物位置和边缘的准确性、提高查全率，同时通过优化分割算法降低时间复杂度、使本文的研究成果工程化，是后续研究的目标.

[1]Wegne J D,Soergel U,Rosenhahn B.Segment-based building detection with conditional random fields[A].Proceedings of 2011 Joint Urban Remote Sensing Event (JURSE)[C].Munich:IEEE,2011.205-208.

[2]Benedek C,Descombes X,Zerubia J.Building extraction and change detection in multitemporal remotely sensed images with multiple birth and death dynamics[A].2009 Workshop on Applications of Computer Vision (WACV)[C].Snowbird,UT:IEEE,2009.1-6.

[3]Huang X,Zhang L.Morphological building/shadow index for building extraction from high-resolution imagery over urban areas[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2012,5(1):161-172.

[4]Benarchid O,Raissouni N.Support vector machines for object based building extraction in suburban area using very high resolution satellite images,a case study:Tetuan,Morocco[J].IAES International Journal of Artificial Intelligence (IJ-AI),2013,2(1):43-50.

[5]陶超,谭毅华,蔡华杰,等.面向对象的高分辨率遥感影像城区建筑物分级提取方法[J].测绘学报,2010,39(1):39-45. TAO Chao,TAN Yihua,CAI Huajie,et al.Object oriented method of hierarchical urban building extraction from high resolution remote sensing imagery[J].Acta Geodaetica et Cartographica Sinica,2010,39(1):39-45.(in Chinese)

[6]程亮,龚健雅.LiDAR辅助下利用超高分辨率影像提取建筑物轮廓方法[J].测绘学报,2008,37(3):391-393. CHENG Liang,GONG Jianya.Building boundary extraction using very high resolution images and LiDAR[J].Acta Geodaetica et Cartographica Sinica,2008,37(3):391-393.(in Chinese)

[7]苏娟,张强,陈炜,等.高分辨率SAR图像中建筑物特征融合检测算法[J].测绘学报,2014,43(9):939-944. SU Juan,ZHANG Qiang,CHEN Wei,et al.A Building detection algorithm based on feature fusion in high resolution SAR images[J].Acta Geodaetica et Cartographica Sinica,2014,43(9):939-944.(in Chinese)

[8]ünsalan C,Boyer K L.A system to detect houses and residential street networks in multispectral satellite images[J].Computer Vision and Image Understanding,2005,98(3):423-461.

[9]Ahmadi S,Zoej M J V,Ebadi H,et al.Automatic urban building boundary extraction from high resolution aerial images using an innovative model of active contours[J].International Journal of Applied Earth Observation and Geoinformation,2010,12(3):150-157.

[10]裴继红,谢维信.势函数聚类自适应多阈值图像分割[J].计算机学报,1999,22(7):758-762. PEI Jihong,XIE Weixin.Adaptive multi thresholds image segmentation based on potential function clustering[J].Chinese J.Computers,1999,22(7):758-762.(in Chinese)

[11]Shi J,Malik J.Normalized cuts and image segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(8):888-905.

[12]Ok A O.Automated detection of buildings from single vhr multispectral images using shadow information and graph cuts[J].ISPRS Journal of Photogrammetry and Remote Sensing,2013,86:21-40.

[13]Sirmacek B,Unsalan C.Building detection from aerial images using invariant color features and shadow information[A].23rd International Symposium on Computer and Information Sciences[C].Istanbul:IEEE,2008.1-5.

施文灶男，1982年8月出生于福建省晋江市，现为福建师范大学讲师，福州大学博士研究生.主要研究方向为遥感影像信息提取.

E-mail:swz@fjnu.edu.cn

毛政元男，1964年10月出生于湖南省武冈市，现为福州大学教授、博士生导师.主要研究方向为时空序列分析与变化检测.获省级科技进步奖、国家知识产权局发明专利各1项，在国内外发表学术论文40余篇.

E-mail:zymao@fzu.edu.cn

Building Extraction from High Resolution Remotely Sensed Imagery Based on Shadows and Graph-Cut Segmentation

SHI Wen-zao1,2,3,4,MAO Zheng-yuan1,3,4

(1.KeyLabofSpatialDataMining&InformationSharingofMinistryofEducation,FuzhouUniversity,Fuzhou,Fujian350002,China; 2.CollegeofPhotonicandElectronicEngineering,FujianNormalUniversity,Fuzhou,Fujian350108,China; 3.NationalEngineeringResearchCentreofGeospatialInformationTechnology,FuzhouUniversity,Fuzhou,Fujian350002,China; 4.SpatialInformationEngineeringResearchCentreofFujianProvince,FuzhouUniversity,Fuzhou,Fujian350002,China)

Automatic building extraction from high spatial resolution remotely sensed imagery can accelerate the update process for urban basic geographic database.One problem of building extraction methods is the difficulty of extracting the precise building contour.This article proposes an approach to recognizing and extracting buildings from high resolution remotely sensed imagery based on shadows and graph-cut segmentation.Firstly,shadows were detected by using potential histogram function.Then,candidate segmentation objects were selected from the result of graph-cut segmentation with the constraint by integrating aspect ratio and rectangularity.At last,shadows were processed with open,dilate and corrode operations respectively,while buildings and their exact boundaries were extracted with adjacency between processed shadows and candidate segmentation objects.For verifying the validity of the proposed method,six sub-images were chosen from PLEIADES images.Experimental results show that the average precision and recall of the proposed method are 92.31% and 74.23% respectively.

remotely sensed imagery;shadows;graph-cut;building extraction

2015-05-04;

2015-08-13;责任编辑：覃怀银

“十二五”国家科技支撑计划项目(No.2013BAC08B02-01);国家重点基础研究发展计划项目课题(No.2006CB708306);福建省教育厅项目(No.JB14038)

TP237.4

0372-2112 (2016)12-2849-06

��学报URL:http://www.ejournal.org.cn

10.3969/j.issn.0372-2112.2016.12.006