城市道路的多特征多核SVM提取方法
2018-03-07李洪川霍英海
李洪川,楚 恒,2,3,霍英海
(1. 重庆邮电大学光通信与网络重点实验室,重庆 400065; 2. 西南大学地理科学学院,重庆 400715; 3. 重庆市勘测院,重庆 400020)
城市道路作为高分辨率遥感影像中重要的地物信息,其精确提取在地理国情普查与监测、城市规划、交通导航等领域应用中具有重要意义。由于高分辨率遥感影像的空间分辨率较中低分辨率影像显著提高,地物细节信息更加丰富,纹理更加清晰,“同物异谱”“同谱异物”现象广泛存在,道路提取更加困难[1]。如何从拥有复杂地物的高分辨率遥感影像中精确提取道路信息成为目前研究的热点与难点。
目前常用的道路提取方法有模板匹配法[2]、Snakes模型方法[3]、边缘检测法[4]、面向对象法[5]等。其中面向对象的道路提取方法在克服“椒盐”噪声的同时能够利用影像丰富的空间信息,提高道路提取精度,成为目前道路提取首选的方法。SVM在解决小样本、非线性及高维数据的模式识别问题具有特有的优势,被越来越多的国内外学者应用到面向对象的道路提取中。ZHU等提出了一种改进SVM的道路提取方法。该方法通过聚类减少SVM分类数目,然后再训练SVM实现道路提取,取得了不错的效果[6]。MIAO等提出了一种面向对象的SVM道路提取方法。该方法在对象级影像上利用SVM并结合张量投票实现道路提取[7]。林鹏等提出一种面向对象的城镇道路提取方法。该方法利用SVM实现了农村道路的精确提取[5]。以上方法均是以单核SVM对影像进行提取,由于不同核函数的SVM分类器道路提取精度不同,同时,影像中不同的特征对不同核函数的适应性也不相同,造成道路提取的精度还有待提高。
基于此,本文提出一种高分辨率影像城市道路的多特征多核SVM分层提取方法。首先,基于FCM算法将原始输入高分辨率遥感影像粗分类为包含道路、建筑物等地物信息的建成区和非建成区,去除非建成区;运用分水岭分割算法对建成区影像进行分割,同时提取分割后对象的光谱特征和空间特征;然后选取RBF核函数和POLY核函数加权组合成MKSVM并对建成区进行二次分类,获取道路初始信息;最后经过数学形态学处理,实现道路的最终提取。通过重庆市某地区的QuickBird影像试验证明:该方法能够较好地提取出城市道路信息,且道路的分类精度明显高于单一核函数的SVM和其他对比方法。
1 道路提取过程
试验所选影像地物信息复杂,既有水体、植被,又有与道路信息易于混淆的建筑物等地物,能够很好地验证本文所提方法的有效性。道路提取具体实现流程如图1所示。
图1 道路提取流程
1.1 FCM聚类算法
模糊C均值聚类(fuzzy C-means,FCM),是一种基于目标函数的模糊聚类算法。该算法采用隶属度确定每个数据点属于某个聚类的程度,是对传统硬聚类算法的一种改进[8]。
假设数据集X={x1,x2,…,xn},则它的模糊c划分可用模糊矩阵U=uij表示,矩阵U的元素uij表示第j(j=1,2,…,n)个数据点属于第i(i=1,2,…,c)类的隶属度,其中uij满足以下条件
(1)
(2)
1.2 分水岭分割算法分割建成区影像
经过FCM聚类处理后的影像被粗分为具有光谱相似性的包含道路、建筑物等地物的建成区和与道路光谱差异较大的非建成区,去除非建成区地物后,剩余基于像素FCM聚类的建成区,因此需要对建成区进行分割,以便对后续的基于对象的MKSVM道路提取进行处理。
分水岭分割方法,是一种基于拓扑理论的数学形态学的分割方法,其基本思想是把图像看作测地学上的拓扑地貌,图像中每一点像素的灰度值表示该点的海拔高度,每一个局部极小值及其影响区域称为集水盆,而集水盆的边界则形成分水岭[9]。由于受噪声等因素影响分水岭分割算法容易造成过分割现象。本文采用文献[9]中的标记分水岭方法,能够一定程度上抑制影像过分割,减少分割对象数目,减少后文工作的工作量,提高算法效率。
1.3 建成区分割对象的特征提取
分水岭分割后的建成区影像对象既含有光谱特征,又含有大量的空间结构特征。特征提取是通过MKSVM进行道路信息提取的关键步骤,特征提取的好坏直接影响后续道路提取的精度。
1.3.1 光谱特征
(1) 光谱均值:计算区域对象中像素的每个波段的光谱值,对每个波段光谱值求平均值作为区域对象的特征。
SAVE=SSUM/N
(3)
式中,SAVE为单波段对象光谱均值;SSUM为单波段区域对象内像素的光谱值之和;N为像素点个数。
(2) 均方差:高分辨率遥感影像谱内差异较大,谱间差异较小,仅提取光谱均值作为光谱特征难以满足分类需要,进一步提取均方差,与均值一起作为光谱特征。
1.3.2 纹理特征
区域形状指数(regional shape index,RSI)是在PSI基础上加以改进的区域空间特征,能够很好地反映区域对象的纹理特征[10]。对于任一特定的区域对象,从对象中心点沿不同方向发散一系列方向线,通过设定阈值T限制方向线条数。假设对象中心点为(x0,y0),方向角为θ,对于第tth条方向线上任意一坐标点(mt,nt),其方向线描述如下
nt=tan(t×θ)×(mt-x0)+y0
(4)
方向线长度计算公式如下
(5)
式中,(xt,yt)为方向线与边界的交点。算出所有的方向线长度,并进行求和运算就可以得到RSI,计算公式如下
(6)
1.3.3 形状特征
(1) 长宽比:城市道路通常表现为条带状结构,长宽比较大。使用区域对象的最小外接矩形的长度与宽度比M来近似区域对象的长宽比[11]。
M=LR/W
(7)
式中,LR为外接矩形的长;W为外接矩形的宽。
(2) 矩形度:目标区域对象面积与包围该对象的最小矩形面积的比值,适合检测曲线道路。
R=S0/SR
(8)
式中,S0为目标区域对象的面积;SR为包围该对象的最小矩形的面积;R的大小可以区分目标对象与最小矩形的接近程度,其范围是(0,1]。
(3) 线性特征指数(linear feature index,LFI):道路是暗长区域,遍历已得到道路的候选区域,利用一个最小外接矩形包围连通区域,采用文献[12]中的方法提取每个连通区域的中心线。连通区域转换成矩形,该矩形满足
LW=np
(9)
约束条件为:L=连通域中心线的长度;np=连通域的面积。其LFI可通过下式计算
(10)
式中,L和W分别是新矩形的长和宽;np是连通域的面积。道路有大的LFI值,LFI较小的连通区域被去除。
2 MKSVM道路提取及数学形态学处理
2.1 MKSVM基本原理
大量的试验研究证明SVM对于小样本、高维特征的分类具有较好的性能,SVM的成功运用促进了核方法的研究与发展[13-14]。MKSVM在SVM的基础上以多核函数代替单核函数,将不同样本的特征分量分别输入不同的核函数进行映射,使数据在新特征空间中得到更好的表达,从而提高学习性能和分类精度[15]。其中核函数公式为
(11)
式中,dm为多核权系数;km为基核。
因此,与SVM问题类似,多核SVM类问题可描述为如下形式
(12)
约束条件为
(13)
将式(3)整理为以dm为变量的优化问题
(14)
约束条件为
(15)
(16)
全局核函数泛化能力强,学习能力差;局部核函数学习能力强但泛化能力差。本文结合高分辨率遥感影像小样本特征复杂的特点,以全局核函数POLY核函数与局部核函数RBF核函数线性加权组合,构建MKSVM,采用文献[16]中的蜂群算法求解MKSVM的权系数和相关核参数。人工选取训练样本,将上文提取的特征进行归一化处理后输入MKSVM进行建成区影像的二次分类,提取出道路信息。
2.2 数学形态学处理
经过上述MKSVM提取后的道路信息,仍存在由于车道线、车辆、阴影和其他噪声干扰造成的孔洞现象。数学形态学利用具有一定形态的结构元素去度量和提取图像中的对应形状[17],能够很好地填充孔洞。在本文中用到的数学形态学算子是膨胀运算、腐蚀运算、击中或不击中变换。
设A和B为两个非空集合,B为具有一定形态的结构元素,那么:
腐蚀的定义为
AΘB=xBx⊆A
(17)
膨胀的定义为
(18)
击中或不击中变换
A⊗B=(AΘB1)∩(AcΘB2)
(19)
3 试验结果与分析
试验选取重庆市某地区QuickBird影像为研究对象,实现城市道路信息的快速准确提取,影像拍摄时间2016年8月,影像大小434×434。QuickBird影像含有R、G、B 3个波段,空间分辨率0.61 m。各试验步骤结果如图2所示。
图2 道路提取步骤
从目视效果来看,本文所提方法可以较好地提取出道路信息。图2(b)是经FCM方法聚类后提取的建成区影像,建成区内既含有道路,也含有与道路光谱相似的建筑物、水泥广场等;图2(c)经过标记分水岭分割后,一定程度上抑制了过分割现象;图2(d)利用MKSVM二次分类获得了粗略的道路信息,从图中可以看出,道路已经基本上完整地被提取出来,但仍含有一些易混的噪声;图2(e)为经过数学形态学处理后的道路提取结果,可以看出,道路提取效果比较好。
为了验证本文所提方法的有效性,采用常用的道路提取算法边缘检测算法、多尺度提取及单一核函数SVM作为对比试验,并采用客观与主观结合的方式对提取效果进行评价。具体的各方法道路提取效果图如图3所示。
图3 不同方法道路提取结果
从目视效果来看,边缘检测的道路提取方法效果最差,存在一定程度上的道路误分现象,一些建筑物被误分成道路;多尺度提取及单核SVM的道路提取方法基本上可以准确提取出道路,但仍有一定的凹洞、不连贯现象存在;本文所提方法经过MKSVM提取和数学形态学处理后,能够完整地提取出道路信息,提取效果相比其他3种方法有了明显提高。
为了对道路的提取效果进行客观评价,即将道路提取结果与真实的地物地面数据进行比较,本文通过建立误差矩阵并进行相关的运算得到所分地物的分类精度;选用总体精度与Kappa系数对道路提取效果进行客观评价[18]。
3.1 误差矩阵
误差矩阵是用来表示精度评价的一种标准格式,它是一个n×n的矩阵,其中n表示类别的数量。
(20)
式中,pij表示分类数据类型中第i类数据被划分到j类中的总数。在误差矩阵中,对角线上的值越大,说明分类精度越高,反之,若非对角线上的值越大,则分类精度越低。
3.2 总体精度(OA)
(21)
3.3 Kappa系数
Kappa系数是另外一种评价分类精度的方法,它采用离散的多元技术,考虑了误差矩阵中的所有因素,是一个更为客观的评价指标,具体计算公式如下
(22)
为定量进行道路提取效果的评价,验证本文所提方法的有效性,本文在原始图像中随机选取500个测试样本点,并对道路和非道路样本点进行个数统计。图4为测试样本点分布。道路提取结果评价见表1、表2。
图4 测试样本点分布
从表2中可以看出道路提取的总体精度达到了91.00%,Kappa系数达到了0.802 2,能够有效地提取出道路信息。相比于边缘检测方法,多尺度方法及单核SVM方法都有一定程度的提高。
表1 测试样本点道路提取结果
表2 不同方法道路提取综合评价
为了更好地验证本文所提方法的有效性,本文利用另外一幅WorldView-2影像进行道路提取试验,各方法道路信息提取结果如图5所示
图5 不同方法提取效果
从表3中可以看出,本文所提方法与边缘检测方法和多尺度方法相比,总体精度和Kappa系数明显提高,分别提高7.1%和4.4%,Kappa系数分别提高0.068 9和0.034 8。相比于单核SVM提取方法,提高幅度不大,总体分类精度和Kappa系数分别提高2.9%和0.024 9,但仍有一定效果的改善。由上述分析可知,本文方法道路提取效果更好。
表3 不同方法的道路提取评价结果
4 结 语
针对在高分辨率遥感影像中难以精确提取道路信息的特点及SVM分类性能的问题,本文提出了一种城市道路的多特征多核SVM分层提取的方法。综合利用影像对象的多种特征,基于面向对象技术并结合多核学习和SVM分类器,实现了城市道路的有效提取。总体来看,本文所提方法能够较精确地提取出城市道路信息,在地理国情普查与监测、数字城市、智慧城市建设中具有一定的应用价值。但本文由于利用多核SVM进行分类,势必导致计算复杂度的增加,下一步将就如何降低计算复杂度进行研究。
[1] 刘纯,洪亮,陈杰,等.融合像素—多尺度区域特征的高分辨率遥感影像分类算法[J].遥感学报,2015,19(2):228-239.
[2] 孙可,张钧萍.局部自适应方向模板匹配的高分辨率遥感影像道路提取[C]∥2015年光学精密工程论坛论文集.长春:《光学精密工程》编辑部,2015:509-515.
[3] ZHAO L,WANG X.Road Extraction in High Resolution Remote Sensing Images Based on Mathematic Morphology and Snake Model[C]∥International Congress on Image and Signal Processing.[S.l.]:IEEE,2010:1436-1440.
[4] ZHAO W Z,LUO L Q,GUO Z,et al.Road Extraction in Remote Sensing Images Based on Spectral and Edge Analysis[J].Spectroscopy and Spectral Analysis,2015,35(10):2814-2819.
[5] 林鹏,阮仁宗,王玉强.一种基于面向对象的城镇道路自动提取方法研究[J].地理与地理信息科学,2016,32(1):49-54.
[6] ZHU E,SONG W,DAI J,et al.Road Extraction of High-resolution Remote Sensing Images Based on Improved SVM[J].Science of Surveying and Mapping,2016,41(12):224-228.
[7] MIAO Z,SHI W,GAMBA P,et al.An Object-based Method for Road Network Extraction in VHR Satellite Images[J].IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing,2016,8(10):4853-4862.
[8] JIA S,LI X,GUO F,et al.A Fast and Robust FCM Algorithm with Local Information for Image Segmentation[J].Icic Express Letters,2015,9(3):869-874.
[9] 贾永红,冯在梅,沈庭乐.基于标记分水岭分割的高分辨率影像水体信息提取[J].测绘通报,2014(9):31-33.
[10] CHU S,HONG L,LIU C,et al.A New Regional Shape Index for Classification of High Resolution Remote Sensing Images[C]∥Third International Workshop on Earth Observation and Remote Sensing Applications.Changsha:IEEE,2014.
[11] 陈杰,邵权斌,梅小明,等.结合尺度空间的面向对象高分辨率影像城市道路提取[J].测绘工程,2016,25(12):5-11.
[12] SHI W,MIAO Z,WANG Q,et al.Spectral-spatial Classification and Shape Features for Urban Road Centerline Extraction[J].IEEE Geoscience and Remote Sensing Letters,2014,11(4):788-792.
[13] ZHENG W,TANG H,HUANG T S.Emotion Recognition from Non-frontal Facial Images[M]∥Emotion Recogn-ition:A Pattern Analysis Approach.Hoboken:John Wiley and Sons,Inc.,2015:183-213.
[14] CUSANO C,NAPOLETANO P,SCHETTINI R.Remote Sensing Image Classification Exploiting Multiple Kernel Learning[J].IEEE Geoscience and Remote Sensing Letters,2015,12(11):2331-2335.
[15] 晁拴社,楚恒,王兴.高光谱图像数据的多尺度多核SVM分类[J].计算机与现代化,2016(2):11-14.
[16] 吴一全,殷骏,戴一冕,等.基于蜂群优化多核支持向量机的淡水鱼种类识别[J].农业工程学报,2014,30(16):312-319.
[17] GONZALEZ R C,WOODS R E,EDDINS S L.数字图像处理[M].阮秋琦,译.北京:电子工业出版社,2014.
[18] 赵时英.遥感应用分析原理与方法[M].北京:科学出版社,2003.