APP下载

基于SVM的资源三号测绘卫星影像多特征分类

2015-02-07范雪婷史照良

地理空间信息 2015年4期
关键词:分类器灰度测绘

范雪婷,史照良,刘 波

(1.江苏省基础地理信息中心,江苏 南京 210013;2.江苏省测绘地理信息局,江苏 南京210013)

基于SVM的资源三号测绘卫星影像多特征分类

范雪婷1,史照良2,刘 波1

(1.江苏省基础地理信息中心,江苏 南京 210013;2.江苏省测绘地理信息局,江苏 南京210013)

针对传统分类方法精度不高、感兴趣目标分类不理想等缺陷,采用多特征组合的支持向量机影像分类方法,利用颜色矩、颜色集和灰度共生矩阵进行特征提取,总体精度、Kappa系数和混淆矩阵作为评价指标对单一特征、组合特征的不同分类结果进行分析。实验结果表明,该方法有效地解决了单数据源分类不完整、精度低等问题,对高维输入向量具有较高的推广力。

支持向量机;多特征;资源三号;分类

遥感数字图像计算机识别与分类是遥感图像处理中的一个重要课题[1]。随着遥感技术发展,遥感图像数据日益增多,人工目视解译方法已无法满足遥感图像的分类要求,计算机自动识别、分类提供了更加准确有效的分类结果[2]。2010年12月,李克强副总理作出“深入贯彻落实科学发展观,加强基础测绘和地理国情监测”重要批示,加之我国第一颗自主的民用高分辨率立体测绘卫星资源三号(ZY-3)发射成功[3],因此如何借助ZY-3测绘卫星影像获取地理国情监测对象,尽可能减少多种干扰因素对其分类产生的负面影响,不断提高分类的精度和智能化水平[4,5],是地理国情监测遇到的技术难题,同时也是遥感影像识别与分类中一个重要课题。支持向量机(SVM)由Bosoer、Guyon和Vapnik等提出[6],作为一种最新的也是最有效的统计学习方法,已成为模式识别与机器学习领域一个新的研究热点。SVM适用于解决小样本、非线性、高维数据和局部极小等实际问题,因其学习效率高、稳定和具有相对较高的精度而得到广泛应用,较最小距离和最大似然等传统经典方法具有一定的优势,例如,基于SVM进行遥感影像分类[7],利用SVM提取空间特征进行遥感影像分类[8]。目前已提出的分类方法中,大多采用逐点分类方法且只利用单一特征。大量文献指出,单一特征在某些应用中不如多特征组合提取的图像信息完整,在特征提取上,不同算法得到的图像信息具有一定的互补性,通过特征组合形成的分类器能获得好的分类效果。因此,提出了基于SVM多特征组合的遥感影像分类方法。

1 特征提取

1.1 颜色矩

颜色矩是一种非常简单而有效的颜色特征,由Stricker和Orengo提出[9]。该方法利用线性代数中矩的概念,将图像中的颜色分布用矩表示。由于颜色信息主要集中在低阶矩中,因此仅采用一阶矩(Mean)、二阶矩(Variance)和三阶矩(Skewness)就足以表达图像的颜色分布。与颜色直方图不同,利用颜色矩进行图像描述无需量化图像特征。颜色的3个低次矩的数学定义如下:

式中,Ei、σi和si分别表示图像第i颜色通道一阶矩、二阶矩和三阶矩;pij表示图像第i颜色通道分量中第j 个像素的灰度值;N表示图像总像素个数。

这样,图像就可以用颜色矩特征向量,一个9维直方图向量来表征,即图像的颜色矩可表示为{ER,σR,sR,EG,σG,sG,EB,σB,sB}。

1.2 颜色集

HSV颜色空间直接对应于人眼视觉特性3要素:色调H(Hue)、饱和度S(Saturation)和亮度V(Value),比RGB空间更直观,更符合人的视觉特性。

颜色直方图计算简单、快速,是较为常用的一种颜色特征,然而直接在颜色三维空间中进行计算,无论是计算时间还是存储空间,成本都非常高。Smith和Chang提出用颜色集作为颜色直方图的一种近似[10],首先将图像RGB颜色空间转化为HSV空间,在HSV空间中进行特征提取,由于人眼对H值较敏感,对S、V值的感知较弱,因此将HSV 3个分量按照人的颜色感知进行非等间隔的量化,将图像量化为一个72阶的直方图。

按照人的视觉分辨能力,把色调H空间量化为8份,饱和度S和亮度V空间各量化为3份,具体非等间隔量化模型为:

依据量化级,将3个颜色分量转化为一维特征矢量:

式中,Hij、Sij、Vij分别表示图像像素点(i,j)的H、S、V值;G的取值范围为0~71。

1.3 灰度共生矩阵

灰度共生矩阵反映图像中任意两点之间灰度的空间相关性,是一种有效的纹理描述方法,是分析图像局部模式和排列规则的基础[11]。1973年Haralick研究了图像纹理中灰度级的空间依赖关系,提出灰度共生矩阵的纹理描述方法,其实质是从图像中灰度为i的像素(其位置为(i,j))出发,统计与其距离为d、灰度为j的像素(x+Δx,y+Δy)同时出现的次数p(x,i,d,θ),数学表达式为:

式(6)中,x, y=0,1,2,…,N-1表示图像中的像素坐标;i, j=0,1,2,…,k-1表示灰度级;Δx,Δy表示位置偏移量;d为灰度共生矩阵步长;θ为生成方向,取0°、45°、90°、135° 四个方向,从而生成4个不同方向的灰度共生矩阵。实验中d的取值为5,k的取值为16。

Haralick等人由灰度共生矩阵提取了14种特征,其中最常用的有角度方向二阶矩ASM(angular second moment)、主对角线惯性矩CON(contrast)、逆差矩IDM(inverse different moment)、熵ENT(entropy)以及自相关COR(correlation)5种二阶统计量,计算公式分别为:

式(11)中,

2 SVM

2.1 SVM理论基础

SVM的原理是用分离超平面作为分离训练数据的线性函数,解决非线性分类问题。其最优分类形式为寻找一个分类超平面,使两类无错误地分开,且分类间隔最大。数学描述为:在条件约束下,求函数的极小值。

通过求对偶问题,将其归结为一个二次函数极值问题,即在约束条件下,求解函数的最大值。

得到的最优分类判别函数为:

式中,K(xi· xj)为核函数,有线性核、多项式核、RBF核(Gaussian径向基核)等多种形式。

2.2 SVM多类分类器

SVM是一个二分类器,如何将SVM应用于多分类问题,现主要有以下两种方法:①一对多分类器,即对于n类问题,构造n个2类SVM分类器。将多个分类面的参数求解合并到一个最优化问题中,通过一次求解该最优化问题实现多类分类。②一对一分类器,即对于n类问题,构造n个2类SVM分类器。每个分类器只用于识别其中2个类别,并将它们的判别结果以投票方式组合起来,得票最多的类为样本所属的类。对于这两种方法,第一种方法在求解最优化问题过程中所需变量远多于第二种,且训练速度较慢,分类精度也比较差。本文采用一对一分类器进行影像分类。

2.3 SVM分类器参数选择

不同形式的核函数,生成不同形式的SVM,同时对应着不同的分类最优超平面。Vapnik等人的研究表明,SVM的性能与所选用的核函数的类型关系不大,核函数的参数和误差惩罚因子C是影响SVM性能的主要因素。RBF核在低维、高维、小样本、大样本等情况下均表现出较好的学习能力,因此这里选用RBF核作为本实验的核函数。惩罚系数参数C和间隔γ的取值直接影响分类精度。本文采用一种基于交叉验证的网格搜寻的方法来确定C和γ的值。

3 实验与分析

3.1 实验数据

实验数据采用2012-03-24安徽省滁州市的资源三号测绘卫星影像,截取其中涵盖地物类别较为全面且适中的1幅影像进行分析(图1),其大小为824行×971列,分辨率为5.8 m。采用交叉比对算法确定SVM模型最佳参数为C=2、γ=0.5。

3.2 样本选择

图1 原始影像图

样本选择充分考虑了各类别的光谱、纹理特征、边界特性及分布均匀性等原则,实验中,样本选择类别及数量分别为:建筑物C1=33;植被C2=40;道路C3=73;水体C4=29,占实验区数据样本总量的7.3%。

3.3 实验结果与分析

在Microsoft Windows7操作系统下,基于VS2008和LibSVM3.7集成开发环境编写了算法实验程序。实验中用于训练和测试的样本数据集在输入SVM 前,先进行归一化处理,统一缩放到[-1, 1]之间,以避免大特征值淹没小特征值对分类的贡献;然后将归一化处理的单一特征或组合多特征作为输入数据进行学习和训练,形成不同的SVM预测模型;再利用SVM 模型对测试样本进行分类。分类结果精度评价,采用最常用的混淆矩阵,结合总体精度和Kappa系数指标进行评价。

为了验证多特征组合的SVM遥感影像分类的有效性,分别从单一颜色矩特征、单一颜色集特征、单一GLCM特征、颜色矩和GLCM组合特征、颜色集和GLCM组合特征与颜色矩、颜色集和GLCM组合特征等方面进行实验。相关实验结果为:①表1列出了不同特征组合的SVM分类结果,从总体精度和Kappa系数可以直观看出不同特征数组组合的分类结果;②图 2给出了颜色矩、颜色集与GLCM特征组合的遥感影像分类结果;③为进一步说明各类别的分类精度,表2列出了颜色矩、颜色集与GLCM特征组合的SVM分类结果混淆矩阵。

表1 不同特征组合的遥感影像分类结果

表2 颜色矩、颜色集与GLCM组合特征分类结果混淆矩阵

综合上述实验结果分析如下:

1)基于SVM利用单一光谱、纹理特征进行分类,分类精度都达到了80%以上,显示出SVM在小样本分类中的优越性。颜色和纹理特征组合描述更多的遥感图像信息,分类准确率高于单一特征,分类精度基本在90%以上。

2)从图像定性分析和精度结果表的定量分析来看,结合光谱和纹理的SVM分类方法对复杂、高维输入向量具有更高的推广能力。

3)对于单一地物,纹理特征在丰富纹理结构地物上具有显著影响,如建筑区等;而光谱特征在亮度、颜色较为丰富的地物上表现出一定的优势。小范围水域由于水面光谱差异大,且基本无纹理结构,准确分类较为困难。

图2 颜色矩、颜色集与GLCM组合特征分类结果

4 结 语

通过光谱、纹理特征的提取,研究了基于单一特征和多种特征组合的SVM分类方法在资源三号测绘卫星影像分类中的应用,并利用总体精度、Kappa系数和混淆矩阵比较了各种基于不同特征的SVM 算法的分类效果。从实验结果的定性和定量分析,利用多特征组合的SVM分类方法较单一特征具有较高的分类精度,满足资源三号测绘卫星影像的地物分类调查要求,具有很高的实用和推广价值。

[1] 梅安新, 彭望禄, 秦其明, 等.遥感导论[M].北京:高等教育出版社,2001

[2] 汤国安, 张友顺, 刘咏梅,等.遥感数字图像处理[M].北京:科学出版社,2004

[3] 唐新明, 张过, 祝小勇,等.资源三号测绘卫星三线阵成像几何模型构建与精度初步验证[J].测绘学报,2012,41(2) : 191-198

[4] 苏伟, 李京, 陈云浩,等.基于多尺度影像分割的面向对象城市土地覆被分类研究——以马来西亚吉隆坡市城市中心区为例[J].遥感学报, 2007, 11(4):521-530

[5] 陈杰, 邓敏, 肖鹏峰,等.基于分水岭变换与空间聚类的高分辨率遥感影像面向对象分类[J].遥感技术与应, 2010, 25(5):597-603

[6] Vapnik V N. The Nature of Statistical Learning Theory[M].Beijing: Tsinghua University Press, 2000

[7] 胡自申, 张迁.基于SVM的遥感影像的分类[J].遥感信息, 2003(2): 14-18

[8] 骆剑承, 周成虎, 梁怡, 等.支撑向量机及其遥感影像空间特征提取和分类的应用研究[J].遥感学报, 2002,6(1):50-55

[9] Stricker M,Orengo M.Similarity of Color Images[A].Niblack W, Jain R C. Storage and Retrieval for Image and Video Databases Ⅲ[C].SPIE,1995

[10] Smith J R,Chang S F.Tools and Techniques for Color Image Retrieval[A]. Sethi I K, Jain R C. Storage and Retrieval for StillImage and Video DataBase Ⅳ[C]. SPIE,1996

[11] Tuceryan M, Jain A K. Texture Analysis, Handbook Pattern Recognition and Computer Vision[M]. Singapore: World Scientific, 1993

P237.4

B

1672-4623(2015)04-0023-04

10.3969/j.issn.1672-4623.2015.04.009

范雪婷,硕士,研究方向为地理国情监测及InSAR。

2014-07-21。

项目来源:精密工程与工业测量国家测绘地理信息局重点实验室开放基金资助项目(PF2012-9);江苏省科技基础设施建设计划—科技公共服务平台项目(BM2013066)。

猜你喜欢

分类器灰度测绘
采用改进导重法的拓扑结构灰度单元过滤技术
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
浙江省第一测绘院
工程测绘中GNSS测绘技术的应用
04 无人机测绘应用创新受青睐
基于实例的强分类器快速集成方法
基于最大加权投影求解的彩色图像灰度化对比度保留算法
无人机在地形测绘中的应用
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器