基于SVM的土地利用/覆盖分类
——以老哈河流域为例
2015-03-16李硕
李 硕
(中国水利水电建设工程咨询西北有限公司,西安 710065)
文章编号:1006—2610(2015)03—0012—03
基于SVM的土地利用/覆盖分类
——以老哈河流域为例
李 硕
(中国水利水电建设工程咨询西北有限公司,西安 710065)
选取老哈河流域为研究区域,以2007年的两景Landsat5的TM影像为数据源,对该地区进行土地利用/覆盖分类。由于该区域土地覆盖类型复杂,影像较难区分且容易造成错分类。该研究中采用支持向量机(Support Vector Machine,SVM)分类法,通过引入径向基核函数进行非线性变换映射至高维空间,提取它们的非线性特征,增强不同类型之间的可分性,减少错分现象,提高遥感图像分类的精度。通过试验,提取出了2007年的老哈河流域的土地利用/覆盖现状图,以校验该方法的可行性。
老哈河流域;土地利用/覆盖;支持向量机(SVM);遥感图像分类
1 研究区域概况
老哈河为西辽河南源,是西辽河流域主流。其地貌特征复杂,黄土广布,覆盖层深厚,冲沟发育,沟壑纵横,土地覆盖类型比较复杂多样。 在本研究中所取的兴隆坡控制站以上的老哈河流域,面积约为1.9万km2,位于北纬41°~43°,东经 117°~120°,流域形状为不对称扇形,全流域水系共有大小165条。
2 研究区数据及预处理
2.1 研究区数据
根据研究区的覆盖范围及生物、气候特征,本文中将选用成像于无云的晴朗天气下的2007年9月3日和2007年10月3日的两景Landsat5的TM影像进行镶嵌,作为遥感制图数据源。
将地面高程信息引入遥感图像分类是提高遥感分类精度的有效措施之一,而老哈河流域相当一部分面积在山区,因而地形信息成为遥感精确分类必不可少的数据。因此,本研究选用SRTM的“3”数据作为DEM数据源。
2.2 数据预处理
由于遥感系统空间、波谱、时间以及辐射分辨率的限制,很难精确地记录复杂地表的信息,遥感数据在获取过程中会产生辐射畸变、几何畸变,从而降低了遥感数据的质量,影响图像分析的精度。遥感图像数据预处理即经过几何校正、辐射校正,以及噪声抑制等处理,使遥感图像能最好地接近原始景物[1]。
本研究的遥感影像数据经过了辐射校正、大气校正、几何校正和影像镶嵌,其中辐射校正所使用的影像的增益(Gain)和偏差(Bias)值如表1所示(由于Landsat TM传感器运行时间较长,其增益和偏差值较最初改变较大),大气校正使用ENVI遥感软件的Flaash模块实现,几何校正使用最邻近象元法采用二次多项式实现,精度在0.5个象元之内。
表1 研究所用TM影像的增益和偏差值表
3 选择样本,进行信息提取
本次试验基于SVM方法对老哈河流域的高分辨率遥感影像进行特征提取和分类,在此基础上进行土地利用覆盖分类。在分类时,主要步骤为:首先,选择合适的训练区和检验区;其次,进行参数率定,寻求合适的参数,使得分类精度最高;最后,得出分类结果及对结果进行评价。
3.1 训练区和检验区的选择
根据本研究区的土地覆盖特征,将土地覆盖分为水体、城乡用地、林地、耕地、草地和未利用地6个类别,针对每个类别分别选取感兴趣区,每个类别的感兴趣区不少于300个样本。
3.2 SVM参数率定
在多光谱遥感影像的SVM分类中,RBF核函数模型被证明是最有效的核函数,因此本文在SVM分类中选用RBF核函数。
采用交叉验证的方法来确定RBF必备的2个关键参数惩罚系数C和间隔γ,通过不断改变C和γ的取值可以改变样本分类结果的精度,最后选取可得到最高的样本分类结果精度(即样本精度)的C、γ取值,作为SVM分类的参数值。本文使用libsvm-2.89软件[2]提供的参数选择模型Grid.py来搜索C和γ的取值。最佳SVM模型参数为:惩罚因子C=8,核参数γ=8,交叉验证的精度为95.5631%。
3.3 SVM分类及分类结果评价
在ENVI软件的支持下,将经过交叉验证得出的C和γ值带入其中,对影像进行分类处理,在分类结果的基础上进行分类精度的评价。
通过基于误差矩阵(或称混淆矩阵)的遥感影像分类精度的评价方法,最终算出对于总体的和基于各种地面类型的分类精度值。在基于混淆矩阵的统计量中,总体精度、用户精度、制图精度和KKappa系数是最常用的指标。
在进行精度评价时,每类至少有30~50个样本点,本文根据类别面积大小随机选取样本点进行精度评价,每个类别的精度评价样本大于200个。样本选取的依据是原始影像的目视判读和参考2000年的老哈河流域土地利用现状图,以及2006年8月份和2008年8月份对老哈河流域进行的土地利用现状调查数据。最后构建土地利用变化分类混淆矩阵,见表2所示。
表2 SVM分类混淆矩阵及KKappa系数表
由表2可以看出,各地物类别的提取精度较高。其中城乡用地、耕地、林地等面积较小类别的精度均比较高,取得了较好地分类效果。
从混淆矩阵也可以看出,最大的变化分类误差来自未利用地类,原因主要是可能当时存在部分新种的农田,由于其光谱特征与未利用地光谱特征较为相近,容易发生混淆,导致出现部分耕地被错分成未利用地[3-4]。或者变化误差来源于耕地转化为城乡用地类,此类耕地与城乡用地交错分布,一部分耕地被收割后,与未利用地的光谱发生混淆,部分面积较小的单元就会构成混合像元,以导致影像上的一部分耕地被错误地分为未利用地[3-4]。耕地的分类精度最高,主要是由于耕地的光谱特征跟其他地物的光谱特征差异较大,且耕地区域内的地形起伏不大,几乎没有阴影,不易与其他地物产生混淆,所以分类精度最高。
从总体精度和KKappa系数上来看,SVM分类方法精度较高,比较适用于本研究取的土地利用/土地覆盖分类,研究区最后的分类结果为:在2007年的老哈河流域,水体、城乡用地、林地、耕地、草地和未利用地所占流域面积分别为0.31%、2.53%、32.04%、41.75%、22.43%和0.94%。从上述统计数据可以看出,流域内城乡用地不多,城市化程度不高,流域内农林牧用地占流域的96.22%,为流域的主体。
4 结果分析与评价
本文采用径向基函数支持向量机,通过实验,可以看出SVM分类精度较高,分类结果比较理想,总体精度高达91.14%。
通过本次实验,亦可以得出,C值可以控制学习过程的边界误差与支持向量的数目[5],但是C值过大,也不能提高分类精度。在本次试验中,当C=8,γ=8时,其土地利用/土地覆盖分类精度达到最高;C值过小时,其分类精度降低,直到为0。γ值决定了特征空间内决策平面的收缩程度[5],当γ在8附近时,分类效果达到最好,当γ进一步增加或者减小时,其分类精度均有所降低。
该流域土地类型复杂,有些地区草地和林地间杂分布,而使图像难以区分,同时由于分类是用光谱信息,对影像逐个像元进行比较、分析,在地类交界处的像元中包括有多类别,其混合像元造成错分类。而基于SVM分类方法对这些类型的分类精度较高,SVM通过引入和函数进行非线性变换映射至高维空间,提取它们的非线性特征,增强不同类型之间的可分性,大大地减少了错分现象,在一定程度上提高了分类精度。
[1] 李祖锋,贺丽娟,张成增,周涛. 高角度信号遮挡区域GPS测量控制网精度控制[J].西北水电,2014,(01):27-31.
[2] Chang Chih-Chung,Chih-Jen Lin.LIBSVM : a library for support vector machines[M].2001.
[3] 曹雪.基于TM影像的南京市土地利用遥感动态监测[J].武汉大学学报(信息科学版),2006,(11):958-961.
[4] 刘启寿,魏兰花. 坐标转换在悬高测量中的应用[J].西北水电,2012,(01):24-25,33.
[5] 居红云.基于K-means与SVM结合的遥感图像全自动分类方法[J].计算机应用与研究,2007,(11):318-320.
Classification of Land Utilization and Covering Based on Support Vector Machine——with case of Laoha River catachment
LI Shuo
(China Hydro Consulting Engineering Corporation, Northwest Branch, Xi'an 710065,China)
The Laoha River catchment is selected as the study catchment. Based on the data source of TM image of Landsat 5 in 2007, classification of the land utilization and covering in the catchment is studied. As the land covering of this catchment is complicated in classification, the images are difficult to separate and easy to classify. In this study, classification method of support vector machine (SVM) is applied. By utilization of radial basis function, the non-linear conversion is conducted to the high-dimensional space, abstracting their non-linear characteristics, strengthening the separation between different types, reducing mistaken classification and improving accuracy of the remote-sense image classification. Through tests, the land utilization and covering status images of the Laoha River catchment in 2007 are abstracted to verify the feasibility of this method.
Laoha River catchment; land utilization and covering; support vector machine; remote-sense image classification
2014-12-15
李硕(1986- ),男,陕西省渭南市大荔县人,助理级工程师,主要从事工程测绘工作.
TP79
A
10.3969/j.issn.1006-2610.2015.03.004