APP下载

高分辨率遥感影像5种面向对象分类方法对比研究

2017-12-05邵聪颖李海涛顾海燕王李娟

测绘通报 2017年11期
关键词:面向对象向量精度

林 卉,邵聪颖,李海涛,顾海燕,王李娟

(1. 江苏师范大学地理测绘与城乡规划学院,江苏 徐州 221116; 2. 中国测绘科学研究院, 北京 100083)

高分辨率遥感影像5种面向对象分类方法对比研究

林 卉1,邵聪颖1,李海涛2,顾海燕2,王李娟1

(1. 江苏师范大学地理测绘与城乡规划学院,江苏 徐州 221116; 2. 中国测绘科学研究院, 北京 100083)

针对主流的面向对象分类方法在遥感影像处理中的使用范围不明确的问题,以e-Cognition软件平台为基础,处理标准数据集,综合考虑视觉效果、总体精度和用户精度3方面,系统地比较分析了主流的面向对象分类方法在高分辨率影像中的分类效果和精度分析。试验结果表明:使用不同的分类方法均存在混分现象且混分对象不完全一样。在处理同一标准数据集时,隶属度函数分类方法的精度最高但分类速度最慢,Bayes的分类效果最差但操作简单,支持向量机(SVM)、决策树(DT)、随机森林(RF)的分类速度均较快且都有较高的精度,其中SVM分类方法在区分相似性高的对象方面具有明显优势。在选择高分影像分类方法时,要充分考虑分类影像的特征选择从而选择合适的分类方法。

面向对象分类;SVM分类;RF分类;DT分类;Bayes分类;隶属度函数分类

高分辨率的卫星遥感影像在获取地表细节、大比例尺制图及监测环境变化等方面具有显著优势,应用前景非常广阔。随着高分辨率影像的普及,以及商业化的面向对象分类智能软件的面世,面向对象分类方法越来越受到青睐,其应用也逐渐扩展到众多领域,高分辨率遥感影像主要用于测绘制图、国土资源管理、油气矿业、精准农业交通及道路设施、军事目标识别与灾害评估等。国内外学者针对高分辨率遥感影像面向对象分类方法展开了一系列研究。

郭亚鸽等以HJ-1数据、Landsat数据为主并结合DEM数据,对森林植被进行分类,并对比了隶属度函数和最大似然分类方法,结果表明,隶属度函数在植被森林二级类信息提取的效果优于最大似然方法[1];郭玉宝等以高分一号影像为试验数据,使用随机森林、支持向量机、最大似然3种方法进行了城市用地分类对比分析,综合分析发现,随机森林算法表现更优,既能保证分类精度又能保持一定的时间效率[2];赵丹平等以多源高分辨率遥感影像为试验数据,从分类效果、分类精度等方面对比分析支持向量机、决策树、随机森林3种分类方法的优劣,大量的试验分析表明,可综合随机森林对特征的优选机制和支持向量机的高分类精度,得到新的组合分类器[3];Qian等通过处理WorldView-2影像发现在城市土地分类中,支持向量机和贝叶斯分类方法分类效果优于决策树和最近邻分类方法[4];Duro等利用决策树分类方法、随机森林分类方法、支持向量机分类方法进行农业景观分类,并进行对比分析,试验表明决策树和随机森林分类方法更适合农业景观分类[5];Song等通过土地覆盖分类试验发现人工神经网络和支持向量机在分类准确率上无显著差异,但通常支持向量机表现略好[6];Campomanes等利用支持向量机分类方法和随机森林分类方法对红树林进行提取,并进行比较分析,试验结果表明,随机森林方法优于支持向量机[7];Li等分析两种非监督分类方法(ISODATA和基于特征空间变换聚类分类方法)和13个监督分类方法(最大似然分类方法、最近邻分类方法、支持向量机分类方法、决策树、随机森林分类方法、Logistic模型树分类方法等)发现,大多监督分类方法可以产生较高的分类精度,综合各方面考虑,最大似然、随机森林、支持向量机、Logistic模型树分类方法的分类效果最优[8];Chan等利用高光谱影像比较分析了随机森林和决策树两种分类方法的分类结果,试验表明,两种方法具有同样高的分类精度,但随机森林的训练速度更快、更稳[9]。Novack等利用WorldView-2和QuickBird-2模拟影像采用支持向量机、C4.5决策树、随机森林和回归树4种方法对屋顶进行分类,并比较分析各种方法的优劣,试验表明,随机森林分类方法精度最高,效果最好,支持向量机效果最差[10]。

随着计算机技术学科的发展,面向对象的高分辨率遥感影像分类方法突破了传统的依靠像元自身光谱特征进行分类的缺陷,研究方法呈现多样化发展。常用的面向对象分类方法包括贝叶斯分类(Bayes)、支持向量机分类(support vector machine,SVM)、决策树分类(decision tree,DT)、随机森林分类(random forest,RF)、隶属度函数分类等。虽然国内外专家学者对各类方法进行了深入的研究,并成功应用于高分辨率影像的分类,但是还未在标准数据集中比较分析主流分类方法在高分辨率影像中的分类效果和精度。本文以正射影像为主要数据,借助DSM数据,以eCognition软件为平台,采用标准数据集对5种面向对象分类方法的分类效果进行对比分析。

1 面向对象分类方法

图1是5种分类试验的技术路线,先对正射影像和DSM进行多尺度分割,利用ESP(estimation of scale parameters)得出最优参数[11],然后分别对5种方法进行分类,前4种方法需要对样本进行训练。

图1 5种分类试验的技术路线

1.1 影像多尺度分割

采用eCognition9.0对研究区进行面向对象分类,运用多尺度分割算法对影像进行分割,为了确保影像分类的精度,利用ESP得出最优分割参数,最佳分割尺度为100,形状因子为0.1,紧致度因子为0.5。

1.2 特征提取

利用随机森林算法得出最优特征[12],选取Mean_nir(近红外波段均值)、NDVI(归一化植被指数)、Mean_DSM(高度均值)3个特征。其中,归一化植被指数=(Nir-Red)/(Nir+Red)。

1.3 样本采集

DT、SVM、RF、Bayes 4种方法需要进行样本训练,根据试验区地物类型覆盖范围,选取典型、有代表性的样本。在选取的样本中,一部分用来训练样本,一部分用来进行精度评价。

1.4 影像分类

对试验数据采用DT、SVM、RF、Bayes和隶属度函数等5种方法进行影像分类,前4种方法使用同一个训练样本,5种方法使用同一个样本进行精度评价。

1.4.1 Bayes分类方法

在eCogniction软件中完成Bayes分类时,需要先根据分类体系,为每种类别选取少量具有代表性的样本进行训练,再根据训练样本影像对象进行贝叶斯分类。

1.4.2 SVM分类方法

在eCogniction软件中完成SVM分类时,同Bayes过程一样。训练样本时,综合考虑样本数量、模型大小和运行速度,优先选择线性核函数作为SVM分类器的核函数。SVM模型中惩罚系数C(对误差的宽容度)是一个非常重要的参数。C值越大表明越不能容忍出现误差,更易出现过拟合线性;相反,C越小,容易欠拟合。C过大或过小,泛化能力都会变差。经过多次试验后,本文的惩罚系数C为2。

1.4.3 DT分类方法

在eCogniction软件中完成DT分类时,同Bayes过程一样,采用的是CART算法。经过多次试验,每个节点需要的最小样本数为5,进行交叉验证数为3。

1.4.4 RF分类方法

在eCogniction软件中完成RF分类时,同Bayes过程一样。经过多次试验,单棵树的最大深度为3,每个节点需要的最小样本数为3,森林中树的数目上限50,森林训练的OOB误差为0.01。

1.4.5 隶属度函数分类方法

虽然隶属度函数分类不需要提前选择样本,但仍需要多次试验获取各个地物分类的最佳阈值,因此,确定地物类别的阈值范围及隶属度函数决定了隶属度函数分类的效果。在此分类过程中,使用eCognition软件平台,先大致确定某一地物的阈值范围,再经过多次调试,获取较为准确的阈值。对于隶属度函数的选择也是结合各个地物光谱特征,尽量选择能够准确描述该类别地物变化曲线的隶属度函数。通过多次试验,通过对各类进行定量描述,使用隶属度函数分类方法可提取分类系统中的各类土地利用类型,各地类类描述见表1。

表1 各地类类描述

2 试验与结果分析

2.1 研究区数据

试验区为波茨坦城区,试验数据为ISPRS提供的标准数据集(正射影像与DSM),分辨率均为5 cm[13]。参与分类的波段为蓝、绿、红、近红外1。从可解译性出发,结合试验区的特点,划分试验区用土地类型:建筑区、水体、树、低植被和不透水面5类,原始影像以假彩色显示(如图2所示)[14]。

图2 分辨率5 cm的波茨坦城区

2.2 分类结果

5种分类方法分类效果如图3所示,精度评价见表2。

表2 5种分类方法的精度评价

图3 5种分类方法的结果

2.3 对比分析

图3给出了5种方法在波茨坦城区的分类结果。从图3的视觉效果上看,5种方法都得到了很好的分类效果。隶属度和RF分类效果最好,其次是DT和SVM,分类效果最差的是Bayes。Bayes方法存在明显的水体、建筑物和不透水面混分现象;SVM方法存在明显的低植被、树和不透水面混分现象;DT方法存在水体、建筑物混分现象;RF方法存在水体、建筑物和不透水面混分现象;隶属度函数方法存在低植被和树混分现象。

表2给出了5种分类方法的精度评价结果。从表2的总体精度来看,5种方法都得到比较满意的总体分类精度,总体精度的大小是:隶属度函数>RF>DT>SVM>Bayes,分别为:98.19%、96.99%、93.96%、93.37%、90.36%。从表2的用户精度看,隶属度函数和RF方法的5类地物的精度总体上高于其他4种方法,而Bayes方法的建筑物和树的精度低于其他4种方法,DT方法的树和水体的精度都偏低,SVM方法的低植被精度最低。

针对5种分类方法得到的结果图详细分析如下:

从图3(a)和表2可以看出有少部分的建筑区被错分成了水体,树的提取效果最好,但也导致大片的低植被错分成树。DT分类过程具有很强的可理解性,在理论上也能较好地解释各个类别之间的特征与差别,特别适合大数据量的遥感影像处理。DT分类方法在实际生产中应用更为广泛,对地类空间分布要求不高,但要求各类别之间特征明显。

从图3(b)和表2可以看出,SVM分类方法的分类精度与DT相近,相比DT、SVM的分类速度更快,并且SVM对树和低植被区分效果优于DT,树和低植被具有较高的相似性,SVM对相似性较高的地类分类效果更好,但SVM方法的核函数和分类参数(包括惩罚系数C,核函数参数)的选择没有特别好的办法,不容易找到最优的核函数和分类参数。

从图3(c)和表2可以看出,RF分类方法既有较好的分类精度,又有较快的分类速度,但决策树的个数影响RF方法分类效果和速度。为保证既有较快的分类速度又能满足精度需求,应选择合适的生成树个数。RF方法适合大数据量、多特征参数的高分影像的实际生产应用。

从图3(d)和表2可以看出,在分类过程中Bayes分类方法易于操作,而且能取得较好精度,分类速度较快。Bayes方法在水体、树和低植被的边界分类效果不好,其适用于地物类别之间特征明显,各地物类别空间分布均匀的区域,不适用于各个地类之间特征不明显或有交叉的情况,或是各个地类在整幅影像中分布不均匀的区域。

从图3(e)和表2可以看出,隶属度函数分类方法对影像分类结果最为准确,体现了隶属度函数分类方法的优越性,但隶属度函数分类方法对操作人员的技术要求较高,分类过程中工作量较大,尤其是阈值的确定需要经过大量试验,其分类精度与用户设定阈值直接相关。因此,隶属度函数适用于地形复杂,地物类别之间特征有交叉的情况,其分类结果较为精确,但实际生产中由于需要大量的试验和经验,数据适用性不高。

3 结 论

5种分类方法在高分辨率遥感影像中都得到了相对较好的分类效果。从试验结果可以看出,这5种方法均存在一定程度上的混分现象,不同方法的混分对象不一样。综合考虑视觉效果、总体精度和用户精度,隶属度函数的分类效果最好,但分类速度最慢,极大依赖于大量的试验和经验数据;Bayes的分类效果最差,但操作简单、分类速度快;其余3种方法分类效果和分类速度类似,其中SVM分类方法能够较好地区分相似性高的对象,如低植被和树木。综上所述,这5种方法在不同的情况下可以发挥各自的分类优势,应当根据实际情况选择不同的分类方法。

[1] 郭亚鸽, 于信芳, 江东, 等. 面向对象的森林植被图像识别分类方法[J]. 地球信息科学学报, 2012, 14(4): 514-522.

[2] 郭玉宝, 池天河, 彭玲, 等. 利用随机森林的高分一号遥感数据进行城市用地分类[J]. 测绘通报, 2016 (5): 73-76.

[3] 赵丹平, 顾海燕, 贾莹. 机器学习法在面向对象影像分类中的对比分析[J]. 测绘科学, 2016, 41(10): 181-186.

[4] QIAN Y, ZHOU W, YAN J, et al. Comparing Machine Learning Classifiers for Object-based Land Cover Classification Using very High Resolution Imagery[J]. Remote Sensing, 2014, 7(1): 153-168.

[5] DURO D C, FRANKLIN S E, DUBÉ M G. A Comparison of Pixel-based and Object-based Image Analysis with Selected Machine Learning Algorithms for the Classification of Agricultural Landscapes Using SPOT-5 HRG Imagery[J]. Remote Sensing of Environment, 2012, 118(6): 259-272.

[6] SONG X, DUAN Z, JIANG X. Comparison of Artificial Neural Networks and Support Vector Machine Classifiers for Land Cover Classification in Northern China Using a SPOT-5 HRG Image[J]. International Journal of Remote Sensing, 2012, 33(10): 3301-3320.

[7] CAMPOMANES F, PADA A V, SILAPAN J. Mangrove Classification Using Support Vector Machines and Random Forest Algorithm: a Comparative Study [R]. Enschede: University of Twente, 2016.

[8] LI C, WANG J, WANG L, et al. Comparison of Classifica-tion Algorithms and Training Sample Sizes in Urban Land Classification with Landsat Thematic Mapper Imagery[J]. Remote Sensing, 2014, 6(2): 964-983.

[9] CHAN J C W, PAELINCKX D. Evaluation of Random Forest and Adaboost Tree-based Ensemble Classification and Spectral Band Selection for Ecotope Mapping Using Airborne Hyperspectral Imagery[J]. Remote Sensing of Environment, 2008, 112(6): 2999-3011.

[10] NOVACK T, ESCH T, KUX H, et al. Machine Learning Comparison between WorldView-2 and QuickBird-2-simulated Imagery Regarding Object-based Urban Land Cover Classification[J]. Remote Sensing, 2011, 3(10): 2263-2282.

[12] 顾海燕, 闫利, 李海涛, 等. 基于随机森林的地理要素面向对象自动解译方法[J]. 武汉大学学报(信息科学版), 2016, 41(2): 228-234.

[13] ISPRS.2D Semantic Labeling Contest-Potsdam[DB/OL]. (2001-12-19)[2016-09-15]. http:∥www2.isprs.org/commissions/comm3/wg4/2d-sem-label-potsdam.html.

[14] 张继贤, 魏钜杰, 赵争,等. 基于多方向多源合成孔径雷达数据融合的假彩色正射影像制作[J]. 测绘学报, 2011, 40(3):276-282.

FiveObject-orientedClassificationMethodsAnalysisBasedonHigh-resolutionRemoteSensingImage

LIN Hui1,SHAO Congying1,LI Haitao2,GU Haiyan2,WANG Lijuan1

(1. School of Planning,Geomatics and Geography of Jiangsu Normal University, Xuzhou 221116, China; 2. Chinese Academy of Surveying and Mapping, Beijing 100083, China)

In view of the mainstream object-based classification method in remote sensing image processing using range is not clear, based on e-Cognition software, the standard data set is processed. Comprehensively considering the visual effects, overall accuracy and user accuracy, classification results and precision analysis of mainstream object-based classification are systematic analysis in the high resolution image. The experimental results show that there are mixed phenomena using different classification methods and the mixed objects are not exactly the same. In dealing with the same standard data set, the membership function has the highest accuracy but the slowest speed. The classification effect of Bayes is the worst, but the operation is simple. The classification speed of SVM, RF, DT are faster and have higher accuracy. Meanwhile SVM has obvious advantages in distinguishing objects with high similarity. In the selection of high resolution image classification method, we should fully consider the feature selection of classified images to select the appropriate classification method.

object-based classification;SVM classification;RF classification;DT classification;Bayes classification;membership function classification

林卉,邵聪颖,李海涛,等.高分辨率遥感影像5种面向对象分类方法对比研究[J].测绘通报,2017(11):17-21.

10.13474/j.cnki.11-2246.2017.0340.

P237

A

0494-0911(2017)11-0017-05

2017-04-13;

2017-05-05

国家自然科学青年基金(41401397);江苏省自然基金青年项目(BK20140237)

林 卉(1973—),男,硕士,副教授,主要从事遥感图像处理工作。E-mail:linhuixznu@126.com

猜你喜欢

面向对象向量精度
GEE平台下利用物候特征进行面向对象的水稻种植分布提取
向量的分解
热连轧机组粗轧机精度控制
聚焦“向量与三角”创新题
超高精度计时器——原子钟
分析误差提精度
面向对象方法在水蓄冷PLC编程中应用分析
基于DSPIC33F微处理器的采集精度的提高
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线