基于GF-2影像城市绿地提取方法对比研究
2019-08-21
(滁州学院地理信息与旅游学院,安徽 滁州239000)
引 言
城市绿地是城市生态系统中必不可少的组成部分,为城市提供诸多生态服务,发挥着重要的生态作用,快速并准确地获取城市绿地信息是绿地格局分析、规划建设与管理的基础[1-2]。因此,为实现城市绿地的合理规划和有效管理需要精确、高效地城市绿地提取方法。
相对于中低空间分辨率的遥感影像,高空间分辨率的遥感影像具有更为丰富的空间几何结构、纹理、形状等信息,这些信息对提升地方分类精度大有裨益。近年来,以Worldview-2、IKONOS等为主的国外高空间分辨率遥感影像已在城市绿地信息提取中被广泛应用[3-5]。而国产卫星的不断发展也使我国高空间分辨率遥感影像的自主供给能力得到提升,“高分二号”(GF-2)卫星是迄今为止中国自主研制的空间分辨率最高的民用遥感卫星,GF-2影像已广泛地应用于矿山资源监测、土地利用现状解译、城市规划检测评价、交通规划等行业和领域,但在城市绿地提取方面研究还不够深入[6-9]。
目前,利用遥感影像进行地物提取的主要方法可分为目视解译和计算机自动分类方法两种。其中目视解译方法虽然精度高,但过程繁琐复杂且效率低,工作量大成本高;而相对于目视解疑,利用计算机自动分类的方法不仅可以避免目视解疑中因主观因素造成的错误,同时其还具有快速、大量、高效提取地物信息的优点[10]。在计算机自动分类方法中,又可进一步分为基于像元的分类方法和面向对象的分类方法,其中基于像元的分类方法应用较为广泛,且发展较为成熟,其代表之一就是最大似然法(Maximum Likelihood, ML)[11-12]; 但随着遥感影像空间分辨率的不断提升,传统的基于像元光谱信息的分类方法很难满足高空间分辨率遥感影像的信息提取需求,因此一种面向对象影像分析(Object-based Image Analysis, OBIA)技术得以提出,其在一定程度上降低了“椒盐现象”,弥补了基于像元分类的不足,并逐渐在遥感影像分类中占据了主导地位[13-16]。目前常用的主流面向对象分类算法有决策树(Decision Tree, DT)[17]、支持向量机(Support Vector Machines, SVM)[18]、随机森林(Random Forest, RF)[19]、贝叶斯(Bayes)[20]、K最近邻法(K-Nearest Neighbor, KNN)[21]等。为验证面向对象分类方法在高分辨率遥感影像分类中的优势,并系统地比较基于GF-2影像提取城市绿地信息时几种面向对象方法的表现效果和精度差异,文章以滁州市城区为例,选取了两个范围大小相同的实验样区,在综合视觉效果和精度结果下对这几种分类方法进行了比较分析,旨在探索适用、可靠的城市绿地信息提取方法,为精确、高效地提取城市绿地提供参考。
1 研究区概况与数据源
1.1 研究区概况
滁州市位于安徽省东部,总面积13398平方千米,为安徽省面积第三大地级市,地处江淮丘陵东北部,北接淮北平原,南近沿江平原,地形以丘陵为主,丘陵面积约占全市总面积的64.9%。市内有琅琊山国家级风景名胜及明皇陵、龙兴寺等历史文化景点,旅游资源优异;市境地跨长江、淮河两大流域,水资源充沛,此外市内矿产资源丰富且植被覆盖多样。文章选取滁州市城区中心部位开发较早,常年没有明显地物变化且城市绿地丰富的两个范围为1.0km×0.8km的矩形区域作为研究区,如图1所示。
图1 GF-2研究区概况图
1.2 数据源及处理
文章以滁州市中心城区一景GF-2影像为遥感影像数据源,该影像的获取时间为2015年7月29日,其多光谱波段和全色波段分辨率分别为4m和1m;此外研究区域30m的ASTER GDEM数据和2018年获得的两个研究区实地调查样本各300(绿地200个,非绿地100个)个作为辅助数据也参与到本研究中。在影像预处理过程中,先以中国资源卫星应用中心提供的GF-2绝对辐射定标系数将多光谱数据定标为辐射亮度,将全色数据定标为表观反射率,并利用ENVI 5.3中的FLAASH模块对多光谱辐射定标之后的辐亮度图像进行大气校正;然后利用GDEM数据对影像进行正射校正,因研究区域地形变化不明显,所以未对影像进行进一步的地形校正;最后将正射校正后的影像进行融合、裁剪,完成了影像的预处理[10]。
2 研究方法
利用经过预处理后的GF-2研究区影像分别利用传统基于像元的ML方法和面向对象的方法对研究区绿地进行提取。其中面向对象的方法先通过多尺度分割(Multiresolution Segmentation, MRS)生成影像对象层,然后构建并选取特征参数作为分类的预测变量,再利用5种不同的面向对象分类方法实现绿地的提取。最后,将6种分类方法的结果进行对比分析。研究的技术流程如图2所示。
图2 技术流程图
2.1 影像分割及对象获取
影像分割的目的是将影像中类似的像元集合并成对象单元,是面向对象分类的基础,因此影像分割结果将直接影响到分类的精度。本文采用Cognition Developer中集成的MRS方法实现了影像的分割和对象的获取。在利用MRS方法获取对象时需要对形状因子、紧致度因子、分割尺度参数等进行设定,其中形状因子、紧致度因子等对分割结果影响较小,通过试错法获得;而分割尺度的选择是多尺度分割中的核心问题[22],若分割尺度过大(如图3a),会导致单个对象包含多种地物,易形成欠分割现象;若尺度过小(如图3b),使得地物对象过于零碎而对象纹理和结构信息不足。由于研究区绿地破碎且零散,经过多次分割实验并结合ESP(estimation of scale parameters)尺度评价工具[22-23],最终选择效果最好的分割尺度为30,光谱因子权重为0.9,形状因子权重0.1,紧致度为0.5,光滑度0.5,分割结果如图3c。
a.分割尺度:100 b.分割尺度:10 c.分割尺度:30图3 尺度为30的分割结果
2.2 特征构建与选择
2.2.1 光谱特征
光谱特征是利用不同地物反射的光谱信息作为影像分类的重要依据,研究选取光谱特征包括预处理后GF-2影像的4个波段(Blue、Green、Red、NIR)的均值(Mean)、标准差(Standard deviation)、归一化植被指数(NDVI)、亮度(Brightness)、最大差分(Max diff)[24](表1)。
表1 特征变量统计表
2.2.2 纹理特征
纹理特征可以充分利用高分辨率影像地物丰富的纹理信息进行辅助分类,合理的利用纹理特征能够给影像分类精度带来很大提高[24]。1973年Haralick等提出的基于灰度共生矩阵(Gray Level Co-occurrence Matrix, GLCM)提取的均值(Mean)、标准差(Standard Deviation)、同质性(Homogeneity)、对比度(Contrast)、相异性(Dissimilarity)、熵(Entropy)、角二阶矩(Second Moment)和相关性(Correlation)是目前研究中常用到的纹理特征[25]。但是纹理特征通常存在着严重的冗余现象,而利用主成分分析(Principal Components Analysis, PCA)法可以减少信息冗余提高运行效率。本研究通过主成分变换所得的PCA1、PCA2波段包含了原始影像99.17%的信息量,因此,本研究选取PCA1、PCA2波段信息替代原始影像构建共生矩阵(表1)。
2.3 影像分类
研究从两个研究区实地调查样本中各选分布较为均匀地180个样本作为训练样本(绿地120个,非绿地60个),而后对单个研究区使用相同训练样本,并结合光谱和纹理特征变量分别采用DT、SVM、KNN、Bayes、RF共5种面向对象的分类方法进行影像分类,同时作为对比,使用基于像元的ML进行分类。
3 结果分析
3.1 分类结果
根据实验得到的研究区分类结果,将每种分类结果制作成绿地分布专题图,如图4和图5所示。
a.DT分类图
b.SVM分类图
c.KNN分类
d.Bayes分类
e.RT分类
f.ML分类
a.DT分类图
b.SVM分类图
c.KNN分类
d.Bayes分类
e.RT分类
f.ML分类
通过对比分类结果图明显可以看出,研究区城市绿地分布相当破碎零散。就直观分类效果而言,图4中DT、SVM、RT分类效果较好,图5中DT、SVM、Bayes、RT分类效果较好。基于像元的ML结果中出现了比较严重的“椒盐”现象,而在面向对象的分类结果中也存在着不同程度的“错分、漏分”现象,其中KNN方法效果较差。
3.2 精度评价
从两个研究区实地调查样本中分别以除去训练样本后的120个样本作为验证样本(绿地80个,非绿地40个)进行精度评价,验证样本点分布如图5所示。研究利用验证样本对分类结果构建混淆矩阵[26],得出每种分类结果的总体精度和Kappa系数,最终获得研究区一和研究区二的精度评价结果如表2所示。
a.研究区一
b.研究区二
从精度评价表2可得知,5种面向对象分类的总体精度和Kappa系数相比基于像元的ML均有明显地提升,其中RT在两个研究区中均取得了最好的结果,分类精度为88.37%和91.17%,Kappa系数为0.80和0.87,DT和SVM的分类精度略次于RF且二者相差不明显,而Bayes和KNN的表现较差。
本研究以滁州市城区GF-2影像数据为数据源,对原始影像进行辐射定标、大气校正、正射校正、影像融合等预处理,采用5种不同面向对象的分类方法和1种基于像元的分类方法分别对研究区绿地信息进行提取,并对实验结果进行对比分析,得到如下结论。
表2 研究区精度评价结果
4 结论
在影像分割时选取不同的分割尺度会直接影响到分类的精度,分割尺度的确定需要反复的实验,分割的目标对象应尽量完整且不冗余,最佳的分割尺度能够减少分类结果的“错分、漏分”现象,有效地提高分类精度。
基于GF-2影像数据的面向对象方法提取城区绿地结果总体表现较好,从分类效果来看,相比基于像元的ML而言,面向对象分类结果“椒盐”现象减少,整体目视效果较好;从精度评价结果来看,RT的分类结果最优,相比ML总体精度从77.5%提高到91.17%,Kappa系数从0.74提高到0.87,DT、SVM、RT分类精度都达到80%以上,两个研究区分类精度排序分别为:RT>DT> SVM>Bayes>KNN>ML,RT>SVM>DT>Bayes>KNN>ML。