基于GF-1卫星东洞庭湖湿地类型信息提取
2015-12-21和晓风严恩萍
和晓风,林 辉,孙 华,严恩萍,胡 佳
(中南林业科技大学 林业遥感信息工程研究中心,湖南 长沙 410004)
基于GF-1卫星东洞庭湖湿地类型信息提取
和晓风,林 辉,孙 华,严恩萍,胡 佳
(中南林业科技大学 林业遥感信息工程研究中心,湖南 长沙 410004)
以我国自主发射的第一颗高分辨率卫星(GF-1卫星)的影像为数据源,在东洞庭湖开展湿地信息提取。结合国家湿地遥感分类系统和高分影像数据的可解译性,建立了东洞庭湖湿地类型遥感分类系统,包括湖泊、河流、泥滩地、林地、芦苇、苔草、辣蓼+泥蒿7种湿地类型。利用最佳指数和联合熵 2个指标确定最佳波段组合方式为 4(R)3(G)2(B),并在遥感图像进行预处理的基础上,采用面向对象的决策树进行分类,结果表明:基于面向对象决策树遥感分类方法比最大似然法分类的精度高,总分类精度达85.41%,Kappa 系数为 0.822 5,并且各类信息的提取精度均有所提高,其中湖泊、芦苇、林地的精度较高。
湿地;信息提取;面向对象;决策树;东洞庭湖
遥感图像分类是遥感技术的重要步骤,传统分类方法主要包括非监督分类和监督分类,这是基于像元的分类方法,主要依据光谱特征来分类,信息极其有限[1-2],由于异物同谱和同谱异物现象较为普遍,仅靠光谱特征提取目标,所得分类结果的精度较低[3]。近年来基于像元的遥感影像分类引入了大量先进的方法,如支持向量机、神经网络、分层聚类等,在影像分类精度等方面有了很大的改进[4-7],但本质上还是基于灰度的分类,无法摆脱方法上的局限。事实上地物的分布具有一定的连续性[8-9],遥感影像相邻像元之间存在一定的关联,分类时必须加以联系并一起来考虑。将像元及其周边像元综合考虑,成为一个对象,每个对象都具有一定的空间信息如大小、形状、纹理、位置及空间关系等[10-14],这样影像的最小单元不再是单个的像元而是一个个整体和一个个对象 。而湿地的类型大多以斑块或者一个整体的形式出现,有着很强的纹理信息和连续性[15],斑块之间又存在一定的关联,利用湿地的这些特点,采用面向对象的决策树分类技术,对遥感影像,特别是高分辨率的遥感影像分类应该是有改善的[16-17]。
本文以东洞庭湖湿地为研究对象,在研究区湿地类型分类系统构建基础上,利用GF-1影像数据,基于ENVI EX 软件的Feature Extraction平台,采用面向对象方法对研究区湿地进行分类,并将结果与传统的最大似然法分类结果进行比较分析。
1 研究区概况与数据处理
1.1 研究区概况
东洞庭湖位于北纬28°39′~ 30°14′, 东 经111°43′~ 113°40′,地处湖南省北部、长江中游荆江南岸,属于中亚热带向北亚热带过渡地带,气候温暖湿润,年平均气温 16.4 ℃,研究区内的湿地类型主要有:湖泊、河流、泥滩地、林地、芦苇、苔草、辣蓼、泥蒿等(如图 1 所示)。
图1 研究区地理位置Fig. 1 Location of Study Area
1.2 数据源
1.2.1 GF-1影像数据
研究选取了2014年05月东洞庭湖的高分一号卫星(GF-1,见表1)影像,进行湿地类型信息提取。GF-1卫星搭载了2 m分辨率全色和8 m分辨率多光谱相机,是我国自主发射的第一颗高分辨率卫星。
表1 GF-1卫星参数Table 1 Parameters of GF-1 satellite
1.2.2 外业实测数据
2014年11月上旬对研究区进行野外考察和数据采集,结合研究区主要湿地类型的地理分布特点,共选取25个样区调查,建立了湿地植被解译标志表,同时利用Trimble手持GPS记录下样点的地理位置、高程以及分布情况。
1.3 GF-1数据预处理
研究对所采用的GF-1遥感影像进行了辐射校正、几何校正、正射校正和图像融合处理。辐射校正过程包括辐射定标与大气校正。图像融合是将低分辨率的多光谱影像与高分辨率的单波段影像重采样,处理后的影像既有较高的空间分辨率,又具有多光谱特征信息。
1.4 东洞庭湖湿地遥感分类系统
根据国家湿地遥感分类系统和GF-1卫星影像的可解译性,结合东洞庭湖实际情况,建立了东洞庭湖的四级湿地遥感分类系统,结果如表2所示。
表2 湿地遥感分类系统Table 2 Remote sensing classification system of wetland types
2 研究方法
2.1 GF-1最佳波段组合
将多波段遥感影像信息通过最佳波段组合合成彩色图像是遥感影像处理的一个重要步骤。利用信息熵和最佳波段指数(Optimum Index Factor,OIF)的定量指标来确定最佳波段组合,熵是衡量信息丰富程度的重要指标之一,熵越大,图像含的信息越丰富,图像质量越高。图像数据的标准差越大, 包含的信息量也越多,而波段间的相关系数越小, 则表明各波段的独立性越高,信息的冗余度越小。波段组合之间地物光谱差异变大,地物就越容易区分,所选波段组合中各波段间的相关性最小,则信息量就最大。对GF-1预处理后的影像,进行信息量的评价,结果见表2和表3。
表2 GF-1各波段信息指标评价Table 2 Each band information index evaluation
表3 波段间最佳波段组合Table 3 Optimum Index Factor between bands
从表中2可以看出,预处理过后的影像,第4波段标准差远大于其余3个波段的标准差,说明第4波段的信息量优于其他,从信息熵的大小中也可以得到相同的结论,另外从信息量的角度考虑,带有第4波段的波段组合OIF均大于65,但是234波段组合超过另外两类组合将近10%,因此234波段组合为最优,考虑到目视效果,确定最终的RGB为432。
图2 预处理后的GF-1影像(波段432组合)Fig 2 Preprocessed image of GF-1 data(band 432 combinations)
2.2 信息提取
2.2.1 光谱特征
水域多成青色,并且色调单一,与其它地物的光谱信息相差较大,很适合用归一化水体指数(NDWI,IW)来提取,该指数是基于影像的绿波段与近红外波段,归一化水体指数计算公式为IW=[bGreen-bNir]/[bGreen+bNir]。不同地物的归一化植被指数(NDVI,IV)值差别较大,归一化植被指数计算公式为IV=[bnir-bred]/[bnir+bred]。通过计算统计,东洞庭湖水体和泥滩地的SARVI差别明显,可用SARVI指数区分水体和泥滩地。
2.2.2 纹理特征
纹理是由大量或多或少的相似纹理元或模式组成的一种结构,组成纹理的基元及其相互关系构成了纹理的两个基本特征,纹理基元与图像的局部灰度色调变化规律有关,有大小和形状等特征,而纹理基元之间的相互关系则构成了整个图像的空间结构,如均值、标准差、对比度。
2.2.3 形状特征
除上述两项重要的特征外,形状特征也有利于快速有效地分辨不同几何形态的地物,提高分类精度,如河流为条带状,其长宽比和形状指数大于其它地物。分割后的图像从以像元为基础转换为以对象为基础,在对每个对象进行形状因子的计算和分析,这些形状因子包括面积、周长、长度、宽度、长度比、圆形度等。
2.3 影像分割
根据研究区域范围的大小和影像特征,确定合适的分割尺度,分割尺度的选择对分类结果的精度具有至关重要的影响。因为对于光谱特征上比较相近的地类,如果分割参数选择不当,他们就会混合在一起,造成分类精度降低。不同分割尺度的试验结果差异是明显的,分割尺度取 30 时,分割过于细致、破碎,不利于分类;当分割尺度取 70 时,分割不够完整,存在一个对象包含了多种地物的现象;分割尺度取 50 的结果相对兼顾了研究区各种植被的局部细节以及空间几何分布特征。本研究选择分割尺度为50,其它参数设置为形状权重0.35,紧凑度0.6。
2.4 最大似然法分类
最大似然法假设每个波段中各类训练数据都呈正态(高斯)分布,直方图具有两个或n个波峰的单波段训练数据并不理想。在这种情况下,各个波峰很有可能表示是由各类唯一确定的,应该作为分离的训练类单独训练和标识。然后,应该得到满足正态分布要求的单峰、高斯型训练类统计量。最大似然法的判别规则是基于概率的,它把每个具有模式测试或特征X的像元划分到很有可能出现特征向量X的第i类中。换言之,首先计算某个像元属于一个预先设置好的m类数据集中每一类的概率,然后将该像元划分到概率最大的那一类。
2.5 建立面向对象决策树模型
面向对象决策树分类不再以像元为处理单元,而是以图斑作为分类的处理对象,图斑包含的信息比单个像元更加丰富,不仅仅包含光谱信息,还包括多种特征如大小、形状、纹理、位置等信息。面向对象的分类方法主要分为两个步骤,发现对象及特征提取。发现对象首先要对图像进行分割,得到同质对象,根据具有相同属性的对象进行同一类别的合并,再根据图斑属性以及具体知识进行目标地物的提取。根据研究区的实际情况和GF-1的可判性,建立了东洞庭湖湿地决策树分类模型(见图3)。
图3 面向对象决策树分类模型Fig. 3 Object-oriented model of decision tree classification
基于面向对象遥感分类方法,根据研究区湿地植被特点及GF-1数据分辨率,确定草滩地(苔草滩地、芦苇滩地、泥蒿滩地、辣蓼滩地)、湖泊、河流、泥滩地、林地、其它等几种湿地类型。运用 ENVI EX 模块作为数据处理平台,首先输入经过预处理的原始图像,输入 DEM 图像作为辅助分类图像,经过多次反复试验,分割阈值设为 50,合并分块阈值设为98.2,同时选择具有典型性和代表性的训练样区,且数量不宜过多,经过分析后,建立了决策树模型。
3 结果与分析
3.1 2种分类方法的比较
为了比较面向对象分类方法的效果,将最大似然法与面向对象决策树法进行比较分析。最大似然法是传统的遥感影像分类法中比较具有代表性,应用比较普遍的一种方法。
从图4可以直观地看出,最大似然法进行运算的分类结果更加破碎化,图像放大之后会看到更多的噪声,原因在于最大似然法仅运用光谱信息进行分类,而高分辨率影像光谱信息复杂多样,同物异谱或同谱异物现象更加严重,导致该方法在运用于高分辨率影像分类时误差较大。而面向对象分类方法作为特征参与分类的不仅仅是光谱信息,还包括分割得到图斑的几何形状、空间位置、相互关系以及可人为定义的大量专家知识,在处理高分辨率遥感影像方面更加具有适用性,避免了分类结果的破碎化和椒盐现象,并且分类结果中各类别边界明确清晰。
3.2 精度评价
对研究区进行系统布点(见图5),并逐点判读,得到分类结果见表4和表5。
图4 最大似然法分类和面向对象决策树分类结果Fig. 4 Maximum likelihood and Object-oriented decision tree classification results
图5 精度评价分布点Fig. 5 Precision evaluation of distribution points
从表4和表5可以看出,采用面向对象决策树法分类精度达到85.41%,Kappa 系数为0.822 5;最大似然法的分类精度为78.75%,Kappa 系数为0.674 4,说明面向对象分类方法在进行高分辨率遥感影像信息提取时比传统的最大似然监督分类方法具有更高的分类精度。
4 结 论
本文采用最大似然法和面向对象的决策树法对东洞庭湖进行湿地信息提取,将两种方法的分类结果进行定性、定量的比较,并对研究区内GF-1遥感影像特征和实验结果的进行分析,得出如下结论:
(1)对 GF-1影像进行波段分析,利用联合熵和最佳指数确定了研究区内最佳波段组合为4(R)、3(G)、2(B)、波段。
(2)对于湿地信息的提取,在面向对象分类方法中,湖泊、芦苇、林地成斑块化分布,分类结果明显优于河流、苔草、泥滩地、辣蓼+泥蒿。
(3)利用面向对象决策树分类技术对图像进行分类,在分类过程中减少了“同谱异物”和“同物异谱”现象的产生,并且分割操作的引入也极大地避免了“椒盐”现象的出现,提高了遥感影像解译精度,总的分类精度达85.41%,Kappa 系数为0.822 5,比最大似然法精度高出6.66个百分点,Kappa系数高出0.148 1,取得了较好的分类效果。
[1]章仲楚.面向对象的杭州西溪湿地遥感方法研究[D].杭州:浙江大学,2007:29-38.
[2]孙 华,林 辉,莫登奎,等.面向对象的决策树分类技术[J].中南林业科技大学学报,2007,27(4):39-43.
[3]陈 利,林 辉,孙 华,等.基于决策树分类的森林信息提取研究[J].中南林业科技大学学报,2013,33(1):47-51.
[4]凌成星,鞠洪波,张怀清,等.基于 Worldview-2八波段影像改进指数的湿地类型分类研究[J].林业科学研究,2014,27(5):639-643.
[5]莫登奎,林 辉,李际平,等.基于均值漂移的高分辨率影像多尺度分割[J].广西师范大学学报,2006,24(4):247-250.
[6]东启亮,林 辉,孙 华,等.独立分量分析与主成分分析方法的湿地遥感分类精度对比——以西洞庭湖湿地为例[J].湿地科学,2014,12(3):332-338.
[7]朱晓荣,张怀清,周金星.东洞庭湖湿地遥感动态监测研究[J].林业科学研究,2008,21(2)41-45.
[8]Benz U C,Hofmann P, Willhauck G, et al. Multi-resolution,Object-oriented Fuzzy Analysis of Remote Sensing Data for GIS-ready Information[J]. ISPRS Journal of Photogrammetry and Remote Sensing,2004,58(1): 239- 258.
[9]Chris Wright,Alis Gallant. Improved wetland remote sensing in Yellowstone National Park using classification trees to combine TM imagery and ancillary environmental data[J]. Remote Sensing of Environment, 2007,107(4):582-605.
[10]Hamed K H.Trend detection in hydrologic data:The Mann-Kendall trend test under the scaling hypothesis[J].Journal of Hydrology,2008,349:350-363.
[11]Li Ting-wei, Liang Dian-nong, Zhu Ju-bo. A review of inversion of the forest height by polarimetric interferometric SAR [J].Remote Sensing Information,2009,3:95-101.
[12]Mazzoni D,Logan A,Diner D.A Data Mining Approach to Associating MISR Smoke Plume Heights with MODIS Fire Measurements [J].Remote Sensing of Environment,2007,3:107.
[13]Su L.Support Vector Machines for Recognition of Semiarid Vegetation Types Using MISR Multiangle Imagery [J].Remote Sensing of Environment, 2007,107(12):299-311.
[14]林 辉,莫登奎.高分辨率遥感图像分割技术研究[J].中南林学院学报,2006,26(4):45-51.
[15]唐小平,黄桂林.中国湿地分类系统的研究[J].林业科学研究,2003,16(5):531-539.
[16]王红娟,姜加虎,黄 群.基于知识的东洞庭湖湿地遥感分类方法[J].长江流域与环境,2008,17(3)370-373.
[17]陶 超,谭毅华,蔡华杰.面向对象的高分辨率遥感影像城区建筑物分级提取方法[J].测绘学报,2010,39(1):39 -45.
Wetland types information extraction form east Dongting lake based on GF-1 satellite
HE Xiao-feng,LIN Hui,SUN Hua, YAN En-ping, HU Jia
(Research Center of Forest Remote Sensing & Information Engineering, Central South University of Forestry & Technology,Changsha 410004, Hunan, China)
Based on the first high satellites (GF-1 satellite images) launched by China, the study extracted information of the East Dongting Lake wetland. Combined with the interpretation of national wetland remote sensing classification system and high resolution image datas, a RS classification system of wetland types of East Dongting Lake was built , including lakes, rivers, mudflats, woodland,reed, sedge, Polygonum + mud Artemisia seven kinds of wetlands .Two index ,the best index and joint entropy, were used to determine the optimal band combination ,that was 4 (R) 3 (G) 2 (B).Based on the preprocessing of remote sensing image ,the classification was done by using object oriented decision tree, the results showed that: the precision of object oriented decision tree classification method is higher than maximum likelihood ratio classification, the accuracy of total classification reaches to 85.41%, Kappa coefficient is 0.8225.And the extraction accuracy of all kinds of information has improved, among them the accuracy of lake, reed and forest is higher.
wetlands; Information extraction;object oriented;decision tree; east Dongting lake
S771.8
A
1673-923X(2015)11-0010-06
10.14067/j.cnki.1673-923x.2015.11.003
2015-07-10
国家重大专项(21-Y30B05-9001-13/15-2);国家自然科学基金项目(31370639);湖南省高校产业化培育项目(13CY011)
和晓风,硕士研究生 通讯作者:林 辉,教授,博士生导师;E-mail:1053460198@qq.com
和晓风,林 辉,孙 华,等. 基于GF-1卫星东洞庭湖湿地类型信息提取[J].中南林业科技大学学报, 2015, 35(11): 10-15.
[本文编校:吴 毅]