全球地表覆盖产品林地类型融合:以美国为例
2018-06-30张小红
张小红
摘 要:近年来,很多学者提出了融合多种地表覆盖产品的方法,以生产出空间一致性较好且精度较高的分类产品。文章以美国区域为研究对象,使用基于模糊理论的方法将三种源数据NLCD 2011、FROM-GLC-seg、Globcover2009_V2.3_Globald的森林类进行融合,将GlobeLand30(2010)林地类型划分成针叶林、阔叶林、混交林。在新图像中,阔叶林、针叶林、混交林用户精度分别达到77%、 74%、 69%。
关键词:融合;GlobeLand30;细化图
中图分类号:P237 文献标志码:A 文章编号:2095-2945(2018)16-0008-03
Abstract: In recent years,many scholars have proposed a method that integrates a variety of land cover products to produce a better spatial consistency and higher precision of the classified products. This article used the United States region as the research object, using the method based on fuzzy theory to integrate the forest type of three source data NLCD 2011, FROM-GLC-seg, and Globecover2009_V2.3_Globald. The land type of GlobeLand30 (2010) was divided into coniferous forest, broad-leaved forest, and mixed forest. In the new image, the user accuracy of broad-leaved forest, coniferous forest, and mixed forest reached 77%, 74%, and 69%, respectively.
Keywords: integration; GlobeLand30; refined image
引言
地表覆盖是指地球表面各种物质类型及其自然属性与特征的综合体, 其空间分布与变化对人类社会、生物及自然环境有着重要的影响作用[1]。现有的全球地表覆盖产品有马里兰大学的全球地表覆盖数据集、MODIS土地覆盖产品等。以上产品的空间分辨率是300-1000m,在全球尺度上,已经出现了更高空间分辨率的地表覆盖产品,其中包括美国马里兰大学研制的2000年-2012年全球30m森林覆盖及增减数据集和中国研制的GlobeLand30。
为了进一步提高现有的全球地表覆盖产品的精度,满足用户多样化的需求,很多学者提出了融合多种分类产品来提高分类的稳定性与精确度[2]。目前,具体的融合方法主要有两大类:基于多源遥感数据融合法、基于多源遥感和非遥感数据融合法[3]。基于多源遥感数据融合法中包含基于模糊集合理论的融合的方法,其可以结合不同地表覆盖产品各自的优势,生产出空间一致性较好且精度较高的产品,比基于遥感影像的传统分类方法工作量少,综合考虑,本文采用基于模糊集合理论的融合方法,利用四种地表覆盖数据产品:NLCD 2011、FROM-GLC-seg、Globcover2009_V2.3_Global、GlobeLand30(2010),以美国区域为对象来进行研究,将GlobeLand30(2010)林地类型划分成针叶林、阔叶林、混交林。
1 数据来源
本文采用四种地表覆盖数据产品进行研究,即:NLCD 2011、FROM-GLC-seg、Globcover2009_V2.3_Global、GlobeLand30(2010)。NLCD 2011(National Land Cover Database 2011)采用2011年陸地卫星数据并利用决策树进行分类,空间分辨率为30米[4]。FROM-GLC-seg(Fine Resolution Observation and Monitoring of Global Land Cover-Segmentation)在使用陆地卫星TM/ETM+数据(30m)的基础上,利用基于分割的降尺度方法来融合多种多分辨率数据集,空间分辨率为30m[5]。Globcover2009产品的分类方法是分层分区法,采用来自ENVISAT卫星平台的MERIS FR数据,空间分辨率为300m[6]。GlobeLand30是中国科学家自主研制的首套全球30米分辨率的地表覆盖遥感制图数据集,其研制中所使用的分类影像主要是30米多光谱影像,其具有10个一级类,空间分辨率为30m[7]。
2 方法
2.1 数据预处理及图例翻译
四种地表覆盖数据中FROM-GLC-seg和GlobeLand30是分景的,且空间分辨率与坐标系统,所以首先在Arcgis10.1中将这些图像去黑边、拼接,最后进行重投影与重采样,重采样后的分辨率为300m。
在本研究中,首先要对其森林类进行比较,本文采用地表覆盖分类系统LCCS对图例进行翻译,LCCS是联合国粮农组织(FAO)与联合国环境规划署(UNEP)联合开发的地表覆盖分类系统[8],该系统有如下特点:内部结构具有灵活性,是一种综合性的、规范性的先验系统。由于本文研究的内容是针对林地类型的,所以翻译时只需翻译与林地相关的类。图例翻译过后要给每个类赋一系列属性值,其中8个属性值可以从LCCS中直接得到,还有一个土地利用类属性,需要添加进去,共9个属性:植被状况、土壤条件、人造覆盖、土地利用类别、生命形式、叶型、植被覆盖密度、叶物候、树高[9]。
2.2 计算重叠矩阵
利用9个属性来进行类之间的重叠性计算时,除了植被覆盖密度、树高,其余属性按照公式(1)进行计算。植被覆盖密度、树高按照公式(2)进行计算。这里须为每个属性构造一个概念空间,Pk代表一个n值属性,Ok(Ci,Cj)表示Pk的两个重叠类的重叠性,Ci≡(ri1,ri2,…,rin)和Cj≡(rj1,rj2,…,rjn)代表к+n空间的点,其值设置为0和1。Pk的重叠性用如下公式表示:
公式(1)中的Min(rim-rjm)代表求rim与rjm的交集。公式(2)中,li=[lil,liu],lj=[ljl,lju]表示编码值是连续属性的区间值,li∩lj表示其区间长度的重叠值。
当按照公式(1)、(2)计算完9个属性的重叠性之后,要按照公式(3)计算出最终的重叠性[9]。
其中,k表示这9个属性在计算重叠矩阵时的权重,这里设定生命形式、叶型、叶物候三个属性的权重为1/6,其余六个属性的权重为1/12。
2.3 定义目标图例并计算相似分数
本文中,由于NLCD 2011、FROM-GLC-seg、Globcover
2009三种产品中有两种森林类都具有阔叶林、针叶林、混交林,虽然NLCD 2011森林类中只有落叶林、常绿林、混交林,但是按照常识,一般情况下,落叶林多数属于阔叶型,常绿多数属于针叶型,所以我们定义目标图例M为阔叶林、针叶林、针阔混交林三类,在新图像中的代码分别是1,2,3。
各原始数据图例与目标图例的相似分数表征了源数据中各类型属于目标图例三个类的可能性,由重叠矩阵得到。以NLCD 2011为例,NLCD 2011中落叶林与目标图例中的阔叶林的相似分数Ok(Ck,y)由落叶林与其他数据中阔叶林的各相似分数和的平均值得到,y表示目标图例中的类,设Ω代表目标图例,Ω=(1,2,……n),n代表目标图例中类的个数,这里,y∈Ω。本文列举FROM-GLC-seg与目标图例的相似分数如表1所示,行代表目标图例,列代表FROM-GLC-seg森林类。
2.4 生成新地图
这里,假设x是某个像素,它同时存在于三个地表覆盖产品中,设其具有三个值 分别代表NLCD 2011、FROM-GLC-seg、 Globcover2009。
其中,Ok(■k(x),y)是像素x在某个地表覆盖产品中代表的类与目标图例中的类y的相似分数。U(■k(x))代表用户精度,由混淆矩阵计算得到,本文在Google Earth中对采集的样本点进行验证并计算U(■k(x))。公式(5)表示取的最大值时x属于的类为最终的类。
在融合的过程中,当遇到像素x在三种地表覆盖产品中有冲突时,采取多数原则,最后,将按照如上公式得出的图像与GlobeLand30进行叠合,以剔除GlobeLand30认为不是林地的像素。
3 结果与精度评价
GlobeLand30(2010)林地类型细化结果如图1所示。
对新图像进行精度评价时,由于野外验证工作量较大且难以实现,本文采用室内在Google earth上进行精度评价。但由于Globcover2009中类40的像元总数太少,很难采集样本,所以在本次研究中忽略此类。NLCD 2011 产品中类41、42、43的用戶精度分别是0.66、0.70、0.67;FROM-GLC-seg产品中类21、22、23、24的用户精度分别是0.62、0.62、0.62、0.53;Globcover2009产品中类50、60、70、90、100的用户精度分别是0.47、0.45、0.42、0.43、0.39;新图像的类1、2、3用户精度分别是0.77、0.74、0.69。
4 结束语
新图像中阔叶林、针叶林、针阔混交林的精度分别是77%、74%、69%,这三者的精度相比其他三种地表覆盖产品都有所提高。本文的创新点是在利用LCCS进行语义翻译且属性赋值时,引入了新的编码值D3,避免混交林与阔叶林、针叶林发生重叠,减少了混交林像元被分到其他类型像元中的个数,从而提高最终产品的精度。但是在本研究过程中也遇到了很多问题,例如Globcover2009产品的精度相对较低,可能会对结果精度产生一定的影响。尽管该方法有如上缺点,但不可否认的是在本研究中,利用该方法可以用到对某个地表覆盖产品一级类进行二级细分的过程中。本研究结果也可以对某些对森林变化进行观测的机构或组织提供某些参考数据,但是其空间分辨率有待提高。
参考文献:
[1]Jonathan A. Foley, Ruth DeFries, Gregory P. Asner, et al. Global Consequences of Land Use[J]. Science, 2005,309(5734):570-574.
[2]Jung M, Henkel K, Herold M, et al. Exploiting synergies of global land cover products for carbon cycle modeling[J]. Remote Sensing of Environment, 2006,101(4):534-553.
[3]陈迪,吴文斌,陆苗,等.基于多源数据融合的地表覆盖数据重建研究进展综述[J].中国农业资源与区划,2016,37(9):62-70.
[4]Homer C, Dewitz J, Yang L, et al. Completion of the 2011 National Land Cover Database for the Conterminous United States - Representing a Decade of Land Cover Change Information[J]. Photogrammetric Engineering & Remote Sensing,2015,81(5):345-354.
[5]Le Yu, Jie Wang, Peng Gong. Improving 30 m global land-cover map FROM-GLC with time series MODIS and auxiliary data sets: a segmentation-based approach[J]. International Journal for Remote Sensing, 2013,34(16):5851-5867.
[6]Bicheron P, Defourny P, Brockmann C, et al. GLOBCOVER: products description and validation report[J]. Foro Mundial De La Salud, 2011,17(3):285-287.
[7]陈军,廖安平,陈晋,等.全球30m地表覆盖遥感数据产品——Globe Land30[J].地理信息世界,2017,24(1):1-8.
[8]Di Gregorio A. Land cover classification system: classification concepts and user manual: LCCS[M]. Rome: Food & Agriculture Org.,2005:11-74.
[9]Pérez-Hoyos A, García-Haro F J, San-Miguel-Ayanz J. A methodology to generate a synergetic land-cover map by fusion of different land-cover products[J]. International Journal of Applied Earth Observation & Geoinformation, 2012,19(10):72-87.