1988-2017年黄山自然与文化遗产地森林扰动数据集
2019-11-17张少宇朱岚巍霍艳辉杨旭唐世林
张少宇,朱岚巍,霍艳辉,杨旭,唐世林
1. 中国科学院遥感与数字地球研究所,数字地球重点实验室,北京 100094
2. 东华理工大学,南昌 330013
3. 华北理工大学,河北唐山 063210
4. 清华同方威视技术股份有限公司,北京 100094
5. 中国科学院南海海洋研究所广东省海洋遥感重点实验室,广州 510220
数据库(集)基本信息简介
数据库(集)组成本数据集主要包括1 9 8 8-2 0 1 7年长时间序列3 0年的黄山自然遗产地的森林扰动结果数据。这些数据保存为一个压缩文件(1 9 8 8-2 0 1 7年黄山自然与文化遗产地森林扰动数据集.z i p),其中包含4个文件夹(地理要素、源数据、符号系统、制图)。
引 言
世界遗产主要包括自然遗产、文化遗产、混合遗产3种,是由联合国教科文组织和世界遗产委员会发起并确认的世界人民公认的、目前无法替代的财富,是全人类最具有代表性和最具有普遍价值的文物古迹及自然景观。其中自然遗产包含奇特的自然景观、完整的生态系统、原始的生物保护圈,突出体现了大自然的鬼斧神工、动植物的良好生活家园、生物进化的显著特征等。因此世界遗产逐渐受到人类的广泛重视,越来越多的国家和人民加入保护自然遗产、保护世界遗产的行列当中。
黄山在1990年被评为世界自然与文化遗产,在2015年被评为世界地质公园,在2018年被列入世界生物圈保护区,因此黄山在中国乃至世界上都占据非常高的地位。本文利用遥感空间技术,在自然遗产的研究课题下针对中国的自然与文化遗产地-黄山进行长时间序列的监测研究,并利用云计算平台及森林扰动提取算法得到1988-2017年30年的森林扰动数据产品,并进行数据共享。相关的研究成果作为自然遗产的研究成果的一部分,反映了自然遗产的历史及现在的生存状况,同时也可为相关学者研究其他自然遗产地提供相关参考。
1 数据采集和处理方法
1.1 数据来源
本研究使用的云计算在线处理平台,具有高效、快速、方便等多个特点,解决了数据年份过多、研究区过大、数据下载繁琐等众多问题。在线获取的原始数据集是美国地质勘探局(http://glovis.usgs.gov/)提供的Landsat产品数据集。Landsat具有较高的分辨率(30 m)、较长的时间跨度、开放式使用等众多特点[1],对长时间序列监测研究具有显著优势。区域尺度的植被变化监测研究,主要使用的是Landsat影像数据[2-4]。通过人工预览选取30年中较好的数据产品(表1),并进行相应的预处理得到可在线使用的1988-2017年的基础数据集。
表1 黄山自然遗产地遥感影像数据列表
序号 成像日期 卫星 传感器 轨道号9 1 9 9 6-0 4-2 2 L a n d s a t 5 T M 1 2 0-0 3 9 1 0 1 9 9 7-1 1-0 3 L a n d s a t 5 T M 1 2 0-0 3 9 1 1 1 9 9 8-0 4-2 8 L a n d s a t 5 T M 1 2 0-0 3 9 1 2 1 9 9 9-1 2-2 7 L a n d s a t 5 T M 1 2 0-0 3 9 1 3 2 0 0 0-1 0-1 0 L a n d s a t 5 T M 1 2 0-0 3 9 1 4 2 0 0 1-0 2-1 5 L a n d s a t 5 T M 1 2 0-0 3 9 1 5 2 0 0 2-0 9-3 0 L a n d s a t 5 T M 1 2 0-0 3 9 1 6 2 0 0 3-0 2-0 5 L a n d s a t 5 T M 1 2 0-0 3 9 1 7 2 0 0 4-0 4-2 0 L a n d s a t 7 E T M 1 2 0-0 3 9 1 8 2 0 0 5-0 3-0 6 L a n d s a t 7 E T M 1 2 0-0 3 9 1 9 2 0 0 6-0 5-2 0 L a n d s a t 5 T M 1 2 0-0 3 9 2 0 2 0 0 7-0 1-0 7 L a n d s a t 7 E T M 1 2 0-0 3 9 2 1 2 0 0 8-0 2-2 7 L a n d s a t 7 E T M 1 2 0-0 3 9 2 2 2 0 0 9-0 3-0 9 L a n d s a t 5 T M 1 2 0-0 3 9 2 3 2 0 1 0-0 3-2 8 L a n d s a t 5 T M 1 2 0-0 3 9 2 4 2 0 1 1-0 5-1 8 L a n d s a t 5 T M 1 2 0-0 3 9 2 5 2 0 1 2-0 4-2 6 L a n d s a t 7 E T M 1 2 0-0 3 9 2 6 2 0 1 3-0 4-0 7 L a n d s a t 8 O L I 1 2 0-0 3 9 2 7 2 0 1 4-1 0-2 5 L a n d s a t 7 E T M 1 2 0-0 3 9 2 8 2 0 1 5-0 2-0 6 L a n d s a t 8 O L I 1 2 0-0 3 9 2 9 2 0 1 6-0 3-2 8 L a n d s a t 8 O L I 1 2 0-0 3 9 3 0 2 0 1 7-1 0-0 9 L a n d s a t 8 O L I 1 2 0-0 3 9
1.2 数据处理方法
近几十年来,许多遥感变化检测方法被提出、应用、对比分析和评价[2]。同时也出现了很多监测森林扰动的指数,如MODIS全球扰动指数(MGDI)、基于缨帽变化的扰动指数(DI)、归一化湿度指数(NDMI)、综合森林特征指数(IFZ)、归一化植被指数(NDVI)、归一化燃烧比指数(NBR)等[3]。但是每个指数具有不同的特点,针对不同的扰动类型具有不同的监测能力,同时众多指数对于不同的研究区也会出现一定的差异性。本文参考众多文献进行相关总结分析,选取DI指数作为研究方法的基础,并采取因地制宜的方式进行改进,对黄山自然遗产地进行监测。
根据森林扰动监测算法原理,基于森林扰动DI算法加以改进,DI指数在根据对影像波段的进行缨帽变化后,提取其主要的分量进行数学运算,以获取主要的森林扰动信息,其改进后DI算法的主要原理如下[5]:
式(1)中Bt、Gt、Wt分别为标准化后的亮度、绿度、和湿度。式(2)中B为缨帽变化后第一个分量波段代表亮度,Bμ表示第一分量波段平均值,Bσ为第一分量波段方差。式(3)、式(4)同理分别对应缨帽变化后第二分量和第三分量,代表绿度和湿度以及其平均值和方差。式(5)中DIμ代表森林扰动指数平均值,根据其亮度平均值、绿度平均值以及湿度平均值计算而来;式(6)中DIm表示由多年份森林扰动指数平均值计算而来,n为时间年份。
扰动像元以及恢复像元判别:
θ为阈值,阈值调整首先参考DIm平均值的大小,一般往大于DIm的方向选择。连续三年DI值大于θ,即定义为扰动像元;即DIn、DIn+1、DIn+2均大于θ,则DIn为第n年扰动值,此时DIn对应的该像元为扰动像元。DIn、DIn+1、DIn+2中DIn为扰动像元,DIn+1、DIn+2均小于θ,则DIn对应的该像元为恢复像元。本次实验通过计算DIm值,以及参考持久森林样本DI值,综合考虑后本实验初次θ阈值选取为4.0,以步长为0.5,分别进行多次实验;对检测结果的范围大小、变化程度进行比较,经过多次试验后确定阈值。
本文的研究路线如图1,利用Google Earth Engine云计算在线处理平台,先进行原始数据的大气校正、GEE中Landsat.simple Cloud Score函数及image.updateMask函数进行去云掩膜;然后进行监督分类、计算NDVI滤波;然后结合Landsat TOA数据产品进行缨帽变换、扰动提取、结果导出等。以上工作大部分可依靠编程完成。在数据平台导出数据后,然后通过ArcGIS软件进行处理,同时利用 2017年哨兵数据、Google Earth高分辨率影像、实地验证进行结果分析和结果验证,最终生成1988-2017年共30年逐年森林扰动产品数据集。
图1 森林扰动研究技术路线
2 数据样本描述
2.1 数据组成
本数据集主要包括1988-2017年长时间序列30年的黄山自然遗产地的森林扰动结果数据,这些数据保存为一个压缩文件。压缩文件中包含4个文件夹(地理要素、源数据、符号系统、制图),总数据量为8.19 MB。地理要素文件夹中包含建筑、水体、边界、索道、公路、步道对应的矢量数据,文件为shp格式,可直接进行查看编辑;此边界为相关课题边界研究人员参考多方资料确定的黄山自然遗产地的边界范围;其他要素为本研究工作人员搜集数据,结合地形图,规划图矢量化而成。源数据文件夹中每个文件夹单独存储每一年的对应的tif栅格数据文件,共有6个属性值,分别为未扰动森林、扰动森林、恢复森林、建筑裸岩、耕地和水体,采用的UTM-WGS84坐标系;符号系统文件夹中为ArcGIS软件中属性值中的符号系统,此为模板方便赋值使用,格式为lyr可直接使用或编辑;mxd格式文件为ArcGIS软件格式文件,包含所有的源文件信息可直观进行查看;制图文件夹中为1988-2017年30年的制图成果,格式为jpg。
2.2 数据样本
图2为黄山自然遗产地1988-2017年中6期的森林扰动监测产品。通过GEE平台中的监督分类的方式,选取足够多的样本进行分类,主要分为森林、水体、建筑、裸岩、耕地;然后通过NDVI滤波再次筛选森林像元。森林扰动信息的提取是对森林像元做变化监测,根据连续3年的处理像元值的比较来判断是否为扰动像元或恢复像元。使用的方法是GEE平台中Join函数方法,查看当前年份前后年份的像元值是否大于θ,只要存在连续3年大于θ,均定义为扰动像元。例如,起始年份1988年只查看当前年份及后一年数据即1989年像元值是否大于θ,以及终止年份只查看当前年份及左年份即2016年像元值是否大于θ,以此定义是否为扰动像元。森林扰动点位主要集中在旅游路线的主干道两侧、山顶的宾馆附近、水系附近、较高海拔、以及森林与裸岩的交界处。主要的扰动类型为森林-裸岩、森林-建筑、森林-土地以及植被的自然变迁。例如,2006年黄山自然遗产地的保护面积为160.6平方公里,缓冲区面积为490平方公里,2006年的森林扰动面积接近7.6万平方米,恢复面积为6.8万平方米,扰动面积占据总覆盖面积的0.0473%,恢复面积占据总覆盖面积的0.0423%。
图2 黄山自然与文化遗产地6期森林扰动图
3 数据质量控制和评估
3.1 数据结果分析
根据结果统计可得1988-2017年30年中每年扰动面积和恢复面积见图3。根据30年的森林扰动趋势可看出,早期及2011年前后具有大面积的扰动,2008年前后出现大面积扰动,随后未发生较好的恢复。最近10年虽一直频繁出现不同程度的扰动,但整体占据比例很小,仍在自然变化的可接受范围之内。在每次扰动之后均有一定幅度的面积恢复,分析可知主要以森林自然变化为主。选取每年的具体扰动点位进行比较来看,大多扰动点位出现在低等植物与高等植物、裸岩交界之处;由于数据质量的限制,不得不采用每年份相对较好的影像,因此就满足不了同一月份进行比较;同时由于黄山季节变化也会出现很大的差异,数据选取问题给提取精度带来影响,造成一定程度的扰动信息误提取,导致提取精度一般;但鉴于此方法高效、快捷、可同时进行长时间序列分析,因此具有一定的普遍适用性和可扩展性,可优选其使用数据并用于其他地区研究。
图3 森林恢复和扰动面积列表
3.2 精度验证方式
采用辅助数据,2017年哨兵数据、Landsat原始数据、高分影像Google Earth数据进行目视解译。采用目视解译的方法,根据随机分层抽样原理[6];由于Google高分影像限制,选取2008-2017年共10年每年的扰动点,每层随机抽样30个样本;未扰动森林、非森林每层随机抽取样本100个,共500个像元点。根据精度评价混淆矩阵,计算制图精度、用户精度、总体精度、误检率、漏检率、Kappa系数加以评价。总体精度为80.66%,Kappa系数为0.77,见表2。
表2 精度混淆矩阵及评价表
预测值真实值持续森林 非森林 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 总计 用户精度 误检率%%漏检率% 30.37 11.82 3.80 0.00 3.70 0.00 0.00 2.90 1.71 9.70 9.40 0.00 80.66 0.77
通过实地验证的方式,共选取 4种典型样本点(图 4),验证点位分别为 a(118°09'42.27″E、30°04'00.78″N),b(118°10'38.27"E、30°4'30.89"N),c(118°14'15.68"E、30°8'32.67"N),d(118°9'32.237"E、30°8'36.161"N)。图4a为早期扰动,现已经完全恢复,森林密集程度走势较好,左侧为该样本点DI值的走势图,由图可知当地森林覆盖良好;图4b为早期多次扰动,近几年逐渐恢复,由实地情况可知为较新树种覆盖良好。图4c为持续未扰动森林,一直处于较好的状态,由图可知此样本相比图4a、4b两样本明显有更好的覆盖效果。图 4d为近几年发生扰动但没有完全恢复样本,经过现场查看可知此处多为植被生长变化造成的自然扰动,由于是裸岩与植被交界处,受到季节植被变化影响,容易出现监测扰动值持续较高,由此可见此处的覆盖度较差。
图4 4种典型样本点
4 数据使用方法和建议
数据使用的tif格式、shp格式的文件、lyr格式文件、mxd格式文件,便于研究工作者查看和进行编辑。本文采用ArcGIS软件进行编辑绘制,同时数据集中也包含了本文所设置的图层模板,便于更好的查看和制图。本数据集具有很强的代表性,可以为众多研究学者研究森林变化、植被变化、自然遗产地监测提供一定程度的参考。同时本研究数据集可直接用于黄山遗产地保护、规划、可持续发展等研究。
致 谢
非常有幸能够参与到自然遗产的保护研究工作当中,能够有机会致力于遗产的保护和发展;同时感谢杨瑞霞副研究员在验证工作中给予指导,感谢杜文杰、王普、陈亚亚等同学在研究过程中提供了很多帮助。