2000–2020 年海南岛天然橡胶人工林分布变化数据集
2024-01-11包青格乐张润卿王艺宸崔嵬赵俊福乌兰孙仲益
包青格乐,张润卿,王艺宸,崔嵬,赵俊福,乌兰,4,孙仲益,4*
1.海南大学生态与环境学院,海口 570228
2.国家林业和草原局发展研究中心,北京 100714
3.海南省生态环境监测中心,海口 571126
4.海南省农林环境过程与生态调控重点实验室,海口 570228
引 言
由于对天然橡胶产品的需求量增加,天然橡胶(Hevea brasiliensis)人工林(简称“橡胶林”)在过去的20 年里迅速扩张,已成为全球热带地区最重要的种植生态系统之一[1-2]。根据联合国粮食及农业组织(FAO)报告,在过去的20 年中,全球橡胶林面积扩大了20%,其中90%的扩张在亚洲,主要分布在印度尼西亚、泰国、马来西亚和中国[3]。橡胶林面积的扩大在很大程度上改变了原有的土地利用类型,是全球热带地区土地利用变化的重要驱动因素,显著地改变了区域碳水循环、生物多样性等生态系统服务功能[4]。在我国,橡胶林主要大面积分布在海南省、云南省和广东省,其中海南省作为天然橡胶林保护区是我国第二大天然橡胶种植区[5-6]。根据2021 年海南省第三次国土调查主要数据公报,橡胶林占海南岛全域面积的20.45%[7],其显著改变了区域下垫面组成与生态环境;但也提供了较高占比的生态系统服务价值,有助于增进人类福祉。因此,准确监测和绘制海南岛橡胶林空间分布情况和动态变化趋势,对我国政府部门及时制定或调整产业发展政策,保障天然橡胶资源供应安全,维护橡胶产业的健康发展以及海南岛区域生态环境保护、生态系统服务功能与价值提升等具有重要意义。
近年来,遥感技术已被广泛用于绘制橡胶林分布范围[8],与传统的人工测量相比,遥感技术具有宏观快速的优势[9]。相对早期的研究中,中分辨率成像光谱仪(Moderate-Resolution Imaging Spectroradiometer,MODIS)数据常用来提取橡胶林分布,对于区域物种组成与大尺度生态系统功能评估中起到了重要作用[10-12];但由于MODIS 传感器的空间分辨率低,难以识别面积小且碎片化分布的橡胶林[5],无法满足生产实践要求,因此高分辨率遥感影像逐渐被用于橡胶林识别[13-14]。相比于其他热带森林,橡胶树存在明显的旱季落叶期[4],因此,基于橡胶树的物候特征,采用多时相的遥感影像开展橡胶林识别逐渐流行[15-17]。可受限于热带地区常年的多云覆盖影响,很难获取到橡胶林关键物候期的影像,因此在大尺度和特定时期研究中仍存在很大的局限性[9]。为克服上述困境,Dong等人通过融合合成孔径雷达与光学遥感影像的方式,首次完成了海南岛橡胶林分布区的识别[18],并且很大程度上改善了识别结果。目前主要依靠上述光谱影像中的归一化差值植被指数(Normalized Difference Vegetation Index,NDVI)、增强型植被指数(Enhanced Vegetation Index,EVI)、地表水分指数(Land Surface Water Index,LSWI)等常规植被指数来识别橡胶林[19]。然而,橡胶林在生长旺季或林龄达到一定龄组后,由于光谱指数趋于饱和,光谱特征与天然林相似[20],并且部分海南岛的橡胶林与天然林相邻[4],这导致一些常规植被指数在区分橡胶林与天然林时效果欠佳。另外,海南岛分布较大面积的果园,相似的纹理结构也给橡胶林的识别带来了一定困难。综合来看,虽已有大量针对橡胶林分布与动态变化的研究成果,但仍缺乏公开共享的高精度海南岛长时间序列橡胶林动态变化数据集。
在本数据集研发中,基于多时期多时相合成的Landsat 数据,在多波段反射率与常规植被指数的基础上,增加了抗饱和性和处理混合像素能力强的kNDVI 指数(kernel Normalized Difference Vegetation Index,kNDVI)[21]和能有效减轻植被-土壤混合像元影响的NIRv 指数(Near-Infrared Reflectance of vegetation,NIRv)[22-23],提高分类精度;并对比支持向量机、高斯过程回归、人工神经网络、随机森林等多种分类方法,最终确定,以5 年为步长,利用RF 提取了海南岛2000 年、2005年、2010 年、2015 年、2020 年共5 期橡胶林分布数据,为橡胶林生态系统监测、管理与决策、生物量与碳储量计算以及土地覆盖类型变化分析等方面提供数据支持。
1 数据采集和处理方法
1.1 数据采集
1.1.1 影像数据采集
本研究使用的Landsat TM/OLI 影像数据全部从GEE 云平台(https://code.earthengine.google.co m/)上下载获取。分别下载目标年份及前后两年的橡胶林落叶期(每年12 月至次年3 月)和展叶期(每年5 月至10 月)的合成影像,共150 幅合成影像。海南岛数字高程模型(DEM)数据由地理空间数据云平台(https://www.gscloud.cn/search)下载获取,具体信息详见表1、表2。
表1 研究中使用的Landsat 影像数据信息Table 1 Landsat image data information used in the study
表2 研究中使用的DEM 数据信息Table 2 DEM data information used in the study
1.1.2 样本点数据采集
为了训练随机森林分类模型,在谷歌地球(Google Earth Pro)高清影像上进行了样本点预选,并在2022 年8 月开展了野外核实。对于橡胶林样本点,观察了周围区域以确定橡胶林的边界,并评估了橡胶树的生长情况,包括树高、树干直径和冠幅大小等指标。此外,还调查了与橡胶林分布和生长相关的环境要素,如土壤类型、土壤湿度、降水情况、气温和光照条件,最终选取了7848 个样本点,其中橡胶林样本点1850 个,非橡胶林样本点5998 个(包括建筑物、水体、草地、耕地、灌木林和天然林)。样本点将用于提取海南岛橡胶林及分类验证。图1 为样本点分布。
图1 样本点分布图Figure 1 Sample point distribution
1.2 数据处理
(1)Landsat 影像数据处理
首先在GEE 云平台上对Landsat TM/OLI 影像数据进行辐射定标、大气校正和几何校正。其次进行遥感影像的去云处理、中值合成、植被指数计算以及影像下载。目标是获取2000–2020 年5 期(2000 年、2005 年、2010 年、2015 年和2020 年)的海南岛橡胶林分布情况,限于热带地区的全年高云覆盖,因此,以目标年份及前后两年的中值合成影像作为目标年份橡胶林分布识别的基础数据(如,2020 年橡胶林分布是利用2018–2022 年合成影像所识别)。影像信息如表1 所示,包含6 个波段的地表反射率和NDVI 指数、归一化差值水指数(Normalized Difference Water Index,NDWI)、归一化建筑物指数(Normalized Difference Built-up Index,NDBI)、LSWI 指数、差值植被指数(Difference Vegetation Index,DVI)、归一化燃烧指数(Normalized Burn Ratio,NBR)、EVI 指数、kNDVI 指数和NIRv 指数,共计9 个遥感植被指数。
(2)指数计算
指数计算公式如下:
式中ρBLUE、ρGREEN、ρRED、ρNIR、ρSWIR1和ρSWIR2分别为蓝色波段、绿色波段、红色波段、近红外波段、短波红外1 波段和短波红外2 波段的地表反射率,参数σ和C 分别为1 和0.08[21,23],k为核函数。
(3)利用样本点数据在MATLAB 2022b 中训练分类器模型,使用包括支持向量机、高斯过程回归、人工神经网络、随机森林等模型,最终选取精度最高的随机森林模型进行海南岛橡胶林分布提取。
(4)使用GIS 软件对分类结果进行可视化。
2 数据样本描述
2.1 数据集信息
利用1998–2022 年Landsat 数据获得的海南岛橡胶林分布数据集,主要包括:2000 年、2005 年、2010 年、2015 年、2020 年5 个时期的海南岛橡胶林分布数据和2020 年海南岛18 个市县橡胶林分布数据。数据集包含5 个地理空间数据库,每个地理空间数据库均以“年份+海南岛橡胶林分布.gdb”命名。地理空间数据库下的数据文件均是“Esri FGDBR”格式数据,每个文件均以“海南岛橡胶林分布”命名,2020 年海南岛18 个市县橡胶林分布数据文件以“市县名称”命名。文件属性表可详见栅格数量、橡胶林面积(其中包含m2和km2两种不同单位面积)+信息,具体信息详见表3。
表3 2000-2020 年海南岛橡胶林变化数据集详细信息Table 3 Detailed information of the dataset of distribution changes of natural rubber plantations in Hainan Island from 2000 to 2020
2.2 数据样本
图2 为2015 年、2020 年海南岛橡胶林分布和2020 年海南岛临高县、三亚市橡胶林分布图。
图2 海南岛与部分市县橡胶林分布图:(a)和(b)分别为2015 年和2020 年海南岛橡胶林分布、(c)和(d)分别为2020 年临高县和三亚市橡胶林分布Figure 2 Distribution map of rubber plantations in Hainan Island and some cities and counties:(a)and(b)show the distribution of rubber plantations in Hainan Island in 2015 and 2020,respectively;(c)and(d)show the distribution of rubber plantations in Lingao County and Sanya City in 2020,respectively.
3 数据质量控制和评估
为了得到可靠稳定的随机森林分类模型,在本研究中,使用了十折交叉验证[24]来提高模型分类精度。其中,模型总体分类精度为96.93%,橡胶林生产者精度为89.10%,橡胶林用户精度为94.72%,Kappa 系数为0.90(表4)。同时,利用了第三次全国国土调查报告数据比较模型分类结果,2020年海南岛橡胶林面积预测值为7422.02 km2,比第三次全国国土调查报告数据确定的面积多152.36 km2(偏高估计2.10%)。橡胶林提取的总体精度达97.90%,面积加权总体精度达89.39%,橡胶林识别精度较低(<80%)市县面积权重仅为0.22,而分类精度较高(>90%)的市县面积权重高达0.47。橡胶林分布面积最广的儋州市(1367.87 km2)与琼中县(871.01 km2)分类精度高达98.20%与99.23%,而分布面积最低的陵水县(91.42 km2)与文昌市(106.50 km2)则分类精度较低,分别为75.90%与74.68%;整体上呈现出橡胶林分布面积越大,识别精度越高的趋势(表5)。
表4 使用随机森林分类模型分类结果精度评价Table 4 Data accuracy evaluation of classification results based on random forest classification model
表5 利用第三次全国国土调查报告数据进行市县级精度评价Table 5 Data accuracy evaluation based on the Third National Land Survey Report
4 数据价值
本数据集包含了海南岛橡胶林分布数据,涵盖了5 个时期的数据以及2020 年海南岛18 个市县的橡胶林分布信息。用户可以直接在常用的地理信息系统软件中打开并使用该数据集。本数据集可用于计算橡胶林的生物量和碳储量,并了解其动态变化情况。同时,可以通过分析橡胶林面积变化对土地覆盖类型的影响,进一步了解其对生态环境的影响,并进行生态质量评价等研究。
致 谢
感谢在野外实地调查过程中海南省相关行业部门和单位的支持与配合,感谢Google Earth Engine(GEE)云平台提供Landsat 影像数据。
数据作者分工职责
包青格乐(1999—),男,内蒙古通辽市人,硕士研究生,研究方向为热带海岛遥感及应用。主要承担工作:数据获取与处理、数据集生产、实地验证和论文撰写。
张润卿(2000—),男,山东淄博人,硕士研究生,研究方向为热带森林碳汇。主要承担工作:数据获取和实地验证。
王艺宸(1997—),女,海南海口人,博士研究生,研究方向为生态遥感与植物物候。主要承担工作:数据获取和实地验证。
崔嵬(1990—),男,北京人,博士,副研究员,研究方向为森林高质量发展。主要承担工作:数据校核与质量控制。
赵俊福(1986—),男,海南海口人,博士,研究方向为森林生态系统多尺度效应。主要承担工作:数据校核与质量控制。
乌兰(1990—),女,海南海口人,博士,副教授,研究方向为陆地生态系统模拟和植被与生态遥感。主要承担工作:数据校核与质量控制。
孙仲益(1989—),男,海南海口人,博士,副教授,研究方向为生态遥感和全球变化生态学研究。主要承担工作:总体方案设计和论文撰写。