全球30 米分辨率火烧迹地产品

2021-01-20张兆明唐朝何国金龙腾飞魏明月

中国科学数据(中英文网络版) 2020年4期

关键词：样区迹地火烧

张兆明，唐朝，何国金*，龙腾飞，魏明月

1. 中国科学院空天信息创新研究院，北京 100094

2. 中国科学院大学电子电气与通信工程学院，北京 100049

3. 海南省地球观测重点实验室，海南三亚 572029

引言

火烧迹地是全球及区域碳循环和气候变化等研究所需的重要参量之一。美国国家航空航天局（NASA）、欧洲空间局（ESA）和国际地圈生物圈计划（IGBP）等都曾发布过各种基于不同卫星遥感数据获取的全球尺度火烧迹地信息产品，空间分辨率从250 米至0.25 度不等。美国陆地卫星Landsat 系列数据是目前存档时间最长、使用最广泛的中高空间分辨率卫星数据，为全球火烧迹地信息高精度提取提供了理想的数据源。利用Landsat 系列卫星数据研发高空间分辨率和精度的大尺度火烧迹地信息产品具有迫切的应用需求，也是国际上的一个热点研究课题。美国地质调查局于2017 年发布了覆盖美国本土的Landsat 30 米分辨率火烧迹地产品[1]，也制定出研发全球30 米分辨率火烧迹地产品的科学计划。然而，相比MODIS 等中低分辨率卫星数据，Landsat 系列卫星数据具有较少的光谱波段和更长的重返周期，现有的中低分辨率火烧迹地信息提取方法无法直接应用。因此，基于Landsat 数据的全球尺度火烧迹地信息的高精度自动提取是一个具有挑战性的研究方向。

近年来，机器学习方法在遥感大数据分析和智能信息提取领域获得了成功的应用。通过利用全球火烧迹地样本库和基于生态系统分区的机器学习方法，实现了基于Landsat 数据的全球火烧迹地信息高精度自动化提取[1]，生产了全球30 米空间分辨率火烧迹地遥感产品。

1 数据采集和处理方法

1.1 数据来源

主要利用Landsat 8 卫星OLI 传感器数据。按照该卫星的运行计划，可以覆盖60°S-80°N 的所有陆地区域。制作年度全球火烧迹地产品，需要利用当年获取的全部Landsat 8 OLI 数据，以尽可能减少漏分现象，同时需要利用前一年获取的全部Landsat 8 OLI 数据，去除前一年发生且未恢复的火烧迹地，制作一期全球火烧迹地产品需要利用约40 万景Landsat 8 OLI 影像，数据量超过300TB，在产品生产时利用了Google Earth Engine（简称GEE）云平台上的Landsat 8 OLI 地表反射率[2]。

1.2 数据处理方法

利用Landsat 8 地表反射率数据的质量标识建立云和云阴影掩膜，去除云和云阴影影响。在全球高精度样本库基础上，基于Landsat 8 时序卫星数据和火烧迹地敏感光谱参量〔波段反射率、归一化燃烧指数（Normalized Burned Ratio，NBR）[3]，归一化差值植被指数（Normalized Difference Vegetation Index，NDVI）[4]，全球环境监测指数（Global Environmental Monitoring Index，GEMI）[5]，中红外燃烧指数（Mid-Infrared Burn Index，MIRBI）[6]，火烧迹地指数（Burned Area Index，BAI）[7]，修正的土壤调节植被指数（Soil-Adjusted Vegetation Index，SAVI）[8]和归一化差值湿度指数（Normalized Difference Moisture Index，NDMI）[9]等〕，利用机器学习算法（随机森林模型）进行样本训练和学习，得到火烧迹地识别规则和疑似火烧迹地种子点。对疑似火烧迹地种子点进行一系列过滤和优化，得到确定的火烧迹地种子点。具体的过滤和优化参量及判别式包括：（1）两年（2014、2015 年）间最大的NDVI 值大于0.2；（2）两年（2014、2015 年）间最大的NDVI 值（NDVI2）与当年（2015 年）火烧概率最大时的NDVI 值（NDVI1）的差值大于0.2，即NDVI2−NDVI1>0.2；（3）上一年（2014）最小NBR 值（NBR2）与当年（2015 年）火烧概率最大时的NBR 值（NBR1）的差值大于0.1，即NBR2−NBR1>0.1；（4）当年（2015 年）火烧概率最大的日期（t1，儒略日）大于两年（2014、2015年）间NDVI 最大的日期（t2，儒略日），即t1> t2，或者t2−t1>100。从种子点开始按8 连通原则进行区域生长，吸收周围火烧概率大于50%的候选点，得到火烧迹地。更详细的解释和说明参见文献[2]。总体技术流程如图1 所示。

图1 火烧迹地提取技术流程

2 数据样本描述

火烧迹地数据产品利用经纬度投影，分辨率为0.00025°（约30 米），以10°×10°分块，GeoTiff 格式存储，以分块图像左上角像素的经纬度作为文件名，像素值中以1 代表火烧迹地像元，空值代表非火烧迹地像元。例如文件名为S10E020.TIF 的分块文件代表左上角像素坐标为南纬10 度、东经20度的火烧迹地数据文件（图2）。

图2 S10E020 火烧迹地块示例

3 数据质量控制和评估

利用随机分层抽样的方式对全球火烧迹地产品进行精度验证和评估。为确保精度验证的全面性和代表性，精度验证样区的选择兼顾不同地表覆盖类型和火行为特征。依据MODIS 地表覆盖类型产品将全球概括为7 个地表类型：Broadleaved Evergreen（常绿阔叶林），Broadleaved Deciduous（落叶阔叶林），Coniferous（针叶林），Mixed Forest（混交林），Shrub（灌丛），Rangeland（草地），和Agriculture（农田）。同时根据GFED 4（Global Fire Emission Database 4，第四版本的全球火烧排放数据库）2015年的火烧迹地密度数据将全球均匀划分为5 个密度级，最终在全球范围内选择了80 个验证样区，这些样区覆盖了全部的地表类型。

精度验证利用的数据源主要包括Landsat 8、GF 1、CBERS 4 和美国MTBS（Monitoring Trends in Burn Severity，火烧强度趋势监测）火烧迹地产品。其中中国境内的验证样区使用GF 1 数据，南美区域使用CBERS 4，美国区域使用MTBS 和Landsat 8，全球其他区域使用Landsat 8。对于Landsat 8 数据，验证样区的大小为185 km×185 km；对于CBERS4 数据，验证样区的大小为120 km×120 km；对于GF1 数据，验证样区的大小为100 km×100 km。

通过收集验证样区2015 年整年的时序卫星数据，进行正射校正等处理。然后目视寻找2015 年内新增的火烧迹地，确定火烧前后的卫星影像对。基于卫星影像对手动选择火烧迹地和非火烧迹地样本点，利用支持向量机分类器进行分类，最终得到2015 年火烧迹地验证的参考数据。

在每个验证样区分别进行验证，然后得到全球火烧迹地精度验证结果，选用误分率（Commission Error）、漏分率（Omission Error）和整体精度（Overall Accuracy）3 个指标来定量表征火烧迹地信息提取的精度，最终得到2015 年全球火烧迹地产品的误分率、漏分率和整体精度分别为13.17%、30.13%和93.92%[10]。