2001–2020 年中国东北区域土壤水蚀数据集
2024-01-11吴瀚逸熊俊峰侯渲林晨许金朵马荣华
吴瀚逸,熊俊峰,侯渲,林晨,许金朵,马荣华
1.可持续发展大数据国际研究中心,北京 100094
2.北京师范大学遥感科学国家重点实验室,北京 100875
3.北京师范大学环境演变与自然灾害教育部重点实验室,北京 100875
4.中国科学院南京地理与湖泊研究所,南京 210008
5.国家科技资源共享服务平台,国家地球系统科学数据中心湖泊–流域分中心,南京 210008
引 言
土壤侵蚀是土地退化的重要原因,引发的一系列生态环境问题已严重威胁到区域的粮食生产与水土保持[1-3]。东北黑土区是我国重要的粮食产区和生态保障区。近年来,由于气候变化和过度垦殖,导致了严重的水土流失,威胁到东北地区粮食安全和水土资源安全[4-6]。因此对于土壤侵蚀进行准确的监测、评估以及侵蚀量计算,有助于水土保持措施的配置与优化。
由于精准的实地测量和高精度土壤水蚀数据获取方式在大区域尺度内难以实施且耗费的人力物力较大,因此利用基于遥感和GIS 开发的土壤侵蚀模型对于土壤侵蚀进行定量模拟计算,是当前土壤侵蚀计算以及水土流失动态监测的重要途径之一。在大尺度区域的土壤水蚀研究中最为常用的模型有通用土壤侵蚀模型(Universal Soil Loss Equation,USLE)和其修订模型RUSLE(Revised Universal Soil Loss Equation),以及经改进后适用于中国土壤侵蚀特征的CSLE(Chinese Soil Loss Equation)模型。USLE/RUSLE 系列侵蚀模型将复杂的土壤侵蚀过程解构为土壤特性、地形、植被覆盖、土地管理以及降雨和径流等多个影响因子进行计算,可以较好地对土壤侵蚀进行定量描述,故本研究采用RUSLE 模型进行水蚀量计算。如表1 所示。
表1 部分土壤水蚀数据产品Table 1 Partial data products of soil water erosion
以上土壤水蚀数据产品在大尺度土壤水蚀估算研究中通常利用单一土壤水蚀影响因子算法,对于具有不同地理分异规律的地区,缺少区域性优化,时空分辨率不够精细;并且,对于数据精度缺少直接验证。同时考虑到东北地区与全国其他区域存在地理环境差异,基于其他地理条件开发的模型算法在东北地区的适用性有待验证,因此本数据集将当前研究中常用的模型针对东北区域做出优选与结果的直接验证。
针对当前土壤水蚀模型应用过程中区域性优化和实测数据验证缺失的短板,本研究基于多源遥感数据,解构RUSLE 模型,对模型每个因子选取多种经典算法进行排列组合,结合水文站数据直接验证筛选最优算法组合,模拟东北地区2001–2020 年土壤水蚀模数时空分布,建立东北地区土壤水蚀时空数据集,对实现东北地区农业持续发展和土地退化监测等可持续发展目标有着重要意义。
1 数据采集和处理方法
1.1 数据生产流程
本文拟采用技术路线如下首先基于多源遥感数据,利用RUSLE 模型,对模型每个因子选取多种经典算法进行排列组合计算,结合水文站数据直接验证筛选最优算法组合,得到东北地区不同三级流域分区的土壤水蚀模数估算结果。本文的技术路线如图1 所示,包含以下处理步骤:
图1 技术路线图Figure 1 Technical flow chart
1.2 模型及算法
RULSE 模型是美国农业部基于通用土壤侵蚀模型USLE 修正的一种适用区域较广的土壤水蚀模数估算模型[12-13]。该模型综合考虑了降雨、土壤理化性质、坡度坡长、地表植被覆盖以及水土保持措施共5 个因子。其基本公式如下:
其中,A 代表土壤侵蚀模数,单位为t ha-1y-1;R 是降水侵蚀因子,单位为MJ mm ha-1h-1y-1,代表降水对于土壤颗粒的冲刷侵蚀作用,作为土壤水蚀的主要动力因子;K 是土壤可蚀性因子,代表土壤本身理化性质在土壤侵蚀过程中的影响作用;LS 代表地形因子,包括坡度(S)和坡长(L)两个因子;C 表示地表植被和作物覆盖因子,表示在植被覆盖与种植耕作对于土壤侵蚀的影响,该因子与植被冠层、地表植被覆盖以及其他地表植被状况有关;P 代表水土保持措施因子,代表着梯田、沟渠、围栏等水土保持措施对土壤水蚀的影响,值域为0–1 之间,越接近1 表示水土保持措施越少。
1.3 数据来源
本研究使用的降水数据是来自美国航空航天局(National Aeronautics and Space Administration,NASA)和日本宇宙航空研究开发机构(Japan Aerospace Exploration Agency,JAXA)合作开展全球卫星降水计划(Global Precipitation Measurement mission,GPM),其利用多传感器多卫星多算法结合卫星网络和雨量计反演得到更高精度的降水数据,其能够提供全球范围基于微波和红外的半小时的降水数据产品[14]。GPM 的数据产品主要分为:Level-1、Level-2 和Level-3。本研究使用的是Level-3 的数据是在Level-2 的基础上对固定时间和空间尺度进行插值,数据完整性和一致性较高,包括逐半小时降水以及逐月降水数据。土壤信息数据是国际应用系统分析研究所(International Institute for Applied Systems Analysis,IIASA)及联合国粮农组织(Food and Agriculture Organization of the United Nations,FAO)倡导下建立的世界土壤数据库(Harmonized World Soil Database version 1.2,HWSD V1.2)[15]。其中,中国地区数据源为1995 年全国第二次土壤普查由南京土壤所提供的1:1 000 000 土壤数据,数据格式为grid,投影为WGS84,采用的土壤分类系统主要为FAO-90。DEM 高程数据是由美国宇航局NASA 制作由美国地质联邦调查局(United States Geological Survey,USGS)免费发布的高程数据,包括北纬60°到南纬56°之间陆地表面较高质量的海拔数据[16]。数据来源详见表2。
表2 数据来源表Table 2 Data source table
1.4 数据处理
1.4.1 R 因子
首先对逐半小时的GPM 降水数据进行日合成得到逐日的降水数据,根据章文波等[17]提出的R因子计算算法,由逐日降水数据计算得到逐年的R 因子时空分布,记为R1;其次,根据周伏建和黄炎和[18]提出的降水因子计算模型,由GPM 逐月降水数据进行计算得到逐年降水侵蚀因子,记为R2。具体计算公式参照表3。
表3 R、K、C 和LS 因子Table 3 R, K, C and LS factors
1.4.2 K 因子
基于HWSD 数据选取了土壤不同粒径颗粒组成含量以及土壤有机碳含量,通过目前土壤水蚀研究中常用的EPIC[19]、Shrazis[20]以及Torri.D[21]模型计算表示土壤的可蚀性,得到土壤可蚀性因子空间分布,依次记为K1,K2 和K3。具体计算公式参照表3。
1.4.3 C 因子
选取MODIS(Moderate-resolution Imaging Spectroradiometer)提供的MOD13A2 植被指数数据的归一化差值植被指数(Normalized Difference Vegetation Index,NDVI)数据,首先利用蔡崇法和丁树文[22]提出的分段的非线性转换模型计算得到C 因子空间分布,记为C1;其次利用Van Leeuwen and Sammons[23]提出的带参数的指数非线性模型计算得到C 因子空间分布(其中经验性参数取值为=2.5; =1),记为C2。具体计算公式参照表3。
1.4.4 LS 因子
坡度坡长因子LS 代表着地形条件对于土壤侵蚀的影响。本研究基于SRTM(Shuttle Radar Topography Mission) 90 米分辨率的数字高程模型数据,利用符素华等[24]的坡度坡长法计算出坡度坡长因子,记为LS1。具体计算公式参照表3。
1.4.5 P 因子
水土保持措施因子代表着地表对于土壤水蚀的保护措施对于土壤水蚀的影响。本研究基于文献调研统计以及中国5 年一期的土地利用数据,学者们在东北区域常用的水土保持措施因子的取值进行赋值计算。详细取值如表4,参考文献见数据集中的补充材料。
表4 P 因子赋值表Table 4 P factor value table
2 数据样本描述
2.1 数据信息及结构
本数据集包含2001–2020 年东北区域土壤水蚀模数数据。数据集空间分辨率为250 m,时间分辨率为1 年,数值单位为(t ha-1y-1)。数据集保存为“2001–2020 年东北区域土壤水蚀模数.zip”压缩文件,压缩文件大小为2.71 GB。其中文件以对应年份进行命名,如“NE_2001”代表2001 年东北区域土壤水蚀模数,共20 个文件,背景值为-1。
2.2 数据样本
以下给出2001–2020 年,5 年一期的土壤水蚀结果时空分布图(图2)。总体上东北地区的土壤侵蚀热点为西、北、南的大、小兴安岭与长白山地区,这三个地区的海拔都较周围高,土壤侵蚀敏感性也较强。其中以长白山南侧土壤水蚀模数较大,主要是因为该地区处在黄海暖流北上所产生的水汽通道上,南侧为迎风坡,因而长白山地区的降水多。整个流域的降水量非常丰沛,导致该地区计算出的土壤水蚀模数偏大。山区的侵蚀状况主要受到植被变化、冻融作用等多营力的影响,随时间变化呈现出波动的趋势;平原地区的侵蚀状况随时间变化呈现出轻度和微度的侵蚀区域缓慢增大的趋势,强烈的侵蚀呈现减小趋势。
3 数据质量控制和评估
3.1 质量控制
本研究将水利部发布的2001–2020 年《河流泥沙公报》[25]中东北区域主要水文监测站测量得到的年输沙量以及输沙模数与模型估算的土壤侵蚀模数进行直接验证,并基于验证结果选取最优的因子算法组合生成最终侵蚀模数估算结果。步骤如下:1)首先根据水文站点分布位置与流域河段位置的相对关系以及站点对应的控制流域面积对初始流域评价单元进行合并或者迁移,建立一个站点对一个流域单元或一个站点对多个流域单元的流域评价单元。2)其次对每个评价单元建立以站点测量得到的年输沙量为横坐标,利用土壤水蚀估算模型计算的流域总土壤水蚀量为纵坐标建立散点图,并结合时间序列变化趋势以及公开资料记载的重大河流泥沙事件剔除异常值。3)最后将水文观测站点测量得到的年输沙量与对应流域评价单元内计算出的土壤水蚀模数的总和对比并计算二者在控制流域面积尺度上的评估指标,比较不同组合方式在三级流域尺度上的验证指标,选取精度最优的组合模型生成最终结果。
3.2 质量评估
在本研究中将实测水文站点数据与对应流域估算的土壤水蚀模数进行统计比较,引入相关系数(Correlation coefficient,Cov)、均方根误差(Root Mean Square Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)等统计指标进行精度评估。相关计算公式如下:
相关系数(Cov):
均方根误差(RMSE):
平均绝对误差(MAE):
各因子组合排列方案如表5 所示,每种因子组合方案的相关系数,RMSE 与MAE 三个评估指标统计如图3 所示,最终得到12 种土壤水蚀估算结果及验证结果。由于因子计算方法的适用条件以及地理要素之间的差异,根据R、K、C 因子的不同算法计算出的水蚀结果主要会根据降雨、土壤理化性质以及地表植被覆盖状况的不同,而产生不同的结果。由图3 可知最佳的组合因子组合方案为A1 组合,其中使用的为R1-K1-C1-LS1-P 的因子组合,其流域估算的土壤水蚀模数值与站点观测值相关性分布主要为0.4–0.5 之间,相较于其他组合方案整体稍高,RMSE 分布位于0.007–0.009 之间相较于其他组合方案整体偏低。A6,A7,A10 组合方式相关性指标明显偏低且RMSE 与MAE 偏高,说明在东北区域以上三种因子组合的估算模型较不适用。A2–A5、A8、A9、A11、A12 相关性分布于0.3–0.45,且分布较为离散,RMSE 与MAE 相较于A1 组合偏高,整体分布于0.007–0.01 之间。
图3 相关系数,RMSE 与MAE 统计箱线图(其中A1–A12 为12 种算法组合方式,如表5 所示)Figure 3 Statistical boxplot analysis of correlation coefficient, RMSE and MAE ( A1-A12 is a combination of 12 algorithms, as shown in table 5)
表5 模型各因子组合表Table 5 The table of combination for various model factors
4 数据价值
水土流失对于我国东北地区的生态环境以及粮食种植影响较为严重。同时受到气候、土壤、植被、土地利用等综合地理环境因素的影响,东北区域黑土流失严重,耕层变浅,肥力下降,土壤盐碱化加剧。水土过程模拟是治理土地退化的关键基础环节。本研究提供的2001–2020 年长时间序列的高精度、高时空分辨率的土壤水蚀模数估算结果,对东北地区水土保持以及生态环境监测具有重要意义。
本数据集是公开发布的东北区域2001–2020 年土壤水蚀模数估算数据,具有较高的时空分辨率和实际精度,可为东北区域的土壤侵蚀评估以及水土保持决策提供基础数据,帮助决策者和生产者制定合理的政策和风险管理策略。同时,本数据集也具有较高的科学价值与研究意义,基于模型优选思想为空间异质性较高区域的土壤侵蚀估算提供了新的思路与角度。在后续的研究中,我们将尝试使用精度更高的源数据来计算各个影响因子并使用月尺度监测数据进行土壤侵蚀的验证。
数据作者分工职责
吴瀚逸(2000—),男,福建南安人,硕士研究生,研究方向为农业遥感、环境遥感。主要承担工作:研究方案设计、算法构建、产品生产、精度验证和论文撰写。
熊俊峰(1993—),男,江西九江人,助理研究员,研究方向为环境遥感。主要承担工作:研究思路与方案设计、论文撰写。
侯渲(1998—),男,甘肃天水人,工程师,研究方向数据库建设、数据共享。主要承担工作:数据收集整理、数据产品评估。
林晨(1984—),男,江苏南京人,研究员,研究方向自然资源遥感监测。主要承担工作:研究思路设计。
许金朵(1982—),女,江苏徐州人,高级工程师,研究方向数据库建设、数据共享。主要承担工作:研究框架设计,数据提供。
马荣华(1972—),男,山东临沂人,研究员,研究方向湖泊环境遥感。主要承担工作:研究方案设计。