APP下载

数字土壤制图在土壤养分方面的研究综述

2021-12-06李莹莹赵正勇

江西农业学报 2021年7期
关键词:制图养分变量

李莹莹,赵正勇,杨 旗

(广西大学 林学院,广西 南宁 530004)

土壤是一种基本的自然资源,是人类农林业的基础。土壤中储存了大量的有机质(SOM)、碱解氮、速效磷、速效钾等土壤养分,它们的循环过程和相互作用在调节植物生产力、固碳能力和生态系统稳定性方面起着关键作用,是维持陆地生态系统结构和功能的重要化学元素[1]。了解SOM、氮、磷、钾等土壤养分的空间分布和储量,对于研究土壤退化、生物多样性缺失、气候变化和制定土地管理计划具有重要意义,是制定农业、林业、防洪、环境保护等决策的重要依据,也是可持续发展的必然要求[1-2]。

传统的土壤养分空间分布研究方法是通过野外土壤样点采样,其结果过于依赖测量工作者自身的经验知识[3]。同时,景观中土壤性质是复杂和连续变化的,这使得传统制图的精度并不是很理想,而且这种方法需要大量的采样数据,使得土壤调查非常费力、耗时且昂贵[4]。随着土壤制图的发展,一种高效、低成本的数字土壤制图(digital soil mapping,DSM)技术应运而生,它可以根据少量的采样数据和环境变量来估计区域土壤养分的分布[1,5]。DSM是对土壤养分的空间分布特征的反映,建立土壤特性和辅助数据之间的关系,并利用这些关系进一步来预测和绘制土壤特性空间分布[6-8]。此外,DSM也是一种基于环境协变量的预测性方法,因而又被称为预测性土壤制图[9]。与传统土壤制图相比,数字土壤制图有成本低、速度快、精度高等优点。

DSM是一门成功的土壤科学分支学科,其研究成果十分丰富。本文基于土壤制图的两大关键理论基础,详细介绍了传统土壤调查法、空间插值法、土壤-景观模型法、遥感影像法等4种主要的土壤制图的预测方法,并探讨了DSM在迅速发展过程中所遇到的一些挑战和问题,以及对今后土壤制图的发展前景进行了展望。

1 土壤制图的理论基础

土壤图是传递土壤属性空间分布特征的图形,主要用于描绘土壤属性的空间差异性和制定合适的土地利用方案[2]。土壤制图就是利用现场和实验室观测方法,结合空间和非空间土壤推理系统,创建空间土壤信息系统[10-11]。

DSM的第一个理论基础是Jenny的土壤形成因子模型[12]。这一观点由Dokuchaev于1883年首先提出,Jenny在1941年对其进行了进一步的阐述,将土壤形成因子模型定义为:S=f(cl,o,r,p,t,…)[12-14]。该模型认为,土壤是当地气候、动植物、母岩类型和结构、地形和时间等因素相互作用的结果。这一经典模型被称为“土壤科学的第一个基本定律”[12,14]。在Jenny之后,一些研究者试图定量地形式化这个概念方程。例如,Taylor等总结了土壤制图的各种方法,然后提出了一个Jenny的变式,S=f(S,c,o,r,p,a,n,…)[14-15]。它包括7个因素:土壤在某一点的其他特性(S)、气候(c)、植被或动物群或人类活动(o)、地形(r)、母质(p)、年龄(a)、空间(n),这个经验方程表明土壤形成因子和土壤预测在空间和时间上都是明确的,是为了定量描述土壤和其他空间环境因子之间的关系,以将这些作为土壤空间预测函数[15]。

Jenny的土壤形成因子模型的另一个演变是继Huggett的研究之后的土壤-景观理论,后者认识到土壤-景观发展的规律性[10,16]。如果在特定环境中发现了特定的土壤,那么在相似的环境中也会发现相似的土壤,并且环境组合越相似(无论它们相距多么遥远),其对应的土壤养分越相似,反之亦然[12,17,18]。这是DSM的第二个理论基础[12]。这种土壤-景观关系方法影响了许多传统的土壤制图方法。例如,克里格法将环境因子考虑到土壤制图中来,发展了协同克里格和回归克里格等。

因此,在预测土壤养分空间分布格局方面,选择合适的环境变量(包括遥感和地形参数)作为模型输入变量非常重要[8]。当然除了慎重选择环境参数外,预测模型的开发、软硬件和算法的进步对于土壤制图也至关重要。

2 土壤制图的方法

土壤制图研究在过去30年中一直尝试改进输入(即土壤数据和协变量)和预测模型来提高制图精度。数据(包括数据模型)在很大程度上代表了土壤的高度可变、连续性,正确管理空间数据是土壤制图精度提高的重要方面。因此,为了解释土壤的高变异性,研究者提出了各种土壤发生模型和开发了许多输入参数,以下就制图的参数输入和预测模型方面介绍了一些主要的预测方法。

2.1 传统土壤调查制图

传统的土壤调查是最基本的土壤测绘和调查形式,该方法包括3个步骤:第一步是土壤专家直接观察和解译辅助数据(航空影像、地质图、植被图等)和土壤剖面特征;第二步,将观察得出的土壤属性与环境之间的关系纳入专家脑海中建立隐式经验模型,用于推断土壤变化;第三步是将经验模型应用于调查区域,以预测未观测场地的土壤变化,即将基于土壤-环境的经验模型应用到航空照片上手工勾绘景观单元边界[11,19,20]。在一定程度上,这种制图方式解决了当时对土壤信息的需求。但是,这种制图方式往往很不可靠,原因有3个:首先,现场采样的成本高,实际观测到的区域很小,并且无法记录土壤测量员在昂贵的实地测绘过程中积累的大部分知识[20-21];其次,虽然传统土壤调查隐含地吸收了土壤科学家的专业知识,但它们没有利用现在广泛使用的地理信息技术,往往带有主观性,对隐性知识过度依赖,导致制图结果不够科学客观[22-23];最后,土壤的空间变化是连续的,但传统土壤图中土壤被图斑界线分割不能很好地表示土壤的连续变化[24]。

因此,土壤调查的最终成果是具有未知假设、不客观、精度非常低的土壤图。为解决这些问题,DSM技术应运而生,其在理论上类似于土壤调查(它们都使用土壤-环境关系的知识来进行推断),但所采用的方法通常会产生具有预测精度的土壤变异性的定量表达式,生成更能代表土壤景观连续性的土壤图[25]。显然,土壤调查创新的一个方向是增加模型开发的客观性和定量识别。

2.2 基于样点数据的空间插值法制图

土壤的性质在空间上通常是连续变化的,其空间变化可以用变异函数来量化[10]。空间插值则是使用变异函数来确定计算平均值时应用于数据的权重,通过已知点的空间信息对未知点的空间特征进行估计的一种制图方法[26]。所得土壤图更科学、精确,更能表示土壤的连续性。

Xie等[27]利用逆距离权值法、局部多项式法、普通克立格法和径向基函数法对土壤重金属的空间分布特征进行预测,结果表明:各种插值方法对土壤重金属的预测均较理想。在中国山东省,张贝尔等[28]采用具有代表性的普通克里格、简单克里格、反距离加权法和样条函数插值法,对土壤质量进行评价时得出不同的插值方法对预测精度影响不大,但是采样点数量会对预测精度影响显著。张铁婵等[29]采用3种常用的空间插值法对5种土壤养分元素进行空间插值,插值表明在采样点密度大的地区,插值精度很好,在样点稀疏的地区插值效果就较差。另外,石小华等[30]对土壤速效钾进行插值研究时,同样得出在采样稀疏区模型精度不大理想,插值结果受采样密度的影响较大的结果。因此,虽然空间插值比起传统土壤调查更为精确科学,更能表示土壤的连续性,但其精度过于依赖样点数据,还不是一个很理想的制图方法。

空间插值法也遭到了一些学者的批评,他们认为空间插值法是一种全球性的技术而不是局部的,不仅没有考虑到土壤发生过程的知识,还假设空间自相关,这在土壤形成因素发生突变的复杂地形区可能不是一个好的制图方法[11,31]。并且,这些插值方法过分依赖采样数据,需要大量密集的数据点,其精度过分依赖采样点的密度、原始数据点的分布,以及受土壤测量工作者实地经验影响的数据质量[32]。因此,在一个大范围或地形复杂的研究区域内,这种制图方法很不适用,且野外土壤调查通常耗时、昂贵,使用密集采样方法来预测土壤养分的空间分布特征是不现实的[32-34]。要解决这些问题必须要依赖更先进的土壤理论和地理信息技术。

2.3 基于土壤-景观模型的空间制图

20世纪80年代以来,在Huggett提出的土壤-景观理论基础上和地理信息系统的发展,人们根据目标土壤特性和环境协变量的关系建立各种模型来预测土壤养分空间分布,对于样点数据的依赖减少了。期间,地形、植被和气候因子被广泛地应用于模型输入,地形变量主要从数字高程模型(DEM)衍生出来,是最广泛应用的环境因子。

2.3.1 线性统计模型 主要有基于经典统计学的线性回归模型和回归克里格、协同克里格法。Moore等[35]使用线性回归来模拟土壤特性(SOM、pH值、土壤质地)和地形属性(坡度、坡向和地形湿度指数),模型解释了这些土壤性质的大部分变化。Wang等[36]发现地形是影响埃塞俄比亚中部高地区域SOC和土壤全氮(STN)含量空间变化的主要因素。孙孝林等[37]在皖南宣城的丘陵地带建立了线性回归模型来预测表层土壤有机质的空间分布特征,证明从DEM中提取的地形因子与表层土壤有机质有着显著相关性。此外,黄安等[38]在陕西省蓝田县采用克里格法和多元线性回归模型预测土壤有机质的含量,结果表明:多元线性回归模型比克里格插值法预测效果好。统计模型克服了空间插值法生成的土壤图没有充分体现土壤连续变化的不合理斑块,使得制图结果更加符合现实中土壤养分随着环境变化而变化的渐变特征[39]。

统计方法确实以定量的方式证明了地形分析可以用来预测土壤属性。但是,线性统计方法大多受到土壤和地形属性之间假定的线性关系、正态分布数据的假设、高质量数据要求的限制[32,40]。并且,土壤属性与各环境因子之间的关系更多的是非线性过程,土壤本身存在很大的变异性[41]。标准统计程序不够灵活,不足以与各种潜在的数据源,如专家知识进行强有力的整合。采用统计方法的研究大部分是在小尺度景观中进行的。因此,为了在更大规模和更多样化的环境中进行制图,需要开发更高效、更具普遍性的方法。

2.3.2 非线性机器学习法 依赖归纳法的数据驱动机器学习方法已被广泛应用:例如,Minasny和McBratney使用人工神经网络(ANN)预测土壤物理性质[42-43];Bui和Moran使用分类树预测土壤和地表地质类别[44-45];Henderson等[46]使用决策树生成各种土壤性质图。杨琳等[47]在黑龙江省嫩江县内采用了模糊C均值聚类和多元线性回归法进行表层SOM的研究,结果表明:样点数据较少的情况下,模糊C均值聚类比多元线性回归方程效果好,表明机器学习法可以较好地解决土壤与环境之间复杂的非线性关系。范晓晖[48]建立了回归树模型和多元线性回归模型用于研究广西南宁市高峰林场中桉树人工林的SOC含量,结果表明,回归树模型的预测精度和稳定性都比多元线性回归好,她还认为地形因子与有机碳之间的非线性关系比线性强[49]。Taghizadeh等[50]利用人工神经网络、支持向量回归、K最近邻、随机森林、回归树模型和遗传规划等6种数据挖掘技术,比较它们在1 m深度的SOC横向和垂直变化的有效性,结果表明:ANN对4个深度的SOC预测是该地区土壤有机碳含量预测的最佳方法,同时发现,土壤表面的预测效果比在深度上更好,这表明地下SOC变化的预测需要其他辅助变量,而寻找合适的协变量来解释深层SOC仍然是一个挑战。

大多数DSM研究使用地形属性作为主要预测变量。然而,在地势较低的平原地区,地形因子通常不会随空间上的土壤条件变化而变化,以至于他们不能有效地用于土壤制图中[51]。绘制这些地区土壤性质的变化图仍然是一个巨大挑战。随着卫星遥感技术的迅速发展,遥感已经成为一种强有力的工具,为解决大规模准确预测土壤养分空间分布格局开辟了新的数据源,先进卫星传感器获取的高分辨率遥感图像为这一思想的实现提供了基础数据[52]。遥感数据为在地形变异较小的地区建立土壤变异的环境协变量提供了一条有效的途径。

2.4 基于遥感数据的空间制图

随着传感器创新、软硬件功能的进步,记录着更多土壤信息的多光谱和高光谱传感器丰富了土壤养分制图的数据集[53]。遥感技术的进步,改变了长期以来过度于依赖地形变量的制图方法。以往研究表明,具有实时信息的遥感数据可以与采样数据相结合,可以快速和准确地对土壤养分进行频繁的监测和评估,拓宽研究范围,是一种有前途的辅助数据源[54-56]。

刘峰[57]、Zhu[58]等在黑龙江省利用MODIS遥感影像数据获取了土壤的空间分布。Wang等[59]基于气候(MAT、MAP)、地形(海拔、坡度、坡向、剖面曲率、平面曲率、地形湿度指数)和遥感变量(B3、B4、B5、NDVI)基础上,绘制了辽宁省旅顺市表层土壤(0~20 cm)STN含量的分布图。精度评估表明,结合所有环境变量的随机森林模型具有最佳的预测性能,其次是仅仅利用遥感数据的随机森林模型,而仅使用地形和气候变量的随机森林模型表现最差,但仅包含遥感变量的模型精度与使用所有变量的模型精度不相上下。最后得出,在所有协变量模型中,TSN的分布主要由遥感变量(48%)解释,其次是地形变量(36%)和气候变量(16%)。Wang等[1]之后又利用9个遥感变量:B3、B4、B5、DVI、EVI、RVI、NDVI、RDVI、SAVI对东北森林生态系统SOC和STN分布进行预测。研究结果表明,在所有遥感环境变量中,SAVI和NDVI是预测SOC和STN重要性最高的因子。一些研究也指出了利用遥感数据绘制SOC的重要性。例如,在丹麦日德兰半岛,Pouladi等[60]利用NDVI、SAVI、DVI、RVI和地形相关变量预测表层SOC含量,他们发现这些遥感变量解释了89%的SOC空间变化,并且当采样点足够密集时,没有必要在模型构建中引入其他环境变量。因此,随着卫星遥感技术的迅速发展,遥感已经成为一种强有力的工具,为解决大规模准确预测土壤养分空间分布格局开辟了新的数据源。同时,遥感数据还具有成本低、速度快、精度高等优点[61]。

3 存在问题与展望

3.1 存在问题

尽管数字土壤制图为满足土壤信息的各种需求正在走向成熟,但新的理论、方法和应用,特别是在高度异质和人为影响的环境下仍然存在挑战,并需要在未来解决。

(1)模型处理大变量集能力差。Brungard等[63]研究表明,使用土壤学专业知识对协变量进行先验预选可能会降低土壤类别预测的准确性。但由于受到目前地理信息技术和土壤理论知识水平等的影响,在最近许多的DSM研究中,只选择了相关协变量的一小部分来创建预测模型,都使用了相对较小的(不超过30个)协变量集。但是我们通常认为DSM技术受益于大量的协变量[63]。因此,DSM模型的建立面临着处理非常大的协变量集的挑战。

(2)可用的模型参数少。基于成土因素学说和土壤-景观模型,我们清晰地知道了土壤和环境之间的关系。但是,影响土壤的条件非常复杂,并且这些条件没有绝对值,因此很难用数值表示;并且有些因素的数据很少,有些因素则没有任何数据,如时间因素[9,12]。因此,亟需加大力度开发更多的可用数据源以及土壤理论。尽管如此,我们还是希望这些困难能随着时间的推移而克服,使土壤科学真正成为一门严谨的科学。

(3)模型推广性差。现有的模型甚至是人工智能模型,只能反映小区域内局部环境与土壤的关系,因为这些模型往往是利用小区域采集的现场样本来构建和校准的。研究区的原始模型应用到与研究区环境条件相似的地区可能具有较高的精确度,但在与研究区环境条件有显著偏差的地区其精度往往就不是很理想[32,43]。因此,有必要设计更优越的模型来处理土壤与环境的非线性关系,用以高分辨率和高精度模拟土壤性质和过程。

(4)遥感数据的局限性。对于地形起伏小、范围广的研究区,遥感影像发挥了非常重要的作用。但是,遥感图像受大气等因素影响较大,选取的遥感图像空间分辨率和时间分辨率都会对制图精度造成影响。此外,当涉及大面积区域时,遥感数据的价格往往是一个限制因素。因此,要实现大尺度、高精度的制图,遥感技术是一个重要的突破口。

3.2 展望

综上所述,近10年来DSM的发展主要有以下趋势。(1)从小区域到大区域。由于探索性和实验性的目的,早期的研究多在小范围内进行,国家和区域尺度的少之又少。随着3S技术的发展,最近的研究已经纷纷转向较大的区域,探讨各种DSM方法在大尺度上的适用性[64]。例如,刘京等[65]以新疆伊犁表层SOC为研究对象,提出了基于样点“个体代表性”推测土壤养分,合理地利用了质量不是很好的采样点数据,在样点数据上进行了突破。

(2)从简单到复杂的景观。简单景观是指只有一两个环境因素控制土壤格局,土壤-环境关系几乎是线性的;复杂景观是指3个或3个以上的环境因素,土壤-环境关系是非线性的、非平稳的[62-63]。对于前者,即使是线性回归也能很好地解释协变量(如地形属性)与土壤变量之间的关系。但对于后者,必须使用机器学习算法来模拟土壤变化。

(3)从二维到多维。传统的二维土壤图通常只是显示表层土壤养分的空间分布,不足以表达土壤的深度,甚至是颜色、纹理、光谱、温度和湿度等信息。因此,在土壤建模中需要开发更多的虚拟现实技术。Mulder等[66]开发了一个绘制土壤主要性质(黏土、沙土、pH值、SOC、阳离子交换量和土壤深度等)的自动程序,其精度大多在合理范围内,为法国提供了第一个全球土壤图。

(4)从样点数据到遥感数据。随着卫星遥感技术的迅速发展,遥感已经成为一种强有力的工具。为解决大规模准确预测土壤养分空间分布格局开辟了新的数据源[53-54]。Wang等[67]以多光谱遥感数据、地形、气候等12个环境变量为基础,结合增强回归树模型,预测表层SOC含量,结果表明:在自然植被较密集的森林生态系统进行土壤养分预测的关键环境变量是遥感数据。

猜你喜欢

制图养分变量
抓住不变量解题
无声手枪如何消音?
苹果最佳养分管理技术
也谈分离变量
养分
年轻时的流浪,是一生的养分
二向反射模型在土地覆被制图中的应用
SL(3,3n)和SU(3,3n)的第一Cartan不变量
工程制图课程教学改革探析
分离变量法:常见的通性通法