不同空间插值方法对土壤化学元素空间分布适用性分析
2023-10-27冯郑文刘亚静
冯郑文,刘亚静
(华北理工大学 矿业工程学院,河北 唐山 063210)
土壤作为一种不可再生的自然资源,是人类生存和发展的物质基础[1],在生态系统中也有着重要的空间地位[2]。土壤是由多种因素相互作用而形成的,其属性在空间分布上有一定的差异[3]。实现农业养分精确管理和解决全球变化等环境问题的关键在于准确掌握土壤理化性状的空间变异规律[4]。获取土壤理化性质的主要手段仍是通过野外采样、室内测定[5],但其问题在于,即使是在高密度采样的条件下,土壤样点数量还是有限的,需要借助空间插值方法来建立土壤理化性质的连续性表面[6]。空间插值是根据已知的空间数据估计未知空间数据值的数学方法[7],可以通过有限的采样点用来预测整个研究区域的土壤属性空间信息[8]。空间插值方法的优选是准确预测区域土壤化学元素含量空间分布特征的关键。
现有对于土壤属性数据进行空间插值的研究,多是针对传统确定性插值和地统计插值的对比研究。张优等[5]采用反距离权重法(IDW)、普通克里格插值法(Kriging)、径向基函数插值法(RBF)和回归克里格法(RK)等不同方法对龙门山与成都平原过渡地带的绵竹市部分区域的土壤水分进行空间插值,研究发现在众多插值方法中,克里格插值的适用性最好;马宏宏等[1]、王大鹏等[9]基于ArcGIS对土壤元素进行空间插值发现使用克里金法的插值数据相对误差最小,是最佳的估计方法。符德龙等[10]对毕节市492个烟地样本点采用反距离权重法、样条函数法和普通克里格法进行空间插值利用交叉验证方法得出普通克里格法对耕深、犁底层、可耕层均具有最好的插值精度的结论。李东升等[2]对云南省会泽县者海镇土壤中重金属的含量采用不同方法进行插值比较,在插值数据符合正态分布的前提下,克里金插值效果最好。文雯等[8]对黄土丘陵羊圈沟小流域的土壤有机碳含量采用不同方法进行空间插值,普通克里格法对刻画区域土壤有机碳的空间分布趋势效果最佳, 预测结果的准确性最好。石小华等[7]对陕西省周至县北部猕猴桃适生区土壤速效钾采用普通克里格(OK)、样条函数(Spline)、趋势面拟合(TSA)、距离权重反比法(IDW)进行插值,研究发现克里格插值方法明显优于其它方法,其中半变异函数又以球形模型为最佳。综上,目前针对土壤理化性质的空间插值最优方法的确定,普遍以克里金法为主。因此,不同空间插值方法对土壤化学元素空间分布适用性研究不再考虑确定性插值,直接采用克里金法进行插值。克里金法是以区域化变量理论为基础,它既是有结构性又有随机性的变量,适合研究具有空间相关性和依赖性的自然现象[11]。克里金插值方法反映总体趋势以及各向异性、空间变异性是确定性插值法不能够取代的[12]。
虽然在算法不断改进的情况下,克里金法衍生出多种不同的克里金插值方法,但针对土壤化学元素空间分布特征的不同克里金插值法适用性问题目前鲜有研究。因此,基于ArcGIS软件地统计克里金插值法,通过插值后图像效果和交叉验证结果分析不同克里金法对土壤化学元素的空间插值精度,确定最优插值模型,研究土壤化学元素的空间分布差异性。比较不同的插值模型,选取精度较高的方法进行插值分析对研究土壤化学性质的空间分布特征是很有必要的[13]。
1 研究区概况与数据来源
遵化市隶属河北省唐山市,属京、津、唐、承、秦腹地,总面积约1 521 km2。遵化市属于燕山南麓的重要农业区,地貌以浅山丘陵为主,土壤类型以风化片麻岩为主,富含农作物生长结果所需的有机质和多种矿质营养,适宜发展特色农业产业。该研究以遵化市西部地区面积约628 km2作为研究区,根据土壤耕深和土地复垦原则采集化验0~30 cm深度土壤表层化学元素数据,结合GIS技术分析土壤化学元素空间分布特征,确定最优空间插值方法,可以为地方农业健康稳定发展提供科学依据。
结合研究区地形、植被类型等现状,按不同乡镇区域在遵化市西部地区选取60个采样点,按照五点取样法进行取样[14,15],土壤样品采集后带回实验室,将土壤进行风干、去除杂质,采用重铬酸钾容量-外加热法测定土壤有机碳含量;选用PH计法测定土壤酸碱度;速效钾采用NH4OAC浸提火焰光度法;有效磷测定采用0.5 mol/LNaHCO3钼锑抗比色法;全氮采用凯氏定氮仪测定。
2 克里金法概述
克里金法是根据非样本点周围位置的样本数据,分析它们之间的空间相关性,并且能够计算出其估计精度的一种插值方法[16]。克里金插值也称为空间局部插值或空间局部估计,是建立在变异函数理论和结构分析的基础上,具有坚实的数学基础,能够对区域化变量进行线性无偏最优估计[17]。由于研究对象和条件不同,相继产生了各种各样的形式,根据插值原理,指示克里金法建立的是二进制数据模型,析取克里金法、概率克里金法不允许出现测量误差,由于土壤化学元素数据不是二进制数据且在数据采集化验过程中存在测量误差,因此,该研究选取普通克里金法、简单克里金法、泛克里金法以及经验贝叶斯克里金法4种用于研究土壤化学性质空间差异性的克里金插值方法。
2.1 普通克里金法
普通克里金法假设模型为:
Z(s)=μ+ε(s)
(1)
其中,μ是一个未知常量。作为一种简单的预测方法,普通克里金法具有显著的灵活性。普通克里金法可用于带有某种趋势的数据[18],单凭数据无法确定已观测到的模式是否是自相关(μ为常量的情况下,在误差ε(s)之间)或趋势(μ(s)随s变化)所造成的。普通克里金法可以使用半变异函数或协方差(用于表达空间自相关的数学形式),使用变换和移除趋势,还允许测量误差[19]。
2.2 简单克里金法
简单克里金法假设模型为:
Z(s)=μ+ε(s)
(2)
其中,μ是已知常量。对于简单克里金法,因为假设确切已知μ,那么也确切已知数据位置上的ε(s)。对于普通克里金法,如果估算了μ,那么也会估算ε(s)。如果已知ε(s),可以比估算ε(s)时更好地估算自相关。通常,已知确切平均值μ的假设是不现实的。简单克里金法[20]可以使用半变异函数或协方差和变换,并且允许测量误差。
2.3 泛克里金法
泛克里金法假设模型为:
Z(s)=μ(s)+ε(s)
(3)
其中,μ(s)为某些确定性函数。没有假设误差ε(s)是独立的,而是将它们建模为自相关。泛克里金法[21]可以使用半变异函数或协方差和变换,并且允许测量误差。
2.4 经验贝叶斯克里金法
经验贝叶斯克里金法可以自动执行构建有效克里金模型过程中的那些最困难的步骤[22],不像其他克里金方法需要手动调整参数,可以使用构造子集和模拟的方法自动计算参数。经验贝叶斯克里金法可以通过估计基础半变异函数来说明引入的误差,而不像其他克里金方法通过已知的数据位置来计算半变异函数,因此经验贝叶斯克里金法与其他克里金方法相比,经验贝叶斯克里金法降低了预测的标准误差[23]。当待插值数据不符合正态分布规律时,也可使用经验贝叶斯克里金方法,该方法可对数据的趋势进行校正,在处理地质层面高程估计方面具有一定的优越性,但处理速度相对其他克里金法较慢。
3 插值精度评价
空间插值的精度及预测值的效果检验一般采用交叉验证法进行[13]。通常采用交叉验证法(cross-validation)来验证土壤化学性质的空间插值效果,即先移除某一个或多个样点的数据,然后使用周围样点数据预测该点的值,并与实际值进行比较,以评价插值方法预测未知位置值的准确程度。比较不同插值方法的插值预测误差中的平均值误差、均方根误差、标准化平均值误差、标准均方根误差和平均标准误差。具体的评判标准为:当平均值误差和标准平均值误差越接近0、标准均方根误差越接近1、平均标准误差和均方根误差数值相差越小,表明插值结果精度越高[23]。
4 研究结果与分析
4.1 数据预处理
克里金插值一般要求对采集的土壤化学元素数据进行正态分布检验,不符合正态分布的数据需要进行转换后满足正态分布要求。该项研究选用的4种插值方法中,除经验贝叶斯克里金插值法不要求数据服从正态分布以外,其他3种方法均需要对研究数据进行正态分析检验。采用SPSSPRO软件中数据描述性分析检验方法﹐对土壤化学性质数据正态分布情况进行核验[24]。
除经验贝叶斯克里金法之外,其他克里金插值要求待处理的数据大概符合正态分布,或对其进行变换后大概符合正态分布[25]。正态QQ图是用于反映样点数据与标准正态分布的接近程度[5],样点数据值与正态分布线越接近,则越接近正态分布。通过SPSSPRO软件中数据描述性分析检验土壤5类化学元素的正态性,如表1所示。
表1 土壤化学元素正态校验
通常正态分布的检验方法有2种,一种是Shapiro-Wilk检验,适用于小样本资料(样本量≤5000);另一种是Kolmogorov-Smirnov检验,适用于大样本资料(样本量>5000)。若呈现显著性(P<0.05),则说明拒绝原假设(数据符合正态分布),该数据不满足正态分布,反之则说明该数据满足正态分布。由表1可知,5类土壤化学元素样本均小于5 000,采用S-W检验。pH显著性P值为0.074*,水平不呈现显著性,不能拒绝原假设,因此数据满足正态分布。全氮显著性P值为0.693,水平不呈现显著性,不能拒绝原假设,因此数据满足正态分布。有机质显著性P值为0.911,水平不呈现显著性,不能拒绝原假设,因此数据满足正态分布。有效磷显著性P值为0.000***,水平呈现显著性,拒绝原假设,因此数据不满足正态分布,其峰度(-0.045)绝对值小于10并且偏度(0.881)绝对值小于3,结合正态分布QQ图进行进一步分析。速效钾显著性P值为0.000***,水平呈现显著性,拒绝原假设,因此数据不满足正态分布。其峰度(0.349)绝对值小于10并且偏度(1.195)绝对值小于3,结合正态分布QQ图进行进一步分析。土壤速效钾和有效磷数据正态QQ图如图1所示,明显看出二者数据拟合性均不满足正态分布要求。因此,本研究土壤pH、全氮和有机质元素数据可直接进行空间插值,而土壤有效磷和速效钾元素需要对数据进行对数变换之后满足正态分布要求再进行空间插值。
4.2 变异系数分析
变异系数[26]又称标准差率或离散系数,是统计分析中用来衡量变异程度的一个统计量[27]。标准差与平均值的比值称为变异系数[28],值越大,说明研究区土壤化学性质空间分布差异越大。5类土壤化学元素的变异系数如表2所示,变异系数值由大到小排列为:有效磷、速效钾、全氮、有机质、pH;有效磷的变异系数为61.1%,其数据空间分布差异性最大;空间分布差异性最小的是土壤pH元素。
4.3 块金效应分析
块金值与基台值(块金值与偏基台值总和)的比值C0/(C0+C)称为块金效应[29,30],当该比值C0/(C0+C)≤25%时,表明该统计量的空间相关性很强;当比值介于25%~75%之间时,表明该统计量的空间相关性属于中等水平;当比值C0/(C0+C)>75%时,则表明该统计量具有较弱的空间相关性。土壤5类化学元素的块金效应处理结果如表3所示,5类土壤化学元素均具有空间相关性。有效磷的块金效应为20.5%<25%,说明有效磷元素的空间相关性很强;土壤有机质的块金效应为80.7%>75%,表明其具有较弱的空间相关性;土壤pH、全氮、速效钾的块金效应值在25%~75%之间,这3类化学元素的空间相关性属于中等水平。
表3 土壤化学元素块金效应处理结果
4.4 土壤化学元素空间分布特征分析
通过普通克里金插值法、泛克里金插值法、简单克里金插值法和经验贝叶斯克里金插值法对研究区土壤pH、全氮、有机质、速效钾以及有效磷进行空间插值,利用插值结果直观反映并分析土壤化学元素的空间分布特征,并通过插值效果以及插值后的数据拟合度分析土壤化学元素最适用的空间插值方法。5类土壤化学元素的4种克里金插值结果如图2~图6所示。图2所示为土壤pH不同克里金插值结果。
图2 土壤pH不同克里金插值结果
由图2可以看出,4种插值方法显示的土壤pH空间分布特征基本吻合,空间分布层次明显。在研究区域内,土壤pH的低值区主要分布在2个地区,一小部分分布在北偏西方向上,另一大面积区域分布在正南方向上;高值区主要分布在区域西部、北部的边缘地带。普通克里金法和泛克里金法插值效果相似,简单克里金法插值后的曲面最平滑,正西方向部分区域采用经验贝叶斯克里金法插值、过度处理后明显区别于另外3种插值结果。插值后的pH值数据范围由大到小分别是普通克里金法、泛克里金法、简单克里金法和经验贝叶斯克里金法,说明对于研究区土壤pH数据,插值普通克里金法的拟合结果最优。
土壤全氮数据利用4种克里金法空间插值后的结果如图3所示。
图3 土壤全氮不同克里金插值结果
简单克里金法插值效果与另外3种克里金法差异明显,整体来看全氮高值区主要分布在研究区的最西和最南方向链接线上,东部地区数据值较低,中间有多核区域也表现为较高的插值结果。从插值效果上看,4种克里金法均表现出较好的层次关系,插值后的土壤全氮数据范围由大到小分别是普通克里金法、泛克里金法、简单克里金法和经验贝叶斯克里金法,说明对于研究区全氮数据插值普通克里金法的拟合结果最优。
土壤有机质4种克里金法插值结果如图4所示,普通克里金法和泛克里金法插值效果十分吻合,4种插值结果综合效果相似,研究区有机质空间分布呈现西高东低的趋势。就插值效果的平滑程度而言,简单克里金法的插值效果更好。插值后的有机质数据范围由大到小分别是普通克里金法、泛克里金法、经验贝叶斯克里金法和简单克里金法,说明对于研究区土壤有机质数据插值普通克里金法拟合性最好。
图4 土壤有机质不同克里金插值结果
土壤速效钾的空间插值结果如图5所示,其整体空间分布特征为西部和南部区域为高值区域,中部、北部和东部区域为低值区域。就插值效果的平滑程度而言,简单克里金法的插值效果更好。插值后的速效钾数据范围由大到小分别是普通克里金法、泛克里金法、经验贝叶斯克里金法和简单克里金法,说明对于研究区土壤速效钾数据,普通克里金法的拟合度最高。
图5 土壤速效钾不同克里金插值结果
图6所示为土壤有效磷的4种克里金法空间插值结果,其空间分布高值区主要以南部区域为主,由南到北数值逐渐减小,北部和西部各有小部分区域为次高值区。插值后研究区的有效磷数据范围,普通克里金法的覆盖最广。
图6 土壤有效磷不同克里金插值结
综上所述,5类土壤化学元素空间分布差异性明显,土壤pH的低值区分布在研究区正南方向上;高值区主要分布在区域西部、北部的边缘地带。全氮高值区主要分布在研究区的最西和最南方向链接线上,东部地区数据值较低,中间有多核区域也表现为较高的插值结果。研究区有机质空间分布呈现西高东低的趋势。土壤速效钾的整体空间分布特征为西部和南部区域为高值区域,中部、北部和东部区域为低值区域。土壤有效磷空间分布高值区主要以南部区域为主,由南到北数值逐渐减小,北部和西部各有小部分区域为次高值区。普通克里金插值法、泛克里金插值法、简单克里金插值法和经验贝叶斯克里金插值法对研究区土壤pH、全氮、有机质、速效钾以及有效磷进行空间插值结果显示,普通克里金法插值后的数据拟合性最优,最大程度保留了原始采样点的数据值;泛克里金法与普通克里金法的插值效果基本类似;其中土壤pH、有机质和速效钾选择简单克里金法插值的效果更好,插值曲面更加平滑。
4.5 不同插值方法精度评定
通过交叉验证方法定量分析4种克里金法分别对5类土壤化学元素空间分布的最优插值方法,交叉验证结果如图7所示。
图7 土壤5类化学元素空间插值交叉验证结果
由于平均值误差和标准平均值误差越接近0、标准均方根误差越接近1、平均标准误差和均方根误差越小的插值结果精度越高,所以由图7可以得到,土壤有机质数据在4种插值方法中平均值误差最接近0的是普通克里金法,其次是简单克里金法;标准平均值误差最接近0的是普通克里金法,其次是简单克里金法;标准均方根误差最接近于1的是简单克里金法,其次是经验贝叶斯克里金法;均方根误差最小的是简单克里金法,其次是普通克里金法;平均标准误差最小的是泛克里金法,其次是简单克里金法。因此,综合上述5种精度评定指标,简单克里金法对土壤有机质的空间插值精度最高。同理,在上述精度评定原则要求下,由图7可得4种空间插值方法中对土壤PH数据插值最优的是经验贝叶斯克里金法;图中显示简单克里金法对土壤全氮的空间插值精度最高;交叉验证结果显示经验贝叶斯克里金法对土壤速效钾和有效磷的空间插值精度影响均最大。
4.5.1 不同半变异函数模型精度评定
通过交叉验证方法定量分析4种克里金法中最优的插值方法,由4.2节对土壤5种化学元素的变异系数和4.3节的块金效应分析得到土壤有机质相较于其它4类化学元素的空间分布差异性较小且具有较弱的空间相关性,因此该研究以土壤有机质元素为例分析最优的克里金插值方法中最适宜半变异函数模型,由4.5节得对土壤有机质空间插值最适用的克里金插值是简单克里金法,由于使用克里金法插值时会使用半变异函数模型,而在ArcGIS软件的地统计克里金插值模块中匹配的半变异函数模型有三角函数、球面函数、四球、五球、指数函数、高斯函数、有理二次方程式、孔洞效应、K-Bessel、J-Bessel、稳定的共11种模型。表4所示为对土壤有机质进行简单克里金插值的11种模型交叉验证结果。
表4 土壤有机质简单克里金插值不同半变异函数模型精度
由表4可得,对土壤有机质进行简单克里金插值选择不同半变异函数模型时交叉验证结果有明显差异。其中,平均值误差最接近0的是指数函数模型,精度最高,平均值误差最大的是J-Bessel模型,精度最差;均方根误差最小的是K-Bessel模型,其次是高斯函数模型和稳定的模型,误差最大的是J-Bessel模型,精度最差;标准平均值误差最接近0的是指数函数模型,精度最好,其次是有理二次方程式模型,标准平均值误差最大的是J-Bessel模型,精度最低;标准均方根误差最接近1的半变异函数模型是三角函数模型,其次是孔洞效应模型,误差最大的是J-Bessel模型,精度最低;11种半变异函数模型中平均标准误差最小的是J-Bessel模型,其次是孔洞效应模型,平均标准误差值最大的是有理二次方程式模型,精度最低。因此,综合交叉验证分析的5类精度评定指标得出,土壤有机质进行简单克里金插值时半变异函数模型选用指数函数模型时空间插值精度最高,选择J-Bessel模型时空间插值精度最低。综上,本研究的土壤有机质数据空间插值的半变异函数模型选择的是指数函数模型,此时空间插值结果最优。
4.5.2 不同半变异函数模型空间插值结果分析
由4.5.1节的分析结果选择空间插值精度最高的指数函数模型、空间插值精度最低的J-Bessel模型、插值时默认选择的稳定的模型以及插值精度一般的球面函数模型共4种半变异函数模型对土壤有机质进行克里金插值,得到的空间插值结果如图8所示。
由图8可以看出,J-Bessel模型的对土壤有机质的简单克里金插值效果明显区别于指数函数模型、稳定的模型和球面函数模型,在研究区东南方向区域上处理效果不如另外3类半变异函数模型;指数函数模型和稳定的模型、球面函数模型的插值效果大致一致,但其在整体空间分布的细节处理上相较于稳定的模型、球面函数模型有明显变化,更加符合研究区有机质空间分布西高东低的趋势特征。插值后的数据范围最大的是指数函数模型,最小的是J-Bessel模型,说明对于研究区土壤有机质数据简单克里金插值指数函数模型的数据拟合性最优。因此,从插值结果上进一步验证了指数函数模型是土壤有机质最优空间插值方法-简单克里金法的最适宜半变异函数模型。
5 结论
(1)在数据预处理过程中发现实测土壤pH、全氮、有机质元素符合正态分布,满足克里金插值要求,对不满足要求的土壤速效钾、有效磷进行对数变换后符合插值要求。根据变异系数分析结果得到5类土壤化学元素空间分布均具有差异性,其中有效磷空间分布差异最大;块金效应处理结果说明5类土壤化学元素均具有空间相关性,但相关性程度不一。结果表明,土壤样点数据满足选用克里金法的插值要求。
(2)在研究区域内,土壤pH空间分布层次明显,土壤pH的低值区主要分布在2个地区,一小部分在北偏西方向上,另一大面积区域分布在正南方向上;高值区主要分布在区域西部、北部的边缘地带;简单克里金法插值后的曲面最平滑。整体来看全氮高值区主要分布在研究区的最西和最南方向链接线上,东部地区数据值较低,中间有多核区域也表现为较高的插值结果。研究区有机质空间分布呈现西高东低的趋势。就插值效果的平滑程度而言,简单克里金法的插值效果更好。土壤速效钾整体空间分布特征为西部和南部区域为高值区域,中部、北部和东部区域为低值区域。有效磷空间分布高值区主要以南部区域为主,由南到北数值逐渐减小,北部和西部各有小部分区域为次高值区。5类土壤化学元素插值后均是以普通克里金法进行空间插值的数据拟合性最优。
(3)根据交叉验证结果定量分析不同克里金法插值精度得出不同土壤化学元素的最优空间插值方法不同;简单克里金法对土壤有机质的空间插值精度最高;原始数据不符合正态分布需要进行数据变换时,使用经验贝叶斯克里金法插值精度更好。以土壤有机质简单克里金插值为例,使用不同半变异函数模型得到的插值结果土壤化学元素空间分布特征整体相似,指数函数模型在细节处理上优于其他半变异函数模型,且插值后数据拟合性最优。