短距离样点对土壤呼吸空间变异预测精度的影响*
2020-03-12谢梦姣陈奇乐张俊梅吴超玉
谢梦姣, 陈奇乐, 张俊梅, 康 营, 吴超玉, 刘 琦, 王 洋**
(1.河北农业大学国土资源学院 保定 071000; 2.河北农业大学资源与环境科学学院 保定 071000)
土壤呼吸作为陆地生态系统中仅次于总初级生产量的第二大碳通量, 在全球范围总量值预测达到68~100 Pg·a-1, 是实现生态系统碳循环的一个关键生态过程[1]。土壤呼吸在地理空间上具有多尺度、多方向性的复杂变化, 提高土壤呼吸空间变异模拟精度对预测区域尺度的土壤碳通量具有重要意义。
田间土壤呼吸的测定耗时费力且时间窗口有限, 基于有限的样本量预测土壤呼吸空间变异特征时, 合理的布点方式对提高预测精度至关重要。最新研究指出设置短距离样点(一个研究区中采样点之间距离相较于常规布点方式更短的样点)能显著提高土壤属性空间变异的预测精度[2]。Stein[3]在设置短距离样点的一维模拟研究中, 发现拟合函数的空间协方差参数在最大值附近非常平稳, 拟合效果明显提高。Haskard 等[4]在进一步的二维模拟中发现增加10%短距离样点时, 空间协方差参数的标准误差减少, 空间预测精度显著提高。然而, 在短距离样点影响土壤属性空间预测精度的研究中, 不同布点方式下的预测差异尚不明确。前人研究表明, 规则格网、完全随机等布点方式在土壤属性空间变异特征预测中表现不同[5]。申祥民等[6]应用完全随机与规则格网布点方式对土壤含水率的空间变异进行预测, 发现完全随机布点方式优于规则格网布点方式。但Wang和Qi[7]通过对土壤污染物的空间变异结构特征研究, 发现相同采样密度下, 规则格网采样比完全随机和分层采样模式的预测精度更高。因此, 基于不同布点方式设置短距离样点后, 对土壤属性空间变异的预测精度影响亟待研究。
本研究基于规则格网、完全随机, 以及规则格网+完全随机3 种布点方式, 分别设置占各布点方式样本总量(49 个)2%~14%的短距离样点, 以探究预测土壤呼吸空间变异的最佳布点设计, 为田块尺度土壤采样设计的相关研究与实践提供参考。
1 材料与方法
1.1 研究区概况
研究区位于黄淮海平原北部, 选取河北省宁晋县(114°46′~115°15′E, 37°24′~37°48′N)地形无起伏的代表性区域的1 km×1 km 农田作为采样区(图1)。该区域属暖温带半干旱季风气候,年平均降水量和气温分别为449.1 mm 和12.8 ℃。研究区土壤类型主要是潮土, 土地利用方式为农田, 耕作制度为小麦(Triticum asetivu)-玉米(Zea mays)轮作耕地, 一年两熟。
1.2 研究方法
1.2.1 采样点设计
本研究设置3 种布点方式, 方案a 为规则格网布点, 即在7×7单元的规则格网顶点设置采样点共49个, 样点间距167 m; 方案b 为完全随机布点49 个, 样点平均间距433 m; 方案c 为规则格网+完全随机布点49个, 其中选取方案a 中嵌套的3×3 单元规则格网设置9个采样点, 选取方案b 中完全随机布点设置40 个采样点, 样点平均间距405 m (表1)。在3 种布点方式的基础上, 保持样本总量(49)不变, 以占总样点2%~14%的短距离样点随机替换原方案相应样点个数的方法优化布点方式。为获取短期内可比的土壤呼吸测量值, 样本总量不可过大, 因此, 在不同方案中部分样点在合理范围内重复使用, 所有设置方案共设采样点100 个, 采样点为半径0.097 m 的圆形。短距离样点的设置方法为随机选取1 个已布设样点, 设置在随机方向上与 该点距离为§的点作为短距离样点(图1)。
式中: n 为研究区内采样点个数, l 为每一个采样点与其最近采样点的距离[2], 本研究中§=4 m。
图1 研究区域不同样点布设方案的样点分布图 Fig.1 Samples distribution of different sampling methods in the study area
表1 不同样点设计方案的样点布设方法 Table 1 Sample layout of different sampling methods
1.2.2 土壤呼吸的测定
于2018年植株未收割的夏玉米收获期(9月28—30日)的无风天气, 于玉米行间采用LI8100(LICOR, 美国)进行土壤呼吸测定(一个样点的土壤呼吸值由仪器在4.5~5.5 min 内选取的16 个最佳测量值通过多项式拟合所得), 测定时间为上午9:00—11:00, 同时测定5 cm 和10 cm 土壤温度、5 cm 土壤水分含量。为减少对土壤表层的扰动, 用于放置LI8100 测量室的PVC 环(长10 cm, 内径0.194 m)埋设深度为5 cm, 并于测定前24 h 剪除环内杂草。
1.3 数据处理与精度检验
1.3.1 数据处理与正态检验
应用Microsoft Excel 2010 和SPSS 17.0 进行土壤呼吸数据统计分析。本研究将3s 准则法识别后未发现异常值的土壤呼吸数据按照布点方案进行样本创建, 并予以K-S 正态分布检验, 发现本研究各方案土壤呼吸数据均符合正态分布。
1.3.2 空间插值
空间插值是应用地统计学原理, 通过已知部分空间样本信息对未知地理空间特征进行预测的方法[8]。本研究使用GS+ 10.0 进行土壤呼吸空间变异的半变差函数分析, 应用普通克里金(Ordinary Kriging, OK)插值方法对3 种布点设计方案进行田块尺度的土壤呼吸空间插值预测, 由ArcGIS 10.2 进行土壤呼吸空间分布特征制图[9-12]。
半变差函数公式:
式中: h 为变程, 即样本间距(range), N(h)为间距等于h 的样本对数, Z(xi)为样点xi处的土壤呼吸实测值。
普通克里金插值法公式:
式中: μ为拉格朗日乘数, γ(xi, xj)是两个实测值的差的平方的一半。
1.3.3 空间预测精度检验
本研究采用交叉验证作为土壤呼吸空间预测精度的检验方法, 交叉验证作为目前最为常用的精度检验方法, 通过比较验证数据点的预测值和实际测量值来评价预测精度[13-16]。将均方根误差(RMSE)作为预测精度的验证指标, 分析对比3 种布点方法田
块尺度土壤呼吸空间预测的精度。
均方根误差公式:
式中: Z(xi)和(xi)分别为第i 个样点的实际测定值与插值预测值, n 为样本数量。均方根误差越小则空间预测结果越精确。
2 结果与分析
2.1 土壤呼吸的描述统计分析
统计分析表明, 研究区土壤呼吸速率平均值为2.65 μmol·m-2·s-1, 变化范围在1.16~4.88 μmol·m-2·s-1, 变异系数为27%, 属于中等程度变异(表2)。不同采样方法下, 方案a(规则格网+短距离样点)、方案b(完全随机+短距离样点)和方案c(规则格网+完全随机+短距离样点)的样本子集统计结果与样本总集(研究区全部100个采样点)相比变化不大, 说明3 种方案均满足研究区土壤呼吸数据整体估算的要求。各方案土壤呼吸数据偏度与峰度均接近0, 且K-S检验呈正态分布(P>0.05), 可以直接进行空间插值和空间预测精度分析。
表2 不同样点布设方案下土壤呼吸速率的描述性统计结果 Table 2 Descriptive statistical results of soil respiration rate of different sampling methods
2.2 土壤呼吸半变差函数
半变差函数是地统计学的核心和基本工具, 是分析变量空间变异特征的有效手段[17]。本研究中, 不同采样方案的土壤呼吸半变差函数最优拟合模型均为球状模型, 基台效应值[C0/(C0+C)]均在25%~75%, 表现出中等程度的空间变异特征(表3)。
采样设计中样点的布局和数量发生改变时, 样点所承载的信息量也会发生变化[18-24]。如表3 所示, 在不设置短距离样点时, 规则格网、完全随机和规则格网+完全随机的采样方案中, 土壤呼吸半变差函数的变程(range)介于296~325 m, 规则格网+完全随机的最小。且规则格网+完全随机的块金值C0最小(0.05), 确定系数R2最大(0.68)(表3), 因此优于其他采样方案。
在设置短距离样点的各采样方案中, 土壤呼吸的半变差函数变程为247~350 m, 在保持各方案样本量不变的情况下, 完全随机和规则格网+完全随机采样方案设置短距离样点后变程总体呈现减小趋势, 说明空间自相关范围在减小; 而规则格网采样方案的变程则总体呈现增加趋势, 说明空间自相关范围在增大, 短距离点的加入改变了样点的分布特征, 使得半变差函数变程有所变化, 这表明采样数量并不是影响变程的唯一因素, 样点分布特征对局部空间变异的表征能力存在重要的影响[25]。随着短距离样点个数的增加, 除规则格网+完全随机采样方案外, 其他方案均呈现C0递减趋势, 说明在最小间距内的变异分析过程引起的空间预测误差更小。在设置短距离样点的3种布点方式中, 确定系数均随短距离样点个数增加而呈现递增趋势, 确定系数值越大表明半变差函数预测精度越高, 因此, 短距离点的增加会提高土壤呼吸空间变异特征的预测精度。
值得说明的是, 在本试验中获取100 个采样点的土壤呼吸速率时, 为保证其空间变异主要由空间变化引起, 在田间测定时间段内, 对土壤呼吸影响较大的土壤水分和土壤温度条件变化不大, 保证了本研究土壤呼吸空间变异分析结果的可靠性。表4 表明土壤呼吸与土壤温度、土壤水分这些环境因子相关性并不显著。
表3 不同样点布设方案下土壤呼吸空间半变差函数模型及参数 Table 3 Semi-variation function models and parameters of soil respiration under different sampling methods
表4 研究区土壤呼吸与土壤温度、土壤水分的 Pearson 相关性分析 Table 4 Correlation among soil respiration, soil temperature and soil moisture
2.3 土壤呼吸空间分布特征
应用普通克里金法预测的研究区不同采样方案的土壤呼吸空间分布特征一致(图2), 土壤呼吸速率呈带状分布, 格局为西高东低, 自西向东逐渐减小。经调查, 本研究区内, 西部地区较东部地区靠近人口居住区, 农田的耕作模式西部地区多数为会导致土壤碳排放增加的100%秸秆粉碎还田配施化肥且为深松, 而东部地区多数为施肥量相对较少的化肥配施且为旋耕[26], 碳排放量相对较低, 这些可能是造成本研究区土壤呼吸西高东低空间分布特征的原因。
从图2 可以看出, 不设置短距离样点时, 规则格网+完全随机的采样方案比规则格网、完全随机采样方案确定系数提高17.2%~44.7%(表3), 表达土壤呼吸空间分布高低值更加清晰, 带状界线更加平滑明确。而在设置短距离样点的各采样方案中, 在短距离样本占10%时确定系数较高, 均达到0.65 以上, 且随短距离样点占比增加而逐渐平稳, 土壤呼吸的空间变异特征比不设置短距离样点的采样设计确定系数提高14.7%~31.9%(表3)。综上所述, 较不设置短距离样点时, 设置短距离样点可较好地反映土壤呼吸西高东低的空间分布特征, 且在短距离样本占10%时的预测效果明显提升, 表达土壤呼吸空间分布特征更加准确。本研究在此选用短距离样本占10%与不设置短距离样点的样本集合展示土壤呼吸空间分布图。
2.4 土壤呼吸空间预测精度分析
采用交叉验证法对不同采样方案的土壤呼吸空间变异的相关参数进行预测精度评定, 图3 的均方根预测误差RMSE 和相关系数(r)表明, 在不设置短距离样点时, 规则格网+完全随机方案预测的RMSE 最小(0.54)且r 最大(0.78), 因此该方案对研究区土壤呼吸空间预测的精度优于规则格网、完全随机采样方案。
设置短距离样点后, 3 种方案土壤呼吸空间变异的预测精度提高7%~13%。随着设置短距离样本占比增加, RMSE 逐步下降, 且r 逐步上升, 在短距离样本占10%时达到平稳。此时方案c 在各采样方案中的RMSE 最小和r 最大, 分别为0.50 和0.80, 土壤呼吸空间预测时的精度优于其他方案。本研究结果表明在短距离子集中使用总样本工作量的大约10%~14%是合理的(表3、图2 和图3)。
图2 不同样点布设方案下基于普通克里金插值的土壤呼吸空间分布特征(上: 无短距离样点; 下: 10%短距离样点)Fig.2 Spatial distribution of soil respiration rate based on Ordinary Kriging interpolation under different sampling methods (top: no short distance samples; bottom: with 10% short distance samples)
图3 不同样点布设方案下土壤呼吸速率预测相关系数和均方根预测误差(RMSE)随短距离样点占比增加的变化 Fig.3 Variation of estimation correlation coefficient and root mean square prediction error (RMSE)of soil respiration rate with the proportion of short distance samples under different sampling methods
3 讨论
采样点总数相同的情况下, 布点方式不同, 描述空间变异性的精度也不同, 即每一样点能表征空间变异性的范围和效果不同[27]。本研究中, 对未增加短距离样点的土壤呼吸速率空间分布特征预测精度的检验表明, 规则格网+完全随机布点方式的预测精度高于单纯的规则格网和完全随机布点方式。
在各采样设计方案中, 土壤呼吸的空间分布具有相似的描述统计特征, 但以不同数量的短距离样 点替换单纯增加的采样点影响土壤呼吸空间变异的能力不同, 表明在土壤呼吸空间变异特征研究中, 要想达到更好的预测效果, 最优化的采样设计比单纯增加采样点数量更为重要。范曼曼等[28]、张贝尔等[14]研究表明, 同一尺度研究区内, 采样点数量越多、采样点最小间距越小(区域范围内采样密度越大)土壤属性空间变异预测精度越高。而在较常用的单一的规则格网、完全随机的采样点布设模式中, 即使能够探测到更小尺度的变异结构, 也会由于试验 成本限制, 样点数量不足、样点最小间距较大且一定距离范围内的样点数较少而造成数据的可靠性大大降低[29]。本研究布点设计中加入了短距离样点, 这就使得此风险大大降低, 更有利于探测小尺度范围的空间变异性, 试验结果也更具可靠性。因此, 结合实际试验成本以及结果的可靠性找出设置短距离样点的最优占比是一种较优的空间变异研究手段。本研究对采样点区域范围内增加短距离样点的土壤呼吸速率空间分布特征预测精度的检验表明, 短距离样点占比决定了最大预测误差的下降(10%的短距离集合实现了最小均方根预测误差), 但样本大小相同时, 短距离点占比增加到10%以上, 无论样本大小如何, 都会出现误差, 且短距离样点增加到14%时, 空间预测仅有少量的精度提高, 因此, 增加10%短距离点是最优的布点方式, 这与Lark 等[2]的研究一致。
本研究通过对布点方式影响土壤呼吸空间变异预测精度的探究, 发现规则格网+完全随机+短距离点替换10%总样点的布点方式可提高空间变异的预测精度。具有高度空间变异的土壤呼吸已合理验证该布点方式可提高数字制图精度的可行性, 但在土壤数字制图等研究中还涉及更多的具有空间变异特性的土壤属性, 因此本研究指出的短距离样点布点方式需进一步在土壤有机质含量、土壤全氮、土壤C/N 等其他土壤指标的空间变异特征研究中进行验证, 从而保证该采样方式的普适性。此外, 在后续研究中可另外设置独立的样本集以进行土壤呼吸空间插值分析的精度验证, 进一步提高土壤呼吸空间变异特征模拟的精确度。
4 结论
本研究区土壤呼吸速率平均值为2.65 μmol·m-2·s-1, 呈现中等程度的空间变异, 土壤呼吸空间格局总体呈现由西向东逐渐降低的趋势。
不设置短距离样点时, 规则格网+随机布点比单一的完全随机布点和规则格网布点空间插值预测精度分别提高10%和22%。设置短距离样点后, 3 种采样方案的空间预测精度提高7%~13%。基于提高预测精度而不增加样点数量, 设置短距离样本个数占采样方案样本总数10%时, 是经济易行又可靠的布点方案。