气候敏感的落叶松人工林林分生物量模型研究
2022-01-05徐奇刚雷相东
何 潇,徐奇刚,雷相东*
(1.中国林业科学研究院资源信息研究所,北京 100091;2.国家林业和草原局森林经营与生长模拟实验室,北京 100091)
森林生态系统中存储的生物量-碳储量是全球碳循环的基础。研究表明,全球森林生态系统大约含有861±66Gt碳储量[1],这对于全球气候调节服务至关重要[2]。生物量估计的常用方法是建立回归模型,目前,国内外研建了大量的单木生物量模型[3-7],这些单木模型是林分生物量计算的基础。由于森林资源调查数据中可能没有单木数据,仅记录了林分因子,导致单木生物量模型的应用受限。而在大尺度上更直接有效的方法是建立林分生物量模型,利用林分因子估计生物量,但是林分层次的生物量模型并不多见[8-10]。此外,为了制定应对气候变化的适应性经营策略,迫切需要了解气候对生物量估算的影响。Rudgers 等[11]发现林木生物量及其分配会受到气候的影响,使得生物量模型的参数变化,进而影响生物量估计结果。Fu 等[12]和Zeng 等[13]建立了气候敏感的单木生物量异速生长方程,发现气候与生物量之间存在显著关系。Usoltsev 等[14]将气候变量引入可加性林分生物量方程中以确定气候对林分生物量的影响。因此,在生物量估计模型中应考虑气候变量,以减少模型的不确定性。
常见的模型参数估计方法是最小二乘法,然而森林生长受到立地质量[15]和外界干扰[16]的影响,可能导致调查数据存在较多的离群点,加上生物量数据的异方差性[17],如果使用最小二乘方法求解参数可能会导致模型参数的有效性降低,引起模型的不确定性增加[18]。因此,有学者提出了用稳健回归来尽可能降低离群点对参数估计的影响[19],郭清文等[18]的实验结果证明:基于稳健回归的生物量模型不仅能有效降低建模数据中离群点带来的影响,还使得参数估计在理论上接近最优。
本研究利用东北和华北地区的落叶松(Larixspp.)人工林生物量数据,比较稳健回归方法和普通最小二乘方法求解林分生物量模型的差异,并在模型中考虑气候因子,量化分析林分因子和气候因子对林分生物量(包括林分地上生物量AGB和林分总生物量TGB)的解释率,以期为大尺度生物量精准估计提供基础模型和方法。
1 材料与方法
1.1 数据来源
数据来源于黑龙江、吉林、辽宁、北京、河北、山西和内蒙古等7 个省份(34°34′~53°33′N,97°12′~135°05′E)第8次森林资源连续清查(2009—2013)中的落叶松人工纯林固定样地。经逻辑检查后共得到445 块有效样地数据。样地调查因子包括平均年龄、平均胸径以及平均高等,其中平均高是在样地中测量3~ 5 株平均木的树高取平均值得到。考虑到划分训练集和验证集可能会导致气候因子对林分生物量的解释率量化受到抽样的影响,因此本研究没有进行样本划分,各因子统计量见表1。气候因子来自ClimateAP[20],根据每个样地的地理坐标和海拔下载,气候因子变量名及其描述见表2,样地气候因子为1981 — 2010 期间的平均值。
表1 林分因子和林分生物量统计量Table 1 Summary statistics of stand variables and biomass
表2 气候因子变量名称及其含义Table 2 The name of climatic variables and its description
1.2 林分生物量计算
林分生物量使用单木生物量模型计算,然后累加得到。我国林业行业标准《LY/T 2654—2016:立木生物量模型及碳计量参数—落叶松》[4]中就提供了落叶松的单木生物量模型,对于有行业标准的伴生树种也采用行业标准中给出单木生物量模型进行计算,剩余树种则使用文献[3]和[5]中给出的单木生物量模型进行计算。
1.3 最小二乘回归与稳健回归
最小二乘是回归模型参数求解的常用方法,但如果建模数据中存在离群点且排除是数据录入错误等原因所导致的,则使用最小二乘回归可能得到的不是最优估计。而稳健回归是在剔除离群点和保留离群点之间的一个折中,根据观测值的稳健情况对每个样本点进行赋权,对应的优化目标为式(1)。
式中,wi是第i个样本对应的权重,yi为第i个样本的因变量实测值;为第i个样本的模型估计值。
本研究使用Huber 提出的稳健回归方法(式2)[19],可以看出权重估计依赖于残差分布,而残差估计又反过来需要权重。因此,稳健回归是一个迭代重复加权最小二乘直到结果收敛,获得稳健的参数估计结果的过程。
式中,wj表示第j次迭代的权函数;uj表示第j次迭代的标准化残差。
1.4 基础林分生物量模型与气候敏感的林分生物量模型的建立
董利虎等[9]指出落叶松林分生物量模型的误差结构是相乘的,本研究以式(3)~(6)作为基础林分生物量模型,分别采用最小二乘法和稳健回归法求解模型参数。因为使用对数回归来消除生物量数据的异方差,在预测时会产生偏差,曾伟生等[21]详细讨论了非线性模型对数回归的偏差矫正原理与方法,本研究采用Baskerville[22]提出的校正因子CF,对模型进行矫正。
式中,B为林分生物量,包括AGB和TGB;Dg为林分平均胸径;N为株数密度;H为林分平均高;βi(i=1~4)为模型参数;ε为误差项。
向最优基础林分生物量模型中添加气候变量,为了降低气候变量的共线性,本研究采用主成分分析和相关分析方法筛选气候变量,步骤如下:(1)对所有气候变量进行主成分分析;(2)选择因子载荷较大的气候变量;(3)通过相关分析筛选出气候变量之间相关性较低但和林分生物量相关性较高的气候变量。最后利用筛选出来的气候变量建立气候敏感的林分生物量模型。
1.5 模型评价
模型评价包括两方面:首先确保模型参数在0.05 水平下显著;其次使用决定系数(R2)、均方根误差(RMSE)、相对均方根误差(rRMSE)等指标对模型进行评价,公式见文献[23]。
1.6 各因子解释率量化
林分生物量的总解释率可被划分为:(1)独立解释的部分(a:林分因子的独立解释率,c:气候因子的独立解释率);(2)共变的部分(b),即无法确定是由哪个因子所解释的部分;(3)模型不可解释的部分(d)。计算方法如下:含林分因子和气候因子的全模型的R2即为总解释率a+b+c,且存在a+b+c=1−d的关系,最优基础林分生物量模型的R2为a+b,仅以气候因子为自变量的林分生物量模型的R2为b+c。由上述关系可计算a、b、c和d。
2 结果与分析
2.1 基础林分生物量模型优选
所有模型参数在0.05 水平下显著(表3、表4)。对于同一形式的模型,2 种方法的参数估计值略有差异,从参数符号可以看出AGB和TGB均随Dg、N和H的增加而增加,但CF没有明显的区别。从基础模型的评价指标发现,AGB模型优于TGB模型。对于AGB而言,采用直接引入变量的模型比变量组合形式的模型拟合效果要好,除5 号和6 号模型的评价指标显示出普通最小二乘回归略优于稳健回归外,其余模型均显示出稳健回归略优于普通最小二乘回归,其中模型8 的R2最高,可达0.967,稳健回归的RMSE和rRMSE要比普通最小二乘回归分别低0.046 t∙hm−2和0.085%,二者差异不大。对于TGB而言,其规律和AGB相似,所有TGB模型中,15 号和16 号模型的R2可达0.953,稳健回归的误差统计量略好一些,但比AGB模型低0.014。由于建模数据的质量较好,两种方法建立的模型没有太大差异,稳健回归的优越性没有得到充分体现,甚至普通最小二乘回归略优于稳健回归。不论是AGB还是TGB,最优基础模型形式相同,采用稳健回归的方法求得的参数略优。因此,本研究分别以模型8 和模型16 作为AGB和TGB的最优基础林分生物量模型,用于解释率的量化分解。
表3 基础林分地上生物量模型拟合与评价结果Table 3 Fitting and evaluation results of basic stand aboveground biomass model
表4 基础林分总生物量模型拟合与评价结果Table 4 Fitting and evaluation results of basic stand total biomass model
2.2 气候敏感的林分生物量模型
主成分分析表明,前3 个主成分的贡献率分别为56.0%、22.9%、16.7%,其中第一主成分中载荷大于0.3 的气候变量有:MAT,NFFD,EMT,主要是和温度有关的气候变量;第二主成分中载荷大于0.3 的气候变量有:CMD,AHM,主要是和湿热特征有关的气候变量;第三主成分中载荷大于0.33 的气候变量有:TD,EXT,MWMT,主要是和极端天气有关的气候变量。从相关分析(表5)的结果看出:AGB和TGB的结果相似,都与AHM和CMD的相关系数较高,而与其他气候因子的较低。由于AHM和CMD之间的相关系数为0.856,而AHM和林分生物量的关系更密切,因此将AHM添加到最优基础林分生物量模型中,得到气候敏感的林分生物量模型。
表5 林分生物量与部分气候变量的相关系数矩阵 Table 5 Correlation coefficient matrix between stand biomass and some climatic variables
从表6 看出,气候敏感的林分生物量模型(模型17~ 20)的参数均显著,2 种算法的参数估计结果略有差异,AGB和TGB均随AHM增加而降低,但矫正因子CF基本没有差异。根据评价指标,稳健回归稍优于普通最小二乘回归,而气候敏感的模型明显优于最优基础模型:对于AGB,模型18 与4 相比,R2提高了0.41%,而RMSE和rRMSE降低了6.85%;对于TGB,模型20 与16 相比,R2提高了0.63%,而RMSE和rRMSE降低了6.79%。这说明建立气候敏感的林分生物量在统计上是合理的,气候因子对林分生物量有显著影响,加入AHM后,模型的拟合优度提升。本研究分别以模型18 和模型20 作为AGB和TGB的最优气候敏感的林分生物量模型,用于解释率的量化分解。
表6 气候敏感的林分生物量模型拟合与评价结果 Table 6 Fitting and evaluation results of climate sensitive stand biomass basic model
2.3 林分因子和气候因子对林分生物量的影响
分别以AGB和TGB为对象,量化气候因子和林分因子对林分生物量的贡献,结果如图1 所示。对于AGB:气候因子的总解释率(b+c)为9.73%,其中独立解释部分(c)为0.40%,而林分因子的总解释率(a+b)为96.70%,独立解释部分(a)为87.37%,共变部分(b)为9.33%,二者的总解释率(a+b+c)为97.10%。对于TGB:气候因子的总解释率(b+c)为10.58%,其中独立解释部分(c)为0.60%,而林分因子的总解释率(a+b)为95.30%,独立解释部分(a)为85.32%,共变部分(b)为9.98%,二者共同解释率为95.90%。总的来看,林分因子对林分生物量的解释率很高,加入气候因子后模型解释率明显提升,但其中共变部分较大,气候因子的独立解释率不到1%。气候因子对AGB的独立解释率小于对TGB的独立解释率,说明不同组分的生物量对于气候的响应程度有所不同。
图1 林分因子和气候因子对林分生物量的解释率分解Fig.1 Explanation rate decomposition of stand and factors to stand biomass
3 讨论
本研究采用普通最小二乘法和稳健回归方法建立落叶松人工林林分生物量模型。从模型形式上看,不论是AGB还是TGB,最优基础模型的自变量均为Dg、H和N同时直接引入的方式,而采用组合变量的形式,模型精度略低,这与单木层次类似[24]。其原因是组合变量相当于对参数进行了限制,使得自变量的作用减弱。洪奕丰等[25]指出建立林分生物量模型需要多维度的自变量,而在本研究中,Dg、H和N较好的描述了林分生物量,R2在0.95以上,该结果和徐奇刚等[26]的结果一致。从生物量组分上看,林分地上生物量优于总生物量,主要是树根生物量的分布不均匀、变异性较大所导致的[27]。从方法上看,对数转换虽然是消除生物量模型异方差的有效手段[21],但没有解决离群点对模型参数估计的影响,稳健回归则对残差值较大的样本进行了多次限制,使得参数估计更加有效,但这与建模数据的质量有很大关系,如果建模数据中基本不存在离群点,稳健回归则会把每一个样本点赋予接近1 的权重,那么稳健回归和普通最小二乘回归的差异不大,对于本研究而言,由于建模数据的质量较高,虽然基于稳健回归的模型的误差统计量略小,但这种差异还不到1%,稳健回归的优势就难以发挥。另外,当前仅开发了基于线性形式的稳健回归方法,本研究没有对加性误差进行实验,更有效的手段是基于非线性形式开发稳健回归方法,对生物量模型的误差结构进行深入分析。
了解林分生物量与气候变量之间的关系才能量化气候因子对林分生物量的影响,同时有必要在大尺度范围内进行研究,才能获得较为可信的模拟结果,如果尺度太小,则气候变量的变异较小,生物量对气候的响应不能完全表达。为了避免这种不确定性,本研究以我国北方地区7 个省份的落叶松人工林作为研究对象,在大尺度上对林分生物量和气候因子之间的关系进行了探索。为了降低共线性的风险,结合主成分分析和相关分析,即能筛选出具有统计学意义的气候变量加入到林分生物量模型中,是一套合理、方便的方法。从理论上讲,气候敏感的林分生物量模型比传统的模型更好,而本研究的实验结果也证明:不论是AGB还是TGB,考虑气候影响的模型性能优于最优基础模型,这和以前的研究结果一致[12-14]。AHM是将气温和降水量相结合的一个综合指标,可用来比较温度和降水量均不同的环境下的气候对林分生物量的影响程度。本研究发现单独使用温度或降水量模拟气候对生物量的影响并不合适,温度和降水存在共同变化,从图2 可以看出生物量与气候因子之间的复杂作用关系,比如温度较高而降水量过低时,AHM比较大,此时林分生物量比较小,但是当温度和降水量同时变高或变低时,AHM可能增加也可能会降低,此时林分生物量的变化波动就比较厉害,无法用单一气候变量说明林分生物量的变化趋势,这也印证了与利用主成分分析和相关分析筛选出具有统计学意义的气候变量的重要性。气候因子的变化将会影响林木的生理过程(如光合和呼吸作用),导致生物量的积累和分配发生变化[28]。通过解释率的分解,本研究发现林分因子对林分生物量的独立解释率在87%以上,气候因子对林分生物量的独立解释率不超过0.6%,有大约10%的解释率无法确定是由哪一类因子所解释的,虽然气候因子对林分生物量的解释率不高,但对林分生物量有显著影响。同时,不同生物量组分对于气候的响应程度有所差异,说明气候等非生物因子对于生物量的影响不能被忽视,应该深入探究林分生物量多元驱动机制。
图2 林分生物量与气候因子的综合作用Fig.2 Comprehensive effect between stand biomass and climatic factors
4 结论
在建模数据质量高的情况下,稳健回归方法和普通最小二乘方法的差异不大,均可用来估计林分生物量的参数。最优基础林分地上生物量和总生物量的模型R2分别为0.967、0.953,可以对林分生物量进行很好的估计,而通过相关方法筛选气候变量,建立气候敏感的林分生物量模型能够进一步提升模型性能,模型R2分别达到0.971、0.959,可用于林分生物量精准估计。进一步分析发现:林分因子对林分生物量的独立解释率大于88%,气候因子对林分生物量的独立解释率不超过0.6%,但是二者共同解释率大于95%,因此建立林分生物量模型时不能忽视气候因子的影响,应在大尺度范围内建立气候敏感的生物量模型,以减少生物量模型的不确定性。