应用空间格网化法估算森林碳储量1)
2024-05-11王晓红辛守英马明浩王艺琳焦琳琳
王晓红 辛守英 马明浩 王艺琳 焦琳琳
(华北理工大学,河北·唐山,063210)
森林作为地球上最重要的陆地生态系统之一,在全球碳循环与气候调节中起着至关重要的作用[1-2]。森林碳储量是指通过光合作用将大气中的二氧化碳转化为有机碳,并储存在植物组织中的总量,是评估森林生态系统健康状态和碳循环的关键指标之一。人工林是森林的重要组成部分,通过造林、抚育等活动可以提高森林固碳量,推进区域林业碳汇不断发展。因此,准确估算人工林碳储量是区域甚至全球碳循环的重要内容,对制定应对气候变化策略,统筹区域生态-经济-社会协调发展具有重要作用[3]。
目前,估算森林碳储量的方法主要包括采样调查法和遥感估算法。其中,森林资源规划设计调查数据(即森林资源二类调查数据)的方法作为一种极其重要的碳储量估算方法,依赖于林班的蓄积量和森林碳储量转换参数进行森林碳储量估算,其估算结果能够为遥感估算法提供准确的地面采样调查数据[4]。然而,森林资源二类调查数据更新周期较长,滞后性明显,且不能直观短周期反映森林碳储量。为此,引入空间格网化方法[5]进行森林碳储量的估算,该方法将空间连续的森林资源二类调查矢量数据划分成为规则的格网单元,并对每个格网单元内的属性信息进行提取和分析,最终实现对区域森林碳储量的整体性估算。空间格网化方法估算森林碳储量的方法能够克服传统采样调查法的信息缺失,并在保证准确估算的前提下更及时地反映森林碳储量及其空间分布。此外,由于不同树种间的碳储量估算参数存在较大差异,分树种进行森林碳储量估算能够提高森林碳储量的估算精度[6]。因此,使用空间格网化方法进行森林碳储量估算时,应该充分考虑不同树种的特征与差异,并调整和应用不同树种的碳储量估算参数,保证空间格网化的森林碳储量估算的准确性。
河北塞罕坝机械林场(以下称塞罕坝林场)是中国最大的人工林林场,承担着京津冀乃至华北地区的水源涵养、水土保持和碳循环的重要功能[7]。目前,对该林场碳储量的估算研究,大都集中在单一树种林班区域碳储量的估算。张田田[8]、邢娟等[9]、张乃暄等[10]分别对塞罕坝林场的华北落叶松、樟子松、云杉树种的碳储量进行了估算。而对塞罕坝林场森林碳储量的整体性评估的研究相对较少。因此,本文以塞罕坝林场为研究对象,探究分树种的空间格网化方法在森林碳储量估算应用中的适用性及优越性,结合塞罕坝林场二类调查数据,对该林场内主要优势树种进行碳储量整体性估算,为区域森林碳储量估算、森林资源管理和应对气候变化的决策提供重要的技术支撑。
1 研究区概况
研究区位于河北省承德市围场满族蒙古族自治县最北部的塞罕坝林场(116°53′30″E~117°49′50″E,41°5′N~42°2′30″N)(见图1)[11]。塞罕坝林场面积92 634.7 hm2,海拔1 010~1 940 m,年均气温为-1.3 ℃,年均降水日134 d,年均降水量479 mm,其中6—8月降水量明显集中,占全年降水量的67.6%,该地区属于寒温带大陆性季风气候。林场丰富的土壤类型和复杂的气候,孕育了丰富的植物种群,有森林、草原、草甸、灌丛等。其中,林场的林业资源丰富,以人工林为主,森林覆盖率达80%以上,主要优势树种有华北落叶松(Larixgmeliniivar.principis-rupprechtii(Mayr) Pilger)、白桦(BetulaplatyphyllaSukaczev)、樟子松(Pinussylvestrisvar.mongholicaLitv.)、蒙古栎(QuercusmongolicaFisch. ex Ledeb.)和云杉(PiceaasperataMast.)等。
地图矢量文件审图号为GS(2019)1822号;高程数据来源于地理空间数据云网站(https://www.gscloud.cn/search)。图1 研究区
2 研究方法
2.1 数据资料
本研究采用塞罕坝林场的森林资源二类调查数据(以下称二类调查数据),调查因子主要包括林班、林龄、郁闭度、亩株数、亩蓄积量、小班面积、优势树种等。根据二类调查数据的优势树种与小班面积属性汇总,有林地面积占林场面积的85.24%,其中,华北落叶松林面积为41.04%、白桦林面积为17.18%、樟子松林面积为15.80%、蒙古栎林面积为3.91%、云杉林面积为3.55%、其他林种面积为3.76%。二类调查数据未涉及枯枝落叶层、林下层、土壤层等数据的调查,因此本研究仅对森林地上碳储量进行估算(以下称为森林碳储量)。选取塞罕坝林场的华北落叶松、白桦、樟子松、蒙古栎、云杉的优势树为研究对象,对塞罕坝林场主要优势树种的森林碳储量进行整体性估算。主要优势树种及非林地在林场的空间分布见图2。
图2 塞罕坝林场主要优势树种及非林地的空间分布
2.2 空间格网化
格网化已有多种成熟的算法和误差分析的方法,但考虑到格网化的工作量、数据量和实用性,结合二类调查数据的特点进行空间格网化。根据二类调查数据提取林场边界范围,按照不同尺度大小将林场矢量范围划分出规则形状的格网,并用已提取的范围边界切割格网,并使生成的格网全部落在边界范围内。提取格网的几何中心点作为格网的代表即格网中心,在二类调查矢量图上进行叠置分析,获取相关属性参数到格网中心,并将获取的参数划分成格网中心的蓄积量和格网中心的其他参数。将格网中心的蓄积量经相关参数转化格网中心的碳储量,与格网中心其他参数进行数据合并,合并的数据按照8∶2的比例划分成训练集和测试集(见图3)。
图3 空间格网化流程
2.3 格网中心碳储量估算
根据格网中心提取的森林蓄积量,经过蓄积量-生物量转换模型和生物量-碳储量转换模型[12]的转化计算得到格网中心的森林碳储量。根据目前关于森林清查数据估算森林碳储量的研究结果,森林生物量与森林蓄积量之间存在着良好的线性回归关系[13-14]。因此,格网中心的森林生物量是根据格网中心提取的森林蓄积量,采用生物量-蓄积量转换模型进行估算[15],具体的公式如下:
Bj=ajVj+bj。
式中:Bj表示第j种森林类型单位面积森林生物量;Vj表示第j种森林类型单位面积森林蓄积量;aj、bj为j种森林类型回归参数。
在aj和bj回归参数中,使用邱梓轩[16]利用第六到第八期全国森林资源清查数据,研建的我国41种主要乔木树种蓄积量-生物量转换模型参数,选取符合塞罕坝林场的5种主要优势树种的转换模型参数(见表1)。在回归参数中,对没有明确生物量-蓄积量转换模型参数的主要优势树种采用近似树种参数代替。
表1 塞罕坝林场主要优势树种生物量回归参数
根据以往关于生物量-碳储量转换模型研究的相关文献,森林生物量与森林碳储量之间存在明显的正比例关系[17],因此,生物量-碳储量转换模型的公式如下:
Cj=BjCc。
式中:Cj表示第j种森林类型的单位面积的森林碳储量;Cc表示不同森林类型对应的含碳率。
目前国内大多数研究采用0.5或0.45作为平均含碳率来推算森林碳储量存在较大差异,仅采用统一固定的含碳率推算碳储量会导致估算精度降低。因此,本研究同样采用中国陆表乔木林碳储量和碳汇估计模型的含碳率[16],没有涉及的主要优势树种的含碳率,参考相近树种的含碳率进行代替(见表2)。
表2 塞罕坝林场主要优势树种的含碳率
2.4 贝叶斯优化随机森林回归算法
采用随机森林回归算法(RF)是一种集成算法,由多个决策树组成,既能减少单棵树的过拟合风险,又能提供更稳定的回归结果,被广泛应用于非线性模型回归预测[18]。贝叶斯优化随机森林回归算法是将Python软件的Scikit-learn机器学习库中的随机森林模块与贝叶斯优化器(BO)结合完成随机森林回归算法的超参数优选[18],消除人为调整参的影响,最终实现最优超参数下的BO-RF森林碳储量估算(见图4)。
图4 贝叶斯优化随机森林回归算法
BO-RF森林碳储量估算模型的精度评价,为了减少因划分训练集和验证集对估算结果造成的偶然性误差,随机选择80%的格网中心用于森林碳储量估算模型的构建,其余20%的格网中点用于模型精度评价。考虑到碳储量估算模型受多种因素的综合影响,本文选择的评价指标有决定系数(R2)、偏差(BIAS)、均方根误差(RMSE)、相对偏差(BBIAS)、相对均方根误差(RRMSE),具体计算公式如下:
2.5 森林碳储量空间统计及其精度验证
森林碳储量空间统计是分树种将格网中心估算碳储量,利用ArcGIS软件的反距离加权插值方法对格网中心估算碳储量进行空间插值[19],以此完成各主要优势树种估算碳储量的空间统计。为了满足以亩为单位估算碳储量的需求,将空间插值数据重采样为像元边长25.819 8 m×25.819 8 m的栅格数据,再经像元统计完成各主要优势树种碳储量的整体性估算;并与二类调查数据的林班数据的蓄积量及对应参数计算得到的各主要优势树种整体性碳储量进行对比研究,分析其碳储量空间统计的估算精度。
3 结果与分析
3.1 主要优势树种数据的空间格网化
由表3可知,以塞罕坝林场的二类调查矢量数据和边界数据为基础,通过ArcGIS软件的创建渔网工具按照林场边界数据范围分树种划分出规则形状的格网,利用边界数据切割格网,使生成的格网全部落在主要优势树种边界数据的范围内。为了满足二类调查数据中以亩为单位进行调查的森林蓄积量的需求,按边长为3×3、5×5、7×7、9×9等4种不同格网尺度进行空间格网化,并以格网的几何中心作为边长为25.819 8 m和面积为666.7 m2的格网中心,即按照77.459 4 m×77.459 4 m、129.099 0 m×129.099 0 m、180.738 6 m×180.738 6 m和232.378 2 m×232.378 2 m格网边长进行空间格网化,不同格网尺度分树种提取的格网中心点数。
表3 塞罕坝林场不同格网尺度不同优势树种的格网中心
由图5可知,根据4种不同格网尺度的格网中心,使用ArcGIS软件的叠置分析工具分树种在二类调查矢量数据上进行叠置分析获取林龄、郁闭度、株数、蓄积量属性参数到格网中心,并将格网中心蓄积量通过蓄积量-生物量转换模型和生物量-碳储量转换模型的转化参数换算得到格网中心碳储量,进而完成对塞罕坝林场4种不同格网尺度不同优势树种的格网中心碳储量的空间分布。
图5 塞罕坝林场不同格网尺度不同优势树种格网中心的空间分布
3.2 不同格网尺度主要优势树种格网中心碳储量的估算
由表4可知,根据格网中心的林龄、林龄、株数、郁闭度以及格网中心碳储量参数进行塞罕坝林场森林碳储量的估算,其中,3×3、5×5、7×7和9×9等4种不同格网尺度的主要优势树种碳储量的BO-RF模型估算精度。不同格网尺度主要优势树种碳储量模型中,以3×3和5×5两种格网尺度的主要优势树种碳储量估算模型的华北落叶松、白桦、樟子松、蒙古栎、云杉的决定系数(R2)均已超过0.8;偏差、相对偏差、均方根误差、相对均方根误差也都表现较优。此外,考虑到格网中心碳储量估算模型的数据量、计算量和森林资源调查实用性,结合二类调查数据的特点,最终采用5×5格网尺度的主要优势树种碳储量估算模型对塞罕坝林场总体碳储量的估算,能够很好平衡格网间距与估算精度的相互关系。
表4 塞罕坝林场不同尺度主要优势树种的碳储量估算精度
3.3 5×5格网尺度主要优势树种格网中心碳储量的估算精度评价
由图6可知,在5×5格网尺度主要优势树种碳储量估算模型的精度评价中,华北落叶松、白桦、樟子松、蒙古栎、云杉主要优势树种估算模型的实测碳储量与预测碳储量的决定系数(R2)均在0.8以上,具体分别为0.910、0.887、0.956、0.864、0.913。因此,BO-RF的碳储量估算模型对不同树种的林龄、株数、郁闭度与格网中心碳储量参数之间具有很好的拟合效果,适宜塞罕坝林场主要优势树种森林碳储量估算的需求。
图6 塞罕坝林场5×5格网尺度主要优势树种碳储量估算模型拟合效果
3.4 主要优势树碳储量空间统计和估算精度验证
由图7可知,根据华北落叶松、白桦、樟子松、蒙古栎、云杉格网中心估算的碳储量,利用ArcGIS软件的反距离加权插值方法进行空间插值,完成主要优势树种碳储量空间插值后的空间分布和塞罕坝林场总体森林碳储量的估算。
图7 塞罕坝林场主要优势树种碳储量的空间分布
由表5可知,各主要优势树种碳储量估算的精度均超过99%,塞罕坝林场的整体性实测碳储量与预测碳储量之差21 958.83 t。说明分树种进行空间格网化方法能够以较高的精度对塞罕坝林场主要优势树种碳储量的整体性估算。
表5 塞罕坝林场主要优势树种碳储量的整体估算结果
4 结论与讨论
本研究根据塞罕坝林场的二类调查数据,通过空间格网化方法,将二类调查数据的林龄、株数、郁闭度、蓄积量参数提取至不同尺度的格网中心,通过蓄积量-生物量转换模型和生物量-碳储量转换模型的转换参数,将格网中心的蓄积量换算为碳储量,采用Python软件的BO-RF算法进行建模估算和ArcGIS软件的反距离加权插值方法进行空间统计,选择精度较高森林碳储量估算的格网尺度,对塞罕坝林场的主要优势树种碳储量的整体性估算。
塞罕坝林场的3×3、5×5、7×7、9×9等4种格网尺度中,以3×3、5×5格网尺度的主要优势树种碳储量估算模型的精度表现较佳,华北落叶松、白桦、樟子松、蒙古栎和云杉的决定系数(R2)均在0.8以上,偏差、相对偏差、均方根误差和相对均方根误差也都表现较优。其中,5×5格网尺度主要优势树种的BO-RF的碳储量估算模型对塞罕坝林场5种主要树种的林龄、株数、郁闭度与格网中心碳储量的拟合效果明显,决定系数(R2)分别为0.910、0.887、0.956、0.864、0.913,能够很好地处理数据量、计算量和森林资源调查实用性的相互关系。主要优势树种的格网中心估算的森林碳储量,通过ArcGIS软件的反距离加权插值方法进行空间插值实现空间分布,经像元统计得到主要优势树种的整体性碳储量空间统计,与林班直接估算的整体性碳储量对比分析,塞罕坝林场碳储量整体性估算的精度99%以上,林场整体性实测碳储量与预测碳储量之差21 958.83 t。因此,分树种的空间格网化方法能够有效地森林碳储量的整体性估算。
塞罕坝林场的二类调查数据仅对活立木本身进行了调查,缺少枯枝落叶层、林下层、土壤层等数据的调查,因此对塞罕坝林场主要优势树种森林碳储量的估算有一定程度的偏低[20]。本研究所用蓄积量-生物量转换模型和生物量-碳储量转换模型的参数,主要来自于区域和国家尺度森林碳储量估算研究的文献。若能开展研究区实地的森林碳储量转换参数测定,这将有利于提高结果的适用性与准确性[21]。分树种的空间格网化方法对森林碳储量估算模型的构建具有一定的现实意义,有利于节省人力和财力,缩短森林资源调查的更新周期[22]。随着遥感方法在林业资源监测方面的广泛应用,遥感技术与二类调查数据结合将成为今后不同区域尺度森林生物量、碳储量估算的重要途径[23-24]。