基于机载激光雷达的森林地上生物量估测研究
2021-11-10赵鑫
赵鑫
摘要:森林地上生物量(Above Ground Biomass,AGB)是衡量生态系统生产力的重要标志,也是研究森林生态系统物质循环的基础。本文以佩诺布斯科特森林为研究对象,选取森林的百分位密度和百分位高度作为估测森林地上生物量的特征,使用随机森林回归模型对样地的森林地上生物量进行预测。结果表明:(1)森林的生物量与高度特征相关性较强,与密度特征相关性较弱。(2)使用随机森林回归模型预测精度最高为0.83,对应的均方根误差为26.4t/ha。使用机载激光雷达数据结合随机森林回归模型对于森林生物量有较好的预测精度。
关 键 词:森林地上生物量;激光雷达;特征选择;随机森林
0引言
森林是陆地生态系统的重要组成部分,覆盖面积大约占全球陆地面积的30%;森林在陆地总初级生产量中占比75%[1]。研究表明:森林在吸收二氧化碳、调节动植物群落、水文和巩固水土方面具有显著功能。因此,如何快速、大范围的获取森林的相关指标是林业研究中的关键问题。
遥感技术自上世纪60年代兴起后,就不断被应用到各行各业中。遥感由于其数据获取方便、覆盖地理范围广、数据更新快的特点,在森林调查方面具有十分明显的优势。由其工作方式可以看出激光雷达技术能克服光学遥感存在的问题,可以获取与森林垂直结构(树高、密度等)相关的信息,并且不易受外界环境干扰[2-4]。因此,近年来学者的研究多集中在使用LiDAR数据反演森林地上生物量。
1 实验区域概况
本次研究区域为佩诺布斯科特(Penobscot)实验森林,如图1所示。在森林中,有46个用于研究的森林服务站。该地区的气候阴冷潮湿,年平均温度低于10℃,2月份是该地区最冷的季节,平均每日温度为-7.1℃,7月份是最温暖的季节,平均温度为20℃。降水量为1060mm,近一半的降水主要集中在每年的5月份到10月份之间。年降雪量为2390mm,平均年生长天数的456天。森林中的树种主要以混合针叶林为主。从1950年以来,缅因州的佩诺布斯科特森林一直是美国农业部、林业部的研究站,是北部针叶林的森林学和生态学研究基地。
2 数据与方法
2.1 实测数据介绍
(1)佩诺布斯科特实验森林的范围:
(2)样地设置介绍:
在佩诺布斯科特森林,设置了12组50m*200m的样地,每个样地又被划分成16个25m*25m的子样地。单个样地划分如图2.2示。
2.2 激光雷达数据介绍
激光雷达数据是由美国国家航空航天局戈达德飞行中心进行航飞和处理。数据采集时间为2012年6月19-21日,飞行的重叠度为30%,飞行高度为300m。部分森林区域激光雷达点云如图2.3示,依据不同的高度渲染不同的颜色,红色为地面,黄色为树木。
由图3可以看出,点云数据显然不利于处理,因此利用Fusion软件对激光雷达点云进行处理,得到百分位高度、百分位密度的森林指标信息,并以tif形式保存相应的数据。使用ArcGIS软件结合样地坐标文件和百分位高度和百分位密度数据将样地对应信息进行提取。提取结果如表2示,其中d0代表0%密度,p10代表10%高度,以此类推,stdev代表高度标准差,mean代表高度平均值。
2.3.2 随机森林回归模型介绍
随机森林属于集成学习一种方法,集成学习的思路是将多个弱模型组成一个强模型,强模型的性能要好于单个弱模型[7,8]。随机森林回归模型中使用的CART算法构建决策树。
3 实验结果与分析
Spearman相关系数筛选的变量为P80、P90、P50、P60、P70、P100、Pmean、d7、d8。利用其进行支持向量回归,数据分组与上述小節处理方式相同,分为数量不同的数据进行回归分析。结果如图4所示。
依据统计学相关性等级划分:相关系数的绝对值越大,说明解释变量和响应变量之间的相关性就越强,相关系数越接近1,表明两者存在正相关性,相关系数越接近-1,表明两者存在负相关性,相关系数在0.8-1.0范围之间表示相关性极强,在0.6-0.8范围之间表示具有强相关性,在0.4-0.6范围之间表示中等程度相关性,在0.2-0.4范围之间表示相关性较弱,在0-0.2范围之间表示相关性极弱或无相关性。故依据上述等级划分可以看出百分位高度与森林AGB都具有中等程度以上的相关性,其中P80与P90与森林AGB的的相关性最强达到0.88,其次是P50、P60、P70、P100、Pmean都与森林AGB有强相关性,相关系数均在0.8以上,P10与森林AGB的相关性相较于其他高度特征较弱。基于上述分析结果,故采取相关系数均在0.8以上的高度特征作为生物量预测模型的特征变量。密度特征整体与森林AGB相关性较低,有些特征与森林AGB甚至是负相关性,与森林AGB具有强相关性的密度特征为d7、d8,d1、d2、d3、d4、d9都与森林AGB呈现负相关性。故选取d7、d8作为生物量预测模型的特征变量。
(2)随机森林模型预测结果
由图5可以看出:(1)本次使用随机森林回归模型预测的最高精度为0.83,均方根误差最小为26.40t/ha。(2)训练集的增加有助于提升模型的预测精度,同时降低模型预测误差,但并非训练集数量越多越好,在本次实验中,训练集的大小在总训练集的65%为宜。
4结论与不足
本次实验利用激光雷达数据结合随机森林回归模型对佩诺布斯科特森林的生物量进行预测表明生物量与森林的高度特征先惯性较强,与森林的密度特征相关性弱,其次随机森林回归模型对于生物量的预测有较好的精度。
本次使用了森林的高度和密度特征,后续可以结合更多森林相关特征和机器学习方法预测生物量,不断提高生物量的预测精度。
参考文献
[1] 赵同谦, 欧阳志云, 郑华, 等. 中国森林生态系统服务功能及其价值评价[D]. , 2004.
[2] 欧光龙, 胥辉. 森林生物量模型研究综述[J]. 西南林业大学学报: 自然科学, 2020, 40(1): 1-10.
[3] 罗云建, 张小全, 王效科, 等. 森林生物量的估算方法及其研究进展[J]. 林业[4] 科学, 2009, 45(8): 129-134.
巨文珍, 农胜奇. 森林生物量研究进展[J]. 西南林学院学报, 2011, 31(2): 78-83.
Chen Q. Modeling aboveground tree woody biomass using national-scale allometric methods and airborne lidar[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 106: 95-106.
易东, 陈军, 刘岭, 等. 相关系数的正确理解和表达[J]. 重庆医学, 2011, 40(34): 3518-3519.
闫云凤. 基于决策森林的回归模型方法研究及应用[D]. 浙江大学, 2019.
郑林涛. 基于机器学习方法的珠三角地区商场空调全年负荷预测研究[D]. 华南理工大学, 2019.