APP下载

运用机载LiDAR数据对橡胶林地上生物量估测的采样尺度效应分析

2020-07-03罗洪斌舒清态王冬玲

林业资源管理 2020年1期
关键词:橡胶林激光雷达样地

罗洪斌,舒清态,庞 勇,王 强,王冬玲

(1.西南林业大学林学院,昆明 650224;2.中国林业科学研究院资源信息研究所,北京 100091)

森林是陆地生态系统中的重要碳库,在全球碳循环中处于重要地位。森林生物量作为森林生产力的重要评价指标,在全球气候变化的背景下,生物量的高效监测对碳汇的研究和生态系统的保护具有重要的现实意义[1-2]。传统的森林生物量调查一般以地面实测为主,效率低、成本高,而且获取的只是小范围的一些具有代表性的数据,不利于大范围的森林生物量研究[3]。遥感技术的发展,改变了传统生物量估测小尺度、对植被具有破坏性以及不连续等局限性。为此,森林生物量遥感估测逐渐成为众多学者研究的重要内容。目前,森林生物量遥感估测主要依靠激光雷达、微波雷达、光学影像等遥感方式。其中,光学遥感很难穿透林木冠层,仅可以获取林木冠层反射率信息,无法获得树木垂直结构参数,并且对环境因素极为敏感,受大气、云层等的影响较为严重[4];微波雷达虽具有穿透性,可以获得林分三维结构信息,但容易受地形起伏的影响,极易出现后向散射信号饱和现象,在生物量较大地区也存在一定的局限性[5]。

机载激光雷达(Airborne Light Laser Detection and Ranging,LiDAR)是一种主动的遥感技术,具有强穿透性、主动性、全天候以及高精度等独特优势,现在已越来越广泛地应用于森林生物量监测和调查中。它可精准、快速地获取林分高度及垂直参数信息[6],极大地提高了森林生物量动态监测的效率和精度。早在20世纪80年代,Nelson等[7-8]研究指出,激光雷达可以用于林木高度的估测;随后,Popescu等[9]和Nsset等[10]利用机载激光雷达数提取林分高度信息和覆盖度等信息,对森林地上生物量进行估测,并取得了较好的结果。在国内,庞勇等[11]对此也进行了大量研究,证明机载激光雷达可以精确地估测森林地上生物量。

然而,研究发现,从机载激光雷达点云数据中提取植被信息时,如果采样面积过大则不能有效反映出采样区的植被信息,而取样规模较小时,则不足以产生精确的数字高程模型(DEM),从而影响森林地上生物量的估计精度[12]。其次,采样大小的选择与激光雷达数据的水平精度和GPS系统的误差也有关系[13]。为此,Luo等[12,14]利用机载激光雷达数据估测玉米生物量和热带雨林物量时,对机载激光雷达采样大小进行了研究,结果表明:5m大小的玉米方形样地对应的最佳采样尺度为3m(R2=0.838),15m半径大小的热带雨林圆形样地对应的最佳采样半径为22m(R2=0.893)。另外,Estornell等[15]还探究了不同点云密度和不同采样大小下机载激光雷达数据对灌木生物量估测精度的影响,发现点云密度大于8个/m2时估测效果最佳,0.5m半径大小的圆形样地所对应的最佳采样半径为1.5m(R2=0.73)。总而言之,利用激光雷达数据对森林地上生物量的估测精度受到采样尺度大小的影响。此外,变量参数、植被类型、地理环境和激光雷达数据不同,最佳取样大小也不同。为了提高激光雷达数据对森林参数的估计精度,必须根据研究区实际情况确定最优采样大小。

本研究以机载激光雷达飞行条带内的橡胶林地上生物量为研究对象,对21个不同尺寸大小的机载激光雷达数据进行采样,提取不同采样尺寸下的激光雷达参数,并与橡胶林地上生物量建立PLSR模型,就机载激光雷达数据采样大小对橡胶林地上生物量估测精度的影响进行研究。

1 研究区与数据

1.1 研究区概况

机载激光雷达飞行条带地处云南省景洪市,地理坐标为:21°59′26″~22°4′28″N,100°41′35″~101°0′16″E,条带总面积为118km2。研究区兼有大陆性气候和海洋性气候的优点而无其缺点,常年高温酷暑,干湿季分明,日温差较大,年温差小,年平均气温在18.6°~21.9°C之间。年平均降水量为1 200~1 700mm,年平均日照时长为1 800~2 300h。土壤以赤红壤、砖红壤为主,土层深厚,自然肥力高。植被类型主要有热带季节雨林、热带山地雨林、南亚热带季风常绿阔叶林。由于温度高、降水充沛、低风速等自然条件,成为了橡胶林的主要分布区。研究区地理位置如图1所示。

图1 研究区地理位置Fig.1 The location of study area

1.2 机载激光雷达数据

机载LiDAR数据由中国林科院的LiCHy系统(LiDAR,CCD and Hyperspectral)中的RIEGL LMS-Q680i激光雷达传感器获取,时间为2014年4月,平均飞行高度为851m,扫描角度为±30°,最大脉冲发射频率为400kHZ,点云密度为3.9个/m2。离散点云最终以LAS1.2格式存储,飞行区域长32.1km、宽3.7km,6个航带总面积为118km2。

1.3 样地数据

本研究所用的44块大小为30m×30 m的正方形样地,数据获取于2014年4月,为拟合机载LiDAR数据条带范围,在其飞行区域所覆盖范围选择不同龄级、不同生物量大小的橡胶林作为地面样地,以确保样地数据具有一定代表性。样地信息主要包括:胸径、树高、坡度、坡向、GPS定位坐标等。

2 研究方法

2.1 数据处理

2.1.1机载LiDAR数据处理

LiDAR数据处理主要分为前期处理和后期处理,数据的前期处理由数据提供商完成,数据的后期处理运用北京数字绿土公司开发的LiDAR360软件完成。首先,为激光点云数据定义坐标系以及点云去噪。其次,分离地面点和非地面点(将0~2m划分为低植被点;2~6m划分为中等植被点;6~30m划分为高植被点;30~150m划分为建筑物点),其中还包括低于地表点的分类等过程。利用分离出来的地面点生成2m×2m的数字高程模型(Digital Elevation Model,DEM)对点云进行归一化处理,即所有植被的高度都是相对于地面的高度。

2.1.2样地数据处理

橡胶林样地生物量由单株生物量汇总得到,橡胶树单株地上生物量通过唐建维等[16]提出的西双版纳地区橡胶树单株生物量模型计算得到,计算公式为:

WT=0.136D2.437

(1)

式中:WT为单株生物量(kg),D为胸径(cm)。

样地生物量概况汇总如表1所示。

表1 样地实测生物量汇总Tab.1 Summary of measured ground biomass

2.2 变量参数的提取

本研究样地大小为30m×30m,样地范围内均进行每木检尺,而未对出样地范围外的林分进行调查,因此本文仅对30m范围内激光雷达不同采样大小对生物量估测结果的影响进行研究。如图2所示,研究以样地为中心,建立了21组不同边长的正方形缓冲区作为采样边界范围(边长从10m至30m,间隔为1m),通过LiDAR360软件提取各个采样范围内的归一化点云,并根据每一个采样尺度内的归一化点云提取激光雷达变量参数。参考目前已有的研究可知,激光雷达参数中高度变量、百分位变量较多地应用于生物量的估测研究中,且效果较好。本文中使用LiDAR360自动提取激光雷达变量参数,包括高度变量参数、百分位高度变量参数共17个自变量参数(表2)。

1)高度变量参数。包括:最大高度(Hmax)、平均高度(Hmean)、高度标准差(Hstd)、高度变异系数(Hva)等4个变量。(例:Hmax为某一统计单元内,所有点Z值的最大值)。

2)百分位高度变量参数。包括(H10th,H20th,H25th,H30th,H40th,H50th,H60th,H70th,H75th,H80th,H90th,H95th,H99th等13个参数。百分位高度变量的间隔大小由软件划定,例:H10th代表植被回波点云的10%高度处的高度值。

表2 LiDAR量参数Tab.2 Variable parameter of LiDAR

图2 采样范围示意图Fig.2 Sample range schematic

2.3 统计模型及精度验证

回归模型采用偏最小二乘回归(Partial Least Squares Regression,PLSR)模型进行生物量估测,偏最小二乘回归可以克服多个机载激光雷达变量之间的多重共线性问题,且满足样本点个数较少的特点。其原理为:自变量(X1,X2,…,Xa)和单因变量Y,样本数n;由此构成自变量和因变量的矩阵X=[x1,x2,…,xa]n×a和Y=[y]n×1。分别在X与Y中提取第一对成分t1和u1。X和Y成分第一次被提取后,分别实施对t的回归,若回归方程精度达到满意的程度,则终止算法。否则X和Y对t回归后的残余信息进行下一轮成分提取,如此循环,直至满足既定的精度。在偏最小二乘回归建模过程中,自变量的筛选使用变量投影重要性指标(Variable Importance in Projection,VIP)作为选择依据,VIP值解释了自变量对因变量的重要性,如果自变量对因变量的解释能力越大,其VIP值也越大[17]。为了达到较好的建模效果,选取VIP值大于1的变量参与生物量模型的构建。

不同采样尺度下生物量估测模型的拟合效果通过决定系数(R2)、均方根误差(RMSE)作为评价指标。采用留一交叉验证(Leave One Out Cross Validation,LOOCV)对生物量估测模型进行预测评价,其原理为:使用总样本中的其中一个作为验证样本,其余的用来作为测试样本,直到每个样本都被验证一次为止。根据交叉验证的结果计算得到估计精度(P)以及均方根误差(RMSEcv)作为预测结果的评价指标。

(2)

(3)

(4)

(5)

3 结果分析

3.1 变量因子的筛选

变量因子的筛选使用SIMCA-P软件计算各个变量的投影重要性指标(VIP)值如图3所示,根据(VIP)值的大小可以看出,所提取17个备选参数中,除了高度标准差(Hstd)、高度变异系数(Hva)、百分位高度(H10th)以外,其余14个变量(Hmax,Hmean,H20th,H25th,H30th,H40th,H50th,H60th,H70th,H75th,H80th,H90th,H95th,H99th)的VIP值均在1以上。本文在其飞行区域所覆盖范围内选择不同龄级、不同生物量大小的橡胶林作为地面样地,结合林分构造以及样地调查数调查情况分析得出,样地内树高差异不明显,不同龄级之间变异程度较小,高度标准差(Hstd)、高度变异系数(Hva)、百分位高度(H10th)对生物量的影响较小,因此,选择VIP大于1的变量参与橡胶林地上生物量估测模型的构建。

图3 自变量因子的筛选Fig.3 Selection of independent variable factor

3.2 不同采样尺度下生物量估测结果对比

样地的实际大小为30m×30m,而激光雷达变量的采样大小则是从10m×10m逐渐递增,因此,根据样地面积与采样面积的比例,分别计算出各个采样尺寸大小所对应的橡胶林地上生物量(例:原始样地面积为900 m2,10m采样大小的采样面积为100m2,因此10m采样大小范围对应的生物量为原始样地的1/9),以此作为因变量。采用偏最小二乘回归(PLSR)模型,在Matlab2017b软件下分别基于21组不同采样大小下的机载激光雷达变量建立橡胶林地上生物量估测模型。通过不同采样大小下的估测结果的比较,进而确定较优采样大小。不同采样大小下的拟合结果(图4)与交叉验证结果如图5所示。

从估测结果可以看出,估测模型决定系数(R2)大小介于0.700~0.718之间;预测均方根误差(RMSEcv)介于18.874~19.556t/hm2之间;预测精度(P)介于82.117%~82.741%之间。当采样尺寸小于18m时,估测精度随着采样尺寸的增大而增大;当采样尺寸大于18m时,估测精度随着采样尺寸的增大而减小,进而趋于平缓;当采样尺寸为18m时,模型决定系数(R2)达到最大,为0.718,均方根误差达到最小,RMSE为17.830t/hm2,RMSEcv为18.874t/hm2,交叉验证精度(P)为82.741%。其次,对比实际样地尺寸(30m)和最佳采样尺寸(18m)的估测结果发现,当采样尺寸为30m时,模型的决定系数(R2)仅为0.704,均方根误差(RMSEcv)为19.380t/hm2,交叉验证精度(P)也仅为82.278%;当采样尺寸为18m时,估测模型的R2提高了1.989%,RMSEcv降低了2.611%,预测精度(P)提高了0.463%。

图4 不同采样大小下的模型精度Fig.4 Model accuracy at different sample size

注:因变量的单位为吨(t),为了更直观比较不同采样尺度下的估测效果,均方根误差(RMSE)统一转换为“t/hm2”。

图5 不同采样大小下的交叉验证结果

Fig.5 Cross-validation results at different sample size

根据估测结果变化并结合生物量的估测方法分析得出,如果采样尺寸较小,则不足以产生精确的数字高程模型(DEM),这直接影响归一化点云的高度,从而影响森林地上生物量的估计精度[12];若采样尺寸过大,则提取的变量不能真实反映样地的实际情况,导致估测精度偏低。其次,采样大小的选择与激光雷达数据的水平精度和GPS系统的误差也有关系[13]。激光雷达数据获取过程中,由于环境条件的影响,若坐标不够精确则会导致与实际样地位置不能完全匹配,此时激光雷达变量则不能完全反应样地真实情况,从而影响生物量的估测精度。因此,采样大小的选择有助于减小测量误差带来的影响,从而提高估测精度。就本研究而言,机载激光雷达对橡胶林地上生物量的估测精度受采样尺寸大小的影响,最优尺寸下的估测精度相较于实际样地尺寸下的估计精度有一定提高,结果虽然呈现出一定的规律性,但是差异并不明显。

4 结论与讨论

4.1 结论

本文就机载激光雷达采样大小对橡胶林地上生物量估测精度的影响进行了研究,对激光雷达数据进行了21个不同尺寸采样,并提取不同采样尺寸下的机载激光雷达变量,利用不同采样尺寸下的机载激光雷达变量与橡胶林地面样地数据建立PLSR估测回归模型。研究结果表明:使用机载激光雷达数据对橡胶林地上生物量估测时,估测结果受到机载激光雷达数据采样尺寸大小的影响。就本研究而言,当采样尺寸小于18m时,估测精度随着采样尺寸的增大而增大;而采样尺寸大于18m时,估测精度随着采样尺寸的增大而减小,进而趋于平缓;当采样尺寸为18m时,模型决定系数达到最大,R2为0.718,均方根误差最小,RMSEcv为18.874t/hm2,交叉验证精度(P)等于82.741%。相较于实际样地尺寸(30m)下的估测结果而言,当采样尺寸为18m时,估测模型的R2提高了1.989%,RMSEcv降低了2.611%,估计精度(P)提高了0.463%,虽然估测结果的变化存在一定的规律性,但是总体差异不明显。因此,在生物量估测过程中,需结合研究对象和研究区的实际情况对采样尺寸进行选择。

4.2 讨论

机载激光雷达数据可以准确地获取森林三维结构信息,利用机载激光雷达数据可以对森林地上生物量进行精确高效地监测。然而,采样尺寸的大小成为了一个不确定性因素,以往的研究多是以样地实际大小来确定机载激光雷达数据的采样大小,而忽略了是否在实际采样大小中获得估测结果才是最好的。因此,Luo等[12]、Streutker等[13]对不同采样尺寸下的估测效果进行了对比研究,发现由于受坐标的准确性以及机载激光雷达点云数据在不同采样大小产生的DEM准确性等因素的影响,实际样地大小对应的采样尺寸所获的估测精度不一定是最优的。其次,本研究的实测样地大小为30m,而最佳的采样尺寸为18m,说明了机载激光雷达数据对橡胶林地上生物量的估测精度受采样大小的影响,最佳的采样尺寸与Luo,Wang[12,14],Estornell[15]的研究结果并不相同。这也从侧面反映出了不同的研究区、不同的研究对象,其最优的采样尺寸也不一样。就本研究而言,利用激光雷达数据估测橡胶林地上生物量时进行采样尺寸的选择,有利于估测精度的提高。

本研究也有不足之处。首先,本文的采样大小仅在30m以内,由于未对采样边界外林分进行调查,因此采样范围没有增加,仅研究了30m范围以内机载激光雷达采样大小对橡胶林地上生物量估测精度的影响。其次,单木生物量计算公式的年份相差时间较长,PLSR生物量估测模型为线性模型,模型较为单一。

猜你喜欢

橡胶林激光雷达样地
森林资源监测地面固定样地优化研究
手持激光雷达应用解决方案
橡胶林氮肥穴施下的氨挥发和氮淋洗损失
海南橡胶林生态系统净碳交换物候特征
橡胶林
额尔古纳市兴安落叶松中龄林植被碳储量研究
法雷奥第二代SCALA?激光雷达
基于角尺度模型的林业样地空间结构分析
15 年生鹅掌楸林分生长差异性研究
基于激光雷达通信的地面特征识别技术