基于无人机多光谱遥感的马尾松林叶面积指数估测
2021-07-30余坤勇
姚 雄 余坤勇 刘 健
(1.福建工程学院建筑与城乡规划学院, 福州 350118;2.3S技术与资源优化利用福建省高校重点实验室, 福州 350002; 3.福建农林大学林学院, 福州 350002)
0 引言
叶面积指数(Leaf area index,LAI)指单位水平地面面积上所有绿叶面积总和的一半[1],是表征森林冠层结构的重要参数,也是描述森林植被的光合作用、蒸腾作用、呼吸作用、降水截留作用和碳氮循环过程的关键参数,经常用于评价森林生产力、森林质量和森林健康状况[2-4]。马尾松(PinusmassonianaLamb.)是南方红壤区典型的造林树种,具有耐干旱耐贫瘠土壤、适应性强、生长迅速等特点,已成为南方水土流失区域荒山造林的先锋树种[5],其健康状况和长势对红壤区水土流失监测评价与治理具有重要意义。因此,准确估测马尾松林的LAI,对森林生态系统完整性以及碳氮循环过程研究尤为重要。
目前,获取林分LAI的方法有直接测量法和间接测量法[6]。直接测量法精度较高,但需要对林木进行破坏性采集,不仅费时、费力,而且选取林木不一定具有代表性,因此这种方法很难应用于大尺度、长时序的研究。间接测量法主要利用遥感技术获取植被光谱信息,进而利用模型对LAI进行估算,具有破坏性小或无破坏性、测量高效等特点。常用的遥感技术主要包括卫星遥感、地面遥感、载人机遥感和无人机遥感[7-8]。其中,无人机遥感因灵活性高、机动性强、操作简便、成本低等优势而逐渐成为精准农业和精准林业管理的又一重要技术,也是获取植被冠层表型参数的重要手段[9-11]。现有研究促进了无人机遥感技术在植被LAI估测中的应用,但也存在以下不足:对于无人机影像空间分辨率的选择缺乏统一标准,具有一定的随意性,这给植被LAI估测模型推广带来一定困难;利用经验统计模型、机器学习模型和物理模型反演植被LAI,并通过一种方法或两种方法建模,而采用多种方法进行对比分析的相关研究还比较少。目前,国内外利用无人机遥感技术进行植被LAI的估测研究主要集中在农作物上,而针对森林的研究还鲜见报道[11],尚未见关于马尾松林LAI无人机遥感估测的相关研究。因此,探讨不同模型下不同空间分辨率影像对马尾松林LAI估测精度的影响,对精准林业管理和森林冠层表型参数遥感估测技术规范的制定具有重要意义。
本文以无人机搭载的多光谱传感器为平台,获取马尾松林光谱信息,选取相关性高的植被指数,运用多种方法分别构建不同空间分辨率下的LAI估测模型,比较分析各模型的估测精度,从而得到最佳模型和最佳空间分辨率,为无人机影像空间分辨率的选择提供理论依据,以支撑精准林业中森林冠层表型参数无人机遥感估测。
1 材料与方法
1.1 研究区概况
研究区位于福建省西部的长汀县河田镇(25°33′~26°48′N、116°18′~116°31′E),如图1所示。该区属于典型的中亚热带季风气候,年平均降雨量为1 621 mm,其中一半以上的降雨量集中在4—6月,年平均气温为19℃,年平均无霜期为260 d;土地利用现状以林地为主,森林覆盖率超过70%,优势树种是马尾松,约占森林面积的80%。试验地为马尾松纯林,林龄35 a,林分密度约1 800株/hm2,平均树高小于8 m,平均胸径小于10 cm,较好地代表了南方红壤水土流失区马尾松人工林现状,适合森林LAI无人机遥感估测试验的开展。
1.2 叶面积指数采集
2018年4月在试验地布设了72个10 m×10 m样方,在每个样方中心点附近测量LAI。借助LAI-2200型植物冠层分析仪(Li-COR Inc., Lincoln, NE,美国)采用1A4B方式测定LAI,即选用90°遮盖帽在离地1.5 m处顺序测量1次样方外空旷处A值和4次样方B值,测量结束后,仪器自动根据朗伯-比尔定律计算并记录LAI;测量同时,利用集思宝手持式GPS定位仪记录该中心点的坐标。为了减少误差,每个样方中心点重复测量3次,取其平均值作为该点的LAI,共获取72组LAI数据。
1.3 无人机影像数据获取及预处理
采用云上晴空公司生产的WG-18型无人机平台搭载美国MicaSense公司生产的RedEdge多光谱传感器进行试验地遥感影像的获取,获取时间为2018年4月。该传感器包含5个通道:蓝光通道(中心波长475 nm)、绿光通道(中心波长560 nm)、红光通道(中心波长668 nm)、红边通道(中心波长717 nm)、近红外通道(中心波长840 nm)。飞行前,利用传感器配套的白板进行校正。飞行时,航高设置为120 m,航向和旁向重叠率均设置为80%,航行速度设置5 m/s。为降低影像数据受阳光直射效应的影响,选择无风且阳光充足的时间段(11:00—14:00)进行影像数据采集。采用Pix4D Mapper和ERDAS软件对无人机获取的数据进行影像拼接和波段融合,首先将无人机采集的各波段影像数据和标准定标板数据导入Pix4D Mapper软件中进行辐射校准并生成单波段拼接影像,然后利用ERDAS对拼接后的单波段影像进行波段融合,融合后的影像空间分辨率为0.08 m。
1.4 植被指数选择与提取
植被指数是由遥感数据多种波段经线性和非线性组合而成的遥感产品,相比于单波段数据,植被指数可以更有效地度量地表植被长势、生物量和覆盖度等指标。目前常用的植被指数中,归一化植被指数是应用最广泛、最简单的植被指数,可用于区域植被覆盖度和植被生理参数的检测,比值植被指数可用于生物量估算,修正型土壤调整植被指数降低了土壤背景对植被的影响。此外,不少研究者利用植被指数进行森林LAI估算,如傅银贞等[12]分析了马尾松林LAI与7种植被指数的相关性,并进行回归分析,结果表明,转换型归一化差值植被指数和归一化植被指数对马尾松林LAI具有较好的预测性;董立新[13]基于7种常用植被指数和5种自定义植被指数对三峡库区阔叶林、针叶林和混交林的LAI进行估算,3种森林类型的LAI估算模型的决定系数R2均达到0.77以上。因此,本文借鉴相关研究者的研究结果,选择8种对LAI变化敏感的植被指数:绿色归一化植被指数(GNDVI)[14]、绿色比值植被指数(GRVI)[15]、修正型土壤调整植被指数(MSAVI)[16]、归一化植被指数(NDVI)[17]、再归一化植被指数(RDVI)[18]、比值植被指数(RVI)[19]、冠层结构不敏感植被指数(SIPI)[20]、可见光大气修正植被指数(VARI)[21]。
为了分析无人机影像空间分辨率对马尾松林LAI估算结果的影响,本文将原始无人机影像数据进行重采样。考虑到试验地的马尾松平均冠幅小于5 m,因此设置原始影像重采样为空间分辨率分别为0.1、0.2、0.5、1、2、5 m,并借助ERDAS软件中的建模工具,根据植被指数的计算公式分别提取不同空间分辨率下的植被指数。
1.5 模型构建方法
研究采用经验统计模型(一元回归模型和多元逐步回归模型)和机器学习模型(神经网络模型、支持向量机模型和随机森林模型)建立不同空间分辨率的马尾松林LAI无人机估测模型。
一元回归模型用于表示预测项目(LAI)与单个预测因子(植被指数)之间的关系。本文利用Matlab R2014b建立LAI的线性回归(Linear regression,LR)、对数、指数和乘幂模型。
多元逐步回归分析(Multiple stepwise regression,MSR)的基本思路是:将所有植被指数按照其对LAI影响的显著程度,从小到大依次排序,每一步选一个最显著的植被指数进入回归方程。首先,将最显著的植被指数引入回归方程组成一元回归方程。其次,从剩下的植被指数中选择最显著的植被指数引入回归方程中,并对回归方程中的所有植被指数进行显著性检验。如果植被指数显著,则留在回归方程中;反之则移除,直至回归方程中的植被指数均对LAI的作用显著。如此反复选取,直至最后再无显著的植被指数可以引入,同时回归方程中也没有作用不显著的植被指数需要移除[22]。采用Matlab R2014b构建MSR模型。
反向传播(Back propagation,BP)神经网络模型是RUMELHART和MCCELLAND[23]提出的一种基于误差反向传播算法的多层前向型神经网络算法,是目前应用最广泛的神经网络模型。本文BP模型结构采用输入层、单层隐藏层和输出层3层网络结构,通过交叉验证优化得到输入层到隐藏层的传递函数为tansig、隐藏层到输出层的传递函数为purelin、训练方法为LM算法、学习率为0.01、迭代次数为200的误差反向传播模型。本文采用Matlab R2014b构建BP模型。
支持向量机模型(Support vector machine, SVM)是VAPNIK[24]基于统计学习理论,依据Vapnik-Chervonenkis理论和结构风险最小化理论提出的解决最优解问题的机器学习算法。SVM的基本思想是把训练样本通过非线性变换映射到高维特征空间,然后通过多种算法训练解算高维特征空间中的最优超平面。目前,SVM已被广泛应用于LAI反演研究[25-26]。SVM预测的核心问题是确定核函数和模型相关参数。研究利用R软件中的e1071软件包进行参数优化并构建SVM,最终选择核函数为高斯核函数,惩罚因子C为7.2,核函数参数γ为0.042 1。
随机森林(Random forest,RF)模型是BREIMAN[27]于2001年提出的一种基于分类回归树的集成学习方法。它可以用来处理分类和回归问题。RF回归的主要思想是从n个原始训练集中应用自助法有放回的随机抽取k个样本,并由此生成k个决策树建模结果,根据所有决策树的建模结果,取其平均值得到最终预测结果。RF预测精度依赖于森林中决策树的数量ntree和分割节点的随机变量数mtry。本文通过误差分析及反复试验,选择模型参数ntree为500、mtry为3构建RF模型。本文采用R软件中的randomForest软件包构建RF模型。
1.6 模型精度评价
为了检验模型的精度,采用保留样本交叉检验方式将72个样本数据按照2∶1的比例随机划分为建模集(48个)和检验集(24个)。建模集用来构建LAI估测模型,检验集用来评价估测模型的精度。采用决定系数(R2)、均方根误差(Root mean square error,RMSE)、相对分析误差(Residual predictive deviation,RPD)、总体精度(Total accuracy,TA)对LAI预测模型的精度进行评价[1]。R2、RPD和TA越大,RMSE越小,说明模型的预测精度越高。
2 结果与分析
2.1 叶面积指数与植被指数的相关性分析
利用48个建模集实测的LAI,分别与7个不同空间分辨率下计算的遥感植被指数进行相关性分析,结果见表1。由表1可知,不同空间分辨率下LAI与8种植被指数均呈极显著相关(p<0.01),且它们的相关系数均大于0.4。从植被指数来看,RVI与LAI的相关系数在不同空间分辨率中均最大,相关系数均大于0.6,且最大达到0.819。从影像分辨率来看,LAI与植被指数的相关系数整体上呈现先增大后减小的趋势,并在空间分辨率为5 m时,相关系数大幅降低;在0.08 m和0.1 m空间分辨率的尺度下,各植被指数的相关系数由大到小依次为RVI、NDVI、VARI、SIPI、GNDVI、MSAVI、RDVI、GRVI。本文所选8种植被指数均能较好地反映马尾松林LAI的变化情况,可用来建立马尾松林LAI遥感反演模型。
表1 不同空间分辨率影像植被指数与LAI的相关系数
2.2 叶面积指数单变量模型分析
基于48组建模集数据,共建立了不同空间分辨率尺度下的224种单变量模型,各模型的R2见表2。从表2中可知,在空间分辨率为0.5 m时,基于RVI构建的LAI线性模型的R2最高(0.671);在空间分辨率为5 m时,基于VARI构建的LAI乘幂模型的R2最低(0.157)。从模型类型来看,LAI单变量模型的R2平均值由大到小依次为线性(0.487)、对数(0.457)、指数(0.455)、乘幂(0.432)。从植被指数来看,LAI单变量模型的R2平均值由大到小依次为RVI(0.587)、NDVI(0.540)、VARI(0.507)、SIPI(0.463)、GNDVI(0.397)、RDVI(0.384)、GRVI(0.382)。从空间分辨率尺度来看,LAI单变量模型的R2平均值由大到小依次为0.5 m(0.501)、0.1 m(0.500)、1 m(0.499)、0.2 m(0.498)、0.08 m(0.497)、2 m(0.437)、5 m(0.270)。此外,在同一空间分辨率尺度下,基于RVI构建的LAI线性估测模型均比其他模型的R2高。
表2 不同空间分辨率下单变量LAI估测模型的R2
2.3 叶面积指数多变量模型分析
表3为不同空间分辨率尺度下LAI多变量估测模型的调整R2。由表3可知,在空间分辨率为0.5 m时,基于RF算法建立的LAI估测模型的调整R2最高(0.766),比单变量R2最高值(0.671)提高了14%;在空间分辨率为5 m时,基于MSR模型构建的LAI估测模型的调整R2最低(0.401),但比单变量R2最低值(0.157)增加了0.244。从模型类型看,LAI多变量模型的调整R2平均值由大到小依次为RF(0.695)、SVM(0.683)、BP(0.670)、MSR(0.668)。从空间分辨率尺度来看,LAI多变量模型的调整R2平均值均比单变量模型高,说明LAI多变量模型比单变量模型的建模精度高,对应的调整R2平均值由大到小依次为0.5 m(0.744)、0.08 m(0.739)、0.2 m(0.729)、1 m(0.726)、0.1 m(0.725)、2 m(0.631)、5 m(0.459)。
表3 不同空间分辨率下多变量LAI估测模型的调整R2
2.4 马尾松林叶面积指数遥感反演模型比较分析
基于24组检验集数据,利用单变量最优模型(即线性模型)和4个多变量模型,得到不同空间分辨率尺度下5个模型的LAI估测数据,通过与野外实测LAI数据比较分析,评价不同空间分辨率尺度下不同模型的预测性能,结果见图2。由图2可知,除BP算法外,其余模型整体上在空间分辨率尺度为0.08~0.5 m内变化幅度不大,而在空间分辨率尺度为1~5 m范围内整体上呈急剧下降的趋势;当空间分辨率尺度为0.5 m时,RF算法的R2最高,达到0.554。均方根误差RMSE的变化趋势与R2相反,即模型RMSE在空间分辨率尺度为0.08~0.5 m内随着分辨率的增大其值变化幅度较小,随着空间分辨率尺度的进一步增大,其值整体上呈增加的趋势;当空间分辨率尺度为0.5 m时,RF算法的RMSE最低,仅为0.421。模型相对分析误差和总体精度的变化规律与R2较为一致,即在空间分辨率尺度为0.5 m时,RF算法的模型相对分析误差最高(1.523),总体精度达到最大,最大值为81.95%。由此可知,空间分辨率尺度为0.5 m时RF模型得到的反演结果较为理想。
研究表明,利用无人机影像数据进行林地LAI遥感反演时,影像空间分辨率尺度并非越高越好,在选择合适的预测因子和模型前提下,空间分辨率尺度的选择对保证LAI的反演精度至关重要,因而在进行林地LAI无人机遥感反演时,需根据树种类型以及叶片和冠幅大小选择合适的空间分辨率影像。
2.5 马尾松林叶面积指数空间分布
根据前文分析结果,研究采用0.5 m空间分辨率尺度下的RF模型进行马尾松林LAI的空间反演(图3)。从图3中可以看出,试验地LAI在0~4.35之间,平均值为1.46,且大部分区域的LAI在0~2之间;中部区域的LAI普遍低于西南部区域的LAI,可能原因是2017年7月课题组在中部区域进行了一次马尾松目标树采伐作业,加上多次的外业工作,破坏了林下植被覆盖状况,导致植被较为稀疏,从而使该区域的LAI低于西南部的LAI。由此可知,基于0.5 m空间分辨率下的RF模型能够较好地还原马尾松林LAI的分布格局。
3 讨论
目前,利用无人机多光谱成像仪进行植被参数的反演研究,主要通过提取植被指数建立经验统计模型或机器学习模型进行植被参数的估测,不同研究区、植被类型和估算方法得到的研究结果基本一致[28-31],但精度有一定差异。本文利用LR、MSR、RF、SVM、BP共5种方法构建了马尾松林LAI无人机估测模型,通过对比分析发现,基于多变量模型(MSR、RF、SVM、BP)的LAI估测精度普遍优于单变量(LR)模型,这与多变量模型中多种自变量比单变量模型能更全面挖掘遥感数据信息有关。这与文献[32]利用单变量模型和多变量模型进行阔叶林、针叶林、针阔混交林等林地LAI的研究结果一致。除BP模型外,其他4种模型的决定系数R2均在空间分辨率为0.5 m时达到最高,且随着空间分辨率的变化,对应的R2均降低,并在空间分辨率为5 m时降至0.4以下。其原因主要是LAI反映了单位水平面积上绿叶总叶面积的一半,在影像空间分辨率较高(0.08~0.2 m)的情况下,可能会出现马尾松叶簇完全包含整个像元的现象,此时基于间隙率计算的LAI较易失真,从而降低模型的R2;而在空间分辨率越来越低(1~5 m)的情况下,可能由于像元中存在的混合信息越来越复杂,导致模型的估测性能下降。这与文献[33]利用无人机影像进行玉米冠层的LAI、叶绿素含量的研究结果基本一致。
在空间分辨率较高时,RF模型的检验精度均最高,主要原因是RF模型对自变量共线性问题不敏感,且不需要检验变量的正态性和独立性,加上该模型在回归分析过程中进行了两次随机抽样,其预测结果不是某一个回归方程的预测结果,而是多个预测值的平均值,可有效提高模型的精度。尽管BP模型在建模集中的调整R2均高于LR模型,甚至在空间分辨率为0.2 m时的调整R2高于SVM和RF模型,但BP模型在检验集中的预测精度普遍低于其他4种模型。造成BP模型预测精度较低的原因可能是该模型在建模集训练过程中学习能力过强或模型陷入局部最优解,导致学习模型未能有效包含建模集的内在规律,从而造成模型在检验集中的泛化能力较弱[1]。在空间分辨率较低时,可能由于单个像素中含有的混合信息较复杂,导致5种模型的估测精度均较低。
需要指出的是,本文建模集和检验集中LAI估算模型的R2最高值均低于0.800,精度相对比较低,造成此现象的原因可能是试验地地形因素的限制,加上地面实测点不足且比较集中,弱化了实测点之间的空间异质性。此外,研究采用的是LAI-2200型植物冠层分析仪以自下向上测定LAI,即通过5个天顶角方位(7°、22°、38°、52°、68°)综合观测冠层空隙率结合朗伯-比尔定律获取LAI,而无人机采样角度(本次是垂直拍摄)以自上向下观测方式仅能获取顶部冠层光谱信息,两者之间必然存在误差。再者,基于光谱信息构建的植被指数在反演LAI时容易出现光谱信息“饱和”现象,从而影响模型估测精度。有研究表明,在光谱信息的基础上引入纹理特征信息可以显著提高LAI或其他植被参数的估算精度[8,34]。后期将改进这些问题,引入多角度信息、纹理特征和地形变量等,以获取更加精确的估算结果。研究仅对试验地的马尾松林进行了LAI估测研究,最佳分辨率为0.5 m,接近于试验地马尾松林平均冠幅半径的一半,因此利用无人机影像反演林分LAI的最佳分辨率可能与林分冠幅大小或叶片大小存在相关性。后续工作将进一步确定利用无人机影像估算其他林分植被LAI的合适空间分辨率,以验证本文研究结果的普适性程度。
4 结论
(1)在不同空间分辨率尺度下选取的植被指数与马尾松林LAI均呈极显著相关,相关系数均大于0.4,且7个空间分辨率尺度中RVI与LAI的相关性最高。
(2)构建LAI和植被指数之间的单变量模型(线性、对数、乘幂、指数模型)和多变量模型(MSR、BP、SVM、RF模型),对建模样本的R2进行对比分析,结果表明,4种多变量模型的调整R2平均值均比单变量模型高,其中基于RF模型建立的LAI估测模型在空间分辨率为0.5 m时调整R2最高,达0.766。
(3)用LR、MSR、RF、SVM、BP共5种模型估算不同空间分辨率下的马尾松林LAI,研究无人机影像空间分辨率对LAI估测精度的影响,研究表明,选择最优的估算模型和空间分辨率才能得到高精度的估测结果,空间分辨率为0.5 m时RF模型的估测效果最佳,可作为水土流失区域马尾松林LAI监测的主要模型。