基于PROSAIL模型和无人机高光谱数据的冬小麦LAI反演
2022-12-09李天驰冯海宽田坤云杨福芹杨佳琪
李天驰,冯海宽,田坤云,杨福芹,杨佳琪
(1.天津科技大学海洋与环境学院,天津 300457;2.河南工程学院土木工程学院,河南郑州 451191;3.国家农业信息化工程技术研究中心,北京 100097;4.河南工程学院资源与安全工程学院,河南郑州 451191)
近年来,全球生态环境发生了较大变化,温室效应、极端干旱等气候现象的出现对农作物生长发育造成不可忽略的影响,因此需要对农作物生长状况进行及时监测[1]。叶片是作物结构中重要组成部分,其面积变化会直接影响到作物光合作用、呼吸作用等生理代谢过程[2]。叶面积指数(leaf area index,LAI)常被用来对作物健康状况、冠层分布密度、作物产量等方面进行评价[3]。因此,在农业现代化发展的背景下,研究LAI在不同生育时期下的变化对农作物估产和田间管理具有重要意义。
目前,无人机遥感技术已广泛应用于农田小范围尺度的作物监测,有效解决了航空航天遥感技术分辨率低、重访时间较长的问题[4]。最初受限于无人机平台的载荷能力,数码相机多被用于获取数据,由于其能直观地获取作物生长状况及生长环境的变化情况,且数据处理较为简便,因而成为重要农田监测工具[5]。利用无人机获取的数码影像数据,结合不同波段中所含信息,可实现研究区域内植被信息的提取[6-7]。但通过数码相机获取的数据仅包含红绿蓝三个波段,缺乏除可见光外对植被敏感的其他波段,限制了其在作物监测中应用的进一步发展。随着无人机机载平台的改进,其为更多遥感设备如高光谱传感器、热红外传感器、激光雷达等同步搭载提供了可能[8]。高光谱成像仪所获取的数据光谱范围广、光谱分辨率高,能更准确地显示作物的光谱特征,进而精确地获取作物生物物理与生化组分参数[9]。如陈晓凯等[10]获取了冬小麦拔节期高光谱数据,从不同光谱指数中筛选最优窄波段光谱指数,分别构建了单光谱指数和多光谱指数的叶面积估算模型,验证结果显示,基于随机森林算法的多光谱指数估算模型精度最高;Ali等[11]提取无人机高光谱反射率数据中红边位置波段,使用普通最小二乘回归算法构建柑桔LAI和叶绿素含量反演模型,结果表明,在红边位置,植株LAI和叶绿素含量高于其他波段,而且基于多项式拟合的模型反演精度较好。
除了使用遥感技术对作物参数进行间接测量外,一些学者提出从作物内部结构入手,构建辐射传输模型,进而反演所需的作物参数。植被辐射传输模型是研究辐射与植被冠层相互作用的重要方法,常用的模型包括LIBERTY、SAIL、PROSPECT、Suits等[12]。由于各模型存在一定局限性,通常将不同模型进行耦合得到更具普适性的模型。如曾毓燕等[13]利用PROSPECT和DART耦合模型,评价了不同尺度下植被指数对桉树叶片叶绿素含量和冠层叶绿素含量的反演能力;Roosjen等[14]将无人机采集的多角度数据作为PROSAIL模型的输入参数,反演的LAI和叶绿素含量精度高于单一角度数据。研究表明,作物辐射传输模型在冠层尺度下,从辐射传输理论建立冠层光谱与作物生化组分参数之间的定量关系,具有较强的普适性与稳定性,为模拟作物在不同生长条件下的光谱特征与反演作物参数提供了理论依据[15-16]。
现有基于无人机遥感技术开展的LAI研究,多是以多光谱或高光谱数据为基础,通过构建植被指数来反演LAI,忽略了光谱原始数据中所包含的信息。对于PROSAIL模型模拟的冠层光谱反射率,其能否准确表示作物光谱特征的分析也较少。本研究选择冬小麦挑旗期和开花期为研究时间节点,同步获取地面实测数据和无人机遥感数据,基于查找表建立PROSAIL模型模拟光谱数据,并对无人机采集数据与PROSAIL模拟数据进行可靠性评价,随后结合连续投影算法和植被指数相关性分析,筛选用于构建LAI反演模型的特征波段和植被指数,探究不同反演模型的可行性与预测效果,以期为监测冬小麦长势和改善冬小麦生长环境提供参考。
1 数据获取与研究方法
1.1 研究区及试验设计
试验于国家精准农业研究示范基地开展,基地地处北京市昌平区小汤山镇(北纬40°10′48″-40°10′54″,东经116°26′10″-116°27′05″),属北温带大陆半湿润大陆季风气候,年平均气温约 12 ℃,年平均降水量约580 mm。研究区共分为48个试验小区,小区面积48 m2。试验以冬小麦为研究对象,品种包括京9843(J9843)和中麦175(ZM175)。为体现不同小区冬小麦生长状况的差异,各小区采用不同营养和水分水平进行管理,包括4个氮素水平(N1:未施氮肥;N2:施尿素195 kg·hm-2,1/2正常水平;N3:施尿素390 kg·hm-2,为正常施氮水平;N4:施尿素585 kg·hm-2,为3/2正常施氮水平)和3个水分水平(W1:雨养、W2:正常水养、W3:2倍正常水养)。将48个试验小区以16个为1组进行划分,并对每组进行重复处理,其中重复试验1与重复试验2数据用于后期冬小麦LAI反演模型建立,重复试验3数据用于模型验证。具体研究试验设计方案如图1所示。
图1 试验设计
1.2 数据获取
本研究分别于2015年4月26日和5月13日两个关键生育时期(挑旗期和开花期)进行冬小麦试验数据采集,包括冬小麦地面实测光谱数据、LAI数据和无人机高光谱数据。为保证地面实测数据与无人机采集数据的一致性与准确性,在午间12时左右、天气晴朗无云时进行数据采集。
冬小麦高光谱地面实测数据采用ASD FieldSpecFRPro 2500光谱辐射仪获取。该辐射仪采样的光谱范围为350~2 500 nm,其采样间隔在350~1 000 nm范围内为1.4 nm,1 000~ 2 500 nm范围内为2 nm。数据采集期间,辐射仪探头保持垂直向下,并与冬小麦冠层间隔1 m,在每个实现小区内随机进行10次采样,取平均值作为该小区内冬小麦冠层光谱反射率。无人机高光谱数据由八旋翼无人机平台所搭载的CubertUHD-185成像仪获取,该成像仪所获取的光谱范围为450~950 nm,光谱采样间隔为4 nm。对于冬小麦LAI数据,在各试验小区内选取冬小麦长势良好区域进行采样,并对样本进行预处理,使用CI-203型激光叶面积仪测定叶片面积,乘以单位面积茎数即可得到冬小麦LAI。
1.3 研究方法
1.3.1 PROSAIL模型
本研究使用由PROSPECT-5模型与4SAIL模型耦合而成的PROSAIL模型。其中,PROSPECT-5模型用于模拟400~2 500 nm范围内叶片组分光谱参数即叶片反射率与透射率。该模型需要6个输入参数:叶片叶绿素a、b含量Cab;叶片类胡萝卜素含量Car;叶片等效水厚度Cw;叶片干物质含量Cm;叶黄素含量Cbrown和叶片结构参数N。4SAIL模型用于模拟植被冠层反射率,其输入参数包括结构参数与组分光谱参数。当PROSPECT模型模拟的叶片反射率与透射率作为SAIL模型的输入组分光谱参数时,便得到PROSAIL辐射传输模型,如式(1)所示[17-18]:
ρ(λ)=PROSAIL(Cab,Cw,Car,Cbrown,N,LAI,LAD,Hotspot,VIS,ρsoil,φs,φv,θs,θv)
(1)
式中,ρ(λ)为波长的冠层反射率;LAD为叶片倾角分布;Hotspot为热点尺寸;VIS为大气水平能见度;ρsoil为土壤亮度参数;φs、θs、φv、θv分别表示太阳方位角、太阳天顶角、观测方位角和观测天顶角。
结合试验中冬小麦相关生化参数实测值与现有文献参数设定,PROSAIL模型的输入参数查找表范围如表1所示。为保证参数之间的独立性,各参数均按照正态分布进行取值,参数输入组合约3 000组。
表1 PROSAIL模型输入参数的查找表范围Table 1 Range of look-up tables for PROSAIL model input parameters
1.3.2 特征波长与植被指数选取
连续投影算法(successive projections algorithm,SPA)对建模集光谱数据进行向量投影循环分析,选择最大投影值的向量,并在循环过程中建立已选择向量的回归模型,以均方根误差(root mean square error,RMSE)作为模型精度评价指标,最终选取RMSE最小值所对应的波长组作为特征波长[19]。
通过连续投影算法对高光谱数据进行处理,可以有效消除数据中存在的冗余,减少参与模型建立的波长数,降低模型复杂程度。为了消除获取的光谱中所含的噪声等干扰因素,本研究对原始光谱进行Savitzky-Golay(S-G)平滑处理,并对处理后的数据计算一阶导数(Savitzky-Golay first derivative,SGFD)。SPA算法提取波长数的最大值为15,并使用Kennard-Stone选择算法对48个样本进行划分,其中32个样本作为建模集,16个样本作为验证集。
根据现有高光谱数据反演LAI研究,选取10个与LAI相关的植被指数,具体见表2。
1.3.3 LAI反演方法
对建立的10个植被指数进行相关性分析,筛选出与LAI相关性最好的前5个植被指数,分别建立指数、线性、多项式等单变量预测模型(univariable prediction model,UPM)。同时以偏最小二乘回归法(partial least squares regression,PLSR)构建多变量预测模型(multivariable prediction model,MPM)。其中,将植被指数(vegetation index,VI)作为输入变量的模型记为MPM-VI;由原始光谱(origin spectrum,OR)中选取的特征波长作为输入变量的模型记为MPM-OR;经S-G平滑和一阶导数预处理光谱中选取的特征波长作为输入变量的模型分别记为MPM-SG和MPM-SGFD;将基于查找表的PROSAIL反演模型记为MPM-PROSAIL。
1.3.4 反演结果精度评价
为了对反演冬小麦LAI的精度进行评价,本研究采用决定系数(coefficient of determination,r2)、均方根误差和平均绝对百分误差(mean absolute percentage error,MAPE)作为评价指标。
(2)
(3)
(4)
表2 研究选取的植被指数Table 2 Vegetation indices selected for the study
2 结果与分析
2.1 冬小麦高光谱数据评价
由于无人机搭载的UHD-185传感器采集的光谱数据范围为450~950 nm,且光谱采样间隔为4 nm,因此将ASD实测数据和PROSAIL模拟数据进行重采样,并计算冬小麦不同生育时期ASD、PROSAIL和UHD-185的平均光谱反射率。为研究重采样后PROSAIL模拟冬小麦冠层光谱数据与UHD-185采集数据的可靠性,本研究以重采样ASD地面高光谱数据为标准对二者进行对比分析。由图2可知,PROSAIL模拟光谱曲线、UHD-185采集光谱曲线与ASD实测光谱曲线在450~900 nm范围内的变化趋势大体一致,三者均在550 nm附近出现峰值,在690 nm附近出现谷值。PROSAIL模拟光谱曲线与ASD实测光谱曲线较为吻合,而UHD-185光谱曲线与ASD实测光谱曲线在750 nm后出现明显差异,且840 nm后出现下降趋势。究其原因包括但不限于以下两方面:首先,UHD-185传感器与ASD传感器的光谱响应函数之间的差异,因二者响应函数并未公开,故不作过多讨论;其次,在光谱数据采集时传感器的观测角度(太阳-传感器-目标构成的观测天顶角、观测方位角等)不同会造成二向性反射分布函数(BRDF)的差异。有学者认为,BRDF会对光谱反射率产生影响,特别是红边波段范围(698~750 nm)以后,波长越长,反射率变化越明显[30]。对重采样PROSAIL、UHD-185数据与ASD实测数据进行相关性分析,分析结果(图3)显示,冬小麦各生育时期PROSAIL、UHD-185与ASD之间呈现高度正相关,决定系数r2均达到0.989以上。综合以上两种分析,PROSAIL模拟光谱与无人机UHD-185采集光谱在450~900 nm范围内能与地面实测光谱数据保持较高的一致性,可以用于后期冬小麦LAI反演建模。
2.2 冬小麦不同生育时期特征波长与植被指数的筛选
对挑旗期和开花期的冬小麦高光谱原始数据、S-G平滑光谱数据和一阶导数光谱数据进行SPA筛选,提取特征波长(表3)。尽管不同生育时期、不同光谱处理方法所选择的波段分布与数量并不相同,但特征波长主要集中在500~800 nm范围内,而且经过预处理的光谱中,波段选择范围要比原始光谱更广泛。挑旗期原始光谱所选择的特征波段数仅为8个,主要分布于700~870 nm范围;经过S-G平滑后的光谱所选择的特征波段最多,有15个,主要分布于500~880 nm范围。而开花期三种光谱所筛选特征波段数为13个左右,均分布于530~880 nm范围。
图2 冬小麦不同生育时期高光谱数据对比
图3 冬小麦不同生育时期的UHD-185、经重采样的PROSAIL和ASD光谱反射率的相关性
表3 冬小麦不同生育时期提取的特征波长Table 3 Characteristic wavelengths selected at different winter wheat growth stages
经相关性分析,挑旗期和开花期的植被指数与LAI之间均极显著相关(P<0.01),其中开花期的相关性高于挑旗期(图4)。植被指数中在挑旗期和开花期,相关系数绝对值最高的均为NVI,其值分别为 0.831、0.854;相关系数绝对值最低的指数为RVSI,其值分别为0.579、0.726。根据相关性,筛选出相关性较强的前5个植被指数建立冬小麦LAI反演模型,其中挑旗期选定NVI、MSR、REP1、NDVI和DPI,开花期选定NVI、MSR、REP1、DPI和RDVI。
图4 冬小麦植被指数与LAI的相关性
2.3 冬小麦LAI反演建模
用选定的5个植被指数分别构建不同生育时期单变量预测模型。整体上看,各植被指数所建立的LAI反演模型精度均较高,大部分模型的r2大于0.6,RMSE在0.6~1.0范围内,MAPE分布在17%左右(表4)。在挑旗期,建模精度最高的模型是基于指数关系的UPM-NDVI模型,其r2为0.717,RMSE和MAPE达到该生育时期所有模型最低值,分别为0.890和15.86%;建模效果最差的模型是基于指数的UPM-MSR模型,其r2、RMSE和MAPE分别为0.598、1.061和 16.86%。在开花期,基于多项式关系的UPM-NVI模型反演精度最高,其r2、RMSE和MAPE分别为0.716、0.649和16.79%;基于线性关系的UPM-RDVI模型反演精度最低,其r2、RMSE和MAPE分别为0.643、0.728和18.66%。对于不同生育时期,同一植被指数所构建的模型反演效果有所差异,开花期构建的模型反演精度整体要高于挑旗期构建的模型。对于不同的回归模型,同一植被指数的三种模型反演效果较为接近,其r2、RMSE和MAPE并无明显差异,但基于多项式关系的模型反演精度较高,其r2基本分布于0.7附近,指数和线性模型次之。
将SPA算法所筛选的特征波段和已选择的5个植被指数作为PLSR回归模型的输入变量,构建不同生育时期多变量LAI反演模型,并与基于查找表的PROSAIL模型反演结果进行对比。结果(表5)表明,除挑旗期的MPM-PROSAIL模型外,其他模型的r2均分布于0.7附近。其中,挑旗期多变量模型r2均大于0.72,RMSE和MAPE相差不大,分别在0.8和16%附近。开花期多变量模型r2为0.676~0.733,MPM-PROSAIL模型的RMSE和MAPE分别为0.986和20.58%,高于其他模型。因此,在由特征波段、植被指数和PROSAIL构建的三类反演模型中,MPM-PROSAIL模型反演效果较差。MPM-VI模型在不同生育时期表现较稳定,反演效果最好,挑旗期和开花期模型的r2分别为0.755和 0.733,RMSE和MAPE达到所有模型中最低值,分别为0.823、15.51%和0.629、15.56%。在基于特征变量构建的PLS回归模型中,MPM-SG模型反演精度较高,MPM-SGFD次之,基于原始光谱的MPM-OR模型反演效果较差,表明经过S-G平滑处理后的光谱数据更有利于模型建立。
表4 基于单一植被指数的LAI反演模型建立Table 4 LAI retrieval models established by single vegetation index
表5 基于多变量的LAI反演模型建立Table 5 LAI retrieval models established by multivariable
2.4 冬小麦LAI反演模型验证与可视化分析
根据LAI反演建模精度评价结果,选取基于植被指数构建的MPM-VI多变量回归模型为冬小麦LAI反演最佳模型,并对该模型进行精度验证,结果(图5)表明,模型的RMSE和MAPE在开花期分别为0.405和12.90%,在挑旗期分别为1.101和26.68%。在挑旗期,大部分LAI的预测值分布于1∶1趋势线上方(图5A),表明挑旗期的LAI预测值被高估。在开花期,LAI的实测值与预测值较为均匀地分布在1∶1趋势线附近(图5B),表明开花期的MPM-VI模型能较准确地反演LAI。
图5 不同生育期MPM-VI模型验证结果
将各时期MPM-VI反演模型应用于无人机高光谱影像,得到LAI预测值空间分布图(图6)。结合图1分析,在挑旗期,重复试验1和重复试验3部分小区LAI值较低,重复试验2小区的LAI值较高。在开花期,除重复试验3部分小区,其他试验小区的LAI值较高,重复试验2小区的LAI值达到5.0以上。各时期LAI分布与模型预测结果较一致,挑旗期小区LAI分布有明显差异,开花期小区LAI分布较均匀。可视化分析结果显示,冬小麦在开花期的长势比挑旗期稳定,同时利用植被指数构建的冬小麦LAI反演模型应用于不同生育时期无人机高光谱影像上,可更为直观地反映冬小麦在不同试验小区的长势情况,为农田有效管理提供依据。
图6 不同生育时期冬小麦LAI预测值
3 讨 论
本研究获取冬小麦两个关键生育时期的高光谱数据和LAI实测数据,并利用PROSAIL模型模拟了冬小麦冠层光谱反射率,结合植被指数和由SPA算法筛选的特征波段,分别构建冬小麦LAI单变量和多变量反演模型,得到了较高的反演精度,有效监测了不同生育时期冬小麦LAI的变化情况。
在高光谱数据获取与处理方面,本研究选择了关键生育时期地面实测光谱数据、无人机采集光谱数据和PROSAIL模型模拟冠层光谱数据,并对PROSAIL模拟光谱与无人机采集光谱进行数据质量评价,证明了二者在450~900 nm范围内数据的可靠性,同时也表明PROSAIL模型在作物冠层光谱反射率模拟方面的有效性。随着近年来对作物结构的深入研究,改进的PROSAIL模型则考虑加入更多的作物生理参数以提高冠层光谱反射率的模拟精度,如PROSAIL-D模型中加入了花青素[31],PROSAIL-DyN模型中加入了蛋白质含量,并用纤维素和木质素总含量代替了干物质含量[32]。本研究中PROSAIL模型输入的生理参数大多是根据经验数据或其他文献内的试验结果进行设定,因此如何有效准确获取作物的更多生理参数数据,提高PROSAIL模型模拟精度,可作为后续研究重点。
在筛选用于构建冬小麦LAI反演模型的变量方面,本研究使用SPA算法对光谱数据进行降维处理,同时建立了与LAI相关性较高的植被指数。目前光谱分析中的变量筛选方法较多,如遗传算法、灰色关联分析法和相关性分析法等[33],而SPA算法在农作物高光谱波段筛选方面研究较少。在本研究中将SPA算法应用于原始光谱数据和预处理后的光谱数据,均筛选出了数量较少的特征波段,为后续建立反演模型的输入变量减少了冗余,简化了模型结构。尽管在建立反演模型时,基于植被指数的多变量反演模型精度更高,但由SPA算法所选定的特征波段构建的多变量反演模型精度也较高,尤其在挑旗期,MPM-SG模型的r2为0.742,比MPM-VI模型低了 0.013,其RMSE和MAPE也比MPM-VI模型仅高了0.022和0.32%,表明SPA算法在冬小麦特征波段筛选中亦是有效的。
在冬小麦LAI反演模型建立方面,本研究所构建的MPM-VI模型反演效果最好,并将该模型应用于无人机高光谱影像上进行LAI空间分布可视化分析,分析结果直观地显示了各试验小区LAI的分布情况。但从建模结果亦可看出,部分基于单植被指数构建的模型反演效果与多变量模型相差不大,甚至反演精度优于多变量模型,比如开花期中UPM-MSR模型的r2、RMSE和MAPE分别为0.706、0.664和17.02%,而该生育时期的MPM-OR模型r2、RMSE和MAPE分别为0.676、0.692和17.71%。考虑到在分析植被指数与LAI相关性的时候,各植被指数均显示出了与LAI的高相关性,而且在构建模型时挑选了敏感程度较高的前5个植被指数,因此构建的单植被指数模型反演精度会高一点。而多变量模型综合了不同波段之间的有效信息,特别是MPM-VI模型保留了高相关性植被指数之间的信息,提高了该模型的稳定性,所以MPM-VI模型的反演精度达到最高。
4 结 论
基于试验实测、PROSAIL模型模拟和无人机影像等多源数据,利用数学统计方法构建了冬小麦LAI反演模型。构建的单变量和多变量模型反演精度均较高,大部分模型决定系数r2可达到0.7以上,均方根误差RMSE在0.649~1.207范围内,平均绝对百分误差MAPE基本在17%附近波动。从模型验证结果来看,基于植被指数构建的多变量模型反演效果最好,其各精度指标均达到最优,而且将该模型应用于冬小麦LAI空间分布进行可视化分析,结果能较好地反映研究区内冬小麦长势情况。