基于无人机多光谱遥感的苎麻叶绿素含量反演
2023-08-11岳云开陈建福赵亮焦鑫伟许明志付虹雨廖澳崔国贤佘玮
岳云开,陈建福,赵亮,焦鑫伟,许明志,付虹雨,廖澳,崔国贤,佘玮
(湖南农业大学苎麻研究所,湖南 长沙 410128)
苎麻(Boehmeria niveaL.)为荨麻科(Urticaceae)苎麻属(Boehmeria) 的多年生草本纤维植物[1],在我国纺织业中占有重要地位[2]。 苎麻中含有丰富的营养成分,是优质的植物蛋白饲料来源[3];叶和根中富含绿原酸和多酚等活性成分,具有止血、安胎、抗病毒等药用功效[4];叶中还含有丰富的叶绿素,是一种天然可食用色素,民间常将其用于食品调色[5]。 因此,苎麻不断地被开发和利用。
叶绿素是植物叶片中的主要光合色素,其含量可以直接反映植物的光合作用强弱和健康状况,是评价植物生长状况的重要指标,与作物的产量及品质密切相关[6,7]。 因此,及时准确监测叶绿素含量对于苎麻生产管理十分重要。 传统的叶绿素监测方法具有破坏性大、操作繁琐、效率低、费时费力等缺陷,不能及时反馈作物的生长状况。近年来,无人机遥感技术快速发展,并在作物生长监测、营养状况诊断等方面广泛应用[8],也为作物叶绿素监测提供了新的方法。 如陈浩等[9]利用无人机多光谱遥感对不同施肥处理下的夏玉米冠层叶绿素进行估测,然后基于线性回归和逐步回归,建立了夏玉米冠层叶绿素含量遥感监测模型;周敏姑等[10]利用无人机多光谱遥感5 个波段光谱反射率反演冬小麦SPAD 值,经对比分析发现基于逐步回归法构建的模型效果最优,决定系数为0.77;Narmilan 等[11]利用无人机多光谱,并基于MLR、RF、DT、SVR、XGB、KNN 和ANN 等机器学习算法,预测甘蔗冠层叶绿素含量,结果表明所有模型反演效果均较好,其中随机森林(RF)回归模型的决定系数高达0.99。 可见,利用无人机遥感反演作物叶绿素含量是可行的。
本研究以四个生长时期的苎麻为研究对象,利用无人机多光谱图像构建多种植被指数,通过对叶绿素含量和植被指数的相关性分析,采用传统回归和随机森林回归方法建立了苎麻叶绿素含量的遥感估算模型,经分析评价后确定最佳反演模型以实现苎麻叶片叶绿素含量的动态监测。
1 材料与方法
1.1 试验区概况
试验区位于湖南省长沙市芙蓉区湖南农业大学耘园教学基地(28°11′01.981″N,113°04′10.159″E)。该区域属典型的亚热带季风性湿润气候,降水充沛,光热条件良好,是苎麻的主产区之一。 试验区地势平坦,无遮挡物,为无人机作业提供了良好的条件。 试验区共种植27 个苎麻品种,每个品种一个小区,重复3 次,共81 个小区;小区面积2.0 m×1.8 m,2 行×4 蔸,蔸间距为0.4 m,行间距为0.6 m,排水沟宽0.5 m。 苎麻材料于2017 年12月育苗移栽,2018 年6 月破杆。 试验区土壤肥沃且成分均一,灌溉排水便捷,田间水肥管理一致。
1.2 数据获取
1.2.1 无人机遥感影像获取 利用大疆精灵Phantom 4 多光谱版无人机搭载多光谱遥感设备获取苎麻冠层影像。 该无人机采用厘米级定位系统,并将飞控、相机与RTK 的时钟系统进行微秒级同步;无人机搭载一台多光谱传感器,该传感器集成了1 个可见光相机及5 个多光谱相机(蓝光、绿光、红光、红边和近红外),所有相机均拥有200万像素解析力,拍摄照片的最大分辨率为1 600×1 300。
于2022 年3—5 月苎麻每个生育期采集一次数据。 为保证无人机影像的稳定性和可靠性,每次飞行选择在晴朗无风天气的10—12 时进行。 无人机遥感系统在距离地面20 m 的高度搭配-90°云台俯仰角进行拍摄,飞行速度为2 m/s,航向及旁向重叠度均为75%。 各时期飞行任务的拍摄参数、航线规划一致,在飞行任务执行前设置完成。 将采集的影像导入大疆智图软件进行拼接,经辐射校正后获取试验区域的反射率影像,再通过无人机一体化图像分析系统PhenoAI air 软件进行植被指数及反射率的提取。
1.2.2 叶绿素含量测定 参照张宪政[12]的方法进行。 取苎麻植株顶部倒数第6 ~7 叶,去除叶脉后剪碎、混匀,称取0.1 g 装入10 mL 离心管中,重复3 次,分别加入提取液(95.5%丙酮+无水乙醇,体积比为1∶1)10 mL,充分摇匀后用黑色塑料袋遮盖并避光保存48 h,直至叶片完全变白,然后用紫外分光光度计在663、652、645 nm 波长下测定吸光度,并按下列公式计算叶绿素a、叶绿素b 含量及叶绿素总含量。
叶绿素a 含量(mg/L)=(12.7D663-2.69D645)V/(1000W) ;
叶绿素b 含量(mg/L)=(22.9D645-4.68D663)V/(1000W) ;
叶绿素总含量(mg/L)=D652V/(34.5W) 。式中D663、D652、D645分别为相应波长下的光密度值,V 为提取液体积,W 为叶片鲜重。 整个生育期苎麻叶片叶绿素含量的箱线图如图1 所示。
图1 各生育时期苎麻叶片叶绿素总含量的箱线图
1.3 植被指数选取
依据已有的多光谱植被指数,结合叶绿素吸收光谱的特性,并通过与实测叶绿素含量进行相关性分析,选择相关系数较高的7 种植被指数进行建模,分别为归一化植被指数(NDVI)、绿色归一化植被指数(GNDVI)、归一化差异红色边缘植被指数(NDRE)、改进简单比值植被指数(MSR)、比值植被指数(RVI)、宽范围动态植被指数(WDRVI)、土壤调节植被指数(OSAVI),如表1所示。
表1 植被指数及计算公式
1.4 模型构建与评价
本研究基于7 种植被指数分别使用一元线性回归、多元线性回归和随机森林回归构建不同生育时期苎麻叶绿素含量反演模型。 一元线性回归模型的构建使用SPSS 软件,其方程为y =ax+b,式中,y 代表叶绿素含量,x 代表植被指数。 多元线性回归模型的构建也使用SPSS 软件,其方程为y =a1x1+a2x2+...+anxn+b,式中x1、x2...xn代表不同植被指数。 随机森林回归模型的构建使用Matlab软件,首先从全部自变量集合里有放回地随机抽取m 个样本数据集,在所有特征变量中选择K 个特征变量,然后选择最佳分割特征变量作为节点构建CART 树,并重复T 次,即组建了T 棵决策树,最终每个决策树结果的平均作为随机森林回归模型的结果。
随机选取70%样本作为建模集,用于构建叶绿素含量反演模型,30%样本作为验证集,用于模型评价。 为评估不同模型的估算精度,本研究以决定系数(R2)、均方根误差(RMSE)作为评价指标。 通常R2越接近于1、RMSE 越小,说明模型估算能力越好。
式中:yi为叶绿素含量实测值,为叶绿素含量预测值,为叶绿素含量平均值,n 为样本数。
2 结果与分析
2.1 植被指数与叶绿素含量的相关性分析
对不同生育期获取的植被指数与叶绿素含量进行相关性分析,结果(表2)显示,全生育期内,叶绿素与7 种植被指数之间的相关性均达到显著或极显著水平,苗期、封行期、旺长期、成熟期叶绿素与植被指数的相关性范围分别为0.723~0.798、0.629 ~0.761、0.391 ~0.818、0.731 ~0.794。 其中,NDVI 在苗期、封行期、成熟期与叶绿素含量具有最高相关系数,分别达到0.798、0.761、0.794;NDRE与叶绿素在旺长期最相关(相关系数为0.818)。因此,所选植被指数可用于叶绿素含量反演模型的构建。
表2 植被指数与叶绿素含量的相关系数
2.2 基于传统线性回归的苎麻叶绿素含量反演
根据叶绿素含量与植被指数相关性分析的结果,以上述7 种植被指数作为自变量、叶绿素含量作为因变量,分别建立不同生育时期的一元线性回归模型和多元线性回归模型,结果如表3 所示。所有线性回归模型的显著性均达到0.01 极显著水平,说明各模型的拟合性均较好。 不同生育时期、不同建模方法的反演效果存在差异,总体上多元线性回归模型的效果好于一元线性回归模型,且以封行期的反演效果最佳,建模集和验证集的R2分别为0.667 和0.752。 各时期基于多元线性回归模型的实测值与预测值间拟合关系如图2所示。
表3 叶绿素含量与植被指数线性回归模型
图2 基于多元线性回归的叶绿素估算模型预测值和实测值的关系
2.3 基于随机森林模型的苎麻叶绿素含量反演
根据叶绿素含量与植被指数相关性分析的结果,选择NDVI、GNDVI、RVI、OSAVI、NDRE、MSR、WDRVI 这7 种植被指数,采用随机森林算法,分别建立苗期、封行期、旺长期、成熟期的叶绿素含量反演模型,并利用验证集数据对模型精度进行验证,由表4 可以看出,不同生育时期随机森林模型反演效果也存在差异,苗期和封行期决定系数较小,反演效果较差;旺长期的建模效果最好,建模集R2为0.969,RMSE 为0.031;成熟期的反演效果最好,验证集R2为0.892,RMSE 为0.116,且建模效果也较好,建模集R2为0.949,RMSE 为0.045。 基于随机森林模型的苎麻叶绿素含量预测值与实测值间的关系如图3 所示。
表4 叶绿素含量与植被指数随机森林模型的评价结果
图3 基于随机森林模型的叶绿素预测值与实测值的关系
综上所述,与传统的线性回归模型相比,基于随机森林算法构建的模型预测效果在各生育时期均有大幅提升,总体以成熟期的反演效果最好,建模集和验证集的R2分别为0.949 和0.892,因此最终选用成熟期的随机森林模型用于苎麻叶绿素含量反演。
3 讨论与结论
本研究基于无人机获取的苎麻苗期、封行期、旺长期和成熟期多光谱遥感影像,结合实测叶绿素含量,选取7 种植被指数,分别利用一元线性回归、多元线性回归和随机森林算法建立了苎麻叶片叶绿素含量反演模型,研究利用多光谱遥感估测苎麻叶绿素含量的可行性。 相关性分析结果表明7 种植被指数均与各时期叶绿素含量显著或极显著相关,与陈鹏[14]、Cao[18]等的研究结果一致,可用于后续模型构建。 经对比分析,多元线性回归模型的反演效果明显好于一元线性回归,而基于随机森林机器学习构建模型的叶绿素预测效果最好,以成熟期的反演效果最佳,建模集和验证集的R2分别为0.949 和0.892,RMSE 分别为0.045 和0.116。 这主要是因为随机森林模型有很好的抗噪声能力且不容易过度拟合,使得模型精度较高[20-22]。
无人机多光谱遥感技术为监测苎麻叶绿素含量提供了一种实用、高效、低成本、无损的方法,通过结合机器学习技术,能够较精准反演苎麻叶绿素含量,可以作为苎麻生长过程中叶片叶绿素含量监测的有效手段。
虽然本研究建立的随机森林模型对苎麻叶绿素含量反演效果较好,但目前对叶绿素的跨期预测模型还没有深入研究,且模型的普适性也需要进一步验证,在下一步研究中将对模型进行优化,尝试机器学习与深度学习的对比研究,以探索出普适性强、预测精度更高的苎麻叶绿素含量反演模型。