APP下载

基于无人机高光谱影像的水稻叶绿素含量反演

2024-03-09何嘉晨何敬王彬苟静林远杨刘刚

四川农业大学学报 2024年1期
关键词:植被指数波段叶绿素

何嘉晨,何敬*,王彬,苟静,林远杨,刘刚,2

(1.成都理工大学地球科学学院,成都 610059;2.成都理工大学地质灾害防治与地质环境保护国家重点实验室,成都 610059)

叶绿素是农作物的重要生化参数,其含量是植物营养胁迫、氮素状况和生长衰老等各阶段的重要指示因子。叶绿素含量通常与植被的光合能力和生长状况具有良好的相关性,对动态监测植被长势以及快速诊断施肥具有重要意义[1-2]。传统检测作物叶片叶绿素含量的方法是利用有机溶剂提取,不仅需要专业人员检测、消耗大量的时间和精力,并且对叶片具有破坏性,不能实现对叶绿素含量的大面积监测[3-4]。无人机高光谱遥感技术具有体积小、机动灵活、成本低且时空分辨率高等特点,可以精确地获取作物的光谱信息,利用无人机遥感技术定量分析作物光谱信息与生物生理指标间的量化关系,可以实现对作物生长状况的实时监控[5-6]。

叶绿素含量反演的最优空间分辨率和最优植被指数。常潇月等[8]以无人机为平台搭载高光谱仪获取玉米农田高光谱影像,选取基于光谱位置的变量、基于光谱面积的变量以及植被指数多种特征参数,构建单因素线性、非线性回归模型,并制作玉米叶片叶绿素含量分布图。王浩云等[9]证明基于MMD迁移的光学特性参数所建立的叶绿素回归模型比直接使用光学参数和光谱图像所建立的模型具有更好的反演效果,可以为叶绿素含量无损估测研究提供参考。Zhang Y.等[10]提出了一种新的基于振幅和形状增强的二维相关谱(2 DCOS)与迁移学习相结合的新型混合技术,用于提取具有代表性的LCC特征波长,在此基础上,引入了一种基于深度神经网络的迁移学习技术,将从PROSAIL模拟数据集中学到的知识迁移到现场测量LCC的反演任务中。

从以上研究可以看出,大部分实验通过分析植被参数与作物生理参数之间的相关关系,利用简单的线性或非线性回归模型估算植被的各项生理参数。本研究采用基于相关性分析建立的CatBoost回归模型反演水稻叶绿素含量,CatBoost回归模型是基于复杂的机器学习算法构建的模型。实验基于特征波长建立了对叶绿素含量敏感的光谱参数,确定了水稻叶绿素含量的最佳回归模型,并利用反演结果进行填图得到叶绿素含量分布图,为水稻生长监测提供新的理论依据和技术手段。

1 材料和方法

1.1 水稻叶片光谱测定与含量测定

选择晴朗少云少风的天气,测量时间在10:00—14:00较好。无人机平台为大疆M600 Pro,高光谱仪是芬兰的SENOP RIKOLA,光谱范围为500~900 nm,光谱仪探头垂直置于冠层上方10 m处测量光谱,每次测量前进行白板校正。在无人机采集数据的范围内,随机选取60个地面点利用SPAD仪实测获取每一个样本点的SPAD值。由于无人机高光谱仪采集的主要是水稻冠层上层叶片光谱反射率,因此实测SPAD值时也主要针对上层叶片。无人机与SPAD仪采集数据如图1。

图1 水稻SPAD值采集Figure 1 Collection of rice SPAD value

1.2 高光谱数据预处理

受到周围环境的影响,影像在采集过程中容易产生噪声[11]。为了有效提取对水稻叶绿素含量敏感的波段,需要对原始光谱进行预处理以去除背景噪声,并突出其特征波段。首先,用Rikola Ltd.软件对数据进行暗电流校正,以减弱吸光度误差。然后进行白板校正,作为定标或测量时的参考标准。最后,进行辐射校正,以消除或改正因辐射误差而引起影像畸变的过程。图2(a)为水稻原始高光谱影像的单波段显示效果,图2(b)为预处理后的高光谱影像,采用634 nm作为红波段,551 nm为绿波段,503 nm为蓝波段显示的真彩色效果。

图2 水稻高光谱影像Figure 2 Hyperspectral image of rice

1.3 特征波段选取

原始的高光谱数据波段较多,各波段之间存在一定的相关性,造成了数据的冗余,因此需要根据研究内容对其进行波段选择。高光谱图像的波段选择是一种很复杂的波段组合优化问题,它要求所选的波段组合信息量较大、相关性较小、类别可分性较好[12]。本文利用相关性分析进行光谱指数特征波长的筛选,使所选特征波长与所用的水稻叶绿素含量的相关性最高。常见的用于描述变量间相关性的系数,包括Pearson、Spearman、Kendall、Polychoric、Tetrachoric和Polyserial等。Pearson相关系数[13]可以通过数字度量2个连续型变量之间的相关关系,并且结果带有方向性,因此本文选择使用Pearson相关系数。其计算公式如式(1)所示。

式中,rxy是变量x和y的Pearson相关系数,表示2组连续变量之间的线性关联程度;n是观测对象的数量;xi是x的第i个观测值;yi是y的第i个观测值。

1.4 分析方法

本文选取了多数研究中涉及的与叶绿素相关性较好并且物理意义明确的6种植被指数以及红边幅值和红边面积共8种光谱参数,用于水稻叶绿素含量反演模型的构建。

1.4.1 基于红边特征的分析方法

红边是绿色植被反射光谱在红到近红外区域内出现的一个陡峭“爬坡”,其位置位于680~760 nm的波段范围内[14]。红边波段是指示绿色植物生长状况的敏感性波段,与植被叶绿素含量具有良好的相关性,是作物生理参数遥感反演的重要指示波段[15]。红边参数主要由红边位置、红边面积、红边幅值(又称为红边斜率)等参数组成。本文选择使用的2个红边参数为红边幅值和红边面积(表1)。

表1 红边参数的定义Table 1 Definition of red edge parameters

1.4.2 基于植被指数的分析方法

植被指数将不同的特征敏感波段通过差分、比值等运算进行线性或非线性组合,对绿色植被的某种生理生化参数有一定的指示作用,因此利用植被指数建立数学模型是叶绿素含量反演研究中常用的方法[17]。

本文选择的植被指数有归一化光谱指数(NDSI)、差值光谱指数(DSI)、比值光谱指数(RSI)和改进简单比值指数(MSR),优化型土壤调节植被指数(OSAVI)和再归一化差值植被指数(RDVI)(表2)。MSR是重整化差值植被指数的改进版本,用于限定后者与生物物理参数的关系。OSAVI是土壤调节植被指数(SAVI)的优化指数,SAVI指数是一个可以适当描述土壤-植被系统“简单模型”的植被指数,它可以降低土壤背景等的影响,但同时也会降低与植被覆盖度之间的相关性,而当指数中的参数取固定值后,OSAVI既适用于低植被覆盖,也适用于高植被覆盖。RDVI适用于各种植被覆盖情况,同样对植被冠层叶绿素含量具有较好的估算能力。

表2 光谱指数名称与公式Table 2 Spectral index names and formulas

1.5 基于CatBoost回归方法反演建模

CatBoost是由俄罗斯Yandex公司于2017年开源的机器学习库[21],是一种基于对称决策树(decision trees)算法的GBDT(gradient boosting decision tree,GBDT)框架。它通过有序提升的方式对传统GBDT算法中的梯度估计进行了改进,能够高效地处理梯度提升决策树特征中的类别型特征。Cat-Boost算法可以解决梯度偏差(gradient bias)和预测偏移(prediction offset)的问题,并且使用了一种全新的梯度提升机制来构建模型以此减少过拟合,不仅参数少、准确性高,还能支持类别型变量,高效合理地处理类别型特征(categorical features)[22-23]。其原理是利用训练集来建立回归模型,通过建立的回归模型可计算特征重要性,然后将建立的模型应用到训练集和测试集,从而得到模型评估结果。

由于CatBoost模型参数较少,因此该模型对小样本数据库的训练效果较好。本文所构建的实验样本数量为60个,按照普遍的7∶3比例随机划分训练集和测试集,利用构建的CatBoost模型对叶绿素含量进行预测。

2 结果与分析

2.1 特征波段选取与相关性分析

利用ENVI软件计算出原始光谱反射率的一阶导数,选取680~760 nm范围内的光谱一阶导数,然后分别计算出红边幅值和红边面积,分析2个红边参数与叶绿素含量的相关关系,利用红边参数作为输入变量建立叶绿素含量反演模型。由表3可知,水稻叶绿素含量与红边面积的相关性较显著,相关性为-0.272*,红边幅值与SPAD值相关系数为-0.256*。

表3 光谱参数与SPAD值相关系数最大值及波长位置Table 3 The maximum value and wavelength position of the correlation coefficient between spectral parameters and SPAD values

将提取的水稻光谱反射率经两波段植被指数DSI、RSI、NDSI运算后,与实测叶绿素含量进行相关性分析,筛选出能够指示叶绿素含量的最佳特征敏感波段。图3为DSI、RSI和NDSI 3种植被指数与叶绿素含量相关关系的等势图,图内任意点为该点对应的横、纵坐标2个波长组合构建的植被指数与叶绿素含量的相关系数。植被指数RSI、NDSI与叶绿素含量相关系数|R|较大值主要位于横轴760~823 nm、804~887 nm之间,纵轴751~800 nm、792~887 nm之间。植被指数DSI与叶绿素含量相关系数|R|较大值主要位于横轴503~672 nm、576~723 nm和751~840 nm之间,纵轴503~651 nm、591~711 nm和751~823 nm之间。因此本文选取的相关系数较高的特征波段主要分布在503~723 nm、760~887 nm之间,即绿光波段、红光波段和近红外波段范围内,以此作为植被指数的变量,分析与叶绿素含量的相关性。从图中可以看出,DSI与水稻叶绿素含量的相关性最好,RSI、NDSI与叶绿素含量相关性分布则比较相似。其中,由800 与816 nm 2波长组合构建的DSI(R800,R816)、RSI(R816,R800)、NDSI(R800,R816)与叶绿素含量相关性最好,相关系数分别为0.432**、0.408**和0.406**,因此,B(800)、B(816)是指示叶绿素含量的敏感波段。表3为水稻冠层叶绿素含量与光谱参数的相关性分析,MSR与叶绿素含量相关系数最大值为0.220*;OSAVI与叶绿素含量相关系数最大值为0.268*;RDVI与叶绿素含量相关系数为-0.438**,这3种植被指数与叶绿素含量之间同样具有显著相关关系。

图3 两波段组合与叶绿素含量相关系数等势图Figure 3 Equipotential plot of correlation coefficient between two-band combination and chlorophyll content

2.2 基于红边参数叶绿素含量反演

本研究选取决定系数R2和均方根误差(root mean square error,RMSE)表征模型精度。R2取值范围为0~1,值越大,模型越精确,回归效果越显著。RMSE反映了预测值偏离真实值的程度,值越小,表示估算精度越高[24]。

表4为基于2个红边参数建立的水稻叶绿素含量反演模型结果。由表4可知,基于2个红边参数的反演模型精度均较高,都达到0.8以上,其中基于红边信息叶绿素含量反演效果最好的模型是红边幅值-SPAD-CatBoost,其拟合模型为y=1.205 3x-9.118 6,R²为0.941 8,RSME为0.603 6,叶绿素含量反演模型如图4。基于2个红边参数的叶绿素含量反演模型决定系数均较高,对于动态监测水稻叶片叶绿素含量具有一定的帮助。

表4 基于不同红边信息的水稻叶绿素反演模型精度Table 4 Accuracy of rice chlorophyll inversion model based on different red edge information

图4 基于红边参数的叶绿素含量反演模型Figure 4 Chlorophyll content inversion model based on red edge parameters

2.3 基于植被指数水稻叶绿素含量反演

在选取出特征敏感波段的基础上对任意两波段进行组合计算,再与叶绿素含量进行相关性分析,得到了6种植被指数DSI、RSI、NDSI、MSR、OSAVI、RDVI与水稻叶绿素含量的定量关系。利用6种植被指数作为水稻叶绿素含量反演模型的变量,并得到以各个植被指数为变量的估算方程,将得到的预测值与水稻叶绿素含量进行拟合,检测其对叶绿素含量的估算能力。从表5可以看出,基于植被指数的叶绿素含量最佳反演模型是OSAVI (823,760)-SPAD-CatBoost,其拟合方程为y=1.212 5x-9.362 1,R²为0.941 6,RSME为0.588 5,叶绿素含量最佳反演模型见图5。本文研究的6种重构植被指数建立的叶绿素含量反演模型精度均达到显著水平,即R2>0.80,说明参与模型建立的植被指数均包含诊断叶绿素含量的可靠信息。基于植被指数与叶绿素含量建立的反演模型精度较好,表明利用植被指数可以有效地提高对水稻叶片叶绿素含量的反演精度。6种光谱参数对水稻叶片叶绿素含量的估算能力表现不一,基于这6种重构的植被指数里,DSI (672,656)、MSR (792,634)、OSAVI (823,760)、RDVI (800,816)的拟合模型的决定系数R2均大于0.90,其估算能力由大到小依次为OSAVI (823,760)、DSI (672,656)、MSR (792,634)和RDVI (800,816)。NDSI (672,656)、RSI (816,623)的决定系数最小,但仍大于0.8,这是因为构成这2个光谱指数的波段均位于对冠层叶绿素敏感的红光和近红外波段范围内。虽然NDSI、RSI对水稻冠层叶绿素含量具有较高的估算能力,但仍比本文中随机组合得到的其他4种植被指数低,其原因或许是由共线性问题引起的,由于2个变量之间的相关性可能是由于二者之间存在一个中介而导致的相关性较好,因此有可能会导致回归中决定系数变小甚至不显著[25]。

表5 不同光谱指数的水稻叶绿素含量反演模型结果Table 5 Inversion model results of rice chlorophyll content with different spectral indices

图5 基于植被指数的叶绿素含量最佳反演模型Figure 5 The best inversion model of chlorophyll content based on vegetation index

2.4 水稻冠层叶绿素含量分布图

叶绿素含量分布图能够直观地展现出区域内水稻叶片的叶绿素含量,对评估水稻健康生长有一定帮助,叶绿素含量分布图如图6所示。

图6 水稻冠层叶绿素含量分布图Figure 6 Distribution of chlorophyll content in rice canopy

图6中,不同颜色表示不同浓度的水稻叶绿素含量,叶绿素含量高的叶片颜色呈深绿,叶绿素含量低的叶片颜色呈浅绿甚至黄色。观察分布图发现,反演填图结果(图6)中SPAD值呈现聚集状态,在聚集中心SPAD值较高,向外呈递减趋势。这是因为水稻叶片数量多、叶片较长,叶片之间相互遮挡,产生小范围的阴影,导致阴影部分光谱反射率较低,SPAD值较小。基于差值光谱指数(DSI)反演的水稻叶绿素含量明显高于其他2个植被指数的反演结果,水稻叶绿素含量预测值范围为42.88~55.88,其预测值范围与水稻叶绿素含量实测值范围基本吻合,土壤中所含叶绿素含量也明显低于水稻,与实际相符。基于归一化光谱指数(NDSI)和比值光谱指数(RSI)反演的水稻叶绿素含量预测值范围为42.76~46.47,预测值偏低,反演效果不如DSI指数反演效果好。

3 讨论与结论

本文以水稻分蘖期叶片为研究对象,利用无人机高光谱遥感技术,获取水稻叶片的高光谱影像和叶绿素含量实测值。对原始高光谱数据进行一阶微分处理,基于原始和一阶微分高光谱反射率进行植被指数和红边参数的计算,利用相关性提取特征波段,最后结合CatBoost回归模型对水稻叶片叶绿素含量进行反演,得出以下结论:

①选取的8种基于特征波长组合计算的光谱指数中,红边面积和红边幅值与叶绿素含量显著相关,反演效果较好。再归一化差值植被指数(RDVI)与叶绿素含量的相关性最好,相关系数最大值绝对值为0.438**。NDSI、RSI与叶绿素含量的相关性差别不大,因此这2个植被指数与叶绿素预测含量拟合的效果也较为相似。通过分析由水稻光谱反射率值构建的植被指数与叶绿素含量之间的相关关系,确定B(800)、B(816)是对水稻叶绿素含量敏感的特征波段。虽然实验中参与的2种变量之间相关性数值较低,但均呈显著相关,因此反演效果较好。

②本研究选用了较常见且实用性较强、计算量较小的原始光谱特征波段对植被指数进行分析计算,并对原始光谱数据进行一阶微分处理,计算后得到2个红边参数,结合CatBoost回归模型对水稻叶绿素含量进行模型反演。植被指数与红边参数对水稻叶绿素含量均具有较好的估算能力,其中基于红边幅值的叶绿素含量反演模型决定系数达到0.9以上,模型反演精度也很好。基于植被指数的叶绿素含量反演模型精度也都达到0.8以上。

③本文研究的6种光谱指数和2种红边参数与叶绿素含量相关性的显著性具有明显差异,但是这8种参数作为CatBoost回归模型的输入变量,其回归模型的决定系数R2均达到0.8以上,拟合效果较好。红边参数中红边幅值拟合效果最好,其拟合模型为y=1.205 3x-9.118 6,R²为0.941 8,RSME为0.603 6;植被指数中OSAVI指数拟合效果最好,其拟合模型为y=1.212 5x-9.362 1,R²为0.941 6,RSME为0.588 5。这说明了利用CatBoost回归模型建立的最优反演模型能够很好地预测水稻冠层的叶绿素含量,为开展精细田间管理提供了依据。

猜你喜欢

植被指数波段叶绿素
春日暖阳
提取叶绿素
桃树叶绿素含量与SPAD值呈极显著正相关
AMSR_2微波植被指数在黄河流域的适用性对比与分析
河南省冬小麦产量遥感监测精度比较研究
叶绿素家族概述
M87的多波段辐射过程及其能谱拟合
日常维护对L 波段雷达的重要性
主要植被指数在生态环评中的作用
基于MODIS数据的植被指数与植被覆盖度关系研究