APP下载

冬小麦不同叶位叶片的叶绿素含量高光谱估算模型

2022-08-05马春艳王艺琳翟丽婷郭辅臣李长春牛海鹏

农业机械学报 2022年6期
关键词:植被指数反射率冬小麦

马春艳 王艺琳 翟丽婷 郭辅臣 李长春 牛海鹏

(河南理工大学测绘与国土信息工程学院,焦作 454000)

0 引言

叶绿素是绿色植物进行光合作用的关键驱动因素[1],其含量与植被的光合能力、生长发育及营养状况密切相关。因此,及时、准确地获取叶绿素含量对于作物田间管理、长势监测及产量估算具有重要意义。传统的化学检测方法成本高、效率低,而且具有田间破坏性和不可恢复性[2]。近年来,高光谱遥感技术因其具有便携、快速、无损等优势,在高通量植物表型研究中显示出相当大的应用前景[3]。已有的研究成果[2,4-6]为高光谱检测作物叶绿素含量提供了科学依据,然而,这些研究大多是基于冠层单一尺度构建的作物叶绿素含量遥感估算模型,无法精确反映其在垂直方向上的分布特征。

作物在生长发育过程中,营养成分在植株体内的运转会导致其不同叶位生化组分的分布呈现一定的规律性[7]。因此,通过分层研究作物生化成分的垂直变化特征并对其进行准确估算,可以提高作物营养诊断的精确性。从已有的研究报道[8-10]来看,针对冬小麦叶绿素含量的定量遥感反演主要存在以下两方面的不足:一是在构建冬小麦叶绿素含量估算模型时往往直接采用实测的冠层叶绿素含量及冠层光谱数据,而忽略了不同层叶绿素含量在植株体内存在的垂直分布差异规律;二是在构建作物叶绿素含量遥感反演模型时直接采用原始光谱数据,未进行相应的光谱变换等预处理以减少噪声干扰,这些已成为进一步提高模型精度和改善应用效果的限制因子。

综上所述,本文基于作物叶片尺度,分层测定冬小麦上1叶、上2叶、上3叶和上4叶叶片的叶绿素含量及高光谱反射率数据,分别利用4种机器学习算法构建冬小麦不同叶位叶绿素含量的高光谱估算模型,并进行模型精度评估,以期为更加精细化评价作物长势及产量预测奠定基础。

1 估算模型构建

1.1 研究区概况

研究区位于北京市海淀区(北纬40°11′,东经116°27′),具体位置如图1所示。基地土地肥沃、地势平坦,平均海拔36 m,年均气温13℃,年均降水量507 mm,气候类型为典型的暖温带半湿润大陆季风气候。冬小麦的播种时间为2017年9月29日,本研究共设置48个试验小区,每个小区尺寸为1.2 m×1.5 m,供试品种分别为京9843和农大211。

图1 研究区地理位置Fig.1 Geographical location of study area

1.2 数据获取

在冬小麦的各个发育阶段中,抽穗期是需要生产以及追肥管理的关键时期,这一时期小麦叶片中较高的叶绿素含量可以促进作物叶片生长、延长叶片功能、提高光合效率及产量[6]。因此,选择在冬小麦抽穗期分别获取其上1叶、上2叶、上3叶和上4叶的高光谱反射率和叶绿素含量实测数据。

1.2.1分层高光谱数据采集与预处理

采用ASD FiedSpec FR2500型便携式地物光谱仪[11](光谱范围350~2 500 nm,重采样间隔为1 nm,视场角为25°)获取冬小麦不同叶位叶片的高光谱反射率数据。为了消除天空光线变化对光谱测量的影响,测量前使用BaSO4校准面板进行光谱校准[12]。测量时在每个试验小区内随机选择3棵具有长势代表性的冬小麦样本植株,从上至下依次剪取上1叶、上2叶、上3叶和上4叶的叶片,并确保叶片平整放置在背景板上,以消除背景反射和叶片弯曲引起光谱波动的影响。每个叶片样本测量10条光谱曲线,每个小区可获取30条光谱曲线。光谱数据采集完成后,利用ViewSpec Pro光谱处理软件导出无量纲的原始光谱反射率,然后计算30条光谱反射率的平均值作为各小区不同叶位叶片的光谱反射率。

1.2.2叶绿素含量数据分层获取

光谱测量完成后,将选取植株的叶片样本装入保鲜袋内,并迅速带回实验室,采用分光光度法测定其叶绿素含量。对于各小区不同叶位分别测量3个叶片的叶绿素含量,取其平均值作为该小区不同叶位的叶绿素含量。测量时,首先使用打孔器在每个叶片上取下18片直径为0.8 cm的圆叶片,使用精度为0.001 g的天平称量后,将其剪成细丝状置于盛有95%乙醇的试管中,然后加塞放置在黑暗的环境中浸泡7 d直至叶片变白,最后采用分光光度计测定叶绿素溶液在光谱波长655、649 nm处的吸光度,再根据色素分子在该波长下的消光系数计算出叶片的叶绿素质量比。

1.3 数据处理与模型构建方法

1.3.1光谱微分变换

光谱微分变换技术可以有效消除仪器自身、光照和大气效应的影响,增强不同光谱波段的对比度[13]。本研究采用Grünwald-Letnikov微分[14]形式对高光谱数据进行微分处理,其计算公式为

(1)

式中f(λ)——光谱反射率

λ——350~2 500 nm范围内的波长

Γ——Gamma函数

m——微分上下限之差

α——阶数

其中,当α为0、1、2时,分别表示原始光谱、一阶微分光谱和二阶微分光谱。

1.3.2连续小波变换

连续小波变换是采用小波基函数将高光谱数据分解为一系列不同尺度和不同波长上的小波系数[15]。本研究选择收敛速度快的Meyer函数作为小波基函数,为了减少数据冗余,选取1、2、3、4、5、6、7、8、9、10为小波系数的分解尺度。计算公式为

(2)

(3)

式中a——尺度因子b——平移因子

φa,b——小波基函数

1.3.3植被指数构建

本研究根据前人的研究成果[16-21],评估了15个高光谱植被指数用于估算冬小麦不同叶位叶片叶绿素含量的潜力。15个植被指数分别为:差值环境植被指数(DVI)[22]、优化土壤调节植被指数(OSAVI)[23]、最佳植被指数(VIOPT)[24]、归一化差异水体指数(NDWI)[25]、水体指数(WI)[26]、转化叶绿素吸收比指数(TCARI)[27]、红绿植被指数(RGVI)[28]、绿蓝植被指数(GBVI)[29]、改良的绿红植被指数(MGRVI)[30]、红绿蓝植被指数(RGBVI)[31]、绿叶面积指数(GLA)[32]、超绿超红差分指数(EXR)[33]、超绿指数(EXG)[34]、颜色植被指数(CIVE)[35]和可见光大气阻抗指数(VARI)[36]。

1.3.4模型构建方法

考虑到模型构建及预测的稳定性和鲁棒性,本研究选择75%的数据用于建模,25%的数据用于验证。筛选与不同叶位叶绿素含量相关性较强的光谱敏感波段、植被指数、小波系数作为模型输入变量,叶片叶绿素含量作为输出变量,分别基于偏最小二乘回归(Partial least squares regression,PLSR)、支持向量机(Support vector machine,SVM)、随机森林(Random forests,RF)和反向传播神经网络(Back propagation neural network,BPNN)4种机器学习算法构建冬小麦不同叶位叶片叶绿素含量估算模型,并对模型精度进行验证。

(1)偏最小二乘回归

偏最小二乘回归集中利用了多元线性回归分析、典型相关分析和主成分分析的概念[37]。该方法主要适用于含有多个自变量或多个因变量的回归分析,可以有效解决多重共线性问题并保证模型的稳定性[38]。

(2)支持向量机

支持向量机可以有效避免模型出现过拟合现象,具有良好的泛化能力和鲁棒性,目前在作物识别、分类以及小样本回归分析中得到了广泛应用[2]。

(3)随机森林

随机森林提供了一种对多个决策树的预测结果进行平均的方法,这些决策树在同一数据的不同子集上进行训练,不仅能提供更高的精度,还能有效克服单个决策树的过度拟合问题[39]。

(4)反向传播神经网络

反向传播神经网络具有较强的自学习、自组织以及自适应能力,适宜模拟较为复杂的非线性关系,目前被广泛应用于分类、拟合、压缩等领域[40]。

1.3.5模型精度评价指标

选择决定系数(Coefficient of determination,R2)、均方根误差(Root mean squared error,RMSE)和标准均方根误差(Normalized root mean squared error,NRMSE)作为模型精度评价指标。

2 结果与分析

2.1 冬小麦不同叶位叶片叶绿素含量分布及光谱响应特征

分层测定冬小麦不同叶位叶片的叶绿素含量,图2为冬小麦不同叶位所有小区平均叶绿素质量比的分布特征。

图2 不同叶位叶片叶绿素含量分布Fig.2 Plot of chlorophyll content distribution of leaves at different leaf positions

由图2可知,不同叶位叶片叶绿素含量随叶位的升高呈现逐渐上升的趋势。这是由于上层叶片光合作用强度较大,而下层叶片接收到的光照较少,因而光合作用较弱,叶绿素含量相对较低。

分层测定冬小麦抽穗期上1叶、上2叶、上3叶和上4叶不同叶位叶片的高光谱反射率数据,并绘制不同叶位叶片的原始光谱反射率变化曲线,如图3所示。

由图3可知,上1叶、上2叶和上3叶叶片的原始光谱反射率曲线较为接近,而上4叶叶片的原始反射率曲线与它们的差异较大,总体表现为随着叶位升高叶片光谱反射率逐渐增强。其中,不同叶位叶片原始光谱反射率在波段750~1 300 nm和1 400~1 900 nm之间出现明显差异性,反射率由大到小依次为上1叶、上2叶、上3叶、上4叶,其他波段范围内,不同叶位叶片的光谱反射率及其变化趋势基本相似。

图3 不同叶位叶片的原始光谱响应曲线Fig.3 Raw spectral response curves of leaves at different leaf positions

2.2 不同叶位叶片叶绿素含量与光谱参数的相关性分析

2.2.1与变换光谱反射率的相关性分析

将原始光谱分别进行一阶微分(First-order differential,FD)和二阶微分(Second-order differential,SD)光谱变换,并将原始光谱、不同变换光谱与不同叶位叶绿素含量进行相关性分析,筛选相关系数的绝对值(|ρ|)较大的前5个波长(λ)作为敏感波长,结果如表1所示。

表1 与不同叶位叶片叶绿素含量相关性强的前5个光谱波长Tab.1 The first five spectral bands with strong correlation with chlorophyll content in leaves at different leaf positions

分析表1可知,整体上看,光谱反射率与不同叶位叶绿素含量的相关性呈现随叶位的下降而逐渐降低的趋势。其中,上1叶敏感波段集中在二阶微分和原始光谱的近红外波段(640~790 nm),|ρ|最大为0.73;上2叶敏感波段集中在一阶微分和原始光谱的可见光波段(360~370 nm)和近红外波段(690~710 nm),|ρ|最大为0.68;上3叶敏感波段主要集中在一阶微分光谱的可见光波段(360~370 nm)和中红外波段(1 890~1 900 nm),|ρ|最大为0.67;上4叶敏感波段集中在二阶微分中红外波段(1 450~1 460 nm),|ρ|最大为0.63。

2.2.2与植被指数的相关性分析

利用选取的植被指数与不同叶位叶片叶绿素含量进行相关性分析,筛选出不同叶位相关系数的绝对值较大的前5个植被指数用于构建叶片叶绿素含量估算模型,结果如表2所示。

分析表2可知,整体上看,上1叶叶绿素含量与植被指数相关性最高,其他叶位叶绿素含量与植被指数相关性相当。其中,与上1叶叶绿素含量相关性最大的植被指数分别为EXR、GLA、RGBVI、GBVI和EXG,|ρ|最大均为0.75;与上2叶叶绿素含量相关性最大的植被指数分别为VARI、GBVI、RGVI、MGRVI和EXR,|ρ|最大均为0.66;与上3叶叶绿素含量相关性最大的植被指数为WI,|ρ|最大达到0.75;与上4叶叶绿素含量相关性最大的植被指数为WI,|ρ|最大可达0.65。

表2 与不同叶位叶片叶绿素含量相关性强的前5个植被指数Tab.2 The first five vegetation indices with strong correlation with chlorophyll content in leaves at different leaf positions

2.2.3与小波系数的相关性分析

利用连续小波变换将原始光谱反射率转换为小波系数,对应10个尺度。将小波系数与不同叶位叶片叶绿素含量进行敏感性分析,绘制不同叶位小波系数与叶片叶绿素含量的相关性分布图,结果如图4所示。基于相关性分析结果,筛选不同叶位对应的前5个敏感小波系数用于构建叶绿素估算模型,结果如表3所示。

图4 不同叶位小波系数与叶绿素含量的相关性矩阵图Fig.4 Correlation matrix between wavelet coefficients and chlorophyll content at different leaf positions

表3 与不同叶位叶片叶绿素含量相关性强的前5个小波系数Tab.3 The first five wavelet coefficients with strong correlation with chlorophyll content in leaves at different leaf positions

分析图4和表3可知,整体上看,不同叶位叶片叶绿素含量与小波系数的相关性随叶位升高而增强,上1叶和上2叶叶绿素含量与小波系数的相关性相当,且相关性最强。对于不同叶位,在1 500~2 500 nm波段,上1叶的全局敏感指数最高,对应尺度为2、3、4、5、6,上1叶叶绿素含量与小波系数相关性最大的系数主要集中在波段1 730~1 740 nm,|ρ|最大为0.88,对应尺度为4;在1 800~2 500 nm波段范围,上2叶的全局敏感指数最高,对应尺度为3、4、5,上2叶叶绿素含量与小波系数相关性最大的系数主要集中在波段1 730~1 740 nm,|ρ|最大为0.88,对应尺度为3;在波段500~1 000 nm,上3叶的全局敏感指数最高,对应尺度为3、4、5、7、8、9,上3叶叶绿素含量与小波系数相关性最大的系数主要集中在波段550~560 nm,|ρ|最大为0.83,对应尺度为9;在波段1 500~2 500 nm范围,上4叶的全局敏感指数最高,对应尺度为2、3、4,上4叶叶绿素含量与小波系数相关性最大的系数主要集中在波段2 000~2 500 nm,|ρ|最大为0.79,对应尺度为3。

2.3 不同叶位叶片叶绿素含量估算模型构建及模型精度验证

2.3.1基于变换光谱构建估算模型

利用表1筛选出的敏感变换光谱波段作为模型输入特征,分别基于PLSR、SVM、RF、BPNN 4种机器学习算法,构建冬小麦不同叶位叶片叶绿素含量估算模型,并对模型进行精度评定,结果如表4所示。

表4 基于变换光谱的不同叶位叶片叶绿素含量估算模型精度Tab.4 Accuracy of chlorophyll content estimation model at different leaf positions based on transform spectrum

由表4可知,叶片叶绿素含量的估算精度整体上随叶位的升高呈现逐渐上升的趋势。其中,上1叶叶绿素含量估算的最佳模型为BPNN,其建模和验证R2分别为0.64和0.50;上2叶叶绿素含量估算的最佳模型为BPNN,其建模和验证R2分别为0.43和0.57;上3叶叶绿素含量估算的最佳模型为BPNN,其建模和验证R2分别为0.49和0.60;上4叶叶绿素含量估算的最佳模型为PLSR,其建模和验证R2分别为0.44和0.35。

2.3.2基于植被指数构建估算模型

利用表2筛选出的敏感植被指数作为模型输入特征,分别基于PLSR、SVM、RF、BPNN 4种机器学习算法,构建冬小麦不同叶位叶片叶绿素含量估算模型,并对模型进行精度评定,结果如表5所示。

表5 基于植被指数的不同叶位叶片叶绿素含量估算模型精度Tab.5 Accuracy of chlorophyll content estimation model at different leaf positions based on vegetation indices

由表5可知,上1叶叶绿素含量估算的最佳模型为SVM,其建模和验证R2分别为0.85和0.73;上2叶绿素含量估算的最佳模型为PLSR,其建模和验证R2分别为0.67和0.72;上3叶叶绿素含量估算的最佳模型为BPNN,其建模和验证R2分别为0.66和0.62;上4叶叶绿素含量估算的最佳模型为SVM,其建模和验证R2分别为0.74和0.79。

2.3.3基于小波系数构建估算模型

利用表3筛选出的敏感小波系数作为模型输入特征,分别基于PLSR、SVM、RF、BPNN 4种机器学习算法,构建冬小麦不同叶位叶片叶绿素含量估算模型,并对模型进行精度评定,结果如表6所示。

由表6可知,整体上看上1叶和上2叶估算精度相当,且估算精度最高,上3叶和上4叶叶绿素估算精度次之。上1叶、上2叶、上3叶、上4叶叶绿素含量估算的最佳模型均为PLSR,其建模R2分别为0.82、0.80、0.71和0.74,验证R2分别为0.75、0.77、0.62和0.70。

表6 基于小波系数的不同叶位叶片叶绿素含量估算模型精度Tab.6 Accuracy of estimation model of chlorophyll content at different leaf positions based on wavelet coefficients

3 讨论

随着作物的生长发育,营养成分会在植物体内发生转移,导致不同叶位叶片的叶绿素含量存在垂直异质性[7]。本文研究也验证了这一点,即叶绿素含量自上而下逐渐降低,且光谱反射率随着作物叶绿素含量的变化,呈现不同的光谱响应特征(图2、3),整体上表现为不同叶位光谱反射率随叶绿素含量的减少而逐渐降低,其中上4叶的光谱反射率差异性更明显。这是因为作物的茎叶是自下而上生长的,因而作物下层叶片会先生长而先衰老,叶绿素含量也会随之减少,而中上部叶片的叶龄接近,因而光谱反射率的差异较小[41]。

本文研究发现将原始光谱采用一阶和二阶微分光谱变换处理后,光谱与不同叶位叶片叶绿素含量的相关性显著增强,相关系数绝对值最高可达0.73。这主要是因为高光谱数据采集过程中会受光照、大气效应和背景等因素的影响,致使原始光谱存在噪声,影响敏感信息的提取,光谱微分技术能够部分消除环境因素的干扰,有效增强植被的本质特征,这与蒋金豹等[42]的研究结论一致。由于可见光波段和近红外波段对叶绿素含量的变化更加敏感,因而在敏感特征参数的筛选中与不同叶位的叶绿素含量表现出更强的相关性,这与王纪华等[10]的研究结果一致。

为了提高不同叶位叶绿素含量的准确性,本研究分别评估了光谱变换波段、植被指数和小波系数用于估算叶绿素含量的潜力。整体上看,小波系数与叶绿素含量的相关性最强,植被指数次之。综合分析基于不同光谱特征参数的模型精度评定结果可知,上1叶、上2叶、上3叶均为基于小波系数构建的估算模型精度最高,不同叶位叶绿素含量估算模型的建模和验证R2的最大值分别达到0.82和0.77,这与前人研究结论[43-45]一致。这是由于小波变换技术能够通过伸缩平移运算,将光谱信息分解成不同频率的子信息,对光谱信息逐步进行多尺度细化,深度挖掘并提取光谱信号中隐藏的弱信息,有效利用光谱信息的整体结构特征,实现对光谱特征更精确的局部描述和分离[46]。

本研究采用4种机器学习算法预测冬小麦不同叶位叶片的叶绿素含量,精度评定结果均显示上1叶的预测效果最佳。这与上部叶片对冠层光谱贡献最大,且随着叶位降低,叶片对冠层光谱的贡献逐渐减少有关。该结论与XIAO等[47]的研究结论高度吻合。综合分析不同机器学习方法用于不同叶位叶绿素含量估算模型的结果发现,PLSR表现出最好的预测能力,这是因为PLSR在回归建模过程中采用了数据降维、信息综合与筛选技术,能够有效提取对系统有最佳解释能力的新综合成分[37]。

然而,本研究仅讨论和研究了抽穗期冬小麦植株不同叶位叶绿素含量的估算方法,且田间试验区域较小。因而为了更加准确地研究冬小麦的长势状况,未来还需在大田试验中增加供试品种,并针对作物不同生育期进行动态试验验证,以期为开展作物冠层整体动态诊断提供参考。

4 结论

(1)叶绿素含量随叶位的升高而逐渐升高,光谱反射率随着作物叶绿素含量的减少而呈现逐渐降低的趋势。

(2)将原始光谱经过光谱微分变换、小波变换处理或者用于植被指数的构建均可以显著增强光谱反射率与不同叶位叶片叶绿素含量的相关性,整体上看,小波系数与叶绿素含量之间的相关性最强,植被指数次之。

(3)冬小麦上1叶、上2叶和上3叶均采用小波变换结合PLSR的方法构建的叶绿素含量估算模型精度最高,建模和验证R2分别为0.82和0.75、0.80和0.77、0.71和0.62;上4叶采用植被指数结合SVM的方法构建的模型估算效果最好,建模和验证R2分别为0.74和0.79。研究可为基于遥感技术精细化监测作物长势及产量奠定基础。

猜你喜欢

植被指数反射率冬小麦
中红外波段超广角抗反射微纳结构的研究
车灯反射腔真空镀铝反射率研究
2022年山西省冬小麦春季田间管理意见
冬小麦田N2O通量研究
冬小麦的秘密
如冬小麦般耐心
浅谈植被指数的分类与应用
高光谱遥感数据下城市植被碳汇的研究
分步催化制备纳米SiO2减反射膜的性质与结构研究