APP下载

基于机器学习的春小麦叶片水分含量高光谱估算

2022-05-20热依拉艾合买提吾木提艾山江阿不都艾尼阿不里尼加提卡斯木

麦类作物学报 2022年5期
关键词:植被指数春小麦波段

热依拉·艾合买提,吾木提·艾山江,阿不都艾尼·阿不里,尼加提·卡斯木

(1.伊犁师范大学生物与地理科学学院,新疆伊宁 835000;2.浙江大学农业遥感与信息技术应用研究所,杭州 310058;3.浙江省农业遥感与信息技术重点研究实验室,浙江杭州 310058;4.新疆大学资源与环境科学学院,新疆乌鲁木齐 830046)

水分对植物生长发育不可或缺。叶片水分含量(leaf water content,LWC)是反映作物生理动态的重要指标之一,可为作物长势、旱情、抗病性等评估提供参考依据。因此,快速准确地提取作物叶片水分含量对干旱半干旱地区作物旱情诊断具有重要的指导意义。

随着高光谱遥感技术的迅速发展,其因为快速、无损、高效等特点被广泛用于地上生物量、叶片氮磷含量、LAI等作物重要参数的定量估算,并体现了明显的优势。高光谱技术也被用于作物水分快速监测。研究表明,小麦LWC对近红外(NIR)波段光谱吸收特征参量存在一定的影响。作物水分的吸收光谱主要在970、1 200、1 450、1 940和2 500 nm周边,利用光谱数据的一阶导数变换能提升小麦叶片水分相对含量与吸收光谱的相关性。作物LWC的估算通常采用植被指数的经验模型。王延仓等结合野外高光谱数据进行连续小波变换预处理,并筛选特征敏感波段和光谱指数计算(NDVI、PWI、RVI等),基于偏最小二乘法(partial least squares regression,PLSR)构建了冬小麦LWC定量反演模型;陈秀青等在冬小麦叶片和冠层两种尺度下,将竞争自适应重加权采样方法与PLSR回归方法相结合,采用两波段植被指数如NDSI和RSI对LWC进行估算,且取得较好的估算效果。刘晓静等对RVI、NDVI、R/ND、OSAVI、冠气温差等5种光谱参数与冬小麦不同生育时期LWC进行拟合分析,并得到较好的拟合效果。目前,作物LWC的高光谱估算主要是基于高光谱数据不同预处理方式的单一波段反射率和传统植被指数为数据源,结合多种回归模型来构建最佳监测模型,而利用对高光谱数据构建的植被指数进行组合并进行优化有待研究,且在植被指数波段优化模式下,对不同机器学习算法效果的对比分析研究较少。

由于环境因素的影响,作物水分状况会发生变化,也表现出不同的冠层光谱反射特征。在不同环境条件下,作物冠层结构会有所不同,从而引起单一波段或固定波长植被指数在不同区域对作物叶片含水量的敏感程度存在一定的差异,使作物水分监测模型的普适性和适应性变差。因此,有必要对作物冠层高光谱反射率全波段信息进行自由组合,进而构建适宜植被指数,以增加模型参数的敏感性。因此,本研究选取春小麦抽穗期叶片水分数据及高光谱数据,分析基于春小麦LWC与单一波段反射率、水分植被指数及两波段组合植被指数之间的定量关系,比较其拟合效果,筛选最佳波段组合植被指数,并比较三种机器学习算法(SVM、ANN和KNN)估算模型的预测精度,以期为干旱区域田间尺度春小麦水分状况快速、准确评估提供参考依据。

1 材料与方法

1.1 研究区概况

研究区属于科学实验基地,位于新疆阜康市上户沟乡滋泥泉子镇北部(88°22′~88°29′E,44°23′~44°22′N),占地面积为480 hm,周围均为主要播种小麦、玉米等农作物的大型农场。该地区是典型的旱作农业区,也是新疆主要粮食基地。气候类型属于典型的中温带大陆性干旱气候,其特点是四季分明,冬天冷夏天热,春秋气温变化较剧烈,降水量少、季节分配不均匀且主要集中在春夏季,光热条件充足。图1为研究区春小麦播种区域和采样部分,播种区域均匀铺设滴灌设施,水肥管理参照当地春小麦施肥灌溉方案;黄色部分为正方形采样区(1 m×1 m),共154个。在小方框范围内进行春小麦冠层叶片光谱反射率测定和叶片取样,每个小区光谱测定重复10次。

图1 数据采样区域

1.2 数据获取与处理

春小麦不同叶位中,顶部叶片含水量与反射光谱之间的定量关系较好。因此,2017年6月对春小麦顶一叶和顶二叶进行采样,并立刻放于密封塑料袋中且做好标签,保证其水分不受到损失,每个小区重复采样10次。样品采集和冠层高光谱数据同时进行。样品先用电子天平(0.000 1 g)称取鲜重(fresh weight,FW),再在105 ℃下杀青30 min后,放入烘干箱(温度为80 ℃)烘干36 h,最后称取干重(dry weight,DW),并计算叶片含水量[LWC=(FW-CW)/FW×100%]。

利用美国的ASD FieldSpec-3光谱仪(波段范围为350~2 500 nm)采集小麦冠层高光谱数据,数据在350~1 000 nm和1 000~2 500 nm范围内分别间隔为1.4 nm和2.0 nm重采样后可达到1 nm。数据采集当日天气晴朗无云,时间为12:00-14:00,每隔5 min进行白板校正。每个样品重复采集10次光谱曲线,取其平均值作为样品的冠层光谱数据。

1.3 两波段植被指数的筛选

两波段植被指数包括两波段组合植被指数和传统水分植被指数,通过对光谱全波段信息两两组合计算,并进行波段组合优化获得。本研究选取了3种两波段组合植被指数(表1)。两波段组合计算过程通过Java平台上开发的软件(two-band combination of optimized indices,V1.0.登记号:2018SR281300)实现。本研究通过文献统计方法选取了12个传统水分植被指数(表2)。

表1 两波段组合植被指数

表2 传统水分植被指数

1.4 估算模型的建立与验证

本研究把154个点的采样数据随机分为建模集(123个,占总数据的80%)和验证集(31个,占总数据的20%)。

利用人工神经网络(artificial neural network,ANN)、K近邻(K-nearest neighbors,KNN)和支持向量回归(support vector regression,SVR)三种机器学习算法构建模型。ANN是指由大量的处理单元(神经元)互相连接而形成的复杂网络结构,是对人脑组织结构和运行机制的某种抽象、简化和模拟,以数学模型模拟神经元活动,是基于模仿大脑神经网络结构和功能而建立的一种信息处理系统。KNN是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路非常简单直观:如果一个样本在特征空间中的个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。SVR是支持向量机(support vector machine,SVM)算法来计算出来的回归方法,是输入标签是连续值时选取的模式。

利用决定系数()、均方根误差(root mean square error,RMSE)和相对偏差百分比(relative percent deviation,RPD)对所建立的模型进行稳定性和预测能力检验。越高,表明模型的线性关系越强。RMSE越小,表明测量数据和预测数据之间的误差低。RPD是标准偏差(SD)与估计标准误差(SEP)之间的比率。RPD的值超过 2.0,说明该模型具有较好的预测能力;RPD值在 1.4到 2.0之间,说明模型具有一般的预测能力;RPD值小于1.4,说明模型的预测能力较差。

RPD=SD/SEP

2 结果与分析

2.1 LWC统计分析及其对高光谱的响应

经统计分析,总数据集、建模集和验证集的LWC变化范围分别为64.94%~91.54%、64.94%~85.26%、69.56%~91.34%,标准差分别为3.56%、3.15%和4.83%;变异系数分别为 4.58%、4.06%和6.15%,三个数据集的变异系数相近(图2)。

图2 春小麦叶片含水量(LWC)统计分析

Pearson相关性分析(图3)发现,春小麦冠层光谱反射率与LWC呈极显著相关(<0.01),相关系数()为-0.2~0.23。其中,在400~720 nm波段范围内二者呈负相关,在720~1 300 nm波段范围内则呈正相关。相关系数通过0.05显著性检验的波段范围分别为400~410 nm、760~980 nm和1 020~1 120 nm,而相关系数通过 0.01显著性检验的波段主要集中在780~930 nm。从上分析可知,对春小麦LWC敏感的光谱波段区域主要为400~1 300 nm,单波段反射率信息虽然明显存在敏感波段区域,但与春小麦叶片水分含量的相关程度较弱。因此,需要通过植被指数的波段优化计算来进一步探讨其对LWC之间的关联程度。

图3 小麦LWC与光谱反射率之间的相关性

2.2 水分含量与植被指数的相关性

对12种传统植被指数与LWC进行相关性分析,结果(表3)表明,植被指数与LWC显著相关,均通过了0.05或0.01显著性水平,相关系数为-0.22~0.30。其中,FWBI与LWC的相关系数最大,为0.30。这表明传统光谱指数对LWC的敏感性较低。

表3 传统植被指数与小麦LWC的相关性

在400~1 300 nm波段范围内,通过对两波段光谱植被指数(比值植被指数RVI、归一化植被指数NDVI和差值植被指数RVI)进行组合运算,并借助MATLAB环境分别绘制了小麦LWC与DVI、NDVI和RVI之间的二维Pearson相关性可视化热图,结果(图4)表明,三种光谱指数对小麦LWC的敏感波段区域比较相似,相关性大致在近红外(800~1 000 nm)波段区域表现突出,相关系数的绝对值均达到了0.60(<0.01),相关程度较传统的水分植被指数明显提高,因此可通过两波段光谱指数的运算寻找对小麦LWC更加敏感的波段组合。

a:DVI; b:NDVI; c:RVI.

2.3 模型建立与验证效果

从相关分析结果看,原始光谱、传统水分植被指数和两波段组合植被指数对LWC敏感性存在一定的差异,其中波段组合植被指数的敏感性最高,而原始光谱数据最低。但为了更全面反映相关信息,3种数据均参与建模过程,并对参与变量进行了筛选,数据分别包括波长769~924 nm对应的154个原始光谱反射率信息、12种水分植被指数及最佳波段组合的植被指数(DVI、RVI、NDVI)。

从建模效果(表4)看,在同一种算法下,利用3种数据所建的模型的和RMSE存在明显的差异,其中基于原始光谱数据敏感波段和12种传统水分植被指数的较低,RMSE较高,建模效果较差,而基于两波段组合植被指数的建模效果相对较好。对于同一类数据而言,三种算法中,KNN算法的建模效果最好。

表4 春小麦LWC估测建模与验证

利用独立数据对模型验证的结果(表4和图5)表明,三种数据所建模型的预测精度也存在差异,也是基于两波段组合植被指数的预测效果好于其他两类数据,且以KNN算法较好,其= 0.64,RMSE=2.35%,RPD=2.01。

图5 春小麦LWC的观测值与预测值散点图

3 讨 论

抽穗期是小麦对水分需求的临界期,也是决定小麦小花数量以及小花发育程度的重要时期,它对后期的麦穗和籽粒形成起着决定性作用。水分的调节状况直接影响到春小麦品质和产量,因此快速准确地监测春小麦叶片含水量具有重要的理论和现实意义。目前为止,诸多研究通过数学的方法对高光谱数据进行不同的预处理,并进行多种植被指数的计算,采用统计学分析方法完成敏感波段和植被指数的筛选,结合不同的回归算法构建了冬小麦叶片含水量的估算模型。由于高光谱的数据量大,连续性强,而且不同植被指数具有各自不同的特点。因此,以往研究对高光谱植被指数的波段优化计算和最为有效合理植被指数的筛选较少,尤其是基于波段优化计算和机器学习算法的春小麦叶片含水量监测模型研究方面少见。

本研究选取抽穗期春小麦叶片水分含量为研究对象,基于野外叶片冠层高光谱数据,提取和筛选光谱特征波段和敏感水分植被指数,对DVI、RVI、NDVI等植被指数进行波段组合优化计算,采用SVM、ANN和KNN等机器学习算法,构建了春小麦叶片水分含量高光谱定量估算模型。结果表明,春小麦抽穗期叶片含水量与冠层高光谱反射率()、12种传统水分植被指数均显著相关(<0.01),这与前人研究结果一致;与传统水分植被指数相比,通过波段组合和有效优化,在800~1 000 nm区间两波段自由组合的光谱参数(RVI、NDVI、DVI)对叶片含水量的敏感性明显提升;与原始光谱(,共154个反射率信息)、传统12种水分植被指数相比,以RVI、NDVI、DVI为自变量,利用KNN算法构建的春小麦叶片含水量估算模型的拟合效果最佳,决定系数为为 0.64,RMSE为2.35,RPD为2.01,说明两波段光谱指数的有效计算和KNN算法在作物叶片水分高光谱遥感估算领域具有一定的优势。

虽然本研究以春小麦冠层高光谱数据为数据源,选取最佳波段组合的植被指数,建立了基于机器学习算法的春小麦叶片水分含量估算模型,并取得了较好的预测效果,但研究中仍存在不足之处:基于1 nm分辨率的高光谱数据,通过自由波段组合运算能够有效地获得最佳敏感植被指数,而春小麦叶片含水量敏感指数在其他的生长阶段也有所差异,构建的最佳波段范围可能会发生变化。本研究数据仅局限于春小麦抽穗期,需要进一步获取其他生长阶段的叶片水分和高光谱冠层数据,进而对春小麦叶片含水量估算模型进一步验证与修正,以提高估算模型的普适性与实用性。

猜你喜欢

植被指数春小麦波段
最佳波段组合的典型地物信息提取
鲁棒多特征谱聚类的高光谱影像波段选择
呼和浩特市土默特左旗春小麦播种发育期、理论产量与气象要素关系
绿色农产品春小麦主要虫害防治技术
克什克腾旗旱地优质春小麦高产栽培技术探讨
利用小波分析对岩石图像分类
浅谈植被指数的分类与应用