APP下载

干旱胁迫下冬小麦植株含水量的高光谱监测

2022-12-14闫晓斌杨武德冯美臣肖璐洁宋晓彦张美俊

山西农业科学 2022年12期
关键词:冬小麦波段预处理

张 月,张 煊,闫晓斌,杨武德,冯美臣,肖璐洁,宋晓彦,张美俊,王 超

(山西农业大学 农学院,山西 太谷 030801)

植株含水量(Plant water content,PWC)是表征植物水分状况最直接的指标,也是农户进行田间灌溉的重要参考。当前,干旱已经成为影响作物生产的重要农业灾害之一[1-2],干旱发生后,能否实时、快速、无损地掌握干旱条件下作物水分含量,是进行有效农田灌溉管理从而减缓干旱对作物生产影响的关键,同时也可为监测大田作物的长势状况提供一定参考。

高光谱技术具有快速、无损、高效获取目标属性的优点[3]。近年来,众多研究者利用高光谱技术致力于构建植株生理指标的高光谱准确诊断模型,从融合植被指数建立反演模型[4]、寻找最优建模方法预测生理指标[5]、发掘新的变量选择方法[6]和构建综合指标[7]等多种角度进行了研究。已有研究开展了灌溉处理下作物水分特性及长势的光谱估算,证实了在适宜水分处理下高光谱与作物水分的响应特性及定量监测效果[8]。在干旱胁迫下,作物生长发育进程会受阻,同时作物冠层结构、叶片颜色、细胞结构、酶活等生理生化特性也会发生相应变化[9]。而干旱胁迫下高光谱技术能否响应作物水分状态、有何响应特性、能否定量估算是值得进一步探究的。但提高目标属性的光谱监测精度一直是光谱领域研究的核心和热点,同时也是限制光谱技术能否应用于生产实践的关键。孙乾等[10]研究中提到光谱数据获取过程中极易受到杂散光、样品背景、周围环境等因素的影响,从而降低光谱信息的准确性和有效性,且高光谱数据信息多和波段变量之间冗余情况严重,都会对模型的估算精度产生干扰和影响。JIANG等[11]研究证实,对高光谱数据进行预处理可以在一定程度上降低噪音影响和提高信噪比,这是提高模型精度的有效途径之一。而当前光谱预处理方法众多,最优预处理结果和效果各异。此外,HE等[12]研究证实,挖掘和提取目标属性的高光谱敏感特征波段,有助于揭示和解释目标属性的高光谱响应机理,同时实现光谱数据降维,也是建立高精度模型和实践应用性模型的主要思路。就估算模型类型来讲,基于全谱信息的估算模型一般具有较好的估算效果,但SEQUEIRA等[13]研究指出,因其包含了许多无效信息,不可避免地影响到模型估算精度,同时,全谱模型因其变量多、信息量大,其运算效率对实践应用构成了一定的挑战。基于光谱特征的估算模型虽可以克服以上缺点[14],但是模型精度有待进一步提升。

本研究以冬小麦干旱胁迫试验为基础,采用不同高光谱预处理结合不同建模方法,实现对干旱胁迫下冬小麦植株含水量的监测和预测,主要包括:干旱胁迫下冬小麦植株含水量的高光谱特征及响应特性;光谱预处理对高光谱监测冬小麦植株含水量的影响;构建冬小麦植株含水量的高光谱监测模型,从而实现干旱胁迫下冬小麦植株含水量的高效、准确监测。

1 材料和方法

1.1 试验材料

供试小麦品种为长6878(V2)和长4738(V1)。

1.2 试验设计

本试验在农业部华北黄土高原作物栽培与耕地保育科学观测实验站进行。该地区属于温带大陆性气候,年平均无霜期为179 d,年平均降水量为397.1 mm,年平均气温为10.4℃。试验地设有可移动电动防雨棚,可避免自然降雨的影响,棚内小区面积9 m2(3 m×3 m),每个小区四周安装深度为2 m的PVC防渗板。试验采用完全随机区组设计,设计小区分布如图1所示。分别在拔节期—抽穗期和开花期—灌浆期进行干旱胁迫处理:田间持水量在拔节期—抽穗期为75%,在开花期—灌浆期分别保持65%(T1)、55%(T2)和45%(T3);在开花灌浆期为75%时,在拔节期—抽穗期分别保持65%(T4)、55%(T5)和45%(T6);以2个时期处理均保持正常灌溉75%的持水量作为对照(图1)。控水处理过程中,为尽可能保证各处理小区中的土壤水分状况处于目标水分处理条件,针对每一处理水平,每隔2 d测定该处理中0~20 cm的土壤含水量一次,并换算为当前土壤水分占田间持水量的百分比,然后根据该处理的目标田间持水量,计算当前该处理条件下需要灌溉的水量。全生育期预防自然降水,其他管理措施相同。

图1 试验设计的小区分布及控水处理方案Fig.1 Plot distribution map and water control treatment details of experimental design

1.3 数据获取

根据冬小麦干旱胁迫试验中控水处理的时期,在冬小麦抽穗末期(第1期控水结束时)、灌浆中期(第2期控水期间)和灌浆末期(第2期控水结束时)采集其冠层光谱和获取PWC。

1.3.1 高光谱数据采用美国ASD公司生产的FieldSpec 3型背挂式野外光谱仪获取冬小麦冠层高光谱数据,波长范围为350~2 500 nm。350~1 000 nm采样间隔为1.4 nm,光谱分辨率为3 nm,在1 000~2 500 nm采样间隔与光谱分辨率分别为2、10 nm。光纤视场角度为25°。冬小麦冠层高光谱的测定需选择天气晴朗、风力小于3级的天气条件。测定时间为11:00—13:00,测定时光谱探头垂直向下,距目标冠层的垂直高度为1 m。每次测量获取9个光谱数据,各小区选择3个测量样点,测量过程中,需用标准白板进行不间断校正。

1.3.2 PWC数据在获取冠层光谱的位置,采集冬小麦植株样本。取0.02 m2样方内的冬小麦植株,去除根部后迅速装入密封袋内,称取鲜生物量(AGFB),之后放入已称质量的牛皮纸袋中,于105℃烘箱中杀青0.5 h,然后于80℃烘箱中干燥至恒质量,迅速称其干生物量(AGDB),计算植株含水量(PWC)。

1.4 数据处理与分析

共获取126个样本数据,其中,5个样本的冠层光谱数据不具备绿色植被的典型光谱特性,另外2个样本的PWC数据为负值,因此,在研究分析中特将该7个样本数据进行删除,最终得到119个样本数据。

此外,冠层光谱数据获取过程中,大气水汽等环境因素会造成1 350~1 400、1 800~1 950 nm光谱区域数据的剧烈无规则波动,同时由于光谱仪噪音和背景的存在,会影响到首末端350~399、2 451~2 500 nm光谱信息[15],因此,从原始光谱数据中删除以上4个光谱区域用于进一步数据分析。

1.4.1 预处理方法当前较为广泛的预处理方法可以分为散射校正方法(MSC、NC、SNV等)和微分处理方法(1st、2nd等)2类,其中,多元散射校正(MSC)主要用于消除颗粒分布不均匀产生的散射影响;归一化处理(NC)常用于微小光程差异引起的光谱变化;标准正态变量(SNV)作用与MSC相似;一阶微分(1st)、二阶微分(2nd)可以有效消除基线和背景因素的干扰[16]。故本研究采用MSC、NC、SNV、1st、2nd等5种预处理方法对原始光谱数据进行处理。

1.4.2 连续投影算法(SPA)SPA是用矢量投影分析来最大程度地消除频谱中的冗余信息,并经过反复采样和检查,当估算误差(RMSE)最小时,进入模型中的自变量就被认为与因变量具有重要的关系。在高光谱分析中常采用SPA方法来提取和选择能够表征目标属性的波段,该波段一般被认为是目标属性的特征波段。

采用SPSS 26.0进行描述性统计分析,采用MATLAB 2010a进行相关性、特征波段提取和建模分析,采用Origin 2020b作图。

1.5 模型构建方法

1.5.1 偏最小二程回归(PLSR)PLSR通过输入所有光谱波段,从解释变量的矩阵中选择不相关变量,因其能够有效克服数据的共线性、频带重叠和交互等常见问题,而广泛应用于高光谱数据的定量分析中[17]。通过MATLAB 2010a中使用pls库编写的程序进行PLSR建模,综合考虑因子个数及标准偏差确定最佳因子个数,并得出该因子个数下PLSR模型的决定系数(R2)、标准偏差(RMSE)和预测均方根误差比(RPD)。

1.5.2 多元线性回归(MLR)MLR是通过确定因变量和多个自变量以及他们之间的关系,设定自变量参数的回归方程进行预测,其所建模型简单、易于解释,但受变量共线性的影响较大。在MATLAB 2010a中进行特征波段提取后,利用Excel的数据分析功能构建校正集和验证集的MLR模型。

使用决定系数(R2)、标准偏差(RMSE)和预测均方根误差比(RPD)来作为模型的评价指标。模型预测精度采用R2和RMSE进行表征,R2越大、RMSE越小,说明模型预测精度越高;模型稳定性采用RPD来检验,一般认为RPD小于1.4时,模型难以对样本进行有效预测;RPD介于1.4~2.0时,模型可以对样本进行粗略地预测;RPD大于等于2时,模型预测效果极好。

式中,n代表数据样本个数,Y'i、Yi和分别表示预测值、实测值和平均值,SD表示实测值的标准误差。

2 结果与分析

2.1 冬小麦PWC的描述性统计分析

将119个植株含水量样本数据从低到高进行排序,按照2∶1分配标准划分为校正集(n=80)和验证集(n=39),各数据集PWC的描述性统计分析如表1所示。

表1 冬小麦PWC的描述性统计分析Tab.1 Description statistical analysis of winter wheat PWC

由表1可知,总样本的PWC最小值和最大值分别为55.7%和86.8%,样本数据的全距较大,标准差为8.00%,变异系数10.5%,表明数据样本的整体异质性较大;验证集样本PWC全距基本包含在校正集中,为建立冬小麦PWC高光谱监测模型奠定了数据基础。且各数据集偏度处于-0.88附近,具有一定的负偏性,但呈近似正态分布型,可对数据进行进一步分析和建模。

2.2 预处理冠层高光谱与冬小麦PWC的相关性分析

将原始光谱进行MSC、NC、SNV、1st、2nd等5种预处理,分析冬小麦PWC与原始光谱(R)和预处理光谱之间的相关关系,并进行显著性和极显著性水平的检验,以更好地凸显不同预处理光谱条件下光谱波段与冬小麦PWC的相关关系,以及对比和评价预处理方法对预处理光谱和冬小麦PWC相关性的影响,结果如图2所示。

图2 冬小麦PWC与不同预处理冠层高光谱的相关分析Fig.2 Correlation analysis between the PWC of winter wheat and the different preprocessed canopy hyperspectra

由图2可知,原始光谱(R)与冬小麦PWC的相关性整体呈负相关关系,最大相关系数为-0.626,极大负相关系数出现在690、1 410、2 000 nm;MSC的预处理光谱在720~1 170 nm范围内与PWC呈正相关关系,其他波段区域呈负相关,极大正相关和负相关系数分别为0.767和-0.780,出现在740、1 510 nm;NC的预处理光谱在710~1 340 nm范围内与PWC呈正相关关系,其他波段区域呈负相关关系,极大正相关和负相关系数分别为0.784和-0.771,出现在735、1 495 nm;对于SNV来讲,400~1 060 nm光谱区域与PWC呈正相关,而1 060~2 450 nm光谱与PWC呈负相关,其中,正相关系数和负相关系数的极值分别为0.751和-0.789,分别出现在740、1 510 nm;而对于1st和2nd微分处理光谱,其相关性随着波长的波动性较为剧烈,其中1st预处理光谱的正相关系数和负相关系数的极值分别出现在0.479和-0.780,对应波长分别为970、680 nm,而且在光谱区域400~880 nm与冬小麦PWC的相关性要优于其他预处理光谱和原始光谱;2nd预处理光谱的正相关系数和负相关系数的极值则分别为0.692和-0.705,出现在570、680 nm;以上各预处理光谱条件下的相关系数出现极值所对应的光谱波段都达到了显著或者极显著水平,且整体来看,与冬小麦PWC相关性较高的光谱波段出现在:570、680、740、970、1 410、1 510、2 000 nm,且这些波段都达到极显著水平,以上结果可为进一步定量化提取的冬小麦PWC光谱特征波段提供另一个角度的参考;此外,与原始光谱相比,预处理光谱明显提高了其与冬小麦PWC的相关性水平。

2.3 冬小麦PWC的高光谱特征提取

采用SPA方法进一步定量挖掘和提取冬小麦PWC的光谱重要波段,结果如图3所示。

由图3可知,不同预处理下最优波段个数和提取的重要波段位置存在一定的差异,考虑到所提取的光谱信息更具有一定的普适性和可参考性。本研究通过对比各预处理光谱条件下所提取的光谱波段位置及其分布特点,凝练和汇总出不同预处理条件下冬小麦PWC的重要光谱区域:650~800、950~1 200、1 400~1 500、1 900~2 200 nm(图3)。而且,对比利用相关分析法所提取光谱波段可知,除了570 nm外,其他光谱波段都位于所确定的光谱区域中,表明所确定的光谱区域与冬小麦PWC存在紧密的关系。

图3 基于SPA方法的冬小麦PWC预处理光谱特征区域分布Fig.3 Distributions for the preprocessed sensitive spec⁃tral regions for the PWC of winter wheat based on SPA

2.4 冬小麦PWC的高光谱定量监测

针对各类预处理光谱,分别建立基于全谱和特征波段的冬小麦PWC的PLSR和MLR模型,以实现干旱胁迫下冬小麦PWC的高光谱定量监测和评价预处理方法对冬小麦PWC高光谱监测模型表现的影响研究,各类校正和验证模型的表现如表2所示。

从表2可以看出,基于全谱的PLSR模型中,所有预处理条件下的验证模型优于基于原始光谱(R)条件下的模型表现,其中,基于1st处理下的冬小麦PWC监测模型表现最优。基于光谱特征的SPA-MLR模型中,除二阶微分光谱模型的表现最差外,其他预处理光谱的模型表现整体优于原始光谱模型,其中,基于MSC预处理光谱条件下的冬小麦PWC的SPA-MLR模型整体表现最好。以上结果表明,无论是PLSR模型还是SPA-MLR模型,对原始光谱进行预处理,在一定程度上可以提高干旱条件下冬小麦PWC的模型估算精度。

表2 不同预处理光谱条件下冬小麦PWC的PLSR和SPA-MLR高光谱监测模型表现Tab.2 Hyperspectral monitoring model performance of PLSR and SPA-MLR of winter wheat PWC under different preprocessed spectral conditions

同时,就干旱胁迫下冬小麦PWC模型构建类型来看(基于全谱的PLSR模型和基于光谱特征波段的SPA-MLR模型),相同预处理条件下的PLSR模型整体优于SPA-MLR模型,其中,基于1st-PLSR模型在本研究中表现最优(Rc2=0.957、RMSEv=0.033、RPDv=2.370),MSC-SPA-MLR模型也取得了不错的估算精度(Rc2=0.814、RMSEv=0.332、RPDv=2.359)。为了直观的展示两类建模方法下冬小麦PWC的最优模型表现效果,绘制基于1st-PLSR和SPA-MLR校正模型和验证模型的预测值和实测值1∶1拟合图,结果如图4所示。

图4 基于1st-PLSR和SPA-MLR校正模型和验证模型的预测值和实测值1∶1拟合结果Fig.4 1∶1 fitting lines for the predictive and measured values based on the calibrated and validated models of 1st-PLSR和SPA-MLR

3 讨论

3.1 干旱胁迫下冬小麦冠层光谱特性分析

一般认为,相关系数极值所对应的光谱波段与目标属性存在紧密的关系[18],本研究根据这一原则,从相关分析和特征波段定量提取的角度确定高光谱对干旱胁迫下冬小麦PWC的敏感响应特性确定了光谱波段570、680、740、970、1410、1 510、2 000 nm;同时对比各预处理光谱条件下所提取的光谱波段位置及其分布特点,凝练和汇总出不同预处理条件下冬小麦PWC的重要光谱区域:650~800、950~1 200、1 400~1 500、1 900~2 200 nm;发现除了光谱波段570 nm外,所有相关分析确定的光谱波段基本位于SPA所确定的光谱敏感区域中,而MAGNEY等[19]认为,570 nm是光化学植被指数PRI的组成波段,常用于表征远程估计叶黄素色素相互转换的动态。光谱波段680 nm是表征植被叶绿素吸收的吸收位置,是众多植被指数构建的重要组成波段[20]。740 nm位于红边区域内,该区域被证明能够敏感响应作物遭受的生物和非生物胁迫[21]。可知,由于所提取光谱波段570、680、740 nm与叶绿素等农艺形状的直接关系,使得其与干旱胁迫下冬小麦PWC的响应是一种间接关系。对于光谱波段970 nm,其是水分指数WI的关键组成波段,能够较好地表征叶片、冠层水平上的作物水分含量。SERRANO等[22]研究也证实,由于其能够敏感响应蒸腾作用,而与作物冠层水分含量关系密切。此外,研究者也形成共识,即1 410、1 510 nm是重要的水分吸收波段,已经被用于监测作物水分状况[23]。

3.2 干旱条件下冬小麦PWC冠层光谱监测

构建准确、稳健的冬小麦PWC定量模型,是实现干旱条件下冬小麦PWC的高光谱监测前提。因此,本研究兼顾模型的准确性和简易性需求,针对干旱条件下冬小麦PWC,构建了基于全谱的PLSR模型和基于光谱特征波段的MLR模型;综合对比冬小麦PWC的PLSR和SPA-MLR模型类型可知,基于全谱所构建的冬小麦PWC模型表现整体优于基于光谱特征波段所构建的模型,这主要是由于PLSR模型是全谱的模型,模型所含有的信息量多于SPA-MLR模型,纵然全谱信息之间存在一定的过拟合现象。而ZOU等[24]研究认为,PLSR具有有效克服数据共线性、频带重叠和交互的作用,广泛应用于高光谱数据的定量分析中,此外,PLSR还融合了主成分回归(PCR)和多元线性回归(MLR)的优点和功能,可实现在尽可能少的损失光谱信息前提下,实现最优模型构建,其模型预测能力要优于PCR和MLR。针对MLR模型来讲,因其模型中仅由较少波段构成,易导致部分重要信息的丢失,这也是本文中MLR模型整体略逊于PLSR模型的主要原因之一。但是,VOHLAND等[14]研究认为,MLR模型中因其变量较少,模型的复杂度会降低,从而有利于提高模型的稳健性,同时VOHLAND等[25]提出,实现这一前提必须通过准确挖掘和提取能够表征目标属性的光谱特征波段,尽可能减少重要信息的丢失。本研究中,基于1st-PLSR模 型 表 现 最 优(Rc2=0.957、RMSEc=0.017、RPDc=4.788;Rv2=0.882、RMSEv=0.033、RPDv=2.370、Fn=4),可以实现干旱胁迫下冬小麦PWC的准确估算,而MSC-SPA-MLR模型也取得了不错的估算精度(Rc2=0.814、RMSEc=0.036、RPDc=2.243;Rv2=0.825、RMSEv=0.332、RPDv=2.359、Fn=5),且达到了统计学的要求,考虑到模型构成的复杂性和稳健性,及其对后期模型在软件平台时的运行速度和效率[26],本研究中的冬小麦PWC的SPA-MLR模型仍具有潜在的实践应用价值。

3.3 光谱预处理对干旱条件下冬小麦PWC光谱监测的影响

高光谱数据采集过程中极易受到环境因素、电磁辐射、仪器自身背景等因素的影响,对原始光谱数据进行预处理可有效去除以上背景的影响,也是构建光谱监测模型的前提[27]。为了探究光谱预处理对干旱条件下冬小麦PWC监测的影响,本研究分析了原始光谱及5类常规光谱预处理方法对光谱和冬小麦PWC之间的相关性,以及对冬小麦PWC监测模型的影响,结果表明,光谱预处理可以明显提高其与冬小麦PWC的相关性,其中微分处理(1st、2nd)效果较为明显。尼珍等[28]研究证实,微分处理能有效突出光谱吸收峰、减小噪音和减缓背景的干扰。BUDDENBAUM等[29]研究进一步指出,微分处理可以凸显可见光区域的吸收和反射特性,这也是本研究基于微分处理所提取的重要光谱波段全部位于可见光位置的可能原因(1st:480、667 nm;2nd:575、812 nm)。而MSC及NC预处理光谱则较为明显地提高了近红外区域的相关性。张进等[30]研究认为,主要是由于该区域光谱变量数多且共线性严重,而采用MSC和NC预处理可实现对该光谱区域有效降维和优化。

此外,针对光谱预处理对冬小麦PWC监测模型的影响,结果证实,无论是PLSR模型还是SPAMLR模型,对原始光谱进行预处理,一定程度上可以提高干旱条件下冬小麦PWC的模型估算精度,表明对原始光谱进行预处理,一定程度上可以对所构建模型表现起到积极作用,但并非所有预处理都会提升模型估算精度(2st-SPA-MLR)。同时,对比2类模型的表现可知,PLSR模型整体优于SPAMLR模型,且针对同一类模型,光谱预处理虽在一定程度上提高模型估算精度,但是,同光谱预处理的提升效果相比,模型构建方法似乎在一定程度上提升的效果更为明显。BUDDENBAUM等[24]在其研究中也证实了这一结论。

4 结论

综上所述,预处理光谱明显提高了其与冬小麦PWC的相关性水平,且本研究分析发现,与冬小麦PWC相关性较高的光谱波段出现在570、680、740、970、1 410、1 510、2 000 nm,同时证实光谱区域650~800、950~1 200、1 400~1 500、1 900~2 200 nm与冬小麦PWC存在紧密关系,表明利用相关分析和连续投影变换寻找水分敏感波段具有可靠性且所得波段区域相似。此外,本研究证实,光谱预处理在一定程度上可以提高与PWC相关关系和影响监测模型表现,而构建模型方法可能对模型估算精度产生更为积极的效果。其中,基于1st的PLSR模型可以实现对冬小麦PWC的准确监测(Rv2=0.882、RMSEv=0.033、RPDv=2.370),而 基 于MSC的SPA-MLR模型仍具有潜在的实践应用价值(Rv2=0.825、RMSEv=0.332、RPDv=2.359,Fn=5)。研究结果可为干旱条件下冬小麦植株水分状况的监测诊断提供一定的理论依据和实践探索。

猜你喜欢

冬小麦波段预处理
基于Sentinel-1A数据的冬小麦种植面积提取
求解奇异线性系统的右预处理MINRES 方法
最佳波段组合的典型地物信息提取
不误农时打好冬小麦春管“第一仗”
高COD二噻烷生产废水预处理研究
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
基于预处理MUSIC算法的分布式阵列DOA估计
L波段kw级固态功放测试技术
甘肃冬小麦田