APP下载

基于连续投影算法和光谱变换的冬小麦生物量高光谱遥感估算

2020-03-05王玉娜李粉玲王伟东陈晓凯常庆瑞

麦类作物学报 2020年11期
关键词:冠层拔节期波段

王玉娜,李粉玲,王伟东,陈晓凯,常庆瑞

(西北农林科技大学资源环境学院,陕西杨凌 712100)

作物生物量是指单位面积内作物积累有机物质的总量[1],可用于诊断作物的氮素营养状况,是监测作物生长状况和预测最终产量的一个重要指标[2-3]。作物生物量测定的传统方法需要破坏性采样。近年来,遥感技术以其快速、实时、无破坏性且大面监测的特点在作物生理生化参数定量监测中得到了广泛应用[4-5]。通过高光谱遥感技术可以获取目标物非常窄且连续的光谱信息和图像,从中得到研究对象在全波段范围内的详细信息。目前,已有国内外学者基于高光谱遥感技术对不同作物生物量的快速准确监测进行研究[6]。如Hansen等[7]基于归一化植被指数(NDVI)和偏最小二乘法(PLS)对小麦地上部生物量进行有效估算,发现NDVI在680~750 nm中心波长内的波段组合与生物量相关性较高,基于PLS建立的生物量估测模型比NDVI模型的均方根误差(RMSE)降低22%。Jin等[8]基于高光谱植被指数对玉米冠层反射率和生物量的关系进行研究,结果表明,三波段水指数(TBWI)是估算玉米生物量的最佳指数,估算模型决定系数可以达到 0.76。Gnyp等[9]基于在近红外和短波红外区域光谱具有吸收和反射特征的植被指数对冬小麦生物量进行估测,发现氮反射指数(NRI)和新开发植被指数(GnyLi)可解释81%~89%的生物量变异性,估测精度最佳。柏军华等[10]研究表明,基于归一化组合参数[629,901]的棉花地上部鲜生物量指数形式估算模型的精度高于基于单波段629 nm一阶导数光谱建立的估算模型。王大成等[11]基于高光谱植被指数比较了人工神经网络和对数回归模型对冬小麦生物量的估算精度,发现神经网络模型显著提高了小麦生物量诊断的准确性,其中基于叶绿素吸收植被指数的模型决定系数提高幅度最大,为75.9%。吴亚鹏等[12]筛选对冬小麦地上部氮积累量和植株生物量兼容性强的植被指数,构建不同产量水平下的动态模型,发现红边叶绿素指数(CIred-edge)、土壤调整植被指数(SAVI)和修正型红边比率(mRER)拟合精度较高。付元元等[13]结合波段深度分析与偏最小二乘法对大田冬小麦生物量进行估算,结果发现,两者结合建立的模型精度优于基于代表性植被指数建立的估算模型。以上研究充分展现了基于高光谱技术对作物生物量进行估算的优势,但仍然存在一定的问题:(1)原始光谱是作物冠层反射情况的最直接表达,光谱变换可以不同程度地减弱或消除背景噪声,对于特征波段的优选和波段灵敏度的提高有重要作用,当前研究较少讨论变换光谱估算地上部生物量的能力;(2)目前的研究主要基于少数敏感波段进行作物生物量的估算分析,比如利用单一波段反射率或2~3个敏感波段反射率的组合植被指数来构建模型,没有充分利用高光谱遥感所提供的详尽光谱信息,而偏最小二乘回归可以更加有效利用高光谱信息并且防止共线性产生,模型解译性高。基于此,本研究基于不同生育时期的冬小麦高光谱反射率信息,首先进行光谱变换,然后从利用冠层高光谱全波段信息和减少波段之间信息冗余的角度出发,采用连续投影算法在350~1 350 nm的波段范围内筛选不同变换光谱的敏感波段,利用偏最小二乘法建立冬小麦地上部生物量估算模型,并进行模型检验,优选出冬小麦关键生育时期地上部生物量的最佳模型,以期为冬小麦长势监测、后期田间管理以及产量预测提供科学依据。

1 材料与方法

1.1 试验设计

分别于2016年度在陕西省杨凌农业示范区西北农林科技大学实验农场(东经108°10′,北纬34°14′)和2017年度在陕西省咸阳市乾县梁山镇齐南村(东经108°07′,北纬34°38′)开展田间试验。供试品种为关中地区主栽品种小偃22。西北农林科技大学实验农场设20个小区,小区面积为33 m2(5.5 m×6 m);土壤为粉砂粘壤土,0~40 cm耕层有机质含量为15.61 g·kg-1,全氮含量为0.56 g·kg-1,碱解氮含量为74.31 mg·kg-1,速效磷含量为30.14 mg·kg-1,速效钾含量为185.24 mg·kg-1;氮磷肥各设5个处理,其中氮肥(N)处理的施入量分别为0、45、90、135和180 kg·hm-2,磷肥(P2O5)处理的施入量分别为0、22.5、45、67.5和90 kg·hm-2,每个处理2个重复。乾县梁山镇齐南村设36个小区,小区面积为90 m2(9 m×10 m);土壤为壤土,0~40 cm耕层有机质含量为13.36 g·kg-1,全氮含量为0.48 g·kg-1,速效氮含量为44.86 mg·kg-1,有效磷含量为13.54 mg·kg-1,速效钾含量为182.88 mg·kg-1;氮、磷、钾肥各设6个处理,其中氮肥(N)处理的施入量分别为0、30、60、90、120和150 kg·hm-2,磷肥(P2O5)和钾肥(K2O)处理的施入量均分别为0、22.5、45、67.5、90和112.5 kg·hm-2,每个处理2个重复。氮、磷、钾肥分别为尿素、过磷酸钙和硫酸钾肥,均全部底施,小麦生育时期不追肥,田间管理按大田管理方式进行。

1.2 冠层光谱测定

选择晴朗无风的天气,采用美国SVC HR-1024I型野外光谱辐射仪在冬小麦生长的拔节期、抽穗期、开花期和灌浆期测定冠层光谱。该光谱仪波段范围为350~2 500 nm,其中50~1 000 nm、1 000~1 850 nm和1 850~2 500 nm的光谱分辨率分别为3.5 nm、9.5 nm和6.5 nm。每次光谱测定前进行标准白板校正。利用视场角25°镜头在距离冬小麦冠层1 m处垂直向下测定冠层反射光谱,设置一次采样重复10次,平均值作为该样点的冠层光谱反射率。每个小区选取2个样点,以样点光谱反射率平均值作为该样区冠层光谱反射率。

1.3 生物量的测定

光谱测定完成后,以光谱测定点为中心,采集各小区0.5 m×0.5 m范围内的地上小麦植株,迅速密封装袋带回实验室测定地上部生物量鲜重。并从中随机选取20株样品称取其鲜重后,置入牛皮纸袋中,放入烘箱在105 ℃杀青30 min,80 ℃烘干48 h以上,称取其干重,进而计算干重与鲜重的比值。通过0.25 m2范围内的地上部生物量与干湿比获取各小区的地上部生物量样本56个,其中建模集45个,验证集11个。

1.4 研究方法

1.4.1 冠层光谱预处理

由于1 350~2 500 nm是叶片水分吸收的主导波长,可见光-近红外波段的光谱反射率与作物的色素含量以及冠层结构和地上部生物量密切相关[14-16],因而本研究以350~1 350 nm范围内的高光谱反射率数据为基础,进行地上部生物量的估算分析。首先将350~1 350 nm范围内的高光谱反射率数据重采样为1 nm,并对重采样后的光谱数据利用二次多项式和9个平滑点数进行Savitzky-Golay 平滑滤波处理,剔除依附于冠层高光谱之上的噪声信息。对去噪后的冠层光谱进行基本变换,获取冠层一阶导数光谱、对数光谱(对平滑之后的光谱先求倒数,然后取对数的数学变换)和连续统去除光谱。

1.4.2 敏感波段提取

相关系数是反映两个变量线性相关程度的统计量[17]。首先分析不同生育时期的冬小麦冠层原始光谱、一阶导数光谱、对数光谱和连续统去除光谱与地上部生物量之间的相关性,将相关系数满足0.01水平显著性检验的波段范围作为各生育时期和各变换光谱的敏感特征区域。在Matlab环境下通过编程实现连续投影算法(SPA),经过反复抽样检查,在RMSE达到最低值时,从敏感特征区域中提取冬小麦地上部生物量的敏感波段。最后将选择的敏感波段对应的原始光谱、一阶导数光谱、对数光谱和连续统去除光谱分别作为自变量,采用偏最小二乘法(PLS)回归对地上部生物量进行模拟,并与光谱指数估算模型进行对比,获取最佳的冬小麦地上部生物量估算模型。

连续投影算法(SPA)是一种使矢量空间共线性最小化的向前变量选择法,它利用向量投影分析最大程度地消除光谱中的冗余信息,从全波段中筛选出少数几个特征波段,不仅能够减少参与建模的光谱波段个数,并且能够保证特征波段之间的共线性最小,从而提高建模效率,具体算法和意义参见文献[18]。PLS 是多元线性回归分析、典型相关分析和主成分分析的结合,能够同时实现回归建模和数据结构简化。对高光谱数据的分析处理表明,PLS方法能够最大程度利用光谱信息,减少有效信息的丢失并能有效滤除光谱噪音,且对模型自变量具有解释性,相对于多元逐步回归等方法稳定性更强,建模精度更高[19-20]。主成分个数是PLS回归分析的关键因素,本研究利用交叉验证计算潜在模型预测能力来权衡主成分的选取个数。

1.4.3 光谱指数选择

本研究利用Matlab软件系统构建了350~ 1 350 nm波段范围内,任意两波段组合的归一化(NDSI)、比值(RSI)、差值(DSI)光谱指数。通过分析任意两波段构建的窄波段归一化(NDSI)、比值(RSI)、差值(DSI)光谱指数与冬小麦地上部生物量间的相关关系,构建拟合精度r2二维图,并以r2极大值区域重心作为高光谱估算地上部生物量的敏感波段中心。所筛选出的最佳窄波段光谱指数及已报道的对冬小麦地上部生物量相关性较好的土壤调整植被指数(SAVI)和修正型红边比率(mRER)的构成形式和敏感波段见表1[12,19-20]。

表1 光谱指数及其计算公式

1.5 模型验证参数

分别采用决定系数(r2)、均方根误差(RMSE)和相对预测偏差(RPD)对模型进行检验。r2越接近1,RMSE越小,说明模型拟合能力越好,预测精度越高。RPD通过衡量估测值和实测值之间的偏差程度来表明模型的预测能力。通常认为RPD<1.5时,模型不具备预测能力;1.52.0时,模型的预测能力极好[23]。

RPD=SD/RMSE×[n/(n-1)]1/2

其中,n为建模集或者验证集的样本数目,SD为验证集标准偏差。

2 结果与分析

2.1 不同生育时期的冬小麦地上部生物量统计分析及光谱响应

2.1.1 地上部生物量随生育时期的变化规律

从拔节期到灌浆期,小麦地上部生物量不断增加,在灌浆期达到11.07 t·hm-2,各时期平均值为2.94~11.07 t·hm-2(表2)。开花期地上部生物量的离散程度较小,变异系数为 25.91%,而拔节期的变异系数最大,为41.52%。

表2 冬小麦地上部生物量统计描述

2.1.2 地上部生物量与光谱特征的关系

随着小麦地上部生物量的增大,可见光-近红外的冠层光谱反射率总体上均呈增加趋势,其中近红外部分的增幅高于可见光部分。不同地上部生物量之间对应的光谱差异显著(图1)。

图1 小麦不同地上部生物量的光谱变化

2.2 地上部生物量与冠层变换光谱的相关性

从各关键生育时期原始光谱(OS)、一阶导数光谱(FD)、对数光谱(LOG)和连续统去除光谱(CR)与冬小麦地上部生物量的相关性(图2)看,拔节期原始光谱、一阶导数光谱、对数光谱和连续统去除光谱对地上部生物量的敏感区间(相关系数满足P≤0.01的置信区间)集中在728~ 1 350 nm;995~1 073 nm、1 121~1 197 nm、1 208~1 256 nm、1 276~1 343 nm;728~1 350 nm和351~758 nm、991~1 075 nm、1 096~ 1 127 nm、1 164~1 257 nm,相关系数分别为 0.35~0.60、0.34~0.60、0.49~0.62和0.34~0.52。抽穗期敏感区间集中在576~703 nm、739~1161 nm;718~806 nm、994~1 068 nm、1 076~1 166 nm、1 209~1 251 nm、1 274~ 1 337 nm;607~699 nm、738~1 304 nm和 351~762 nm、942~1 066 nm、1 134~1 281 nm,相关系数分别为0.34~0.54、0.34~0.69、0.34~0.56和0.35~0.56。开花期敏感区间集中在 1 350 nm;794~799 nm、804~807 nm、825~828 nm;1 118~ 1 125 nm、1 345~1 350 nm和 1 280~1 292 nm、1 309~1 349 nm,相关系数分别为0.35、0.34~ 0.57、0.34~0.37和 0.34~0.50。灌浆期仅一阶导数光谱在973 nm与地上部生物量的相关系数通过0.01显著性水平检验,相关系数为0.42。总体上,开花期和灌浆期各光谱变换与地上部生物量的相关性较低,故以下只对拔节期和抽穗期的冬小麦地上部生物量进行估算分析。

OS:原始光谱;FD:一阶导数光谱;LOG:对数变换光谱;CR:连续统去除光谱。图中两条平行线间的相关系数达到0.01显著水平。

2.3 基于SPA法的特征波段提取

在相关性分析筛选出的敏感特征区域内,进一步利用SPA法分别提取原始光谱、一阶导数光谱、对数变换光谱和连续统去除光谱在拔节期和抽穗期对冬小麦地上部生物量的敏感波段。结果表明,从冠层光谱350~1 350 nm范围内所包含的1 001个波段中,优选出各变换光谱的敏感波段数目大幅下降,其中拔节期连续统去除光谱所对应的敏感波段数相对较多(14个),而抽穗期原始冠层光谱敏感波段数仅4个(表3)。

表3 不同变换光谱的冬小麦地上部生物量敏感波段

2.4 基于PLS的冬小麦地上部生物量模型构建与验证

以SPA法优选出的冬小麦拔节期和抽穗期敏感波段作为输入变量,以地上部生物量作为响应变量,构建基于PLS的地上部生物量预测模型。不同生育时期变换光谱所选用的主成分个数由模拟精度和总方差解释率综合确定。拔节期和抽穗期地上部生物量的模拟结果见表4。在拔节期的预测模型中,基于一阶导数光谱所建模型的拟合精度相对最佳,r2为0.62,RMSE为0.71 t·hm-2;其次为连续统去除光谱r2和RMSE分别为0.61和0.77 t·hm-2;原始冠层光谱和对数光谱的地上部生物量预测模型的r2和RMSE基本相同,分别为0.50和0.87 t·hm-2。抽穗期所建模型的r2由高到低依次为一阶导数光谱(0.78)、对数光谱(0.61)、连续统去除光谱(0.49)和原始冠层光谱(0.47),各变换光谱所建模型的RMSE相应依次增加。基于一阶导数光谱的预测模型在拔节期和抽穗期均获得了最佳的验证精度,拔节期r2为0.66,RMSE为0.83 t·hm-2;抽穗期r2为0.84,RMSE为0.69 t·hm-2。将基于一阶导数光谱的拔节期和抽穗期地上部生物量估算模型实测值与预测值的空间分布绘制成散点图(图3),散点分布越接近于1∶1线,模型的估算效果越佳。抽穗期的散点分布更接近于 1∶1线,离散程度较小,对地上部生物量的估算能力较强,实测值与预测值的散点趋势线斜率为 1.05,r2为0.89。整体上,抽穗期地上部生物量的预测精度高于拔节期。

图3 基于一阶导数光谱的小麦地上部生物量预测值与实测值的相关性

表4 基于PLS的冬小麦地上部生物量预测模型验证

2.5 基于光谱指数的冬小麦地上部生物量估算效果

利用任意两波段组合的NDSI、DSI、RSI,结合已报道的SAVI和mRER进行冬小麦地上部生物量估算并进行精度(表5)对比,结果表明,在拔节期的预测模型中,基于NDVI 和DSI所建模型的精度相对最佳,r2分别为0.45和0.47,RMSE分别为0.96 t·hm-2和0.98 t·hm-2;其次为RSI模型,r2和RMSE分别为0.44 t·hm-2和0.98 t·hm-2;SAVI和mRER预测模型的精度相对较低,r2分别为0.34和 0.35,RMSE均为1.08 t·hm-2。在抽穗期的预测模型中,基于DSI建立模型的预测精度最佳,r2为 0.6,RMSE为1.36 t·hm-2。基于RSI、NDVI、SAVI和mRER的预测模型精度依次降低。基于DSI的预测模型在拔节期和抽穗期均获得了最佳的验证精度,r2分别为 0.76和 0.45,RMSE分别为0.69 t·hm-2和1.34 t·hm-2。从拔节期和抽穗期基于DSI的地上部生物量估算模型的实测值和预测值空间分布(图4)看,抽穗期的实测值和预测值更接近1∶1线,散点趋势线斜率为 0.65。

图4 基于DSI 的小麦地上部生物量预测值与实测值相关性

表5 基于光谱指数的冬小麦地上部生物量预测模型

2.6 模型精度对比

为了更好地检验本研究中地上部生物量估算模型的精度,对本研究所用光谱指数构建的冬小麦地上部生物量估算模型与基于SPA-PLS构建的回归模型进行对比(表6)。RPD通过衡量估测值和实测值之间的偏差程度来表明模型的预测能力。在拔节期中,无具备极好预测能力的模型;具有粗略估测样本的能力(1.5

表6 冬小麦地上部生物量估算模型对比

3 讨 论

冬小麦在不同生育时期的地上部生物量差异较大,本研究及相关研究均表明随着生育时期的推进,有机质逐渐积累,冬小麦地上部生物量在灌浆期达到最大[24]。拔节期和抽穗期的地上部生物量离散程度较大,变异系数分别为41.52%和 37.30%,而开花期地上部生物量的变化相对较小。冠层光谱反射率对不同生育时期生物量的响应同样显著,随着地上部生物量的增加,可见光-近红外冠层光谱反射率呈增加趋势,相关性分析表明冠层光谱对生物量变化的响应在拔节期和抽穗期尤为明显,敏感特征波段遍布可见光-近红外波段,最高相关系数为0.62,而开花期和灌浆期各光谱变换与地上部生物量的相关性较低。在本研究中,选用对冬小麦地上部植株生物量兼容性强的SAVI和mRER建立冬小麦地上部生物量模型的预测样本能力并不理想,它们对地上部生物量的估算结果低于任意两波段筛选出的归一化光谱指数、差值光谱指数和比值光谱指数。王大成等[11]利用人工神经网络估算冬小麦生物量的精度显著高于对数回归模型,且基于叶绿素吸收植被指数的神经网络模型精度最高,决定系数为0.37,但这些模型精度同样低于本研究的任意两波段光谱指数。它们的敏感位置主要包括931、944和 1 131 nm,但是这几个敏感波段的物理意义有待探讨。变换光谱可以减少或剔除冠层光谱的噪声信息,提高高光谱数据精度[25]。本研究所采用的一阶导数光谱、对数变换光谱和连续统去除光谱建立的模型精度均高于原始光谱以及光谱指数建立的模型精度。

高光谱数据的信息量大,有较强的波段连续性。连续投影算法是一种使光谱波段共线性最小化的变量选择算法,能够提取全波段的几个特征波段,消除原始光谱中的冗余信息,避免光谱波段信息之间的重叠[26]。本研究通过相关分析结合连续投影算法对各关键生育时期的变换光谱进行敏感波段提取,提取的敏感波段在可见光和近红外区域均有分布,这与贺佳等[27]在冬小麦生物量高光谱遥感监测模型研究的结果一致。但是所提取的敏感波段数显著下降,由350~1 350 nm的1 001个波段下降到4~14个波段。偏最小二乘回归方法进一步对特征波段进行主成分提取,提高了敏感特征波段与地上部生物量之间的相关性。本研究通过模型精度对比发现,连续投影算法和偏最小二乘方法相结合所构建的地上部生物量估算模型要优于基于常用光谱指数的估算模型,并且抽穗期的估算效果优于拔节期,这与付元元等[13]应用波段深度分析和偏最小二乘法估算冬小麦生物量的研究结果一致。基于一阶导数光谱敏感波段建立的抽穗期地上部生物量估算模型精度较高,模型估测能力高于赵钰等[28]在基于冬小麦冠层高光谱的生物量监测模型,优于吴芳等[29]基于机器学习算法的抽穗期冬小麦不同生育时期生物量高光谱估算模型,可用于地上部生物量的定量估算。在今后的研究后需要进一步探讨该方法是否能在全生育期上具有相似的预测 能力。

4 结 论

本研究利用不同生育时期冬小麦冠层光谱及变换光谱,基于相关性分析和连续投影算法进行敏感波段提取,构建了地上部生物量的偏最小二乘回归估算模型,结果表明,拔节期和抽穗期冬小麦地上部生物量对冠层光谱及变换光谱的响应较为敏感,且抽穗期的估算精度优于拔节期;利用 SPA结合PLS方法所构建的地上部生物量估算模型结构简明,其中基于一阶导数光谱的预测模型精度最高,r2=0.78 t·hm-2,RMSE=0.87,RPD= 2.74,模型具有极好的样本预测能力,可用于抽穗期冬小麦地上部生物量的遥感估算。

猜你喜欢

冠层拔节期波段
夜间增温对小麦干物质积累、转运、分配及产量的影响
密度与行距配置对向日葵冠层结构及光合特性的影响
四川水稻分蘖-拔节期低温连阴雨时空特征
最佳波段组合的典型地物信息提取
新型X波段多功能EPR谱仪的设计与性能
不同灌溉条件下一个春小麦重组自交系(RIL)冠层温度与产量性状的相关性
基于激光雷达的树形靶标冠层叶面积探测模型研究
2021年山西省小麦返青拔节期主要病虫发生趋势预报
最佳波段选择的迁西县土地利用信息提取研究
密度与播期互作下棉花冠层PAR时空特征分析