APP下载

高光谱早稻生理指标可跨期预测性的初步研究

2022-01-12祝海竣付虹雨王学华崔国贤石爱龙薛卫纯

光谱学与光谱分析 2022年1期
关键词:早稻生育期叶绿素

祝海竣,付虹雨,2,王学华*,崔国贤,2*,石爱龙,薛卫纯

1.湖南农业大学农学院,湖南 长沙 410128 2.湖南农业大学苎麻研究所,湖南 长沙 410128 3.益阳市赫山区农业农村局,湖南 益阳 413000

引 言

叶绿素和氮素是两个非常重要的表征作物营养和生长状况的指标[1]。实时、精准监测作物叶绿素含量和氮素状况对作物科学栽培、田间肥料精准管理、提高作物产量和品质等均具有重要意义[1-2]。

当前,光谱反演是常用的估算作物叶片氮含量和叶绿素含量的方法[2-3],Zhang等[4]结合高光谱技术和多元线性回归方法建立了实时监测叶片氮状况的定量模型,结果表明实测值与估算值高度拟合。但传统线性回归方法在模型拟合度方面存在缺陷,模型精度往往不高。随着机器学习技术的发展,RF,PLSR和SVM等算法被广泛用于作物生化参数反演研究,成为传统逐步回归方法的很好替代。如PLSR融合了MLR,PCR和CCA 3种分析方法的优点,具有很好的可解释性和预测功能;SVR能够考虑高维数据和噪声模式,进而提高预测精度;RF通过对训练数据的自举采样以及随机选择变量使得决策更加快速、稳健[5]。这些算法对于作物生化参数预测具有各自的优势,然而,在众多算法中,最佳算法选择仍具有挑战。因此,需要进一步工作来测试不同算法反演作物叶片氮含量和叶绿素含量的性能。

作物在不同生育期的不同光谱特性导致生化参数预测模型的拟合效果存在差异[6]。如Li等[7]认为不同生育期光谱数据对作物氮含量预测能力不同。杨福芹等[8]研究表明不同生育期高光谱数据对冬小麦氮素营养状况的监测效果存在较大的差异。这些研究都表明作物叶片光谱反射率对不同生长时期的生化参数变化极其敏感,作物生化参数反演模型的普适性问题存在争议。针对这一问题,Katherine等[9]根据两年光谱数据以及叶片氮含量(leaf N concentration,LNC)数据,探讨了PLSR模型的跨年应用能力,并认为,经验模型受作物类型和地域环境的影响,存在年际间普适性不高的缺陷,因此往往需要进行调整甚至重新建模。已有研究探究了模型的年际间普适性[10],但针对模型不同生育期间普适性的研究还存在空白。作物在不同生育期具有的光谱特性是否存在相互联系,如果有联系,是否可以依靠同一生命活动周期的跨期数据实现作物生化参数的预测?

与以往研究单一地从不同生育期、不同算法等角度建立基于高光谱作物叶绿素和叶片氮含量预测模型不同,本工作对水稻叶片光谱检测的研究更为系统,将多种时期、多种建模方法和跨期预测方法融于一体,分析水稻叶绿素和叶片氮含量与光谱反射率的定量关系,包括:(1)比较PLSR,RF和SVR 3种算法用于构建早稻叶片氮含量和叶绿素含量预测模型的预测性能。(2)评估跨期预测模型预测水稻叶绿素含量与叶片氮含量的效果。

1 实验部分

1.1 试验材料与试验地概况

试验于2020年3月至2020年7月在益阳市赫山区笔架山乡中塘村(112°50′83″E,28°49′61″N)进行。该地属于亚热带季风气候,降水充沛,光热条件良好,适宜水稻生长。供试早稻品种为株两优819和株两优39。采用随机区组实验,每个品种设置4个施氮梯度,分别为D1(不施氮)、D2(90 kg·hm-2)、D3(150 kg·hm-2)、D4(210 kg·hm-2)。每个水平按小区设计3次重复,共24个小区,每小区面积20 m2。试验材料采用大田育秧,于3月20日播种,4月20号移栽。种植株行距为16.5 cm×20 cm,每穴2粒谷苗。

1.2 数据采集

1.2.1 叶片高光谱数据采集

于早稻分蘖盛期(5月22日)、孕穗期(6月3日)、齐穗期(6月17日)、灌浆期(6月27日)和成熟期(7月11日)5个时期,使用美国ASD公司生产的FieldSpec 3地物光谱仪测量早稻叶片高光谱数据,光谱范围为350~2 500 nm。测量选择在当地时间11:00—13:00,天气晴朗、无风或者风速较小的情况下进行。每个试验小区选取5株具有代表性、均匀无病虫危害的样本,测量其最上部2片全展叶,共获取120组光谱数据。测量时使用仪器内置光源,并且每隔10 min进行一次参考白板校正。

1.2.2 叶片含氮量测定

于高光谱数据采集当天取样,从每个试验小区采样点获取早稻叶片,分别装入自封袋中并标注小区名称和编号。去除叶片表面灰尘后,将叶样放入105 ℃烘箱中杀青30 min,并在80 ℃下烘干至恒重。使用凯氏定氮法测定叶片氮含量。

1.2.3 叶绿素含量测定

采用日本Minolta Camera公司生产的SPAD-502便携式叶绿素仪测量叶片叶绿素含量,样本株与光谱测定的一致,每小区叶绿素测量5株,每株测超级早稻的2片最上部的全展叶,每片叶的基部、中部和尖部各测一点并求其平均值即为该叶的SPAD值。

1.3 模型构建

1.3.1 跨期预测模型

将120组光谱数据按分蘖期、孕穗期、齐穗期、灌浆期和成熟期分为5组,采用PLSR,RF和SVR 3种方法构建早稻叶片氮含量和叶绿素跨期预测模型。跨期预测模型是指在构建某一特定时期(X时期)预测模型的过程中,跨过X时期数据,仅以其他时期数据为模型输入。以分蘖期叶片氮含量跨期预测模型为例,以孕穗期、齐穗期、灌浆期和成熟期光谱数据为输入,实测早稻叶片氮含量为输出,建立叶片氮含量跨分蘖期预测模型,然后以分蘖期数据作为验证集。

1.3.2 非跨期预测模型

试验共采集全生育期光谱数据120组,将数据混合并按照4∶1的比例随机划分为训练集和测试集。以光谱数据为输入,实测早稻叶片氮含量或叶绿素含量为输出构建早稻叶片含氮量和叶绿素的非跨期预测模型。

1.3.3 建模环境及模型评价指标

采用python 3.6进行编程,scikit-learn(0.22.1)构建模型和验证评估。通过网格搜索和五折交叉验证在训练集中确定各算法的最佳模型参数,然后分别以最佳参数通过训练集进行训练,将训练好的各算法在测试集中评估模型表现。选用R2和RMSE作为评估指标,R2越大,RMSE越小,预测效果越好。RMSE计算公式如式(1)

(1)

式(1)中,yi为实测值,yi为预测值,n为样本数。

2 结果与讨论

2.1 早稻叶绿素含量跨期预测模型分析

各时期的早稻叶绿素含量跨期预测模型结果见图1。5个跨期预测模型效果存在差异,其中跨成熟期预测模型效果最佳,R2达到0.74,RMSE为1.77,具体表现为跨成熟期>跨灌浆期>跨分蘖期>跨齐穗期>跨孕穗期。可见,在同一生命活动周期内,依靠水稻生长早期光谱以及叶绿素数据,能够较准确预测成熟期数据。此外,不同算法对跨期预测模型精度也有影响。PLSR算法在跨齐穗期预测模型中效果最好,而在另外4个跨期预测模型中,SVR算法更加具有优势。

图1 早稻叶绿素含量跨期预测模型分析Fig.1 Analysis of intertemporal prediction model of chlorophyll content in early rice

2.2 早稻叶片氮含量跨期预测模型分析

图2为早稻叶片氮含量跨期预测模型的精度分析。结果显示针对各时期的早稻叶片氮含量跨期预测模型的拟合效果都很差。除基于PLSR算法建立的齐穗期叶片氮含量预测模型R2为0.09、基于PLSR算法建立的跨灌浆期叶片氮含量预测模型R2为0.41以及基于SVR算法建立的跨灌浆期叶片氮含量预测模型R2为0.23外,其他模型的R2都为负值。这表明早稻叶片氮含量具有不可跨期预测性,各生育期早稻叶片光谱特性仅能反映同时期叶片含氮量,依据统计关系建立的早稻叶片氮含量预测模型普适性不高。

图2 水稻叶片氮含量跨期预测模型分析Fig.2 Analysis of inter-temporal prediction model of rice leaf nitrogen content

2.3 水稻叶片氮含量和叶绿素含量非跨期预测模型

基于以上结果,我们发现水稻叶片氮含量跨期预测模型不具有预测能力。为进一步探究其原因,构建了早稻叶片含氮量和叶绿素的非跨期预测模型。如图3所示,水稻叶绿素非跨期预测模型的精度高,3种不同算法的性能表现为:PLSR>SVR>RF。其中PLSR算法最具有优势,R2为0.84,RMSE为1.25。水稻叶片含氮量非跨期预测模型也具有较高的预测能力,其中PLSR模型预测效果最好(R2=0.85,RMSE=0.11),其次为SVR模型和RF模型。SVR的R2为0.81,MRSE为0.12;DF的R2为0.56,RMSE为0.19。因此,跨期预测模型与非跨期预测模型之间的模型差异由跨期因素导致。

图3 水稻叶片氮含量和叶绿素含量非跨期预测模型Fig.3 Non-intertemporal prediction model of rice leaf nitrogen content and chlorophyll content

2.4 不同模型构建算法的比较分析

随着机器学习在各类算法上的突破,大量线性和非线性计算方法被用于基于复杂光谱的作物生化参数反演建模。比较了PLSR线性回归和RF和SVR两种非线性回归方法的预测性能。PLRS线性回归在非跨期预测模型中比RF和SVR两种非线性回归的预测性能更好,这表明早稻叶片光谱反射特征主要呈线性相关,PLSR算法在包含线性和简单数据的数据集中是可行的,这与Ghasemi等[11]的研究结果一致。在跨期预测模型中,SVR算法明显具有优势。在Shao等[12]、Yang等[13]的研究中,SVR也表现出比线性回归更好的预测性能。相比于PLSR线性回归模型,非线性SVR模型能更深度地挖掘光谱参数与水稻生化成分参数之间的统计关系。

2.5 跨期预测模型与非跨期预测模型的比较分析

我们实现了水稻叶片氮含量和叶绿素的非跨期预测,表明基于光谱的作物叶片生化成分定量分析是可行的。

一些研究讨论了经验模型的普适性,如Li等[7]认为用经验模型普适性差且反演作物生化成分的内在机理存在争议。对于这一问题的解释是,受不同环境影响,经验模型在不同年际的反演效果上必然存在差异,因此必须谨慎使用经验模型来推断不同年际间作物各项生化成分状况。为探讨模型在不同生育期的普适性,利用跨期数据进行了同一生命活动周期的水稻叶片氮含量和叶绿素进行预测研究。结果显示,对比非跨期预测模型,模型构建未包括同期数据时,模型精度降低或失去预测能力。其中,针对不同生育期的早稻叶绿素含量跨期预测模型精度明显下降;而针对不同生育期的水稻叶片氮含量跨期模型的R2大多为负值,根据生育期前期数据模型无法预测后期氮素状况。对模型效果差异的解释是由跨期因素导致。同期数据受生长环境等因素影响具有一致性,而在跨期预测模型中,完全避免了同期数据的干扰,从而导致跨期预测模型精度下降以及无法预测。

2.6 作物生理生化指标预测的可跨期性

对早稻叶片氮含量和叶绿素进行跨期预测,结果表明,叶绿素含量表现出可跨期预测潜力,而叶片氮含量并不可跨期预测。这可能是由于叶绿素在早稻全生育期中仅与光合作用相关,影响因素较少,便于全生育期预测。而氮素参与了氨基酸合成、激素调控等多种代谢途径,这些途径在作物不同生育期差异较大而在相同生育期差异较小,影响因素多,导致其跨期预测准确性较差,这也解释了氮素可以进行非跨期预测原因。其中的内在机理还需要进一步研究。本研究提出了作物生理指标的“可跨期预测性”,这一特性反映了作物在不同生育期下某一生理指标之间存在的内在联系,有助于实际生产过程中的早期预测,也为作物表型性状以急内部品质的预测研究提供了新思路。目前,对作物生理指标预测的可跨期性研究还并不深入,本研究仅仅对水稻的叶片氮含量以及叶绿素含量进行预测,并且试验年限较短,下一步研究应进一步探讨不同作物、不同生育期、不同生理指标的可跨期预测性。

3 结 论

分析了不同施氮梯度下早稻叶片含氮量、叶绿素含量的季节变化以及采用叶片光谱反射率反演生化参数的潜力。得到以下结论:

(1)光谱可以用于早稻叶绿素含量以及叶片氮素的估算。在非跨期预测研究中,PLSR模型对早稻叶绿素含量和叶片氮含量的预测效果比RF模型和SVR模型更好。

(2)相对非跨期预测模型,跨期预测模型精度较差,早稻叶绿素含量跨期预测模型精度明显下降。而在叶片氮含量预测过程中,根据生育期前期数据模型无法预测后期氮素状况。

(3)作物生理生化指标存在“可跨期预测性”,并且跨期预测的准确度受生育期选择影响较大,有必要进一步探讨不同作物、不同生理生化指标的“可跨期预测性”。

猜你喜欢

早稻生育期叶绿素
早稻迎丰收
大豆生育期组鉴定分组方法的比较研究
2021年全国早稻总产量2802万吨增长2.7%
不同生育期大豆品种氮素积累特性研究
2021年全国早稻总产量2802万吨 比2020年增产72.3万吨
宋代早稻若干问题探讨
提取叶绿素
锌对白菜和香葱叶绿素含量的影响研究
桃树叶绿素含量与SPAD值呈极显著正相关
由松针制取三种叶绿素钠盐及其稳定性的研究