APP下载

小麦籽粒蛋白质含量高光谱遥感预测模型比较

2022-06-01张志勇樊泽华张娟娟邱青彬郑亮芮战许马新明熊淑萍

河南农业大学学报 2022年2期
关键词:农学光谱籽粒

张志勇, 樊泽华, 张娟娟, 邱青彬, 郑亮, 芮战许, 马新明, 熊淑萍

(1.河南农业大学农学院/作物生长发育调控教育部重点实验室,河南 郑州 450046;2.河南农业大学信息管理与科学学院,河南 郑州 450046)

小麦是中国三大粮食作物之一,随着社会经济的发展和农业供给侧结构性改革的深入,小麦需求已由数量型向质量型转变。提升小麦品质,解决专用优质小麦生产问题已成为中国小麦产业的主要发展方向[1-2]。小麦籽粒蛋白质含量(grain protein content,GPC)是影响小麦品质最重要的指标,不同生态环境、栽培措施均会对其造成显著的影响。因此,在小麦生育进程中较早感知小麦籽粒蛋白质含量信息,实时采取相应栽培调控措施,对保障小麦籽粒蛋白质含量达标,实现小麦优质专用生产指导、分级收割、企业按质论价收购及国家制定作物进出口政策有着重要的现实意义[3]。由于高光谱遥感技术具有分辨率高、连续性强、光谱范围窄、数据信息量大等特点,近年来,国内外不少学者以不同的农学参数为链接点,利用高光谱技术,分别构建了“高光谱-农学参数-籽粒蛋白质含量”的籽粒蛋白质预测模型,在实现小麦籽粒品质的预测方面,进行了不少的研究与探索[4-6]。田永超等[7]发现,抽穗后利用叶片叶绿素含量(SPAD)和冠层光谱比值指数R(1 220,560)可以对单位土地面积上籽粒蛋白质与淀粉的动态积累进行预测,其成熟期籽粒蛋白质积累量监测模型实测值与预测值之间的相关系数R可达0.94。李娜[8]对小麦成熟期GPC和各个生育时期SPAD进行相关分析与建模,发现灌浆期SPAD与冠层光谱指数PSSRb(R800,R635)构建的GPC估测模型效果较优,其决定系数(coefficient of determination,R2)与均方根误差(root mean squared error,RMSE)达到0.693和0.152。冯伟等[9]、王纪华等[10]和黄文江等[11]研究表明,小麦开花期叶片氮指标与成熟期籽粒品质有显著的相关性,可以很好地预测籽粒蛋白质含量,相关系数分别为0.842、0.527、0.562,前两者的建模验证实测值与预测值的决定系数R2分别最高达到0.616、0.909。贺佳等[12]以植株氮含量为链接点,使用最小二乘法建立的不同生育时期植被指数监测成熟期籽粒蛋白质含量模型均有很好的模拟精度,其中以抽穗期植株氮含量构建的GPC预测模型效果最佳,实测值与预测值的R2和RMSE分别达到0.979与1.767。

综上所述,前人对于小麦籽粒品质即籽粒蛋白质含量的遥感估测预测较多,但多基于小麦生育后期的单一农学参数与籽粒蛋白质含量建立遥感估测预测模型,缺乏不同农学参数间的横向对比,对于不同农学参数对模型产生的影响也较少解释。本研究通过对不同氮处理下两类品质类型4个小麦品种的开花期SPAD、叶片干物质质量(leaf dry weight,LDW)、地上生物量(aboveground biomass,AGB)、叶片氮含量(leaf nitrogen content,LNC)、叶片氮积累量(leaf nitrogen accumulation,LNA)、叶面积指数(leaf area index,LAI)、植株氮含量(plant nitrogen content,PNC)、植株氮积累量(plant nitrogen accumulation,PNA)、氮营养指数(nitrogen nutrition index,NNI)9个不同农学参数的测定,利用一阶导数作为光谱预处理方法和偏最小二乘法作为模型构建方法,构建不同的高光谱-农学参数-籽粒蛋白质含量的冬小麦品质预测模型,以期筛选确定最优中间参数与建模方法组合,实现小麦生育进程中籽粒蛋白质品质提前精准预测,为优质小麦品质调控栽培管理提供技术支持。

1 材料与方法

1.1 试验设计

试验于2020—2021年在河南农业大学原阳科教园区进行(113.94°E,35.10°N)。试验田0~0.2 m土层全氮含量1.90 g·kg-1,硝态氮含量20.80 mg·kg-1,有效磷含量9.38 mg·kg-1,速效钾含量239.90 mg·kg-1。试验采用裂区设计,主区为不同供氮水平,设N0(0 kg·hm-2)、N8(120 kg·hm-2)、N15(225 kg·hm-2)、N22(330 kg·hm-2);副区为不同小麦品种,分别为弱筋小麦扬麦13和扬麦15、强筋小麦郑麦366和郑麦369;3次重复。氮肥为尿素(总氮含量≥46.4%),分基肥和追肥,基追质量比为6∶4,追肥于拔节期施入。每个小区面积约为41.5 m2,其他栽培管理措施同一般高产田。

1.2 测定项目和方法

1.2.1 小麦冠层光谱测定 试验于小麦开花期前后(时间为2021-04-26)进行群体冠层光谱测定。采用美国生产的ASD Field Spec野外便携式光谱辐射仪测定。该仪器采集光谱波段范围为350~2 500 nm,连续采样间隔为1 nm,测量时将光谱探头垂直于小麦冠层1 m高度的位置进行测量。每个小区选定3个位置,每个位置测量记录10条光谱曲线,去除异常值后以剩余光谱曲线的平均值作为该小区的冠层光谱。在北京时间10:00—14:00进行测量,并在测量时选择晴朗无云的条件,测量过程中使用标准白板进行校正。

1.2.2 农学参数测定 光谱测定完之后,在正下方每次取3~4株小麦,3个样点共取10株以上小麦,然后,随机选取10株小麦用于以下指标测定。将随机选取出来的10株小麦茎部、叶片及穗部分离,然后将它们分别装入信封,烘箱内105 ℃杀青0.5 h,之后下调到80 ℃烘干,直至其干物质质量不再发生变化,得到其叶片干物质质量(LDW)及地上部生物量(AGB)。叶片氮含量(LNC)、叶片氮积累量(LNA)、植株氮积累量(PNA)和植株氮含量(PNC)的测定与计算参照张英利等[13]的方法。叶绿素含量(SPAD)的测定参照徐云飞等[14]的方法。叶面积指数(LAI)的测定参照刘镕源等[15]的方法,以比叶重法进行测定计算。氮素营养指数(NNI)是Lemaire提出的能够精准地量化反映作物体内氮素状况的概念,计算公式为:

NNI=Na/Nc

式中:Na为作物地上部植株氮的实测值/%,Nc为临界氮质量分数/%,是作物地上干物质达到最大生长速率所需要的最低氮质量分数[16]。采用已有研究的河南省原阳县地区的冬小麦氮稀释曲线进行计算[17]:

Nc=5.25W-0.472

式中:W为小麦地上部生物量/(kg·hm-2)。

1.2.3 小麦籽粒蛋白质含量(GPC)的测定 将成熟期的小麦颖壳与籽粒分离,将籽粒装入自封袋,烘干,研磨籽粒,粉碎后用H2SO4-H2O2消煮,继而用流动分析仪AA3测定小麦籽粒中全氮含量,小麦中GPC是籽粒全氮含量与5.7的乘积[18]。

1.3 模型构建方法与数据分析

1.3.1 光谱数据处理方法 高光谱数据在采集时容易受样本群体分布不均匀、光路散射、高频噪声与电路噪声等环境和仪器的影响,需要排除其中大量的噪声信息及干扰波段。因此本研究选用作物敏感性较高的400~1 000 nm波段为有效波段进行分析[19]。

同时,为提高光谱信息中的有效信噪比,采用一阶导数变换(first derivative,FD)对小麦冠层光谱进行预处理,其可以通过导数计算确定光谱曲线的弯曲点,以及最大最小反射率处的波长位置等光谱特征[20]。

1.3.2 模型构建 采用偏最小二乘法(partial least-squares method regression,PLSR)进行建模。偏最小二乘法是应用最为广泛的一种模型估测方法,它融合了主成分回归和多元线性回归的主要优势,既不会发生过度拟合或不能充分利用光谱信息的问题,也不会受到多种信号重叠、线性回归的干扰,且顾虑光谱信息与待测组分性质信息的相互作用[21]。

本研究中,选取开花期叶绿素含量(SPAD)、叶片干物质质量(LDW)、地上生物量(AGB)、叶片氮含量(LNC)、叶片氮积累量(LNA)、叶面积指数(LAI)、植株氮含量(PNC)、植株氮积累量(PNA)、氮营养指数(NNI)9个农学参数指标与经过一阶导数变换的结果进行建模,将样本按照2∶1的比例随机划分为建模集与预测集,每个农学参数的建模集与预测集的样本个数分别为32和16。

1.3.3 检验方法 在每个模型构建完成之后,利用预测集数据对所构建的回归估测模型的精度进行检验,利用决定系数(coefficient of determination,R2)、均方根误差(root mean squared error,RMSE)、标准均方根误差(normalized root mean squared error,nRMSE)以及相对预测偏差(ratio of performance to deviation,RPD)作为评价指标对其进行评估。其中,R2越高,RMSE越小,说明模型预测性能越好;反之,则模型预测性能越低。nRMSE≥30%为较大差异,30%>nRMSE≥20%为中等,20%>nRMSE≥10%为较小差异,nRMSE<10%为无差异。RPD≥2,表示模型结果可靠;2>RPD>1.4表示模型结果可行,但准确性与稳定性有待提高;RPD≤1.4表明模型结果较差,数据不可靠。

2 结果与分析

2.1 农学参数与籽粒蛋白质含量的统计分析

对小麦开花期的各农学参数与成熟期籽粒蛋白质含量进行统计分析。由表1可知,不同农学参数在试验处理下的数据离散程度,即变异系数表现具有一定的差异性,将各参数建模集与预测集的变异系数差值绝对值作比较,从小到大排序为LNC(0.16%),GPC(0.62%),PNC(0.74%),SPAD(1.22%),LAI(2.46%),NNI(3.28%),LDW(6.53%),LNA(6.79%),PNA(7.86%),AGB(8.71%)。结合统计分析特征来看,建模集与预测集在LNC,GPC,PNC,SPAD,LAI,NNI等6个指标较为相近,在LDW,LNA,PNA,AGB等4个指标上因为单位量纲的原因数据集之间的波动范围较大,但仍存在处理间差异性。这为冬小麦籽粒蛋白质含量高光谱预测模型的实现奠定了数据基础。

表1 小麦农学参数与籽粒蛋白质含量统计分析

续表

2.2 农学参数与冠层光谱的相关性分析

对开花期小麦冠层原始光谱和其一阶导数光谱反射率与不同农学参数进行相关性分析。结果如图1所示,可以看出原始光谱农学参数敏感区域主要集中在400~900 nm,呈先负相关后正相关关系,先增高后降低再增高的趋势,相关性最强的参数为SPAD(相关系数r=0.770),最低为PNC(相关系数r=0.529)。而一阶导数光谱农学参数敏感区域表现则明显优于原始光谱,相关性最强的参数为SPAD(相关系数r=0.891),最低为AGB(相关系数r=0.626)(表2)。由此可以看出,一阶导数的处理可以提高农学参数与光谱数据的相关性。

表2 小麦不同农学参数与原始光谱(OS)及一阶导数预处理光谱(FD)的相关性

图1 小麦不同农学参数与原始光谱(A)及一阶导数预处理光谱(B)的相关性

2.3 基于农学参数的高光谱估测模型构建

使用经过一阶导数处理后的建模集光谱数据,通过PLS最小二乘法构建冬小麦9个农学参数的估算模型,使用预测集的光谱数据输入进行效果检验。由表3可以看出,LAI、LDW、AGB3个参数构建的模型建模集与预测集的R2相对较低,nRMSE小于30%,RPD小于1.4,说明这3种参数估测模型准确性与稳定性差,有着中等的差异。LNA、PNA构建的模型建模集与预测集的R2大于0.5小于0.7,nRMSE小于30%大于20%,RPD均大于1.4小于2.0,表明模型的准确性和稳定性有待提高。SPAD、LNC、PNC、NNI构建的模型建模集R2大于0.8,nRMSE除NNI的建模集大于10%,其余皆小于10%,RPD大于2,说明该4种农学参数建模具有很高的精度,同时无差异,NNI有较小差异。预测集的R2低于建模集,大于0.58小于0.76。nRMSE以SPAD和LNC的预测集小于10%,PNC与NNI的预测集大于10%小于20%。RPD仅有NNI构建的模型预测集大于2.0其余皆大于1.4小于2.0。出现这种情况的原因可能是由于数据量少发生了过拟合的现象,验证效果受到了一定的影响,没能达到最佳,有待进一步提高。

表3 小麦不同农学参数的高光谱估测模型的构建与验证

2.4 农学参数与籽粒蛋白质含量相关性分析

将试验所获得的开花期农学参数与成熟期籽粒蛋白质含量进行相关性分析。由表4可以看出,8个农学参数与成熟期GPC达到极显著正相关关系,其从大到小分别为LNC(0.822)、LAI(0.744)、LNA(0.732)、PNC(0.712)、SPAD( 0.708)、NNI(0.693)、PNA(0.633)、LDW(0.599)。而AGB与GPC之间则不具有相关性。

表4 小麦不同农学参数与籽粒蛋白质含量的相关关系

2.5 基于农学参数的籽粒蛋白质含量预测模型构建

开花期农学参数与成熟期籽粒蛋白质含量存在显著的相关性,因此以线性回归的方法利用开花期9个农学参数的建模集与成熟期籽粒蛋白质含量构建冬小麦籽粒蛋白质含量预测模型,其回归方程与验证精度如表5所示。将各参数模型建模决定系数作比较,从大到小排序为LNC(0.636),LAI(0.598),LNA(0.577),SPAD(0.53),PNC(0.493),PNA(0.448),NNI(0.430),LDW(0.411),AGB(0.057),可知除AGB以外其余皆可达到差异极显著水平,其中最优的为LNC。将预测集实测值带入模型中,根据其预测值的验证效果可以将不同估测模型分为4类,最佳的为LNC,其R2达到0.766,RMSE达到0.79,RPD达到2.11;较好的为PNC与NNI,其R2在0.5到0.6之间,RMSE在1.0到1.1之间,RPD在1.5到1.7之间;适中的为SPAD、LNA、LAI,其R2在0.46到0.47之间,RMSE在1.2到1.3之间,RPD在1.3到1.4之间;较差的为PNA、LDW,其R2在0.4以下达到差异显著水平,RMSE大于1.3,RPD在1.2以下;AGB无差异。

表5 基于小麦不同农学参数的籽粒蛋白质含量预测模型

2.6 基于高光谱-农学参数-籽粒蛋白质含量的预测模型构建

经过一阶导数-最小二乘法处理的高光谱农学参数估测模型具有较高的估算精度,因此,利用高光谱-农学参数-籽粒蛋白质含量的技术路径,以农学参数作为中间变量构建基于冬小麦开花期高光谱数据的籽粒蛋白质含量预测模型。将高光谱农学参数估测模型的预测输出值作为输入值带入表5中的基于小麦不同农学参数的籽粒蛋白质含量预测模型,最终获得基于高光谱-农学参数-籽粒蛋白质含量的预测模型结果。表6为各农学参数模型中建模集与预测集的验证结果,预测值与实测值的1∶1比较关系见图2。结果显示,农学参数SPAD、LNC、NNI作为中间参数的预测模型可以达到较高的精度,R2达到差异极显著水平,分别为0.417、0.554和0.410,而RMSE则以SPAD、LNC、LAI、NNI4个参数构建的预测模型表现较低。总体上,以SPAD、LNC和NNI为中间参数的预测模型可以给出很好的检验效果,因此,可以利用开花期光谱数据对不同品质类型的小麦籽粒进行品质预测,其中,以LNC作为中间参数的模型预测效果最好。

图2 基于不同农学参数的高光谱预测籽粒蛋白质含量的预测值和实测值比较(1∶1)

表6 基于小麦不同农学参数的高光谱籽粒蛋白质含量预测模型的构建与验证

3 结论与讨论

基于“高光谱-农学参数-籽粒蛋白质含量”的籽粒蛋白质含量预测模型在实现高光谱对当前作物生长状况反演的基础上,涉及农学参数与成熟期籽粒蛋白质含量的关系,可以准确预测籽粒品质,为农业管理指导生产提供必要的信息。在此方法中,农学参数作为中间参数起到至关重要的作用,其必须能够对籽粒蛋白质含量有着较高的相关性从而准确预测出其值大小,还需具备可以被作物冠层光谱有效反演的特征。陈鹏飞等[22]利用主成分回归分析的方法建模,得出在AGB、PNC和NNI3个参数中挑旗期的NNI能够有效利用冠层高光谱参数预测,进而估测小麦GPC。屈莎等[23]利用支持向量机的建模方法,选用PNA、PNC、LNA和LNC4个参数与植被指数构建GPC预测模型,最终得出PNC为最优参数。可以看出不同建模方法以及植被指数选择对不同中间参数的建模效果影响是不同的。本研究表明,一阶导数可以显著提高农学参数与光谱曲线的相关性,以SPAD、LNC、PNC、NNI构建的高光谱农学参数反演模型效果较优,其中SPAD建模集以及预测集R2与nRMSE最佳,分别为0.993、0.759与0.54%、4.10%,NNI预测集RPD最佳,为2.04。以上4种农学参数同样是与高光谱曲线相关性最高的4种参数,说明小麦冠层高光谱可以有效反演当前叶片及植株氮素指标与生长状况,这一结论与前人[24-26]研究结果一致。

开花期之后小麦从营养生长转化为生殖生长,植株营养,尤其是氮素营养,主要向籽粒转运,所以可反映开花期叶片及植株氮素营养状况及能力相关的指标,诸如LNC、PNC和NNI与成熟期籽粒蛋白质含量拟合程度较高,SPAD、LNA、LAI和PNA等4个农学参数可以预测GPC且具有一定建模精度,但验证效果有待提高,而地上部生物量及叶片干物质质量仅能反应植株生长状态而不具备可显著反应氮素营养的特征,故其与籽粒蛋白质含量拟合程度较低。这与陈鹏飞等[22]、屈莎等[23]、宋晓宇等[27]的研究结果相同。

构建“高光谱-农学参数-籽粒蛋白质含量”的籽粒蛋白质含量预测模型,比较9个农学参数作为中间参数构建的模型预测效果,LNC的建模集与预测集的决定系数R2为0.64和0.55,RMSE为1.05和1.12,RPD为1.68和1.49。所以可以判断LNC是高光谱籽粒蛋白质含量预测模型中的最佳选择。另外,本研究主要在一阶导数与偏最小二乘法的方法基础上利用开花期高光谱数据与农学参数进行籽粒蛋白质含量预测,对于对比不同生育时期下的籽粒蛋白质含量预测模型效果能否进一步提前预测,以及结合不同农学参数相关的植被指数,进而提高籽粒蛋白质含量预测精度,仍需要在下一步研究中进行探讨。同时,在小麦籽粒蛋白质含量预测模型构建中,缺乏考虑温度等生态环境等因子的影响,需要在以后的研究中加入作物模型来进行综合研究。

猜你喜欢

农学光谱籽粒
声明
声明
基于三维Saab变换的高光谱图像压缩方法
煤炭矿区耕地土壤有机质无人机高光谱遥感估测
氮素对高温胁迫下玉米籽粒发育的调控效应
山西省主推小麦品种籽粒形态性状分析
基于3D-CNN的高光谱遥感图像分类算法
农学类专业校企协同育人的探索与实践
撒落成星星
基础农学发展现状及趋势分析