基于冠层高光谱的油菜角果期红边参数及叶片SPAD值反演模型
2019-12-23张锐廖桂平王访刘凡
张锐 廖桂平 王访 刘凡
摘要:以湖南省为研究区,探索不同栽培因子条件下油菜的高光谱特征,建立基于高光谱特征的叶绿素预测模型,并将其应用于田间生产实践,以期为油菜营养诊断、高产栽培和生产管理的信息化提供一定的理论依据和技术支撑。使用便携式地物光谱仪和SPAD-502叶绿素仪分别对油菜冠层反射光谱和SPAD值进行实测,分析不同栽培因子条件下角果期的油菜冠层光谱特征,并得到其相应的红边参数(包括红边位置、红边振幅与红边面积),最后运用多种方法对红边参数与角果期的油菜SPAD值进行相关性分析,以期建立SPAD值的最佳反演模型。结果表明,在红光波段(680~760 nm),油菜角果期的冠层反射光谱趋于稳定,冠层的三峰两谷现象比较明显,而且在整个角果期,红边位置都稳定在760 nm这个点,不随栽培因子的改变而改变。但是栽培因子对红边振幅和红边面积有着明显影响,因此可用红边参数来预测油菜的SPAD值。经过5种不同的建模比较分析可以得出,基于支持向量机(SVM)的预测模型最好,R2为0.912 6,均方误差为0.326 6。
关键词:油菜;红边特征;SPAD值;相关分析;回归模型
中图分类号: S565.4 文献标志码: A
文章编号:1002-1302(2019)20-0255-05
作物叶片的SPAD值反映了作物叶绿素含量的相对高低,它已经成为一种评价作物长势状况的重要参考指标[1]。因此,了解作物的叶绿素含量及其变化,对作物群体营养诊断、长势监测及估产具有重要意义。近年来,随着高光谱遥感技术的快速发展,遥感手段已经可以在光谱维度上展开,并且可直接对地物进行微弱光谱差异的定量分析,在作物遥感研究与应用中表现出强大优势[1]。作物叶片的高光谱信息在可见光范围内主要受叶绿素、类胡萝卜素的影响,因此可以用作物的高光谱参数来估测叶片的叶绿素含量。油菜是世界上主要的油料作物,也是我国生产种植面积最大的油料作物[2],因此,利用高光谱技术估测油菜叶片的叶绿素含量(SPAD值)的研究具有重要意义。
红边是由于作物在红光波段的强吸收以及在近红外波段的强反射,使光谱反射率在680~760 nm区域内陡然上升,形成了绿色作物光谱最明显的特征,与作物的叶绿素含量、氮含量等生理参数之间具有很好的相关性[3]。据姚付启等报道,在国外,Carter等将680~760 nm这一波段范围内冠层光谱特征曲线的一阶导数最大值定义为“红边”位置,接着进行了关于“红边”位置同叶绿素等色素之间关系的探讨[4];Pinar等提出,植被的冠层光谱“红边”位置能够非常好地反映单位面积农作物的叶绿素含量[4]。在国内,有研究指出,上层叶片的红边位置与叶绿素含量之间存在密切的联系[4]。有研究者于2004年测量了水稻、玉米、棉花3种作物不同生长期的高光谱反射率及其相应叶片的叶绿素含量等,分析了它们的红边参数与叶片色素含量的相关性[4]。黄敬峰等在2003至2008年研究了红边参数与叶面积指数(LAI)的相关性,因而建立了反演估算模型[5-6]。宋开山等测量了大豆冠层的高光谱反射率,接着分析了其与叶绿素含量的相关性[7]。在利用红边参数来估测绿色植物的叶绿素含量方面,国内外已经有很多研究成果,但是在油菜方面的应用较少,有的研究也只是基于冬前,关于油菜角果期的研究却很少,而角果是油菜最重要的器官,其光合能力和潜力直接决定了油菜的产量[8]。因此,研究油菜角果的高光谱特征以及不同栽培因子下红边特征与叶绿素的相关性,能够很好地提高油菜的光合作用效率并解决其“源”“库”之间的冲突,这对于增加油菜的产出、提升油菜籽的质量以及油菜的大规模、机械化生产具有巨大的价值。
本研究以长沙市耘园实验基地作为研究区,以油菜为研究对象,选择栽植密度、施肥量等作为试验因子,研究栽植密度与施肥量对油菜光谱特征的影响,旨在建立基于冠层高光谱的叶绿素预测模型,并将其应用到田间生产实践中,为油菜营养诊断、高产栽培和生产化管理提供一定的理论依据和技术支持。
1 材料与方法
1.1 试验设计与数据获取
1.1.1 试验设计 试验于2016年9月至2017年5月在湖南农业大学内耘园基地(地理位置为113°09′E,28°19′N)进行,试验用地为水旱轮作地。试验用油菜品种为油菜708(由隆平高科股份有限公司提供),栽植密度设为低密度(15万株/hm2)、中密度(30万株/hm2)和高密度(45万株/hm2)3个水平,施肥量设为低(225 kg/hm2)、中(487.5 kg/hm2)、高(750 kg/hm2)3个水平。所用肥料为从俄罗斯进口的复合肥,其氮(N)、磷(P)、钾(K)(即N+P2O5+K2O)含量为45%。施用硼肥、化学除草、抗旱等由試验区统一实施。例如,播前进行一次封闭除草,苗期施用1次药剂防蚜虫和菜青虫,油菜生长后期施用1次药剂防菌核病。共设9个处理(表1),3次重复,共计27个小区,均为随机小区,小区面积为16 m2(长 8 m,宽2 m)。
1.1.2 数据的获取 在油菜的角果期采用美国ASD公司生产的FieldSpec3Hi-Hi-Res便携式地物光谱仪测定不同处理小区冠层的高光谱反射率,光谱仪波段范围为325~2 500 nm,其中,325~1 000 nm采样间隔为1.4 nm,光谱分辨率为3 nm;1 001~2 500 nm采样间隔为1.1 nm,光谱分辨率为8 nm。光谱测量选择在晴朗无云、风力较弱的天气进行,测量时间为10:30—14:00。试验小区共计27个,每个处理小区随机均匀地选取5个点进行测量,取其平均值作为该小区的高光谱反射率,并且在每个小区测量之前,进行1次白板校正[6],然后在同一小区内再次测量角果期油菜叶片的SPAD值,测量所用仪器是日本美能达公司生产的SPAD-502叶绿素仪,每块小区测定5张叶片的SPAD值,均匀地选取各小区长势比较居中的样本进行测量,测量时选择油菜主茎从上往下数第3张叶片,每张叶片沿叶周选测5个均匀的叶片SPAD值,取平均值作为该采样点的叶片SPAD值,并对5个测定值取平均作为该试验小区的叶绿素含量相对值。
本研究共完成12次田间试验与数据采集,由于本研究主要针对的是油菜角果时期的特征,因此选取2017年3月26日和4月13日的数据用于研究。
1.2 分析方法
1.2.1 高光谱数据的处理 使用地物光谱仪自带的View Spec数据后处理软件,对原始数据进行处理,先转换为txt格式的文档,然后导入Excel,进行原始光谱的一阶微分变换并截取680~760 nm范围内反射率的一阶导数,从而计算各个红边参数。红边振幅Dλred是波长680~760 nm内光谱反射率的一阶导数的最大值;红边位置λred是红边振幅对应的波长;红边面积Sλred是680~760 nm内一阶导数光谱所包围的面积。
1.2.2 估算模型的方法 (1)线性回归模型。线性回归是数理统计中基于回归分析的一种统计分析方法。在回归分析中,只包含1个独立变量和1个因变量,两者之间的关系可以近似看作1条直线。这种回归分析被称为一元线性回归模型分析,其表达式如下:y=kx+b,其中,b为误差服从均值为0的正态分布。二元线性回归是有2个自变量的线性回归,是依据2个自变量和1个因变量之间的关系进行预测的方法。二元线性回归的公式如下:y=k1x1+k2x2+b。基于二元线性回归的预测方法、原理和步骤与基于一元线性回归的预测方法没有根本性差异,基本上相同。
(2)多项式回归。若对于可控变量x和随机变量y进行m(m>n)次独立的观测(xi,yi)(i=1,2,3,…,m),则y(因变量,也被称为响应变量)和x(自变量)之间的回归模型为yi=p1xin+p2n-1+…+pnxi+pn+1,其中,p1,p2,…,pi为未知参数。
(3)BP神经网络。BP神经网络的算法有2个步骤:1个是正向和反向传播,另1个是权值修正。在第1个步骤中,正向传播时,要把1个需要输入的学习样本输入到神经网络中,经过每层的权值加权以及激活函数的映射,一直传到最后1层,得到输出神经元的1个结果;而反向传播时,要把计算出来的这个输出结果与理想的输出相比较,计算它们的误差,然后将这个误差再反向传播到每层神经元中。在第2步误差反向传播的权值修正中,采用的是梯度下降法的原则[9-10]。
(4)支持向量机(SVM)回归。支持向量机是与相关学习算法有关的监督学习模型,可以分析数据、识别模型,用于回归和分类。支持向量回归的基本思想就是通过1个非线性映射到高维特征空间,并在这个特征空间进行线性回归[11]。支持向量机最开始是做分类的,但是为了利用支持向量机解决回归拟合问题,所以在支持向量机分类的基础上引入了不敏感损失函数,从而得到了回归型支持向量机。并且,在支持向量机应用于回归拟合时,其基本思想不再是寻找1个最佳超平面来使2类样本分开,而是寻找1个最佳超平面,使所有样本点距该最佳超平面的误差最小。
1.2.3 模型检测 将检测数据参数带入研究得到的反演模型中。通过预测值和实际值的计算对比,可以得到均方误差(MSE)和决定系数(R2)。MSE越小,R2约接近1,证明预测模型越好。具体有:(1)均方误差越小,表明模型的性能越好;(2)决定系数的范围在[0,1]内,愈接近1,表明模型的性能越好;反之,愈接近0,表明模型的性能越差。
2 结果与分析
2.1 冠层光谱的红边参数
通过一阶微分计算出每种处理方式下的一阶微分曲线,然后截取其中红光波段(680~760 nm)的曲线。从图1、表2可以看出,在整个油菜角果期,红边位置都稳定在 760 nm 这个点,说明油菜在角果期的红边位置不随栽培因子的变化而发生改变;油菜角果冠层光谱红边特征在680~750 nm 出现的双峰两谷现象也很明显,其中双峰分别在 687~689、717~719 nm,两谷则分别在690~691、720~721 nm,完全符合绿色植物的光谱特征,同时具备油菜特有的双峰现象,因此能够从这些特定的位置来识别油菜角果期的冠层光谱信息,这也与黄敬峰等关于水稻冠层一阶光谱在红光区域存在“双峰”现象的研究结论[6]相同。
分析本研究测得的角果期油菜冠层光谱红边参数可以得出,油菜角果期的红边位置为760 nm,红边振幅在 0.030 990~0.036 491之间,红边面积在0.309 525~0.400 972 之间,其中处理T9的红边振幅最大,但红边面积最小,处理T3的红边振幅最小,但红边面积最大,推测其主要原因,可能由于隨着供氮量的增加,叶片叶绿素含量升高,植物新陈代谢能力加强。因而在不同栽培因子条件下,油菜角果的冠层光谱值存在一定差异,即不同栽培因子对油菜角果冠层光谱有影响。
2.2 油菜红边参数与SPAD值的相关性反演研究
对角果期的油菜数据进行统计分析,其中油菜的样本容量为27株,通过MATLAB对油菜样本的红边参数与叶片SPAD值之间进行相关性分析,进而建立角果期红边参数与叶片SPAD值的回归模型。
2.2.1 一元线性回归 利用MATLAB对红边参数的单一变量红边振幅和红边面积进行分析,建立单一变量红边振幅和红边面积与叶片SPAD值的线性方程,其中红边振幅和红边面积作为自变量,叶片SPAD值作为因变量,可以得出图2、图3的线性回归方程。关于红边振幅和叶片SPAD值的一元线性回归方程为y=55.831-409.57x,其决定系数为0.436 6,均方误差为1.53;关于红边面积和SPAD值的一元线性回归方程为y=26.287+44.65x,其决定系数为0.665 0,均方误差为1.18。以红边面积作为自变量建立的回归模型的决定系数比以红边振幅作为自变量建立的模型的决定系数要大,并且均方误差要小,可见使用红边面积作为自变量建立的模型要更精确。
2.2.2 多元线性回归 多元线性回归分析就是要研究因变量与2个或2个以上自变量的回归问题。红边参数中的红边振幅和红边面积都与叶片SPAD值具有较好的一元关系。为了探索精确度更高的估算回归模型,建立上述2个显著变量与油菜叶片SPAD值的多元线性回归模型。经过MATLAB软件的分析处理,建立的多元回归模型为y=-113.44x1+37.693x2+32.582(其中:x1为红边振幅,x2为红边面积),该模型的R2为0.682,MSE为1.170,均优于单个变量的回归模
型,估算精度得到了提高。
2.2.3 一元多项式回归 使用MATLAB对红边参数的单一变量(红边振幅和红边面积)与叶片SPAD值分别进行二次、三次多项式回归拟合。由图4、图5可以看出,红边振幅的二次多项式拟合方程为y=0.057 53x2-1.331x+41.82,r2为 0.437,MSE为1.564;红边振幅的三次多项式拟合方程为 y=-0.754 3x3+0.063 93x2-0.011 8x+41.91,r2为0.526,MSE为1.467。红边面积的二次多项式拟合方程为y=0.343x2+1.692x+41.55,r2为0.694,MSE为1.153;红边面积的三次多项式拟合方程为y=-0.097 91x3+0.341 1x2+1.887x+41.53,r2为0.695,MSE为1.175。
2.2.4 BP神经网络 以油菜冠层角果期的叶片作为试验样本,建立以高光谱红边参数为自变量的传统回归模型,然后将从中优选的红边参数作为BP神经网络的输入,将油菜叶片的SPAD值作为输出。利用MATLAB编程对BP神经网络模型进行训练,首先对数据进行随机抽取,分作2组,1组作为训练集(n=20),用以建立回归模型,1组作为测试集(n=7),用以进行精度检查,然后对输入、输出变量进行归一化处理,数据被压缩到[0,1]的范围中,以使训练阶段容易收敛,最后建立BP神经网络的叶片SPAD值估算模型及精度检验,模型的训练值和目标值均方误差MSE为0.240 6,决定系数为 0.724 0,模拟结果较精确。模型的检验结果如图6、表3所示,可见预测值与实际值的MSE为0.114 7,决定系数为 0.802 4,模型的预测效果良好。
2.2.5 支持向量机 以油菜冠层角果期的叶片作为试验样本,建立起以高光谱红边参数为自变量的传统回归模型,利用MATLAB编程对SVM模型进行训练。首先对数据进行随机抽取,分作2组,1组作为训练集(n=20),用以建立回归模型,1组作为测试集(n=7),用以进行精度检查,然后对输入、输出变量进行归一化处理,数据被压缩到[0,1]的范围中,以使训练阶段容易收敛,最后建立基于SVM的油菜红边参数及叶片SPAD值估算模型并进行精度检验,由图7可知,模型的训练值和目标值均方误差为0.038 5,决定系数为0.856 7,模拟结果很好。模型的检验结果如图8所示,预测值与实际值的均方误差为0.326 6,决定系数为0.912 6,模型的预测效果较为精确。
3 讨论
本研究利用高光谱对角果期油菜的叶片SPAD值进行了估算研究,为油菜的叶片SPAD值高精度估算提供了重要的理论依据。通过对油菜冠层高光谱特征曲线的分析可知,油菜角果的光谱特征在680~760 nm这一范围出现的双峰两谷现象很明显,而整个油菜角果期的红边位置都稳定在760 nm这点,可作为油菜角果期识别与反演的重要标志,这与黄敬峰等的研究结果[6]相同。在角果期不同栽培因子条件下,油菜光谱反射率的整体变化趋势相同,但是在不同栽培条件下,油菜的冠层光谱值存在着一定差异,即不同栽培因子对油菜冠层光谱有影响,结果表明,在3.3 kg/hm2+667株/hm2这一栽培条件下,油菜的长势最好,可以推测是由于随着单位植株供氮量的增加,叶片叶绿素含量增加,植物的新陈代谢能力加强。
本研究结论具有一定的代表性,但是还存在一些不足,研究初步得出的结论都是基于同一年份以及同一地点进行的,加上试验样本有限,而且试验样本为同一种油菜品种,此外采集光谱数据的人不同,操作仪器的方式也不可能完全一致,另外还受到天气、环境以及设备的影响。因此,基于冠层光谱的油菜角果红边参数和SPAD值估算模型的预测准确性和稳定性以及所建立的模型是否适用于其他油菜品种类型和指导大面积生产仍需要进一步试验与论证。
4 结论
本研究以油菜作为对象,利用微分技术获取光谱参数,分析叶片SPAD值与高光谱特征参数的相关关系,建立起了估算油菜叶片SPAD值的线性回归模型、多项式回归模型、BP神经网络模型以及支持向量机回归模型,并对各模型的反演精度进行比较分析,得出基于红边参数构建的支持向量机回归模型是估算油菜叶片SPAD值的最优模型,其决定系数R2为0.912 6,均方误差为0.326 6。
参考文献:
[1]朱西存,赵庚星,姜远茂,等. 基于高光谱红边参数的不同物候期苹果叶片的SPAD值估测[J]. 红外,2011,32(12):31-38.
[2]张秀英,皇甫海燕,陈菁菁,等. 高油酸油菜的研究进展及前景[J]. 作物研究,2007,60(增刊1):654-656,661.
[3]杨荣超,田海清,李 斐,等. 基于甜菜冠层高光谱红边参数的SPAD值診断[J]. 江苏农业科学,2017,45(11):153-156.
[4]姚付启,张振华,杨润亚,等. 基于红边参数的植被叶绿素含量高光谱估算模型[J]. 农业工程学报,2009,25(增刊2):123-129.
[5]王福民,王 渊,黄敬峰. 不同氮素水平油菜冠层反射光谱特征研究[J]. 遥感技术与应用,2004,26(2):80-84.
[6]黄敬峰,王 渊,王福民,等. 油菜红边特征及其叶面积指数的高光谱估算模型[J]. 农业工程学报,2006,22(8):22-26.
[7]宋开山,张 柏,王宗明,等. 基于小波分析的大豆叶绿素a含量高光谱反演模型[J]. 植物生态学报,2008,32(1):152-160.
[8]张耀文,赵小光,关周博,等. 油菜角果光合特性研究现状及改良思路[J]. 中国油料作物学报,2017,39(5):704-713.
[9]李媛媛,常庆瑞,刘秀英,等. 基于高光谱和BP神经网络的玉米叶片SPAD值遥感估算[J]. 农业工程学报,2016,32(16):135-142.
[10]杨可明,张婉婉,卓 伟,等. 红边光谱谐波分析的神经网络法叶绿素含量反演研究[J]. 科学技术与工程,2016,16(24):19-24.
[11]梁 栋,管青松,黄文江,等. 基于支持向量机回归的冬小麦叶面积指数遥感反演[J]. 农业工程学报,2013,29(7):117-123.