基于高光谱和MLSR-GA-BP 神经网络模型油菜叶片SPAD 值遥感估算
2020-09-10崔小涛常庆瑞屈春燕史博太蒋丹垚夏利恒王玉娜
崔小涛,常庆瑞,屈春燕,史博太,蒋丹垚,夏利恒,王玉娜
(西北农林科技大学资源环境学院,陕西 杨凌 712100)
叶绿素与植物光合作用能力和生长状况紧密相关,是植物氮含量重要指示器[1-2]。传统测量叶绿素含量方法主要有分光光度法、原子吸收法等,这些方法耗时、耗力、过程繁琐。目前,高光谱遥感具有实时、快速、无损监测叶绿素含量优势,为作物叶绿素含量定量化诊断提供有效手段[3-4]。将高光谱遥感技术应用于叶绿素含量测定研究中,作物方面对小麦、玉米研究较多,Daughtry等研究光谱指数、光谱波段与玉米叶绿素关系,构建不同模型预测玉米叶绿素含量[5-6];李粉玲等利用光谱指数与SPAD值建立模型,探究预测小麦叶绿素最佳模型[7-8]。在预测模型方面由简单传统线性模型拓展到复杂机器学习算法模型,刘露等通过构建夏玉米光谱反射率与植株冠层SPAD值传统线性模型,寻找最优光谱指数[9];刘京等通过苹果叶片归一化光谱参数与SPAD值构建多项式回归及支持向量回归模型,发现支持向量回归模型优于多项式回归模型[10];于汧卉等基于地面高光谱和实测农学数据,发现将PROSAIL模型、连续小波变换和偏最小二乘回归结合可实现冬小麦叶绿素遥感估算[11]。由于BP神经网络算法模型具有实现任何复杂非线性映射功能,具有自学习推广、概括能力[12],在叶绿素预测方面应用较多。刘文雅等采用BP神经网络定量模拟马尾松叶绿素含量[13];李媛媛等基于光谱反射率和玉米叶片SPAD值,构建传统回归模型、主成分回归模型、偏最小二乘回归模型与BP神经网络模型,表明BP神经网络对叶绿素具有较好预测能力[14]。
遗传算法具有并行性,可使BP神经网络更易收敛到全局最小,提高BP神经网络模型反演精度[15]。但运用多种光谱参数,使用基于多元线性逐步回归遗传算法优化BP神经网络模型预测SPAD值研究较少。本文以西北地区油菜作物为研究对象,基于光谱反射率构建光谱参数和油菜叶片SPAD值,构建单因素模型、多元线性逐步回归模型、偏最小二乘回归模型、基于多元线性逐步回归遗传算法优化BP神经网络模型,旨在探究预测油菜叶片SPAD值最优模型,为西北地区油菜长势遥感监测提供理论和技术支持。
1 材料与方法
1.1 研究区概况与试验设计
本试验研究区位于陕西省宝鸡市扶风县杏林镇西坡村,东经107°58'48'',北纬 34°19'12'',位置见图1,地处关中平原西部,陕西省中西部,属于温带大陆性季风气候,年平均气温12.4℃,无霜期约209 d,年平均降雨量592 mm,降雨分布不均,主要集中在夏、秋两季,作物一年一熟,主要为小麦、玉米、油菜等。本试验划分10个小区,小区面积为64 m2。2018年9月14日播种,采用一次性施足底肥,即 N:240 kg·hm-2,P2O5:120 kg·hm-2,K2O:180 kg·hm-2,田间管理方式同当地大田生产管理,当年试验田油菜未发生病虫害。
本试验按照油菜4个关键生育期采样观测,分别是苗期(2019年3月29日)、蕾薹期(2019年4月16日)、开花期(2019年4月25日)、成熟期(2019年5月11日),采样时每小区设8个采样点,每个采样点采集一株油菜上层、中层、下层各两片叶片,作为采样点样本,立即放入塑封袋,排净空气,放入装有冰袋恒温箱。采用SPAD值作为叶绿素含量指标[10],测定油菜叶片SPAD值和光谱反射率。
1.2 项目测定与方法
1.2.1 叶片SPAD值测定
使用日本KONICA MINOLTA公司生产SPAD-502型手持式叶绿素仪测定油菜叶片SPAD值,测量前将待测叶片编号,擦拭干净叶片,每个样点测量选取上、中、下3层共6片叶子,选取每片叶子在不同部位10次测量平均值作为SPAD值,测量时需避开叶脉位置,求取每个样点6片叶片SPAD值平均值作为该样点最终SPAD值。
1.2.2 叶片光谱反射率测定
采用美国SVC HR-1024i型光谱仪测定油菜叶片光谱反射率,研究光谱400~1 000 nm波段,因绿色植物光谱在可见光波段主要受叶绿素影响。利用光谱仪自带软件SVC HR-1024i PC将油菜叶片光谱曲线重采样到1 nm。每个样点选取测量上、中、下3层共6片叶片(与被测SPAD叶片对应),为使测量结果更具代表性,每叶片测量2条光谱,测量时需避开叶脉位置,求取12条光谱平均值作为该样点最终光谱反射率。
1.3 光谱参数选取
本研究选取8种基于高光谱位置特征参数、5种光谱曲线构成面积特征参数、4种新光谱特征参数和14种植被指数(见表1)。以上参数在本研究中统称为光谱参数,这些光谱指数认可度较高,物理意义较明确。
1.4 模型构建方法
构建单因素模型时,本研究采用一元线性、多项式、指数、对数和幂函数回归模型。运用Excel 2016建模。
构建多因素模型时,本研究采用偏最小二乘回归模型(PLSR)、基于多元线性逐步分析遗传算法优化BP神经网络模型(MLSR-GA-BP神经网络)。PLSR集中主成分分析、典型相关分析和线性回归分析特点,建立最优模型;MLSR-GA-BP神经网络模型首先利用多元线性逐步回归筛选出对因变量影响大变量,简化神经网络结构,再利用遗传算法优化BP神经网络权值和阈值,最终建立最优模型。具体遗传算法参数和BP神经网络参数见表2。运用DPS数据处理系统和Matlab 2016建模。
1.5 模型验证参数
本研究采用决定系数R2、均方根误差RMSE和相对误差RE共3个指标评价模型拟合预测能力,其中决定系数R2越大(不超过1),均方根误差RMSE和相对误差RE越小,模型拟合预测能力越强。
具体公式见式1~3。本试验每个生育期80个样本,4个生育期共320个样本,本试验将测定SPAD值排序,按照3∶1抽样采用分层抽样法,构建估算模型和验证模型,每个生育期估算模型样本60个,验证模型样本20个。
表1 光谱参数及其定义或计算公式Table 1 Spectral parameters and their definition or calculation formula
表2 遗传算法参数和BP神经网络算法参数Table 2 Genetic algorithm parameters and BP neural network algorithm parameters
2 结果与分析
2.1 不同生育期油菜叶片SPAD和高光谱特征变化
由图2可知,油菜叶片SPAD平均值呈下降趋势,蕾薹期、开花期和成熟期较苗期相比分别下降12.71%、17.11%和26.51%,由方差分析结果可见,苗期分别和蕾薹期、开花期、成熟期差异显著,成熟期分别和蕾薹期、开花期差异显著,但蕾薹期和开花期无显著差异。
由图3可知,各生育期光谱反射率总体趋势一致,与大多数绿色植物高光谱反射率规律一致,在400~500 nm,由于叶绿素强烈吸收蓝光,形成第1个吸收谷;在600~700 nm,由于叶绿素强烈吸收红光,形成第2个吸收谷,两个吸收谷在550 nm附近形成较强反射峰,在670~780 nm,由于叶绿素对红光强烈吸收逐渐变为对近红外光散射,造成反射率急剧上升;在780~1 000 nm,由于叶片内部结构和叶片内营养成分浓度等影响,形成持续高反射率平台。由图3可知,不同生育期反射率变化,总体趋势从苗期到成熟期反射率呈上升趋势,但在400~520和580~690 nm附近,开花期反射率大于成熟期反射率,总体趋势与不同生育期油菜叶片SPAD平均值规律相反,原因为油菜叶片SPAD值越高,叶绿素含量越高,对光吸收越强,反射率越低。
2.2 油菜叶片SPAD值与光谱反射率相关性分析
2.2.1 油菜叶片SPAD值与原始光谱反射率相关性分析
分析油菜叶片SPAD值与原始光谱反射率作相关性,结果见图4。各生育期油菜叶片SPAD值与原始光谱均在绿黄波段和红光波段呈极显著相关性,550和710 nm附近相关性达最大,均为显著负相关,710 nm后4个生育期相关性均迅速下降,而后缓慢上升,但仅成熟期在0.01水平上达到显著正相关,其他3个生育期均未达到。
2.2.2 油菜叶片SPAD值与光谱参数相关性分析
利用SPSS软件分析油菜叶片SPAD值与光谱参数相关性,结果见表3。苗期、蕾薹期和开花期均有22个光谱参数在0.01水平上显著相关(具体光谱参数不同),1个光谱参数在0.05水平上显著相关,8个光谱参数不相关(具体光谱参数不完全相同),成熟期26个光谱参数在0.01水平上显著相关,1个光谱参数在0.05水平上显著相关,4个光谱参数不相关,成熟期比其他3个生育期叶片SPAD值与光谱参数相关性更强。苗期相关性最强光谱参数是MCARI,相关性0.808,其中SRg、CARI、MCARI相关性均达0.800以上;蕾薹期相关性最强光谱参数为VOG2和MTCI,相关性是0.908,其中14个光谱参数相关性达到0.800以上;开花期相关性最强光谱参数为CARI,相关性为0.839,其中Db、SRg、CARI、MCARI和MTCI相关性达到0.800以上;成熟期相关性最好光谱参数为SRg,相关性为0.869,其中有13个光谱参数相关性达0.800以上。Db、SDb、 SRg、 CARI、 MCARI、 MCARI/OSAVI、 MTCI共7个光谱参数在4个生育期相关性均达0.770以上,可较好参与模型建立。
2.3 不同生育期油菜叶片SPAD值高光谱估算模型构建与精度比较
本研究为使各模型具有可比性,从31种光谱参数中选取出与油菜叶片SPAD值相关系数绝对值大于0.770光谱参数(7种)建模。
2.3.1 油菜叶片SPAD值单因素模型构建与精度比较
模型建模结果见表4,可见,苗期MCARI建立幂函数模型建模决定系数R2最高,验证决定系数R2较大,RMSE和RE均较小,MCARI建立幂函数模型拟合预测能力最优;同理,蕾薹期MCARI/OSAVI所建立二次多项式模型拟合预测能力最优;开花期CARI建立指数模型拟合预测能力最优;成熟期MCARI建立幂函数模型相比于同期其他参数建模最优。比较4个生育期最优模型,可见蕾薹期建模决定系数和验证决定系数均最高,RMSE和RE均较低,蕾薹期可利用MCARI/OSAVI建立二次多项式模型估算油菜叶片SPAD值。
2.3.2 偏最小二乘回归模型构建与精度比较
模型建模结果见表5。可见,蕾薹期建模决定系数R2和验证决定系数R2相比其他生育期均最高,RMSE在3以下,RE在4.5%以下,均较小,故在4个生育期中蕾薹期模型精度最高,拟合预测能力最优。
表3 不同生育期油菜叶片SPAD值与光谱参数相关性Table 3 Correlation between SPAD value and spectral parameters of rape leaves at different growth stages
表4 不同生育期光谱参数与SPAD值单因素最优估算模型Table 4 Single factor optimal estimation model of spectral parameters and SPAD values at different growth periods
表5 不同生育期偏最小二乘回归模型Table 5 Partial least squares regression model for different growth periods
2.3.3 基于多元线性逐步分析遗传算法优化BP神经网络模型(MLSR-GA-BP神经网络)构建与精度比较
模型建模结果见表6。
由表6可知,蕾薹期建模决定系数R2最高,建模效果最优,其次为开花期、成熟期、苗期。但成熟期验证决定系数R2最高,且RMSE和RE最低,故成熟期验证精度最高,其次为蕾薹期、苗期、开花期。综合验证精度和预测精度,蕾薹期和成熟期拟合预测效果良好。
表6 不同生育期MLSR-GA-BP神经网络模型Table 6 MLSR-GA-BP neural network model at different growth stages
2.4 各模型效果与模型精度比较
为筛选估算油菜叶片SPAD值最优模型,对比模型见表7。MLSR-GA-BP建模决定系数R2在4个生育期均最大,建模效果最优,PLSR次之,单因素模型最差。在模型精度方面,MLSR-GA-BP验证决定系数R2在4个生育期均最大,验证均方根误差RMSE在苗期、蕾薹期和成熟期均为最低,开花期略高于单因素模型,验证相对误差RE均最小,综合3个指标可见,MLSR-GA-BP神经网络模型预测精度最高。
因此将MLSR-GA-BP神经网络模型验证样本实测值和预测值空间分布绘制成散点图5,图中实线为实测值回归方程,虚线为1∶1线,当回归方程越接近于1∶1线,说明模型效果更优。由图5可见,成熟期模型估算效果最好,曲线斜率为0.97,最接近1。
表7 不同生育期各模型比较Table 7 Comparison of models in different growth periods
3 讨论
在可见光波段,油菜叶片SPAD值与叶片光谱反射率呈负相关,叶绿素含量越高,光谱反射率越低,光吸收越强。在估算叶片SPAD值时,模型选择至关重要。
目前已有学者将多种模型应用至各种作物SPAD值估算,多因素模型优于单因素模型,机器学习算法模型优于传统线性模型,在机器学习算法中BP神经网络算法模型优于偏最小二乘算法模型,与本文研究结果一致[14]。SPAD值反映叶绿素含量,差异体现在反射率光谱从可见光到近红外多个光谱波段上,光谱参数即不同光谱波段组合,单因素建模仅考虑单一光谱参数,而多因素建模将多个光谱参数参与建模,故多因素模型优于单因素模型;其次偏最小二乘算法模型集中主成分分析、典型相关分析和线性回归分析特点,BP神经网络算法模型具有实现复杂非线性映射功能,适合求解内部机制复杂问题,具有自学、推广、概括能力,遗传算法并行性,可使其更易收敛至全局最小,机器学习算法模型优于传统线性模型,BP神经网络算法模型优于偏最小二乘算法模型。研究BP神经网络时,其隐含层节点数无固定计算方法,前人使用几种方法[14],但经训练,均不适合本模型,本模型隐含层节点数经多次尝试,选择最优节点数。
目前,国内外对SPAD值估算模型尚无统一定论,最优模型选取不同。不同作物叶绿素含量不同,同种作物叶绿素含量也受品种、种植地点、水肥状况、仪器差异影响,导致无法确定估算SPAD值统一模型标准。本文测定油菜叶片SPAD值仅限于反映西北干旱地区情况,受此影响模型结果尚无法应用于其他地区油菜叶片SPAD值估算。
4 结 论
本文以西北地区油菜作物为研究对象,通过分析油菜叶片SPAD值与光谱参数相关性,筛选对SPAD敏感光谱参数,分别构建并比较基于光谱参数单因素模型、偏最小二乘回归模型(PLSR)和基于多元线性逐步回归遗传算法优化(GA)BP神经网络SPAD估算模型,结论如下:
a.油菜SPAD平均值在苗期、蕾薹期、开花期、成熟期呈下降趋势,而油菜叶片光谱反射率总体趋势则呈上升趋势,但在400~520和580~690 nm,开花期反射率大于成熟期反射率,因油菜叶片SPAD值越高叶绿素含量越高,对光吸收越强,反射率越低,总体趋势呈相反趋势。油菜SPAD平均值在蕾薹期和开花期无显著差异,其他生育期均呈显著差异。
b.苗期相关性最优光谱参数为MCARI,蕾薹期相关性最强光谱参数为VOG2和MTCI,开花期相关性最优谱参数为CARI,成熟期相关性最优光谱参数为SRg。从光谱参数角度看,Db、SDb、SRg、CARI、MCARI、MCARI/OSAVI、MTCI共 7 个光谱参数在4个生育期相关性均达0.770以上,相关性较好,可参与模型构建。
c.从最优模型来看,MLSR-GA-BP神经网络模型为最优模型,建模R2均在0.77以上,最大为0.91,验证R2均在0.72以上,最高达0.92,可更好预测油菜叶片SPAD值。