采用SEPLS_ELM模型估算夏玉米地上部生物量和叶面积指数
2021-11-24陆军胜陈绍民黄文敏胡田田
陆军胜,陈绍民,黄文敏,胡田田
采用SEPLS_ELM模型估算夏玉米地上部生物量和叶面积指数
陆军胜1,2,陈绍民1,2,黄文敏3,胡田田1,2※
(1. 西北农林科技大学旱区农业水土工程教育部重点实验室,杨凌 712100;2. 西北农林科技大学水利与建筑工程学院,杨凌 712100;3. 陕西省耕地质量与农业环境保护工作站,西安 710000)
利用高光谱数据进行作物生长状况监测具有无损和高效的特点,是现代精准农业发展的必要手段。该研究以连续3 a(2018—2020年)不同水氮供应下夏玉米营养生长期采集的212份植物样品(地上部生物量和叶面积指数)和高光谱实测数据为数据源,分别采用偏最小二乘回归(Partial Least Squares Regression,PLS)、极限学习机(Extreme Learning Machine,ELM)、随机森林(Random Forest,RF)和基于PLS叠加策略的叠加极限学习机算法(Stacked Ensemble Extreme Learning Machine based on the PLS,SEPLS_ELM)构建了夏玉米营养生长期地上部生物量和叶面积指数估算模型。结果表明:基于PLS和ELM构建的夏玉米地上部生物量和叶面积指数估算模型的精度均较低,前者验证集2低于0.85、均方根误差高于550 kg/hm2,后者2低于0.90、均方根误差高于0.40 cm2/cm2。相比之下,基于RF和SEPLS_ELM构建的夏玉米营养生长期地上部生物量和叶面积指数估算模型均有着较高的估算精度,SEPLS_ELM模型表现尤为突出,其地上部生物量和叶面积指数估算模型验证集的2分别为0.955和0.969,均方根误差分别为307.3 kg/hm2和0.24 cm2/cm2,表明叠加集成模型能够充分利用高光谱数据并提高作物地上部生物量和叶面积指数估算精度。
高光谱;遥感;生物量;随机森林;叶面积指数;偏最小二乘;极限学习机;叠加集成模型
0 引 言
生物量是作物生长发育过程中光合作用的产物,能够反映作物长势和营养状况,是作物产量形成的重要基础[1-2]。叶面积指数是表征叶片疏密程度和冠层结构特征的重要植被参数,与作物蒸腾、光能截获、光合速率、净初级生产力等密切相关,在气候变化、净初级生产力模型、作物生长模型、生态模型以及水、碳循环研究中有着重要作用[3-5]。依据地上部生物量和叶面积指数不但能够进行作物长势监测和产量预报,而且能够进行田间水肥管理[6-8]。因此,快速、准确地获取地上部生物量和叶面积指数具有重要意义。
传统的作物地上部生物量和叶面积指数获取主要通过破坏性的人工测量,其过程繁琐,耗时费力,难以大面积推广应用。近年来,遥感技术逐渐应用于作物生理生态参数的提取,这为作物生物量和叶面积指数等参数的快速获取提供了极大可能。如高林等[9]通过植被指数估算了冬小麦叶面积指数;Zhou等[10]通过构建新植被指数估算了马铃薯地上部生物量和叶面积指数;Feng等[11]通过优化的非线性植被指数估算了冬小麦叶面积指数。然而利用单一植被指数进行作物生理生态参数反演时,常常存在不同程度的饱和现象[12],此外单一植被指数往往包含有限的信息,使得生物量和叶面积指数估算时存在精度不高的问题。为了解决单一植被指数信息量少,估算不准确等问题,崔日鲜等[13]通过构建多个植被指数并利用BP神经网络和多元线性回归估算了冬小麦地上部生物量;夏天等[14]通过分析冬小麦冠层光谱反射率与叶面积指数之间的相关性,选择了敏感光谱波段的反射率作为BP神经网络的输入进行冬小麦叶面积指数估算并获得了较高的估算精度;梁栋等[15]通过将植被指数(归一化植被指数和比值植被指数)与不同波段反射率数据(蓝、绿、红、近红外4个波段)作为支持向量机的输入进行了冬小麦叶面积指数的估算。然而上述将敏感波段的光谱信息或者多个植被指数作为传统回归或机器学习方法的输入变量进行生物量或叶面积指数估算往往会舍弃大量的光谱信息,同时敏感波段的选择常常需要一定的先验知识,且数据处理过程较为复杂。
已有研究报道极限学习机能够以非常快的速度和较少的人工干预学习出泛化能力较好的学习器[16],解决了传统神经网络参数选取复杂,容易陷入局部最优的缺点,在非线性拟合方面有着明显的优势,近年来广泛应用于作物生理生态参数反演,然而该算法在处理高维小样本数据时存在预测精度低、误差大和预测结果不稳定等问题[16]。基于此已有研究将光谱曲线划分为若干个子区间,使得每个子区间包含相对较少的波段数降低了高光谱数据维度,然后分别对每个子区间进行独立建模(子模型),最后依据一定的叠加策略进行子模型叠加集成,提高了模型的预测精度[16-19]。如Shan等[17]分别采用赢者通吃、非负约束最小二乘和偏最小二乘加权策略进行了相关生化参数的估算,得出采用偏最小二乘加权策略进行叠加集成能够取得较好的预测效果。但是Shan等在光谱区间数和子模型神经元数的选择上存在一定的盲目性,这可能会使得子模型光谱区间对响应变量的敏感性降低,最终影响叠加集成模型的估算精度。因此,本研究拟以此为切入点,基于验证集均方根误差最小的原则选择适宜的光谱区间数和神经元数量,对不同水氮处理下大田玉米的地上部生物量和叶面积指数进行估算,同时对比具有集成思想的随机森林算法与本研究构建的基于偏最小二乘叠加策略的极限学习机叠加模型,以期为夏玉米地上部生物量和叶面积指数估算提供参考。
1 材料与方法
1.1 研究区概况
研究区位于陕西省杨凌示范区西北农林科技大学节水灌溉试验站(108°24′E,34°20′N),海拔506 m,地处关中平原,属于暖温带季风半湿润气候区,年平均温度为12.9 ℃,多年平均降水量560 mm(主要集中在7、8、9月),年平均蒸发量1 000 mm,是中国重要的夏玉米种植区[20]。
1.2 田间试验及数据获取
2018—2020年进行了夏玉米不同水氮管理的田间试验,试验采用裂区设计,水分处理为主区,施氮量为副区,包括3个水分水平和4个氮肥供应水平,共12个处理(表1),每个处理3次重复。具体的水肥管理细节和田间试验过程与参考文献[20]一致。
表1 夏玉米田间试验水氮处理设计
注:ETc为夏玉米蒸散量。
Note: ETcis evapotranspiration of summer maize.
试验所用氮肥为尿素(N,46%),磷肥为过磷酸钙(P2O5,16%),钾肥为氯化钾(K2O,62%)。氮肥采用滴灌水肥一体化(滴头流量为2 L/h,滴头间距为30 cm)分4次施入,具体施肥比例分别为播种(出苗)20%,苗期30%,拔节期30%,吐丝灌浆期20%。磷肥(P2O5)和钾肥(K2O)在播种后随降雨一次性撒施,施肥量分别为90和60 kg/hm2。
分别于2018年7月28日、2019年7月10日、7月26日和2020年7月6日、7月19日和7月27日采集光谱数据。夏玉米冠层光谱反射率采用ASD Field-Spec 3背挂式野外高光谱仪(Analytical Spectral Devices,Inc.,St,Boulder,美国)测定。仪器波段范围350~1 830 nm,其中,350~1 000 nm光谱分辨率为3 nm,采样间隔为1.4 nm;1 000~1 830 nm分辨率为10 nm,采样间隔为2 nm,仪器自动将采样数据插值为1 nm间隔输出。光纤长度1.5 m,视场角25°。在晴朗无风的天气,于11:00—14:00进行测定,测定时保证光纤探头垂直向下,距冠层顶部约1 m。
每个小区选取能代表该小区长势的3个样方进行测定,每个样方每次采集10条光谱曲线,以平均值作为该样方的光谱反射率,3 a共采集212组数据。每个样本测定前进行一次标准白板校正。在测定高光谱的样方内同步进行破坏性取样,分别测定夏玉米地上部生物量和叶面积指数。
1.3 光谱数据预处理
由于光谱数据受到环境的干扰(1 350~1 450 nm处存在水分强吸收带,1 801~1 830 nm处存在较强的边缘噪声),所以本研究保留351~1 350 nm和1 451~1 800 nm波段反射率进行研究(共1 350个波段)。为了减少(消除)背景噪声、基线漂移及杂散光等无用信息对高光谱反射率曲线的影响,本文选用Savitzky-Golay卷积平滑(9点4次)对光谱数据进行预处理。
1.4 样本集划分
基于3 a田间试验共获取212份有效样本,首先对地上部生物量和叶面积指数分别从小到大排序,然后选取1/4的样本作为验证集,其余3/4的样本作为建模集。建模集和验证集的样本数量及地上部生物量和叶面积指数统计特征如表2所示。
表2 夏玉米营养生长期地上部生物量和叶面积指数统计
1.5 研究方法
偏最小二乘回归(Partial Least Squares Regression,PLS)是一种集多元线性回归分析、典型相关分析和主成分分析于一体的多元统计数据分析方法[21]。自模型提出以来,因其能够较好地解决传统多元回归难以解决的问题(如自变量之间的多重相关性)而得到广泛的应用。
极限学习机(Extreme Learning Machine,ELM)是基于单隐含层前馈神经网络为基础的一种算法,在学习速率和泛化性能方面具有明显优势[22]。ELM的特点是输入层与隐含层之间的连接权值和隐含层神经元的阈值随机生成。基于此,应用ELM模型通常需要多次运行,记录建模和预测结果较好的模型或者计算多次预测的均值[23]。
随机森林(Random Forest,RF)算法是基于自助法(bootstrap)取样的一种机器学习算法,它的主要思想是从原始训练集中抽取个样本,且每个样本的样本容量均与原始训练集的大小一致[24-25];然后对每个样本分别进行决策树建模,得到个建模结果。最后,以所有决策树预测结果的均值作为最终预测结果。RF预测准确率高,不容易出现过拟合现象,对噪声和异常值都具有很好的容忍度。对高光谱遥感等高维度数据训练和学习效果较佳。
1.6 模型评价
为了验证模型预测精度和预测能力,本研究选取决定系数(determination coefficient,2)、均方根误差(Root Mean Square Error,RMSE)和相对分析误差(Residual Predictive Deviation,RPD)进行模型评价[6]。
2 结果与分析
2.1 不同水氮处理对夏玉米生物量和叶面积指数的影响
不同水氮处理对夏玉米地上部生物量和叶面积指数的影响如表3所示。由表可知,灌水对2018和2019年夏玉米地上部生物量和叶面积指数的影响均达到了极显著水平,但对2020年夏玉米地上部生物量和叶面积指数的影响均未达到显著水平。施氮对3 a夏玉米地上部生物量和叶面积指数的影响均达到了极显著水平(<0.01)。夏玉米地上部生物量和叶面积指数均随着施氮量的增加而增加。
表3 不同水氮处理对夏玉米地上部生物量和叶面积指数的影响
注:同列不同字母表示处理间差异显著(<0.05);*和**分别表示在0.05和0.01水平下显著,ns代表不显著。
Note: Different letters in the same column indicate significant difference among treatments (<0.05); * and **indicate significance at 0.05 and 0.01 levels, and ns indicates no significance.
2.2 夏玉米地上部生物量和叶面积指数估算模型
以夏玉米营养生长期地上部生物量和叶面积指数为响应变量(),以光谱反射率作为自变量(),分别采用偏最小二乘回归(PLS)、极限学习机(ELM)、随机森林(RF)和叠加极限学习机(SEPLS_ELM)构建了夏玉米营养生长期生物量和叶面积指数的估算模型。
2.2.1 基于PLS估算夏玉米生物量和叶面积指数
在PLS模型构建中,采用10折交叉验证法确定生物量和叶面积指数估算模型的最优潜在变量数(LVs)。图 2a和图2b分别展示了生物量估算模型和叶面积指数估算模型前10个潜在变量解释的累积方差百分比。为了避免冗余LVs加入导致PLS回归出现过度拟合,以对变量的解释累积方差百分比提高5%为标准确定LVs,即增加某一LVs能够使变量的解释累积方差百分比提高5%,则加入该LVs[17]。本研究中前3个变量分别解释了建模集生物量和叶面积指数的87.3%和88.5%,前4个LVs分别解释了建模集生物量和叶面积指数的88.2%和89.6%,较前3个变量增加均不足5%。因此,本研究中夏玉米生物量和叶面积指数估算模型的LVs均确定为3个(图2)。
图3为基于PLS回归的夏玉米营养生长期地上部生物量和叶面积指数估算模型。由图可知,基于PLS回归的夏玉米地上部生物量估算模型建模集和验证集的2分别为0.873和0.837,RMSE分别为504.9和570.5 kg/hm2,RPD为2.51;叶面积指数估算模型建模集和验证集的2分别为0.895和0.894,RMSE分别为0.40 和0.41 cm2/cm2,RPD为3.12。基于PLS回归的夏玉米叶面积指数估算模型的精度高于地上部生物量估算模型。
2.2.2 基于ELM估算夏玉米生物量和叶面积指数
在ELM模型构建中,本文选用默认的“Sigmoid”为隐含层神经元激活函数,隐含层神经元数量以15为初值,5为步长逐步增加到120,每个模型进行运行100次选择最优训练结果。结果表明(图4):当神经元数量为35时,夏玉米地上部生物量和叶面积指数估算模型均获得最高的估算精度。基于ELM构建的夏玉米地上部生物量估算模型建模集和验证集的2分别为0.879和0.845,RMSE分别为490.4和565.0 kg/hm2,RPD为2.53;叶面积指数估算模型建模集和验证集的2分别为0.904和0.886,RMSE分别为0.39和0.42 cm2/cm2,RPD为3.00。基于ELM的夏玉米叶面积指数估算模型较地上部生物量估算模型获得了更高的精度。
2.2.3 基于RF估算夏玉米生物量和叶面积指数
在RF模型构建中,经过参数优选和多次训练最终确定的夏玉米生物量和叶面积指数估算模型中决策树个数均为500。如图5所示夏玉米地上部生物量估算模型建模集和验证集的2分别为0.958和0.851,RMSE分别为292.1和517.0 kg/hm2,RPD为2.61;叶面积指数估算模型建模集和验证集的2分别为0.963和0.903,RMSE分别为0.24和0.40 cm2/cm2,RPD为3.18。基于RF的夏玉米叶面积指数估算模型较地上部生物量估算模型获得了更高的精度。
2.2.4 基于SEPLS_ELM估算夏玉米生物量和叶面积指数
光谱曲线分段数和神经元数量是影响叠加集成模型估算精度的主要参数。为了选择适宜的光谱曲线分段数和神经元数量,本文依次将光谱曲线均匀划分为3~50段,每段分别以实测地上部生物量和叶面积指数为响应变量利用ELM进行模型构建,每个光谱分段数ELM神经元个数均以15为初值,5为步长,直至120为止。然后依据偏最小二乘叠加策略进行SEPLS_ELM模型构建。最终依据验证集RMSE最小原则分别确定夏玉米地上部生物量和叶面积指数估算模型的最佳光谱分段数分别为20和33,最优神经元数分别为110和100(图6)。
图7展示了最佳光谱分段数下不同光谱区间子模型建模集RMSE和各子模型在叠加集成(SEPLS_ELM)模型中的权重,由图7可知,夏玉米地上部生物量估算模型中子模型的RMSE介于136.3~308.5 kg/hm2之间,叶面积指数估算模型的RMSE介于0.15~0.32 cm2/cm2之间。在夏玉米地上部生物量估算模型中,子模型7(753~820 nm波段)的RMSE最小,相应的在SEPLS_ELM模型中权重最大,为0.051 9,子模型6(686~752 nm波段)的权重次之,为0.051 5;在夏玉米叶面积指数估算模型中子模型11(751~791 nm波段)的RMSE最小,相应的在SEPLS_ELM模型中权重最大,为0.031 8,子模型10(711~750 nm波段)的权重次之,为0.031 6,二者均位于红边和近红外波段。此外,在可见光波段夏玉米地上部生物量估算模型子模型3(485~552 nm波段)的权重最高,叶面积指数估算模型中子模型7(591~631 nm波段)和子模型5(511~551 nm波段)的权重较高。图8展示了最佳光谱分段数和最佳神经元数量下基于SEPLS_ELM的夏玉米地上部生物量估算模型训练集的2为0.992,验证集的2为0.955;夏玉米叶面积指数估算模型的2为0.990,验证集的2为0.969。
图8展示了最佳光谱分段数和最佳神经元数量下基于SEPLS_ELM的夏玉米地上部生物量和叶面积指数估算模型。夏玉米地上部生物量估算模型建模集和验证集的2分别为0.992和0.955,RMSE分别为123.1和307.3 kg/hm2;叶面积指数估算模型建模集和验证集的2分别为0.990和0.969,RMSE分别为0.13和0.24 cm2/cm2,RPD为5.30。
综上,基于PLS和ELM的夏玉米地上部生物量和叶面积指数估算模型的精度相近且较低。基于RF和SEPLS_ELM的夏玉米地上部生物量和叶面积指数估算模型的精度显著高于PLS和ELM模型,其建模集的2均在0.95以上,但基于RF的夏玉米地上部生物量和叶面积指数估算模型验证集的2和RMSE较建模集显著降低。基于SEPLS_ELM的夏玉米地上部生物量和叶面积指数估算模型验证集的2均高于0.95,RMSE分别为307.3和0.24 cm2/cm2,RPD分别为4.66和5.30。与PLS和ELM模型相比,基于SEPLS_ELM的夏玉米地上部生物量和叶面积指数估算模型验证集的2增加均超过8%,RMSE降低均超过40%,RPD增加均超过70%。与RF模型相比,基于SEPLS_ELM的夏玉米地上部生物量和叶面积指数估算模型验证集的2增加均超过7%,RMSE降低均超过40%,RPD增加均超过66%。
3 讨 论
高光谱遥感数据已经广泛应用于作物生理生态及生化参数的反演,然而前人研究主要通过选取敏感波段或者构建敏感植被指数进行目标参数反演[6,14],这在一定程度会损失部分波段的光谱信息,进而降低模型的预测能力。因此本研究以高光谱全波段反射率作为模型的输入,分别基于PLS和3种机器学习方法进行了夏玉米营养生长期地上部生物量和叶面积指数的估算。结果表明基于PLS和ELM方法的夏玉米地上部生物量和叶面积指数估算模型的精度远低于RF和叠加极限学习机SEPLS_ELM方法。这是因为RF和SEPLS_ELM模型均是具有集成思想的机器学习方法,这种集成提高了模型的预测能力,增强了模型的抗噪能力[26-27]。此外,本研究中直接利用全波段高光谱反射率数据作为模型输入,极大简化了高光谱数据的处理流程。基于SEPLS_ELM的夏玉米生物量和叶面积指数估算模型的精度高于RF建模方法,一方面原因可能是因为SEPLS_ELM集PLS和ELM算法的优势于一体,既包含了所有波段的光谱信息并具有较强的抗噪和泛化能力;另一方面是RF的子模型为CART决策树,对于连续数据的分割较为粗糙,对本研究的数据集的适用性稍差,而SEPLS_ELM子模型ELM能够更好地模拟出数据之间的非线性关系,因此SEPLS_ELM模型的表现好于RF模型。在SEPLS_ELM模型构建中,隐含层神经元数量和光谱曲线的分段数是决定算法性能的关键参数,本研究中限于计算机硬件的性能在有限的范围内进行了优选,获得的最佳分段数和神经元数量可能为局部最优,也缺乏一定的理论基础。因此在未来的研究中应该加强光谱分段数与神经元数量选择的研究。此外,本研究结果还表明不论使用何种建模方法,夏玉米叶面积指数估算模型的精度均高于地上部生物量估算模型,这与侯学会等[28-29]研究结果一致。原因可能是因为叶面积指数较生物量而言更为直观,是作物重要的形态参数。
本研究还发现绿峰、红谷及红边波段的子模型在SEPLS_ELM叠加模型中的权重较高(图7),这说明这些波段对地上部生物量和叶面积指数的响应较为敏感。这与前人研究结果红边参数[30]及部分植被指数(MTVI1[31],Carte3[32]和NDCI[33])的敏感波段一致。但是本研究的估算精度(地上部生物量和叶面积指数估算模型验证集2均高于0.95,RMSE分别低于307.3 kg/hm2和0.24 cm2/cm2)高于前人研究(玉米叶片生物量估算模型2为0.67[34];叶面积指数估算模型2为0.89,RMSE为0.46 cm2/cm2[31]),其原因是前人研究选择了较为敏感的波段进行建模,舍弃了一些次敏感波段,因此将光谱曲线划分为多个波段区间的降维方式没有损失光谱信息,提高了模型的估算精度。
4 结 论
本文基于实测高光谱数据,分别采用偏最小二乘回归(Partial Least Squares Regression,PLS),极限学习机(Extreme Learning Machine,ELM)、随机森林(Random Forest,RF)和基于PLS叠加策略的极限学习机集成模型(Stacked Ensemble Extreme Learning Machine based on the PLS,SEPLS_ELM)估算了夏玉米营养生长期地上部生物量和叶面积指数。结果表明:
1)PLS和ELM模型估算夏玉米营养生长期地上部生物量和叶面积指数的精度相近且较低。
2)基于RF和SEPLS_ELM的夏玉米地上部生物量和叶面积指数估算模型的精度显著高于PLS和ELM模型,其建模集的2均在0.95以上,但基于RF的夏玉米地上部生物量和叶面积指数估算模型验证集的2较建模集显著降低,分别为0.851和0.903。
3)基于SEPLS_ELM的夏玉米地上部生物量和叶面积指数估算模型验证集的2均高于0.95,RMSE分别为307.3 kg/hm2和0.24 cm2/cm2,RPD分别为4.66和5.30。
[1] 吴芳,李映雪,张缘园,等. 基于机器学习算法的冬小麦不同生育时期生物量高光谱估算[J]. 麦类作物学报,2019,39(2):217-224.
Wu Fang, Li Yingxue, Zhang Yuanyuan, et al. Hyperspectral estimation of biomass of winter wheat at different growth stages based on machine learning algorithms[J]. Journal of Triticeae Crops, 2019, 39(2): 217-224. (in Chinese with English abstract)
[2] 张领先,陈运强,李云霞,等. 可见光光谱的冬小麦苗期地上生物量估算[J]. 光谱学与光谱分析,2019,39(8):2501-2506.
Zhang Lingxian, Chen Yunqiang, Li Yunxia, et al. Estimating above ground biomass of winter wheat at early growth stages based on visual spectral[J]. Spectroscopy and Spectral Analysis, 2019, 39(8): 2501-2506. (in Chinese with English abstract)
[3] Chen J M, Cihlar J. Retrieving leaf area index of boreal conifer forests using Landsat TM images[J]. Remote sensing of environment, 1996, 55(2): 153-162.
[4] 江海英,贾坤,赵祥,等. 山地叶面积指数反演理论、方法与研究进展[J]. 遥感学报,2020,24(12):1433-1449.
Jiang Haiying, Jia Kun, Zhao Xiang, et al. Review on the theory, method, and research progress of leaf area index estimation in mountainous areas[J]. Journal of Remote Sensing, 2020, 24(12): 1433-1449. (in Chinese with English abstract)
[5] Sellers P J, Dickinson R E, Randall D A, et al. Modeling the exchanges of energy, water, and carbon between continents and the atmosphere[J]. Science, 1997, 275(5299): 502-509.
[6] 李岚涛,李静,明金,等. 冬油菜叶面积指数高光谱监测最佳波宽与有效波段研究[J]. 农业机械学报,2018,49(2):156-165.
Li Lantao, Li Jing, Ming Jin, et al. Selection optimization of hyperspectral bandwidth and effective wavelength for predicting leaf area index in winter oilseed rape[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(2): 156-165. (in Chinese with English abstract)
[7] 谢巧云,黄文江,梁栋,等. 最小二乘支持向量机方法对冬小麦叶面积指数反演的普适性研究[J]. 光谱学与光谱分析,2014,34(2):489-493.
Xie Qiaoyun, Huang Wenjiang, Liang Dong, et al. Research on universality of least squares support vector machine method for estimation leaf area index of winter wheat[J]. Spectroscopy and Spectral Analysis, 2014, 34(2): 489-493. (in Chinese with English abstract)
[8] Zhang J J, Cheng T, Guo W, et al. Leaf area index estimation model for UAV image hyperspectral data based on wavelength variable selection and machine learning methods[J]. Plant Methods, 2021, 17(1): 14. DOI:10.1186/ s13007-021-00750-5
[9] 高林,杨贵军,于海洋,等. 基于无人机高光谱遥感的冬小麦叶面积指数反演[J]. 农业工程学报,2016,32(22):113-120.
Gao Lin, Yang Guijun, Yu Haiyang, et al. Retrieving winter wheat leaf area index based on unmanned aerial vehicle hyperspectral remoter sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(22): 113-120. (in Chinese with English abstract)
[10] Zhou Z J, Jabloun M, Plauborg F, et al. Using ground-based spectral reflectance sensors and photography to estimate shoot N concentration and dry matter of potato[J]. Computers and Electronics in Agriculture, 2018, 144: 154-163.
[11] Feng W, Wu Y P, He L, et al. An optimized non-linear vegetation index for estimating leaf area index in winter wheat[J]. Precision Agriculture, 2019, 20(6): 1157-1176.
[12] 李鑫川,徐新刚,鲍艳松,等. 基于分段方式选择敏感植被指数的冬小麦叶面积指数遥感反演[J]. 中国农业科学,2012,45(17):3486-3496.
Li Xinchuan, Xu Xingang, Bao Yansong, et al. Retrieving LAI of winter wheat based on sensitive vegetation index by the segmentation method[J]. Scientia Agricultura Sinica, 2012, 45(17): 3486-3496. (in Chinese with English abstract)
[13] 崔日鲜,刘亚东,付金东. 基于可见光光谱和BP人工神经网络的冬小麦生物量估算研究[J]. 光谱学与光谱分析,2015,9(35):2596-2601.
Cui Rixian, Liu Yadong, Fu Jindong. Estimation of winter wheat biomass using visible spectral and BP based artificial neural networks[J]. Spectroscopy and Spectral Analysis, 2015, 9(35): 2596-2601. (in Chinese with English abstract)
[14] 夏天,吴文斌,周清波,等. 冬小麦叶面积指数高光谱遥感反演方法对比[J]. 农业工程学报,2013,29(3):139-147.
Xia Tian, Wu Wenbin, Zhou Qingbo, et al. Comparison of two inversion methods for winter wheat leaf area index based on hyperspectral remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2013, 29(3): 139-147. (in Chinese with English abstract)
[15] 梁栋,管青松,黄文江,等. 基于支持向量机回归的冬小麦叶面积指数遥感反演[J]. 农业工程学报,2013,29(7):117-123.
Liang Dong, Guan Qingsong, Huang Wenjiang, et al. Remote sensing inversion of leaf area index based on support vector machine regression in winter wheat[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2013, 29(7): 117-123. (in Chinese with English abstract)
[16] 崔金铎. 基于近红外光谱的堆叠极限学习机算法及其应用研究[D]. 沈阳:东北大学,2015.
Cui Jinduo. A Stacked Extreme Learning Machine Algorithm Based on NIR Spectroscopy and Its Application[D]. Shenyang: Northeastern University, 2015. (in Chinese with English abstract)
[17] Shan P, Zhao Y H, Wang Q Y, et al. Stacked ensemble extreme learning machine coupled with Partial Least Squares-based weighting strategy for nonlinear multivariate calibration[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2019, 215: 97-111.
[18] Zhou H, Huang G B, Lin Z, et al. Stacked extreme learning machines[J]. IEEE Trans Cybern, 2015, 45(9): 2013-2025.
[19] Ni W D, Brown S D, Man R L. Stacked partial least squares regression analysis for spectral calibration and prediction[J]. Journal of Chemometrics, 2009, 23(10): 505-517.
[20] 陆军胜,耿晨鸣,崔晓路,等. 基于叶面积指数的夏玉米叶片临界氮浓度稀释曲线研究[J]. 农业机械学报,2021,52(4):319-326.
Lu Junsheng, Geng Chenming, Cui Xiaolu, et al. Determination of summer maize leaf critical nitrogen dilution curve based on leaf area index[J]. Transactions of The Chinese Society for Agricultural Machinery, 2021, 52(4): 319-326. (in Chinese with English abstract)
[21] Kamruzzaman M, ElMasry G, Sun D W, et al. Prediction of some quality attributes of lamb meat using near-infrared hyperspectral imaging and multivariate analysis[J]. Analytica Chimica Acta, 2012, 714: 57-67.
[22] Huang G B, Zhu Q Y, Siew C K. Extreme learning machine: Theory and applications[J]. Neurocomputing, 2006, 70(1/2/3): 489-501.
[23] Guo L, Fu P, Shi T Z, et al. Mapping field-scale soil organic carbon with unmanned aircraft system-acquired time series multispectral images[J]. Soil and Tillage Research, 2020, 196: 104477.
[24] Wang Y W, Song Q Q, Du Y J, et al. A random forest model to predict heatstroke occurrence for heatwave in China[J]. Science of the Total Environment, 2019, 650: 3048-3053.
[25] 周志华. 《机器学习》[M]. 北京:清华大学出版社,2016.
[26] 岳继博,杨贵军,冯海宽. 基于随机森林算法的冬小麦生物量遥感估算模型对比[J]. 农业工程学报,2016,32(18):175-182.
Yue Jibo, Yang Guijun, Feng Haikuan. Comparative of remote sensing estimation models of winter wheat biomass based on random forest algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(18): 175-182. (in Chinese with English abstract)
[27] 陈绍民. 水肥一体化水氮用量对苹果园氮素利用的影响及其供应决策[D]. 杨凌:西北农林科技大学,2021.
Chen Shaomin. Effects of the Water and Nitrogen Application Amount under Fertigation on Nitrogen Utilization and Its Supply Decision in Apple Orchard[D]. Yangling: Northwest A&F University, 2021. (in Chinese with English abstract)
[28] 侯学会,牛铮,黄妮,等. 小麦生物量和真实叶面积指数的高光谱遥感估算模型[J]. 国土资源遥感,2012,199(4):30-35.
Hou Xuehui, Niu Zheng, Huang Ni, et al. The hyperspectral remote sensing estimation models of total biomass and true LAI of wheat[J]. Remote Sending for Land & Resources, 2012, 199(4): 30-35. (in Chinese with English abstract)
[29] 纪景纯,刘建立,牛玉洁,等. 基于全波段高光谱的冬小麦生长参数估算方法比较[J]. 作物杂志,2020(6):180-188.
Ji Jingchun, Liu Jianli, Niu Yujie, et al. Comparison of estimation methods for growth parameters of winter wheat based on full-band hyperspectral data[J]. Crops, 2020(6): 180-188. (in Chinese with English abstract)
[30] 郭彬彬. 小麦氮素营养的高光谱监测及施氮模型构建[D]. 郑州:河南农业大学,2019.
Guo Binbin. Remote Monitoring Nitrogen Status and Constraction of Nitrogen Application Model in Wheat[D]. Zhengzhou: Henan Agricultural University, 2019. (in Chinese with English abstract)
[31] Haboudane D, Miller J R, Pattey E, et al. Hyperspectral vegetation indices and novel algorithms for predicting green LAI of crop canopies: Modeling and validation in the context of precision agriculture[J]. Remote Sensing of Environment, 2004, 90(3): 337-352.
[32] Carter G A. Ratios of leaf reflectance in narrow wavebands as indicators of plant stress[J]. International Journal of Remote Sensing, 1994, 15(3): 697-703.
[33] Marshak A, Knyazikhin Y, Davis A B, et al. Cloud-vegetation interaction: Use of normalized difference cloud index for estimation of cloud optical thickness[J]. Geophysical Research Letters, 2000, 27(12): 1695-1698.
[34] 解飞. 基于高光谱数据的玉米生长信息估算模型研究[D]. 杨凌:西北农林科技大学,2016.
Xie Fei. Study on Estimate Model of Corn Grow Information Based on Hyperspectral Data[D]. Yangling: Northwest A&F University, 2016. (in Chinese with English abstract)
Estimation of aboveground biomass and leaf area index of summer maize using SEPLS_ELM model
Lu Junsheng1,2, Chen Shaomin1,2, Huang Wenmin3, Hu Tiantian1,2※
(1.,,712100,; 2.,,712100,; 3.,710000,)
Hyperspectral remote sensing has widely been used to estimate crop physiological, ecological, and biochemical parameters in recent years. However, most previous studies focused mainly on the selection of sensitive bands or the construction of vegetation index (the combination of sensitive bands) for crop parameter inversion. Particularly, the spectral information of some bands can be lost, and then to reduce the prediction ability of the estimation model. The purpose of this study is to estimate the aboveground biomass and leaf area index of summer maize using all spectral information (spectral bands). Therefore, a three-year (2018-2020) field experiment was also conducted under different water and nitrogen management in the Guanzhong Plain of China. Accordingly, 212 plant samples (aboveground biomass and leaf area index) were collected during the vegetative growth period of summer maize. Prior to plant sample collection, the hyperspectral reflectance data of the summer maize canopy was measured using an ASD FieldSpec 3 portable spectroradiometer. Correspondingly, the estimation model was constructed using Partial Least Squares Regression (PLS), Extreme Learning Machine (ELM), Random Forest (RF), and Stacked Ensemble Extreme Learning Machine (SEPLS_ELM, using the PLS stacked ensemble strategy). The results showed that the estimation accuracy (four estimation models) of the leaf area index of summer maize was higher than that of aboveground biomass. The estimation models of PLS and ELM presented a relatively low accuracy for the aboveground biomass and leaf area index of summer maize, where the determination coefficient (2) for the validation set of the aboveground biomass estimation model was lower than 0.85, and the Root Mean Square Error (RMSE) was higher than 550 kg/hm-2, whereas, the2for the validation set of leaf area index estimation model was lower than 0.90, and the RMSE was higher than 0.40 cm2/cm2. The estimation model of aboveground biomass and leaf area index of summer maize using RF and SEPLS_ELM presented a higher estimation accuracy, particularly that the performance of the SEPLS_ELM model was outstanding. The2values for the validation set of aboveground biomass and leaf area index estimation model using the SEPLS_ELM model were 0.955 and 0.969, while the RMSE were 307.3 kg/hm2and 0.24 cm2/cm2, and the Residual Predictive Deviation (RPD) were 4.66 and 5.30, respectively. Compared with PLS and ELM, the estimation accuracy of the SEPLS_ELM model was significantly improved (the2increased by more than 8%, RMSE decreased by more than 40%, and RPD increased by more than 70%, respectively) in aboveground biomass and leaf area index estimation. Compared with the RF, the2of the SEPLS_ELM estimation model increased by more than 7%, RMSE decreased by more than 40%, and RPD increased by more than 66% in the aboveground biomass and leaf area index estimation of summer maize, respectively. Consequently, the present study demonstrated that the SEPLS_ELM model was highly reliable to predict the aboveground biomass and leaf area index of summer maize. The findings can provide a strong reference for the estimation of crop aboveground biomass and leaf area index using hyperspectral remote sensing.
hyperspectrum; remote sensing; biomass; random forest; leaf area index; partial least squares regression; extreme learning machine; stacked ensemble model
陆军胜,陈绍民,黄文敏,等. 采用SEPLS_ELM模型估算夏玉米地上部生物量和叶面积指数[J]. 农业工程学报,2021,37(18):128-135.doi:10.11975/j.issn.1002-6819.2021.18.015 http://www.tcsae.org
Lu Junsheng, Chen Shaomin, Huang Wenmin, et al. Estimation of aboveground biomass and leaf area index of summer maize using SEPLS_ELM model[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(18): 128-135. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2021.18.015 http://www.tcsae.org
2021-06-01
2021-08-29
公益性行业(农业)科研专项(201503124)
陆军胜,博士,研究方向为农业水土资源高效利用。Email:junshengup@163.com
胡田田,教授,研究方向为农业水土资源高效利用。Email:hutiant@nwsuaf.edu.cn
10.11975/j.issn.1002-6819.2021.18.015
S365;S127
A
1002-6819(2021)-18-0128-08