基于冠层光谱特征和株高的马铃薯植株氮含量估算
2022-08-05樊意广冯海宽边明博杨贵军
樊意广 冯海宽 刘 杨 边明博 孟 炀 杨贵军
(1.北京市农林科学院信息技术研究中心农业农村部农业遥感机理与定量遥感重点实验室,北京 100097;2.国家农业信息化工程技术研究中心,北京 100097;3.南京农业大学国家信息农业工程技术中心,南京 210095;4.中国农业大学现代精细农业系统集成研究教育部重点实验室,北京 100083)
0 引言
马铃薯是我国第4大粮食作物,其产量直接影响着我国的粮食安全和粮食贸易策略。氮素是决定马铃薯产量和品质的重要因素,合理的氮肥供应既能满足作物的生长需求,又能避免因氮素流失而造成的环境污染和资源浪费[1]。因此,及时准确地掌握马铃薯植株氮含量(Plant nitrogen content,PNC)状况,对田间管理决策的制定和实施具有重要的意义。传统的PNC测量方法主要是田间取样和实验室测试相结合,但这种方法受人力和物力制约大,且具有滞后性,不利于大范围的农田监测。近年来,无人机遥感技术的迅速发展,为监测作物理化参数提供了一种新的技术手段。
目前,以无人机为遥感平台监测作物理化参数搭载的传感器主要有高光谱、多光谱和数码相机等[2]。高光谱传感器虽然能获取丰富的光谱信息,但其价格昂贵,数据处理复杂,限制了其在大范围农田监测中的应用[3-4]。数码相机传感器虽仅有3个波段,但空间分辨率高,数据处理简单且成本低廉。如何利用低成本的无人机数码影像监测作物的生长状况已引起了国内外学者的关注[5]。文献[6-8]研究表明,利用无人机数码影像能有效地监测作物的氮素状态,但也存在一定不足,仅利用影像的光谱信息构建作物的氮素估算模型存在影像信息利用率低、模型精度易饱和等问题[9]。
株高在一定程度上能反映作物的生长情况和营养状况[10],文献[11-14]研究表明,株高可以用于作物地上生物量和叶面积指数的估算,且与作物的氮营养状况存在一定的联系,然而,尚没有研究证明株高能用于作物的氮素状况监测。
综上,本文以无人机为遥感平台,获取马铃薯5个关键生育期的冠层数码影像,并提取各生育期的影像变量和株高Hdsm,结合地面实测的PNC数据,采用3种方法构建各生育期的PNC估算模型并验证,探究株高对估算马铃薯PNC的影响,以期寻求最佳建模方法,为马铃薯氮素监测提供新的技术手段。
1 估算模型建立
1.1 试验设计
于2019年在北京市昌平区小汤山镇国家精准农业研究示范基地(40°10′34″N,116°26′39″E)马铃薯试验田开展试验。该地平均海拔36 m,年均温度10℃,年均无霜期180 d,气候类型是典型的暖温带半湿润大陆性季风气候。试验采取小区试验设计,选用2种早熟的马铃薯品种(中薯5(Z1)和中薯3(Z2))作为试验品种。试验区域共划分48个小区,每个小区32.5 m2(5 m×6.5 m)。试验共设密度试验区(N区)、氮素试验区(S区)和钾肥试验区(K区),每个试验区3次重复,分别进行不同密度、氮素(以尿素计)和钾肥处理。其中N区共设3种水平(T0:60 000 株/hm2、T1:72 000 株/hm2、T2:84 000 株/hm2,S区共设4种水平(N0:0 kg/hm2,N1:244.65 kg/hm2,N2:489.15 kg/hm2,N3:733.5 kg/hm2),K区共设3种水平(K0:0 kg/hm2,K1:970.5 kg/hm2,K2:1 941 kg/hm2)。为精确获得试验田的位置,保证无人机影像的精度,在试验小区周围均匀地埋设了11个地面控制点(Ground control point,GCP),并利用高精度的GPS测定各GCP的三维坐标。具体的试验设计如图1(N区和S区均为K1处理,k1~k11为地面控制点)所示。
图1 马铃薯田间位置及试验设计Fig.1 Potato field location and experiment design
1.2 地面数据获取
地面数据包括马铃薯现蕾期到成熟期的实测株高H和PNC,其中,H的测量方法为:每个小区选取具有代表性的植株4株,用直尺量取茎基至自然状态下叶顶端的距离并记录,最终以4株植株的平均高度作为该小区的实测株高。马铃薯PNC的测定方法为:在每个试验小区选取3株具有代表性的植株作为样本,将其茎叶分离,用清水洗净,105℃杀青0.5 h,随后80℃干燥至恒质量,得到样本的干质量,然后利用凯氏定氮仪测定茎和叶部分的全氮含量,最后计算马铃薯各生育期PNC,计算式为
式中CPN——植株氮含量CLN——叶片氮含量
CSN——地上茎氮含量
MLD——叶片干质量
MSD——地上茎干质量
1.3 无人机数码影像的获取及预处理
无人机数码影像的获取与地面数据采集工作同步进行,以大疆精灵4Pro型无人机为遥感平台获取各生育期的数码影像,该系统携带的COMS传感器有效像素为2 000万,含红、绿、蓝3个波段通道。无人机作业时的飞行高度设置为20 m,横向和旁向重叠度均为85%。为避免光照强度对试验结果的影响,选择晴朗无云的天气开展飞行作业,且飞行时间为12:00—14:00。无人机数码影像的预处理在Agisoft PhotoScan Professional软件中进行,主要包括影像的导入与对齐、几何校正、生成点云、构建格网和纹理,最后生成马铃薯试验田的数字表面模型(Digital surface model,DSM)和数字正射影像(Digital orthophoto map,DOM)。
1.4 影像变量选取
依据现有的文献资料,本研究选取21个能较好反映作物氮素状态的数码影像变量(表1),进行马铃薯各生育期PNC的估算。
表1 与氮相关的数码影像变量Tab.1 Digital image variables related to nitrogen
1.5 数据分析方法
于2019年4月20日采集了马铃薯试验田裸土状态下的数码影像,并结合实测的GCP,利用Agisoft PhotoScan Professional软件生成该时期的DSM。将马铃薯不同生育期的DSM与裸土期的DSM做差值运算,得到对应生育期的作物高度模型,最后基于各试验小区的矢量数据,在ArcGIS软件中利用感兴趣区工具,计算马铃薯各小区的株高,并将计算的株高的平均值作为该小区的提取株高(Hdsm),最后将Hdsm与实测H对比分析以验证该方法的可靠性。
采用多元线性回归(Multiple linear regression,MLR)、误差反向传播(Back propagation,BP)神经网络和Lasso回归3种方法构建马铃薯各生育期的PNC估算模型。MLR算法常用于描述因变量与2个或多个自变量之间的关系,相较于一元线性回归模型,MLR能更有效地刻画马铃薯PNC与多个影像变量及Hdsm之间的联系。BP神经网络是一种按误差逆传播算法进行网络训练的前馈神经网络,它能根据误差反馈的信息对网络权值进行不断地修正,以达到无限逼近输出目标的目的。Lasso回归是一种改良的最小二乘估计,它通过引入L1正则化对损失函数进行改造,可以解决线性回归中自变量间存在的严重共线性问题。
1.6 评价指标
本研究以重复1和重复3的数据(32个)构建马铃薯PNC的估算模型,以重复2的数据(16个)对模型进行验证。采用决定系数(Coefficient of determination,R2)、均方根误差(Root mean square error,RMSE)、标准均方根误差(Normalized root mean square error,NRMSE)对模型进行评价,其中,R2越接近于1,RMSE和NRMSE越小,所建模型的预测性能越好。
2 结果分析
2.1 马铃薯株高提取
为验证基于DSM提取马铃薯株高的可靠性,将提取的5个生育期的Hdsm与田间实测的H对比分析,结果如图2所示。由图2可知,基于DSM提取的Hdsm与实测H拟合的R2为0.860,RMSE为2.663 cm,NRMSE为10.234%,这说明基于DSM提取的马铃薯Hdsm具有较高的精度,可以代替实测H估算马铃薯理化参数。
图2 马铃薯提取株高与实测株高对比分析Fig.2 Comparative analysis of extracted and measured plant heights of potato
2.2 马铃薯PNC估算
2.2.1相关性分析
将马铃薯5个生育期的影像变量分别与实测的PNC作相关性分析,结果如表2所示。由表2可知,现蕾期,除R、G和B与PNC表现显著相关外,其他影像变量均与PNC表现不相关,其中,R的相关系数绝对值最大,为0.506;块茎形成期,除r/b和IKAW表现不相关外,其余影像变量均与PNC呈显著相关,其中R、B、r、g、r/g、g-r、(r-g-b)/(r+g)、g-b、EXR、GLA、NDI、GRVI、CIVE、EXGR、VARI和MGRVI 16个影像指数达到0.01相关水平,(r-g-b)/(r+g)的相关系数绝对值最大,为0.812;块茎增长期,除G表现不相关外,其余20个影像变量均与PNC达到0.01相关水平,其中GLA的相关系数绝对值最大,为0.834;淀粉积累期,除r-b表现不相关外,其余影像变量均与PNC达到0.05相关水平,其中R、G、B、r、g、b、r/g、g-r、(r-g-b)/(r+g)、g-b、EXR、GLA、NDI、GRVI、CIVE、EXGR、VARI和MGRVI 18个影像变量达到0.01相关水平,R的相关系数绝对值最大,为0.765;成熟期影像变量与马铃薯PNC间的相关性较前一时期明显减弱,仅G、r、b、r/b、r-b、g-r、g-b、(r-g-b)/(r+g)和IKAW 9个影像变量达到0.01相关水平,其中r/b的相关系数绝对值最大,为0.458。
表2 各生育期影像变量与PNC的相关性Tab.2 Correlation of image variables with PNC in different growth stages
5个生育期的Hdsm与马铃薯PNC均达到0.05相关水平,其中,块茎形成期的相关性最好,相关系数绝对值为0.717,成熟期最差,相关系数绝对值为0.281,现蕾期、块茎增长期、淀粉积累期分别为0.335、0.484、0.506。
2.2.2马铃薯PNC的估算与验证
为探究加入株高是否能提高影像变量估算马铃薯PNC的能力,在马铃薯各生育期基于影像变量和影像变量结合Hdsm2种模型变量分别利用MLR、BP神经网络和Lasso回归3种方法构建PNC估算模型并验证。其中,马铃薯现蕾期,影像变量与PNC的相关性普遍较差,仅选取R、G和B3个与PNC显著相关的影像变量作为模型的输入变量,其余4个生育期,分别选取与PNC相关系数绝对值较大的前10个影像变量作为模型的输入变量。3种方法各生育期估算PNC的建模与验证结果如表3和表4所示。由表3、4可知,以影像变量和影像变量结合Hdsm为模型变量,利用3种方法构建的马铃薯PNC估算模型均表现为块茎形成期到淀粉积累期的估算效果明显优于现蕾期和成熟期。不同生育期利用同种方法构建的马铃薯PNC估算模型中,相较于单一影像变量,影像变量结合Hdsm的建模R2均有所提高,RMSE和NRMSE均有所下降,验证结果与建模结果具有一致性。
表3 不同生育期3种方法PNC估算对比Tab.3 Comparison of PNC estimation results of three methods in different growth stages
表4 不同生育期3种方法PNC验证结果对比Tab.4 Comparison of PNC validation results of three methods in different growth stages
图3 影像变量结合Hdsm的MLR模型建模和验证效果Fig.3 Modeling and validation effects of MLR method with image variables combined with Hdsm
综合各生育期的建模和验证结果可知,以同种模型变量利用MLR构建的模型效果优于BP神经网络和Lasso回归。其中,影像变量结合Hdsm的MLR方法精度最高,其在各生育期的建模和验证效果如图3所示。由图3可知,马铃薯块茎形成期、块茎增长期和淀粉积累期的估算效果较好,各样本点均分布在1∶1线附近。3个时期建模R2分别为0.770、0.809、0.651,RMSE分别为0.293%、0.263%、0.292%,NRMSE分别为9.304%、9.860%、9.734%。验证R2分别为0.753、0.703、0.632,RMSE分别为0.298%、0.327%、0.212%,NRMSE分别为8.961%、11.958%、7.720%。成熟期的估算精度明显降低,建模R2为0.557,RMSE为0.342%,NRMSE为13.072%,验证R2为0.498,RMSE为0.332%,NRMSE为11.884%。现蕾期的估算精度最差,样本点偏离1∶1线严重。这一时期建模和验证的R2分别为0.438和0.301,RMSE分别为0.606%和0.657%,NRME分别为16.633%和16.803%。
3 讨论
3.1 株高监测
本研究基于马铃薯5个关键生育期的DSM提取株高Hdsm,并将Hdsm与实测H对比分析,结果表明,两者的拟合R2为0.860,RMSE为2.663 cm,NRMSE为10.234%,说明基于无人机数码影像提取的株高具有较高的精度,这与文献[19-20]得出的结论一致。不同的是,文献[19-20]是从DSM生成的作物表面模型(Crop surface model,CSM)中提取的株高Hcsm,而本研究的Hdsm是利用各生育期的DSM与裸土期的DSM的差值提取的,主要原因是本研究中马铃薯的种植方式为垄上种植,垄具有一定的高度,而Hcsm表示的是作物茎顶端到地面的距离,因此Hdsm较Hcsm更能表示马铃薯的实际高度。
3.2 植株氮含量估算
本文以影像变量和影像变量结合株高为模型变量,分别利用3种方法构建马铃薯各生育期的PNC估算模型,由结果可知,块茎形成期到淀粉积累期的估算效果明显优于现蕾期和成熟期。主要原因是,现蕾期马铃薯以营养生长为主,叶片空间结构小,提取的影像变量和Hdsm受土壤背景影响大,不能很好地反映PNC的变化规律,因而模型估算效果差。块茎形成期到淀粉积累期,马铃薯以营养生长和生殖生长为主,茎叶生长旺盛,植被覆盖度大,地上部氮持续向地下块茎输送,这一阶段提取的影像变量和Hdsm能较好地反映PNC的变化规律,因而模型效果较好。成熟期受降雨较多影响,部分马铃薯植株叶片快速枯黄脱落,提取的影像变量和Hdsm不能反映真实的PNC变化情况,因而估算模型的精度较低。
为探究加入株高对影像变量估算马铃薯PNC的影响,本研究分别基于影像变量和影像变量结合Hdsm构建马铃薯5个关键生育期的PNC估算模型并验证。结果表明,相较于单一影像变量,各生育期加入株高,均能提高马铃薯PNC的估算精度,其原因是株高是植株主茎的自然高度,植株的地上生物量和叶面积与茎的生长状况联系密切[21],而地上生物量和叶面积的变化又会引起植株茎和叶中氮含量的变化,株高的加入,提供了这些变化在不同层次的信息[22],因此,影像变量结合株高作为模型变量的马铃薯PNC估算模型优于单一影像变量。然而,相较于其它4个生育期,块茎增长期加入Hdsm后马铃薯PNC估算模型精度提升不明显,这是由于块茎增长期,马铃薯以生殖生长为主,地上部氮持续向下输送,但此时的株高已达最大值,不再发生明显变化。因而块茎增长期加入Hdsm对影像变量估算马铃薯PNC的影响较小。
本文采用MLR、BP神经网络和Lasso回归3种方法构建马铃薯PNC估算模型,由表3、4可知,MLR方法构建的模型精度和稳定性优于BP神经网络和Lasso回归,主要原因是:MLR模型能有效地利用多个自变量的信息,提高了对因变量的解释能力;BP神经网络虽然有较强的非线性映射能力,在处理大数据集方面具有优越的性能,但本研究的数据集较小,导致模型的泛化能力较差,模型精度不高。Lasso回归虽然能极大地降低模型的复杂度,但也因此丢失部分变量信息,导致估算精度不高。此外,本文仅用1年的马铃薯数据,所得的结论是否适用于不同年限和地点的马铃薯数据,还需要进一步研究分析。
4 结论
(1)基于DSM提取的Hdsm与实测H高度拟合,R2为0.860,RMSE为2.663 cm,NRMSE为10.234%,说明利用DSM提取的马铃薯株高精度可靠。
(2)相较于单一影像变量,各生育期加入Hdsm,均能提高马铃薯植株氮含量的估算精度。
(3)MLR、BP神经网络和Lasso回归构建的马铃薯植株氮含量估算模型中,以影像变量结合Hdsm的MLR模型效果最好,5个生育期的建模R2分别为0.438、0.770、0.809、0.651、0.557,RMSE分别为0.606%、0.293%、0.263%、0.292%、0.342%,NRMSE分别为16.633%、9.304%、9.860%、9.734%、13.072%,表明模型精度较高。该研究为马铃薯的营养状况监测提供一种快捷、高效的技术方法。