基于无人机高光谱遥感的冬小麦全氮含量反演
2022-10-09袁自然王道中花可可郭志彬
杨 欣,袁自然,叶 寅*,王道中,花可可,郭志彬
1.安徽省农业科学院土壤肥料研究所,安徽 合肥 230031 2.养分循环与资源环境安徽省重点实验室,安徽 合肥 230031
引 言
氮素是作物生长发育最需要的营养元素之一,对作物的光合作用和产量具有显著影响[1-3]。植株的全氮含量是表征作物氮素状况的主要指标[4],因此有必要从植株氮素含量来评价作物氮素营养状况。
作物氮素状况的有效诊断需建立在对作物生长特性和氮素水平实时监测的基础上。目前,测定作物氮含量的传统方法主要依靠田间取样和实验室化学分析[5]。近年来,人们提出了利用叶绿素仪、叶绿素荧光等方法对植物氮素状况进行无损估测[6-7]。然而,这些方法仅针对单个植株单个叶片点对点的监测,在实际应用中难以反映作物植株的种群状况。相比之下,无人机遥感近年来在精准农业领域得到了广泛的应用[8-9],能够实现对作物生长状况由点到面的监测,并能够快速评估农作物的空间差异性。无人机遥感平台可以携带多光谱和高光谱传感器,近十几年来,高光谱遥感以其高分辨率、强连续性和海量信息获取的优势,进一步推动了定量农业遥感的发展[10]。结合无人机高光谱遥感技术提取小麦长势信息已经逐渐成为国内外学者研究热点。Xia等利用该技术从高光谱数据中选取归一化差异植被指数(NDVI)和比值植被指数(RVI)构建了冬小麦生物量遥感反演模型[11]。从无人机影像提取出来的植被指数可以提取小麦籽粒产量信息,支持向量回归(SVR)结合顺序前向选择(SFS)技术能够较好的用于提取籽粒信息[12]。Liu等利用无人机高光谱数据和实测高光谱数据计算光谱指标,构建了用于反演不同生育期的冬小麦叶片含氮量(LNC)的反演模型并分析了LNC与光谱反射率的相关性[8]。Wang等针对江苏北部某实验点小麦拔节、孕穗期和开花3个生育阶段的叶片叶绿素进行了反演并发现与支持向量回归(SVR)和反向传播神经网络(BPNN)相比,基于随机森林(RF)算法的叶绿素反演模型有较好的预测效果[13]。
在同一生育期,不同施肥处理的冬小麦光谱特征存在显著差异[14],因此,有必要引入适用于不同肥力条件下的具有较强泛化能力的算法构建冬小麦全氮含量遥感反演模型。近年来,集成学习(ensemble learning)作为一种新的机器学习范式,通过增加学习器数目提高了其化能力并被广泛应用于解决各类回归问题[15-16]。本研究以位于安徽蒙城的农业部蒙城砂姜黑土生态环境站内冬小麦为研究对象,基于无人机高光谱遥感数据和田间采样数据,采用梯度提升树类集成学习算法(extreme gradient boosting(XGBoost)构建不同土壤肥力条件下拔节期冬小麦全氮含量遥感反演模型,提取不同肥力条件的田块冬小麦全氮含量信息,以期为其田间施肥管理提供科学参考。
1 实验部分
1.1 研究区及概况
以安徽蒙城的农业部蒙城砂姜黑土生态环境站(116°37′E,33°13′N)为研究区(如图1)。本站位于安徽北部平原区,属于暖温带半湿润季风气候,年平均气温14.8 ℃,无霜期212 d,年降水量600~900 mm。试验土为常见的普通砂姜黑土。试验站始于1982年。试验开始时耕层土壤(0~20 cm)的肥力性状为:有机质10.4 g·kg-1,全氮0.96 g·kg-1,碱解氮84.5 mg·kg-1,全磷0.28 g·kg-1,有效磷9.8 mg·kg-1。设置7种不同的施肥处理,分别为撂荒、不施肥、施氮磷钾化肥、氮磷钾+低量麦秸、氮磷钾+全量麦秸、氮磷钾+猪粪、氮磷钾+牛粪。全部肥料于秋季小麦种植整地前一次性施入各处理小区,人工或机械耕翻,与土壤充分混匀。长期以来,形成了具有较大肥力差异的小麦种植田块。
1.2 数据获取
使用的数据包括无人机高光谱成像数据和小麦全氮含量数据。所有数据都于2021年3月26日(拔节期,无云无风)获取。无人机高光谱成像系统(GaiaSky-mini2-VN)由国内大疆公司的六旋翼无人机和四川双利合谱公司生产的高光谱成像仪Gaisky2组成。该系统可获取176个波段的光谱信息,包括可见光到近红外(400~1 000 nm)光谱范围,光谱分辨率为3.5 nm,空间分辨率为4.7 cm。数据采集前用参考板进行数据校准,飞行高度设置为120 m,移动速度设置为7 m·s-1,航向重叠度和旁向重叠度分别设置为50%和55%。
如图1,在研究区域试验田内均匀地布设126个采样点,每个采样点取3-5株小麦,封装保鲜带回实验室。将植株样品置于70 ℃干燥箱内恒温干燥,粉碎,使用凯氏定氮法[17]测定小麦全氮含量。对于每个采样点,取3~5株小麦的均值作为该点全氮含量(total nitrogen content, TNC)。计算公式如式(1)
图1 研究区域试验田分布
N=(V×0.05×14×100)/(1 000×M)
(1)
式(1)中:N为全氮含量(%);V为盐酸体积变量(mL);M为样品质量(g)。
1.3 数据预处理
无人机高光谱图像的处理包括以下步骤:第一步是镜头校正,消除图像畸变;第二步,辐射定标,将数字灰度值(digital number,DN)转换为反射率;然后进行大气校正,以消除大气、水汽等因素的影响。使用Hispectralstitch软件(四川双利合谱公司开发提供)对多景遥感影像进行拼接;最后,从每个田块中提取感兴趣区域(regions of interest,ROI)的平均光谱。因此,每个田块在176个波段都有对应的平均谱,作为模型输入的自变量,这里将整个大田均匀地划分成了126个田块。对于小麦全氮含量实测数据,为避免异常值对建模产生影响,去除了异常实测值。
1.4 方法
XGBoost是由陈天奇等改进的一种GBDT算法[17],它与GBDT算法有较多不同点,比如在优化时,GBDT仅仅用到了一阶导数,XGBoost则另外引入了二阶导数对损失函数进行调优;在目标函数里,XGBoost算法为了避免过拟合现象,将树模型复杂度作为正则项。此外,XGBoost在训练过程中参考了随机森林的思想,每次迭代过程中不使用全数样本,且不采用样本的所有特征,而是有选择地采取部分样本的部分特征进行训练,这样可有效提高模型的泛化能力,削弱模型欠拟合和过拟合现象,而且XGBoost算法支持并行计算以提高运行速度。该算法原理是将原始数据集分割成多个数据子集,将每个子集随机地分配给基学习器进行预测,然后将基学习器的结果按照一定的权重进行计算,从而预测最后的结果。
图2为整体实验的技术路线图,分为3个步骤。第一步,构建模型训练集,将176个波段的光谱反射率信息作为模型输入的自变量,实测全氮含量数据作为模型因变量,随机选取70%的采样点的数据作为训练集并对自变量进行归一化处理;第二步,反演模型构建与验证,采用贝叶斯优化算法对模型进行超参数调优(https://www.kaggle.com/tilii7/bayesian-optimizing-ofxgboost-parameters/notebook),该优化方法可以看做一个高斯过程,考虑了先验参数信息且不断更新知识而传统的网格搜索或随机不考虑先验参数信息。此外,贝叶斯优化方法迭代次少运行速度快,可以优化XGBoost这种具有多个参数的算法,表1为本研究中XGBoost遥感反演模型中关键超参数的含义及其调优后的结果,其他参数设置为默认值。利用30%的验证集数据进行模型验证和精度评估,第三步,基于第二步构建好的全氮含量遥感反演模型预测大田小麦的全氮含量,提取无人机高光谱影像上所有像元的光谱反射率信息作为模型的输入,输出预测的全氮含量并成图。
图2 基于XGBoost模型的冬小麦全氮含量遥感预测技术路线图
表1 XGBoost模型中一些超参数的含义及其最优值
2 结果与讨论
2.1 模型反演精度分析
在长期定位试验下,不同的肥料处理导致不同田块上的土壤肥力存在显著差异,田块间冬小麦的长势存在显著差异,其叶片光合作用性能不同,故其对光的吸收和反射也不同,如图3所示,不同田块冬小麦冠层光谱特征呈现出显著差异。为了筛选出用于构建该区域冬小麦全氮含量遥感反演的敏感波段,首先对光谱反射率和实测全氮含量进行了相关性分析,计算了全氮含量与各波段光谱反射率之间的皮尔逊相关系数。由图4可知,总体上各波段反射率与冬小麦全氮含量之间存在较高的相关性,在各波段的绝对相关系数均值达0.732。在波长为795.3 nm时,全氮含量与该波段相关性达到最大值,为0.794。波长小于735.5 nm时,各波段的光谱反射率与全氮含量均成负相关;波长大于等于735.5 nm时,各波段的光谱反射率与全氮含量均成正相关。当波长为735.5 nm时,反射率与全氮含量之间的相关性最低,为0.232,其余波段的相关系数绝对值均高于0.5,这可能是由于各田块在该波段上的光谱反射率几乎一致(图3),故各田块在该波段上无光谱差异性。
图3 不同田块冬小麦冠层光谱图
图4 光谱反射率与全氮含量之间的相关系数
因此,本研究不采用全波段作为建模的自变量,采用了除735.5 nm波段以外的所有波段作为模型输入自变量,使用XGBoost方法构建冬小麦全氮含量遥感反演模型,模型验证精度使用决定系数R2、均方根误差(root mean absolute error, RMSE)和平均绝对百分比误差(mean absolute percent error, MAPE)作为评价指标,其中,MAPE用来评价模型预测结果的相对误差。由图5可知,XGBoost模型预测的和实测的小麦全氮含量较为接近,模型反演精度较高,R2达到0.76,RMSE值较低,仅为2.68,MAPE值也较低,为11.08%,这说明XGBoost算法具有相对较强的学习性能,可以应用于构建冬小麦全氮含量遥感反演模型。
图5 XGBoost模型反演的与实测全氮含量之间的散点图
2.2 TNC预测结果分析
基于XGBoost算法的拔节期冬小麦全氮含量反演模型具有较好的验证精度,现将该模型应用到整片小麦大田上,提取出不同土壤肥力条件下的小麦大田影像上所有像元在176个波段的反射率,输入该反演模型进行预测整片小麦大田的全氮含量(TNC)。
由图6可知,XGBoost模型预测的拔节期冬小麦全氮含量总体上呈现较为显著的空间分布差异,这是由长期试验不同田块不同的土壤肥力导致,该算法具有较强的泛化能力,构建的遥感反演模型适用于预测不同土壤肥力条件的整片大田的冬小麦全氮含量空间分布。模型预测的冬小麦(拔节期)全氮含量范围介于14%~29%之间,平均全氮含量为19.66%。
图6 XGBoost反演模型预测的TNC空间分布图
2.3 冬小麦全氮含量与土壤全氮含量相关性分析
针对长期定位试验下,不同土攘肥力的田块上的冬小麦全氮含量进行了遥感反演研究,由2.2节研究发现,在不同土壤肥力的田块,冬小麦的全氮含量存在显著空间分布差异性,这是由于土壤养分对冬小麦长势有着一定的影响。因此,本节针对冬小麦全氮含量与土壤全氮含量进行了相关性分析。
如图7所示,冬小麦全氮含量与土壤全氮含量之间存在着较为显著的相关性,其中,冬小麦全氮含量范围为12%~32%,土壤全氮含量范围为29%~55%,两者之间的决定系数(R2)为0.47。
图7 冬小麦全氮含量与土壤全氮含量之间的相关性
3 结 论
(1)基于XGBoost算法,结合无人机高光谱遥感数据和田间采样冬小麦全氮含量数据可以构建全氮含量遥感反演模型,模型验证精度较高。
(2)在不同土壤肥力的田块,XGBoost模型预测的拔节期冬小麦全氮含量呈现较为显著的空间分布差异,平均全氮含量为19.66%。
(3)冬小麦全氮含量与土壤全氮含量之间存在着较为显著的相关性,两者之间的决定系数(R2)为0.47。