基于无人机多光谱的葡萄氮含量监测研究
2022-06-22唐渲运高何璇高晓阳李红岭贾尚云
唐渲运, 高何璇, 高晓阳*, 李红岭, 贾尚云, 张 旭,2
(1.甘肃农业大学机电工程学院,甘肃 兰州 730070;2.甘肃省葡萄与葡萄酒工程学重点实验室,甘肃 兰州 730070;3.甘肃省干旱生境作物学重点实验室,甘肃 兰州 730070;4.兰州银行网络金融部,甘肃 兰州 730000)
目前,葡萄在我国栽培地域广且产量大,葡萄品质对食用和葡萄酒口感影响很大,而氮素是影响其产量和品质的重要因素之一[1]。利用遥感技术快速监测植被元素含量,在现代精准农业的智能化施肥决策中发挥着越来越重要的作用[2-9]。通过无人机搭载光谱相机组成的遥感监测系统,研究使用大面积遥感实验数据对元素含量进行反演,可快速获得植被元素含量[12]。目前农业光谱应用多集中在小麦、水稻等大田作物[17-20],国内外鲜有对葡萄植株所含元素的光谱研究。本文使用无人机搭载多光谱相机获取的葡萄植株多光谱数据生成植被指数进行葡萄植株的氮素反演,以求为葡萄关键生长期施肥管理提供决策依据。
1 材料与方法
1.1 研究试验区域与试验设计
试验研究地点位于甘肃省武威市凉州区清源镇威龙沙漠绿洲有机葡萄庄园(102°47′33″ E,37°54′0″ N),试验地域属于典型温带大陆性气候,日照时数2 800小时左右,光照充足,昼夜温差较大,蒸发量大,干旱少雨。选用马瑟兰葡萄为研究对象,种植株距为3 m,行距5 m,柱架栽培。葡萄4月19日出土上架,萌芽期在5月10号左右,6月初为开花期,6月中旬进入果实膨大期,9月初为果实着色期,全生育期150~165天。试验研究过程中,分别在葡萄的4个生育期获取多光谱图进行建模反演。试验选取60个样本小区,利用矫正后的光谱图,提取小区的平均反射率构建植被指数,对应采样叶片在实验室测定其氮含量数据,构成建模数据样本集。其中随机选取45个样本小区用于建模,剩余15个样本小区用于模型精度验证。从每个样本小区摘取6片叶片,使用保温箱冷藏后带回实验室,使用干燥箱干燥,研磨成粉后经甘肃省农业科学研究院使用凯氏定氮法测取其氮含量。叶片采样时,测定并记录每个样本点GPS数值,便于后期与多光谱影像对应处理。
1.2 多光谱影像数据的采集与处理
本试验研究采用大疆M200系列四旋翼无人机搭载RedEdge-M多光谱相机。无人机飞行时,为确保生成正射影像图,相机镜头保持垂直向下;为保证光谱数据的质量,采集均选在天气晴朗无云并且阳光正射地面的中午时间,飞行高度为45 m,选定飞行实验区域后,自动规划航线飞行。RedEdge-M多光谱相机共有五个通道,分别为红、绿、蓝、红边、近红五通道,拍摄时内置SD卡用于图像储存。利用Pix4D mapper对光谱图像进行拼接、校准、提取各波段反射率,编辑植被指数公式,生成反演所用的光谱变量。
1.3 植被指数的选取
参考已有植物氮素反演研究文献[21-31],本文选取5个波段反射率和11个植被指数,以16个光谱变量对葡萄叶片氮含量进行反演试验研究,表1为试验研究选用的光谱变量。
表1 试验研究选用的光谱变量
1.4 数据分析方法
1.4.1 逐步回归分析
在多元线性回归中,如何选择最优自变量是需要考虑的重要环节,自变量数目太少,则会造成偏差过大;若选择全部自变量,则由于许多不显著自变量会使自由度减小而导致误差δ2增大等问题[32]。为建立最优回归方程,本研究采用逐步回归的思想方法,首先对引入的因子进行显著性检验,只保留显著者;其次,反复引入因子,每引入一个新因子就进行一次显著性检验,保留显著并剔除不显著因子,直到进入的因子都显著,而没有进入的因子都不显著为止。
Note:RGRE、RRED、RBLU、RREG、RREG and RNIRare reflectance values in green,red,blue,red edge and near infrared bands.
1.4.2 建模方法
首先将实测葡萄叶片氮含量与选取的植被指数做相关性分析,以相关性显著作为逐步回归基础;其次,随机选取45个样本数据为训练数据集来构建葡萄氮含量模型,剩余15个样本数据为检验数据集,对建立的估算模型进行能力检验。本文采用后退逐步回归建模,选择16个经过检验显著的植被指数为初始变量,之后再分析逐个剔除其中最不显著者,综合考虑模型精度以及复杂程度,选择出最优植被指数变量构建最终反演模型,用于智慧农业的氮肥决策。
1.4.3 评价指标
本文选取决定系数R2、调整后R2、均方根误差(RMSE)作为模型精度评价指标。所建模型R2越大,相应的RMSE越小,模型估算能力将越好。模型评价指标见公式(1)-(3)。
(1)
(2)
(3)
2 结果与分析
2.1 叶片氮含量与光谱变量相关性分析
相关性分析是回归建模的前提。当因变量与自变量的相关性越高,回归模型才具有较高可解释性。从萌芽期、开花期、果实膨大期、着色期等4个主要生育期数据样本集中随机选取45组数据,对生育期的光谱构建的植被指数与叶片实际氮含量进行相关性分析,各生育期相关性分析结果如图1所示。
图1 光谱变量与葡萄叶片氮含量相关性系数
本试验研究通过对萌芽期、开花期、果实膨大期、果实着色期等4个生育期植被指数与实测叶片氮含量相关性分析可知,在萌芽期,GNDVI与氮含量相关性系数最高,并且P<0.01,极显著;在开花期,MNLI与氮含量相关性系数最高,P<0.01,极显著;在果实膨大期,GNDVI、MNLI与氮含量相关性系数最高;在着色期,MNLI与氮含量相关性系数最高,P<0.01,极显著。
2.2 叶片氮含量最佳估测模型
由上述分析可知,5个通道的光谱反射率以及所构成的11个植被指数与叶片氮含量具有较高的相关性。本文选用SPSS软件对实验数据进行后退逐步回归分析,使用16个光谱变量与叶片氮含量构建多元线性回归模型,首先将全变量建模中不显著变量剔除,然后采用后退逐步回归逐个剔除变量中最不显著变量,步进法条件使用F的概率,进入为0.05,去除为0.1。为规避伪回归风险,首先将原始数据标准化,取自然数对数后进行回归分析。综合考虑模型精度和简洁度,选取合适的模型建模,回归结果如表2所示。
表2 光谱变量与葡萄叶片氮含量回归结果
表3 不同生育期葡萄叶片氮含量回归结果
图2 氮含量预测值与实际值的关系
3 讨论
利用无人机搭载RedEdge-M多光谱相机采集的红、蓝、绿、近红和红边波段等低空农业遥感光谱数据,在田块尺度上包含的精准农业信息丰富,作物生长检测和数据处理也较为简单,相比于高光谱其价格优势明显,便于实际推广应用。
葡萄氮含量与其叶绿素含量有很强的关联性,氮素含量随着叶绿素量增加而增加[33],在氮素含量研究中可适当选取一些对叶绿素敏感的波段。本研究发现,绿光波段在可见光中最为敏感,光谱指数GNDVI在不同生育期和氮素相关性也都较高,说明绿光及其绿光波段所构成的光谱指数可以很好地对葡萄氮含量进行反演。
此外,还尝试了采用BP神经网络、支持向量机等构建模型实验,但由于样本集数量过少,所训练的模型无法满足精度要求;就线性模型而言,本文选用一年采集的试验数据所构建的多元线性回归模型,相比于采用最优植被指数的已有反演模型研究[21-30],其模型精度仍相对较高。多元回归模型即避免了全变量建模的多重共线性,方便模型的解释,又保证了模型的稳定性。为进一步提高所建模型的鲁棒性,今后还应适当增加实验区域,并采用多年数据来构建模型。
4 结论
基于无人机多光谱影像,采用逐步回归分析方法构建葡萄四个生育期的叶片氮素含量模型,实现对葡萄氮含量的有效估测。本文试验研究的结果如下。
(1)葡萄氮含量与多光谱相机的5个波段相关性分析结果表明,绿色、红边、近红波段对植被指数都很敏感,在四个生长期近红外波段与葡萄氮含量相关性都是最高的。
(2)经后退逐步回归分析法,筛选出各生育期葡萄氮含量模型的最优光谱变量。萌芽期为GNDVI、B、R、MNLI、G、NIR;开花期为 GRVI、GNDVI、B、RE、R、G、NIR、MNLI、NDVI;果实膨大期为GRVI、RE、MNLI、NLI、GNDVI、NDVI;着色期为GRVI、NIR、B、RE、R、G、MNLI、NLI、GNDVI。