基于无人机多光谱遥感的冬油菜地上部生物量估算
2023-08-22向友珍李汪洋史鸿棹
王 晗 向友珍 李汪洋 史鸿棹 王 辛 赵 笑
(1.西北农林科技大学水利与建筑工程学院, 陕西杨凌 712100;2.西北农林科技大学旱区农业水土工程教育部重点实验室, 陕西杨凌 712100)
0 引言
油菜是中国广泛种植的重要油料作物之一,油菜籽可以用来压榨食用油,还可以用于开发生物柴油[1]。油菜在我国主要种植在长江中下游地区,但是随着全球气候变暖,CO2浓度持续上升,油菜种植区域呈“东减、北移、西扩”的趋势,西北地区油菜生产不断扩增[1-2]。因此,保证西北地区冬油菜稳定生产至关重要。地上部生物量(Above-ground biomass, AGB)是作物光合作用的产物,能够反映作物的生长状况和群体大小[3-4]。传统的作物地上部生物量测量方法通常是田间采样和室内测量,其获取信息较为准确,但结果仅限于有效的离散点源信息,过程耗时耗力,还具有破坏性和滞后性,很难满足随时监测田间作物养分的需求[5-6]。自20世纪70年代遥感技术在资源环境领域广泛应用,卫星遥感方法成为农业监测领域的一项有利手段[7]。卫星遥感具有大面积同步观测特点,但其受分辨率和重访周期的限制,卫星遥感影像容易受大气云层、雨雪天气等因素的影响,难以满足特定区域尺度高频次、高分辨率的要求[8-9]。
低空无人机 (Unmanned aerial vehicle, UAV)遥感不仅具有更高的分辨率,还可以快速地获取田间尺度作物的空间变异信息,有效地对作物生长特征进行监测,准确地反映地块内部作物的长势差异[10-11],有效弥补了卫星遥感的不足,已逐渐成为现代精准农业研究的新手段[12-13]。樊鸿叶等[14]以无人机搭载多光谱相机所获多光谱数据为基础,构建不同品种玉米的地上部生物量估算优化模型。陈先冠等[15]通过6种植被指数估算冬小麦地上部生物量,结果发现RDVI和NDRE估算效果最佳。ROOSJEN和CORCOLES等[16-17]利用获取的多光谱影像分别建立了马铃薯和洋葱的地上部生物量估算模型。肖武等[18]利用22种植被指数结合BP神经网络有效估算了采煤沉陷区上方玉米的地上部生物量。对于作物的反演相关研究有很多,但大多数研究针对全生育期或作物主要生育期,本研究根据冬油菜营养生长阶段和生殖生长阶段对获取的多光谱数据进行划分。前人研究表明,作物的营养生长阶段和生殖生长阶段之间相互依赖,又相互制约[19],营养生长旺盛不利于生殖器官的形成和养分的积累,产量不高;营养生长过弱又无法满足生殖生长对养分的需求,会出现早衰,产量降低。因此监测作物不同生长阶段的生长情况,及时对水氮施用策略进行调整对实现作物优质高产十分重要[20]。地上部生物量可以很好地反映不同生长时期作物生长情况,因此实现不同生长时期地上部生物量的实时精准监测十分必要[21]。
本试验研究充分利用低空无人机平台在农作物信息提取方面的优势和特点,以不同水氮施用策略下的冬油菜为研究对象,采用低空无人机携带多光谱相机获取不同时期冬油菜的多光谱图像。提取出各波段光谱反射率并构建植被指数,通过相关性分析筛选出不同生长时期绝对值排名前8的光谱变量作为模型输入变量。采用随机森林、支持向量机、遗传算法优化支持向量机和粒子群优化支持向量机对不同生长时期的冬油菜地上部生物量进行反演,通过对比验证集均方根误差及模拟所用时间来确定适合不同生长时期的估测模型。对实现田间尺度冬油菜地上部生物量的实时遥感监测技术进行优化,以期为冬油菜精准灌溉和施肥提供科学依据和数据支撑。
1 材料与方法
1.1 试验区概况
2021年10月到2022年6月在西北农林科技大学北侧灌溉试验站(108°24′E、34°18′N,海拔524.7 m)进行田间试验,该地属于暖温带季风半湿润气候,多年平均温度为12.9℃,多年平均降水量介于550~600 mm之间,但降雨时间与冬油菜主要生长阶段不重合,试验站所处位置及试验场景见图1。
图1 试验站位置及试验场景Fig.1 Test site location and test scene diagram
1.2 试验设计
本研究试验作物为当地品种“陕油18”,施用氮肥为尿素含量45%的纯氮缓释肥,缓释期为2个月。试验设置3个补灌水平和5个施氮量水平,补灌水平分别为不补灌(I0)、越冬期补灌(I1)、越冬期和蕾薹期补灌(I2);施肥量水平分别为0 kg/hm2(N0)、120 kg/hm2(N1)、200 kg/hm2(N2)、280 kg/hm2(N3)、300 kg/hm2(N4),补灌水平和施氮量水平两两组合共15个处理,不同处理设置2个重复。
1.3 试验数据
1.3.1数据获取及处理
于营养生长阶段(2021年12月16日和2022年2月25日)和生殖生长阶段(2022年3月28日和4月26日),采用MATRICE600型六旋翼无人机,搭载Micro-MCA型多光谱相机,选择晴朗无云、风速低于3级且无较大噪声的状况下,在11:00—14:00获取多光谱遥感影像,飞行高度为30 m。使用Yusense Map软件对获取影像进行拼接,利用ENVI 5.1软件基于阈值法对拼接好图像中的各小区的阴影和土壤背景进行掩膜处理[22],提取各小区各波段光谱反射率,通过提取的单波段光谱反射率进行组合计算获取植被指数。
无人机采样的同时进行冬油菜地上部生物量的测量。于营养生长期(苗期和越冬期)和生殖生长期(蕾薹期和开花期)在各小区选取3株能代表整个小区长势的冬油菜植株,清除表面泥垢,去除根部,放进干燥箱105℃下杀青30 min,在70℃下干燥至恒质量,用电子秤测定各组织器官干物质。获取的冬油菜地上生物量样本特征如表1所示。
表1 不同生长时期冬油菜地上部生物量统计Tab.1 Above-ground biomass of winter rapeseed at different growth stages
1.3.2植被指数选择与计算
植被指数(Vegetation indices,VIs)是指根据植被光谱吸收特征,将遥感影像各波段反射率之间进行线性或非线性组合形成的无量纲参数[23]。本文构建16种植被指数,如表2所示。
表2 植被指数Tab.2 Vegetation indices
1.4 模型构建
1.4.1随机森林
随机森林(Random forest, RF)是由LEO Breiman提出的一种基于分类回归树的机器学习方法[33]。通过自助法抽样从原始训练集中抽选n个样本,再对每个样本分别进行决策树建模并得到n个建模结果,最后利用所有决策树的建模结果,通过投票得到最终预测结果[34]。该模型具有高效处理大样本数据、能估计某个特征变量、具有较强噪声及快速运算等特点[35]。经过误差分析和反复试验,选用ntree=500、mtry=3来构建模型。
1.4.2支持向量机
支持向量机 (Support vector machine,SVM)是由CORINNA等[36]于1995年首次提出。该模型将数据转换到高维特征空间建立线性模型,基于此线性模型对回归函数进行拟合,SVM可以在很大程度上克服离散值多和过拟合等问题[37-38]。核函数用于完成非线性变换,其核函数中的径向基函数(RBF)具有映射维度广、需确定参数少、运算相对简单等优点[39]。因此,本文选择径向基函数作为核函数。
1.4.3遗传算法优化支持向量机
遗传算法(Genetic algorithm, GA)是一种最优搜索算法,其应用原理是基因遗传和自然选择[40]。遗传算法优化支持向量机(GA-SVM)的基本思想是在SVM算法之前,先用遗传算法优化确定核函数参数过程,快速确定全局最优解,再用支持向量回归算法对样本进行训练[31](图2)。
图2 基于遗传算法和粒子群算法优化支持向量回归算法流程图Fig.2 Flowchart of optimizing SVM based on GA and PSO
1.4.4粒子群算法优化支持向量机
粒子群算法(Particle swarm optimization, PSO)通过目标函数评估当前粒子所处位置,得相应的适应度。在种群中粒子的随机初始化形成后,会按照某种方式进行迭代,直到终止条件符合要求,从而寻找最优解[13]。PSO-SVM回归算法通过优化支持向量机的结构参数,使其快速寻得最优解,进而提升支持向量机的学习能力和诊断效率(图2)。
1.5 模型精度评价
采用决定系数R2(Coefficient of determination)、均方根误差(Root mean square error,RMSE)和相对分析误差(Relative predication deviation,RPD)对模型的估算精度进行评价。其中,R2越大,RMSE越小表示模型反演效果越好。当PRD小于1.4时,模型无法预测样本;当RPD在1.4~2之间,模型可以粗略预测样本;当RPD大于等于2时,模型能够很好地对样本进行估测[41]。
2 结果与分析
2.1 不同水氮处理对冬油菜生理生长指标和产量的影响
2.1.1地上部生物量
如表3所示,冬油菜地上部生物量随生育期的推进而增加,苗期冬油菜地上部生物量随着施氮量的增加呈先增加再降低的趋势,均在施氮量水平为N2或N3下达到最大,且施氮量水平为N1、N2、N3和N4下各处理之间没有显著性差异。未来3个生育时期,在同一灌溉处理条件下,冬油菜地上部生物量均随施氮量增加呈先增加再降低的趋势,均在施氮量水平为N2或N3下达到最大,且N2和N3施氮量条件下对应处理之间并无显著性差异,同一施氮量水平下,越冬期补灌(I1和I2)对应处理低于不补灌(I0)对应处理,可能是因为降雨量多再额外补灌,抑制了作物生长发育,I0、I1和I2对应处理之间没有显著性差异。同一施氮量水平下,蕾薹期进行补灌(I2)对应处理地上部生物量显著高于不补灌(I0)对应处理,越冬期补灌(I1)对应处理高于不补灌(I0)对应处理,但两者之间并无显著性差异。花期,施氮量水平相同条件下,越冬期进行补灌(I1)对应处理地上部生物量高于不补灌(I0)对应处理,且在施氮量水平为N3和N4下,I1和I0对应处理之间地上部生物量存在显著性差异;除了N1,I2对应处理地上部生物量显著高于I1和I0。成熟期,施氮量水平相同条件下,I2条件下对应处理显著高于I0和I1对应处理,I2条件下对应处理地上部生物量较I0和I1增加6.31%~22.75%和5.21%~22.02%;同一灌溉水平条件下,冬油菜地上部生物量随着施氮量增加呈现先增加再降低的趋势,且均在N3水平下达到最大,且在I2条件下施氮量水平为N2、N3和N4对应处理之间没有显著性差异,其他施氮量水平较N0分别增加4.38%~10.78%(N1)、8.78%~13.69%(N2)、10.98%~28.14%(N3)和8.29%~25.60%(N4)。
表3 不同水氮处理对冬油菜地上部生物量的影响Tab.3 Effects of different water and nitrogen treatments on AGB of winter rapeseed g/株
2.1.2叶面积指数
不同水氮处理条件下冬油菜叶面积指数随生育期的推进均呈先增加再降低的生长变化过程,从播种到进入成熟期叶面积指数一直呈增加趋势,进入成熟期叶片开始脱落,叶面积指数急剧下降(图3)。苗期不同施氮量处理对应冬油菜叶面积指数之间并无显著性差异;越冬期冬油菜叶面积指数增长缓慢,灌水处理相同条件下,冬油菜叶面积指数均随施氮量增加呈现先增加再降低的趋势,均在N3水平下达到最大。越冬期结束,气温开始回升,进入蕾薹期冬油菜叶面积指数急剧上升,蕾薹期补灌(I2)对应中高氮(N2、N3和N4)处理的叶面积指数显著高于仅越冬期补灌(I1)和不补灌(I0)对应处理。进入开花期后叶面积仍呈增加趋势,但增加速率变缓,在开花期结束冬油菜叶面积指数达到最大。开花期在相同施氮量条件下,蕾薹期补灌(I2)对应处理叶面积指数较不补灌处理(I0)增加12.09%~23.69%,较仅在越冬期补灌(I0)对应处理叶面积指数增加3.89%~12.39%;相同灌溉处理条件下,叶面积指数随着施氮量增加呈现先增加再降低的趋势,均在施氮量水平为N4下达到最大,但是施氮量水平为N3和N4之间没有显著性差异,其他施氮量水平较N0分别增加16.69%~23.06%(N1)、26.76%~40.49%(N2)、33.34%~47.15%(N3)和25.77%~35.86%(N4)。
图3 不同水氮处理对冬油菜叶面积指数的影响Fig.3 Effects of different water and nitrogen supply on leaf area index of winter rapeseed
2.1.3产量与其构成
相同灌水处理条件下,冬油菜单株分枝数、单株角果数、每角籽粒数和千粒质量均随施氮量增加呈现先增加再降低的变化趋势,均在N2或N3水平下达到最大(表4)。施氮量相同条件下,冬油菜单株分枝数、单株角果数、每角籽粒数和千粒质量均在灌水水平为I2达到最大。冬油菜单株分枝数在N2I2(27.67枝/株)下达到最大,较I0N0增加11.00枝/株(66.00%)。冬油菜单株角果数均在I2N3处理达到最大,且均与I2N2之间没有显著性差异,单株角果数最大为333.17粒/株,较I0N0增加161.67粒/株(94.27%)。处理I2N3每角籽粒数最大(31.35粒/角),与处理I2N2之间没有显著性差异,处理I2N3的每角籽粒数比I0N0处理增加3.62粒/角(13.04%)。不同水氮处理条件下冬油菜籽粒千粒质量之间相差并不多,为3.41~3.87g,相同灌溉处理条件下,冬油菜籽粒千粒质量均在N2水平下达到最大,N2处理较其他处理分别增加4.82%~7.69%(N0)、3.18%~4.49%(N1)、0.53%~2.28%(N3)和3.28%~9.88%(N4)。
表4 不同水氮处理对冬油菜产量及产量构成要素的影响Tab.4 Effects of different water and nitrogen supply on yield and yield components of winter rapeseed
不同水氮处理条件下,冬油菜籽粒产量为1 332.60~2 460.40 kg/hm2,在处理I2N3达到最大。同一灌水处理条件下,冬油菜籽粒产量随着施氮量增加呈先增加再降低的趋势,且在施氮量水平为N3时达到最大,但N2和N3对应处理之间冬油菜籽粒产量并无显著性差异。施氮量水平为N3对应冬油菜产量较其他施氮量水平对应处理分别增加4.13%~26.96%(I0)、7.63%~20.67%(I1)和2.31%~17.48%(I2)。同一施氮量处理条件下,在越冬期和蕾薹期补灌处理(I2)冬油菜籽粒产量显著高于仅在越冬期补灌处理(I1)和不补灌处理(I0),对应处理I2冬油菜籽粒产量较I0和I1增加17.13%~44.18%(N0)、24.17%~45.19%(N1)、19.94%~37.83%(N2)、14.03%~35.79%(N3)和23.63%~34.71%(N4)。综合分析不同水氮处理条件下冬油菜生理生长指标和产量,结果表明处理I2N3更适合关中地区冬油菜的种植。
2.2 基于多光谱的冬油菜地上部生物量反演
2.2.1冬油菜地上部生物量(AGB)与植被指数(VIs)的相关性分析
将21个光谱变量(5个单波段反射率和16个植被指数)与对应处理的冬油菜AGB进行相关性分析(图4),确定在不同生长阶段内相关系数绝对值排名前8的光谱变量作为输入量,用于构建对应生长时期的冬油菜AGB监测模型。由图可知,在全生长阶段,除了GNDVI,其余植被指数均与AGB达到0.01显著性水平,选取Blue、Green、Red、Rededge、NIR、SAVI、MTVI和GCVI作为模型输入量,其中除了GCVI,其他输入变量均与AGB呈正相关。其中红光波段的相关系数最高,相关系数为0.835,选择的其余光谱变量相关系数均高于0.75。
图4 不同生长阶段植被指数与冬油菜地上部生物量的相关性分析Fig.4 Correlation analysis between vegetation index and above-ground biomass of winter rapeseed at different growth stages注:**表示有极显著差异(p<0.01),*表示有显著性差异(p<0.05),NSD表示无显著性差异(p>0.05)。
在营养生长阶段,光谱变量与冬油菜AGB均达到0.01显著性水平,选择Blue、Red、Rededge、NDVI、VARI、MSR、NBI和IPVI作为模型输入量。其中基于红、绿、蓝波段的NBI与该时期AGB相关系数最大,为0.846。在生殖生长阶段,除了MSR和IPVI,其余光谱变量均与冬油菜AGB达到0.01显著性水平,选择Blue、Green、Red、Rededge、NIR、EVI、MTVI、GCVI作为模型输入变量。所选变量相关系数均高于0.60,除了GCVI,选择的光谱变量均与地上部生物量呈正相关(图4)。
2.2.2基于光谱变量冬油菜地上部生物量估算模型的建立与验证
如图5a~5f(图中WS、NS、GS分别表示全生长阶段、营养生长阶段、生殖生长阶段)和表5所示,基于4种机器学习模型对冬油菜地上部生物量进行反演,结果表明对于营养生长阶段的AGB估测效果最好,其次是全生长阶段。与RF模型相比,SVM模型显著降低了估测地上部生物量所用时间,3个生长时期估测所用时间分别降低79.11%、75.13%和72.24%。对于全生长期RF回归模型的决定系数略高于SVM,但其验证集相对分析误差少7.22%且未达到可以较好预测的程度;在营养生长期SVM估测精度更高,其校正集和验证集的R2分别为0.963和0.944,RMSE分别为0.288、0.341 kg/hm2,其验证集的RPD为3.949,比RF回归模型提高137.35%;在生殖生长期SVM校正集决定系数高于RF,但验证集低于RF,两者验证集相对分析误差均未达到可以极好预测的程度。通过与RF回归模型对比,SVM回归模型更适合对关中地区冬油菜全生长时期和营养生长时期地上部生物量进行估测。
表5 不同地上部生物量估算模型的建模和验证结果Tab.5 Calibration and validation results of different AGB estimation models
图5 地上部生物量估算值与实测值的关系Fig.5 Relationship between estimation and measured values of AGB of winter rapeseed
基于两种算法对支持向量机进行优化可提升模型反演精度并降低反演所用时间(图5g~5l,表5)。相比于SVM模型,GA-SVM模型和PSO-SVM模型在3个生长时期模拟精度均优于SVM,生殖生长阶段优化后的模型RPD分别为2.257和2.034,说明优化后的两模型可以很好反演生殖生长阶段冬油菜地上部生物量,其模拟结果真实可信。在全生长阶段和生殖生长阶段,PSO-SVM的模型精度高于GA-SVM,PSO-SVM在全生长阶段验证集的R2为0.866,比GA-SVM高3.21%,RMSE为 9.594 kg/hm2,比GA-SVM低12.19%;PSO-SVM在营养生长阶段验证集的R2为0.962,比GA-SVM高2.02%,RMSE为0.277 kg/hm2,比GA-SVM低17.80%。在生殖生长阶段GA-SVM模拟精度优于PSO-SVM,GA-SVM在生殖生长阶段验证集R2为0.806,比PSO-SVM高2.15%,RMSE为12.424 kg/hm2,比PSO-SVM模型降低7.401%。对SVM模型进行优化,增大了反演所用时间,GA-SVM 3个生长阶段反演所用时间比SVM增加2 625.5%、1 035.6%和857.74%,PSO-SVM在3个生长阶段反演所用时间比SVM增加342.09%、268.67%、178.66%。相比于GA-SVM,PSO-SVM反演所用时间更少,在全生长时期和生殖生长时期模拟精度有所提升,并且在生殖生长时期达到模拟精度要求。因此,PSO-SVM更适合用于不同生长阶段关中地区冬油菜地上部生物量的反演。
2.3 基于最佳反演模型的AGB可视化制图
应用PSO-SVM获取营养生长阶段和生殖生长阶段的冬油菜各小区地上部生物量空间分布图(其中,苗期不同水氮处理条件下冬油菜地上部生物量差异不明显,不对其进行可视化研究),图像呈现的整体趋势是冬油菜地上部生物量随着生育期的推进而增加(图6)。相同灌水处理条件下,冬油菜AGB随施氮量增加呈现先增加再降低的趋势;相同施氮量处理条件下,越冬期和蕾薹期补灌条件下对应处理AGB高于不补灌对应处理,均在I2N3处理下达到最大,这与对应同时期田间实测数据变化规律相符,说明基于无人机多光谱建立冬油菜地上部生物量反演模型是可行的。
3 讨论
本研究基于无人机获取的冬油菜不用生长阶段的多光谱影像,用阈值法对获取影像中的阴影和土壤背景进行掩膜处理,提取各波段反射率构建植被指数。采用皮尔逊相关性分析法对提取的单波段反射率和构建的植被指数进行筛选确定不同生长阶段相关系数绝对值排名前8的光谱变量作为输入量,采用RF、SVM、GA-SVM和PSO-SVM构建不同生长阶段冬油菜地上部生物量估算模型。
结果表明,不同生长阶段均有相关性较高的光谱变量,这说明提取的光谱变量能够反映不同水氮条件下冬油菜地上部生物量,这与WANG等[42]和黄春燕等[29]反演地上部生物量结果类似。在全生长阶段和生殖生长阶段红光波段反射率显著性最强且稳定,相关系数分别达到0.84和0.75,说明红光波段对于作物地上部生物量的响应更加显著,这与肖武等[18]和樊鸿叶等[14]研究结果一致。JIN等[41]研究发现NDVI、EVI与作物生物量之间相关性更强,也说明红光波段对于作物生物量响应显著。
基于GA和PSO算法对SVM进行优化,结果表明采用两种算法优化后的SVM对各生长阶段AGB估测精度均有所提升,这是因为两种算法优化了确定SVM惩罚参数C与核函数半径g的过程,但优化后的模型估算所用时间均高于支持向量机。且GA-SVM估算时间远高于PSO-SVM,这是因为遗传算法中染色体之间相互共享信息,所以整个种群的移动是比较均匀地向最优区域移动的,而粒子群算法中,粒子仅通过当前搜索到最优点进行共享信息,所以很大程度上这是一种单项信息,整个搜索更新过程是更新当前最优解的过程,因此PSO算法中所有粒子比GA算法中的进化个体以更快的速度收敛于最优解[42]。且PSO算法中无交叉和变异操作,粒子只通过内部速度进行更新,因此其原理也更加简单,参数更少,更容易实现[43]。杨晓宇等[44]利用粒子群算法优化的极限学习机算法对农田土壤养分进行反演,结果表明优化后的模型模拟精度有所提升。
利用优化后的数据建立了改良后的SVM模型,与实测数据进行评价,分析结果表明,模型能够快速、无损地估测冬油菜不同生长时期地上部生物量,为未来大面积分时期遥感监测提供参考。以后可以争取利用更多年份观测数据进行研究,以提高模型估测精度和稳定性,并且对于其他品种和其他地区冬油菜是否实用也需要进一步验证。
4 结论
(1)通过对冬油菜不同生育期生理生长指标以及产量进行分析,确定I2N3(越冬期和蕾薹期补灌,施氮量为280 kg/hm2)为适合关中地区的冬油菜水氮施用策略。
(2)各生长阶段光谱输入变量与地上部生物量均显著相关(p<0.01),全生长阶段和生殖生长阶段红光波段反射率显著性最强且稳定,相关系数分别达0.835和0.754;营养生长阶段NBI显著性最强且最稳定,相关系数高达0.846。
(3)各模型均在营养生长期各模型估算精度最高,在生殖生长期模型估算精度最低,全生长时期各模型估算时间最长。
(4)PSO-SVM在全生长时期、营养生长时期和生殖生长时期的验证集R2分别为0.866、0.962和0.789,综合对比模型反演精度和反演效率,PSO-SVM模型更适合用于反演关中地区冬油菜不同生长时期的地上部生物量。