基于无人机多光谱影像植被指数与纹理特征的冬小麦地上部生物量估算
2024-01-02朱永基陶新宇陈小芳苏祥祥刘吉凯李新伟
朱永基,陶新宇,陈小芳,苏祥祥,刘吉凯,李新伟,*
(1.安徽科技学院 资源与环境学院,安徽 凤阳 233100; 2.安徽省农业废弃物肥料化利用与耕地质量提升工程研究中心,安徽 凤阳 233100)
受全球气候变暖[1]、耕地质量下降[2]、人地关系紧张[3]等因素的影响,我国长期存在粮食供需不平衡的状况[4]。冬小麦作为我国主要粮食作物之一,种植面积约占全国作物种植总面积的15%,产量约占全国粮食总产量的20%;因此,稳定冬小麦产量对保障我国粮食安全有着重要意义[5]。冬小麦的地上部生物量(above-ground biomass,AGB)是评价冬小麦生长发育状况与预测产量的重要指标之一[6]。准确监测冬小麦的AGB是提高作物产量和确保粮食安全的先决条件[7]。传统的冬小麦AGB监测结果主要通过破坏性采样方式获取,需要消耗大量的时间、人力和物力;因此,迫切需要研发出更高效、更灵活的监测方式来提升冬小麦AGB的估算效率。
遥感技术的快速发展为作物无损监测提供了一种高效的新方式。早期的遥感监测研究主要集中在卫星、可驾驶飞机、地面等平台上。前人利用卫星数据进行大区域尺度的AGB监测[8],但卫星存在数据空间分辨率相对较低、重返周期较长、数据获取难度较大(受天气条件、过境时间等因素的制约)等问题,难以满足高精度、高效率的作物监测需求[9]。可驾驶飞机在遥感上的应用,极大地克服了卫星遥感技术访问周期长、空间分辨率低等问题,但人造飞机的使用需要固定的跑道设施,价格昂贵[10],不利于田间使用。随着田间尺度的表型监测技术的发展,一种低成本、操作简易的地面遥感技术得到了广泛应用。研究人员使用手持传感器设备(如高光谱仪、CropCircle手持式植物冠层光谱仪、GreenSeeker便携式光谱仪等)获取作物光谱信息,可以高精度地获取特定位置点的作物生长信息;但这种手持式设备的数据采集范围较小,需要通过增加采样点数量来提升数据对地块的代表性,当地块较多时,这种方式难以满足高效的表型监测需求[11]。因此,在生产上迫切需要一种机动灵活、作业效率高、监测成本低的平台来解决上述遥感平台所存在的问题。
无人机以高时效、高通量、高机动性等优势,在一定程度上弥补了卫星、地面平台的不足,逐渐成为作物监测的主流平台。在无人机表型监测中,归一化植被指数(NDVI)、差值植被指数(DVI)、归一化红边指数(NDRE)等植被指数被广泛应用于冬小麦AGB监测[12]。但是,Kong等[13]、Maimaitijiang等[14]的研究发现,植被指数在作物生长密集、冠层覆盖率较高的情况下会出现饱和现象。为此,有研究采取融合多源传感器数据的方法来削弱光谱饱和效应对模型的影响。利用无人机平台搭载高光谱、激光雷达、热红外等传感器获取更加丰富的数据特征,可以提高监测模型的精度[15]。虽然多传感器的应用提高了模型精度,但多传感器融合面临数据处理过程复杂、数据冗余、数据精度不匹配、成本高等问题[16]。有些研究利用光谱数据结合结构特征来估算AGB。如刘杨等[17]利用无人机提取作物株高(plant height, PH)数据,并与植被指数相结合,提升了模型估算马铃薯地上部生物量的精度。但株高提取易因受到土壤背景的干扰而产生低估,且存在特征位置不匹配的问题。与结构特征相比,纹理特征是像元与其邻域像元灰度频率的表征,是描述微观结构的重要指标之一,与光谱的特征位置高度一致。Liu等[18]将植被指数与纹理特征相结合,利用随机森林(random forest, RF)算法获得了准确的冬油菜AGB估算模型;Freitas等[19]将无人机图像光谱与纹理特征相结合,准确估算了牧场草本作物的AGB;Xu等[20]利用无人机高光谱图像的纹理与光谱信息,改进了水稻AGB估算的精度。上述研究说明,耦合光谱和纹理信息在估算冬小麦AGB方面具有潜力。
机器学习算法能有效处理预测因子与目标变量之间的复杂关系,在应对多模态、高维度数据时具有很好的抗冗余效果。目前,RF[21]、偏最小二乘回归(partial least squares regression, PLSR)[22]等机器学习算法已广泛应用于作物表型监测,取得了不错的效果,但机器学习算法会提高数据计算成本,且模型的构造较为复杂;因此,有必要考虑不同算法下模型的精度差异与实用性。
尽管光谱特征在估算冬小麦生理生化参数上具有广阔的应用前景,但光谱特征易受冠层结构的影响而产生“饱和”效应。研究表明,纹理特征在估算作物AGB方面具有巨大潜力[18-20]。为了探究纹理特征在监测冬小麦AGB中的效果,本研究利用消费级多光谱无人机评估纹理特征对AGB估算模型的改善效果。本研究的目标:1)探究植被指数结合纹理特征对冬小麦AGB的监测效果;2)研究最优的冬小麦AGB监测时期;3)分析不同算法在不同时期对冬小麦AGB的监测效果。
1 材料与方法
1.1 试验方法
于2020-2021年在安徽省滁州市凤阳县小岗村开展冬小麦田间试验。本研究采用裂区试验设计,设置36个2 m×8 m的小区,使用淮麦44(P1)、烟农999(P2)和宁麦13(P3)3个冬小麦品种,于2020年11月播种,2021年6月上旬收获。播种前,钾肥(氯化钾,K2O质量分数为50%)、磷肥(过磷酸钙,P2O5质量分数为12%)以基肥的形式一次性施入,施用量分别为135 kg·hm-2(以K2O计,折纯)、90 kg·hm-2(以P2O5计,折纯)。氮肥使用颗粒尿素(N质量分数46%),分2次施用:60%作基肥施入,40%于拔节期追肥。试验共设置4个氮肥处理:N0,不施氮;N1,100 kg·hm-2(以N计,折纯,下同);N2,200 kg·hm-2;N3,300 kg·hm-2。每个品种每个处理设置3次重复。试验年间未出现生物胁迫与非生物胁迫,田间管理同当地高产大田管理方案。
1.2 数据获取
本研究使用大疆精灵4多光谱版(P4M)无人机(深圳市大疆创新科技有限公司)采集数据。P4M无人机配备一体式云台,该云台集成1个可见光成像传感器和5个多光谱成像传感器[蓝:(450±16)nm;绿:(560±16)nm;红:(650±16)nm;红边:(730±16)nm;近红外:(840±26) nm]。利用DJI GS Pro软件规划飞行任务,获取90%前向重叠和85%旁向重叠的图像,小麦不同生育期的飞行计划和相机设置保持一致。无人机以30 m高度获取试验区影像,飞行速度2 m·s-1,在地面放置4块标准反射布,用于无人机影像的辐射校正。每次飞行活动于11:00-14:00、光照稳定的条件下进行。分别于2021-03-14(拔节期)、2021-04-08(孕穗期)、2021-04-18(抽穗期)、2021-04-29(开花期)、2021-05-09(灌浆期)、2021-05-24(成熟期)获取无人机影像数据,其空间分辨率分别为1.64 cm×1.44 cm、1.85 cm×1.54 cm、1.74 cm×1.44 cm、1.74 cm×1.45 cm、1.74 cm×1.46 cm、1.74 cm×1.47 cm。
在无人机作业的同一天内,对36个小区的AGB进行采样。每个小区选择3处长势均匀、大小为0.5 m双行的冬小麦。将冬小麦从根部剪断,将新鲜样品带回实验室进行茎、叶分离。将带回的样品于105 ℃杀青30 min,然后在75 ℃干燥24 h至质量恒定。称量冬小麦茎、叶的干重,换算AGB(kg·hm-2)。
1.3 无人机影像预处理
利用大疆智图(DJI terra)软件处理无人机图像,生成数字正射影像(digital orthophoto model, DOM)。关键处理步骤包括图像对齐、相机校准、密集点云构建,以及DOM的生成。本研究所使用的无人机自带厘米级定位系统,因此不需要额外的控制点来对图像进行校正。
采用经验线性模型进行辐射定标,以消除不同时期图像因光照不同而造成的辐射失真。为消除边界效应,在参考板中心位置选择约0.2 m×0.2 m的区域取其平均值作为该参考板的DN值(数字量化值,遥感影像的像元亮度值,记录的地物的灰度值)。
R(i,j)=V(i,j)*ai+bi,i∈[1,5],j∈[1,4]。
(1)
式(1)中:R(i,j)和V(i,j)分别代表波段i在第j块参考板上的反射率值和DN值,ai为斜率,bi为截距。
为降低土壤背景对生物量估算的干扰,本研究利用作物与背景之间的反射率阈值去除土壤背景。对比作物与土壤的反射率发现,作物与土壤在近红外波段的反射率差异最大。经过多次试验,最终利用近红外波段阈值法去除土壤背景的影响。
1.4 植被指数计算
本研究选择了7种植被指数用于冬小麦AGB的估算,具体包括归一化植被指数(normalized vegetation index, NDVI)[23]、差值植被指数(difference vegetation index, DVI)[24]、比值植被指数(ratio vegetation index, RVI)[23]、绿色归一化植被指数(green normalized vegetation index, GNDVI)[25]、归一化红边植被指数(normalized red-edge vegetation index, NDRE)[26]、红边叶绿素指数(red edge chlorophyll index, RECI)[8]、转化叶绿素吸收比值指数[27](transformed chlorophyll absorption ratio index, TCARI)。
1.5 纹理特征提取
纹理特征通过像素邻域的灰度值变化来反映空间位置特征,与植被指数相比不存在饱和效应,属于一种微观的结构特征。基于灰度共生矩阵(grey level co-occurrence matrix, GLCM)提取影像纹理特征。为了减少数据交叉,提升数据处理速度,且最大限度地保留纹理信息,本研究利用ENVI 5.6软件对影像进行主成分分析,利用第一主成分的数据进行纹理特征提取。根据Haralick等[28]和刘杨等[29]的研究,选择其中运算量较小且应用较多的3种纹理特征--均值(Mean)、方差(Var)、熵(Ent)。
1.6 模型算法选择
机器学习算法已经被广泛用于处理作物生理/生化参数与遥感变量之间的非线性关系。与线性回归模型相比,机器学习算法适合于建立多输入量的模型。从实际生产应用来说,线性回归在一定程度上可以降低模型的复杂性。综上,本研究选择一元线性回归、PLSR、RF算法构建冬小麦AGB监测模型,比较模型间的精度差异,探究适宜农业生产应用的算法。
1.7 模型评价
为了建立适用于不同生育时期冬小麦AGB的监测模型,采用随机分层方法对不同生育时期的样本进行划分,其中,70%的样本用于模型构建,30%的样本用于模型验证。使用决定系数(R2)、均方根误差(RMSE)和平均绝对误差(MAE)评价模型的准确性。R2值越接近1,RMSE和MAE值越小,表明模型的精度越高,稳定性越好。
2 结果与分析
2.1 多光谱植被指数、纹理特征与小麦生物量的相关性
测算不同生育时期AGB与植被指数和纹理特征的相关性(表1)。纹理特征中:Mean在前4个生育期(拔节期-开花期)的表现较好,与植被指数的表现相近,与AGB在P<0.001水平上显著相关;Var在拔节期的表现最好(与AGB的相关系数为0.77,在P<0.001水平上显著相关);Ent在拔节期的表现较好(与AGB的相关系数达到0.66),但在抽穗期和开花期的表现相对较差。各植被指数在各生育期与AGB均在P<0.001水平上显著相关:拔节期时,DVI与AGB的相关系数最大(0.83);孕穗期时,TCARI与AGB的相关系数最大(0.77);抽穗期和开花期时,均以RVI与AGB的相关系数最大(分别为0.77和0.78);灌浆期时,RECI与AGB的相关系数最大(0.81);成熟期时,GNDVI与AGB的相关系数最大(0.85)。总的来说,植被指数与冬小麦AGB的相关性要高于纹理特征。周元琦等[30]、杭艳红等[25]的研究结果也表明,植被指数与AGB的相关性要高于纹理特征。
表1 植被指数、纹理特征指标与生物量的相关性Table 1 Correlations within vegetation indexes, texture features and biomass
2.2 基于最优植被指数的冬小麦生物量估算模型构建与验证
在不同生育期选择与AGB相关性最高的植被指数构建估算冬小麦AGB的一元线性模型(表2),对比各模型的准确性。结果显示,灌浆期的建模效果最好,R2、RMSE和MAE分别为0.78、2 228.92 kg·hm-2和1 783.60 kg·hm-2,其次是拔节期与成熟期。
表2 基于各生育期最优植被指数的线性模型Table 2 Linear models based on optimal vegetation indexes for growth stages
对各生育期的生物量实测值与模型预测值进行相关性分析,发现在抽穗期和灌浆期的实测值与模型预测值在P<0.05水平上显著相关,其余时期的实测值与模型预测值均在P<0.01水平上显著相关。从拔节期到孕穗期,模型的估算精度呈上升趋势(图1),至孕穗期达到顶点;从孕穗期到灌浆期,模型的估算精度呈下降趋势。各生育期相比,成熟期的估算精度最高,R2为0.75,RMSE为3 066.15 kg·hm-2,MAE为2 669.59 kg·hm-2。其次是孕穗期,抽穗期与开花期的估算精度相近,灌浆期的估算效果最差。
y1~y6分别对应于拔节期、孕穗期、抽穗期、开花期、灌浆期、成熟期的预测值,x为相应时期的实测值。R2,决定系数;RMSE,均方根误差;MAE,平均绝对误差。下同。y1-y6 represent the predicted value at joting stage, booting stage, heading stage, flowering stage, filling stage, mature stage, respectively. x represents the measured value at the corresponding stage. R2, Coefficient of determination; RMSE, Root mean squard error; MAE, Mean absolute error. The same as below.图1 基于各生育期最优植被指数的线性模型验证Fig.1 Verification of the constructed linear models based on optimal vegetation indexes for growth stages
2.3 基于最优植被指数与最优纹理特征的小麦生物量估算模型构建与验证
在不同生育期,结合与冬小麦AGB相关性最好的植被指数、纹理特征,构建二元线性模型(表3)。与仅利用植被指数构建的一元线性模型相比,二元线性模型在各个时期的精度均得到提高,尤以抽穗期和开花期的预测精度提升较多,说明纹理特征的加入有利于提升冬小麦生物量估算模型的性能。
表3 基于各生育期最优植被指数与纹理特征的二元线性模型Table 3 Binary linear models based on optimal vegetation indexes and texture features for growth stages
验证构建的二元线性模型估算冬小麦AGB的效果(图2),除灌浆期外,估算精度均较构建的一元线性模型有所提升,且不同生育期的模型预测值与实测值均在P<0.01水平上显著相关。结果表明,融合植被指数与纹理特征的模型的估算精度要优于单一的植被指数模型,说明纹理特征的融入对生物量估算有积极意义。各生育期相比,孕穗期的估算精度最高,R2为0.76,RMSE为1 012.65 kg·hm-2,MAE为804.12 kg·hm-2。
图2 基于各生育期最优植被指数与纹理特征的二元线性模型验证Fig.2 Verification of the constructed binary linear models based on optimal vegetation indexes and texture features for growth stages
2.4 基于机器学习算法的融合全部植被指数与纹理特征的小麦生物量估算模型构建与验证
将本文选定的所有植被指数与纹理特征作为模型的输入因子,分别基于PLSR、RF两种方法进行模型的构建与验证(表4、表5)。基于所有植被指数与纹理特征构建的模型在验证集上的精度在拔节期到抽穗期呈上升趋势,但在抽穗期到灌浆期总体呈下降趋势,以抽穗期的精度最高。利用全部植被指数建模时,RF方法在抽穗期的估算精度最高,R2为0.78,RMSE为2 464.82 kg·hm-2,MAE为1 783.65 kg·hm-2;利用全部植被指数融合纹理特征建模时,PLSR方法在抽穗期的估算效果最好,R2为0.82,RMSE为2 428.92 kg·hm-2,MAE为1 847.91 kg·hm-2。综合各生育期结果判断,植被指数与纹理特征相融合的估算效果整体上要优于仅运用植被指数的模型的估算效果,融合植被指数与纹理特征能提高冬小麦生物量的估算精度,可在一定程度上降低光谱饱和、冗余所带来的影响。
表4 基于偏最小二乘回归(PLSR)算法构建的不同生育时期的冬小麦生物量预测模型Table 4 Prediction models for winter wheat biomass at growth stages based on partial least squares regression (PLSR)
表5 基于随机森林(RF)算法构建的不同生育时期的冬小麦生物量预测模型Table 5 Prediction models for winter wheat biomass at growth stages based on random forest (RF)
在孕穗期和抽穗期,基于RF算法运用植被指数构建的模型结果要优于融合了纹理特征的模型的效果。这可能是因为,本研究的样本数据量较小,未能发挥RF模型对异常值和噪声的处理优势,且植被指数与AGB的相关性明显高于纹理特征,全部植被指数内部可能存在严重的过拟合现象,弱化了纹理特征对预测结果的贡献。Sexton等[31]的研究也发现,对于数据量大的数据集,基于bootstrap的RF估计效果更好。
综上所述,植被指数与纹理特征的组合效果整体上优于植被指数。但当输入全部数据作为自变量时, RF算法在孕穗期与抽穗期的表现略差。有可能是因为样本数据量较小,导致模型的拟合能力不足;也可能是因为穗部结构的出现会影响纹理特征与光谱特征。线性模型在孕穗期估算生物量的效果最佳,而PLSR与RF估算生物量的最佳时期则是抽穗期,这可能是因为纹理特征受冬小麦穗部特征的影响较小,且此时的冬小麦生长旺盛,以叶片为主的绿色像元在无人机视野内占据绝大部分比例,植被指数能更好地表达绿色植被的特征。
3 讨论
3.1 无人机遥感的潜力
随着现代化农业的蓬勃发展,操作简单、机动灵活的平台日益替代人工来获取田间数据,无人机已逐渐成为实现田间精确管理和作物表型监测的重要平台。虽然,固定翼飞机的飞行速度快、飞行距离远,但其不能悬停获取影像,存在操作难度大、易损坏等问题,不适用于小尺度田块。与固定翼飞机相比,多旋翼飞机稳定灵活,飞行速度适中,可以提供较高分辨率的影像。其中,多光谱无人机获取的红边和近红外波段信息对绿色植被有较高的反射特性,并与多种植物生理生化参数有良好的相关性,可以提高模型的准确性。
3.2 植被指数的饱和效应与纹理特征的增效
植被指数可以增强某种较弱的植被信号,但当冠层叶绿素吸收、反射某些光谱波段的能力与作物生长状态出现非线性变化时,就会出现“饱和”现象。以NDVI为例,之所以会产生“饱和”效应,根本原因是,当植株的生物量和叶面积指数达到一定值时,红光反射率趋于饱和[32]。为了降低这种饱和效应,有研究者利用绿光波段代替NDVI中的红光波段来改进植被指数的性能。但是,这种改进方法还是从光谱的角度出发,受冠层、土壤等因素的影响较大。将纹理特征与植被指数结合,是从图像灰度变化的角度对冠层反射率进行的修正,有利于降低“饱和”效应对模型估算精度的影响。本研究结果表明,在冬小麦的不同生育时期,融合纹理特征均有助于提升冬小麦AGB的估算精度,且适用于不同算法下的AGB估算。未来,可以继续挖掘无人机图像的特征,利用多种特征、多种传感器的组合来进一步提升模型的精度。
3.3 运用光谱特征和纹理特征估算不同生长时期AGB的效果
本研究利用线性回归方法,运用植被指数、纹理特征建立冬小麦AGB估算模型。单独运用植被指数估算AGB的模型在孕穗期和成熟期的精度较好,在成熟期精度最高,在其余时期的效果相对较差。这可能是因为拔节期的冬小麦植株相对矮小,此时的叶片还未完全展开,冠层光谱对于冬小麦AGB的表征能力不足。在抽穗期和开花期,穗、花结构会对光谱信息产生干扰,导致模型精度不佳。为了弥补植被指数在估算冬小麦AGB方面的不足,本文还尝试组合纹理特征和光谱特征构建二元线性模型估算AGB,结果表明,在不同时期,构建的二元线性模型的精度都优于单一运用植被指数估算冬小麦AGB的精度。这说明,在冬小麦的生长过程中,纹理信息可以弥补光谱信息受作物冠层结构、形态等变化带来的影响,提升模型精度。
3.4 方法层面的选择
目前,机器学习等方法被广泛应用于作物监测中。Yue等[33]利用结合了高光谱数据和株高的PLSR来反演小麦生物量。崔日鲜等[34]利用BP(反向传播)神经网络的方法对小麦生物量进行估算。本研究使用线性回归、PLSR与RF方法进行对比研究,结果显示,线性模型的结果在各时期较为稳定,PLSR次之,RF的拟合程度最高,但对生物量的估算精度在不同时期整体浮动略大,模型稳定性一般,这可能是由于样本数量较少所致。申洋洋等[35]的研究表明,基于多时相遥感的PLSR方法对小麦产量的估算精度与逐步多元线性回归的模型精度类似。这可能是因为植被指数间的相关性较高,导致结果中出现拟合精度较高、预测精度较低的现象[36],可利用主成分分析来降低自变量间的自相关性。总体来看,本研究中,基于筛选的特征运用线性回归估算AGB时,孕穗期和成熟期的精度较好;而运用PLSR与RF估算生物量的最佳时期则是抽穗期。今后,在估算冬小麦AGB的研究中,应考虑更多因素,进一步优化模型方法,提升模型的实用性。