基于无人机RGB影像的小麦叶面积指数与产量估算研究
2023-07-17曹承富杜世州黄正来
杨 楠,周 萌,陈 欢,曹承富,杜世州,黄正来
(1.安徽农业大学农学院,安徽合肥 230036;2.安徽省农业科学院作物研究所,安徽合肥 230031; 3.南京农业大学农学院/国家信息农业工程技术中心,江苏南京 210095)
叶面积指数(leaf area index,LAI)能有效反映作物生长信息,是衡量作物群体是否合理的重要栽培生理参数,与作物蒸腾、光合、呼吸作用及碳循环、降水截获等方面密切相关[1-2]。作物产量是农业生产过程中最终的数量特征,对于生产者、政府部门等而言极其重要。目前,预测作物长势和产量的方法主要包括基于地面的实地调查[3]、作物生长模型[4]、基于遥感的方法[5]等。自1970年以来,卫星数据因具有较好的空间、时间和光谱分辨率等优势,已被广泛用于大规模的作物产量预测[6-7]。然而,卫星数据往往难以同时满足空间分辨率和时间分辨率的需求,且易受到外界环境(云层等)的影响[8]。随着农业适度规模经营主体的发展,作物长势监测对光谱数据的需求与当前数据获取平台之间的矛盾越发明显。新兴的无人机平台可以在一定程度上弥补现有卫星平台的不足,近年来被农业领域广泛关注[9-10]。无人机遥感作为一项空间数据采集的重要手段,可快速、准确、无损地获取一定范围内的农田植被覆盖、生态环境、作物长势、病虫草害及作物产量等多方面信息,具有不可替代的优势[11-14]。
在LAI监测方面,通过无人机搭载数码相机PENTAX A40获取低空影像,去除背景提取植被覆盖度,进而可估测LAI[15]。用无人机搭载的FinePix S3 Pro UVIR相机获取小麦冠层影像[16],建立的LAI与影像光谱信息衍生的GNDVI模型的r2达到0.85。除光谱特征外,来自高分辨率RGB影像的纹理特征也在植被重要表型指标的解译中发挥着重要作用,如小麦穗部图像各纹理特征参数值与穗头产量均呈显著相关性[17],森林生物量与多个纹理特征存在较好的相关性[18]。Eckert等[19]认为,相比于植被指数,纹理指数NDTI(MEA800,MEA550)在森林地上部生物量的估测中表现优异,原因是纹理特征可以平滑冠层结构,提升地上部的估测精度。尽管前人的研究证明了利用高分辨率无人机影像提取的光谱与纹理特征在小麦长势监测中的可行性,但是仍缺少光谱与纹理特征融合的LAI估算模型。
在作物产量预测方面,以遥感技术为支撑,对作物大面积产量进行预测,是近年来研究的热点[20-21]。例如,基于无人机平台搭载的高光谱相机提取小麦株高和光谱指数,采用PLSR、ANN和RF回归技术进行建模和验证,结果表明,使用PLSR回归算法将光谱指数和株高组合,可以准确地估测产量[22]。多数研究采用单个生育时期的数据来预测作物产量,模型预测精度及其稳定性都有待提高。而作物产量是一个复杂和不断积累的过程,也有研究尝试采用融合多个生育时期信息的累积植被指数来构建产量预测模型,并证明了累积植被指数可以提高对小麦产量的预测精度[5]。因此,结合作物多个生育时期的多源数据对产量进行估测是提高预测精度的重要途径。
为了实现小麦LAI的快速无损监测和产量估算,本研究在2个地点设置不同施氮水平和小麦品种的田间试验,以形成不同的小麦生长群体,利用无人机搭载的RGB相机获取田间图像,并同步取样测定相同生育阶段的小麦LAI和成熟期的产量数据,利用影像的图谱信息建立不同生育时期小麦LAI和成熟期产量的估算模型,并在不同生态点进行验证以及评估模型的普适性,以期建立一套基于无人机影像的准确自动化的表型参数监测系统,为小麦表型参数研究提供快速、高通量的田间监测技术支撑。
1 材料与方法
1.1 试验地概况
田间试验于2020年10月-2021年6月在安徽省农业科学院作物研究所濉溪县杨柳农业科学实验站(116°44′E,33°37′N)和蒙城县农业科技示范场(116°32′E,33°9′N)进行。前茬作物为玉米,土壤类型为砂姜黑土,小麦播种前0~20 cm耕层土壤中,濉溪县杨柳农业科学实验站土壤pH值为5.83,有机质含量18.69 g·kg-1,全氮含量1.11 g·kg-1,碱解氮含量101.01 mg·kg-1,有效磷含量20.45 mg·kg-1,速效钾含量132.10 mg·kg-1;蒙城县农业科技示范场土壤pH值为7.05,有机质含量20.21 g·kg-1,全氮含量0.74 g·kg-1,碱解氮含量61.07 mg·kg-1,有效磷含量9.43 mg·kg-1,速效钾含量108.85 mg·kg-1。
1.2 试验设计
本研究设置2个独立设计的氮肥梯度试验。
试验1:采用裂区设计,主区为施氮量,设置施纯氮0 kg·hm-2(N0)、90 kg·hm-2(N1)、180 kg·hm-2(N2)、270 kg·hm-2(N3)和360 kg·hm-2(N4)5个施氮水平;副区为品种,分别为15CA73(C1)、中麦578(C2)、中麦255(C3)、济麦22(C4)。每个处理3次重复,小区面积为12 m2(2 m×6 m)。氮、磷、钾肥分别为尿素(N 46%)、过磷酸钙(P2O516%)和氯化钾(K2O 60%)。其中,磷、钾肥施用量分别为90 kg P2O5·hm-2、90 kg K2O·hm-2,全部基施;氮肥60%作为基肥,40%于拔节期作为追肥撒施。小麦人工条播,行距20 cm,基本苗为270万株·hm-2。其他大田管理措施参照当地高产田管理。
试验2:采用单因素随机区组设计,设置6个施氮水平,分别为施纯氮0 kg·hm-2(N0)、162 kg·hm-2(N1)、202.65 kg·hm-2(N2)、243 kg·hm-2(N3)、283.65 kg·hm-2(N4)和324 kg·hm-2(N5)。每个处理3次重复,小区面积为21.6 m2(5.4 m×4.0 m)。氮、磷、钾肥分别为尿素(N 46%)、过磷酸钙(P2O516%)和氯化钾(K2O 60%)。其中,磷、钾肥施用量分别为P2O581 kg·hm-2、K2O 81 kg·hm-2,全部基施;氮肥55%作为基肥,45%于拔节期作为追肥撒施。供试小麦品种为济麦22,机械条播,行距20 cm,播量为187.5 kg·hm-2。其他大田管理措施参照当地高产田管理。
1.3 测定项目与方法
1.3.1 LAI测定
在小麦拔节期、抽穗期、开花期和灌浆期,每个小区随机采集20单茎,使用直尺测量绿叶长度和最宽处的宽度,将二者之积再乘以系数0.83得到每片叶面积,再根据田间单位面积茎数计算LAI[23]。
1.3.2 产量测定
在成熟期,每个小区收获8 m2小麦,脱粒晒干计产,籽粒含水量达13%左右。
1.3.3 无人机影像获取
在小麦拔节期、抽穗期、扬花期和灌浆期获取无人机高空间分辨率影像数据。将数码相机FC300X(DJI-Innovations,深圳,广东,CHN)安装在DJI Phantom 4 Professional无人机(DJI-Innovations,深圳,广东,CHN)上。无人机选择在天气晴朗、无风或微风的条件下10:00-14:00飞行,飞行高度为15 m,分辨率为0.2 cm,自动设置航线飞行,视场角94°,续航时间为5~20 min,定点悬停拍摄,竖直重复率与水平重复率分别为82%和85%。
1.4 影像预处理及光谱和纹理特征提取
RGB影像预处理包括影像拼接、影像配准、影像裁剪等过程。影像拼接在PIX4D mapper软件中进行。由于小麦抽穗后田间植被覆盖率最高,小区特征与土壤差异明显,易于分割,所以选用抽穗期影像实现小区分割,同一地点的不同时期数据均以抽穗期影像为基准进行配准。对配准完成后的所有影像计算灰度共生矩阵(gray level co-occurrance matrix,GLCM),用于提取纹理特征。
1.4.1 小区自动化分割与编号
为解决ROI感兴趣区提取影像信息耗时且费力的问题,采用基于阈值法的图像分割算法实现小区边界的自动化提取。在图像分割之前,在ArcGIS10.0软件中用Exact by mask工具裁剪出试验田区域,避免无关小区的误提取。随后在MATLAB软件中实现影像旋转、提取植被、小区边界提取和标记位置信息,最后对生成的小区按照位置信息从左至右、从上至下的顺序编号,并根据边界信息对各小区进行掩膜处理。
1.4.2 光谱和纹理特征的提取
根据生成的小区边界要素,对配准后的所有时期影像按掩膜保存,分别提取并计算红、绿、蓝波段组合后的植被指数,获得10个光谱特征(表1)。
表1 本研究使用到的光谱特征
灰度共生矩阵涉及三个重要参数即窗口大小、移动步长和移动方向。窗口的大小与图像分辨率有关。较小的窗口代表更细微的纹理特征,而较大的窗口代表粗糙的纹理特征。移动步长取决于图像的纹理粗糙度。纹理特征提取的四个移动方向为0°、45°、90°和135°。在本研究中,按照移动方向为0°、窗口大小为3×3提取了红、绿、蓝三个通道的8个纹理特征,包括Mean、Variance、Homogeneity、Contrast、Dissimilarity、Entropy、Second momen和Correlation(表2),共计提取24个纹理特征。每个小区共计获取34个特征,经相关性分析和显著性分析后,筛选并确定能够指示LAI和产量的关键特征。
表2 本研究使用到的纹理特征
1.4.3 基于机器学习算法的LAI估算
本研究采用随机森林(random forest,RF)、偏最小二乘回归法(partial least squares regression,PLSR)、人工神经网络(artificial neutral networks,ANN)和支持向量机(support vector machine,SVM)4种机器学习算法对小麦LAI进行估算。为确保模型的稳定性和适用性,将两个地点的样本数据分开,其中杨柳点数据用于建模,蒙城点数据用于模型验证。采用决定系数(r2)以及均方根误差(root mean square error,RMSE)作为模型估算精度的评价标准(式1和2),r2越高,表明模型的线性关系越强;RMSE越小,表明模型估算精度和稳定性越高。
(1)
(2)
其中,xi和yi分别是基于不同模型的LAI估算值和实测值。
1.4.4 全生育期的小麦产量估算
本研究将拔节、抽穗、扬花和灌浆4个生育时期的数据结合进行建模。将每个时期的所有光谱特征、纹理特征和对应时期的LAI作为特征输入集合,分别与产量数据进行相关性分析和显著性分析,筛选出最优特征后,运用机器学习算法实现产量的估算。产量估算同样采取独立验证的方法,杨柳点的样本数据用于建模,蒙城点的样本数据用于模型验证。采用r2和RMSE作为模型估算精度的评价标准。
1.5 数据处理
采用Excel 2017进行数据前期整理和基础计算,采用SPSS 23.0进行Pearson相关分析和LSD法显著性分析。
2 结果与分析
2.1 小麦LAI的统计特征
小麦LAI在生育时期间、施氮量间及品种间均存在差异(表3)。总体上,4个品种的LAI在拔节至抽穗期呈上升趋势,在扬花期有所下降,灌浆期的LAI最低。在同一时期,4个品种的LAI总体上随施氮量的增加而增加。在同一施氮水平下,中麦255的LAI明显大于其他品种。
表3 小麦不同生育时期的实测LAI
2.2 小麦不同生育时期LAI与光谱、纹理特征的相关性
对所选取的10种光谱特征、24个纹理特征与不同生育时期的LAI数据进行Pearson相关分析,结果(图1)表明,灌浆期的相关性总体上表现最好,其中GRVI、ExR、VARI、RGRI、GRRI、MGRV1、MEAB1的相关系数绝对值均超过0.8,且都达到极显著水平(P<0.01)。拔节期、抽穗期的相关系数也较高,其中GRVI、ExR、ExG、ExGR、VARI、RGRI、GRRI、MGRVI、CORB2、CORB3的相关系数绝对值均在0.7以上。扬花期的相关性整体表现最差,HOMB2的相关系数绝对值最高,为0.66。在拔节期、抽穗期和灌浆期,与LAI相关性较高的特征为光谱特征,10种光谱特征的相关系数绝对值都高于0.6,最高达0.82。但是与扬花期LAI相关性最高的特征为纹理特征,光谱特征最高相关系数仅达到0.54。
图1 小麦不同生育时期LAI与光谱、纹理特征的相关性
不同生育时期的光谱、纹理特征与LAI的相关性表现不同,但总体上相关性较强,可优选特征以构建小麦LAI估测模型。最终,去除不显著特征外,基于拔节期LAI的估算模型的输入特征为GRVI、GLE、MEAB1等22个,基于抽穗期LAI的估算模型的输入特征为GRVI、ExR、ENTB1等16个,基于扬花期LAI的估算模型的输入特征为VARB1、HOMB1、CONB1等12个,基于灌浆期LAI的估算模型的输入特征为GRVI、GLA、MEAB1等18个。
2.3 小麦产量与遥感特征、LAI的相关性
从图2可以看出,光谱特征和纹理特征都可以有效指示小麦产量,不同生育时期的特征与产量的相关性存在显著差异。扬花期的所有光谱特征相关性都低于其他时期,相关系数绝对值在0.19~0.72之间。拔节期、抽穗期和灌浆期的光谱特征较为一致,均表现为GRVI、ExR、ExGR、VARI、RGRI、GRRI和MGRVI的相关性最高,相关系数绝对值均在0.83以上,其中抽穗期的光谱特征VARI与产量的相关性最高,相关系数值达 0.86。与产量相关性最低的纹理特征大多出现在抽穗期与灌浆期,最低为抽穗期的CONB1,相关系数仅为0.01。拔节期的纹理特征MEAB1与产量的相关性最高,相关系数达-0.88。另外,四个时期的LAI均与产量具有较高的相关性,相关系数分别为0.70、0.83、0.85和0.83,且扬花期的相关性最高,表明加入LAI对于产量的估算是很有必要的。去除相关系数绝对值低于0.5的特征,最终作为产量估算的输入特征共计94个,其中来自于拔节期、抽穗期、扬花期和灌浆期的特征分别为28、19、24和23个。
图2 小麦产量与各时期遥感特征及LAI的相关性热图
2.4 基于机器学习的小麦LAI估算和验证结果
从表4和图3可以看出,在不同生育时期,4种算法下构建的LAI估测模型精度不同。从建模结果看,各生育时期的模型均具有较高的拟合性。对于任一生育时期,RF的建模精度都最高,拔节期、抽穗期、扬花期和灌浆期建模的r2分别为0.93、 0.88、0.84和0.93。基于PLSR的模型拟合效果最差,r2在不同生育时期分别为0.55、0.75、0.54和0.80,对应的RMSE也最差,分别为1.65、1.80、3.01和1.30。基于RF的建模结果,灌浆期的模型拟合效果最好,r2和RMSE分别为0.93和0.69。拔节期、抽穗期和扬花期模型的r2和RMSE依次降低。
RMSE1、RMSE2、RMSE3和RMSE4分别指拔节期、抽穗期、扬花期和灌浆期的RMSE。
表4 小麦不同生育时期LAI建模精度和验证结果
从模型的验证效果看,RF模型在四个时期中的验证效果均最好,RMSE分别为2.26、1.44、1.73和1.02,模型预测能力最高。值得一提的是,灌浆期的建模与验证结果都有最优的表现,建模集的RMSE最低为0.69,验证集中为1.02。
综上,RF模型在各生育时期不仅具有较高的建模精度,并且在不同生态点也得到了较高的验证精度。RF模型表现出较高的稳定性,可作为小麦各生育时期LAI的最优估算模型。
2.5 基于机器学习的小麦产量估算和验证结果
从表5可以看出,在4种机器学习算法下构建的产量模型表现明显出差异。从建模结果看,RF的建模精度最高,其r2达到0.89,RMSE为0.79 t·hm-2;BPNN和PLSR精度次之,r2分别为0.78和0.75,RMSE分别为0.86和0.82 t·hm-2;SVM的建模精度最差,其r2和RMSE分别为0.56和0.89 t·hm-2。从模型的验证效果看,RF模型的验证效果最好,RMSE为1.17 t·hm-2,模型预测能力最高。BPNN和PLSR模型精度次之,RMSE分别为1.26和1.27 t·hm-2。BPNN模型预测能力表现较差,RMSE为1.32 t·hm-2。在产量估算方面,基于RF的估算模型仍被证明其普适性最优。
表5 不同机器学习算法下小麦产量的建模和模型验证效果
图4为基于RF模型对蒙城试验区小麦产量估算的结果空间分布图。通过田块尺度的遥感制图可看到小麦在不同氮肥处理下的最终产量的空间分布特征,即小麦产量随着氮素水平的升高而增加,自N3水平以上的产量都高达7.6 t·hm-2,N0处理下小麦产量最低,在4.0 t·hm-2以下。模型估测值与实测值相一致,进一步说明本研究数据提取和建模方法的可靠性。
图4 小麦产量的空间分布图
3 讨 论
利用无人机遥感获得的作物冠层光谱可提取作物生长状况信息,进而开展不同方向的研究。LAI是反映作物冠层结构的一个重要参数,关系到作物的光合作用、蒸腾作用、水分利用及生物量变化。有研究表明,利用无人机影像提取植被覆盖度的方法可以反演LAI[15],但是对于小麦LAI却不适用,因为小麦在生育后期的植被覆盖度较为稳定,但LAI却随生育进程显著降低。基于绿色植被在可见光区域的光谱响应特性,颜色光谱指数在植被遥感中常被用于监测LAI。因此,本研究选用了常用的10种颜色植被指数,筛选出对小麦LAI最敏感的植被指数。其中,GARI在不同时期都表现出与LAI较高的相关性。GRVI是关于红波段与绿波段的颜色植被指数,再次被证明与植被覆盖度和LAI紧密相关[33]。同时,图像纹理可以表示图像的均匀、细致、粗糙等现象。前人研究表明,光谱特征和纹理特征的结合能够提高作物地上部生物量、LAI和叶片氮含量的估计精度[34]。因此,本研究还提取了纹理特征作为小麦LAI估算的另一输入特征集。从图1可以看出,纹理特征部分与LAI的相关性矩阵图呈现出有规律的排布,即纹理特征在红、绿、蓝不同通道间存在相似性。但是总体上来自红色通道的纹理特征与LAI的相关性较强,表明红色通道的灰度信息对LAI反演的贡献更大。作物产量是农业科学的研究核心,不断提高产量预测精度是作物生长监测预测的主要目标之一。目前,作物产量遥感预测的方法主要是利用植被指数与产量的定量关系,构建产量预测模型[35]。前人已经确定了小麦产量预测的最佳生育时期和遥感参数,如利用无人机影像提取的NDVI在抽穗期与产量有较好的相关性[36],小麦产量与灌浆期的光谱参数相关性高于开花期和挑旗期[37]。另外,还可以结合不同分辨率RGB影像估测作物产量[38],同时结合多种传感器(数码相机、多光谱相机和热红外相机)可以提高作物产量估测精度。鉴于产量的形成是一个累积的过程,并且生育后期的数据对产量预测的准确性更高,本研究综合四个时期的所有与产量相关的特征,进而建立产量预测模型。从小麦产量与遥感特征、LAI的相关性看,并非是某一个时期与产量的相关性最高,拔节、抽穗、扬花和灌浆期都存在与产量相关性较高的特征,表明不同时期的生长信息都可能会对最后的产量预测做出贡献。光谱特征与最终产量的相关性普遍大于纹理特征,这是因为作物光谱反射特性能够直接反映出作物在不同生长阶段表现出的不同的色素组分及其含量、水分含量、叶片细胞结构、冠层形态结构等的变化,这些变化是影响最终产量的最直接因素,而纹理特征是通过研究灰度图像的空间相关特性,间接建立其与产量的相关关系,其对于捕捉作物生长过程中生理生化、形态结构变化的敏感性不如光谱信息。
作物生长参数估算的建模方法可分为基于少数特征波段的统计回归法、基于多特征的机器学习法、基于辐射传输模型的机理监测法、模型-遥感耦合法等。其中,统计回归法是生长参数监测上最常用的建模方法。经验模型公式简单,易于理解和使用,但未充分挖掘丰富的光谱信息,模型的迁移性不强。基于辐射传输模型的物理反演方法可以通过输入叶片或冠层的反射率,来反演LAI,机理性较强[39-40],但原理较复杂,需结合一定的先验知识才能得到较好的效果。遥感与模型的耦合能够将遥感的实时性、区域性与作物生长模型的机理性、预测性优势互补,模型-遥感耦合法成为大尺度作物生产力预测的关键手段[41-42],但需要一定的作物生长模型运用经验。机器学习算法在海量数据处理上能力较强,且能更加充分利用数据中的潜在信息,尤其是生长参数与光谱参数之间的非线性关系[43-44],从而能够获得更高的监测精度。因此,本研究选用RF、PLSR、BPNN和SVM四种常用的机器学习算法作为小麦LAI和产量的建模方法,旨在确定最佳的高精度监测模型。结果表明,RF模型在LAI和产量估算中都表现最好,与周萌等[45]的研究结果一致,并且RF模型的可迁移性也都优于PLSR、BPNN和SVM模型。RF作为一种集成学习算法,集成了多个决策树模型的结果,建模效果会更好,并且模型抗噪声能力也优于其他模型。
4 结 论
准确监测小麦长势的动态变化并及时预测产量,对精确农业的管理调控具有重要意义。本研究基于同年度不同生态点的小麦LAI、产量和无人机RGB影像数据,使用四种常用的机器学习算法构建小麦LAI和产量估算模型。小麦不同生育时期的植被指数与LAI具呈现较强的相关性,其中灌浆期的相关性最高,相关系数绝对值最高达0.8以上,并且基于RF机器学习算法的灌浆期LAI估测模型的验证精度也最高,RMSE为1.02。此外,基于RF的产量预测模型具有较高的建模精度,在不同生态点也获得较高验证精度,验证RMSE为1.17 t·hm-2。