APP下载

基于无人机数码影像的棉叶螨严重度监测*

2022-08-12郭伟高春凤乔红波李成伟张枫张慧

中国农机化学报 2022年8期
关键词:植被指数棉花叶片

郭伟,高春凤,乔红波,李成伟,张枫,张慧

(河南农业大学信息与管理科学学院,郑州市,450046)

0 引言

棉花是中国最主要的经济作物之一,主要分布在新疆、长江流域和黄河流域[1],而新疆作为我国棉花的主要生产基地,在出单总量、出口率等方面已经连续27年保持全国第一[2]。棉叶螨俗称红蜘蛛,是棉花生产过程中的主要害虫之一,棉叶螨的大规模爆发对棉花的产量、质量危害极大[3],因此实施大面积的快速精准监测是进行有效防控的关键措施。叶绿素主要用于植物的光合作用,叶绿素含量与植被营养胁迫、农作物生长及发育状况、植物病虫害等密切相关,是农作物长势监测的重要指标[4-7]。Marenco等[8]通过研究发现使用SPAD叶绿素仪测量叶绿素含量精度很高,表明可使用SPAD来代替叶绿素含量。

传统病虫害监测主要依靠人工调查,影响虫情监测的及时性和精准性,导致长期大量滥用农药防治,增加害虫耐药性、污染环境[9-10]。近年来,遥感技术以快速、无损等优势广泛应用于作物的生理化参数反演[11]。卫星遥感监测虽然具有覆盖面广、数据易获取等优势,但存在时域长、光谱分辨率和空间分辨率相对较低、易受大气干扰等问题,其反演精度不足以满足精准农业的要求[12]。无人机遥感技术凭借价格低廉、机动灵活、不受卫星过境时间和天气影响、时空分辨率高等优势而逐渐成为农情监测的又一重要手段[13]。王丽爱等[14-17]基于无人机多光谱影像,计算多光谱植被指数,估测小麦叶片、番茄冠层、小麦冠层和玉米冠层的叶绿素含量,均达到了较好的估算结果。田明璐等[18]利用无人机高光谱数据构建棉花叶片SPAD反演模型,研究发现采用偏最小二乘回归(Partial Least Squares Regression,PLSR)模型反演精度最高。无人机搭载高光谱、多光谱和激光雷达传感器设备可快速、便捷、高效地用于作物生理化参数反演和病虫害监测,但由于传感器价格昂贵,并且后续数据处理相对复杂,使无人机遥感平台的发展受到一定制约。数码相机因具有智能化、价格低、空间分辨率高等特点,使得无人机遥感数据获取平台得到快速的发展。孟沌超等[19]利用无人机可见光影像估测玉米叶绿素相对含量,研究发现基于植被指数+纹理特征作为输入的PLSR模型效果最优。陈向东等[20]将可见光植被指数阈值法与直方图相结合的新方法用于夏季玉米的植被覆盖度提取,发现利用过绿指数(Excess Green,EXG)来描述植被覆盖度效果最佳。戴建国等[21]通过无人机可见光影像,建立农作物分类模型,结果表明支持向量机分类方法精度最高。吴智超等[22]利用颜色转换空间HSI(H-A法)从无人机数码影像中快速提取马铃薯覆盖度,精度较高。刘帅兵等[23]基于无人机数码影像采用多元线性回归算法,结果表明整体提取试验小区作物信息是反演冬小麦叶氮含量的最佳方式。

无人机遥感已经广泛应用于作物生化指标反演,但利用可见光影像进行作物病虫害的空间监测及严重度估测研究较少。本研究旨在利用无人机数码影像提取多种可见光植被指数,构建基于偏最小二乘回归(PLSR)、BP神经网络(Back Propagation Neural Network,BPNN)和随机森林(Random Forest,RF)的棉花冠层叶片SPAD值遥感估测模型,并研究棉叶螨严重度与棉花冠层叶片SPAD值之间的关系,建立棉叶螨严重度估测模型,绘制试验区棉叶螨严重度空间分布图,以便为新疆棉花种植的高产和病虫害防治提供技术支持,实现大区域棉田棉叶螨的快速高效监测。

1 材料与方法

1.1 研究区概况

研究区位于新疆维吾尔自治区库尔勒市的中国农业科学院植物保护研究所试验区,地处北纬41°44′58″~41°45′0″,东经85°48′23″~85°48′27″,库尔勒市位于欧亚大陆和新疆中部,塔里木盆地东北边缘,气候类型属于温带大陆性干旱气候,年日照时间充足、昼夜温差大、年积温高、降水量低[24],为棉花生长提供了适宜的自然条件,是新疆地区的重要产棉区之一,植棉面积占耕地面积的70%以上。试验区供试棉花品种为中棉所49,进行田间标准化管理,田间自然发生棉叶螨胁迫行为,期间不做人为干预。

1.2 数据收集与分析

1.2.1 无人机遥感数据获取与预处理

无人机平台为大疆Phantom 3 Pro四旋翼无人机,配备Sonny Exmor R CMOS影像传感器。无人机及传感器参数如表1所示。

表1 Phantom 3 Pro飞行平台的技术参数Tab. 1 Technical parameters of Phantom 3 Pro flight platform

无人机数码影像数据于2020年7月29日、2020年8月3日、2020年8月8日、2020年8月13日、2020年8月18日棉花蕾期棉叶螨较严重时期获取,共飞行5次,每次飞行间隔5天,所有飞行均在晴朗、无风、无云的天气进行,飞行时间为上午12:00~14:00,获得的影像基本不受大气因素的影响,5次飞行的飞行航线和参数相同。试验区在地面设置9个地面控制点(GCP),并采用纳米级全球定位系统(GPS)记录GCP经纬度,为后期正射校正做参考。使用Altizure软件进行航线规划,飞行航高30 m,航行速度6 m/s,航向重叠度为80%,旁向重叠度为60%,拍摄时云台相机保持垂直向下,稳定拍摄。采用Pix4Dmapper软件拼接无人机可见光影像,并导入GCP定位信息,最终获取数字正射影像(DOM)。

1.2.2 地面数据采集

依据新疆棉田的实际情况,棉叶螨发生为害后与国家标准存在一定差异,本文将棉叶螨严重度等级[25]重新划分,如表2所示。

表2 棉叶螨严重度划分标准Tab. 2 Classification standard of cotton spider mite severity

地面调查数据的采集与无人机的飞行工作同步开展。本次试验设置5天一期,每期采集80个样点,共400个样点。使用天宝Trimble GeoExplorer 6000 Series设备记录样点的GPS信息,其误差在2 cm左右。在研究区内均匀布设采样点,覆盖整个研究地块。采用SPAD-502型手持式叶绿素仪同步测量棉花冠层叶片SPAD值,在每个调查样点中心范围内选取周围5株,每株随机选取冠层5个棉叶测量SPAD值,在不同的部位测量3次并求平均值,最终取5个叶片的平均值作为该样点的SPAD值,同时记录样点螨害严重度信息。5个时期共测SPAD数据和螨害调查数据400个,最终筛选保留200个棉花冠层叶片SPAD值数据和螨害调查数据。

1.3 数据处理

将预处理后的DOM影像归一化,R、G和B表示红、绿和蓝通道的DN值,r、g和b表示归一化后的可见光波段[26]。

(1)

(2)

(3)

除利用数码影像的3个原始波段和3个归一化波段外,结合以往农作物病虫害遥感监测研究成果选择常用的14个植被指数作为棉叶螨害监测的初选特征因子。表3为20个植被指数的名称、计算公式和参考文献。

表3 植被指数Tab. 3 Vegetation index

1.4 数据分析与模型选择

1.4.1 特征选取算法

ReliefF算法是一种特征权重算法,权重越大,表示该植被指数对棉花冠层叶片SPAD值估测的贡献度越高,反之亦然。Pearson相关系数表征植被指数与棉花冠层叶片SPAD值的线性相关关系。相关系数的绝对值越大,说明该植被指数与棉花冠层叶片SPAD相关性越强。本文采用ReliefF-Pearson方法计算各植被指数与棉花冠层叶片SPAD值的权重以及相关性,消除冗余特征来提高模型的准确性,并减少其计算复杂度。

1.4.2 建模方法

1) PLSR模型通过最小化误差的平方和找到一组数据的最佳函数匹配,包含多元线性回归、典型相关分析与主成分分析,该方法能够很好地解决选取的自变量存在共线性的问题,并且在减少变量个数的同时,能够在最大程度上揭示出反映棉花冠层叶片SPAD值变化的主控因子,使建立的棉花冠层叶片SPAD遥感估测模型具有更好的鲁棒性。

2) BPNN模型利用误差逆传播算法训练多层前馈网络,采用最速下降法的学习规则,通过反向传播不断地调整网络的权值和阈值,使误差平方和达到最小。BP神经网络拓扑结构为输入层、隐含层和输出层,本研究使用的BPNN模型的网络训练函数设置为“trainlm”,传递函数设置为“tansig”,训练次数设置为10 000,学习速率为0.001,训练目标最小误差为0.000 01。BP神经网络具有较强的非线性映射能力、高度自学习和自适应的能力和泛化容错能力。

(4)

(5)

式中:Sj——第j个神经元的净输入值;

m——输入层节点数目;

wij——节点i和节点j之间的权值;

xi——节点i的值;

bj——节点j的阀值;

E(i)——单个样本的误差函数;

n——输出层节点数目;

dj——第j个神经元的期望输出;

yj——第j个神经元的输出。

3) RF模型采用随机的方式创建一个森林,其中包含多个决策树,且彼此之间无关联性。采用自助(bootstrap)法重采样技术,在S个原始样本中,抽取自助样本集S1个,每次抽取后放回,构建S1棵回归树,其余样本作为S1个袋外数据集;在训练决策树节点时,从全部的p个特征中,随机抽取k个(其中k

本文在使用RF模型时通过选取的自变量个数和模型参数的调整,将决策树数量和分割节点随机变量数设为1 000和2。随机森林算法无需考虑选取的变量间的多重共线性问题,也不必进行变量选择,对离群值不敏感,学习过程快。

1.4.3 精度评估指标

使用决定系数R2和均方根误差RMSE评估棉花冠层叶片SPAD值遥感估测模型的准确性。

(6)

(7)

式中:n——数据量;

yi——实测SPAD值;

上述两种模型精度验证指标中,R2的值越大,说明模型的拟合度越好,RMSE的值越小,说明模型的精度越高,模型的预测性能越好。

2 结果与分析

2.1 植被指数和棉花冠层叶片SPAD值的关系

模型构建时筛选出对棉花冠层叶片SPAD值较为敏感的植被指数,可以提高模型精度,也可以有效去除不相关变量和冗余变量,提升模型的鲁棒性。基于ReliefF算法的20种植被指数的特征权重排列情况如图1所示。由图1可以看出植被指数G-B权重最高,其次分别为GBRI、NGBDI和b。为增加所选植被指数的可靠性,将20种植被指数与棉花冠层叶片SPAD值作Pearson相关性分析,表4列出了各植被指数与棉花冠层叶片SPAD值的相关性分析结果,其中GBRI与SPAD值的相关性最高,达到0.789,G-B、GBRI、NGBDI与棉花冠层叶片SPAD值显著相关(r>0.7)。综合分析两种筛选变量算法的结果,最终选取G-B、GBRI、NGBDI作为最终特征参与模型构建。

图1 基于ReliefF算法的植被指数的特征权值Fig. 1 Characteristic weights of vegetation index based on ReliefF algorithm

2.2 不同棉叶螨严重度的棉花冠层叶片SPAD值变化分析

基于筛选保留的200个棉花冠层叶片SPAD值数据和相对应的螨害严重度数据,对不同棉叶螨严重度的棉花冠层叶片SPAD值求取平均值,分析不同棉叶螨严重度的棉花冠层叶片SPAD值的变化情况。结果见图2,受害棉株的棉花冠层叶片SPAD值受螨害等级的影响,并且随着螨害严重度的增加,棉花冠层SPAD平均值逐渐下降,棉花冠层SPAD值与棉株螨害严重度呈明显的负相关关系,R2=0.939 5,且4个严重度间的棉花冠层叶片SPAD值无交叉区间,结果表明可以利用棉花冠层叶片SPAD值的变化来监测棉叶螨的严重度。

表4 植被指数与棉花冠层叶片SPAD值的相关性分析结果Tab. 4 Correlation analysis between vegetation index and SPAD value of cotton canopy leaves

图2 棉叶螨严重度与棉花冠层叶片SPAD值的关系Fig. 2 Relationship between severity of cotton spider mite and SPAD value of cotton canopy leaves

2.3 棉叶螨严重度监测模型的构建与分析验证

通过RelieF-Pearson算法得出20种植被指数反映棉花冠层叶片SPAD值的权重以及与棉花冠层叶片SPAD值的相关性分析结果,选定其中3个植被指数G-B、NGBDI、BGRI为自变量,以棉花冠层叶片SPAD值为因变量,构建PLSR、BPNN、RF棉花冠层叶片SPAD值估测回归模型,将最终保留的200个棉花冠层叶片SPAD值数据划分为140个建模集数据和60个验证集数据,表5列出3种模型的分析结果,3种棉花冠层叶片SPAD值估测模型中,SPAD估测值与SPAD实测值均表现为极显著相关,训练集和验证集的R2和RMSE都达到预期要求。

表5 各个棉花冠层叶片SPAD估测模型分析结果Tab. 5 Analysis results of SPAD estimation model of cotton canopy leaves

图3为各个模型的棉花冠层叶片SPAD值的估测回归结果。综合考虑建模集和验证集的R2和RMSE,RF模型效果最佳,表明利用RF的SPAD估测模型能间接反映出棉叶螨严重度。

(a) PLSR模型

(b) BPNN模型

(c) RF模型图3 各个棉花冠层叶片SPAD值估测模型验证结果散点图Fig. 3 Scatter diagram of SPAD value estimation model verification results of cotton canopy leaves

2.4 棉叶螨病害严重度空间监测

利用研究区2020年7月29日、2020年8月3日、2020年8月8日、2020年8月13日和2020年8月18日五期无人机数码影像为底图,以单个像元为基本处理单元,采用ReliefF-Pearson方法筛选出的G-B、NGBDI、BGRI三个可见光植被指数作为特征集,输入随机森林模型,构建棉花冠层叶片SPAD遥感估测模型,得到研究区棉花冠层SPAD空间分布情况,最终得到研究区棉叶螨严重度空间分布图如图4所示。由图4可以看出,随时间的推移,螨害为害区域明显增加且为害程度逐渐加深,通过实际调查数据分析,本次研究较真实地反映出螨害分布的实际情况,通过五期影像数据和实际调查数据,本研究实现了棉叶螨为害情况及严重度的动态监测,为利用无人机遥感来监测棉叶螨为害情况提供了一种可行方法。

(a)

(b)

(c)

(d)

(e)图4 五期影像的棉叶螨严重度空间分布图Fig. 4 Spatial distribution map of cotton spider mite severity in phase V images

3 结论

为快速、实时、准确地了解研究区棉田棉叶螨的发生情况,本研究利用无人机数码影像的3种可见光植被指数,使用随机森林方法构建了不同棉叶螨严重度的棉花冠层叶片SPAD值的遥感估测模型和棉叶螨严重度遥感估测模型,建立了一种快速动态的棉叶螨严重度监测方法。

1) 将20种可见光植被指数与棉花冠层叶片SPAD值进行相关性分析,结果表明植被指数G-B、BGRI和NGBDI与棉花冠层叶片SPAD值达到极显著相关水平(r>0.7)。

2) 基于选择的140个训练集数据分别建立棉花冠层叶片SPAD值遥感估测模型,剩余的60个验证集数据用于验证各个棉花冠层叶片SPAD值估测模型,结果显示,以G-B、BGRI和NGBDI作为输入的RF模型精度最优,建模集的R2和RMSE分别为0.86、1.66,验证集的R2和RMSE分别为0.74、2.13。该模型可实现棉田棉叶螨的快速有效监测。

3) 随着棉叶螨严重度的增加,棉花冠层叶片SPAD值逐渐下降,棉叶螨严重度和棉花冠层叶片SPAD值之间存在极显著的负相关关系,且4个为害严重度间棉花冠层叶片SPAD值无交叉区间,表明可以通过监测棉花冠层叶片SPAD值的变化来间接监测棉叶螨为害情况。

4) 以多期无人机数码影像为数据源,采用最佳模型随机森林模型进行研究区棉花冠层叶片SPAD值估测,可间接实现对螨害严重度的空间动态监测。

5) 由于技术不成熟和实测调查数据的限制,采集数据的好坏会直接影响到估测模型的精度,本次试验也有很多不足的地方,首先研究区域较为单一,仅限于新疆库尔勒市的中国农业科学院植物保护研究所试验区,且对单一棉花品种的棉叶螨为害情况进行了研究,缺乏普适性,还需要针对不同地区,更多的棉花品种以及不同的作物品种(小麦、玉米、水稻等)进行验证。另外仅比较了3种机器学习方法来估测棉花冠层叶片SPAD值从而实现棉花螨害监测,而深度学习在植物病虫害分类和监测等领域应用前景更为广阔,下一步需要进一步探索深度学习等方法在植物病虫害及植物生长监测方面的潜力。

猜你喜欢

植被指数棉花叶片
棉花是花吗?
基于改进Mask R-CNN模型的植物叶片分割方法
我国10 MW风电机组叶片长度创世界纪录
我的植物朋友
雪白的棉花堡
浅谈植被指数的分类与应用
不可思议的棉花糖小村(上)
心中的“棉花糖”