基于无人机影像多时相的小麦品种氮效率分类识别
2024-05-14臧少龙刘淋茹高越之吴珂贺利段剑钊宋晓冯伟
臧少龙,刘淋茹,高越之,吴珂,贺利,3,段剑钊,宋晓,冯伟,3
基于无人机影像多时相的小麦品种氮效率分类识别
1河南农业大学农学院,郑州 450046;2河南省农业科学院植物营养与资源环境研究所,郑州 450002;3国家小麦工程技术研究中心,郑州 450046
【目的】探索无人机遥感在氮效率分类识别中的潜力,构建小麦品种氮效率分类方法,为氮高效品种筛选提供理论依据和技术支持。【方法】通过6个成熟期与氮效率密切相关的农学指标(产量、植株氮积累、氮素生理利用效率、植株干生物量、籽粒总吸氮量、N收获指数)构建主成分综合值,并对其进行K-Means聚类分析,将121个小麦品种划分为氮高效型、氮中效型和氮低效型3种类型。利用无人机遥感平台搭载多光谱相机,在小麦拔节期、孕穗期和开花期获取无人机遥感影像,并提取34种植被指数,分析植被指数与氮效率综合值的相关性;对比支持向量机(SVM)、随机森林(RF)和K最近邻(KNN)分类方法的氮效率分类模型精度,使用总体分类精度(OA)和Kappa系数比较不同生育时期下小麦品种氮效率分类识别的能力;并使用3种不同的特征集筛选方法(ReliefF算法、Boruta算法和RF-RFE算法)对优化的特征子集进行综合评价,确立适宜的小麦品种氮效率分类识别方法。【结果】随着小麦生育时期的不断推进,植被指数与氮效率综合值的相关性逐渐提高,开花期最高(=0.502);利用植被指数全特征集对小麦品种氮效率进行分类,对于单生育时期数据而言,以开花期的SVM模型分类效果最好(OA=77.1%,Kappa=0.591),拔节期最差(OA=65.6%,Kappa=0.406);总体而言,多生育时期数据融合的品种氮效率分类精度高于单生育时期,其中以拔节期+孕穗期+开花期3个生育时期数据融合的SVM模型的分类效果最优(OA=80.6%,Kappa=0.669)。为减少多生育时期数据融合的特征集变量数量,比较分析RF-RFE、Boruta和ReliefF 3种算法的特征优化效果,基于RF-RFE算法得到的优化特征子集分类精度最高,其OA和Kappa系数比全特征集分类模型分别提高了4.0%和10.1%,其中,以3个生育时期数据融合的分类效果最好(OA=85.4%,Kappa=0.749)。【结论】确立6个氮效率指标—主成分分析—K-Means氮效率评价方法;RF-RFE算法有效优化多生育时期组合的特征子集数量,且获得较高的分类精度,确立基于多生育时期组合—RF-RFE—SVM技术融合的小麦品种氮效率分类模型,为小麦氮高效品种的快速准确分类鉴定提供理论依据和技术支撑。
冬小麦;无人机;植被指数;生育时期;特征筛选;氮效率分类
0 引言
【研究意义】氮(N)是小麦必需的三大营养元素之一,在光合作用、能量同化和传递、形态构建和干物质合成中发挥着重要作用[1]。合理施用氮肥可以促进小麦健康生长发育,最终达到增加产量、优化品质的目的,但过量施用则会导致氮肥效率下降及环境污染问题,如硝酸盐淋洗、氧化亚氮排放等[2]。因此,筛选或培育能够高效吸收利用氮素的小麦品种,对于小麦产业的可持续健康发展具有十分重要的意义。【前人研究进展】作物氮高效品种筛选在不同时期表现不尽相同,大多数学者选择在苗期[3-5]或成熟期进行。在苗期进行作物氮高效品种筛选具有简单、快速且不受时间和空间影响等优点,但小麦氮素利用效率往往是随作物生长而不断发生变化的,因此,在成熟期进行筛选其结果往往更加合理可靠。宋晓等[6]以产量、籽粒吸氮量、植株氮积累量等农学指标为依据,利用主成分分析筛选出10个高产氮高效品种。张盼盼等[7]综合考虑产量和氮效率表现,从黄淮海地区主推的玉米品种中筛选出2个高产氮高效品种。朱新开等[8]、李艳等[9]研究认为,成熟期籽粒产量、籽粒氮素积累量等可作为筛选小麦氮高效材料的有效指标。目前,作物氮高效品种评价筛选多以成熟期籽粒产量、生物学干重、植株氮素积累量等指标进行综合分析,有效消除个别指标的片面性,大大提高氮高效品种筛选的准确性和可靠性,但国际上尚没有固定的氮效率测评体系。以上传统的氮效率评价均以人工地面调查分析氮效率相关性状为基础,费工费时且低效,因此,亟需探索一种适应大田尺度下高通量筛选氮高效品种的新模式及方法。无人机可以实时获取作物冠层的光谱信息、纹理信息及温度信息,已作为一种高通量、快速无损监测手段在作物长势监测及资源评价方面发挥重要作用。无人机的光谱信息主要以植被指数(VIs)的形式应用。VIs可以表征作物的冠层光谱特征,是估算作物表型参数最简单、最有效、研究最广泛的方法[10-11]。朱婉雪等[12]利用无人机获取小麦不同生育时期多光谱影像,应用9个VIs精确评估产量变异状况;刘畅等[13]基于无人机影像解析及植被指数快速提取,采用多元逐步回归法快速反演小麦生物量;郭燕等[14]利用遥感影像提取的植被指数,结合机器学习算法快速估算小麦植株氮积累量;刘涛等[15]基于无人机多光谱影像,采用人工神经网络模型成功反演小麦叶绿素含量。与遥感估算产量及监测长势相比,利用无人机影像快速鉴定氮高效品种以及精确评估作物氮效率状况的研究较少。董德誉[16]利用无人机多光谱遥感影像构建产量、氮肥利用效率等与氮效率相关性状的估算模型,然后对其预测值进行聚类分析,鉴定出氮高效小麦品种;YANG等[17]利用安装在无人机上的多光谱相机评估了小麦氮素利用效率。前人研究表明利用无人机遥感技术在作物氮高效品种筛选识别方面具有很好的应用潜力,但仍存在监测时期单一导致模型适应性差、影像特征多计算效率低的问题,这在一定程度上限制了研究结果的生产应用。前人研究利用单一或少量特征进行物种分类识别,分类效果不尽如人意,而利用较多特征分类又会造成数据冗余等问题[18],因此对于高维数据来说,特征选择是必要的。周小成等[19]利用无人机采集可见光遥感数据,通过递归特征消除随机森林算法(RF-RFE)对多特征集进行特征优化选择,有效提高了森林资源的分类精度;LI等[20]利用Boruta算法对无人机可见光图像进行特征选择获得最佳的特征子集,对甘蔗倒伏鉴定具有较高的准确率(94.0%);梁加玲等[21]利用ReliefF算法有效去除无关特征的影响,提高了遥感影像的分类精度。【本研究切入点】目前,将无人机遥感影像用于作物氮效率鉴定分类的研究还较少,尤其利用无人机在作物生育前期直接对品种氮效率进行鉴定分类的研究还未见有报道。利用无人机可以获取作物多生育时期影像数据,时间和空间分辨率高,相较于单生育时期影像数据,多生育时期融合数据反映与植株氮素吸收转运有关的冠层形态及生理信息更加丰富。但大量信息无疑会产生一定的冗余,影响后续结果的准确性及应用性。为有效减少影像包含的无关或微妙的光谱信息,准确高通量鉴定识别作物氮高效品种类型,很有必要对数据进行降维处理,从而达到减少特征个数、提高模型精度、减少运行时间的目的。不同的特征选择方法其筛选特征的标准不尽相同,不同的监测对象其适用的特征选择方法也有差异,因此有必要进一步探索适用于小麦氮高效品种筛选鉴定的无人机遥感影像特征筛选方法。【拟解决的关键问题】为筛选并培育氮高效品种,优化我国小麦种质资源,减少氮肥用量、稳定产量和保护生态环境,以无人机多光谱遥感影像为数据源,开展特征集筛选方法与鉴定分类方法相融合的小麦品种氮效率分类识别研究。内容具体包括:(1)建立简单快捷、可靠的小麦氮高效品种农学评价筛选方法;(2)比较单生育时期特征集与多生育时期融合特征集在小麦品种氮效率分类识别中的差异;(3)评估不同特征优化算法对分类精度的影响,构建小麦品种氮效率最优分类模型,为快速筛选鉴定小麦氮高效品种提供参考和技术支持。
1 材料与方法
1.1 试验设计
试验于2020—2021年和2021—2022年连续两个年度在河南省荥阳市广武镇河南赛德种业有限公司育种站(34°38′N,113°41′E)以及2022—2023年在河南省新乡市原阳县河南农业大学试验基地进行(35°6′N,113°56′E),试验田的地理位置和土壤基础肥力情况见图1。供试小麦品种共121个,均为适宜黄淮地区种植的主推品种(表1)。试验小区随机区组排列,每个品种3次重复,试验小区长5.0 m,宽1.2 m,6行区,行距0.2 m。所有小麦品种在10月中旬播种,小区基本苗保持在330 万/hm2左右。肥料选择氮肥为尿素(含N 46%)、磷肥为磷酸二氢钙(含P2O512%)、钾肥为硫酸钾(含K2O 57%),每个小区施N 225 kg·hm-2、P2O5112.5 kg·hm-2、K2O 112.5 kg·hm-2。氮肥分基肥和追肥(拔节期)两次施入,基追比为5﹕5,磷肥和钾肥全部作为基肥一次施入。试验田采用统一的种植方式、水肥管理及病虫防治。
1.2 研究方法
氮高效是多种氮效率指标相互作用呈现的一个复杂综合性状,综合前人研究结果,本研究氮效率品种划分是通过6个成熟期与氮效率密切相关的农学指标(产量、植株氮积累、氮素生理利用效率、植株干生物量、籽粒总吸氮量、N收获指数)构建主成分综合值,通过K-Means把小麦品种划分为氮高效型、氮中效型和氮低效型。为探究挖掘无人机多光谱影像在小麦氮高效品种筛选鉴定中的潜力,研究不同生育时期植被指数融合对小麦氮效率品种分类的影响,采用RF-RFE算法、Boruta算法和ReliefF算法对多生育时期植被指数融合数据进行特征优化,选择SVM、RF、KNN分类器对小麦氮效率品种进行分类。技术路线如图2所示。
a:河南省荥阳市;b:河南省原阳县 a: Xingyang City, Henan Province; b: Yuanyang County, Henan Province
1.3 农学参数获取及氮高效品种的确定
农学参数获取:成熟期每小区取长势具有代表性的小麦10株,分为籽粒和秸秆两部分,置于70 ℃干燥箱内恒温干燥至质量不变,称取干重,随后粉碎并采用凯氏定氮仪测定秸秆氮含量和籽粒氮含量。成熟期每小区选取一个具有代表性的1 m×1 m样方进行测产,三年共9个重复的平均值即为该品种产量实测值。根据测得结果计算成熟期植株氮积累、氮素生理利用效率、成熟期植株干生物量、籽粒总吸氮量、N收获指数,相关计算公式如下:
成熟期植株氮积累=籽粒含氮量×籽粒干质量+秸秆含氮量×秸秆干质量(1)
氮素生理利用效率=产量/成熟期植株氮积累(2)
成熟期植株干生物量=秸秆干质量+籽粒干质量(3)
籽粒总吸氮量=籽粒含氮量×产量(4)
N收获指数=籽粒总吸氮量/成熟期植株氮积累(5)
氮效率品种的划分:依据各小麦品种与氮效率相关的6个农学指标的变化及反应,对其进行主成分综合,通过综合值进行K-Means聚类分析,将121个小麦品种划分为氮高效(high nitrogen efficiency type,HNET)、氮中效(medium nitrogen efficiency type,MNET)和氮低效(low nitrogen efficiency type,LNET)3种类型。
表1 供试品种编号及名称
1.4 无人机数据获取与处理
使用Matrice600PRO大疆六旋翼无人机与Ronin系列云台,搭载2 064像素×1 544像素K6机载模块化多光谱相机,该传感器包括蓝光(450 nm)、绿光(550 nm)、红光(685 nm)、红边(725 nm)、近红外(780 nm)5个多光谱通道和1个4 384像素×3 288像素RGB原色通道,如图3所示,在小麦拔节期(S1)、孕穗期(S2)和开花期(S3)分别获取无人机平台的多光谱数据。选择在天气晴朗、无风无云的环境下,中午11:00—13:00进行无人机作业,以避免环境条件的影响。飞行高度设置为50 m,拍照方式为等时触发,航向重叠率为75%,旁相重叠率为70%。拍摄前,使用手持式ASD对铺设反射率为5%、20%、40%和70%的靶标布进行校准。使用Pix4D Mapper 4.5.6软件对多光谱图像进行拼接、辐射校正与几何校正,利用ArcGIS 10.8软件对拼接预处理的遥感影像进行裁剪处理,得到每个试验样区的光谱图像,提取各样区光谱反射率,并计算每个品种3个重复小区的平均值作为该品种的反射率值。
1.5 多光谱植被指数的选取与计算
光谱指数是由不同波段的反射率以代数形式重新组合成的一种参数,可降低条件背景对光谱数据的干扰,比单波段具有更高的灵敏性。依据前人研究结果筛选出适用于无人机多光谱传感器通道的34种植被指数(表2),以用于小麦氮效率评价。
1.6 特征选择
特征选择能够剔除不相关或冗余的特征,从而提高模型精确度,减少运行时间。本研究选取以下3种分类特征选择算法,根据品种实际氮效率类别进行特征筛选。
表2 本文采用的植被指数及计算公式
Rblue:蓝波段反射率 Blue band;Rgreen:绿波段反射率 Green band;Rred:红波段反射率 Red band;Rre:红边波段反射率 Red edge band;Rnir:近红外波段反射率 Near infrared band
图3 大疆M600Pro无人机、搭载相机及图像采集
1.6.1 Boruta特征选择 Boruta算法[20]是一种以随机森林为框架的特征选择方法,通过随机森林策略对每个特征生成1个得分,用此来评估特征的重要性,经过反复迭代运算,剔除不重要特征,保留关联性较好的特征,直至所有特征被选择或达到迭代次数。
1.6.2 ReliefF特征选择 ReliefF算法不受数据类型的限制,抗噪能力强,操作简单,运算速度快,是目前广泛应用的一种过滤式(filter)多类别特征选择算法,通过计算特征权重判断特征重要性。本研究设置权重阈值为0.01,选择权重大于0.01的特征变量作为ReliefF特征子集。具体方法为:在同一类样本中抽取1个样本R,分别在同类和异类样本中寻找k个最近邻样本,构成同类样本集Near Hit和异类样本集Near Miss,再以R与Near Hit和Near Miss中样本各特征平均差异的差值定义特征权重W。特征权重越大,说明该特征使得样本的类间距离越大,类内距离越小,对类别识别的作用也越大[21]。
1.6.3 RF-RFE特征选择 递归消除算法(recursive feature elimination,RFE)是一种集成算法,随机森林与RFE相结合形成RF-RFE,将RF作为基分类器,通过增加或移除特定特征变量,能够更加合理地决定最大化模型性能的最终特征子集的大小。RF-RFE算法[22]是把需要的特征子集初始化为整个特征子集,采用随机森林算法得到的重要性排序进行后向迭代删除特征重要度最小的特征,重复迭代,直至特征数为0,比较每个模型分类效果,选择最优的特征变量集合。
1.7 分类方法
为了探究不同分类算法对筛选小麦氮高效品种的影响,并评价出最优分类算法,本研究选择了3种比较常用的机器学习分类算法:K近邻(KNN)、随机森林(RF)和支持向量机(SVM)分类算法。
1.7.1 K近邻分类算法 K近邻分类算法[23]是一种非参数的分类方法,对于未知或者非正态分布的数据可以取得较高的分类准确率,具有概念清晰、易于操作等诸多优点。其主要过程为:对于1个待分类的样本X,首先找出与X最接近的或者最相似的K个已知类别标签的训练样本,然后根据这K个训练样本的类别标签确定样本X的类别。
1.7.2 随机森林分类算法 随机森林分类算法[24]是由若干决策树组成,用众多决策树对样本进行训练并预测,最终由多棵决策树分类器的投票结果决定分类结果。其中,决策树的个数N、随机特征变量个数m直接影响模型的分类精度和运算速度。决策树的个数N≥100时,各分类情况的OOB误差趋于稳定,随机森林未出现过拟合现象,本研究设置N=300;随机森林变量个数m,本研究根据Breiman建议设定m(随机森林变量的个数)等于M(特征变量的总数)的平方根进行分类。
1.7.3 支持向量机分类算法 支持向量机[25]是一种追求间隔最大化的分类模型,即将向量高维映射,通过学习1个分离超平面,使得该超平面尽量分开两类样本,并且使所有样本点到超平面的距离之和最大。支持向量机的核函数选择径向基核函数,参数gamma和C使用网络搜索交叉验证进行参数寻优。
1.8 精度评价
为了对比不同特征选择和分类算法的分类精度,采用总体分类精度(overall Accuracy,OA)和Kappa系数(Kappa coefficient)对测试结果(以7﹕3的比例划分训练集和测试集)进行评价。由于每次运行的结果存在差异,因此每个方案将分别运行100次,分别计算2个分类精度指标的平均值,以此进行最后的分类精度评价。
式中,N代表验证样本的总数;n代表混淆矩阵的总列数;xii代表混淆矩阵的第i行、第i列的样本数量;xi+和x+i分别表示混淆矩阵各行各列元素之和。
2 结果
2.1 不同小麦品种间氮效率指标差异分析
分析产量、成熟期植株氮积累量、氮素生理利用效率、成熟期植株干生物量、籽粒总吸氮量、N收获指数6个农学性状指标的差异,由表3可知,6个性状指标的变异系数介于8.754%—21.374%,其中植株干生物量的变异系数最大(21.374%),其次为植株氮积累量(20.799%),N收获指数的变异系数最小(8.754%)。6个性状指标在121个小麦品种间存在不同程度的差异,以此作为小麦品种氮效率的评判依据。
2.2 不同小麦品种氮效率分类
2.2.1 主成分提取 本研究的KMO值为0.648,Bartlett球形度检验的Sig.约等于0,因此本研究数据符合Kaiser-Meyer-Olkin度量,可以用于主成分分析。对121个小麦品种的6个性状指标进行主成分分析,主成分确定的标准是累计贡献率>85%,数据分析结果如表4所示,前2个主成分的累计贡献率为75.1%,前3个主成分的累计贡献率为91.9%,因此提取前3个主成分做进一步分析。主成分分析的旋转因子载荷反映各指标对主成分贡献的大小。第一主成分的特征值为2.262,贡献率为37.7%,其中,植株氮积累量、氮素生理利用效率、植株干生物量的载荷值较大,其旋转后的载荷值分别为0.860、-0.937、0.780;第二主成分的特征值为2.244,贡献率为37.4%,其中,产量(0.975)、籽粒总吸氮量(0.911)的载荷值较大;第三主成分的特征值为1.006,贡献率为16.8%,其中,N收获指数的载荷值为0.933,贡献较多。
表3 供试小麦品种氮效率评价指标分析
表4 主成分分析旋转后的特征值、贡献率、累计贡献率和成分载荷值
F1、F2、F3分别表示主成分1、主成分2、主成分3 F1, F2, F3 represent principal component 1, principal component 2, principal component 3。下同 The same as below
2.2.2 不同氮效率品种K-Means分类 结合各主成分的方差贡献率,可得出121个小麦品种氮效率综合得分(F)函数:F=0.377F1+0.374F2+0.168F3,各个品种氮效率综合得分的计算结果如表5所示。利用各品种氮效率综合得分进行K-Means聚类分析,将供试品种分为氮高效型、氮中效型和氮低效型3类(表6),其中氮高效型品种13个,聚类中心为1.782;氮中效型品种61个,聚类中心为0.280;氮低效型品种47个,聚类中心为-0.856。
表5 供试小麦品种氮效率主成分综合评价
表6 供试小麦品种基于氮效率综合得分的聚类结果及聚类中心
聚类中心在第6次迭代后收敛The clustering center converges after the sixth iteration
2.3 不同氮效率品种冠层波段反射率特征分析
不同生育时期下小麦氮高效型、氮中效型和氮低效型的波段反射率如图4所示,不同氮效率类型小麦样品的平均反射率在波段之间的变化趋势总体相似,且随着生育时期的推进,反射率先增后降,表现为典型的小麦冠层反射率特征;不同氮效率类型小麦在单个生育时期下的平均反射率数值存在一定的差异,其中780 nm波段差异最为明显(S1:0.020、S2:0.036、S3:0.118),平均反射率在3个生育时期下都表现为氮高效型>氮中效型>氮低效型。光谱反射率虽然能够展现不同氮效率类型小麦的部分差异,但是仅凭这些差异很难对小麦氮效率进行准确分类,因此,有必要通过植被指数建立合适的分类模型以挖掘不同氮效率类型小麦光谱数据的潜在特征。
图4 3种氮效率品种不同生育时期下的波段反射率箱线图
2.4 不同生育时期植被指数与小麦氮效率综合得分相关性分析
将选取的植被指数分别与冬小麦氮效率综合得分进行相关性分析,得到不同生育时期下相关性热图(图5)。从生育时期来看,随着小麦生长发育的不断推进,植被指数与氮效率综合得分之间的相关性逐渐增强。拔节期的相关系数绝对值的范围为0.023—0.425,RVIgreen的相关系数最高,GWDRVI的相关性最差;孕穗期的相关系数绝对值的范围为0.100—0.498,TVI的相关性最好,DATT的相关性最差;而开花期的相关系数绝对值的范围为0.202—0.502,其中VIopt1最优。整体而言,不同植被指数与小麦氮效率综合得分在不同生育时期都存在一定的相关性,这为利用植被指数对小麦品种氮效率分类奠定了理论技术。
图5 不同生育时期植被指数与小麦氮效率综合得分相关性热图
2.5 基于植被指数全特征集的小麦品种氮效率分类
2.5.1 单生育时期植被指数 为比较不同生育时期多光谱影像植被指数在小麦品种氮效率分类中的效果,利用KNN、RF和SVM分类算法,使用总体分类精度(OA)和Kappa系数对不同生育时期的分类模型进行精度评价(表7)。对于单生育时期而言,随着生育时期的推进,不同分类算法的分类精度逐渐升高,拔节期最低,平均总体分类精度和平均Kappa系数为61.3%和0.306;孕穗期次之,平均总体分类精度和平均Kappa系数为68.6%和0.440;开花期最高,平均总体分类精度和平均Kappa系数为71.9%和0.493。对于3种分类算法而言,KNN分类模型的精度最低,平均总体分类精度和平均Kappa系数为62.4%和0.296;RF分类模型的精度次之,平均总体分类精度和平均Kappa系数为67.6%和0.441;SVM分类模型的精度最高,平均总体分类精度和平均Kappa系数为71.6%和0.503。
表7 基于单生育时期的小麦品种氮效率分类精度
S1:拔节期 Jointing stage;S2:孕穗期 Booting stage;S3:开花期 Flowering stage。下同The same as below
2.5.2 多生育时期植被指数 相对于单生育时期植被指数对氮效率品种进行分类,将不同生育时期的植被指数融合作为输入变量,3种分类算法的精度均有所提升,结果如表8所示。对于两生育时期植被指数融合来说,拔节期和孕穗期植被指数融合分类的精度最低(OA=70.6%,Kappa=0.477),相较单生育时期拔节期和孕穗期平均总体分类精度分别提高15.3%和3.0%;孕穗期和开花期植被指数融合分类的精度最高(OA=74.3%,Kappa=0.542),相较单生育时期孕穗期和开花期平均总体分类精度分别提高8.3%、3.3%。对于三生育时期植被指数融合来说,分类精度在多生育时期植被指数融合中最高(OA=76.7%,Kappa=0.584),与两生育时期植被指数融合相比的平均总体分类精度提高5.7%,与单生育时期植被指数相比平均总体分类精度提高14.0%。
3种算法在多生育时期融合下的分类结果趋势与单生育时期一致。KNN分类模型的精度最低,平均总体分类精度和平均Kappa系数分别为67.6%和0.401,比单生育时期植被指数KNN分类模型分别提高8.3%、35.5%;SVM分类模型的精度最高,平均总体分类精度和平均Kappa系数为77.5%和0.614,比单生育时期植被指数SVM分类模型分别提高8.2%、22.1%。
表8 基于多生育时期的小麦品种氮效率分类精度
2.6 基于多生育时期植被指数不同特征选择算法的小麦品种氮效率分类
2.6.1 基于不同特征选择算法的特征子集筛选 在多生育时期数据融合的基础上,采用不同算法进行特征子集优化。图6表示RF-RFE算法特征选择的过程,选择分类精度最高的组合作为最优特征子集,其中,拔节期和孕穗期植被指数特征组合下变量数量为36时,分类精度最高(0.724);拔节期和开花期植被指数特征组合下变量数量为22时,分类精度最高(0.782);孕穗期和开花期植被指数特征组合下变量数量为11时,分类精度最高(0.798);拔节期、孕穗期和开花期植被指数特征组合下变量数量为21时,分类精度最高(0.807)。图7表示Boruta算法特征选择的结果,根据计算各特征变量的Z-scores选择重要参数,其中,拔节期和孕穗期植被指数特征组合中筛选得到10个重要变量;拔节期和开花期植被指数特征组合中筛选得到11个重要变量;孕穗期和开花期植被指数特征组合中筛选得到11个重要变量;拔节期、孕穗期和开花期植被指数特征组合中筛选得到12个重要变量。图8(仅显示被选择的特征)表示ReliefF算法特征选择的结果,选择权重阈值大于0.01的变量组成特征子集,其中,拔节期和孕穗期植被指数特征组合中筛选得到10个变量组成特征子集;拔节期和开花期植被指数特征组合中筛选得到8个变量组成特征子集;孕穗期和开花期植被指数特征组合中筛选得到10个变量组成特征子集;拔节期、孕穗期和开花期植被指数特征组合中筛选得到10个变量组成特征子集。
a:拔节期+孕穗期 Jointing stage + Booting stage;b:拔节期+开花期 Jointing stage + Flowering stage;c:孕穗期+开花期 Booting stage + Flowering stage;d:拔节期+孕穗期+开花期 Jointing stage + Booting stage + Flowering stage。下同The same as below
2.6.2 基于多生育时期植被指数不同特征选择算法的小麦品种氮效率分类模型评价 根据3种特征选择方法对多生育时期植被指数融合特征筛选的结果,利用KNN、RF和SVM分类算法进行小麦品种氮效率分类,具体分类评价结果如图9所示。不同特征选择算法处理后的分类精度在多生育时期融合之间的趋势与全特征集基本一致,都为拔节期+孕穗期<拔节期+开花期<孕穗期+开花期<拔节期+孕穗期+开花期。对于不同特征选择算法而言,基于RF-RFE特征选择算法的分类精度最高,平均总体分类精度和平均Kappa系数为76.6%和0.585,比全特征集模型分别提高4.0%和10.1%;基于ReliefF特征选择算法的分类精度最差(劣于全特征集),平均总体分类精度和平均Kappa系数为72.5%和0.507,比全特征集模型分别下降1.6%和4.5%。对于不同分类方法对特征选择后的数据进行分类来说,不同分类算法分类精度的趋势与上面研究结果一致。分别以RF-RFE、Boruta和ReliefF特征选择后的植被指数作为输入量,均以SVM分类精度最高,平均总体分类精度和平均Kappa系数分别为80.1%和0.654、78.5%和0.624以及76.8%和0.593,较特征选择前分别提高3.4%和6.5%、提高1.2%和1.6%以及下降0.9%和3.4%;以KNN分类精度最低,平均总体分类精度和平均Kappa系数分别为71.1%和0.474、69.9%和0.448以及66.5%和0.377,较特征选择前分别提高5.2%和18.3%、提高3.4%和11.6%以及下降1.6%和6.0%。12种不同特征数据集(4种多生育时期融合方法、3种特征选择方法)结合3种分类算法组成的48种分类方法中,基于RF-RFE算法对拔节期、孕穗期和开花期多生育时期融合特征子集进行优化,利用SVM分类算法对优化后的数据集进行分类,总体分类精度和Kappa系数最高,分别为85.4%和0.749。
1:拔节期Jointing stage;2:孕穗期 Booting stage;3:开花期Flowering stage。下同The same as below
图8 基于ReliefF的多生育时期特征集优化结果
图9 基于多生育时期植被指数不同特征选择算法的小麦品种氮效率分类模型评价
3 讨论
3.1 作物氮高效品种农学筛选评价方法
选择合适的性状指标是作物氮效率鉴定的关键,有助于快速准确地鉴定不同氮效率品种,为筛选培育氮高效类型品种提供方法参考[26]。氮素高效利用是多种氮效率指标共同呈现的一个复杂综合性状,其中每一个指标都可以从不同侧面反映氮素的吸收与利用能力[27-28],因此,仅利用单指标评价氮效率具有一定的片面性,多指标共同评价氮效率更全面、更充分。本研究在相同氮素水平条件下,综合考虑植株吸收和利用氮素的能力,并依据前人相关研究结果[29-30],将产量、成熟期植株氮积累量、氮素生理利用效率、成熟期植株干生物量、籽粒总吸氮量、N收获指数6个性状指标作为氮效率评价指标,具有较强的理论性与可靠性。但多指标共同评价品种氮效率无疑会增加信息量和计算量,指标间可能还存在多重共性问题。近年来,主成分分析在多重指标综合评价分析中显现出巨大的潜力与优势。主成分综合分析是将多个指标浓缩为几个关键的、不相关的概括性指标,通过主成分得分构造综合得分,进而进行综合评价[31]。周丽艳等[32]通过主成分分析将11个农艺性状简化为彼此互不相关的5个主成分,并通过系统聚类将春小麦品种划分为7大类群。连盈等[33]利用22个氮效率相关指标采用主成分分析法极好评价了参试谷子品种的耐低氮性。陈林涛等[34]运用主成分分析法将8个杂交稻芽种物理特性进行简化,成功构建科学的芽种量化评价体系。本研究利用主成分分析法将6个氮效率指标通过线性组合提炼为3个相互独立的主成分,累计贡献率达91.9%,很好地减少计算工作量,解决了指标间的多重共性问题。最后对3个主成分进行综合分析,得到氮效率综合得分,并通过K-Means进行聚类分析,得到氮高效型品种13个,氮中效型品种61个,氮低效型品种47个。
3.2 生育时期对小麦品种氮效率分类的影响
小麦生命周期包含多个生长阶段,具有不同的冠层光谱特征,从中计算得到的植被指数可以很好地反映不同生育时期作物的生长状况与氮素吸收利用情况,这为通过植被指数进行作物氮效率鉴定分类奠定了理论基础。本研究基于单生育时期植被指数进行小麦品种氮效率分类时,拔节期分类精度最低,开花期分类精度最高。这主要是因为小麦生长初期植被覆盖率低,在进行植被指数提取时裸露的土壤会对植被指数的准确性造成很大的干扰[35],而且氮效率相关指标是通过最后成熟期的性状计算得到的,小麦拔节期主要为营养生长,距离小麦成熟收获还有很长一段时间,该时期的生长特征并不能完全反映后期产量、干物质、植株氮积累量等物质积累。除此之外,拔节后温度、降雨、光照等不可控变量对作物的氮素吸收利用也存在较大影响[36],因此利用拔节期植被指数进行作物氮效率预测分类具有很大的不确定性。随着生育时期推进至小麦开花期,该时期是小麦由营养生长转为生殖生长的关键时期,此时小麦冠层结构基本成型,小麦成穗数及穗粒数基本确定,米国华等[37]、王春晓等[38]指出如果开花期生长良好,也可为之后的植株氮素吸收转运、干物质积累以及籽粒灌浆提供更充分的物质基础。因此,开花期遥感监测所得到的植被指数对成熟期氮效率相关性状的解释性较好、机理性较强。
随着冬小麦生育时期的发展,冬小麦实时氮素利用效率不断发生变化,在单个时期内利用光谱信息对冬小麦品种氮效率进行分类评价精度不高。相反,多个生育时期的光谱信息构成的数据集可以提供更多有用的信息,能更科学、更合理地反映作物产量等氮素利用相关性状的变化过程[39-41]。WANG等[42]利用拔节至灌浆期的累计光谱指数对籽粒产量和蛋白质含量进行预测,发现其预测精度分别高于各单时期的预测精度;程千等[43]研究表明基于多时相植被指数能进一步提高冬小麦产量预测精度,并且能对产量做出较好的提前估测。本研究通过对比发现,结合多个生育时期植被指数对品种氮效率进行分类的精度比单个生育时期的精度均有所提高,其中拔节期、孕穗期和开花期3个生育时期结合的分类精度最高,平均总体分类精度达76.7%,比单个生育时期提高6.7%—25.3%,进一步说明多生育时期融合数据可以更好地反映作物氮素吸收利用的变化过程。
3.3 特征选择及分类方法对小麦品种氮效率分类的影响
在当前大数据背景下,数据处理过程中往往会存在大量无关和冗余的信息,提取大量的数据特征会占用更多的计算机内存和耗费大量的时间,而且不适合的特征子集可能会造成模型过拟合、分类识别精度低等问题[44]。为了解决大数据背景下“维数灾难”问题,挖掘数据内部的本质结构特征和联系,提高变量的区分性、解释性,特征变量的选择至关重要。赵静等[45]利用RFE算法对无人机多光谱影像提取的光谱特征以及纹理特征进行特征选择,显著提高了玉米与杂草的识别精度;魏永康等[46]利用Boruta算法对无人机影像多特征参量进行优化,筛选参数少且倒伏分类精度高。由此可见,数据类型不同,其所适合的特征选择方法也有所区别。本研究发现多生育时期植被指数特征集全部参与品种氮效率的分类评估,虽然分类精度高,但数据运算量大,不适宜构建简便、实用的氮效率分类模型。因此,比较并筛选最佳的分类特征组合是作物氮效率评估分类的重要内容。本研究基于ReliefF算法、Boruta算法和RF-RFE算法对多生育时期植被指数融合特征集进行特征选择,发现RF-RFE特征选择算法在小麦品种氮效率分类识别中效果最优,且具有较好的稳定性,证明RF-RFE特征选择算法在构建小麦品种氮效率分类模型中具有更好的优化能力和泛化能力。
随着数理统计软件的广泛引入,机器学习技术在作物监测及分类中得到了广泛应用[47]。但由于不同机器学习算法原理不同,分类目标物属性也有所区别,导致所得到的结果可能存在很大差异[48-49]。为了探究不同分类建模方法对品种氮效率分类的效果,本研究比较了KNN、RF和SVM 3种常见的分类方法对品种氮效率分类的潜力,其中KNN分类效果最差,SVM效果最好。KNN算法在分类决策上是依据最邻近的一个或几个样本的类别来决定待分类样本所属的类别,无需估计参数,简单易于实现,但模型的可解释性较差,普适性较低[50]。本文在特征选择的基础上利用KNN分类算法得到的最高总体分类精度仅为73.5%,在处理多时期复杂因子时表现出较大的局限性。RF和SVM模型在处理复杂多维度问题时表现出很好的适应性,使分类精度得到进一步提高,其中SVM算法具有精度高、运算速度快、泛化能力强等优点,可以处理多元线性不可分问题,对高维数据做出准确分类[51]。结果表明,SVM算法对品种氮效率进行分类的总体分类精度可达85.4%,说明SVM模型在融合多生育时期数据方面具有较大优势,可作为筛选小麦氮高效品种的有效途径,为小麦氮高效品种筛选鉴定及快速育种提供技术指导,RF算法的效果略差,总体分类精度为82.0%。
本研究确立6个氮效率指标—主成分分析—K-Means氮效率评价方法,根据该评价方法对供试小麦品种氮效率分类的结果,进一步利用无人机植被指数构建了多生育时期组合—RF-RFE—SVM小麦氮效率分类模式,为小麦氮高效品种的筛选鉴定提供了理论依据和技术支撑。但本研究仅利用了单一模态数据(植被指数)参与模型构建,未来还应综合考虑纹理特征、温度参数特征等多模态数据以及温度、降雨、光照等不可控环境变量对小麦品种氮效率分类模型的影响,以期构建精度更高、鲁棒性更强的小麦氮高效品种筛选模型。
4 结论
通过主成分分析—K-Means聚类分析将不同氮效率小麦品种成功划分为氮高效、氮中效和氮低效3个类别,对比分析单生育时期多光谱影像特征集与多生育时期融合特征集在小麦品种氮效率分类识别中的差异,发现单生育时期以开花期的总体分类精度最高(OA=71.9%),多生育时期融合优于单生育时期,以拔节期+孕穗期+开花期融合数据效果最优(OA=76.7%)。对于不同分类方法而言,SVM算法表现最优,KNN算法表现最差。为了减少影像数据特征数量,提高模型分类精度,利用ReliefF算法、Boruta算法和RF-RFE算法对多生育时期特征组合变量进行优化选择,其中RF-RFE方法有效降低数据集维度,提高小麦品种氮效率分类的精度(OA= 85.4%)。多生育时期组合—RF-RFE—SVM技术融合模式对小麦品种氮效率分类具有较高的应用价值,为促进育种进程和我国种业创新具有十分重要的意义。
[1] XU G H, Fan X R, Miller A J. Plant nitrogen assimilation and use efficiency. Annual Review of Plant Biology, 2012, 63: 153-182.
[2] Hawkesford M J. Reducing the reliance on nitrogen fertilizer for wheat production. Journal of Cereal Science, 2014, 59(3): 276-283.
[3] 张鹏钰, 高桐梅, 苏小雨, 李丰, 王东勇, 田媛, 芦海灵, 苗红梅, 卫双玲. 芝麻苗期氮高效品种筛选及氮效率评价体系建立. 河南农业科学, 2022, 51: 54-66.
Zhang P Y, Gao T M, Su X Y, Li F, Wang D Y, Tian Y, Lu H L, Miao H M, Wei S L. Screening of nitrogen efficient varieties and construction of nitrogen efficiency assessment system at seedling stage of sesame (Sesamum indicum L.). Journal of Henan Agricultural Sciences, 2022, 51(6): 54-66. (in Chinese)
[4] 葛礼姣, 方馨妍, 张云月, 罗孟婷, 管志勇, 陈素梅, 房伟民, 陈发棣, 赵爽. 菊花苗期氮高效品种资源筛选及氮效率评价体系建立. 南京农业大学学报, 2021, 44(6): 1054-1062.
Ge L J, Fang X Y, Zhang Y Y, Luo M T, Guan Z Y, Chen S M, Fang W M, Chen F D, Zhao S. Screening of nitrogen efficient varieties and its assessment system construction at seedling stage of chrysanthemum. Journal of Nanjing Agricultural University, 2021, 44(6): 1054-1062. (in Chinese)
[5] 杜保见, 郜红建, 常江, 章力干. 小麦苗期氮素吸收利用效率差异及聚类分析. 植物营养与肥料学报, 2014, 20(6): 1349-1357.
Du B J, Gao H J, Chang J, Zhang L G. Screening and cluster analysis of nitrogen use efficiency of different wheat cultivars at the seedling stage. Journal of Plant Nutrition and Fertilizer, 2014, 20(6): 1349-1357. (in Chinese)
[6] 宋晓, 张珂珂, 黄晨晨, 黄绍敏, 郭斗斗, 岳克, 张水清. 基于主成分分析的氮高效小麦品种的筛选. 河南农业科学, 2020, 49(12): 10-16.
Song X, Zhang K K, Huang C C, Huang S M, Guo D D, Yue K, Zhang S Q. Selection of nitrogen-efficient wheat varieties based on principal component analysis. Journal of Henan Agricultural Sciences, 2020, 49(12): 10-16. (in Chinese)
[7] 张盼盼, 李志源, 刘京宝, 黄璐, 乔江方, 李川, 张美微, 刘锋. 黄淮海地区高产氮高效玉米品种的筛选与评价. 河南农业科学, 2021, 50(10): 10-17.
Zhang P P, LI Z Y, Liu J B, Huang L, Qiao J F, Li C, Zhang M W, Liu F. Screening and evaluation of maize varieties with high yield and nitrogen use efficiency in Huang-Huai-Hai region. Journal of Henan Agricultural Sciences, 2021, 50(10): 10-17. (in Chinese)
[8] 朱新开, 郭文善, 朱冬梅, 朱波风, 封超年, 彭永欣. 不同基因型小麦氮素吸收积累差异研究. 扬州大学学报, 2005, 26(3): 52-57.
Zhu X K, Guo W S, Zhu D M, Zhu B F, Feng C N, Peng Y X. Studies on differences of accumulated N amount in different genotypes of winter wheat. Journal of Yangzhou University, 2005, 26(3): 52-57. (in Chinese)
[9] 李艳, 董中东, 郝西, 崔党群. 小麦不同品种的氮素利用效率差异研究. 中国农业科学, 2007, 40(3): 472-477. doi: 10.3864/j.issn.0578- 1752.at-2006-7202.
Li Y, Dong Z D, Hao X, Cui D Q. The studies on genotypic difference of nitrogen utilization efficiency in winter wheat. Scientia Agricultura Sinica, 2007, 40(3): 472-477. doi: 10.3864/j.issn.0578- 1752.at-2006-7202. (in Chinese)
[10] Qiu R C, Wei S, Zhang M, Sun H, Li H, Liu G, Li M Z. Sensors for measuring plant phenotyping: A review. International Journal of Agricultural and Biological Engineering, 2018, 11(2): 1–17.
[11] Feng L, Chen S S, Zhang C, Zhang Y C, He Y. A comprehensive review on recent applications of unmanned aerial vehicle remote sensing with various sensors for high-throughput plant phenotyping. Computers and Electronics in Agriculture, 2021, 182: 106033.
[12] 朱婉雪, 李仕冀, 张旭博, 李洋, 孙志刚. 基于无人机遥感植被指数优选的田块尺度冬小麦估产. 农业工程学报, 2018, 34(11): 78-86.
Zhu W X, Li S J, Zhang X B, Li Y, Sun Z G. Estimation of winter wheat yield using optimal vegetation indices from unmanned aerial vehicle remote sensing. Transactions of the Chinese Society of Agricultural Engineering, 2018, 34(11): 78-86. (in Chinese)
[13] 刘畅, 杨贵军, 李振海, 汤伏全, 王建雯, 张春兰, 张丽妍. 融合无人机光谱信息与纹理信息的冬小麦生物量估测. 中国农业科学, 2018, 51(16): 3060-3073. doi: 10.3864/j.issn.0578-1752.2018.16.003.
Liu C, Yang G J, Li Z H, Tang F Q, Wang J W, Zhang C L, Zhang L Y. Biomass estimation in winter wheat by UAV spectral information and texture information fusion. Scientia Agricultura Sinica, 2018, 51(16): 3060-3073. doi: 10.3864/j.issn.0578-1752.2018. 16.003. (in Chinese)
[14] 郭燕, 井宇航, 王来刚, 黄竞毅, 贺佳, 冯伟, 郑国清. 基于无人机影像特征的冬小麦植株氮含量预测及模型迁移能力分析. 中国农业科学, 2023, 56(5): 850-865. doi: 10.3864/j.issn.0578-1752.2023.05. 004.
Guo Y, Jing Y H, Wang L G, Huang J Y, He J, Feng W, Zheng G Q. UAV multispectral image-based nitrogen content prediction and the transferability analysis of the models in winter wheat plant. Scientia Agricultura Sinica, 2023, 56(5): 850-865. doi: 10.3864/j.issn.0578-1752.2023.05.004. (in Chinese)
[15] 刘涛, 张寰, 王志业, 贺超, 张全国, 焦有宙. 利用无人机多光谱估算小麦叶面积指数和叶绿素含量. 农业工程学报, 2021, 37(19): 65-72.
Liu T, Zhang H, Wang Z Y, He C, Zhang Q G, Jiao Y Z. Estimation of the leaf area index and chlorophyll content of wheat using UAV multi-spectrum images. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(19): 65-72. (in Chinese)
[16] 董德誉. 冬小麦氮高效鉴定及光合效率和籽粒蛋白质含量的反演. 乌鲁木齐:新疆农业大学, 2022.
Dong D Y. Identification of nitrogen efficiency and inversion of photosynthetic efficiency and grain protein content in winter wheat. Urumqi: Xinjiang Agricultural University, 2022. (in Chinese)
[17] Yang M J, Hassan M A, Xu K J, Zheng C Y, Rasheed A, Zhang Y, Jin X L, Xia X C, Xiao Y G, He Z H. Assessment of water and nitrogen use efficiencies through UAV-based multispectral phenotyping in winter wheat. Frontiers in Plant Science, 2020, 11: 927.
[18] 李郅琴, 杜建强, 聂斌, 熊旺平, 黄灿奕, 李欢. 特征选择方法综述. 计算机工程与应用, 2019, 55(24): 10-19.
Li Z Q, Du J Q, Nie B, Xiong W P, Huang C Y, Li H. Summary of feature selection methods. Computer Engineering and Applications, 2019, 55(24): 10-19. (in Chinese)
[19] 周小成, 郑磊, 黄洪宇. 基于多特征优选的无人机可见光遥感林分类型分类. 林业科学, 2021, 57(6): 24-36.
Zhou X C, Zheng L, Huang H Y. Classification of forest stand based on multi-feature optimization of UAV visible light remote sensing. Scientia Silvae Sinicae, 2021, 57(6): 24-36. (in Chinese)
[20] Li X H, Li X Z, Liu W, Wei B H, Xu X L. A UAV-based framework for crop lodging assessment. European Journal of Agronomy, 2021, 123: 126201.
[21] 梁加玲, 刘彦花, 徐军, 王茜茜, 欧镇丽. 基于ReliefF算法的遥感影像分类特征优化. 地矿测绘, 2020, 36(3): 1-5.
Liang J L, Liu Y H, Xu J, Wang X X, Ou Z L. Classification feature optimization of remote sensing images based on ReliefF algorithm. Surveying and Mapping of Geology and Mineral Resources, 2020, 36(3): 1-5. (in Chinese)
[22] 杨珺雯, 张锦水, 朱秀芳, 谢登峰, 袁周米琪. 随机森林在高光谱遥感数据中降维与分类的应用. 北京师范大学学报(自然科学版), 2015, 51(S1): 82-88.
Yang J W, Zhang J S, Zhu X F, Xie D F, Yuanzhou M Q. Application of random forest in dimensionality reduction and classification of hyperspectral remote sensing data. Journal of Beijing Normal University (Natural Science), 2015, 51(S1): 82-88. (in Chinese)
[23] 王晓晔, 王正欧. K-最近邻分类技术的改进算法. 电子与信息学报, 2005, 27(3): 487-491.
Wang X Y, Wang Z O. An improved K-nearest neighbor algorithm. Journal of Electronics & Information Technology, 2005, 27(3): 487-491. (in Chinese)
[24] 李欣海. 随机森林模型在分类与回归分析中的应用. 应用昆虫学报, 2013, 50(4): 1190-1197.
Li X H. Using “random forest” for classification and regression. Chinese Journal of Applied Entomology, 2013, 50(4): 1190-1197. (in Chinese)
[25] 刘志刚, 李德仁, 秦前清, 史文中. 支持向量机在多类分类问题中的推广. 计算机工程与应用, 2004, 40(7): 10-13, 65.
Liu Z G, Li D R, Qin Q Q, Shi W Z. An analytical overview of methods for multi-category support vector machines. Computer Engineering and Applications, 2004, 40(7): 10-13, 65. (in Chinese)
[26] 赵瑞, 张旭辉, 张程炀, 郭泾磊, 汪妤, 李红霞. 小麦种质资源成株期氮效率评价及筛选.中国农业科学, 2021, 54(18): 3818-3833. doi: 10.3864/j.issn.0578-1752.2021.18.003.
Zhao R, Zhang X H, Zhang C Y, Guo J L, Wang Y, Li H X. Evaluation and screening of nitrogen efficiency of wheat germplasm resources at mature stage. Scientia Agricultura Sinica, 2021, 54(18): 3818-3833. doi: 10.3864/j.issn.0578-1752.2021.18.003. (in Chinese)
[27] 黄永兰, 黎毛毛, 芦明, 万建林, 龙起樟, 王会民, 唐秀英, 范志洁. 氮高效水稻种质资源筛选及相关特性分析. 植物遗传资源学报, 2015, 16(1): 87-93.
Huang Y L, Li M M, Lu M, Wan J L, Long Q Z, Wang H M, Tang X Y, Fan Z J. Selection of rice germplasm with high nitrogen utilization efficiency and its analysis of the related characters. Journal of Plant Genetic Resources, 2015, 16(1): 87-93. (in Chinese)
[28] 崔文芳, 高聚林, 屈佳伟, 于晓芳, 胡树平, 苏治军, 王志刚, 孙继颖, 谢岷. 氮高效玉米杂交种的筛选及氮效率相关特性分析. 玉米科学, 2016, 24(4): 72-82.
Cui W F, Gao J L, Qu J W, Yu X F, Hu S P, Su Z J, Wang Z G, Sun J Y, Xie M. Analysis of nitrogen efficient maize hybrid screening and nitrogen efficiency related characteristics. Journal of Maize Sciences, 2016, 24(4): 72-82. (in Chinese)
[29] 冯洋, 陈海飞, 胡孝明, 周卫, 徐芳森, 蔡红梅. 我国南方主推水稻品种氮效率筛选及评价. 植物营养与肥料学报, 2014, 20(5): 1051-1062.
Feng Y, Chen H F, Hu X M, Zhou W, Xu F S, Cai H M. Nitrogen efficiency screening of rice cultivars popularized in South China. Journal of Plant Nutrition and Fertilizer, 2014, 20(5): 1051-1062. (in Chinese)
[30] 钟思荣, 陈仁霄, 陶瑶, 龚丝雨, 何宽信, 张启明, 张世川, 刘齐元. 耐低氮烟草基因型的筛选及其氮效率类型. 作物学报, 2017, 43(7): 993-1002.
Zhong S R, Chen R X, Tao Y, Gong S Y, He K X, Zhang Q M, Zhang S C, Liu Q Y. Screening of tobacco genotypes tolerant to low-nitrogen and their nitrogen efficiency types. Acta Agronomica Sinica, 2017, 43(7): 993-1002. (in Chinese)
[31] 林海明, 张文霖. 主成分分析与因子分析的异同和SPSS软件——兼与刘玉玫、卢纹岱等同志商榷. 统计研究, 2005, 22(3): 65-69.
Lin H M, Zhang W L. The relationship between principal component analysis and factor analysis and SPSS software—To discuss with comrade Liu Yumei, Lu Wendai etc. Statistical Research, 2005, 22(3): 65-69. (in Chinese)
[32] 周丽艳, 郭振清, 马玉玲, 东方阳, 林小虎. 春小麦品种农艺性状的主成分分析与聚类分析. 麦类作物学报, 2011, 31(6): 1057-1062.
Zhou L Y, Guo Z Q, Ma Y L, DONGFANG Y, Lin X H. Principal component and cluster analysis of different spring wheat cultivars based on agronomic traits. Journal of Triticeae Crops, 2011, 31(6): 1057-1062. (in Chinese)
[33] 连盈, 卢娟, 胡成梅, 牛胤全, 史雨刚, 杨进文, 王曙光, 张文俊, 孙黛珍. 低氮胁迫对谷子苗期性状的影响和耐低氮品种的筛选. 中国生态农业学报(中英文), 2020, 28(4): 523-534.
Lian Y, Lu J, Hu C M, Niu Y Q, Shi Y G, Yang J W, Wang S G, Zhang W J, Sun D Z. Effects of low nitrogen stress on foxtail millet seedling characteristics and screening of low nitrogen tolerant varieties. Chinese Journal of Eco-Agriculture, 2020, 28(4): 523-534. (in Chinese)
[34] 陈林涛, 马旭, 曹秀龙, 温志成, 季传栋, 李宏伟. 基于主成分分析的杂交稻芽种物理特性评价研究. 农业工程学报, 2019, 35(16): 334-342.
Chen L T, Ma X, Cao X L, Wen Z C, Ji C D, Li H W. Evaluation research of physical characteristics of hybrid rice buds based on principal component analysis. Transactions of the Chinese Society of Agricultural Engineering, 2019, 35(16): 334-342. (in Chinese)
[35] 王佳儿, 肖悦, 王志昊, 郑长娟, 王勇, 白旭乾, 于广多, 张智韬. 剔除土壤背景对反演玉米根域土壤含水率的影响研究. 节水灌溉, 2021(12): 81-86, 93.
Wang J E, Xiao Y, Wang Z H, Zheng C J, Wang Y, Bai X Q, Yu G D, Zhang Z T. Effect of removing soil background on inversion of soil moisture content in maize root zone. Water Saving Irrigation, 2021(12): 81-86, 93. (in Chinese)
[36] 徐海成. 冬小麦高产高效群体构建的栽培模式研究[D]. 泰安: 山东农业大学, 2016.
Xu H C. Study on cultivation mode of high yield and high efficiency population construction of winter wheat[D]. Taian: Shandong Agricultural University, 2016. (in Chinese)
[37] 米国华, 陈范骏, 春亮, 郭亚芬, 田秋英, 张福锁. 玉米氮高效品种的生物学特征. 植物营养与肥料学报, 2007, 13(1): 155-159.
Mi G H, Chen F J, Chun L, Guo Y F, Tian Q Y, Zhang F S. Biological characteristics of nitrogen efficient maize genotypes. Journal of Plant Nutrition and Fertilizer Science, 2007, 13(1): 155-159. (in Chinese)
[38] 王春晓, 凌飞, 鹿泽启, 姜蔚, 臧宏伟, 张伟, 姚杰, 兰丰, 柳璇, 王志新, 郑永美. 不同氮效率花生品种氮素累积与利用特征. 中国生态农业学报(中英文), 2019, 27(11): 1706-1713.
Wang C X, Ling F, Lu Z Q, Jiang W, Zang H W, Zhang W, Yao J, Lan F, Liu X, Wang Z X, Zheng Y M. Characteristics of nitrogen accumulation and utilization in peanuts () with different nitrogen use efficiencies. Chinese Journal of Eco- Agriculture, 2019, 27(11): 1706-1713. (in Chinese)
[39] Du M M, Noguchi N. Monitoring of wheat growth status and mapping of wheat yield’s within-field spatial variations using color images acquired from UAV-camera system. Remote Sensing, 2017, 9(3): 289.
[40] ZHOU X, ZHENG H B, XU X Q, HE J Y, GE X K, YAO X, CHENG T, ZHU Y, CAO W X, TIAN Y C. Predicting grain yield in rice using multi-temporal vegetation indices from UAV-based multispectral and digital imagery. ISPRS Journal of Photogrammetry and Remote Sensing, 2017, 130: 246-255.
[41] 王晶晶, 李长硕, 卓越, 檀海斌, 侯永胜, 严海军. 基于多时相无人机遥感生育时期优选的冬小麦估产. 农业机械学报, 2022, 53(9): 197-206.
Wang J J, Li C S, Zhuo Y, Tan H B, Hou Y S, Yan H J. Yield estimation of winter wheat based on optimization of growth stages by multi-temporal UAV remote sensing. Transactions of the Chinese Society for Agricultural Machinery, 2022, 53(9): 197-206. (in Chinese)
[42] WANG L G, TIAN Y C, YAO X, ZHU Y, CAO W X. Predicting grain yield and protein content in wheat by fusing multi-sensor and multi-temporal remote-sensing images. Field Crops Research, 2014, 164: 178-188.
[43] 程千, 徐洪刚, 曹引波, 段福义, 陈震. 基于无人机多时相植被指数的冬小麦产量估测.农业机械学报, 2021, 52(3): 160-167.
Cheng Q, Xu H G, Cao Y B, Duan F Y, Chen Z. Grain yield prediction of winter wheat using multi-temporal UAV based on multispectral vegetation index. Transactions of the Chinese Society for Agricultural Machinery, 2021, 52(3): 160-167. (in Chinese)
[44] GUYON I, ELISSEEFF A. An introduction to variable and feature selection. Journal of Machine Learning Research, 2003, 3(3): 1157-1182.
[45] 赵静, 李志铭, 鲁力群, 贾鹏, 杨焕波, 兰玉彬. 基于无人机多光谱遥感图像的玉米田间杂草识别. 中国农业科学, 2020, 53(8): 1545-1555. doi: 10.3864/j.issn.0578-1752.2020.08.005.
Zhao J, Li Z M, Lu L Q, Jia P, Yang H B, Lan Y B. Weed identification in maize field based on multi-spectral remote sensing of unmanned aerial vehicle. Scientia Agricultura Sinica, 2020, 53(8): 1545-1555. doi: 10.3864/j.issn.0578-1752.2020.08.005. (in Chinese)
[46] 魏永康, 杨天聪, 臧少龙, 贺利, 段剑钊, 谢迎新, 王晨阳, 冯伟. 基于无人机多光谱影像特征融合的小麦倒伏监测. 中国农业科学, 2023, 56(9): 1670-1685. doi: 10.3864/j.issn.0578-1752.2023. 09.005.
Wei Y K, Yang T C, Zang S L, He L, Duan J Z, Xie Y X, Wang C Y, Feng W. Monitoring wheat lodging based on UAV multi-spectral image feature fusion. Scientia Agricultura Sinica, 2023, 56(9): 1670-1685. doi: 10.3864/j.issn.0578-1752.2023.09.005. (in Chinese)
[47] 刘忠, 万炜, 黄晋宇, 韩已文, 王佳莹. 基于无人机遥感的农作物长势关键参数反演研究进展. 农业工程学报, 2018, 34(24): 60-71.
Liu Z, Wan W, Huang J Y, Han Y W, Wang J Y. Progress on key parameters inversion of crop growth based on unmanned aerial vehicle remote sensing. Transactions of the Chinese Society of Agricultural Engineering, 2018, 34(24): 60-71. (in Chinese)
[48] 陶惠林, 徐良骥, 冯海宽,杨贵军, 杨小冬,苗梦珂, 代阳. 基于无人机数码影像的冬小麦株高和生物量估算. 农业工程学报, 2019, 35(19): 107-116.
Tao H L, Xu L J, Feng H K, Yang G J, Yang X D, Miao M K, Dai Y. Estimation of plant height and biomass of winter wheat based on UAV digital image. Transactions of the Chinese Society of Agricultural Engineering, 2019, 35(19): 107-116. (in Chinese)
[49] 潘治利, 祁萌, 魏春阳, 李锋, 张仕祥, 王建伟, 过伟民, 艾志录. 基于图像处理和支持向量机的初烤烟叶颜色特征区域分类. 作物学报, 2012, 38(2): 374-379.
Pan Z L, Qi M, Wei C Y, Li F, Zhang S X, Wang J W, Guo W M, Ai Z L. Color region classification of flue-cured tobacco leaves based on the image processing and support vector machine. Acta Agronomica Sinica, 2012, 38(2): 374-379. (in Chinese)
[50] 毋雪雁, 王水花, 张煜东. K最近邻算法理论与应用综述. 计算机工程与应用, 2017, 53(21): 1-7.
Wu X Y, Wang S H, Zhang Y D. Survey on theory and application of K-Nearest-Neighbors algorithm. Computer Engineering and Applications, 2017, 53(21): 1-7. (in Chinese)
[51] 周涛丽. 基于支持向量机的多分类方法研究[D]. 成都: 电子科技大学, 2015.
Zhou T L. Research on multi-classification method based on support vector machine[D]. Chengdu: University of Electronic Science and Technology of China, 2015. (in Chinese)
Classification and Identification of Nitrogen Efficiency of Wheat Varieties Based on UAV Multi-Temporal Images
ZANG ShaoLong1, LIU LinRu1, GAO YueZhi1, WU Ke1, HE Li1,3, DUAN JianZhao1, SONG Xiao2, FENG Wei
1College of Agronomy, Henan Agricultural University, Zhengzhou 450046;2Institute of Plant Nutrition and Environmental Resources, Henan Academy of Agricultural Sciences, Zhengzhou 450002;3National Engineering Research Centre for Wheat, Zhengzhou 450046
【Objective】To explore the potential of UAV remote sensing in nitrogen efficiency classification and recognition, a nitrogen efficiency classification method for wheat varieties was constructed, so as to provide the theoretical basis and technical support for nitrogen efficient variety screening.【Method】Six agronomic indicators related to nitrogen efficiency at maturity stage (yield, plant nitrogen accumulation, nitrogen physiological use efficiency, plant dry biomass, total nitrogen uptake of grains, and N harvest index) were used to construct the principal component synthesis value, and K-Means cluster analysis was performed on them. The 121 wheat varieties were divided into three types: high, medium, and low nitrogen efficiency types. A UAV remote sensing platform equipped with a multi-spectral camera was used to obtain remote sensing images of wheat at the jointing, booting and flowering stages, and 34 vegetation indices were extracted to analyze the correlation between vegetation index and nitrogen efficiency comprehensive value. The accuracy of nitrogen efficiency classification models of support vector machine (SVM), random forest (RF), and K-nearest neighbor (KNN) classification methods were compared, and the overall classification accuracy (OA) and Kappa coefficient were used to compare the classification and recognition ability of wheat varieties in different growth periods. Three different feature set screening methods (ReliefF algorithm, Boruta algorithm and RF-RFE algorithm) were used to comprehensively evaluate the optimized feature subsets, and an appropriate classification and recognition method for wheat varieties nitrogen efficiency was established.【Result】With the progress of wheat growth stage, the correlation between vegetation index and the comprehensive value of nitrogen efficiency gradually increased, which reached the highest correlation coefficient at flowering stage (=0.502). The full feature set of vegetation indices was used to classify the nitrogen efficiency of wheat varieties. For the data of single growth stage, SVM model had the best classification accuracy at flowering stage (OA=77.1%, Kappa=0.591), and the worst classification accuracy at jointing stage (OA=65.6%, Kappa=0.406). In general, the classification accuracy of nitrogen efficiency of varieties with multi-growth stage data fusion was higher than that of single growth stage, among which SVM model with jointing stage + booting stage + flowering stage had the best classification accuracy (OA=80.6%, Kappa=0.669). In order to reduce the number of feature set variables in multi-growth period data fusion, the feature optimization effects of RF-RFE, Boruta and ReliefF algorithms were compared and analyzed. The optimal feature subset based on RF-RFE algorithm had the highest classification accuracy, and its OA and Kappa coefficients were 4.0% and 10.1% higher than those of the full feature set classification model, respectively. Among them, the data fusion of three growth stages had the best classification accuracy (OA=85.4%, Kappa=0.749).【Conclusion】The nitrogen efficiency evaluation method with six nitrogen efficiency indexes - principal component analysis -K-Means were established in this study. The RF-RFE algorithm effectively optimized the number of characteristic subsets of the multi-growth period combination, and obtained high classification accuracy. A nitrogen efficiency classification model of wheat varieties based on the fusion of multi-growth period combination and RF-RFE-SVM technology was established, which provided the theoretical basis and technical support for the rapid and accurate classification and identification of wheat varieties with nitrogen efficiency.
winter wheat; UAV; vegetation index; multiple growth periods; feature selection; nitrogen efficiency classification
10.3864/j.issn.0578-1752.2024.09.006
2023-11-19;
2024-03-01
国家自然科学基金(32301693)、河南省科技研发计划联合基金项目(232103810017,222103810015)、河南省高等学校重点科研项目(24A210008)
臧少龙,E-mail:z036213@163.com。通信作者贺利,E-mail:he-li19870308@163.com。通信作者冯伟,E-mail:fengwei78@126.com
(责任编辑 李秋雨)