基于机器学习的水稻地上生物量遥感反演
2020-11-28李武岐徐峰杨丰栓董霞周华
李武岐 徐峰 杨丰栓 董霞 周华
摘 要:地上生物量是水稻重要的生理生化参数,其估测模型对长势监测、产量估计等具有重要的意义。高光谱遥感技术具有光谱分辨率高、蕴含信息丰富、高效无损的特点,能够大范围精准监测作物生长信息,在现代化农业中得到了广泛的应用。本文基于ASD FieldSpec 4光谱辐射计获取的水稻的冠层光谱反射率数据,通过光谱转换获得其红边参数、植被指数等参数,利用K近邻回归(KNN)、支持向量机(SVM)、随机森林(RF)等方法开展水稻生物量估测研究,实验结果表明:其中RF建模集精度最高:R2为0.98,RMSE为94.6g·m-2,CV为11.7%,验证集精度:R2为0.89,RMSE为194.1g·m-2,CV为23.5%,且三种机器学习建模的精度R2均高于0.86,达到较好的反演效果。
关键词:地上生物量;水稻;光谱反射率;红边参数;植被指数
中图分类号:S127 文献标识码:A 文章编号:1671-2064(2020)12-0228-02
0研究背景
水稻是我国的主要粮食作物之一,水稻的产量是人们关心的重点问题,而水稻地上生物量(AGB,Above ground Biomass)是水稻的长势监测、产量估计等的重要指标。传统的水稻生物量测算方法需要人工在田间采集水稻样本,直接采集物理样品进行实测,这种方法具有客观准确的特点;但是,该方法成本高,耗时费力,会造成部分水稻被破坏,无法满足精准农业实时快速、大面积的估测需求。近年来,遥感技术的飞速发展,多尺度、高光谱以及多观测角度的遥感数据能够更实时、准确、高效地反映农作物的长势信息,使用遥感技术的非破坏性或非侵入性方法可以有效避免传统方法的问题,从而更好地为生物量进行估测。本文以ASD FieldSpec 4光谱辐射计获取的水稻的冠层反射率为数据源,提取红边参数、植被指数,基于K近邻、支持向量机和随机森林进行回归分析,构建多品种水稻生物量反演模型。
1研究区与数据
1.1研究区
研究区位于湖北省鄂州市试验基地(30°22′22.27″N, 114°45′7.03″E),位于湖北省东部,长江中游南岸,屬于亚热带季风气候区,夏季高温多雨,适宜水稻生长。2019年6月至9月试验区布设4个移栽水稻田块,土壤为水稻土,施肥均相等且适量,选取48个品种作为采样对象。水稻采用双行种植,行列间距40cm,移栽密度为20000兜/亩。
1.2数据获取
实验使用美国ASD公司生产的ASD FieldSpec4便携式地物光谱仪测得水稻冠层高光谱数据和人工采样获得AGB实测数据。其中利用ASD高光谱数据通过光谱变换提取水稻生物量相关参量,构建基于机器学习的水稻生物量反演模型。
1.2.1 ASD高光谱数据
水稻冠层高光谱数据使用美国ASD公司生产的ASD FieldSpec4便携式地物光谱仪测得,该仪器可用于测量反射率、透射率、辐射亮度或辐射照度等参数,其测量波段范围为350nm~2500nm,在350nm~1000nm范围内光谱分辨率为3nm;1000nm~2500nm范围内为8nm。选择在晴朗无云、风速较小且太阳角较小的情况下进行测量(一般在10时~14时),每个小区重复测量五条光谱,取其平均值作为一条光谱样本。获取的ASD数据使用ViewSpecPro软件进行处理得到不同时间的光谱样本。
1.2.2 水稻地上生物量获取
实验使用的水稻地上生物量(AGB)是在光谱测量的同时,通过实地采集48个小区的样本,进行实测得到。每个小区采集5兜所有水稻的地上部分(含茎、叶和穗),作为一个样本。首先在120℃高温条件下杀青1h,再在80℃恒温条件下烘烤24h至恒重,称其重量并记录,最后,通过种植密度计算每平方米的地上生物量(g/m2)。
2研究方法
本论文主要探究植被指数、红边参数在水稻地上生物量估算中的表现。为了减弱环境因素引起的光谱噪声,我们使用S_G滤波算法对每条样本进行平滑处理。提取红边参数和光谱偏角。
2.1植被指数
根据地上生物量遥感反演的相关文献,结合ASD高光谱数据的波段特点,反演水稻生长状态参数的关键波段有400nm~500nm、525nm~600nm、640nm~690nm、720nm~730nm以及800nm处的近红外波段。我们依据水稻冠层光谱变化的特性,选择9种有明确意义的植被指数与AGB进行相关分析,从而建立估算模型。其中相关波段位置的选取分别为近红外波段(NIR)800nm,红光波段(Red)670nm,绿光波段(Green)550nm,红边波段(Red edge)720nm的光谱反射率,植被指数计算方法如表1。
2.2红边参数
利用公式(1)计算ASD光谱反射率的一阶导数,在波长680nm~750nm范围内确定红边参数。红边参数主要包括:
红边位置:波长区间一阶导数最大值所对应的波长位置处。
红边峰值:波长区间的光谱一阶导数的最大值。
红边面积:波长区间的一阶导数所包围的光谱积分面积。
3机器学习模型构建
对ASD高光谱数据利用KNN、SVR、RF三种机器学习回归模型估算AGB时,利用模型的决定系数(coefficient of determination,R2)、均方根误差(root-mean-square error, RMSE)和变异系数(Coefficient of Variation,CV)作为估测模型的评价指标。表2为机器学习回归建模与验证的精度:其中RF建模集精度最高:R2为0.98,RMSE为94.6g·m-2,CV为11.7%,验证集精度:R2为0.89,RMSE为194.1g·m-2,CV为23.5%。
图1是三种机器学习模型的预测效果,通过对比分析,其中RF模型预测拟合点均匀分布在y=x附近,大部分点均在最优拟合范围内,体现了RF模型具备较好的泛化能力。KNN模型估算结果也较接近1∶1线,但在中高AGB区易发生偏估现象。
4结语
该试验通过对ASD高光谱数据进行S_G滤波的预处理及光谱变换,提取了光谱植被指数、红边参数等特征,构建了三种机器学习反演生物量的模型,对水稻估产和水稻生物量估算模型的构建具有一定的指导意义。