APP下载

基于历史增强型植被指数时序的农作物类型早期识别

2018-08-10郝鹏宇唐华俊陈仲新

农业工程学报 2018年13期
关键词:训练样本农作物作物

郝鹏宇,唐华俊,陈仲新,牛 铮



基于历史增强型植被指数时序的农作物类型早期识别

郝鹏宇1,唐华俊1※,陈仲新1,牛 铮2

(1. 中国农业科学院农业资源与农业区划研究所农业部农业遥感重点实验室,北京 100081; 2. 中国科学院遥感与数字地球研究所遥感科学国家重点实验室,北京 100101)

快速准确地获取农作物分布数据对作物估产、灾害预警具有重要意义。该文针对目前农情遥感监测业务中普遍存在的缺乏地面数据和分类时效性较低的问题,以美国堪萨斯州为研究区,提出了基于参考时间序列获得训练样本的方法。首先,基于2006到2013年的MODIS EVI时间序列数据和cropland data layer(CDL)数据,使用免疫系统网络方法建立苜蓿、玉米、高粱和冬小麦的参考EVI时间序列;根据2006年到2013年作物分布情况,将作物超过总记录年数一半的象元作为2014年“潜在”训练样本;通过计算参考EVI时间序列和“潜在”样本的MODIS EVI时间序列的欧氏距离确认2014年训练样本;最后使用这些样本和2014年Landsat NDVI月合成数据进行30 m作物识别,并且评价时间序列长度对作物识别结果的影响。试验结果表明,时间序列长度为4-8月时,获得2014年样本10 183个,样本正确率为96.32%,总体分类精度为94.02%,接近使用完整时间序列数据的结果(总体分类精度94.89%);提取的苜蓿、玉米、高粱和冬小麦的面积分别为549.5、1 999.5、2 851.5和6 415.3 km2,与CDL数据相比误差低于20%,说明基于参考时间序列方法获得的训练样本具有较高的正确率,具备进行30 m作物早期制图的潜力。该研究可为提高农作物遥感制图工作效率提供参考。

作物;遥感;识别;参考EVI时间序列;作物识别;样本;免疫系统网络;CDL数据

0 引 言

快速获取与分析农作物的种植分布是农作物长势监测的基础,遥感技术以其快速、无损和客观等特点,已广泛应用于农作物种植面积提取[1]。由于多时相遥感数据可以在整个生长期内反映不同作物生长状况的差异,具有更强的区分不同作物的能力[2-3],大多数农作物分类产品需要使用全年的多时相遥感数据,因而需要在年底或者第二年才能获得农作物分类的结果,时效性较低[4]。如果能使用较短的时间序列提前获得作物分类的结果,将使作物提取的结果更有意义[5]。例如,在农作物夏季灌溉之前获得农作物分类图,可以辅助决策灌溉用水量的分配,提高灌溉的用水效率;在收获之前获得作物分类结果,可以更有效地管理农作物的收割。另外,目前大多数农作物遥感识别工作均采用监督分类的方法,因而分类的训练样本是农作物精确识别的关键。但是,通过野外试验的方法获得训练样本的方案会造成极大的人力、物力消耗,因而每年获得地面训练样本存在较大困难[6-7]。所以,在不能获得地面调查数据的情况下,探讨使用较短的时间序列数据进行作物提前识别的方法,在农作物识别的业务化运行工作中具有重要意义。

由于多年间同种作物物候的差异小于不同作物的物候差异,一些学者根据先验知识,直接使用遥感数据描述特定作物的特征,从而实现作物提取。如Dong等[8]发现中国东北的水稻在移栽期时,主要体现为水体特征,而在移栽期之后与其他作物的特征类似,提出了基于先验知识的水稻自动提取方法。Zhong等[6]使用MODIS EVI数据计算作物的物候期,使用线性差值的方法获得物候期的作物光谱,并根据作物关键物候期的光谱人为定义决策树进行作物识别。这些方法针对特定作物提出,不能实现多种类的作物识别;而且需要首先使用遥感数据提取物候,而物候的提取会引入误差,影响作物识别的精度。

另一种方法是使用相同研究区其他年份的训练样本训练分类器,再使用这些分类器进行作物识别[9]。例如,Muhammad等[10-11]使用多年历史数据训练分类器,并在此基础上分别在美国堪萨斯州和中国新疆进行作物识别,其总体分类精度达80%以上。Howard等[12]使用5 a历史数据训练决策树分类器,并进行作物识别,其分类精度也在80%左右。Friesz等[13]将该方法进行扩展,实现了2000年到2013年的全美250 m连续作物分布制图,总体分类精度达到90%。Hao等[14]使用2006到2010年的历史地面数据和MODIS数据建立作物的参考曲线,并尝试使用参考曲线在新疆博乐市和玛纳斯县进行2011年30 m作物识别,其识别精度达到85%左右。但是,由于使用MODIS计算的植被指数与使用Landsat和HJ数据计算的植被指数存在差异,作物识别过程中需要使用线性转换的方法将Landsat和HJ数据的植被指数转换为MODIS植被指数,转换过程中引进的误差会影响分类精度。所以如何改进植被指数线性转换的过程有待进一步探讨。

本文针对农作物遥感识别时效性较低和缺乏训练样本的问题,通过作物历史EVI时间序列直接获得分类年需要的训练样本,并使用这些样本进行作物识别。另外,评价时间序列长度较短时,使用该方法进行作物早期识别的适用性,为提高业务运行的效率提供新的思路。

1 研究区和数据

1.1 研究区概况

堪萨斯州(37°N—40°N,94°W—102°W)位于美国大平原,其主要土地利用类型为农田,面积占全州的46.6%[15],主要农作物包括玉米、高粱和冬小麦等[16]。由于堪萨斯州西南ASD 30 (Agricultural Statistics Districts 30)区域包括了堪萨斯州主要的农作物,本文选择堪萨斯州西南的ASD30区域作为研究区(图1)。根据Shroyer等[17],研究区在堪萨斯州种植分区中属于“Zone 2”和“Zone 3”;作物的播种期早于堪萨斯州东南的ASD 90区域,晚于堪萨斯州西北的ASD 10区域。最主要的作物为冬小麦,种植面积占该区域农田面积的53.16%,玉米和高粱也为该区域的主要作物,其种植面积占该区域农田面积的21.24%和21.19%[18]。

1.2 遥感数据

1.2.1 数据及预处理

本文使用的遥感数据包括2部分:1)2006年至2014年的MODIS EVI时间序列数据;2)2014年Landsat数据。MODIS数据为16 d合成的植被指数产品MOD13Q1,空间分辨率为250 m,包括NDVI、EVI、红、蓝、近红、中红和VI 质量文件等数据[3]。本文使用的MODIS数据的条带号为h09v05的数据,数据时相为2006年到2014年每年1月1日至12月31日,2006年至2013 年的数据用于建立参考EVI曲线,2014年的数据用于识别2014年作物。本文使用MRT(MODIS reprojection tool)对MODIS数据进行镶嵌和投影转换,投影为UTM(universal transverse mercator projection)投影,投影带号为14N,地理坐标系为WGS84 坐标系。使用试验区域对MODIS数据进行裁剪,并使用Savizky-Golay滤波的方法进行EVI时间序列重构[19]。另外,本文获得2014 年4月至10月所有Landsat数据(包括Landsat-7 ETM+数据和Landsat-8 OLI数据),空间分辨率为30 m。所有Landsat数据均为经过几何精校正的Landsat地表反射率数据,其几何校正误差小于12 m[20]。使用地表反射率计算NDVI,再使用月最大合成的方法对NDVI进行数据合成,取每个月NDVI中的最大值代表这个月的NDVI。最后,使用试验区的边界对月合成的Landsat NDVI时间序列进行裁剪,并进行投影转换,地理坐标系为WGS84,投影为UTM投影,投影带号为14 N。

注:图中影像为2014年7月MODIS EVI数据。

1.2.2 样本数据

本文使用美国农业部提供的CDL(cropland data layer)数据作为地面数据,涉及的作物类型为堪萨斯州的4种主要的作物,分别为苜蓿、玉米、高粱和冬小麦[21],4种作物CDL数据的用户精度高于85%[18]。

在获得2014年的验证样本时,同时使用CDL数据的作物类型数据和作物识别置信度数据[18]。分类置信度是分类器在进行分类时输出的分类可靠性,代表分类器对分类结果的确定性。首先,使用90%的分类置信度作为阈值获得“高置信度”掩膜;接着使用“高置信度”掩膜删除CDL分类置信度较低的象元。随后,根据2014年CDL数据计算每个250 m×250 m的MODIS象元内主要作物所占的面积比例。如果在一个象元内,一种作物所占的比例大于80%,将这个象元定义为相应作物的“纯网格”,将这个网格中心的坐标定义为该作物的验证样本。

本文使用类似的方法,基于CDL数据获得2006年至2013年的历史参考样本。由于在这些年份,CDL数据未提供作物识别置信度产品,在获得历史训练样本时,省略了“高置信度”掩膜的过程。2006至2013年的训练样本和2014年的验证样本的数量如表1所示。

表1 2006年至2014年样本数量

2 研究方法

本文的技术流程如图2所示。首先,使用免疫系统网络方法[22],基于2006到2013年的MODIS EVI数据和CDL数据生成的训练样本构建4种典型作物的参考EVI时间序列曲线。再根据2006到2013年的CDL数据获得2014年的“潜在”训练样本。由于本文尝试进行作物早期识别,共尝试使用7种时间序列长度(4月、4-5月、4-6月等,从4月开始,以月为单位延长时间序列长度)的数据提取作物。针对每种时间序列长度,通过比较参考EVI时间序列和2014年“潜在”训练样本的MODIS EVI时间序列获得2014年训练样本。再使用这些训练样本和对应的Landsat NDVI数据进行30 m分辨率农作物识别。最后,通过比较本文获得的2014年训练样本与对应的CDL数据和使用这些训练样本进行作物识别的精度,对本文所提出的方法进行评估。

图2 基于历史增强型植被指数时序的农作物类型早期识别流程图

2.1 建立参考EVI时间序列曲线

本研究使用免疫系统网络算法(ABNet)建立作物的参考EVI时间序列曲线。该算法的基础单元是“抗体”,而“免疫系统”模型由多个抗体组成。每个抗体由3个属性组成,分别是该抗体对应的类别、中心向量和识别半径。中心向量即分类的特征序列。与之相对应的“抗原”由2个属性组成,分别是中心向量和所属类别。每个“抗体”可以识别其识别半径内的“抗原”。ABNet主要包括训练和分类2个过程,本研究使用训练过程获得参考EVI时间序列。例如,在获得作物A的参考EVI时间序列时,具体过程为:1)使用2006年至2013年的EVI时间序列数据和训练样本获得“抗原”,并对所有“抗原”的“中心向量”进行归一化,使不同的特征具备可比性;2)通过“抗原”筛选,获得代表性最强的“代表抗原”;3)通过克隆,获得大量“代表抗原”;4)使用遗传算法对第3)步结果进行变异,产生作物A的随机“抗体”;5)分别使用所有随机“抗体”识别作物A的抗原和其他作物的抗原,将识别作物A“抗原”数量最多的随机“抗体”作为“抗体”记录,被这个抗体识别的作物A“抗原”从“抗原集”中删除。重复该过程直到所有作物A的“抗原”均被识别,作物A的训练过程结束。最后,本研究把获得的所有“抗体”的中心向量作为EVI参考时间序列。因ABNet方法的优点是每个类别可以拥有多个“抗体”,可以解决“同物异谱”的现象,尤其适合本研究基于多年EVI时间序列建立参考曲线的问题。本研究使用IDL语言实现ABNet算法,在使用“抗体”识别“抗原”的过程中,涉及到相似度计算的方法,由于欧氏距离计算简便,本文使用欧氏距离法作为相似度评价方法[23],其计算方法如式(1)所示,式中ED()指向量和的欧氏距离。ab分别为时间序列和在时相的EVI值,为时间序列中时相的数量。

2.2 基于参考EVI曲线获得2014年训练样本

基于2006到2013年历史数据获得2014年分类样本时,首先使用ABNet方法,根据2006到2013年的历史MODIS EVI时间序列数据建立作物的参考MODIS EVI时间序列;在2006到2013年的作物类型记录中,如果一个象元为作物A的次数超过总记录年数的一半,则假设在2014年,该MODIS象元可以被标记为作物A。随后计算该象元的MODIS EVI曲线与所有参考MODIS EVI曲线的欧氏距离,如果任意一个欧式距离小于对应抗体的识别半径,则确认该象元属于作物A,将该象元的中心坐标作为2014年作物A的训练样本,否则不记录该象元。

2.3 作物识别和精度验证

本研究的作物识别工作仅针对CDL数据中苜蓿、玉米、高粱和小麦4种作物的地块。针对不同的时间序列长度,使用对应的训练样本和Landsat NDVI时间序列进行作物识别。例如,使用4月的训练样本和4月的Landsat时间序列获得4月的作物分布结果,使用4-5月数据和4-5月Landsat NDVI时间序列获得5月作物识别结果。以此类推,本研究可以获得7种时间序列长度的作物识别结果。

识别作物时,本研究选用的分类器为随机森林算法[24],由于随机森林在处理大量训练样本时效率较高,且对于训练样本的容错能力强,已被广泛应用于遥感分类中。随机森林法有2个需要用户设按定的参数:决策树的数量(ntree)和选择的分裂属性个数(mtry)。本研究将ntree设置为1 000(数值较大,增加随机森林中决策树的数量),mtry设置为分特征数量的平方根(大多数随机森林的默认设置)。本研究使用基于混淆矩阵的精度评价方法,计算分类结果的制图精度、用户精度、整体精度和Kappa系数评价作物识别结果的精度。

3 试验结果

3.1 作物的参考EVI时间序列曲线

由于每种作物有多种生长状况,所以本研究共获得53条参考EVI时间序列曲线,其中苜蓿1条、玉米32条,高粱17条,冬小麦3条。图3为本研究中几种主要农作物的参考EVI时间序列曲线。其中,玉米EVI曲线的峰值介于0.6到0.8,出现在第175到190天(每年日期排序DOY)左右(6月下旬到7月上旬)。高粱的EVI峰值介于0.5到0.7,略低于玉米,且EVI峰值期为第209天到225天(7月中下旬),比玉米略晚。苜蓿的EVI参考时间序列与其他几种作物有明显差异,EVI在第100天达到峰值,峰值为0.7,随后EVI持续较高,直到第270天开始下降。另外,苜蓿只有1条参考曲线,这也说明苜蓿与其他几种作物分离度较高。冬小麦是冬季作物,其EVI峰值期为第100到30天,EVI峰值为0.4到0.8。总体而言,本研究所涉及4种作物的参考EVI时间序列曲线具备可分离度。

3.2 验证本文获得的2014年训练样本

本文使用不同时间序列长度的EVI时间序列,基于各种作物的参考EVI时间序列获得2014年的训练样本,并将这些训练样本与2014年CDL数据进行比较,结果如表2所示。由于本研究将CDL数据作为地面真实数据,所以本研究识别的样本与CDL数据的作物类型相同时,认为该样本识别正确。

注:玉米和高粱的参考EVI时间序列数量较多,图中用这2类作物参考曲线的平均值和标准差作为代表;日序DOY从1月1日计。

表2 本文识别的2014年训练样本与CDL数据的比较

由表2可知,仅使用4月的数据时,识别样本的正确率最低,为91.86%;其中高粱样本的识别错误较大,识别的55个样本中仅有28个与CDL数据相同。玉米样本的正确率相对较低,为89.79%。苜蓿和冬小麦样本的正确率较高,分别为95.8%和98.9%。随着延长时间序列长度,识别出的样本数量增加。只使用4月的数据时,共识别样本5 088个,而使用4-10月数据时,共识别样本10 803个,且有95.5%的样本与CDL数据的作物类型相同。错误识别的样本主要为玉米和高粱样本,7 966个玉米样本中,有421个与CDL数据不同,而131个高粱样本中,有26个与CDL数据不同。本研究识别的高粱样本较少,可能的原因是高粱仅有1 558个“潜在”高粱样本,且高粱样本与玉米样本容易混淆。

虽然识别的样本数量和识别样本正确率随着时间序列长度增加而提高,当时间序列为4-8月时,获得样本10 183个,其中9 808个与CDL数据相同,且高粱样本的正确识别率为77.78%。使用更长的时间序列不能明显提高获得的样本的数量和正确率。这说明,在分类年不能获得地面数据的情况下,可以基于历史数据参考曲线的方法在8月获得用于识别作物的分类训练样本。但是,高粱样本中与CDL类型相同的样本数量在时间序列长度为2个月(4-5月时间序列)至7个月(4-10月时间序列)中没有明显变化,这些都说明了高粱与其他作物容易混淆。

3.3 作物识别精度验证

针对不同时间序列长度,本文使用相应的训练样本和对应长度的Landsat NDVI时间序列进行30 m作物提取,并使用2014年的验证样本(表1)进行作物识别精度验证,结果如表3所示。在进行2014年作物识别时,本文使用3.2小节中所有样本(不只是与CDL数据相同的样本),这样可以评估基于历史数据和参考曲线的方法,在分类年不能获得地面数据时识别作物的精度。

表3 不同长度Landsat NDVI时间序列的作物识别精度

注:表中PA(%)为制图精度,UA(%)为用户精度。

Notes: UA (%) means user’s accuracy and PA (%) means producer’s accuracy.

由表3可知,时间序列为4月和4-5月时,作物识别的精度较低,总体精度分别为66.12%和52.51%。仅有冬小麦的用户精度高于90%,其他作物的制图精度和用户精度均较低,例如时间序列为4月时,苜蓿的用户精度为43.29%。作物识别精度随所用时间序列长度延长而升高,当时间序列达到4-8月时,总体分类精度为94.02%,更长的时间序列不能明显提高分类精度,当时间序列为4-10月时,总体分类精度为94.89%。

图4为局部CDL数据与不同时间序列长度的Landsat NDVI数据识别作物结果的对比。当时间序列为4月和4-5月时,部分冬小麦被识别成苜蓿,而且分类结果中出现明显的“椒盐噪声”。识别作物使用的时间序列较长时,几种主要作物的分布基本与CDL数据相同。本研究试验区的特点为地块面积较大,在地块边缘出现错分。但在分类结果验证的混淆矩阵中没能体现出地块边缘的错分。由于本文中使用的“假设样本”均为MODIS“纯”象元,但农田地块边界处的混合象元是由农作物和周围非农作物构成,因而混合的象元易被错分。

表4为本研究提取的研究区内主要作物的种植面积,其中包括了CDL数据和不同时间序列长度情况下,使用本文获得的训练样本识别的作物种植面积。

图4 不同长度时间序列数据的作物识别结果(亚区)

表4 研究区不同长度时间序列数据主要作物种植面积提取结果

当时间序列较短时,作物面积与CDL数据差异较大,苜蓿和玉米的面积被高估,而冬小麦和高粱的面积被低估。例如仅使用4月的数据时,苜蓿的面积为1 462.4 km2,比CDL数据的苜蓿面积高943.9 km2。随时间序列延长,作物面积逐渐接近CDL数据的作物面积,例如使用4-8月数据时,苜蓿和冬小麦的面积分别为549.5和6 415.3 km2。

4 讨 论

本研究中,使用MODIS EVI为媒介,将2006到2013年的作物特征转换到2014年,这样引起的问题是同种作物的物候特征在多年间存在差异[23,25]。对于每种作物,2006到2013年的EVI时间序列曲线基本相同,但不同的天气情况和作物管理状况仍然引起了作物生长情况的不同,导致MODIS EVI时间序列的变化(图5)。例如在2013和2014年的日序为100 d时,苜蓿的EVI为0.7左右,明显低于其他年份。另外,可能是由于2012年严重干旱的原因[26],高粱的EVI峰值为在2012年为0.5,也明显低于其他年。因此,本研究使用多年EVI时间序列,包含了多种农作物的生长情况,这减小了多年间作物生长差异对训练样本的影响。

图5 研究区主要农作物的MODIS EVI曲线年际变化

针对Hao等[14]方法中需要进行MODIS NDVI和Landsat NDVI转换的问题,本研究直接使用历史(2006到2013年)MODIS EVI曲线获得分类年(2014年)的分类样本,避免了MODIS EVI和Landsat EVI间的转换。但是,本方法仍然存在缺点:1)本研究使用2006到2013年的CDL数据作为地面真实数据,并选择了CDL数据中用户精度较高的农作物种类,但CDL数据的错分会给参考EVI曲线带来误差。2)由于本研究定义2006到2013年的MODIS“纯象元”样本的阈值为80%,这也会引起2006到2013年MODIS EVI曲线的误差,从而影响各种作物的参考曲线。

在今后的农作物识别工作中有可能消除这2方面的缺陷。首先,从2014年起CDL数据开始提供分类置信度数据,可以挑选分类置信度较高的样本建立参考时间序列曲线。第二,定义MODIS“纯网格”的阈值是样本质量和样本数量的平衡,较高的阈值增加了网格内作物的纯度,但降低了样本的数量。所以,“纯网格”的阈值应根据不同试验区的情况由用户定义。最后,在建立参考曲线时,还需要提高算法对样本的容错能力,以降低不准确的样本对参考曲线的影响。

本文还尝试了基于参考MODIS EVI时间序列和Landsat NDVI短时间序列的30 m作物提早识别,结果表明基于参考时间序列获得的训练样本和Landsat NDVI时间序列可以在8月时获得精度较高的作物识别结果。Hao等[25]使用500 m分辨率的MODIS地表反射率数据进行堪萨斯州作物提前识别试验,其结果也表明作物识别精度和分类确定性在8月达到饱和。总之,在堪萨斯研究区,目前多光谱数据和植被指数数据可以在8月实现作物识别,加入更多的分类特征有可能进一步提高作物分类的时效性。

本文的试验区是美国堪萨斯州,研究区的特点是地块较大,在MODIS影像上存在较多纯象元。但在其他地区,例如中国大部分地区、东南亚等,地块破碎,田块面积较小,MODIS数据多为混合象元数据,因而不能直接使用MODIS数据作为媒介将作物的历史知识传递到分类年,从而获得训练样本。所以,需要考虑使用更高分辨率的遥感数据建立时间序列,进行作物分类知识的传递。例如,已有多种中分辨率的多光谱遥感卫星,如美国的Landsat-8[27]、欧洲的Sentinel-2[28]、中国的环境星、高分一号和高分二号卫星等[28-29]。在地块破碎地区,可以尝试综合应用这些中分辨率卫星数据建立类似MODIS时间序列的中分辨率时间序列数据,并以中分辨率时间序列数据作为媒介,进行作物知识的传递、在分类年不能获得野外调查数据时生成分类的训练样本。

另外,本文从CDL数据产品中提取验证样本进行分类精度验证。虽然CDL数据是遥感产品,存在不确定性,但本文通过选择分类精度高于85%的作物、建立CDL分类置信度掩膜和“纯”MODIS象元筛选,尽可能使用可信度高的样本作为验证样本。所以本文虽然没有使用地面数据验证分类结果,但其验证精度具有较强的说服力[30-31]。由于美国农业部提供了连续多年的农作物分布历史数据,可以支持本研究的内容,而且这是能在研究区获得的唯一数据;所以本文选用堪萨斯州作为研究区。在今后会继续尝试在国内获得多年历史作物分布数据,并将这个方法应用于国内作物分布提取业务。

5 结 论

针对目前农作物遥感识别工作中存在的缺乏地面数据和识别作物时效性较低的问题,本研究提出了使用多年历史样本直接获得分类年训练样本的方法。在堪萨斯州东南(ASD30区域)试验区,基于2006到2013年数据获得2014年的训练样本,使用这些样本和Landat NDVI数据进行了2014年30 m农作物提取,并探讨了使用短时间序列数据提前获得作物识别结果的可行性。试验结果表明:

1)使用完整的时间序列时,基于历史数据获得的分类训练样本数量为10 803,其中有10 317个样本的作物类型与CDL数据相同,使用这些样本识别作物时,总体精度为94.89%。

2)使用4-8月数据时,获得2014年样本的数量(10183个)、正确率(96.32%)、分类精度(94.02%)和作物面积(苜蓿549.5 km2、玉米1 999.5 km2、大豆2 839.1 km2和冬小麦6 415.3 km2)都已接近使用完整时间序列所获得的结果,这表明基于参考时间序列获得的训练样本可以在8月进行高精度的作物分布制图,在今后的工作中可以使用CDL置信度数据进一步提高参与建立参考曲线的样本质量。

[1] 唐华俊,吴文斌,余强毅,等. 农业土地系统研究及其关键科学问题[J]. 中国农业科学,2015,48(5):900-910.

Tang Huajun, Wu Wenbin, Yu Qiangyi, et al. Key research priorities for agricultural land system studies[J]. ScientiaAgriculturaSinica, 2015, 48(5): 900-910. (in Chinese with English abstract)

[2] Atzberger Clement. Advances in remote sensing of agriculture: Context description, existing operational monitoring systems and major information needs[J]. Remote Sensing, 2013, 5(2): 949-981.

[3] Pan Yaozhong, Li Le, Zhang Jinshui, et al. Winter wheat area estimation from MODIS-EVI time series data using the Crop Proportion Phenology Index[J]. Remote Sensing of Environment, 2012, 119(3): 232-242.

[4] 陈仲新,任建强,唐华俊,等. 农业遥感研究应用进展与展望[J]. 遥感学报,2016,20(5):748-767.

Chen Zhongxin, Ren Jianqiang, Tang Huajun, et al. Progress and perspectives on agricultural remote sensing research and applications in China[J]. Journal of Remote Sensing, 2016, 20(5): 748-767. (in Chinese with English abstract)

[5] Gallego J, Craig M, Michaelsen J, et al. Best practices for crop area estimation with remote sensing [C]. Ispra: GEOSS Community of Practice Ag 0703a. 2008.

[6] Zhong L H, Gong P, Biging G S. Efficient corn and soybean mapping with temporal extendability: A multi-year experiment using Landsat imagery[J]. Remote Sensing of Environment, 2014, 140(1): 1-13.

[7] 黄亚博,廖顺宝. 多源数据的土地覆被样本自动提取[J]. 遥感学报,2017,21(5):757-766

Huang Yabo, Liao Shunbao. An automatic method of samples collection for land cover classification based on multisource datasets[J]. Journal of Remote Sensing, 2017, 21(5): 757-766. (in Chinese with English abstract)

[8] Dong J, Xiao X, Kou W, et al. Tracking the dynamics of paddy rice planting area in 1986-2010 through time series Landsat images and phenology-based algorithms[J]. Remote Sensing of Environment, 2015, 160(4): 99-113.

[9] 郝鹏宇,牛铮,王力, 等. 基于历史时序植被指数库的多源数据作物面积自动提取方法[J]. 农业工程学报,2012,28(23):123-131.

Hao Pengyu, Niu Zheng, Wang Li, et al. Multi-source automatic crop pattern mapping based on historical vegetation index profiles [J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(23): 123-131. (in Chinese with English abstract)

[10] Muhammad S, Niu Z, Wang L, et al. Crop classification based on time series MODIS EVI and ground observation for three adjoining years in Xinjiang[J]. Spectroscopy and Spectral Analysis, 2015, 35(5): 1345-1350 .

[11] Muhammad S, Zhan Y L, Wang L, et al. Major crops classification using time series MODIS EVI with adjacent years of ground reference data in the US state of Kansas[J]. Optik-International Journal for Light and Electron Optics, 2016, 127(1): 1071-1077.

[12] Howard D M, Bruce K W. Annual crop type classification of the US Great Plains for 2000 to 2011[J]. Photogrammetric Engineering and Remote Sensing. 2014, 80(6): 537-549.

[13] Friesz A M, Wylie B K, Howard D M. Temporal expansion of annual crop classification layers for the CONUS using the C5 decision tree classifier[J]. Remote Sensing Letters, 2017, 8(4): 389-398.

[14] Hao P Y, Wang L, Zhan Y L. Using moderate-resolution temporal NDVI profiles for high-resolution crop mapping in years of absent ground reference data: A case study of Bole and Manas counties in Xinjiang, China [J]. ISPRS International Journal of Geo-Information, 2016, 5(5): 67.

[15] Wardlow B D, Stephen L E. Large-area crop mapping using time-series MODIS 250 m NDVI data: An assessment for the U.S. Central Great Plains[J]. Remote Sensing of Environment, 2008, 112(3): 1096-1116.

[16] Masialeti I S E, Wardlow B D. A comparative analysis of phenological curves for major crops in kansas[J]. Giscience& Remote Sensing, 2010, 47(2): 241-259.

[17] Shroyer J P, Thompson C, Brown R, et al. Kansas crop planting guide [EB/OL]. [2018-06-20] https://www.bookstore.ksre.ksu.edu/pubs/L818.pdf.

[18] USDA. National Agricultural Statistics Service [EB/OL]. [2018-06-20]http://www.nass.usda.gov/research/Cropland/SARS1a.htm.

[19] 边金虎,李爱农,宋孟强,等. MODIS植被指数时间序列Savitzky-Golay滤波算法重构[J]. 遥感学报,2010,14(4):725-741.

Bian Jinhu, Li Ai’nong, Song Mengqiang, et al. Reconstruction of NDVI time-series datasets of MODIS based on Savitzky-Golay filter[J]. Journal of Remote Sensing, 2010, 14(4): 725-741. (in Chinese with English abstract)

[20] USGS. Landsat Collections [EB/OL]. [2018-06-20] https://landsat.usgs.gov/ landsat-collections.

[21] Boryan C, Yang Z W, Mueller R, et al. Monitoring US agriculture: the US Department of Agriculture, National Agricultural Statistics Service, Cropland Data Layer Program[J]. Geocarto International, 2011, 26(5): 341-358.

[22] Zhong Y F, Zhang L P. An adaptive artificial immune network for supervised classification of multi-/hyperspectral remote sensing imagery[J]. IEEE Transactions on Geoscience and Remote Sensing, 2012, 50(3): 894-909.

[23] Lhermitte S J, Verbesselt W W, Verstraeten P, et al. A comparison of time series similarity measures for classification and change detection of ecosystem dynamics[J]. Remote Sensing of Environment, 2011, 115(12): 3129-3152.

[24] Breiman L. Random forests [J]. Machine learning, 2001, 45(1): 5-32.

[25] Hao P Y, Zhan Y L, Wang L, et al. Feature selection of time series modis data for early crop classification using random forest: A case study in kansas, USA[J]. Remote Sensing, 2015, 7(5): 5347-5369.

[26] Wu C, Chen J M. Diverse responses of vegetation production to interannual summer drought in North America[J]. International Journal of Applied Earth Observation and Geoinformation, 2013, 21(1): 1-6.

[27] Irons J R, Dwyer J L, Barsi J A. The next landsat satellite: The landsat data continuity mission[J]. Remote Sensing of Environment, 2012, 122(1): 11-21.

[28] Drusch M, Del Bello U, Carlier S, et al. Sentinel-2: ESA’s optical high-resolution mission for GMES operational Services[J]. Remote Sensing of Environment, 2012, 120(1): 25-36.

[29] Hao P, Wang L, Niu Z. Potential of multitemporal Gaofen-1 panchromatic/multispectral images for crop classification: Case study in Xinjiang Uygur autonomous region, China[J]. Journal of Applied Remote Sensing, 2015, 9(6): 096035.

[30] Hao P, Wang L, Zhan Y, et al. Crop classification using crop knowledge of the previous year: Case study in southwest Kansas, USA[J]. European Journal of Remote Sensing, 2016, 49(6): 1061-1077.

[31] 郝鹏宇. 基于多时相遥感数据的农作物分类研究[D]. 北京:中国科学院大学,2017.

Hao Pengyu. Crop Classification Using Time Series Remote Sensing Data [D]. Beijing: University of Chinese Academy of Sciences, 2017. (in Chinese with English abstract)

Early season crop type recognition based on historical EVI time series

Hao Pengyu1, Tang Huajun1※, Chen Zhongxin1, Niu Zheng2

(1./100081,; 2.,,,100101,)

Timely and accurate crop distribution maps derived from satellite observations could assist crop growth monitoring. Although crop mapping methodologies have been widely studied, there are still some drawbacks, such as the limitation of ground reference data and low efficiency of crop type mapping caused by using time series data of the entire year. The objectives of this study are: (1) to develop a new method, which can identify crop types using the crop records of the previous years; (2) to evaluate the performance of the method with different time series length, and try to acquire the crop type map at 30 m spatial resolution. The study area of this paper was the ASD30 of Kansas State, USA. We firstly used the cropland data layer (CDL) data and MODIS EVI(enhanced vegetation index) time series between 2006 and 2013 to generate reference EVI time series with the ABNet algorithm for the major crops in the study area, i.e. alfalfa, corn, sorghum and winter wheat. Then, we acquired the “possible” training samples in 2014 using the CDL records between 2006 and 2013. If a pixel was labeled as “Crop A” more than 4 times among the 8-year CDL records, the pixel was labeled as “possible Crop A” in 2014. Next, we compared the MODIS EVI of the “possible crop A” pixels and the reference EVI time series of Crop A, if the 2 profiles were matched, the “possible Crop A” was confirmed as a training sample of “Crop A”. Finally, we used these training samples and monthly composited Landsat NDVI (normalized differential vegetation index) to identify crop types at 30 m resolution. To analyze the effect of time series length on crop type identification performance, we tried 7 time series lengths (April, April-May, April-June, April-July, April-August, April-September and April-October), used MODIS EVI time series to acquire training samples for each time series length, and then identified crop types using the corresponding training samples and Landsat NDVI time series. Several metrics derived from the confusion matrix, such as overall accuracy, Kappa coefficient, were used to evaluate the classification performance. Results showed that when only time series data in April were used, we acquired 5 088 samples, and 91.86% among these samples had the same crop label with the CDL data. When longer time series data were used, more training samples in 2014 were acquired with higher accuracy. When entire EVI time series data were applied, 10 803 samples were acquired and 10 317 samples had same crop label with CDL data. When using these training samples and monthly composted Landsat NDVI to identify crop types at 30 m resolution, classification accuracies were low if April or April-May time series data were used, and overall accuracies were 66.12% and 52.51%, respectively. When time series length was April-October, overall classification was 94.89%. April-August time series achieved good classification performance, as 10 183 training samples were acquired, 96.32% samples had same label to CDL data, overall classification accuracy was 94.02%, and acreage of major crops was similar to CDL data. Finally, we could conclude: (1) The method proposed in this study can acquire train samples in the classification year when the ground reference data are absent. Using these training samples, we can obtain crop type distribution maps with high accuracy (better than 90%). (2) We can acquire the crop type map of the study area in August with the high classification accuracy which is similar to the result derived from the entire EVI time series, and has the similar crop acreage with CDL data for each crop. In the future, we can enhance this method by improving the previous-year training samples with CDL crop confidence layer.

crops; remote sensing; recognition; reference EVI time series; crop type classification; training samples; artificial annual network; cropland data layer (CDL)

郝鹏宇,唐华俊,陈仲新,牛 铮. 基于历史增强型植被指数时序的农作物类型早期识别[J]. 农业工程学报,2018,34(13):179-186.doi:10.11975/j.issn.1002-6819.2018.13.021 http://www.tcsae.org

Hao Pengyu, Tang Huajun, Chen Zhongxin, Niu Zheng. Early season crop type recognition based on historical EVI time series[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(13): 179-186. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2018.13.021 http://www.tcsae.org

2018-03-05

2018-06-04

博士后创新人才支持计划(编号:2017BX00286);农业部“948”计划项目(2016-X38)

郝鹏宇,男,博士,现从事农作物遥感制图研究。Email:haopy8296@163.com

唐华俊,男,研究员,中国工程院院士,研究方向为农业遥感、全球变化与土地科学的理论和应用。Email:tanghuajun@caas.cn

10.11975/j.issn.1002-6819.2018.13.021

TP701

A

1002-6819(2018)-13-0179-08

猜你喜欢

训练样本农作物作物
高温干旱持续 农作物亟须“防护伞”
俄发现保护农作物新方法
夏季农作物如何防热害
厉害了!农作物“喝”上环保酵素
作物遭受霜冻该如何补救
四种作物 北方种植有前景
人工智能
内生微生物和其在作物管理中的潜在应用
作物遭受药害的补救措施
基于小波神经网络的网络流量预测研究