基于GF-1和MODIS时序NDVI的种植结构提取
2020-06-22李家宝王贺封张安兵李红红
李家宝,王贺封,张安兵,李红红
(河北工程大学 矿业与测绘工程学院,河北 邯郸 056038)
作物的种植结构是反映作物类型、空间分布、种植面积和轮作模式的综合农业信息,其时空变化信息是农业可持续发展的重要研究内容[1]。逐层统计汇总是获得农作物种植结构信息的传统方式,但存在实地大面积调查测量误差大、耗时耗力和时间滞后的问题[2]。遥感技术因其高时效、宽范围和低成本的优势,近年来在农业、水资源管理方面的应用越来越普及,为大区域准确和快速获取农作物种植结构提供了新的技术手段[3]。
作物在遥感影像上呈现的不同光谱特征、时相特征和空间特征是种植结构遥感解译的理论依据[4]。单一影像的解译方法主要是根据作物光谱差异并结合作物生长的关键期,找到识别作物的最佳时相,操作简单;但由于受“异物同谱”现象影响,为确保作物识别精度,要求影像具有较高空间分辨率和较好的影像质量[5-6]。而时间序列影像的解译方法充分利用作物整个生长生育阶段的信息,一定程度上解决了单一影像方法的混合像元问题。归一化植被指数NDVI (normalized difference vegetation index)反映了植被生长状态及植被覆盖度,NDVI 的时序变化对应了植被的生长和衰落等活动过程[7],并反映出农作物各自的生长差异,因此NDVI被广泛应用于植被信息提取和地物识别[8-9]。但应注意到,由于数据源的限制,目前能够构成完整作物生长周期的时间序列数据大多集中在中低空间分辨率,难以获得较好的提取精度。为此,本文探讨运用GF-1监督分类结果和MODIS NDVI时间序列共同参与决策树构建来提取区域作物种植结构的方法,克服单一数据源或单一提取方法缺点的同时获得更好解译精度。
1 数据获取与预处理
1.1 区域概况
本文选取石津灌区为试验区域,占地面积4 174.48 km2,其中耕地面积29万hm2,主要农作物为冬小麦、夏玉米及苹果、梨、桃等,为国家大II型灌区,位于河北省中南部,太行山东麓,滹沱河下游以南、滏阳河以北、以西,覆盖石家庄、衡水、邢台3个市的14个县(市、区)。
1.2 数据选择
基于物候特征,冬小麦三月返青、四月拔节,此时影像中冬小麦与其他地物的光谱差异最为明显,因此选择三月底、四月初的高分影像初步识别冬小麦;夏玉米九月底全部收获,十月上旬开始播种冬小麦,夏玉米收获后其用地光谱特征在影像中表现为裸地,十月果树还未完全步入落叶期,依然表现为植被的光谱特征,故选择九月底或十月中上旬影像初步识别夏玉米和果树。为确保达到最佳解译结果,对比2014年3至4月、9至10月所有可获取高分数据的质量后,选择使用4月3日和10月16日两期高分影像。为保证时相匹配,从NASA网站下载2014年6月至2015年6月一整年MOD13Q1植被指数产品,共23幅影像,并对23幅影像进行编号,见表1。
1.3 数据预处理
高分一号影像的数据预处理主要包括:辐射定标、大气校正、正射校正、影像拼接、研究区裁剪和几何校正。为使MOD13Q1数据与高分数据在地理位置上统一,下载2014年任意一期覆盖研究区的Landsat8影像,以15 m空间分辨率的Landsat8全色波段为基准,对高分一号影像进行几何校正。MODIS影像数据预处理主要包括:投影变换、影像裁剪、数据重采样。MOD13Q1产品NDVI的原始数据值范围是[-10 000,10 000],需要将所有影像的DN值均乘以0.000 1变换为NDVI正常值范围[-1,1]。最后将变换值域后的23幅影像进行叠加,形成MODIS NDVI时间序列数据。
1.4 样本选择
通过目视解译方法,在Google earth中选取研究区范围内建筑、冬小麦、夏玉米及果树4类样本,并保证样本均匀分布和随机性,最终选取建筑样本150个,冬小麦样本530个,夏玉米样本350个,果树样本130个。其中,150个建筑样本,400个冬小麦样本,250个夏玉米样本,80个果树样本作为监督分类和构建时间序列的训练样本;130个冬小麦样本,100个夏玉米样本,50个果树样本用来检验总体解译效果。
2 研究方法
首先使用最大似然法对预处理后的高分影像进行监督分类,以获取初步识别结果;然后根据训练样本统计绘制各作物MODIS NDVI变化曲线,分析NDVI的时间序列,选择区分作物的最佳时相并确定识别阈值;最后构建监督分类结果与NDVI时序共同约束下的决策树分类模型,识别出研究区主要作物的空间分布。
2.1 高分影像的监督分类
对4月3日和10月16日高分数据使用最大似然法进行监督分类,分类后结果中存在大量的细小图斑,需要对结果进行包括Majority分析、聚类处理及过滤处理在内的分类后处理。分类后处理可以去除监督分类初步结果中的细小图斑,并能够在一定程度上简化分类影像。
2.2 NDVI时间序列的构建
使用目视解译出的各作物训练区裁剪MODIS NDVI时间序列影像,结合ENVI软件统计工具,统计得到冬小麦、夏玉米、果树、建筑训练区的NDVI时间序列特征值,见表1,由NDVI均值得出作物的生长趋势线,见图1。
2.3 GF-1监督分类结果与MODIS NDVI时间序列共同约束下的决策树构建
高分数据具有受气候因素影响,如云雨的覆盖影响较为严重的数据特性,导致监督分类中对作物的错分、漏分,从而造成总体解译结果的精度损失。以监督分类结果为约束的决策树构建能对错分、漏分像元进行筛选和剔除。影像分类阈值的确定对决策树的精准实施起决定性作用,本文的阈值指标对应NDVI的特征值。通过观察作物生长趋势线,找出区分不同作物的最佳识别点,使用不同时相NDVI最大或最小值作为阈值限制作物提取范围,争取达到某种作物的完整提取。
2.3.1 冬小麦决策树识别模型
由图1中冬小麦MODIS NDVI值随时间变化的曲线可以看出,序列号为11的时相是区分冬小麦的最佳时相,此时NDVI值处于主要作物中的最小值,针对该特征的约束条件为:第11时相的NDVI小于冬小麦第11时相的最大值。从序号为9的时相到第12时相,冬小麦NDVI值有一个明显的下降,是冬小麦生长周期中一个可与其他地物区分的明显特征,针对该特征的约束条件为:第9时相与第10时相NDVI之和大于第11时相与第12时相NDVI之和。由于GF影像较高的空间分辨率,观察4月3日的GF-1原始影像发现,此时是区分冬小麦与其他地物的最佳时相,可以保证监督分类冬小麦的最佳分类精度,故将监督分类结果作为首要约束,针对该特征的约束条件为:提取4月3日高分影像监督分类等于冬小麦的部分。本文综合约束下的冬小麦决策树识别模型为:
GF(4.3)=冬小麦
NDVI(11)<0.458 2
NDVI(9)+NDVI(10)>NDVI(11)+NDVI(12)
其中GF(4.3)为4月3日高分影像监督分类结果NDVI(A)中A为第A时相。
2.3.2 果林决策树识别模型
结合监督分类结果观察原始高分影像发现,4月3日的监督分类结果中出现了果林和建筑的大面积错分,故在高分监督分类结果提取果树和建筑两类地物。根据NDVI变化曲线,第11时相的果树NDVI的最小值大于建筑NDVI的最大值,因此对于MODIS影像使用第11时相区分果树与建筑,针对该特征的约束条件为:第11时相的NDVI大于建筑NDVI的最大值。本文综合约束下的果树决策树识别模型为:
GF(4.3)=建筑+果树
NDVI(11)>0.617 8
2.3.3 夏玉米决策树识别模型
果树和夏玉米生长周期存在重叠期,所以首先在10月16日高分监督分类结果中将已确定的果树结果剔除。因为影像质量问题,在10月16日高分影像监督分类结果中,建筑和夏玉米出现严重的错分现象,故将夏玉米和建筑一同提取,再使用其他约束条件单独提取夏玉米。从MODIS NDVI时间序列曲线可以看出,夏玉米在第15时相NDVI达到最大,因为此时相正值夏季,是所有植物生长最旺盛的季节,使NDVI值大于夏玉米NDVI在第15时相的最小值,能提取出夏玉米及大部分同期生长植物并排除居民区;第12、13时相是夏玉米播种生长阶段,NDVI值较小,其他植物生长旺盛,NDVI值维持在较高水平,使用12、13时相的最大值共同约束,区分夏玉米于其他茂盛植物,针对该特征的约束条件为:第12、13时相的NDVI值小于该时相夏玉米NDVI最大值。高分数据和MODIS数据综合约束下的夏玉米识别模型为:
GF(10.16)≠果树
GF(10.16)=建筑+玉米
NDVI(15)>0.622 4
NDVI(12)<0.614 4
NDVI(13)<0.712 8
其中GF(10.16)为10月16日高分影像监督分类结果。
3 结果与分析
3.1 GF影像监督分类结果与评价
基于GF-1监督分类的结果如图2所示。根据Google Earth选取的验证样本检验GF数据监督分类结果中的正确分类点,对4月3日和10月16日GF影像主要作物的分类结果进行精度评价,见表2。
日期作物类型验证样本个数正确分类个数分类精度/%4月3日冬小麦13011991.58果林50438610月16日夏玉米1006565果林504488
理想状况下,高空间分辨率影像与监督分类的结合可以获得较高的解译精度[10],但通常受到所获取到的GF数据质量的影响,解译精度会有所降低。从表2中可以看出,4月3日影像上冬小麦和果林的分类精度相对较高,是因为该时相冬小麦和果林都有其独特的具有可分性的光谱特征;再结合GF原始影像,发现分类结果中存在部分将建设用地划分为果林的多分现象。从表中可以看出,10月16日影像对夏玉米的解译效果较差,观察GF原始影像发现,气象条件对该时相作物光谱特征的影响较大,云雾、日照条件等使地物间可分性降低,最终导致夏玉米分类精度较其他地物的大幅度下降;又因该时相果林的光谱特征明显区别于其他地物,果林的分类精度仍保持在较高水平。
3.2 GF-1监督分类与NDVI时间序列共同约束的决策树分类结果与评价
基于GF-1监督分类与NDVI时间序列共同约束的决策树产生的解译结果如图3所示。
图3 多种约束决策树作物解译结果Fig.3 Crop interpretation results of multiple constraint decision trees
3.2.1 基于训练验证点的分类精度验证
根据Google Earth选取的验证样本检验综合解译结果,分类精度见表3。
表3 基于Google Earth样本点的精度验证表
3.2.2 基于随机点的分类精度验证
使用Arcgis的随机点生成工具,在研究区内随机生成200个随机点,在综合解译方法的冬小麦、果林和夏玉米结果中分别进行统计,200个点中共有132个点对应冬小麦,54个对应果林,113个对应夏玉米;再将这些点分别投映到Google Earth中,统计各类别点的正确分类个数,对综合方法的分类精度做出评价,分类精度见表4。
表4 基于随机点的精度验证表
由表3和表4可见,两种验证方法的结果基本一致,都能观察到分类精度的显著提高。基于监督分类与决策树的综合分类方法的总解译精度达93%以上,相比较于单纯的监督分类,冬小麦分类解译提高3%以上,果树解译精度提高8%以上,夏玉米解译精度提高26%,总体精度提高了10%以上。
4 结论
1)MODIS NDVI时间序列和GF影像监督分类结合的决策树综合分类方法的精度较高,总体分类精度达到93.13%,较4月3日的GF影像监督分类,精度提高了4%以上,较10月16日的GF影像监督分类,精度提高了10%以上,说明该方法具有较高的识别精度,能更好地反映区域主要作物的种植分布,适合作物的分类和提取。
2)本研究综合方法的夏玉米的解译精度较单纯的监督分类有了很大的提升,因为10月16日的GF影像质量不利于区分夏玉米,导致直接监督分类夏玉米的可行性降低,只关注夏玉米识别精度的提升,并不能体现出该方法在解译精度方面的优越性。高分影像监督分类的冬小麦和果林的解译已经取得较好效果,在使用综合解译方法后精度依旧有4%以上的提高,证明该方法可一定程度克服GF数据质量的影响,并对GF影像的监督分类结果有一定的改善、修正效果。
3)GF影像和MODIS数据的综合使用,使数据更好地发挥各自的优势并在时空分辨率上相互补充,提高了数据的可用性和应用潜力。
本文在选取样本时,采用了目视解译的方法,这会对遥感解译结果造成一些人为的误差。由于本文研究区域跨多个市县,尚缺少对该区域的完整的作物种植信息的统计数据,故精度上未采用统计数据进行验证,对于其他区域,可增加统计数据验证分类精度,对本方法进行更加全面的精度评价。