基于遥感地理特征曲线的主要农作物种植面积大尺度提取
2021-03-25乌兰吐雅于利峰包珺玮许洪滔乌云德吉任婷婷赵佳乐敦惠霞于伟卓
乌兰吐雅,于利峰,包珺玮,许洪滔,乌云德吉,任婷婷,赵佳乐,敦惠霞,于伟卓
(1.内蒙古自治区农牧业科学院农牧业经济与信息研究所,内蒙古呼和浩特 010031;2.内蒙古自治区农业遥感工程技术研究中心,内蒙古呼和浩特 010031)
区域尺度上提取作物面积信息是农情遥感监测的重要内容之一。实时、准确地获取农作物类型分布信息对粮食安全、社会经济、政策制定及生态功能评价等都有重要的影响[1]。随着贸易的全球化,快速提取大尺度的农作物信息引起更多关注[2-10]。遥感技术以其信息监测获取的快效率、大尺度和多谱段,成为当前大尺度农作物种植结构研究及农业信息化服务主要的研究途径[6]。然而,遥感提取农作物面积信息受到遥感影像轨道号、遥感卫星周期、天气、农作物物候特征等多种因素影响。中高分辨率的遥感影像虽然对于农作物类别提取的精度较高,但因其重访周期长、幅宽窄,无法满足农作物关键生育时期的要求,只能受限于地块尺度的研究[1]。
大尺度上提取农作物遥感识别及提取农作物种植面积的研究主要有:遥感数据源上应用OLI数据[3,11]、GF-1WFV影像[12]、TM影像[13]等中等分辨率遥感影像。中分辨率遥感影像提取农作物种植面积,比起低分辨率遥感影像,混合像素相对少,提取精度高。但由于受到卫星轨道周期及云雨等气象条件的影响,大尺度上应用主要在我国西部新疆、甘肃等干旱地区。利用多时相MODIS 卫星数据提取大尺度农作物种植面积的研究最多[1,4,5,8,10,14-16]。MODIS影像虽然空间分辨率较低,但时间分辨率较高,结合农作物物候特征能提取大尺度的作物空间分布。大尺度信息提取技术方法概括起来有以下几种:随着大数据的发展,海量数据中如何提取作物种植面积也成热门研究,DONG 等[3]利用Landsat 8影像研究亚洲东北部水稻绘制,用云计算方法,使用Google Earth Engine(GEE)平台处理2014年所有可用的Landsat 8 图像,提取研究区水稻种植面积;考虑时间分辨率和空间分辨率的优势,基于多源数据融合技术提取大尺度农作物面积种植。刘文斌等[9]以湖北江汉平原和湖南洞庭湖平原为例,基于人工神经网络多源数据融合技术提取冬油菜面积。吴峰云[17]使用GF-1 和MODIS数据融合技术提取的鄱阳湖区域水稻空间分布。考虑不同农作物物候特点,用多时相或时间序列遥感数据提取农作物种植面积的研究较多。孙华生[4]利用多时相MODIS数据提取我国水稻种植面积和长势信息,侯玉印[5]基于MODIS NDVI时间序列数据提取的肯尼亚玉米种植面积,邓帆等[10]基于多时相遥感影像监测江汉平原油菜种植面积,平跃鹏[18]基于MODIS时间序列地表物候特征分析农作物分类,吕婷婷等[19]、张健康等[20]、郝卫平等[21]用多时相遥感数据提取柬埔寨、我国的黑龙港地区、东北三省农作物信息,取得了较好的精度;考虑到遥感影像的混合像元问题,蔡薇等[22]分解像元提取小麦种植面积,RMS 均值小于0.009 6。王利民等[23]综合NDVI时序特征的基础上对混合像元分解,提取冬小麦种植面积,相对误差率为7.11%。王凯等[24]使用GF-1数据,用决策树与混合像元分解模型早期估算冬小麦种植面积,精度达到90.00%。
内蒙古是我国13个粮食主产区之一,也是2019年仅剩5个粮食净调出省份之一[25]。内蒙古东西跨度大,东部到西部降水量、气温、积温及生活方式大不同,不同区域种植农作物也不同,本研究选择内蒙古东部呼伦贝尔市和兴安盟,基于遥感地理特征曲线,分区域建模型提取研究区主要农作物种植面积,为自治区农作物种植结构研究及农业信息化管理提供科学思路。
1 材料和方法
1.1 研究区概况
呼伦贝尔市和兴安盟地处44°05′~53°10′N,115°01′~126°36′E,位于内蒙古东部。东西630 km、南北975 km,总面积31.258 3 万km2,占内蒙古自治区面积的26.42%,南部与通辽市相连,东部以嫩江为界与黑龙江省为邻,北和西北部以额尔古纳河为界与俄罗斯接壤,西北与蒙古国交界,西南与锡林郭勒盟相连。大兴安岭以东北——西南走向纵贯研究区,海拔700~1 700 m,以林区为主。西北为海拔550~1 000 m,为呼伦贝尔大草原,以牧区为主。在林区与牧区间零星分布着一些农场,种植春小麦、油菜等作物。大兴安岭东麓,东北平原——松嫩平原边缘,海拔200~500 m,以种植业为主,主要种植玉米、大豆、水稻、杂粮等。研究区北部位于温带北部,大陆性气候显著,气候特点是冬季寒冷漫长,夏季温凉短促,春季干燥风大,秋季气温骤降霜冻早;热量不足,昼夜温差大,有效积温利用率高,无霜期短,日照丰富,降水量差异大,降水期多集中在7—8月。南部属温带半干旱季风气候,四季分明。无霜期95~145 d,大部分地区110~130 d。年降水量平均为400~450 mm,雨热同期,种植一季作物。大部分地区日照2 800~3 100 h,中南部地区10℃以上积温2 200~3 100℃。从北向南气温、积温、光照、无霜期递增,而降水量、相对湿度递减。
1.2 空间数据处理及特征数据集的构建
美国NASA 网(http://edcimswww.cr.usgs.gov)下载2018年46期184 景8 d 反射率(MOD09Q1)数据,在ENVI 软件里通过投影转换、镶嵌、裁剪、波段运算,再经过降噪滤波器(Noise Reduction Filter,NRF)处理,去噪去云,得到研究区时间序列NDVI数据集,并计算5月的NDVI最低值。计算公式
式中,b2为近红外反射率,b1为红波段反射率,分别是MOD09Q1数据的第2波段和第1波段。
式中,b1、b2、b3、b4分别为5月1日、9日、17日、25日的NDVI值。
本研究为了制图更直观,NDVI值乘以10 000。下载2018年5月的4期16景(MOD09A1)数据,在ENVI 里通过波段运算,计算地表水分指数(LSWI)空间分布,并计算5月最高值。
式中,b2为近红外反射率,b6为短波红外反射率,分别是MOD09A1数据的第2波段和第6波段。
式中,b1、b2、b3、b4分别为5月1日、9日、17日、25日的LSWI值。
下载研究区DEM数据,在Arcgis 里投影转换,镶嵌剪切,并计算坡度空间分布图。将以上50个数据集成新的数据集,作为特征曲线数据集,为提取研究区主要农作物种植面积数据(图1)。
图1 特征曲线数据集RGB 合成
1.3 建立解译标志及验证数据
2018年7月18—30日,项目组在呼伦贝尔市和兴安盟用北斗手持机和奥维互动地图软件打点,建立解译标志和验证数据,共打点2 210个,其中,玉米539个、大豆303个、水稻84个、春小麦331个、油菜398个,其他555个。打点数据与研究区Rapid Eye影像叠加,确认农作物空间分布面积,保留农作物种植面积大于25 hm2地块的打点数据,作为本次研究的解译标志和验证数据,有效打点数据1 827个,其中1 188个作为建立模型的感兴趣数据,639个数据作为验证数据(图2)。
图2 解译点和验证点空间分布
1.4 研究方法
1.4.1 按农业资源区划特点,分区提取农作物面积信息
1.4.1.1 大兴安岭东麓丘陵平原农业区 包括阿荣旗、莫力达瓦达斡尔族自治旗、扎兰屯市、突泉县、科右中旗、乌兰浩特市、科尔沁右翼前旗等旗县市。这些区域气温较高,无霜期较长,降水量较多,雨热同期,水资源丰富,土壤肥沃,腐殖质含量高,适宜种植玉米、大豆、水稻等。
1.4.1.2 大兴安岭山地林业区及大兴安岭西麓呼伦贝尔高平原牧业区 大兴安岭山地林业区包括呼伦贝尔市的额尔古纳市、根河市、牙克石市、鄂伦春旗及兴安盟的阿尔山市,从北到西南贯穿整个研究区;这些区域海拔比较高,土壤肥沃但土层较薄,气候寒冷,无霜期较短,天然林占主导地位。呼伦贝尔市高平原牧业区,包括新巴尔虎左旗、新巴尔虎右旗、陈巴尔虎旗、鄂温克旗、海拉尔区、满洲里市;气温较低,降水量较少,光照充足,风大;草场面积大,草质优良,发展畜牧业潜力大。这两个区域零星分布着一些农场,主要种植小麦和油菜等生育期较短的作物。
1.4.2 降噪滤波(NRF),减少误差 降噪滤波是从卫星图像中提取植被的季节变化和年际变化时,为去除随机生成的云和云阴影、灰尘、烟雾等影响植被长势的外界因素为目的而开发的噪声消除滤波。该时间序列数据处理模型,能够很好地纠正原始NDVI时间序列曲线中的突变噪声,消除曲线的“突增”和“突降”的噪声。曲线不仅有较好的平滑度,也保留了真实的细节信息,且平滑曲线符合植被生长规律,有利于植被物候期的高精度信息提取(图3)。
图3 农作物NRF 滤波前后NDVI时间序列变化对比
1.5 主要农作物标准生长曲线的建立
根据林区和牧区的农作物种植情况,野外定位的解译标志点与该区域特征集数据叠加,提取春小麦和油菜特征曲线,作为这两种作物分类的标准曲线。同样的方法,农区提取玉米、大豆、水稻的特征曲线,作为这3种作物分类的标准曲线。从特征曲线上看,不同农作物特征曲线相互之间确实存在差异,用特征曲线分类是可行的(图4、图5)。
图4 小麦、油菜的特征曲线
图5 玉米、大豆、水稻的特征曲线
1.6 CART 决策树分类方法
CART 决策树是在1984年由Breman 提出的一种二叉树分类方法,它能够充分利用空间辅助信息,对影像的多个特征变量进行选择性组合,识别繁多有效信息,从而实现对未知数据的分类、预测和挖掘。该方法在研究区有足够样本数量的情况下,采用GiNi 系数作为最佳测试变量和分割阈值的准则。公式为
由于每次分割都只将样本集划分为两个子集,最终生成的决策树是一个二叉树,结构简洁明了,使用的分割规则清晰易懂,整个过程也比较符合人们一般的思维习惯。
2 结果与分析
2.1 研究区主要作物特征曲线特征分析
2.1.1 大兴安岭山地林业区及大兴安岭西麓主要农作物遥感地理特征曲线分析 小麦和油菜分布于大兴安岭林业区和山地至高原过渡带,这些区域土壤肥沃,但气温偏低,无霜期短。从小麦和油菜的特征曲线上看,都有两个峰值,小峰值几乎完全重叠;第一个峰值的特征,小麦的峰值出现时间比油菜出现早,油菜7月20日左右达到峰值,小麦7月12日左右达到峰值,7月20日之前小麦的NDVI值高于油菜,之后油菜NDVI值高于小麦。
2.1.2 大兴安岭东麓主要农作物玉米、大豆、水稻遥感地理特征曲线分析 大兴安岭东麓丘陵和平原地区的主要农作物玉米、大豆、水稻的特征曲线(图4)。从3种农作物特征曲线的分布来看,水稻特征明显,较好区分。3种作物均有两个峰值,第1个峰值特点是水稻出现的峰值时间比玉米、大豆早,7月28日达到峰值,而玉米和大豆8月5日达到峰值;第2个峰值中,水稻特征特别明显,特征波段49中,水稻值低于2.50,而玉米和大豆值在5.28 以上;特征波段48中,水稻值185.42,而大豆值390.00,玉米值480.82;特征波段47中,水稻值在2 018.00 以下,大豆值2 903.00,玉米值2 582.00。
2.2 构建基于遥感地理特征曲线的主要作物分类的决策树模型
根据研究区的农业资源区划特点,把建好的遥感地理特征数据集分为林、牧区特征数据集和农区特征数据集。根据两个区域的自然特征及农作物特征标准曲线差别分别建立主要农作物提取模型(图6)。用野外定位的解译标志点作为感兴趣区域,提取特征值,用CART 决策树分类方法林、牧区分为水域、林地、草地、小麦、油菜、甜菜、玉米、大豆等种类,同样的道理农区用CART 决策树分类方法分为林地、草地、玉米、大豆、水稻、其他作物,其他作物包括高粱、药材、甜菜、向日葵、马铃薯、小麦等,分类结果见图7。
图6 主要农作物遥感识别流程
研究区地势从西北到东南逐渐降低,山地、丘陵到平原,植被类型多,林地、草地、耕地,相互交错分布。农区南部科尔沁右翼中旗分布着科尔沁沙地、盐碱地、退化草地、零星林地、低湿地,玉米、大豆、多种杂粮。不同植物类型卫星遥感影像上的反射率差别大,加上地块破碎,农区的主要农作物提取过程很复杂,CART 决策树模型共分为747个节点(图8),由于过程过于复杂,决策树模型没有显示。
2.3 分类结果与精度分类
用决策树分类模型执行后,对结果进行更改分类颜色、分类统计分析、小斑点处理、栅格转矢量、制图等操作,结果见图9。以实地调查数据为标准,对模型提取的5种农作物进行精度检验,并进行评价。正确分类的玉米、大豆、水稻、春小麦、油菜的样本点分别为168、142、70、117、81个,相对精度分别为85.71%、70.65%、83.33%、75.48%、73.64%,农作物平均相对精度在77.48%左右,满足大尺度应用需求(表1)。
图7 林、牧区主要农作物遥感识别决策树
图8 农区主要农作物CART 分类运行
3 结论与讨论
以MODIS NDVI数据、DEM数据、坡度数据、LSWI数据构建的特征数据集,根据不同农作物的特征曲线及农业区划,在不同区域构建不同分类模型,并对结果进行精度评价,得到如下结果:
图9 牧、林区和农区农作物分类
表1 研究区农作物样本点提取精度与实地调查数据对比统计
大尺度上应用遥感地理特征曲线区分不同作物,快速提取主要农作物的种植面积是可行的。本研究总体相对精度达到77.48%左右,能够满足大尺度业务化监测需求,但没有达到周思等[8]的基于MODIS的黑龙江省农作物种植结构提取研究中的精度80%以上,原因在于本研究区南部处于科尔沁沙地北部边缘,比起北部地物景观破碎度大,用MODIS卫星数据混合像素较多,作物信息提取误差比北部大。今后大尺度作物信息提取研究中,更加细化研究区区划,地物景观破碎度大的区域用空间分辨率高的卫星遥感数据。根据地面实际情况采用卫星遥感数据源和信息提取方法,提高大尺度作物信息提取精度。
CART 决策树分类方法是一种监督分类方法,样本的数量及空间分布对分类精度至关重要。样本数量多,分布均匀,能提高分类精度。MODIS 卫星遥感数据,适合地块较大的区域的信息提取;地块破碎,作物种植复杂的区域误差较大。