APP下载

基于面向对象决策树的农作物分类识别方法

2016-05-04玉素甫江如素力李兰海哈丽旦司地克

关键词:面向对象基本农田决策树

玉素甫江·如素力, 李兰海, 哈丽旦·司地克, 高 倩

(1.新疆师范大学 地理科学与旅游学院 新疆干旱区湖泊环境与资源实验室,新疆 乌鲁木齐 830054;

2.中国科学院新疆生态与地理研究所 荒漠与绿洲生态国家重点实验室,新疆 乌鲁木齐 830011)



基于面向对象决策树的农作物分类识别方法

玉素甫江·如素力1,2,李兰海2*,哈丽旦·司地克1,高倩1

(1.新疆师范大学 地理科学与旅游学院 新疆干旱区湖泊环境与资源实验室,新疆 乌鲁木齐 830054;

2.中国科学院新疆生态与地理研究所 荒漠与绿洲生态国家重点实验室,新疆 乌鲁木齐 830011)

摘 要:文章为缓解农业遥感农作物分类识别方面的分类精度与成本、空间分辨率与识别方法之间的矛盾问题提供新的方法。以中分辨率的Landsat TM / ETM+ 遥感影像为主要数据源,农田系统图斑的矢量数据作为参考,面向对象方法和CART决策树算法等相结合,提出一种面向对象决策树的农作物分类识别方法。文章分别用提出的方法和传统的决策树分类方法对新疆焉耆盆地2011至2014年的各种地物进行分类识别,4年的平均分类精度92.09 %(Kappa 系数为0.91)。新方法不仅提高农作物分类识别的总精度,还能比较完整地保持农田作物的轮廓。该成果为中等分辨率的遥感影像以高精度的农作物分类识别、信息提取和动态监测提供可能。

关键词:决策树; 基本农田; 农作物; 分类识别; 焉耆盆地;面向对象

遥感技术以其动态、及时、综合、成本低等优势已成为获取土地覆盖分类[1-3]、土地利用变化监测[4,5]、农作物种植面积提取[6,7]、区域碳循环[8]等方面的主要手段。近几十年来,农业遥感受到世界各国的普遍重视,遥感技术面临着突飞猛进的发展[9]。及时获取农作物种植面积信息及其空间分布状况,对于准确估计和预测农作物产量,制定农业政策,确保国家粮食安全具有重要意义[9,10]。国内外学者应用遥感技术,以高精度地分类识别农作物,提取其面积信息及空间分布状况等方面进行了大量的研究[11,12]。目前,遥感数据为主要信息源的农作物分类识别方法较多。传统的基于像元的分类方法(如监督分类或非监督分类等)由于根据地物的光谱信息进行分类,无法有效的解决“同物异谱、同谱异物”的难题,并且分类精度受到局限[13]。神经网络、模糊分类、改进的最大似然分类、遗传算法、支持向量机等方法的引入提高了分类精度,但这些方法大部分仅利用像元的特征,对于色调分布等较为复杂的空间关系没有考虑,仍然相当于图像理解过程的第一层次[14]。一些学者充分利用遥感影像提供的大小、形状、纹理、相邻像素间关系等形状和空间位置特征,针对高分辨率遥感影像(分辨率在10 m以内的影像[15])以及光谱识别提出了面向对象的信息提取方法[16-19]。面向对象法采取决策专家系统支持的模糊分类算法,突破了单纯基于光谱信息进行影像分类的局限性,大大提高了高分辨率影像的自动识别精度[20]和速度[21]。但高分辨率遥感影像的价格昂贵,费时费力,对较长时间大尺度的农作物动态监测根本无法承受[22]。可以看出,在农作物的分类识别及监测方面,分类精度与成本、空间分辨率与识别方法的矛盾是目前农业遥感的瓶颈。除此之外,干旱、半干旱地区土地利用/覆盖的遥感影像分类,普遍受到“同物异谱、同谱异物”现象的影响和制约[23],如何快速准确获取它的土地利用/覆盖对揭示人类活动与绿洲演变的内在关系、绿洲水土资源的合理开发和可持续发展有重要意义[24]。

中时空分辨率的Landsat系列卫星数据(如Landsat TM/ETM/OLI)的连续性,为农业遥感等领域继续提供高质量的免费图像数据[25]。但因其空间分辨率的尺度等问题,以基本农田精度提取农作物种植面积信息及其空间分布是目前亟待解决的问题。本研究以我国西北干旱区典型的农业区——新疆焉耆盆地为研究靶区,参考我国《基本农田保护条例》规定的划定基本农田指标体系[26],以中等分辨率的Landsat遥感影像为主要数据源,提出一种高精度的农作物分类识别与动态监测方法。

1研究方法

1.1基本农田图斑及其提取

根据《基本农田划定技术规程》地块可分为基本农田、基本农田保护区、基本农田保护片(块)、基本农田图斑等[26]。其中,基本农田图斑是农田系统的最基本单元,是对基本农田实行特殊保护而依法划定的以单一地类地块为单位的耕地保护区域。可以看出,基本农田图斑的空间轮廓是相对固定,而种植的作物种类由其所有者决定的地块。现场调查发现,研究区有一些农田图斑临时性划分种植不同农作物,这提高用中分辨率遥感影像分类识别农作物类型的难度。因此,本研究先矢量化提取基本农田图斑数据,再用面向对象方法进行农田图斑的进一步分割,面向对象方法和决策树算法相结合,实现不同农作物的分类识别。

1.2波谱分析与最佳波段组合

由于传感器、大气状况等因素的影响,在成像过程中往往产生“同物异谱,异物同谱”现象[27]。这对图像融合波段选择和图像分类识别带来的很大的困难。文章以Landsat TM / ETM+影响为主要遥感数据信息源,通过比较分析不同地物多时相光谱信息的特征值确定最佳波段组合方式。其主要原则是:各波段组合的最佳指数值同各波段的均方差之和成正比、与各波段间相关系数之和成反比[28,29]。

1.3土地利用类型体系的构建

土地利用类型,是指土地利用方式相同的土地资源单元,是根据土地利用的地域差异划分的反映土地用途、性质及其分布规律的基本地域单位。它是人类在改造利用土地进行生产和建设的过程中所形成的各种具有不同利用方向和特点的土地利用类别。本研究参考中国国家标准化管理委员会于2007年8月发布的《土地利用现状分类》[30]和FAO/UNEP土地分类系统,适当考虑研究区农作物物候特征,在实地考察和验证的基础上,建立研究区的一级和二级土地利用类型体系。

1.4基于See5.0的自动决策树建立与Cart分类

本研究采用美国地质调查局(USGS)在进行土地覆盖分类项目过程中开发的支持决策树分类和回归建模的两个软件模块See5.0和Cart,自动完成决策树构建过程。其中,See5.0的主要功能是数据挖掘(Data Mining),找出隐含在训练样本中模式类的特征,并基于训练样本自动建立决策树及决策规则。Cart是完成决策树分类、形成分类文件以及进行回归树模型预测。由See 5. 0通过对选定训练样本内光谱特征的挖掘,生成决策树,然后将决策树导入Cart模块,实现整个研究区图像分类。

1.5分类结果的比较

从中分辨率的多时相遥感影像中同时分类各种农作物,全面提取其面积信息是一个挑战性的研究。本研究所采用的分类识别过程如图1所示。为了验证提出的分类方法的精度,用同样的多时相遥感数据、采样点数据和土地利用现状图,分别对面向对象尺度和像元尺度的分类识别结果进行精度评价。

图1 面向对象尺度和像元尺度决策树的农作物分类识别流程图

2研究区及数据

2.1研究区介绍

焉耆盆地,在行政区划上包括新疆巴州的焉耆县、和静县、和硕县、博湖县、库尔勒市的塔什店区、巴州直属的乌拉斯台农场、清水河农场、巴州种畜场以及新疆生产建设兵团农二师的21团、22团、24团、25团、27团、223团等6个团场的平原及其周围的低山和丘陵区。在地理位置上位于新疆塔里木盆地东北侧41°40′11.35″-42°25′46″ N和85°45′25″-87°26′11″E之间,是天山山脉中的一个山间盆地。

图2 研究区及其基本农田系统分布图

本研究以汇流流入焉耆盆地的开都河、黄水沟、清水河等河流出山口的平均海拔高度为基础,1 400 m等高线之内的盆地绿洲区作为焉耆盆地的边界线,该区总面积为7 500 km2左右[31]。由于焉耆盆地自然地理条件适宜于农业发展,20世纪50年以来,尤其是70年代后绿洲区农业耕地面积处于增长趋势,焉耆盆地已成为在我国受人类生产活动影响明显的区域[32]。

2.2数据与处理

文章采用的数据包括LEDAPS(Landsat 生态系统干扰自适应处理系统)提供的 Landsat TM/ETM+地表反射率产品、IKONOS遥感数据、农作物播种面积统计数据、各县最新的土地利用现状图和野外考察采样点数据等。其中,Landsat TM/ETM+数据是2012至2014年的轨道号为143/31(WRS2)的逐年影像数据(如表2所示),IKONOS影像为整个研究区2011年至2013年之间获取的影像数据衔接生成1 m空间分辨率的全彩色影像,在2011至2014年之间夏季通过OREGON 550 GPS接收机采集的控制点数据和主要地物(主要包括各种作物农田、水体、戈壁、盐渍化地、湿地)上定点数据等。对Landsat ETM+数据进行环条带的插值修复。利用GPS接收机采集的控制点对以上的全部空间数据进行几何纠正,并其投影统一化为WGS1984-UTM-45N坐标系。

通过研究区Landsat TM/ETM+ 影像的多时相数据波谱特征分析确定,研究区不同地物在各年7-9月成像的B3,B4和B5波段反射率(SR,surface reflectance)数据上的变化幅度较大,并它们之间的相关系数较低。因此,选用了2011-2014年之间Landsat TM/ETM+ 影像B3,B4和B5波段的SR数据(表2)。然后,为了提高决策树规则的通用性将各波段SR数据的灰度值范围拉伸为0-255之间。

表1 焉耆盆地土地利用/覆盖分类系统

从中分辨率的多时相遥感影像中同时分类各种农作物,全面提取其面积信息是一个挑战性的研究。本研究的重点体现在两个方面:(1)通过完整地划分基本农田图斑上不同农作物的边界线,比较准确地提取农作物的面积信息;(2)从中分辨率的Landsat遥感影像以高分辨率的分类识别各种地物。因此,本研究先以高分辨率的IKONOS遥感影像作为底图矢量化提取整个研究区基本农田图斑,作为面向对象尺度分割的专题图层(Thematic Layer),再依据不同地物的纹理特征、形状特征等进行进一步分割。整个研究区通过矢量化获得的基本农田图斑总数为18 411块,其总面积为147 342.48 hm2。

图3 焉耆县及其东南部区域Landsat ETM+遥感影像

在eCoginition软件中,参考专题图层用多尺度分割(Multi-resolution segmentation)法进行影像分割,其选用的最佳分割参数为:尺度参数(Scale parameter)为100,形状参数(Shape)为0.3,紧致度(Compactness)为0.5,其结果如图3(a)所示。图3(b)和图3(c)分别表示以像元和面向对象为单位合成Landsat TM/ETM+ 第5,4,3波段的同一区域(焉耆县城及其东南部)2012年9月2日成像的Landsat ETM+的假彩色图像。可以看出,通过面向对象方法重建的图像明显地提高了图像中各种地物空间分布的轮廓边界线(图3(d)),抵制“同物异谱和异物同谱”现象。这对高精度地分类农作物种类,正确提取和统计面积信息提供基础。

焉耆盆地土地利用类型体系:2011-2014年期间,在研究区进行考察采集的大量定位采样数据的基础上,参考《土地利用现状分类》和FAO/UNEP土地分类系统,适当考虑农作物物候特征(比如,在研究区每年7月收割小麦后,大部分耕地复播玉米),整个焉耆盆地分为水域、天然湿地、耕地、建设用地、未利用地等一级单元和20个二级类。

3结果与分析

为了验证提出的分类方法的精度,用同样的数据与方法,对面向对象尺度和像元尺度的分类识别结果进行精度评价。首先,以2012年9月2日的Landsat ETM+ 影像数据为基础,构建面向对象尺度和像元尺度的两种Cart决策树规则。其中,面向对象尺度和像元尺度决策树规则分别由653个节点和685各节点组成。然后,把两个决策树规则分别用2012-2014年之间的面向对象尺度和像元尺度的图像进行分类识别。其分类结果如图4所示。

由表2可以看出,2012年的分类精度为最高,总精度达到98 %(kappa系数0.96)以上。这是因为通过CART算法获取的决策树规则是以2012年的数据为准建立的。因2012和2014年的遥感影像也同样用2012年的决策树规则,使用对应各年的野外地物采样点验证,它们的精度比2012年的精度低一些。但面向对象方法总精度都高于88 %(kappa系数0.87),4年的平均精度为92.09 % (kappa系数0.91)。

表2 土地利用/土地覆盖分类用的Landsat影像及其精度

图4焉耆盆地2011、2012和2014年的分类结果图

相比与面向对象尺度的决策树分类,2012-2014年的像元尺度决策树分类精度都比较低,其精度在75-85 % (kappa系数0.75-0.84)之间, 4年的平均精度为78.81 % (kappa系数0.77)。

总之,本研究提出的基于面向对象决策树的分类识别方法不仅精度高,更重要的是它提取的基本农田图斑及其作物的轮廓线保持完整性。这种方法从中等分辨率的Landsat遥感影像以高精度的农作物分类识别与动态监测提供可能。

4 结束语

本研究以中分辨率的Landsat TM / ETM+ 遥感影像为主要数据源,基本农田图斑的矢量数据作为尺度分割的参照系,面向对象和决策树规则等方法的优点相结合,克服了传统基于像元的分类方法对噪声比较敏感和基本农田图斑边界线不完整的现象,有效地提高农作物分类识别和面积信息提取的精度。用该方法对新疆焉耆盆地2011至2014逐年的农作物类型进行动态监测,监测结果的平均总精度高于92 %。精度评价的结果表明,面向对象决策树的分类精度明显高于像元决策树的分类结果,更重要的是农田系统中农作物的轮廓比较完整。

本研究提出的地物分类识别方法,将在农业遥感领域农作物的分类识别及监测方面,一定程度的缓解分类精度与成本、空间分辨率与识别方法之间的矛盾,从中等分辨率的遥感影像以高精度的农作物分类识别、信息提取和动态监测等提供可能。

参考文献:

[1] Pohl C,Van Genderen J L. Review article multisensor image fusion in remote sensing: concepts,methods and applications[J]. International Journal of Remote Sensing,1998,19(05): 823-854.

[2] 赵寒冰,曾志远,李硕. 可持续发展战略的资源遥感回顾与展望[J]. 遥感技术与应用,2002,17(02):112-118.

[3] Barrett E C. Introduction to Environmental Remote Sensing [M]. Routledge,2013.

[4] Frolking S,Xiao X,Zhuang Y,et al. Agricultural land-use in China: A comparison of area estimates from ground-based census and satellite-borne remote sensing [J]. Global Ecology and Biogeography,1999,08(05): 407-416.

[5] Gallego F J,Kussul N,Skakun S,et al. Efficiency assessment of using satellite data for crop area estimation in Ukraine[J]. International Journal of Applied Earth Observation and Geoinformation,2014,29: 22-30.

[6] 黄敬峰. 论遥感技术与资源、环境可持续发展研究[J]. 遥感技术与应用,1999,14(01):65-70.

[7] 徐美,黄诗峰,黄绚. 遥感用于土地利用变化动态监测中的若干问题探讨[J]. 遥感技术与应用,2000,15(04):252-255.

[8] Tao F,Yokozawa M,Zhang Z,et al. Remote sensing of crop production in China by production efficiency Models: models comparisons,estimates and uncertainties[J].Ecological Modeling,2005,183 (04): 385- 396.

[9] 申克建,何浩,蒙红卫,孙冠楠.农作物面积空间抽样调查研究进展[J]. 中国农业资源与区划,2012,33(04):11-16.

[10] Tsiligirides T A. Remote sensing as a tool for agricultural statistics: a case study of area frame sampling methodology in Hellas[J],Computers and Electronics in Agriculture,1998,20 (01):45-77.

[11] Congalton R G,Gu J,Yadav K,et al. Global Land Cover Mapping: A Review and Uncertainty Analysis [J]. Remote Sensing,2014,6(12): 12070-12093.

[12] 张猛,曾永年. 基于多时相Landsat 数据融合的洞庭湖区水稻面积提取[J].农业工程学报,2015,31(13):178-185.

[13] 宋茜,周清波,吴文斌,胡琼,余强毅,唐华俊. 农作物遥感识别中的多源数据融合研究进展[J]. 中国农业科学,2015,48(06):1122-1135.

[14] 陈绍杰,单丹丹,赵卫常. 土地覆盖遥感分类方法的比较与分析[J].辽宁工程技术大学学报(自然科学版),2010,29(04):567-570.

[15] 文沃根.高分辨率IKONOS 卫星影像及其产品的特性[ J].遥感信息,2001,(01):37-38.

[16] Fu K S,Mui J K. A Survey on Image Segmentation [J]. Pattern Recognition,1981,13(01): 3-16.

[17] Haralick R M,Shapiro L G. Image Segmentation Techniques 1985. Technical Symposium East[J]. International Society for Optics and Photonics,1985: 2-9.

[18] Gorte B G H. Multi-spectral quad-tree based image segmentation[J]. International Archives of Photogrammetry and Remote Sensing,1996,31: 251-256.

[19] Cross A M,Dury S J,MASON D C. Segmentation of remotely-sensed images by a split-and-merge process+[J]. International Journal of Remote Sensing,1988,9(08): 1329-1345.

[20] 孔令婷,杨英宝,章勇. 基于不同分辨率遥感影像的分类方法对比研究[J]. 测绘与空间地理信息,2015,38(03):40-43.

[21] Lewiński S,Zaremski K. Examples of object-oriented classification performed on high-resolution satellite images [J]. Miscellanea Geographica,2004,11: 349-358.

[22] 张喜旺,刘剑锋,秦奋,秦耀辰. 作物类型遥感识别研究进展[J]. 中国农学通报,2014,30(33):278-285.

[23] 钱育蓉,于炯,贾振红,孙华,古丽给娜·达列力汗. 基于决策树的典型荒漠草地遥感分类策略[J]. 西北农林科技大学学报(自然科学版),2013,41(02):159-166.

[24] 李述,刘勇. 基于多特征的遥感影像土地利用/覆盖分类——以腾格里沙漠东南边缘地区为例[J]. 遥感技术与应用,2006,02:154-158、173.

[25] 初庆伟,张洪群,吴业炜,冯钟葵,陈勃. Landsat-8卫星数据应用探讨[J]. 遥感信息,2013,04:110-114.

[26] 国务院. 基本农田保护条例[J]. 中国土地,1999,02:43-45.

[27] 林辉,刘泰龙,李际平.遥感技术基础教程[M].长沙:中南大学出版社,2002:1-15.

[28] 刘建平,赵英时,孙淑玲. 高光谱遥感数据最佳波段选择方法试验研究[J]. 遥感技术与应用,2001,16(01):7-13.

[29] 马娜,胡云锋,庄大方,王新生. 基于最佳波段指数和J-M距离可分性的高光谱数据最佳波段组合选取研究——以环境小卫星高光谱数据在东莞市的应用为例[J]. 遥感技术与应用,2010,03:358-365.

[30] 中华人民共和国国家标准(GB/T 21010- 2007). 土地利用现状分类[S].2007-08-10.

[31] 玉素甫江·如素力.基于GIS-SD的新疆焉耆盆地二元水循环过程模拟研究[D].北京:中国科学院大学,2015.

[32] Zulpiya Mamat,Hamit Yimit Anwar Eziz. Oasis land-use change and its effects on the Eco-environment in Yanqi Basen,Xinjiang,China[J].Environ Monit Assess,2014,186:335-348.

Object-oriented Based Approach of Decision Tree for Crops Classification and Recognition

Yusufujiang·RUSULI1,2,Li Lan-hai2*,Halidan·SIDIKe1,GAO Qian1

(1.InstituteofGeographicScienceandTourism/XinjiangLaboratoryofLakeEnvironment&ResourcesinAridZone,XinjiangNormalUniversity,Urumqi,Xinjiang,830054,China;2.StateKeyLaboratoryofDesertandOasisEcology,XinjiangInstituteofEcologyandGeography,ChineseAcademyofSciences,Urumqi,Xinjiang,830011,China)

Abstract:Crop acreage and type information is very important for accurate estimating crop production,the policy-making of agriculture and ensuring national food security.Crop mapping by using the remotely-sensed images provide basic information for further geographical and ecological researches. In the current agricultural production and management,there is an urgent need of the direct and immediate information guide. In order to ease the contradictions between classification precision and cost,spatial resolution of images and recognition method,a new method so called object-oriented based approach of decision tree for crops classification and recognition was proposed using Landsat TM / ETM+ remotely sensed images and vectored capital farmland parcels as basic data sources employing object-oriented methodology and diction tree algorithm. The yearly land-use and land cover changes of Yanqi basin in Xinjiang,China between 2011 and 2014 were studied by the new and traditional methods of diction tree respectively,and get an average high overall precision of 92.09 % with the Kappa coefficient of 0.91. The new method not only improved the precision of crops classification and recognition,but also extracted figure outlines of capital farmland parcels perfectly. The new method brought forwarded in this paper provide possibility for crops classification and recognition,extraction of area information and dynamic monitoring with high precision from remotely sensed images of medium spatial resolution.

Key words:Decision tree; capital farmland parcel; Crops; Classification and recognition; Yanqi basin; Object-oriented

中图分类号:TP79;S127

文献标识码:A

文章编号:1008-9659(2016)01-025-08

[作者简介]玉素甫江·如素力(1975—),男,新疆喀什人,副教授,博士,硕士研究生导师,主要应用3S技术,从事流域水文与生态系统研究。*[通讯作者] 李兰海(1964—),男,江西信丰人,研究员,博士,博士生导师,主要从事流域水文与生态系统研究。

[基金项目]新疆维吾尔自治区重点实验室专项资金资助项目(2014KL016);国家自然科学基金项目(41161007,41461006)和新疆师范大学博士启动基金项目 (XJNUBS1528)。

[收稿日期]2015-10-28

猜你喜欢

面向对象基本农田决策树
永久基本农田集中区域“禁废”
一种针对不均衡数据集的SVM决策树算法
面向对象的计算机网络设计软件系统的开发
决策树和随机森林方法在管理决策中的应用
面向对象的数据交换协议研究与应用
山东省共划定永久基本农田9587万亩
基于决策树的出租车乘客出行目的识别
面向对象Web开发编程语言的的评估方法
浅析永久性基本农田的划定与保护——以慈溪市为例
我国基本农田立法的四大软肋及其对策