利用决策树分类方法的南京江宁水稻面积变化研究
2015-03-10余超李明阳何隆华
余超,李明阳,何隆华
(1.南京林业大学,南京210037;2.中国科学院南京地理与湖泊研究所,南京210008)
利用决策树分类方法的南京江宁水稻面积变化研究
余超1,李明阳1,何隆华2
(1.南京林业大学,南京210037;2.中国科学院南京地理与湖泊研究所,南京210008)
自从2000年12月江宁撤县设为南京市江宁区以来,2002年~2010年期间许多农田现在变成了高楼大厦。该文以南京市江宁区水稻田为研究对象,以江宁区2002年、2006年以及2010年的遥感影像为主要信息源,利用决策树分类的方法,通过坡度、湿度、NDVI等决策因子,根据野外实地勘测调查数据对比,提取出江宁区的水稻田,再通过驱动因子分析,用地理加权回归方法找出主要影响因子,加上空间分布格局的动态分析,从而比较出在这段时间内南京江宁区水稻田的变化情况。研究表明:①江宁区在2002年~2010年内水稻田面积减少了约690km2,约70%的稻田变为其他用地,变化非常明显;②主要影响面积变化的驱动因子是人类居住活动范围的变化;③水稻田的空间格局在2002年~2010年间聚集性减弱,破碎化趋势加强。
水稻;决策树;地理加权回归;空间格局;面积变化;地理国情监测
1 引 言
水稻主要生长在我国多云雨、温度适宜的中部和南部地区,该区域是我国的主要产粮区,对该区域水稻进行种植面积的提取、长势的监测和产量的估算等研究是具有重要意义的[1]。水稻的面积提取有很多种方法,从数据的角度看,水稻信息提取的方法可分为两大类型:以TM为代表的中高分辨率数据和以MODIS为代表的低分辨率数据[2]。其中,前一类型是静态地通过单一时相的影像分类,这类数据自身具有较高空间分辨率分类精度较高;后一类型则主要通过时序归一化植被指数(Normalized Difference Vegetation Index,NDVI)的差异结合知识的手段从而提高分类精度。王福民等[3]曾以水稻生长前期和后期2景TM影像进行穗帽变换并合成多时相影像,通过最小距离法来提取水稻信息;朱良等[4]通过TM影像的NDVI和陆地表水指数(Land Surface Water Index,LSWI)不同变化进行小尺度水稻面积提取;彭代亮[5]在2009年基于统计与MODIS数据来进行水稻遥感估产;马孟莉等[6]利用混合像元分解的方法也做过水稻面积的提取。
不过单一的通过某种因子来进行水稻田的提取,会造成误差,比如仅仅通过NDVI来进行提取会误将一部分覆满水草的池塘也分类成稻田。决策树分类的方法可以将多个分类因子同时进行判定筛选,更加严格地根据输入的筛选条件进行面积提取,从而提高了分类精度。因此,本文以南京江宁区作为研究区域,利用决策树的分类方法,提取出水稻田的面积,加上驱动因子分析以及空间动态分布格局,更加全面地比较出江宁2002年~2010年间的稻田面积变化,为江宁区农业的进一步规划发展提供重要参考。
2 研究区域概况
江苏省南京市江宁区(118°31′E~119°04′E,30° 38′N~32°13′N),位于江苏省西南部,东与句容市接壤,南至东南与安徽省当涂县、溧水区毗连,西南与马鞍山市相邻,西与安徽省和县及南京市浦口区隔江相望。常态地貌有低山、丘陵、岗地、平原和盆地,其中丘陵岗地面积最大,境内有大小山丘400多个。境内河道主要有秦淮河和长江两大水系,面积1577.75km2,全年总降水量959.6mm,其中2月、4月、7月~9月和11月份偏多,其余各月偏少,年无霜期225天。2008年统计年鉴统计的水稻稻田面积为210.8km2,约占总面积的13%,最大高程是363m。南京市江宁区农业以油菜、小麦、水稻、大豆、红薯和芝麻等为主要作物,冬小麦和油菜与水稻轮作为主。2000年12月,经国务院批准,撤县设立南京市江宁区,现已呈功能效益多元显现的都市型农业格局。2004年,江宁区累计引进农业外资项目238个,实际利用外资2.5亿美元。到2012年已有近60个国家和地区的2400个项目落户,集聚了40家世界500强企业,累计实际使用外资超过60亿美元,使电力自动化产业成为江宁的特色的产业。
3 数据来源与研究方法
3.1 数据来源与预处理
Landsat TM影像时间分辨率是16天,空间分辨率是30m,主要特点为具较高空间分辨率、波谱分辨率、极为丰富的信息量和较高定位精度。本次实验选取2002年8月24日、2006年8月30日以及2010年8月15日三期遥感数据作为数据源。同时,利用GPS到江宁地区获取研究区域内各个地物位置详细信息,用于几何校正以及精度验证。
TM数据的预处理包括:(1)几何精校正。在ERDAS IMAGINE 9.2中利用实地测量的GPS定点来进行几何校正处理。(2)大气校正和辐射定标。利用ENVI的spectral工具栏下的preprocessing进行辐射定标和大气校正。(3)研究区域的裁剪。利用江宁区行政边界矢量图形通过ENVI软件下的subset data via ROIs工具裁剪出研究区。
3.2 决策树模型的特征指数选取
决策树是通过对训练样本进行归纳学习而生成决策规则,而后使用决策规则对数据进行分类的一种数学方法[7]。决策树的每个内部结点都是一系列类别属性的集合。决策树的叶结点对应一个类别属性值。决策树通过决策规则把根节点逐步划分成内部节点,也是通过决策规则把内部节点划分为叶节点。近年来,决策树因其具有较高的鲁棒性、计算效率高、分类精度高、分类规则直观、易于理解等优点,故被广泛地运用于地物识别提取[8-9]。
TM影像常用的特征指数主要有NDVI,红光波段能增强植被与非植被之间的差异,通过反映不同植物叶绿素含量的不同来区分植被种类。绿色植被在0.7μm~0.8μm之间有一个高反射峰,近红外波段对植物类别差异敏感,是监测植被的通用波段。水稻除了自身生物量与其他地物不同之外,其特殊的生长环境也为信息提取提供了有利条件[10]。根据对南京江宁区水稻田的实地定位调查,发现水稻多生长在海拔小于50m且坡度小于12°的区域,并且在对江宁区的水稻田监测中发现其湿度一般在100%~400%之间。因此本文选择作为决策树分类的因子为NDVI、湿度、海拔以及坡度。
4 研究结果与分析
4.1 水稻田面积变化分析
对实验区域样本定量分析是建立决策树的基础和依据。根据南京市江宁区的NDVI数据,研究从典型地物的NDVI时间序列曲线中将与其他类存在明显差异的水体和建筑设定阈值加以区分,再根据水稻的生活习性依据海拔,坡度,湿度来进行进一步分类筛选。具体步骤为:(1)区分水体,阈值设为NDVI<0.15,水体与其他地类的NDVI曲线有明显差别,故先将其进行剔除;(2)区分出居民点,阈值设为0.15<NDVI<0.35,居民地的NDVI明显高于水体并且低于植被,采用多个时间的数据对该节点的规则在训练区中进行训练,最终得出该区间97.8%的像元都属于居民点;(3)区分林地,根据对江宁区所有种植水稻地方的调查,发现水稻基本生长在海拔小于50m且坡度小于12°的区域,因此可以将此作为阈值进行分类。(4)区分旱田和水稻田,旱田和水稻田的湿度有明显区别。水稻具有好湿喜温的特性,通过ENVI软件的缨帽变换得到江宁区的湿度图,根据对江宁区200个水稻样地点的测量,得出水稻田湿度值在100%~400%之间。
根据所设定的条件,用ENVI决策树功能建立好决策树如图1所示。
图1 决策树模型
根据编辑的决策树分类规则,用ENVI执行决策树进行分类。得到如图2~图4的分类结果。
图2 2002年江宁区水稻分类结果
图3 2006年江宁区水稻分类结果
图4 2010年江宁区水稻分类结果
验证分类精度时,根据在江宁区实地测量的200组样地点GPS数据,如图5所示,利用ENVI软件的混淆矩阵精度验证法来进行精度验证,得到水稻的识别精度结果如下表1所示。
通过3个不同的年代的水稻田分布对比,可以非常明显地看出随着城市化的发展,江宁区的水稻田面积在不断变小。这是由于自1985年起整个江宁区的产业结构发生了重大变化,其工业总产值首次超过农、林、牧、副、渔的总产值。从1990年往后,随着开发区的四处兴起,大量的农业用地首先被工业用地所占用,在早期所征用的农地中,几乎有60%的农业用地变为了工业用地。另外,自从20世纪90年代中期以后,江宁区政府一方面大力引进外资工业对江宁进行开发;另一方面,房地产开发,带来居住型用地的增长;同时,根据生态型新城区的定位,又占用了一部分的农业用地,来进行生态新城区的规划设计。此外,兴建公共活动空间,基础设施用地,这些项目的开展,也占用了大量的农业用地[11]。
图5 GPS样地点分布图
表1 江宁区水稻面积分类结果表
4.2 地理加权回归分析
本文将水稻田斑块距离道路距离,距离居民点距离,距离水体距离这3个因子作为自变量,将水稻田斑块面积作为因变量,采用ArcGIS空间统计分析工具箱中的Graphically Weighted Regression模块进行地理加权回归。
在地理加权回归模型输出的评价系数中,Cond表示局部的共线性情况,当大于30时,表示实验结果不理想,Predicted给出其预测结果,Residuals表明真实值与预测值的差。在本文中,Cond的最小值为3.701,最大值为25.451,平均值为11.624,表示实验结果比较理想,模型的局部相关系数R2为0.7239,表明模型可以解释72.39%差异。因变量距离居民点距离,距离道路距离,距离水体距离的平均相关系数分别为:0.0068,0.0041,-0.0025,表示与距离居民点以及道路距离成正相关,与距离水体距离成负相关,也就是说离居民点以及道路越远越水田越多,离水越近水田越多。由此可以证明出水田面积变化的与人类居住地的变化有着密切的关系。
4.3 水稻田空间格局分析
将三期的水稻分类结果图导入到景观空间分析软件Fragstats 3.3进行分析,在这里本文选取几个结果指标来进行比较:斑块类型面积(Total Class Area,CA),斑块数量(Number of Patches,NP),斑块密度(Patch Density,PD),最大斑块指数(Largest Patch Index,LPI),结果如表2所示。
表2 水稻面积空间格局分析表
从表2可以看出,2002年~2010年间,江宁水稻的斑块面积在不断下降,斑块的数量在增加,最大斑块指数与斑块密度也一同下滑,稻田不断变小变碎变散,由原来的聚集密集型不断破碎,变成又小又散的分布在各个区域。这与三期水稻田面积提取的结果吻合,可以看出由于人为因素的干扰,水稻田空间聚集性减弱,破碎化趋势增强,同时面积也在急剧减少。
这是由于江宁从2000年开始成为南京市的一个新区,发展政策发生了变化,由单一的县城变为了大城市的边缘区,城市规划政策的变化,导致了江宁的水稻田变得更加破碎以及消减。20世纪90年代中期以来,兴起的“开发区热”导致耕地大量被占,如自1992年江宁在东山镇创办经济技术开发区,至1997年2月被批准为国家高新技术产业开发区以后,在县城附近又建设了国家级民营科技园和江宁商城。同时,在县城内其他地区建立了13个乡镇工业小区,8个专业市场,3大贸易市场。在5个重点镇:秣陵、禄口(机场建设)、麒麟、江宁、湖熟等地设立了开发区或工业园。除了开发区建设外,禄口机场的建设也是改变江宁土地利用的重要因素之一。另一方面,由于地处大城市的边缘区,随着城市的不断扩张,城市的发展必然需要寻求与其相邻的边缘区来解决大城市的压力,如房地产开发,新开工业基地的增加。从20世纪90年代以后,在东山镇除开发区的建设外,还新建了百家湖住宅小区及其配套设施,也占用了大量耕地。以上江宁区众多的区划建设改变,导致其水稻田总体面积急剧下降,空间分布越来越零散破碎。
5 结束语
单一的通过某种因子来进行水稻田的提取,会造成误差。决策树分类的方法可以将多个分类因子同时进行判定筛选,更加严格地根据输入的筛选条件进行面积提取,从而提高了分类精度。
本文利用决策树的方法,根据坡度、湿度、NDVI等因子进行面积提取,有效地解决了以往一些单一方法的不足。
研究表明,2002年~2010年间,江宁区水稻田面积减少了约690km2,约70%的稻田变为其他用地,主要影响面积变化的驱动因子是人类居住活动范围的变化,水稻田的空间格局在此期间聚集性减弱,破碎化趋势加强。
在进行实地水稻田GPS定点的过程中,还发现了一些影响面积提取精度的因素,例如有个别农户种植水稻的时间与大部分农户不一样,导致了这一部分的水稻田在遥感影像上所反映出来的情况有所差异,江宁区水稻田面积较小且分布破碎也影响了一定的实验精度,如何进一步提高这种小范围破碎化的水稻田面积提取精度还需要更深入的研究。
[1] 赵锐,汤君友,何隆华.江苏省水稻长势遥感监测与估产[J].国土资源遥感,2002,53(3):9-11.
[2] 朱良,平博.多时相TM影像决策树模型的水稻识别提取[J].地球信息科学学报,2013,15(3):447-451.
[3] 王福民,黄敬峰,王秀珍.基于穗帽变换的TM影像水稻面积提取[J].中国水稻科学,2008,22(3):297-301.
[4] 朱良,平博.多时相TM影像决策树模型的水稻识别提取[J].地球信息科学学报,2013,15(3):447-451.
[5] 彭代亮.基于统计与MODIS数据的水稻遥感估产方法研究[D].浙江:浙江大学环境与资源学院,2009.
[6] 马孟莉,朱艳.基于分层多端元混合像元分解的水稻面积信息提取[J].农业工程学报,2012,28(2):154-159.
[7] FREID M A,BRODLEY C E.Decision tree classification of land cover from remotely sensed data[J].Remote Sensing of Environment,1997(61):399-409.
[8] 李爽,张二勋.基于决策树的遥感影像分类方法研究[J].地域研究与开发,2003,2(1):17-21.
[9] CONRAD C,COLDITZ R R,DECH S,et al.Temporal segmentation of MODIS times series for impro-veing crop classification in Central Asian irrigation systems[J].International Journal of Remote Sensing,2011,32(23):8763-8778.
[10] 林文鹏,王长耀,储德平,等.基于光谱特征分析的主要秋季作物类型提取研究[J].农业工程学报,2006,22(9):128-132.
[11] 王周龙,冯学智,张安定,等.基于空间分析的江宁土地利用变化特征的研究[J].农机化研究,2007,(7):80-85.
Changing of Paddy Area in Jiangning District Based on Decision Tree Classification
YU Chao1,LI Ming-yang1,HE Long-hua2
(1.Nanjing Forestry University,Nanjing210037;2.Nanjing Institute of Geography&Limnology,Chinese Academy of Sciences,Nanjing210008)
Significant change has taken place in Jiangning from 2002to 2010.Since Jiangning became one of the districts of Nanjing in December 2000,much farmland has turned into high-rise buildings.This paper takes the paddy rice in Jiangning district as the research topic.It uses the remote sensing images of Jiangning district in 2002,2005and 2011as the main source of information.Adopting a decision tree classification method with slope,humidity,NDVI and other decision-making as factors,this paper extracts the rice fields in Jiangning district according to survey data compared with field surveys.The change area of rice fields in Jiangning in the past decade is obtained by driving factor analysis,using geographically weighted regression to identify the main factor,coupled with the dynamic analysis of spatial distribution pattern.Studies have shown that:(1)The area of rice fields in Jiangning district during 2002to 2010reduced by about 690km2.With about 70%of the paddy fields turned into other uses,change is very obvious.(2)The main driving factor is the change in the scope of human habitation activities.(3)The aggregation of spatial pattern in the rice fields between 2002and 2010has decreased,and the fragmentation trend has strengthened.
paddy;decision tree;geographically weighted regression;spatial pattern;area change;national geographical conditions monitoring
10.3969/j.issn.1000-3177.2015.02.014
TP79
A
1000-3177(2015)138-0080-05
2014-01-13
2014-04-23
国家自然科学基金项目(41271418)。
余超(1990~),男,硕士,现从事森林经理、林业遥感和地理信息系统研究等工作。
E-mail:wsyc23@gmail.com
何隆华(1966~),男,博士,主要从事作物遥感监测与医学地理研究。
E-mail:lhhe@niglas.ac.cn