APP下载

基于水稻特征波段的决策树分类研究

2017-05-30张博文崔林丽史军

安徽农业科学 2017年28期
关键词:水稻

张博文 崔林丽 史军

摘要 以滁州市为例,结合水稻物候的特征波段,选用反映水稻物候期时相的TM数据,并基于多特征波段,构建CART决策树分类提取水稻种植面积。结果表明,植被指数、湿度因子、绿度因子、纹理特征等多特征参与CART决策树分类能够提高总体精度。基于光谱信息、植被指数和纹理特征的决策树分类的总精度比以最大似然法进行的监督分类方法提高了6.942 1百分点,Kappa系数提高了0.110 4。合理选用作物物候期数据及其遥感影像的特征波段能够有效降低分类误差,为地形复杂地区获取作物种植面积提新的方法。

关键词 多特征选择;CART决策树;水稻

中图分类号 S126 文献标识码 A 文章编号 0517-6611(2017)28-0207-04

Abstract Taking Chuzhou City as an example, combined with the characteristic band of rice phenology in remote sensing image, using TM data of the typical rice phenology, planting area of rice was extracted by CART decision tree classification based on the multifeature band.

The results showed that CART algorithm classification involved by vegetation index, humidity factor,green degree factor,texture feature and other characteristics can improve the overall accuracy. The decision tree classification based on spectral information, vegetation indices and texture features was 6.942 1 percentage point higher in overall accuracy than that of supervised classification method based on maximum likelihood, and its Kappa coefficient increased 0.110 4. So the reasonable selection of the characteristic bands of crop phenological data and remote sensing images could effectively reduce the classification error, which could provide new method for obtaining crop planting area extraction in the complex terrain area.

Key words Multifeatures selection;CART decision tree;Paddy rice

2004年,我國水稻播种面积为28.38 km2,占世界水稻总产量的25%左右[1]。我国水稻播种面积的统计、水稻长势的监测及水稻产量的准确估测等都为保障我国粮食安全提供了重要信息。近年来,随着社会、经济的快速发展,常规的地籍统计方法已无法快速获得准确信息。随着科技的发展,遥感技术已经被广泛应用于农林业、海洋生物、矿藏勘探、水文调查、天气预报、灾害预警、环境保护和军事侦察等领域。利用遥感技术对水稻面积进行监测具有准确、高效的特点,遥感技术不仅能准确获取水稻播种面积,而且还能对其种植面积进行有效动态监测。

近年来,关于采用遥感手段获取水稻信息并提取水稻播种面积,国内外均已有研究報道。张峰等[2]利用NOAA-AVHRR和TM影像结合的方法,探讨了提取水稻面积的方法。Huang等[3]用地理信息系统从土地利用图获取出疑似的水稻种植区,并在疑似的种植区中结合NOAA-AVHRR数据进行最大似然法分类提取水稻面积。韩立建等[ 4]使用多时相IRS-P6数据分区,探讨了水稻面积的手段。赖格英等[5]采用模糊监督分类方法研究了水稻种植面积。

目前,国内外的研究区大多在平原区,且多是基于像元法获取水稻播种面积[6]。在试验中需要高分辨率的遥感影像,导致精确解译耗时过长,难以实现高效监测这一要求。与其他地区水稻播种面积提取相比,安徽省滁州市水稻播种面积的提取受到以下多种因素的制约:①由于纬度差异,与其他地区的耕作制度不同;②皖东地形多样,种植结构复杂,取样精度很难达到要求;③因为遥感数据普遍出现“同谱异物”和“同物异谱 ”现象,多时相的提取方法在阴雨天气较多的南方地区也难以采用。笔者以滁州市为例,结合水稻物候的特征波段,选用反映水稻物候期时相的TM数据,并基于多特征波段,构建CART决策树分类提取水稻种植面积。

1 水稻波段特征的提取及分析

1.1 主成分变换分析

在对滁州市TM影像进行主成分变换分析后,将得到的第一、二、三主成分图像进行彩色合成,获得的彩色图像中包含丰富的图像信息。

1.2 缨帽变换分析

试验中采用缨帽变换参与提取水稻播种面积,分别得出3个分量:亮度(BI)、绿度(GVI)、湿度(WI)。因为对试验区进行缨帽变换分析可以增强植被的辨别效果,利用该功能可以对水稻种植区起到良好的检测作用。

1.3 植被指数分析

针对植被生长状况、植被覆盖度和降低辐射误差等问题,通常使用NDVI进行监测。一般而言,NDVI对植被的监测比单波段监测更加精确。因为水稻的分布密度与水稻种植区面积呈线性相关,而水稻的生长状态和水稻的空间分布密度的最佳指示因子就是归一化植被指数(NDVI)。

1.4 纹理特征提取与分析

试验区的纹理信息呈现出随机性,因此采用共生矩阵法提取所需的纹理信息。共得出常用的8个参量:均值(Mean)、方差(Variance)、均勻性( Homogeneity)、对比度(Contrast)、相异性(Dissimilarity)、熵(Entropy)、相关性(Correlation)、二阶距(Second Moment)等。纹理特征与地物的类别具有明显关系,其中均值反映纹理规则程度,均值越大,纹理规则程度越强。熵反映对信息量的度量,熵值越大则说明纹理越多。

2 CART决策树水稻面积提取

2.1 选取训练区样本

CART决策树分类方法作为一种特殊的监督分类方法,在分类试验前需要事先准备一个训练样本集对其进行构建和评价。根据滁州市水稻种植制度和地形地貌特点,并结合滁州市当年土地利用图,目视解译(在TM5、4、3合成波段假彩色中,安徽省丘陵山地夏季水稻呈现出紫色和灰白色;林地呈现出绿色和黄绿色;水体呈现出黑色和蓝色;建筑用地多为品红色;旱地多数作物呈现前黄褐色或者黄色),部分实地调查样本数据对样本区进行分类。共分成5类主要地物:水体、建筑、林地、水稻及其他作物用地。在该试验中对水稻面积的提取将优先采用CART决策树方法,分析影响水稻面积提取的特定波段。

2.2 决策树特征选择和分类规则

在数据不充分的条件下,为了研究水稻面积提取的主要波段特征,根据选取的训练样本,采用CART算法进行运算分析,选取测试变量为影像的主成分分析值(PC1)、归一化植被指数(NDVI)、绿度分量(GVI)、湿度分量(WI)、2个纹理特征值(均值、熵),目标变量将水体、建筑、林地、水稻及其他作物用地选为目标变量。通过试验得到8 855个训练样本,通过学习得到决策树结构,共生成46个叶节点,每个节点对应一个生成规则,即46条规则。其中,水稻区域部分规则如下:

If(绿度>20.33 && 均值>30.25 && 湿度>30.52 && 均值>43.98)Than(class = 水稻)

If(绿度>20.33 && 均值<30.25 && 熵>3.987&& 绿度<33.26)Than(class = 水稻)

If(绿度>20.33 && 均值<30.25 && 熵<3.987 && NDVI<-0.56)Than(class = 水稻)

从规则上看,缨帽变换中的绿度分量、纹理特征(尤其是均值和熵)以及归一化植被指数是研究地形复杂地区水稻面积时所必须依赖的因子,而主成分在分类提取水稻中作用甚微,精简决策树模型便不再体现。

通过以上生成规则,水稻生长期中的多项特征(归一化植被指数、缨帽变换中的绿度分量和湿度分量、纹理特征分析中的熵值和均值)对于提取丘陵山地地区的水稻面积的研究具有直接作用。

3 试验结果与精度评价

3.1 决策树分类结果

将生成规则应用在ENVI中的Decision Tree,并建立决策树模型,对研究区进行决策树分类,生成多种特征光谱信息的CART决策树分类结果(图1)。

针对图1中分类后各个地物类别出现较多小块图斑,在实际应用中有必要对其按照邻近的相似性将邻近的类进行合并。按照“少数服从多数原则”对基于决策树分类的结果图进行碎斑处理,保证空间的连续性。碎斑处理后的决策树分类结果见图2。

3.2 最大似然法分类结果

为了分析基于CART决策树的分类图的精度与其他分类方法的差异,试验中采用基于影像的光谱特征的监督分类方法中的最大似然法对研究区进行监督分类得到的分类结果如图3所示。

针对图3中分类后各个地物类别出现較多小块图斑,同样对基于最大似然法分类的结果图进行碎斑处理,并得到碎斑合并后的最大似然法分类结果(图4)。

3.3 精度评价

当直接采用目视判读将2种方法得出的分类图与原始图像比对时,检验其分类效果,发现基于CART决策树方法对丘陵山区水稻面积提取分类的效果更好。为了更加客观地评价分类精度,将采用2种方法对结果进行验证。

(1)采用基于混淆矩阵的精度评价方法的对最大似然法分类结果与基于CART决策树分类方法的分类结果进行比较,选用实地调查样本和目视解译部分样本产生样本点,共计578个,建立混淆矩阵。基于CART决策树分类和基于最大似然法分类的精度分析见表1、2。由表1、2可知,基于CART决策树分类的总精度为96.885 8%,Kappa系数为0.961 0。基于最大似然法分类的总精度为89.943 7%,Kappa系数为0.850 6。基于CART决策树分类方法,利用水稻影像的波谱特征并结合多项植被指数和纹理特征分析的分类精度要优于最大似然法。其中,总精度提高了6.942 1百分点,Kappa系数从0.850 6提高到0.961 0,提高了0.110 4。

基于水稻特征波段的CART决策树分类方法能够显著改善林地和水稻的分类中产生的错分漏分现象;最大似然法分类中仅仅依靠地物的光谱特征,导致了分类结果中水稻区和林地与其他作物区的错分漏分的现象较为明显。这是因为水稻区域的波谱特征信息与林地(其他绿色植被)的波谱特征信息极为相似,错分、漏分区域多数集中在丘陵山区附近,这是因为水稻区域破碎、狭长,从而导致分类出现误差。但是,基于水稻特征波段的CART决策树分类方法中利用水稻纹理细密、林地和大部分其他作物的纹理特征影像结构粗糙这一特征很好地将水稻与其他地物区别开来,提高了分类的精度。

(2)采用2种分类方法中水稻区域的像元点数,将水稻种植面积与2006年安徽省统计局公布的滁州市2005年稻谷种植面积进行比对。由表3可知,基于CART决策树分类方法所获取的面积更接近于实际水稻面积,精度达到64.09%,比最大似然法分类获取水稻面积提高了14.86百分点。同时,对滁州市水稻种植区进行实地调查发现,滁州市稻谷种植除水田外还有一定面积的旱稻,而安徽省统计局公布的滁州市稻谷种植面积中包含旱稻面积,在数据不完备的情况下采用基于CART决策树分类所提取的水稻面积精度误差是在合理范围内的。

4 结论与讨论

笔者运用滁州市丘陵山地地区水稻的光谱特征与样本区的归一化植被指数,缨帽变换中绿度分量和湿度分量和纹理测度中熵和均值等多特征波段信息并结合CART决策树模型。水稻与其有相似光谱特征值的地物被很好地区分开来,获得了良好的分类精度,表明多特征波段信息对于水稻面积提取精度有较大帮助。

CART决策树模型比最大似然法分类更加快速简单,提高了分类效率;同时,CART决策树的遥感分类较为准确,不需要扎实的专业知识储备,并且便于与其他地学知识融合,应用广泛。

CART决策树分类方法作为一种特殊的监督分类方法,在分类试验前需要事先提供一个学习样本集对其进行构建和评估。因此,要保证分类精度,就要在分类前选取纯净的像元作为训练样本。今后应进一步研究改善分类效果,降低对先验知识的依赖性,实现自动化分类的目的。

参考文献

[1] 李卫国,李秉柏,石春林.基于模型和遥感的水稻长势监测研究进展[J].中国农学通报,2006,22(9):457-461.

[2] 张峰,吴炳方,黄慧萍,等.泰国水稻种植区耕地信息提取研究[J].自然资源学报,2003,18(6):766-772.

[3] HUANG J F,Ahmad Y,WANG R C.Integration of GIS and TM data to extract early rice area in Longyou Country[J].Transaction of the Chinese society of agricultural engineering,2001,17(1):159-162.

[4] 韩立建,潘耀忠,贾斌,等.基于多时相IRS- P6卫星AWiFS影像的水稻种植面积提取方法[J].农业工程学报,2007,23(5):137-143.

[5] 赖格英,杨星卫.南方丘陵地区水稻种植面积遥感信息提取的试验[J].应用气象学报,2000,11(1):47-54.

[6] 庞新华.基于决策树和混合像元分解的P6AWiFS遥感影像小麦播种面积测量方法研究[D].北京:北京师范大学,2008.

猜你喜欢

水稻
水稻和菊花
机插秧育苗专用肥——机插水稻育苗基质
有了这种合成酶 水稻可以耐盐了
水稻种植60天就能收获啦
油菜可以像水稻一样实现机插
中国“水稻之父”的别样人生
海水稻产量测评平均产量逐年递增
对水稻机插秧技术推广的思考
有些地方的水稻待收割(上)