APP下载

面向对象的高分辨率影像单值分类耕地提取方法研究

2014-08-05徐世武郭庆华

测绘通报 2014年10期
关键词:单值样区面向对象

徐世武,杨 双,孙 飞,郭庆华

(1.中国地质大学(武汉),湖北武汉 430074;2.中国科学院植物研究所,北京 100093)

面向对象的高分辨率影像单值分类耕地提取方法研究

徐世武1,杨 双1,孙 飞1,郭庆华2

(1.中国地质大学(武汉),湖北武汉 430074;2.中国科学院植物研究所,北京 100093)

一、引 言

随着城市化进程的加快,耕地面积逐年减少,实时监测耕地信息已成为国土管理部门关注的问题。利用传统遥感分类器提取地面覆盖信息要求定义所有感兴趣的类别[1],分类系统需要满足互斥性、完备性、层次性[2]。但在很多应用中,用户只关心某一特定地类[3],如耕地提取,如果只需标记感兴趣的地类(即目标类),势必减少真实地表数据采集、样本选取耗费的大量人力和时间。本文将从影像中提取某一类特定地类问题,定义为单值分类问题。

由于传统的监督分类器需要全类别样本,故无法直接将其应用于单值分类问题[4]。其次,缺少部分类别的不完全训练集是对地表景观的不完全认识,硬分类器采用的加权硬阈值难以模拟真实分布,神经网络作为一种“软”处理,在数学上可微,更适合处理不完全训练集问题[2]。Li等[5]将Elkan和Noto提出的基于正样本、未标记样本的学习算法(positive and unlabeled learning,PUL)[6]应用于遥感分类问题,其分类精度优于支持向量机法(BSVM)、一值支持向量机(OCSVM)和高斯域描述(GDD)3种单值分类算法。因此,本文采用这种新算法来解决单值分类问题,并采用神经网络分类器来实现。

随着遥感数据分辨率的提高,地物类别内部的光谱响应变异增大,降低类别可分性,导致传统基于像元的遥感影像分析方法无法满足分类需求。已有大量研究表明,面向对象的影像分析可有效地对高分辨率影像进行信息自动提取[7],其特点为处理对象为多尺度分割、封装后的目标,即影像上形状与光谱性质具同质性的单元[8],将像素进行对象级封装,在利用光谱信息的同时,考虑其空间特征,并结合对象的纹理与邻域信息,进而更接近人类的认知过程[9]。

因此,本文在完全训练集和不完全训练集下,利用结合面向对象和基于正样本、未标记样本的单值(PUL)分类方法对多源高空间分辨率影像进行耕地信息提取研究,选取7块研究区,对比基于像素的分类试验,经特征影像提取、抽样、分类器学习、类别判别及精度评价得到试验结果。

二、数据与方法

1.数据获取

本文选取了3种高分辨率影像数据:广西北海市铁山港区(样区1―3,0.2 m航空数据)、武汉市洪山区光谷一带区域(样区4―5,2.44 m QuickBird影像数据)、湖北省大冶市(样区6―7,2.5 m SPOT影像数据)。试验样区大小为1000像素×1000像素,7组试验样区包含了几种典型的土地覆盖类型,如有覆盖的耕地类型、无覆盖的耕地类型、道路、水体、居民地、林地、裸地等。

2.图像分割和特征提取

本文采用ENVI定义的基于边界的分割算法,采用多尺度切割方法,综合考虑光谱特征、紧密度和光滑度等几何特征,生成同质的影像对象多边形。影像分割后提取紧密度、多边形圆特征、形状要素、矩形形状量度,波段平均灰度值、灰度值标准差、卷积核内的平均灰度值、卷积核内平均信息熵、饱和度及亮度作为耕地的判别特征。

3.基于面向对象的单值分类试验

在特征提取的基础上,按照各个类别随机抽样,训练集需要包括正样本(目标样本)及背景样本(未标记样本),使用完全训练集和不完全训练集进行传统神经网络和单值分类框架网络训练,单值分类在网络训练的同时估算常数c值。根据概率模型计算各个像素属于各个类别的后验概率,依据最大概率原则决定每个像元的归属,同时设置阈值0.5控制后验概率的可靠性。最后,计算遥感分类的各个精度指标并进行精度评价。PUL模型详细见Elkan相关论述[8](如图1所示)。

4.基于像素的单值分类试验

本文中用于对比的基于像素分类试验,除处理对象、特征提取不同之外,为增加可比性,其他步骤均与基于面向对象分类试验相同。该部分试验特征提取均基于影像二阶概率纹理统计,选取的纹理因子包括均值、方差、协同性、对比度和二阶矩,且均采用3×3开窗计算。

图1 PUL单值分类框架

三、结果与分析

表1是不同分辨率的7组试验样区抽样大小为正样本800的10次试验结果平均值。

表1 基于像素分类结果与面向对象分类结果对比表

从表1中2.44 m数据基于面向对象的结果中可以明显看出,在不完全训练集的情况下,对于传统的神经网络分类,相比完全训练集的情况,总体精度有5%~7%的降低,Kappa系数有8%~11%的下降,而PUL方法的则只有0~1%的下降,对于部分数据有1%左右的提高。这就说明,在缺少部分类型先验知识的情况下,对于传统的方法有很大的影响,而PUL方法则有相对比较稳定的表现。同时PUL方法在不完全训练集作用下比传统神经网络分类总体精度高2%~5%,平均高出3.5%;Kappa系数高4%~8%,平均高出6.3%,说明单值PUL分类与传统神经网络分类相比有较高的优势。

为了验证多源高分辨数据是否都有这个现象,对于0.2 m数据和2.5 m数据也进行同样的分析,结果发现2.5 m数据有相同的现象,而对于0.2 m更高分辨率数据却发现在不完全训练集下传统方法与PUL方法的精度相当,其差异不超过1%。通过以上分析,可初步得到在不完全训练集下2.44 m数据和2.5 m数据面向对象的单值分类要优于传统方法,并且在缺少部分类别时有相对比较稳定的表现,而对于更高分辨率的0.2 m航空影像数据却没有这个规律的结论。

另从表1中可以明显看出,基于面向对象法的分类结果在对应的数值上均要优于基于像素的分类结果。在不完全训练集下,单值分类,对于0.2 m数据,基于面向对象的总体分类精度比基于像素高2.3%~16.8%,平均高出10.4%,kappa系数高2.4%~23.5%,平均高出17.3%;对于2.44 m数据,总体精度平均高17.5%,Kappa系数平均高出25.3%;对于2.5 m数据,总体分类精度平均高出11.4%,kappa系数平均高出15.6%。

综合以上分析,在不完全训练集模式下,可得到基于面向对象的单值分类有较大优势的结论。

将样区1(0.2 m数据)基于面向对象和基于像素的分类结果进行可视化,对比真实地物分布矢量图(土地调查成果数据加以人工解译修正),比较完全训练集和不完全训练集下的传统方法与单值分类对于耕地的提取效率。如图2―图4所示(均为原始结果,未进行分类后处理)。

图2 样区1

图3 样区1面向对像分类结果

图4 样区1基于像素的分类结果

图2―图4中浅灰色部分代表道路,黑色部分代表有覆盖耕地,深灰色部分代表无覆盖耕地,特别的,白色部分代表类型不确定部分(其他类),可能为阴影区域或者地类分界处。从目视效果来看,对于典型地物基于像素和基于面向对象的传统方法和单值分类方法均可以正确判别。在基于面向对象的分类结果中,完全训练集下,传统神经网络分类明显存在很多错分现象,在耕地中存在大量的白色区域,而单值分类则较少错分;对于不完全训练集,传统方法由于不充分地训练学习,造成白色代表的不确定类别错分为已知类,而单值分类结果则比较稳定。在基于像素的分类结果中,完全训练集下,传统分类中存在大量白色区域,明显多于相同条件下的单值分类结果。而对于不完全训练集两种方法结果中白色区域都非常的少,但与真实地表矢量图的吻合度要低于基于面向对象的分类结果。

四、结 论

本文结合面向对象的思想和基于正样本、未标记样本遥感单值分类方法对多源高空间分辨率影像进行分类,同时对比基于像素的分类试验。结果表明:

1)对不完全训练集问题,单值分类较传统神经网络分类有更较稳定的表现。

2)对多源高分辨数据,在解决不完全样本问题上,面向对象的分类精度都要远高于基于像素的分类精度。单值分类应用面向对象分类可以提高分类精度。

3)基于面向对象的分类效果图与真实地表矢量图的吻合度明显要优于基于像素的分类效果图。单值分类对于不完全样本集问题具有更稳定的表现。

[1]HODGSON M E,JENSEN J R,TULLIS J A,et al. Synergistic Use of LiDAR and Color Aerial Photography for Mapping Urban Parcel Imperviousness[J].Photogrammetry Engineering&RemoteSensing,2003,69(9):973-980.

[2]RICHARDS J A,JIA X.Remote Sensing Digital Image Analysis:An Introduction[M].Berlin:Springer,1999.

[3]FOODY G M,MATHUR A,SANCHEZ H C,et al. Training Set Size Requirements for the Classification of a Specific Class[J].Remote Sensing of Environment,2006,104(1):1-14.

[4]MUNOZ M J,BRUZZONE L,CAMPS V G.A Support Vector Domain Description Approach to Supervised Classification of Remote Sensing Images[J].IEEE Transactions on Geoscience and Remote Sensing,2007,45(8):2683-2692.

[5]LI W,GUO Q H,ELKAN C.A Positive and Unlabeled Learning Algorithm for One-class Classification of Remote-sensing Data[J].IEEE Transactions on Geoscience and Remote Sensing,2011,49(2):717-725.

[6]ELKAN C,NOTO K.Learning Classifiers from Only Positive and Unlabeled Data[C]∥Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.Las Vegas,Nevada,USA:[s.n.],2008.

[7]OPITZ D,BLUNDELL S.Object Recognition and Image Segmentation:The Feature Analyst Approach[C]∥Object-Based Image Analysis.Berlin:Springer Berlin Heidelberg,2008:153-167.

[8]BENZ U.Definiens Imaging GmbH:Object-Oriented Classification and Feature Detection[J].IEEE Geoscience and Remote sensing Society Newsletter,2001(5):16-20.

[9]GAMOTTO J P.A New Approach to Combining Region Growing and Edge Detection[J].Pattern Recognition Letters,1993,14(11):869-875.

Method Research on Cultivated Land Extraction Based on Object One-Class Classification of High-spatial-resolution Images

XU Shiwu,YANG Shuang,SUN Fei,GUO Qinghua

遥感技术已广泛应用于土地覆盖/土地利用分类中。在专题应用中,用户只对某一类地物感兴趣,如耕地提取,即单类别分类问题。随着影像分辨率的提高,基于像元的分类算法难以满足高分辨率影像高精度信息提取的需求。本文采用结合面向对象分类思想和基于正样本、未标记样本遥感单值(PUL)分类方法从多源高分辨率影像中提取耕地信息,并与基于像素的分类试验进行对比分析。结果表明,在缺少部分地类的不完全训练集下,基于面向对象的单值分类较传统神经网络分类有更较稳定的表现,并且远优于基于像素的分类结果。

面向对象;单值(PUL)分类;多源高分辨率影像;耕地;不完全训练集

P236

B

0494-0911(2014)10-0078-04

2013-08-20

国土空间规划决策支持与管理平台开发(2012BAB11B05);国土空间优化配置关键技术研究与示范(2012BAB11B00)

徐世武(1973―),男,土家族,湖北长阳人,博士,副教授,主要从事国产GIS、遥感、国土资源管理的教学、科研与成果产业化工作。

杨 双

徐世武,杨双,孙飞,等.面向对象的高分辨率影像单值分类耕地提取方法研究[J].测绘通报,2014(10):78-81.

10.13474/j.cnki. 11-2246.2014.0334

猜你喜欢

单值样区面向对象
促进大果沙枣扦插育苗生长的最佳施肥措施
(i,k)-步双极单值中智竞争图
tt*几何的等单值τ函数
河北太行山南段冬季鸟类群落的多样性与分布
野生植物对陕北黄土丘陵区土壤石油污染影响研究
桂北油茶早实丰产林营建现状调查
多值函数w=Lnf(z)的单值解析分支
面向对象Web开发编程语言的的评估方法
峰丛洼地农作物面向对象信息提取规则集
基于面向对象的车辆管理软件的研制与开发