面向对象信息提取的共性技术研究
2010-04-19魏金明吴闯仲伟政
魏金明,吴闯,仲伟政
(济南市勘察测绘研究院,山东济南 250013)
面向对象信息提取的共性技术研究
魏金明∗,吴闯,仲伟政
(济南市勘察测绘研究院,山东济南 250013)
面向对象的信息提取方法已成为高分辨率遥感影像信息提取研究的热点,许多学者利用该方法对遥感影像进行分类和信息提取,并取得了很好的效果。但目前还没有人对其共性技术进行系统的总结。本文总结了面向对象的遥感影像信息提取通用技术流程,并对其中的共性技术如影像分割、特征定义及选取、影像分类等做以相关的介绍。
面向对象;信息提取;高分辨率;影像分割;影像分类
1 引 言
遥感数据获取技术的快速发展,尤其是高分辨率遥感影像的大量出现,大大推动了遥感数据在多个行业部门的广泛应用。高分辨率遥感影像提供了比中低分辨率遥感影像更多的信息(纹理、形状、拓扑等)。针对高分辨率遥感数据的特点,一些学者提出了面向对象的信息提取方法[1]。该方法不仅利用地物的光谱信息,更多的是利用其几何信息和结构信息,可以弥补传统的基于像元的信息提取方法的不足,从高分辨率影像上提取更精细更丰富的地物信息,提高分类精度,更好地为各个领域的研究提供支持。
目前,已有许多专家对面向对象的方法进行了研究,如Willhauck等采用面向对象的影像分析方法,集合了多种数据如ERS SAR影像、植被图及NOAA数据完成了印尼在1997年与1998年严重森林火灾后的制图任务[2]。Huang Huiping等进行了相关的实验,对面向对象分类结果的精度和准确性进行了肯定[3]。Qian Yu利用面向对象分类方法,用航空高分辨率遥感影像进行了森林资源的调查,分类数量达到43个,取得了比较满意的结果[4]。虽然许多学者利用该方法对遥感影像进行分类和信息提取,并取得了很好的效果。但目前还没有人对其共性技术进行系统的总结。文中总结了基于对象的遥感影像信息提取通用技术流程,并对其中的共性技术如影像分割、特征定义及选取、影像分类等做一相关的介绍。
2 技术流程
目前,已有许多商业软件应用于面向对象的技术对遥感影像的信息提取。如德国Definiens Imaging公司推出的面向对象的遥感影像分析软件eCognition; ERDAS IMAGINE软件也在其9.0版本后,推出了扩展模块Feature Analyst;ENVI软件在版本4.4后,提供了特征提取模块FX(ENVI Feature Extraction)。在总结已有面向对象处理方法和现有商业软件的基础上,提出了面向对象的信息提取技术流程如图1所示。
图1 面向对象的信息提取技术流程
3 共性技术
在面向对象的信息提取技术流程中,总结了面向信息提取方法的共性技术,它包括:数据准备,影像多尺度分割,对象特征的选择和组合,影像分类,分类精度评价,分类后处理。
3.1 数据准备
数据准备包括影像预处理,影像增强和变换,辅助数据处理三部分。影像预处理主要指几何纠正和辐射纠正,以去除图像获取过程中产生的变形、扭曲,模糊(递降)和噪音等,得到一个尽可能在几何和辐射上真实的图像。遥感影像增强和变换处理的目的是为了突出有用信息,加大各地物间的差异性,以便于后续分析。对附加的专题数据进行处理,使其与影像数据具有相同的坐标系统,并做到精确配准。
3.2 影像多尺度分割
影像的多尺度分割将影像划分为具有内部同质性和外部异质性的影像对象,使具有相同光谱实体的像元变为具有平均光谱属性和进化空间属性的对象。分割算法库可提供多种影像分割算法,如四叉树分割、均值漂移分割和区域生长分割等。
图2 影像对象层次网络
用选定的分割算法对一幅遥感影像进行分割前,需要设定分割参数。如区域生长法需要设定颜色权值、形状权重、光滑度权重、紧致度权重和分割尺度。分割完成后便生成一个影像对象层。用不同的分割参数经多次分割便可形成影像对象层次网络。影像对象层次网络中的每一个对象都有自己的邻对象、子对象和父对象。对象垂直链接后,便可以利用尺度和高级的纹理特征。影像对象层次网络可以同时展示不同尺度的影像信息,如图2所示[6]。影像对象层次网状结构是一个拓扑关系,比如,父对象的边界决定了子对象的边界,父对象的区域大小由子对象的总和决定,每一层都可由它的直接的子对象来构成。在下一个高层上,子对象合并为大对象。这个合并会被已有父对象的边界所限制。如果是不同的父对象,那么相邻的对象不能进行合并。
3.3 对象特征的选择和组合
影像对象的属性被定义为特征。内在的影像对象特征有形状、颜色等,外部特征有与邻域的关系等,另外,可根据现存特征建立自定义特征,如植被指数(NDVI)。
广义上说,特征包括对象特征、类相关特征、场景特征、处理相关特征等。具体讲,可包括光谱特征(如均值、标准差、比率等),形状特征(如面积、紧致度、对称性等),纹理特征(如光谱纹理、形状纹理、GLCM特性等),拓扑特征(如对象间的相邻、相接、包含等)等等,这些特征都可以在特征库中表示。特征库中包含了众多的特征。
通过查看和分析各特征信息,可在不同的影像对象层中灵活运用对象特征,以确定描述某一特定地物的最优特征组合。如通过对形状特征的长宽比计算,可对线性地物有很好的突出作用。特征组合的原则是用最少的特征准确的描述某一地物类。
3.4 影像分类
根据要划分的地物类别,结合特征库和分类规则库,可建立各地物类的分类规则。具体的规则建立需考虑以下3个层次:①各层次类型的规则建立。根据对象的光谱特征、几何特征和拓扑特征等定义类型的判定规则。②层内子类型对父类型继承。如果存在子类型,子类型应首先继承其父类型的判定规则,然后增加其特有的光谱特征、几何特征和拓扑特征作为判定规则。③对每一层的分类结果进行合并与传递,形成最终的分类判定规则。需要说明的是,每一规则的建立并不一定必须包含以上3个层次,如果能很好地对地物进行判定,仅用一个层次也可以形成规则。同样,在每个层次也可以灵活选择其特征形成其规则。另外,还可以通过调整特征函数的表现形状定义自定义特征。
如对一幅已建立了影像对象层次网络的遥感影像,建立各类别的分类规则可以由两种途径来实现:
(1)对各类采样并自动建立分类规则。
在影像对象层中选择地物类训练样本,由于一个影像对象可以覆盖许多典型像素和它们的变量,故只需选择很少的训练样本。为各地物类选择完训练样本之后,可以自动生成各类别的最优特征表示,进而可以自动建立分类规则。该方法自动化程度高,可以快速的为各类别建立分类规则,但不可以为各类建立类层次关系,分类精确度不是很高。
(2)通过查看和分析各类别的特征表现,建立分类层次并定义各类别的分类规则。
该方法的关键是根据各类别的特征信息和类别间的关系,建立分类层次(分类树),并为各类定义最优的特征函数。如对一幅建立了4个影像对象层次网络的影像,在高等级影像对象层中可以分为水体和非水体;在中高级影像对象层中,我们可以将水体分为河流和湖泊,将非水体分为绿地和非绿地;在中低级影像对象层中,可以将绿地分为林地和草地,将非绿地分为建筑物和裸地;在低级的影像对象层中,可以将林地分为稀树林和密树林。依此原则,对一幅影像,我们可以建立复杂的分类层次结构。在分类层次中,叶子节点代表的类别为最终的分类类别。建立类别层次之后,就可以依据经验和试验为各类别建立特征函数,子类的特征函数会自动继承父类的特征函数,进而建立各类别的分类规则。在分类层次中,从根节点开始,对每个内部节点,采用自上至下的方法,找出其相应的特征函数进行测试,在不同的测试结果找到最优的分类准则,对新节点再重复上述操作,不断循环,直至到达最后一个叶子节点。该方法需要有丰富的先验知识并通过多次试验以确定最优的分类体系,自动化程度不高,但分类精度高。我们拟针对市场上常用的遥感影像数据建立通用的分类体系,同时针对专题应用建立专题应用模型。
在分类算法库中包含多种分类算法,如最邻近分类法、模糊逻辑分类法等。
模糊逻辑分类是一种概率分类方法,同时又是一种利用专家系统的规则来进行分类的强大的分类技术。它把任意的特征值转化到0~1之间,表示属于某个特殊类的隶属度值。模糊分类可做到:①通过把特征值转化为隶属度值,使得特征规则化,并且允许特征的合并;②它提供了一个适应的和可修改的特征描述;③通过逻辑操作和分等级的分类描述方法使得对于复杂特征的描述简单化。一般情况下,模糊分类系统一般有3个步骤组成;模糊化、建立模糊规则和去模糊。
利用选定分类算法,执行分类操作,得到分类结果。
3.5 分类精度评价
分类精度评定包括目视查看和数学统计两种方法。目视查看指将分类后各类别与原始影像进行对比,以查看特征地物是否有明显的误分、漏分现象,该方法只能对明显错误作出判断,不可对错误进行量化;数学统计法指用混淆矩阵、Kappa系数等统计方法对分类精度进行评定,也是当前常用的精度评定方法。
混淆矩阵的定义如下:
式中,mij表示试验区内应属于i类的像素被分到j类中去的像素总数,n为类别数。混淆矩阵中对角线上的元素数值越大,则表示分类结果的可靠性越高;混淆矩阵中非对角线上的元素数值越大,则表示错误分类的现象越严重。
分类精度的主要指标有生产精度、用户精度、总体精度、漏分误差、错分误差和Kappa系数。
生产精度(PA):指某一类别的正确分类数占参考数据中该类别像元总数的比例。那么,相反错误的分类数占参考数据中该类别的总数则为漏分误差(OE)。
用户精度(UA):指某一类别正确的分类数占分为该类像元总数的比例。同样,错误的分类数占分为该类像元的总数则为错分误差(CE)。
总体精度(OA):指总正确分类数占总抽样数的比例,它反映了分类结果总的正确程度。
由于总分类精度只利用了混淆矩阵对角线上的元素,而未利用整个混淆矩阵的信息,作为分类误差的全面衡量尚欠不足,因此许多研究者提出了Kappa系数作为分类精度的一个指标。Kappa系数可用下式来表示:
式中,n为分类矩阵的行列数,mij为混淆矩阵中第i行第j列的元素值,mi+和m+i分别表示分类混淆矩阵的行总和及列总和,N为总观察值,也就是混淆矩阵中所有元素的和。由于Kappa系数全面地利用了混淆矩阵的信息,因此可作为分类精度的综合指标。
另外,针对某一特定地物类,还可以根据它的重合、漏分和误分三部分设计其重合率、漏分率和误分率3个精度评价指标。假定A为某特定类的参考数据,B为该特定类的分类结果。则:
重合率:反映了该类别分类结果的正确率,计算公式为:
重合度越高,该类别的分类效果越好。
漏分率:该类别分类结果中漏分部分占参考数据的比重,计算公式为:
漏分率越高,该类别的分类效果越差。
误分率:表示被误分到该类别的部分占该类别对象分类结果中的比重,计算公式为:
误分率越高,该类别的分类效果越差。
3.6 分类后处理
众所周知,任何的自动信息提取方法都不能保证每次的结果都完全正确,因此,人为参与下的快速半自动提取技术是自动信息提取的必要补充。分类后处理主要包括滤波技术和快速矢量编辑工具,将分类后过小的图斑去除,将漏分和错分的地物类编辑到正确的地物类别中。
4 总结与讨论
文中总结了面向对象的信息提取技术流程,并对其共性技术:数据准备、影像多尺度分割、对象特征的选择和组合、影像分类、分类精度评价、分类后处理进行了概括说明,使人们对面向对象的信息提取技术有了深入的认识。由于遥感影像信息提取的复杂性和特殊性,不同的影像在信息提取中对分割尺度,对象特征选取,分类规则和分类方法的具体要求不尽相同,这使人们在利用面向对象技术进行信息提取时,应具备相关的专业知识,并通过不断实践来获取最佳的结果。
[1]明冬萍,骆剑承,沈占锋等.高分辨率遥感影像信息提取与目标识别技术研究[J].测绘科学,2005(3):18~20
[2]Willhauck,G.,Benz,U.C.,and Siegert,F.,Semiautomatic classification procedures for fire monitoring using multitemporal SAR images and NOAA-AVHRR hotspot data,Proceedings of the 4th European Conference on Synthetic Aperture Radar,Cologne,Germany,2002,4~6
[3]Huang Huiping,Wu Bingfang,Fan jinlong.Analysis to the RelationshiP of Classification Accuracy Segmentation Scale Image Resolution[C].IEEE Trans,IGARSS,2003,6:3671~3673
[4]Qian Yu,Peng Gong et al.object-based Detai1ed Vegetation Classification with Airborne High Spatial Resolution Remote sensing Imagery[J].Photogrammetric Engineering&Remote sensing,2006,72(7):799~811
[5]周芳芳,樊晓平,叶榛,均值漂移算法的研究和应用[J],控制与决策,Vol.22 No.8,Aug 2007
[6]eCogonition Reference Book version 7.0
[7]eCogonition User Guide version 7.0
The Common Technologies of Object-based Information Extraction
Wei JinMing,Wu Chuang,Zhong WeiZheng
(JiNan Geotechnical Investigation and Surveying Institute,JiNan 250013,China)
The method of object-based information extraction has become a research hotspot for high-resolution remote sensing image.Many scholars make use of the method of remote sensing image classification and information extraction,and has good results.There has been no common technology for its system summary systematic summary.In the paper,the common process and technologies of object-based information extraction is summed up and common technologies,such as image segmentation,feature definition and selection,image classification are introduced.
object-based;information extraction;high-resolution;image segmentation;image classification
1672-8262(2010)05-100-04
TD353.6,P23
A
2009—12—16
魏金明(1982—),男,助理工程师,从事遥感图像处理与地理信息系统应用开发研究。