迁移学习支持下的遥感影像对象级分类样本自动选择方法
2014-06-27吴田军骆剑承夏列钢杨海平沈占锋胡晓东
吴田军,骆剑承,夏列钢,杨海平,沈占锋,胡晓东
1.中国科学院遥感与数字地球研究所,北京 100101;2.中国科学院大学,北京 100049
迁移学习支持下的遥感影像对象级分类样本自动选择方法
吴田军1,2,骆剑承1,夏列钢1,2,杨海平1,2,沈占锋1,胡晓东1
1.中国科学院遥感与数字地球研究所,北京 100101;2.中国科学院大学,北京 100049
面向遥感大范围应用的目标,自动化程度仍是遥感影像分类面临的重要问题,样本的人工选择难以适应当前土地覆盖信息自动化提取的实际应用需求。为了构建一套基于先验知识的遥感影像全自动分类流程,本文将空间信息挖掘技术引入到遥感信息提取过程中,提出一种面向遥感影像对象级分类的样本自动选择方法。该方法通过变化检测将不变地物标示在新的目标影像上,并将过去解译的地物类别知识迁移至新的影像上,建立新的特征与地物关系,从而完成历史专题数据辅助下目标影像的自动化对象级分类。试验结果表明,在已有历史专题层的图斑知识指导下,该方法能有效地自动选择适用于新影像分类的可靠样本,获得较好的信息提取效果,提高了对象级分类的效率。
自动化;土地覆盖;对象级分类;样本选择;变化检测;迁移学习
1 引 言
土地利用/覆盖变化(land use and cover change, LUCC)影响着生态环境与气候的变化,是地球表层系统最突出的景观标志之一[1]。遥感作为全球动态监测的重要手段,可以在短周期内对地球表层状况变化进行大规模同步观测,在区域环境变化监测、土地资源合理利用评估等研究中发挥着巨大的作用。LUCC的遥感监测是遥感技术在土地资源领域应用中的一项基础工作,其首要条件是能有效地快速提取各类土地覆盖因子信息,将遥感观测数据转化为有利用价值的土地覆盖时空信息。因此,基于遥感影像分类的土地覆盖信息提取在LUCC应用中显得尤为重要,是其中最基本的核心问题[2]。
作为土地覆盖信息获取的重要手段,遥感影像计算机自动分类方法在模式识别与遥感领域专家的共同推动下得到了较大发展,各种自动、精确、高效的方法被陆续提出[3-15]。然而目前的自动分类方法只是区别于目视解译而提出的,都还需要一定的人工参与和控制,特别是分类所需的训练样本往往需要人工采集,远未达到真正的自动分类水平。因此在实际应用中,面对较高时间分辨率的遥感影像分类任务,训练样本的实时快速采集已成为遥感大规模应用面临的瓶颈问题,是从技术实践的角度来看制约遥感影像分类方法全自动化的主要问题,这需要对影像分类技术的各个环节提出改进需求,以增加遥感的应用能力。
事实上,过往采集的样本和分类专题图能为新的分类任务提供丰富先验知识,但现有的算法没能很好地考虑如何结合这些辅助数据开展基于先验知识的遥感信息自动提取,因此限制了遥感分类方法的应用。鉴于此,本文在遥感多尺度分割和图谱特征定量化表达基础上,克服样本的人工手动采集问题,提出一种基于迁移学习的土地覆盖对象级分类样本自动选择方法。该方法将当前遥感影像数据与先验历史辅助数据有机结合起来,实现地学知识的形式化,通过变化检测及辅助数据的指导完成新影像分类样本的自动采集,进而对当前新影像进行全自动化地学解译。
2 迁移学习
土地覆盖分类方法一般需要在给定充分训练样本的基础上来学习一个预测模型,训练样本的采集是其中非常重要的步骤。而针对这些新的影像分类任务,样本库中训练样本往往是过期的,不能满足传统机器学习理论要求的同分布假设,即训练样本与待分类影像服从相同的概率统计分布。而受到如大气吸收与散射、传感器标定、太阳高度角、方位角、物候时相、数据处理过程等多种因素的影响,卫星传感器获得的地物光谱数据常常会随着时间的变化而变化,这使得前期影像上采集的训练样本和当前新影像数据的光谱值并不能服从相同的概率统计分布,传统的分类算法将无法开展运用,此时需要重新标注大量新的样本以满足当前影像分类任务的训练需求,而标注新样本则会耗费大量的时间、人力及物力,影响土地覆盖分类专题的快速生产,降低分类专题的时效性。而前期的土地覆盖专题图或历史土地利用矢量图是富含有大量先验信息与知识的,从中获取大量过期样本及其空间位置是有助于当前目标影像分类的。因此,完全丢弃这些信息是非常浪费的,有必要挖掘历史知识来辅助完成当前的影像分类任务。如何将历史信息与知识得到合理的迁移,获得适合于当前影像分类的训练样本用于帮助学习,是遥感影像分类流程全自动化的切入点。
迁移学习(transfer learning,TL)是近年来新提出的解决上述问题的一种机器学习理论,它将数据集划分为两部分:即源领域数据集Ds={(xis,yis)}im=1与目标领域数据集Dt={(xit, yit)}in=1,其中目标领域数据集又划分为训练集Dt-train={(xit,yit)}ip=1和测试集Dt-test={(xit, yit)}in=p+1。这里所有的数据均处于同一特征空间,即所有的x都可由特征空间中的特征来描述。实际应用中,Dt-train一般需由人工标注获取,而且少量的Dt-train数据不足以选择出较优的特征子集或训练出一个好的分类器。Ds中虽然包含大量的有标签数据,但是Ds与Dt不同的数据分布使得Ds中的数据不能直接用于开展Dt的分类工作,需要在Ds的基础上借助一定的策略来完成特征子集的选取。迁移学习的目标就是从现有的先验样本数据中迁移知识,将从一个环境中学到的知识用来帮助新环境中的学习任务,且没有传统机器学习理论要求训练数据与测试数据同分布的严格假设[16-17],因此该理论可将历史专题图(源领域)中发现的知识用于新影像(目标领域)的分类,适用于时间密集型遥感数据的分类专题生产与更新任务。
在迁移学习中,主要研究3个问题,即迁移什么、如何迁移与何时迁移。基于迁移什么的问题,目前解决知识迁移的方法可总结为4类[16],即实例迁移(instance transfer)、特征迁移(feature transfer)、参数迁移(parameter transfer)和关联知识迁移(relational knowledge transfer)。关联知识迁移是通过假定源领域数据和目标领域数据之间的关系存在一定的相似性,通过建立源领域数据与目标领域数据的空间映射关系来实现知识的迁移。本文在关联知识迁移的框架下,针对前期解译知识辅助下的遥感影像分类任务,设计了基于变化检测的地物类别标签(关联知识)的迁移方法。它是通过新旧两期影像的变化检测将不变地物及其位置标示在新的目标影像上,并将旧时相解译的地物类别标签知识迁移至新影像,从而实现“不变地物类别解译知识”从源领域向目标领域的迁移,用于建立新的特征—地物关系,完成新影像的分类。
3 具体算法设计与实现
本文设计的方法是面向对象分析框架下的一系列算法集合,总体流程图如图1所示。其技术重点是在已有专题层的图斑信息指导下,通过结合变化检测与迁移学习实现土地覆盖对象级分类样本的自动采集。算法除了设定感兴趣区域、分类需求及预处理外,计算机将全自动完成影像的分割、“图谱”特征计算、对象级分类样本选择、特征提取与优选以及影像分类等一系列过程。下面就该流程中的几个关键技术及其实现加以阐述和说明。
图1 基于变化检测与迁移学习的土地覆盖全自动分类技术实现总体流程图Fig.1 Flow chart of the technology implementation for change detection and transfer learning-based fully automatic land-cover classification
3.1 多尺度分割与“图谱”特征计算
算法首先需要通过多尺度分割和矢量化完成目标影像同质基元对象的提取。考虑到遥感影像分割的稳健性和适用性,笔者采用了基于均值漂移(mean shift,MS)的影像分割算法[18],该算法通过控制核带宽参数h=(hs,hr)决定分割精度,最小区域合并尺度参数M控制基元对象的空间大小,易于实现不同尺度下的基元合并,达到多尺度分割的目的。均值漂移多尺度分割方法的原理与实现过程具体可参考文献[18]。
在影像分割基础上,计算同质基元对象的“图谱”特征[19-21],构建特征专题层。首先,鉴于光谱特征是遥感影像的本质特征,本文以影像分割后的对象为单元,设计并实现了对象对应遥感影像各波段均值、标准差等光谱统计特征的计算。其次,对象的形状特征能反映图斑的几何特征,对于人工地物和条带状地物,形状特征是地物类型识别的重要特征,可以辅助解决许多“同谱异物”现象。因此,本文在多尺度分割的基础上计算了对象的矩形主方向、长宽比、形状指数等形状特征参数来定量评价对象的形状特征。此外,纹理信息也是中高分辨率遥感影像的重要信息,特别是高分辨率遥感影像,一般波段数较少,而纹理等空间结构信息却非常丰富。细小地物在影像上有规律地重复出现,它反映了色调变化的频率,纹理形式很多,包括点、斑、格、垅、栅等。每种类型的地物在影像上都有本身的纹理图案,可以从影像的这一特征识别地物。因此,本文通过大量对比试验确定了对象基于灰度共生矩阵的纹理特征描述算法,包括纹理测度的选择以及窗口大小的确定等。为此,本文算法综合上述关于基元对象的光谱、形状、纹理三大类特征,计算了表1所列的23维“图谱”特征并生成了一系列具有物理意义的、以空间对象为单元的特征层,进而构建监督学习所需的高维矢量特征空间,为后继对象级的分类提供丰富的信息支持。表1中各类对象“图谱”特征的具体计算方法可参见文献[21]。
表1 对象“图谱”特征列表Tab.1 Table of“spatial-spectral”features of objects
3.2 变化检测与不变地物像元确定
算法流程的第2个关键步骤是借助新旧时相遥感影像的变化检测确定不变地物的像元位置,并将其标识在新的目标影像上用于类别标签知识的迁移。本文采用基于像元级直接比较的变化检测方法,如比值法、差值法、主成分变换法(principle component analysis,PCA)、变换向量分析法(change vector analysis,CVA)等。这些方法有各自的特点和适用范围,针对不同的数据源和应用需求,需选择合适的变化检测算法[22]。此外,上述检测方法在具体实施过程中的阈值参数选择一般需依赖经验指导,因此为保证流程的自动化,本文运用大津法来自适应地动态调优确定阈值参数。在此基础上,试验中将以PCA作为主要方法实现新旧两期影像的变化检测,确定不变地物及其像元的空间位置,并将其标识到新影像上。
3.3 知识迁移与对象级样本自动选择
基于迁移学习的对象级训练样本自动选取方法是整个算法流程的重点,旨在于能一定程度上解决影响土地覆盖分类全自动化的瓶颈问题。主要实现思路是将前期解译的土地覆盖专题图作为重要的先验知识,结合变化检测获得的不变地物空间“位置”信息,通过地理位置匹配指导当前目标影像对象级训练样本的选取。
具体方法如图2所示:将当前目标遥感影像与前期辅助遥感影像进行像素级直接比较变化检测,提取出前后两时相影像中未发生属性变化的像元,并记录它们的空间地理“位置”坐标,以此作为新旧时相的关联信息进行地理位置匹配和知识的迁移,即将不变像元在前期专题图中的类别标签知识迁移至当前目标影像中,获得新影像在不变像元位置处的类别标注。在此基础上,针对3.1节提取的基元对象,采用图2所示的阈值筛选规则(包括对象尺寸的大小、对象中包含已标注像元所占比例以及对象中标注为同类的像元所占比例等)和样本纯化技术获得易被判定且可信度较高的“高纯度”对象,并对其进行自动标注,标签即为对象中所占比例最高的未变化像元所属类别,从而实现对象级训练样本的自动标注。
在此需要特别说明的是,在满足阈值规则条件情形下的对象存在一定的错误样本,需剔除其中不合要求的对象。笔者通过对象的光谱信息和空间信息来判断像元是否符合要求:一方面,从光谱信息上来判断,如果对象与训练样本的类型在光谱上是可分的,则可通过计算对象中像元亮度均值与类型亮度值中心(均值)的距离(差值)来进行对象纯化判断,即任一对象某波段亮度值xi与该训练样本类型亮度值中心(均值)μi的距离(差值)大于某一阈值,就认为该对象为不符合要求的对象;另一方面,从空间信息上来判断,可以根据每一对象内部像元的光谱标准差σi的大小来确定是否是非纯对象。基于此,本文构造了如下准则来纯化对象
式中,DNmax为该类影像最大的波段亮度值;n为波段数。
图2 历史专题数据辅助下的对象级样本自动确定方法示意图Fig.2 Diagram of automatic determination of object samples with the assist of preliminary thematic data
通过上述对象样本自动选择方法,将土地覆盖分类与变化检测的过程有机结合起来,通过变化检测和地理匹配建立历史数据与当前数据间的互作用关联关系,进而充分发掘历史积累的解译经验知识,并将不变地物的类别标签知识迁移至目标新影像中,经过样本自动筛选和纯化确定适用于当前影像分类的对象级样本,克服了前后时相样本光谱数据不一致的问题,也使先验知识的应用找到合适的切入点。自动选择的对象级样本不仅准确可靠而且具有较广泛的代表性,有助于对象级分类的有效开展。
3.4 对象级分类与分类后变化检测
在自动采集了与当前目标影像分类相适应的对象级样本后,依据对象已计算的“图谱”特征,选择最佳的特征组合和分类模型进行监督分类。目前有关特征优选与分类模型的方法也较多[23],考虑到应用效率问题,本文采用C5.0决策树算法[9]完成特征的优选及对象级分类模型的训练,从而构建判别规则集用于对象的分类,形成当前期的土地覆盖专题图。在此基础上,可将其与前期的土地覆盖专题图进行叠加分析,快速检测出土地覆盖的变化区域与变化类型,完成LUCC空间信息产品的及时更新。
4 试验与结果分析
4.1 试验1
试验1采用东莞市某区域2006-04-13与2007-07-15的两景SPOT5多光谱遥感影像(图3),空间分辨率为10 m,影像尺寸为1000像素×1000像素。该区域为典型的广东省地貌,包含的地类主要有:耕地、园林地、草地、建设用地、水域、荒地6大类,每种地类均有较好的影像特征,目视易分辨解译,适合对分类算法进行全面客观的测试和评价。以2006年的影像(图3(a))作为前期辅助遥感影像,2007年的影像(图3(b))作为待分类目标新影像。由于物候差异有一定的辐射不一致,因而两幅试验影像的光谱值必然服从不同的概率统计分布,难以直接使用与图3(a)相匹配的过期训练样本完成图3(b)的分类任务。
图3 旧时相和新时相SPOT5遥感影像(3/2/1波段)Fig.3 Previous and current target SPOT5 remotely sensed imageries for classification(band 3/2/1)
依据影像数据的地物特点,设定均值漂移多尺度分割的空间尺度参数、光谱尺度参数、最小区域合并尺度参数分别为hs=7,hr=6.5,M=150。在此设置下获得目标新影像的分割结果如图4(a)所示。同时,在该区域2006年土地覆盖专题图(图5 (a))的辅助下,利用变化检测、迁移学习以及图2所示的对象级样本筛选规则(对象尺寸大小不小于50个像元,对象中已标注的像元不少于95%且同类像元占已标注像元的比例不小于90%)和纯化准则(式(1)),获得与当前影像分类任务相适应的对象级训练样本,见图4(a)。最后利用C5.0决策树对上述对象级样本的“图谱”特征进行优选和学习,并构建规则对图4(a)所示的分割对象进行分类,最终获得如图5(b)所示的新一期土地覆盖分类结果。
图4 SPOT5影像多尺度分割结果、对象级样本及随机验证样本点分布Fig.4 Results of multi-scale segmentation,distributions of the object samples and random validation points for SPOT5 image
本文采用直接检验法验证土地覆盖分类精度,通过生成均匀分布的随机验证点对分类结果进行精度评估。检验方法步骤如下:如图4(b)所示,首先生成与试验区影像等大的10×10规则网格,以保证验证样本点的均匀分布,在每个网格中随机生成5个随机点,以保证验证点采集的随机性、客观性,以此共采集了484个有效验证样本点(排除16个在区域外的无效点);其次通过人工目视解译,记录影像上每个验证点的土地覆盖类型;然后基于分类结果,获取每个验证点对应的分类结果;最后通过叠加对比得到分类精度混淆矩阵表2。
图5 旧时相土地覆盖专题辅助数据与新时相目标SPOT5影像土地覆盖分类结果Fig.5 Previous preliminary land-cover thematic image and result of classification for current SPOT5 image
表2 SPOT5影像分类精度混淆矩阵Tab.2 Confusion matrix of classification accuracy for SPOT5 image
观察表2可以看到,虽然草地、建设用地、水域及荒地的分类精度不高,分别只有68.91%、59.09%、69.23%和53.33%,但由于没有识别率特别低的地类且园林地与耕地分类准确率较高,分别为92.61%与89.60%,使得总体精度达到80.57%,Kappa系数为0.737 9。因此,方法的分类结果总体准确率较高,与实际地类情况基本吻合。另外,通过检查分类错误的样本点后,发现相当一部分分类错误的样本点可以归纳为以下两种情况:①验证点处在两个不同地类的交界处,人工目视也不能判定具体属于哪一个类别,多发生在水域与植被的模糊交界处,导致人工解译和方法分类的结果不相同;②验证点处在人工目视解译容易混淆的地类中,如耕地与草地、园林地与耕地、耕地与荒地易于混淆并发生误分。因此,一部分的分类错误实为人工解译结果错误导致,若能在完全排除人工解译所导致错误的条件下,或者以整体影像的准确分类数据为检验标准的条件下,检验所得到的准确率理论上应大于前述的分类准确率。
4.2 试验2
为进一步验证本文所提出的方法,试验2采用安徽省淮南市某区域2012-11-05与2013-03-08的两景国产资源三号(ZY3)卫星融合遥感影像(图6),影像空间分辨率为2.1 m,尺寸均为5035像素×6338像素。试验以2012年的影像(图6(a))作为前期辅助遥感影像,2013年的影像(图6(b))作为待分类的目标新影像。两幅影像同样由于存在较大的物候差异而使得地类对应的光谱值服从不同的概率统计分布。
图6 旧时相和新时相ZY3遥感影像(4/3/2波段)Fig.6 Previous and current target ZY3 remotely sensed imageries for classification(band 4/3/2)
运用试验1相同的精度验证方法采集了600个验证点,计算得到本试验的分类精度混淆矩阵表3。可以看到,目标影像的土地覆盖分类总体精度能达到91.83%,对应的Kappa系数为0.876 4,可见方法基于图7(b)所示的自动选择样本有较准确的土地覆盖分类结果,特别是对于园林地、草地、水域及建设用地的提取精度较高,分别能达到93.8%、90.5%、98.0%和92.7%。通过检查分类错误验证点发现,若能在完全排除人工解译导致的错误,检验所得到的准确率理论上应更优。因此,使用本文方法自动采集对象级样本大大降低了人工采集的烦琐性,且自动获取的样本具有较高的可靠性,能有效地用于土地覆盖专题图的快速更新。
图7 ZY3影像多尺度分割结果、对象级样本分布Fig.7 Results of multi-scale segmentation,distributions of the object samples for ZY3 image
表3 ZY3影像分类精度混淆矩阵Tab.3 Confusion matrix of classification accuracy for ZY3 image
图8 旧时相土地覆盖专题辅助数据与新时相目标ZY3影像土地覆盖分类结果Fig.8 Previous preliminary land-cover thematic image and result of classification for current ZY3 image
5 结 论
围绕遥感影像大范围应用的目标,本文在历史专题数据的辅助下,提出了一种基于迁移学习的对象级样本自动选择方法,并以此构建了一套全自动化的土地覆盖对象级分类流程,以适应目前时间密集型的中高空间分辨率遥感影像信息提取的需求。该流程从整个方法体系上来看,除了将前期辅助数据和当前目标新影像等作为必要输入外,其他步骤都是在其他各类信息的自动提取和融合后所自动实现的,特别是样本的选择不需要进行任何的人工干预工作,因此提高了土地覆盖分类的自动化程度与适用性,能一定程度上满足“全自动化”的应用需求,具有一定的实际应用价值。
本文方法为知识发现与遥感领域应用的结合提供了新的思路,是开展土地覆盖信息自动化提取具有参考价值的一次技术实践。文中描述的试验中,为了说明整个计算流程的有效性,在某些步骤使用了较为简捷的计算方法,事实上可以用更有针对性、更加有效的算法加以替代,例如,通过对基于多示例学习[24]理论的决策树分类算法及基于多元分析检测(multiple analysis detection, MAD)[25]的变化分析等方法的深入应用有望进一步提高整个方法体系的精度。此外,算法中对象级样本筛选规则和纯化准则也可以作进一步设计和优化以提高样本可靠度。主要可以从如何提高变化检测精度和样本质量,以及有效使用无标签或标签可靠性低的训练样本等角度加以考虑。近年来,基于半监督学习[26]的理论对于如何使用无标签及低可靠性样本有新的算法不断涌现,可以加以借鉴运用。这些新的机器学习理论值得在今后的研究工作中逐步深入,以便能更好地结合遥感领域知识为遥感智能信息提取所用。
[1] LIU Jiyuan.Study on Chinese Resources and Environment Survey and Dynamic Monitoring Using Remote Sensing [M].Beijing:Press of University of Science and Technology of China,1996.(刘纪远.中国资源环境遥感宏观调查与动态研究[M].北京:中国科学技术出版社,1996.)
[2] GAN Fuping,WANG Runsheng,WANG Yongjian,et al.The Classification Method Based on Remote Sensing Techniques for Land Use and Cover[J].Remote Sensing for Land and Resources,1999,4(4):40-45.(甘甫平,王润生,王永江,等.基于遥感技术的土地利用与土地覆盖的分类方法[J].国土资源遥感,1999,4(4):40-45.)
[3] RICHARDS J A,JIA X P.Remote Sensing Digital Image Analysis:An Introduction[M].4th Edition.Berlin: Springer-Verlag Inc,2012.
[4] LU D,WENG Q.A Survey of Image Classification Methods and Techniques for Improving Classification Performance [J].International Journal of Remote Sensing,2007, 28(5):823-870.
[5] TSO B,MATHER P.Classification Methods for Remotely Sensed Data[M].2nd Edition.New York:Taylor& Francis Inc.,2009.
[6] LUO Jiancheng,ZHOU Chenghu,YANG Yan.Land-cover and Land-use Classification Based on Remote Sensing Intelligent Geo-interpreting Model[J].Journal of Natural Resources,2001,16(2):179-183.(骆剑承,周成虎,杨艳.遥感地学智能图解模型支持下的土地覆盖/土地利用分类[J].自然资源学报,2001,16(2):179-183.)
[7] LUO Jiancheng,WANG Qinmin,MA Jianghong,et al.The EM-based Maximum Likelihood Classifier for Remotely Sensed Data[J].Acta Geodaetica et Cartographica Sinica, 2002,31(3):234-239.(骆剑承,王钦敏,马江洪,等.遥感图像最大似然分类方法EM改进算法[J].测绘学报, 2002,31(3):234-239.)
[8] LUO Jiancheng,ZHOU Chenghu,LEUNG Yee,et al.Support Vector Machine for Spatial Feature Extraction and Classification of Remotely Sensed Imagery[J].Journal of Remote Sensing,2002,6(1):50-55.(骆剑承,周成虎,梁怡,等.支持向量机及其遥感影像空间特征提取和分类的应用研究[J].遥感学报,2002,6(1):50-55.)
[9] BARROS,RODRIGO C,BASGALUPP M P,et al.A Survey of Evolutionary Algorithms for Decision-Tree Induction [J].IEEE Transactions on Systems,Man and Cybernetics, Part C:Applications and Reviews,2012,42(3):291-312.
[10] LEI Zhen.Random Forest and Its Application in Remote Sensing[D].Shanghai:Shanghai Jiao Tong University, 2012.(雷震.随机森林及其在遥感影像处理中应用研究[D].上海:上海交通大学,2012.)
[11] LUO Jiancheng,ZHOU Chenghu,YANG Yan.ANN Remote Sensing Classification Model and Its Integration Approach with Geo-knowledge[J].Journal of Remote Sensing, 2001,5(2):122-129.(骆剑承,周成虎,杨艳.人工神经网络遥感影像分类模型及其与知识集成方法研究 [J].遥感学报,2001,5(2):122-129.)
[12] BRIEM G J,BENEDIKTSSON J A,SVEINSSON J R.Multiple Classifiers Applied to Multisource Remote Sensing Data[J].IEEE Transactions on Geoscience and Remote Sensing,2002,40(10):2291-2299.
[13] MENNIS J,GUO D.Spatial Data Mining and Geographic Knowledge Discovery:An Introduction[J].Computers, Environment and Urban Systems,2009,33(6):403-408.[14] XIA Liegang.Study on Automatic Classification Method for Remotely Sensed Imagery by Incorporating Spatial-Spectral Features[D].Hangzhou:Zhejiang University of Technology,2011.(夏列钢.耦合“图-谱”特征的遥感影像自动分类方法研究[D].杭州:浙江工业大学,2011.)
[15] ZHOU Chenghu,LUO Jiancheng.Geo-computation of Highresolution Satellite Remote Sensing Image[M].Beijing: Science Press,2009.(周成虎,骆剑承.高分辨率卫星遥感影像地学计算[M].北京:科学出版社,2009.)
[16] PAN S J,YANG Q.A Survey on Transfer Learning[J].IEEE Transactions on Knowledge and Data Engineering, 2010,22(10):1345-1359.
[17] DAI W Y,CHEN Y Q,XUE G R,et al.Translated Learning:Transfer Learning across Different Feature Spaces[C]∥Processing of 2008 Advances in Neural Information Processing Systems 12(NIPS 2008).Vancouver:[s.n.],2008:353-360.
[18] COMANICIU D,MEER P.Mean Shift:A Robust Approach toward Feature Space Analysis[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,2002,24(5): 603-619.
[19] CHEN Shupeng,YUE Tianxiang,LI Huiguo.Studies on Geo-informatic Tupu and Its Application[J].Geographical Research,2000,19(4):337-343.(陈述彭,岳天祥,励惠国.地学信息图谱研究及其应用[J].地理研究,2000, 19(4):337-343.)
[20] LUO Jiancheng,ZHOU Chenghu,SHEN Zhanfeng,et al.Theoretic and Methodological Review on Sensor Information Tupu Computation[J].Journal of Geo-information Science,2009,11(5):664-669.(骆剑承,周成虎,沈占锋,等.遥感信息图谱计算的理论方法研究[J].地球信息科学学报,2009,11(5):664-669.)
[21] GAO Wei.The Study of Information Extraction Technology for Remote Sensing Based on Feature Knowledge[D].Beijing:China University of Geosciences,2010.(高伟.基于特征知识库的遥感信息提取技术研究[D].北京:中国地质大学,2010.)
[22] WANG Yan.The Research of Land Use/Cover Change Detection Using High-resolution Remote Sensing Images Based on Image Segments Statistical Analysis[D].Wuhan:Wuhan University,2012.(王琰.基于像斑统计分析的高分辨率遥感影像土地利用/覆盖变化检测方法研究[D].武汉:武汉大学,2012.)
[23] BISHOP C M.Pattern Recognition and Machine Learning [M].New York:Springer-Verlag Inc,2006.
[24] ZHOU Z H,ZHANG M L,HUANG S J,et al.Multiinstance Multi-label Learning[J].Artificial Intelligence, 2012,176(1),2291-2320.
[25] NIELSEN A A.The Regularized Iteratively Reweighted MAD Method for Change Detection in Multi-and Hyperspectral Data[J].IEEE Transaction on Image Processing,2007,16(2),463-478.
[26] ZHU X J.Semi-Supervised Learning Literature Survey[R].Madison:University of Wisconsin Madison,2008.
(责任编辑:宋启凡)
An Automatic Sample Collection Method for Object-oriented Classification of Remotely Sensed Imageries Based on Transfer Learning
WU Tianjun1,2,LUO Jiancheng1,XIA Liegang1,2,YANG Haiping1,2,SHEN Zhanfeng1,HU Xiaodong1
1.Institute of Remote Sensing and Digital Earth,Chinese Academy of Sciences,Beijing 100101,China;2.University of Chinese Academy of Sciences,Beijing 100049,China
For the large-scale remote sensing applications,the automatic classification of remotely sensed imageries is still a challenge.For example,the artificial sample collection scheme cannot meet the needs of automatic information extraction from the remotely sensed imageries.In order to establish a prior knowledge-based and fully automatic classification method,an automatic sample collection method for objectoriented classification,with the introduction of data mining to the process of information extraction,is proposed.Firstly,the unchanged landmarks are located.Then the prior class knowledge from old interpreted thematic images is transferred to the new target images,and the above knowledge is then used to rebuild the relationship between landmark classes and their spatial-spectral features.The results show that,with the assist of preliminary thematic data,the approach can automatically obtain reliable object samples for object-oriented classification.The accuracy of the classified land-cover types and the efficiency of object-oriented classification are both improved.
automation;land-cover;object-oriented classification;sample collection;change detection; transfer learning
WU Tianjun(1986—),male,PhD candidate,majors in high performance remote sensing information processing and analysis,statistical analysis of spatial data.
P237;TP751.1
A
1001-1595(2014)09-0908-09
国家自然科学基金(41101398;41271367;41071247;11261044);国家863计划(2013AA12A401);中国科学院重点部署项目课题(KZZD-EW-07-02);国家科技支撑计划重点项目课题(2011BAH06B02);国家国际科技合作计划(2010DFA92720);国家科技支撑计划课题(2012BAH33B01)
2013-07-23
吴田军(1986—),男,博士生,主要研究方向为高性能遥感信息计算与分析、空间数据统计分析。
E-mail:tjwucn@gmail.com.
WU Tianjun,LUO Jiancheng,XIA Liegang,et al.An Automatic Sample Collection Method for Object-oriented Classification of Remotely Sensed Imageries Based on Transfer Learning[J].Acta Geodaetica et Cartographica Sinica,2014,43(9):908-916.(吴田军,骆剑承,夏列钢,等.迁移学习支持下的遥感影像对象级分类样本自动选择方法[J].测绘学报,2014,43(9):908-916.)
10.13485/j.cnki.11-2089.2014.0163
修回日期:2014-02-25