APP下载

改进贝叶斯ARTMAP的迁移学习遥感影像分类算法

2016-11-22敏,杨

电子学报 2016年9期
关键词:历史数据贝叶斯类别

韩 敏,杨 雪

(大连理工大学电子信息与电气工程学部,辽宁大连 116023)



改进贝叶斯ARTMAP的迁移学习遥感影像分类算法

韩 敏,杨 雪

(大连理工大学电子信息与电气工程学部,辽宁大连 116023)

遥感分类旨在从图像光谱中提取资源环境监测可用的地理信息,然而基于模式分类的图像处理技术受光谱漂移影响而缺乏历史样本重复利用的有效策略,制约着有限目标样本下遥感分类精度的提高.针对该问题,本文构建了基于改进的贝叶斯ARTMAP神经网络的迁移学习遥感影像分类算法,通过提高谐振匹配性来抑制类别扩散,利用节点的离散增量期望最大化参数更新策略,将历史遥感样本中的地物分类先验信息迁移到目标模型当中.实验结果表明本文方法能有效利用历史遥感数据弥补缺少目标训练数据的不足,相比于其他样本利用策略大幅提高遥感影像分类精度.

遥感分类;信息提取;迁移学习;ARTMAP;神经网络

1 引言

难以快速采集充足而准确的样本数据已成为遥感影像分类应用面临的最大问题.同时,现有算法缺乏重复利用历史样本的有效策略,导致历史样本资源的浪费[1].如何将历史数据中的先验知识迁移到目标模型当中,是提高遥感影像分类效率与精度的新的切入点.

传统的分类算法无法对历史数据展开有效应用的主要原因是:历史样本光谱特性与待分类影像的光谱特性不服从相同的概率统计分布(光谱漂移现象)[2].迁移学习是近年来提出解决域适应问题的机器学习理论[3,4],如基于Adaboost的迁移学习算法[5]、半监督的域适应迁移成分分析方法[6]、支持向量机的迁移学习理论[7,8].但目前遥感影像方面的迁移学习研究成果还较少[9],如吴田军提出遥感影像对象级分类的迁移学习方法[10];以及Liu提出的基于案例推理时空信息重用的遥感影像分类方法[11].但是上述方法均需要大量的遥感数据积累以及复杂的数据管理方案来建立系统,如何直接地将历史遥感影像中的有效信息迁移到目标模型中,从而降低影像分类对目标影像中有标记样本的依赖仍需要进一步的研究.

本研究中以贝叶斯ARTMAP[12]为具体模型来重点探讨迁移学习在遥感影像分类中的问题.提出基于改进的贝叶斯ARTMAP的迁移学习遥感影像分类算法(Transfer Learning using Improved Bayesian ARTMAP,TL-IBAM).首先改进贝叶斯ARTMAP谐振机制,降低类别扩散的影响,之后将历史遥感影像数据下得到的网络参数作为迁移学习中的先验信息,在目标影像的样本信息支撑下,以离散增量形式实现参数期望最大化,将历史数据中的知识迁移到目标模型中,实现贝叶斯ARTMAP网络的迁移学习.

2 贝叶斯ARTMAP神经网络

贝叶斯ARTMAP[12]由输入模块ARTa和输出模块ARTb组成,中间由映射域进行连接,其本身的特性使其能够不断地学习新的模式,其训练算法可由图1简要描述,参数说明见表1,具体论述参见文献[13].

表1 参变量列表

x:M维输入向量nj:激活次数|Σj|:节点超体积y:输出类标Wab:映射矩阵Smax:警戒参数μj:均值向量waj:ARTa节点jPmin:谐振参数Σj:协方差矩阵wbk:ARTb节点kNa:节点个数

贝叶斯ARTMAP神经网络能够根据数据的复杂程度自适应地调整网络结构,更适合于处理非平稳的遥感影像数据[14].但是,如果获胜节点与输出类别不匹配,便会过度调用匹配跟踪机制,产生大量的中间层节点造成类别扩散现象.产生过多的类别节点会退化分类精度[13],同时过多的节点给模型调整带来巨大的负担,不利于先验信息的迁移学习.因此,限制类别扩散是保持ARTMAP网络模型稳定以及实现迁移学习的重要前提.

3 基于改进贝叶斯ARTMAP的迁移学习

首先改进贝叶斯ARTMAP神经网络,在限制其类别扩散的基础上,利用离散增量形式实现期望最大化算法[15],将历史数据中的先验信息迁移到目标模型中,建立基于改进贝叶斯ARTMAP神经网络的迁移学习算法.

3.1 改进谐振机制的贝叶斯ARTMAP

改进模块谐振判断后,能够确保获胜节点与样本输出建立正确的关联,消除匹配跟踪带来的类别扩散,从而降低节点个数,提高模型的精度,这是进一步迁移学习的前提基础.

3.2 改进型贝叶斯ARTMAP的迁移学习算法

(1)

(2)

(3)

(4)

|lnP(Lc|μ″,Σ″,ξ″)-lnP(Lc|μ,Σ,ξ)|≤ε

(5)

式中,ε为收敛阈值,|·|表示取绝对值.当满足不等式的收敛标准时,则停止对样本集Lc的迁移训练;否则将激活节点的迁移参数传递给网络节点的描述参数:ξj=ξ″j;μj=μ″j;(Σj)-1=(Σ″j)-1;|Σj|=|Σ″j|.利用新的描述参数重复对样本集Lc的迁移训练,直至收敛.

至此算法完成了网络的迁移学习过程.网络的测试过程为基于贝叶斯判据[12]的类别归属确定.

4 仿真实验

此节首先改进贝叶斯ARTMAP(IBAM)在抑制类别扩散以及提高分类精度方面的有效性,在此基础上证明基于改进贝叶斯ARTMAP的迁移学习算法(TL-IBAM)在利用先验信息进行遥感影像分类建模方面的实用性.

4.1 改进贝叶斯ARTMAP分类实例

首先将使用标杆数据验证改进贝叶斯ARTMAP(IBAM)的精度及稳定性,贝叶斯ARTMAP(BAM)[12]、模糊ARTMAP(FAM)[16]、ART-EMAP(AEM)[17]作为比较对象.每组数据进行10次十折交叉检验,平均精度和标准差见表2.

表2 UCI数据仿真结果

从表2中可知,本文所提IBAM算法在实验数据上取得最优结果,说明具有更高的分类精度,且通过比较标准差可以看出IBAM算法的结果更加稳定,表现出更突出的分类性能.

其次,验证IBAM的遥感数据分类能力,以及抑制类别扩散的能力.利用大连SPOT-5遥感数据进行仿真实验,影像分辨率为2.5m.在影像数据中选取400个数据点通过目视解译赋予类标来构造样本集,进行10次十折交叉检验来验证算法的精度.与BAM[12]、FAM[16]、AEM[17]、极限学习机(Extreme Learning Machine,ELM)、决策树(Decision Tree,DT)以及BP神经网络进行比较.其中IBAM与BAM的警戒参数均为Smax=10-12,FAM、AEM、AMIC的警戒参数分别为0.96、0.90、0.75,BP神经网络的最大迭代次数为1000.

表3 各分类算法精度及节点个数

从表3中可以看出,本文GIBAM算法在精度方面优于其余算法.与此同时,本文所改进的贝叶斯ARTMAP神经网络通过改变网络谐振机制,抑制匹配跟踪带来的类别扩散,相比于同类ARTMAPG神经网络而言节点个数更少,获得最佳的算法性能.

4.2 迁移学习遥感影像分类实例

为验证所提TL-IBAM算法在遥感影像分类建模方面的实用性,首先利用393×236像素大小的2003年以及2007年大连SPOT-5遥感影像进行实验.两期影像空间分辨率均为2.5m,包含蓝、绿、红、近红外四个波段.

以图2(a)作为历史影像,图2(b)作为当前解译的目标影像.在图2(a)中获取了1078个有标记样本点.从图2(b)中获取234个有标记样本点,不完备的训练样本集无法对复杂的光谱特征建立有效的模型,因此图2(c)中仅利用目标影像样本的分类结果并不能令人满意,特别是对建筑的识别误分类较多.图2(d)和图2(e)分别给出了利用历史数据获得目标影像分类结果以及混合历史数据与当前数据后获得的目标遥感影像分类结果,可以看出由于两幅影像光谱特征的不一致性,在缺乏历史数据的有效重用策略时,历史数据的引入反而会降低分类的准确性.本文所提的迁移学习算法TL-IBAM在少量有标记样本下辅以大量的历史数据,获得2007年目标影像的最优分类结果(见图2(f)).同时给出分类精度的定量评价指标,图2(b)给出精度评价参考点的位置及大小,表4给出了总体精度以及Kappa系数.

通过表4以及图2的比较可以看出本文所提的迁移学习遥感影像分类方法获得了最优的分类结果,不仅分类准确度高,而且地物类型的完整性强.这主要是因为本文所提迁移学习方法具有将历史模型中的知识迁移到目标模型中的能力,充分利用了历史数据的有效信息,降低了对当前影像中有标记样本的依赖,因此获得更为准确与完整的分类结果.

其次,利用辽河口湿地1776×2177×7大小的TM影像,验证TL-IBAM算法对大场景影像数据中的适用性.本组试验中扩展了历史数据的采样范围,如图3(a)所示,分别从三幅遥感影像不同区域采集735、1764、1225个样本.以2009年该地区遥感影像为目标影像,从中采集980个样本构成当前数据集,警戒参数设定为Smax=10-5.首先以1995年影像样本作为历史数据进行学习,之后在历史数据中依次加入1987年与2004年样本数据,分别进行学习,比较不同历史数据下的分类结果,遥感影像分类精度的定量指标结果如表5所示.

表4 2007年大连SPOT-5遥感影像分类精度

表5 辽河口湿地TM遥感影像分类精度

图3给出了全部3724个样本作为历史数据,不同样本利用策略下的分类结果.初始模型建立了62个节点,在迁移过程中不断对节点参数进行更新,其中|Σj|>102的节点发生退化,最后获得39个迁移节点.利用对称Kullback-Leibler (KL)散度[18]衡量各节点的迁移强度,水体、沼泽、水田、裸地、建筑类别中迁移强度最大节点的KL散度分别为68.5999,227.7071,48.8644,109.0713,30.5086,其中沼泽类迁移程度最大,建筑类的迁移程度最低.TL-IBAM算法建立了历史数据的重用策略,较大程度上提高了大场景目标影像的分类精度,其中增加历史数据的规模有助于建立完备的先验信息,从而提高迁移学习的精度.

表6 计算时间比较

样本数量(个)102103104105ELM运行时间(s)0.0038780.0271580.31691613.909087TL⁃IBAM运行时间(s)0.0183220.0629320.5417735.375229

TL-IBAM算法分类过程中运行时间与样本规模n及节点个数N线性相关,以辽河口湿地影像数据为基础,比较不同数据量下的运行时间(见表6),其中节点数为100.实验环境为Intel(R) Core(TM) i5 760四核处理器,32位操作系统,3.49GB内存及2.80GHz主频.可以看出所提算法在数据量较大时仍有较快的计算速度,就其分类效率上来讲,所提算法同样适用于大场景遥感影像的分类.

5 结论

围绕利用有限样本数据建立遥感影像分类模型的目标,本文在历史数据的辅助下,提出了一种基于改进贝叶斯ARTMAP的迁移学习遥感影像分类算法,其中改进的贝叶斯ARTMAP神经网络有效抑制类别扩散现象的产生,为实现ARTMAP的迁移学习提供了有利条件,而离散增量期望最大化算法将历史数据中的先验知识作为迁移计算的起点,在目标影像的样本数据指导下,调整贝叶斯ARTMAP节点描述参数,实现了目标影像的迁移学习.仿真实验证明本文所提算法有效利用了模型先验信息,避免了遥感影像历史样本的浪费,降低了对目标影像标记样本的依赖性,获得了较好的分类性能.

[1]唐晓亮,韩敏.基于改进型模糊 ARTMAP 网络的 CBR 遥感图像分类系统研究[J].中国图象图形学报,2007,12(6):1033-1040.

TANG Xiao-liang,HAN Min.A study of CBR system for remote sensing classification based on modified fuzzy ARTMAP neural network [J].Journal of Image and Graphics,2007,12(6):1033-1040.(in Chinese)

[2]DAUMÉ H,MARCU D.Domain adaptation for statistical classifiers [J].Journal of Artificial Intelligence Research,2011,26:101-126.

[3]PAN S J,YANG Q.A survey on transfer learning [J].IEEE Transactions on Knowledge and Data Engineering,2010,22(10):1345-1359.

[4]王皓,高阳,陈兴国.强化学习中的迁移:方法和进展 [J].电子学报,2008,36(12):39-43.

WANG Hao,CHEN Xing-guo.Transfer of reinforcement learning:the state of the art[J].Acta Electronica Sinica,2008,36(12):39-43.(in Chinese)

[5]于重重,田蕊,谭励,等.非平衡样本分类的集成迁移学习算法 [J].电子学报,2012,40(7):1358-1363.

YU Chong-chong,TIAN Rui,TAN Li and Xu-yan.Integrated transfer learning algorithmic for unbalanced samples classification [J].Acta Electronica Sinica,2012,40(7):1358-1363.(in Chinese)

[6]PAN S J,TSANG I W,et al.Domain adaptation via transfer component analysis [J].IEEE Transactions on Neural Networks,2011,22(2):199-210.

[7]倪彤光,王士同,应文豪,邓赵红.迁移组概率学习机 [J].电子学报,2013,41(11):2207-2215.

NI Tong-guang,WANG Shi-tong,YING Wen-hao,DENG Zhao-hong.Transfer group probabilities based learning machine [J].Acta Electronica Sinica,2013,41(11):2207-2215.(in Chinese)

[8]BRUZZONE L,MARCONCINI M.Toward the automatic updating of land-cover maps by a domain-adaptation SVM classifier and a circular validation strategy [J].IEEE Transactions on Geoscience and Remote Sensing,2009,47(4):1108-1122.

[9]ZHANG Y S,ZHENG X W,et al.Semi-supervised manifold learning based multigraph fusion for high-resolution remote sensing image classification [J].IEEE Geoscience and Remote Sensing Letters,2014,(11):464-468.

[10]吴田军,骆剑承,夏列钢,等.迁移学习支持下的遥感影像对象级分类样本自动选择方法[J].测绘学报,2014,43(9):908-916.

WU Tianjun,LUO Jiancheng,XIA Liegang,et al.An automatic sample collection method for object-oriented classification of remotely sensed imageries based on transfer learning [J].Acta Geodaetica et Cartographica Sinica,2014,43(9):908-916.(in Chinese)

[11]LIU Y,LI X.Domain adaptation for land use classification:A spatio-temporal knowledge reusing method [J].ISPRS Journal of Photogrammetry and Remote Sensing,2014,98:133-144.

[12]VIGDOR B,LERNER B.The Bayesian ARTMAP [J].IEEE Transactions on Neural Networks,2007,18(6):1628-1644.

[13]TANG X,HAN M.Semi-supervised Bayesian ARTMAP [J].Applied Intelligence,2010,33(3):302-317.

[14]LEIVA-MURILLO J M,GMEZ-CHOVA L,et al.Multitask remote sensing data classification[J].IEEE Transactions on Geoscience and Remote Sensing,2013,51(1):151-161.

[15]NG S K,MCLACHLAN G J.On the choice of the number of blocks with the incremental EM algorithm for the fitting of normal mixtures [J].Statistics and Computing,2003,13(1):45-55.

[16]CARPENTER G A,GROSSBERG S,et al.Fuzzy ARTMAP:A neural network architecture for incremental supervised learning of analog multidimensional maps [J].IEEE Transactions on Neural Networks,1992,3(5):698-713.

[17]CARPENTER G A,ROSS W D.ART-EMAP:A neural network architecture for object recognition by evidence accumulation [J].IEEE Transactions on Neural Networks,1995,6(4):805-818.

[18]COETZEE F M.Correcting the Kullback-Leibler distance for feature selection [J].Pattern Recognition Letters,2005,26(11):1675-1683.

韩 敏(通信作者) 女,1959年8月出生于吉林延吉.现为大连理工大学教授、博士生导师、模糊信息处理与机器智能研究所副所长.从事3S系统信息融合、神经网络理论及其应用、复杂系统建模与预测的研究.

E-mail:minhan@dlut.edu.cn

杨 雪 女,1990年2月出生于河北秦皇岛.现为大连理工大学电子信息与电气工程学部硕士研究生.主要研究方向为遥感影像信息提取.

Transfer Learning Using Improved Bayesian ARTMAP for Remote Sensing Image Classification

HAN Min,YANG Xue

(FacultyofElectronicInformationandElectricalEngineering,DalianUniversityofTechnology,Dalian,Liaoning116023,China)

Remote sensing classification aims at extracting available geographic information from image spectrum for resources and environment monitoring,but due to the spectral drift effect,the lack of effective strategies on historical sample reuse for image processing technology based on pattern classification restricts remote sensing classification accuracy with limited target samples.To solve this problem,this paper proposes a transfer learning algorithm for remote sensing classification using improved Bayesian ARTMAP neural network.More productive resonance matching is used to suppress the unattractive property of category proliferation,so that the incremental expectation maximization can be introduced to update parameters adaptively.The classification prior knowledge of the historical samples is transferred to the target model.The experimental results show that this method can effectively compensate for the lack of target training data by reusing the historical samples and significantly improve the accuracy of remote sensing image classification compared with other sample utilization strategy.

remote sensing classification;information extraction;transfer learning;ARTMAP;neural network

2015-01-14;

2015-04-29;责任编辑:覃怀银

国家重点基础研究发展规划(973计划)项目(No.2013CB430403);国家自然科学基金项目(No.61374154)

TP751;TP181

A

0372-2112 (2016) 09-2248-06

��学报URL:http://www.ejournal.org.cn

10.3969/j.issn.0372-2112.2016.09.033

猜你喜欢

历史数据贝叶斯类别
基于设备PF性能曲线和设备历史数据实现CBM的一个应用模型探讨
基于故障历史数据和BP神经网络的接地选线方案研究
基于贝叶斯解释回应被告人讲述的故事
壮字喃字同形字的三种类别及简要分析
基于Hadoop技术实现银行历史数据线上化研究
用好细节材料 提高课堂实效
基于贝叶斯估计的轨道占用识别方法
基于互信息的贝叶斯网络结构学习
服务类别
多类别复合资源的空间匹配