基于分块CNN的多尺度SAR图像目标分类算法
2018-05-24健伟
, , , , 健伟
(1.海军航空大学电子信息工程系, 山东烟台 264001;2.海军航空大学科研部, 山东烟台 264001)
0 引言
合成孔径雷达(SAR)最早由美国科学家Carl Wiley于1951年提出,相比于传统光学、高光谱和红外传感器,具有不受天气、光照等外界条件的限制,可以大范围、全天候、实时对目标进行检测,并且有一定的穿透能力[1]。随着SAR技术的日益成熟,在民用和军事领域都得了较为广泛的应用,具有较高的研究价值。但是由于合成孔径雷达类型众多,图像分辨率差异较大,同一区域在不同雷达中的成像效果不同,对SAR图像目标分类的准确率产生较大的影响。
卷积神经网络(CNN)可以有效地从大量样本中学习到相应的特征,提取出优于人工设计的特征,并且样本数量越大,提取的特征越有利于分类识别[2]。CNN虽然具有空间位置不变性,对于图像中任意位置的目标都可以提取出相应的特征,但是对于输入图像的空间变化适应性较差,要求训练图像与测试图像在空间尺度上一致,造成网络对与训练集尺度相似的测试数据有较高的激活值,进而导致网络对多尺度输入图像的分类准确率下降[3]。
本文主要研究了分块CNN在多尺度SAR图像上的应用,改善了传统CNN模型的尺度不变性,提升了多尺度SAR图像目标分类识别的准确率。同时,为降低网络训练过程中对训练样本数量的需求,通过大量与目标域相似的源域图像对分块CNN进行训练,得到较优的网络参数;然后将网络参数迁移到新的分类网络结构中,用于特征的提取;最后将提取的特征用超限学习机(ELM)网络结构进行分类,ELM的结构参数通过少量带标签的目标域数据训练得到。实验结果表明,本文方法可以有效提升网络对多尺度SAR图像目标的分类识别效果。
1 分块CNN的基本原理
1.1 卷积神经网络基本结构
典型的卷积神经网络由输入层、卷积层、下采样层(池化层)、全连接层和输出层五部分组成,如图1所示。
卷积层主要用于提取特征和降低噪声。假设第l层为卷积层,则第l层第j个特征图的计算公式如下所示:
(1)
下采样层主要利用图像局部之间相关性的原理,降低需要处理的数据量。将邻域4个像素变为一个像素,常用的方法有均匀下采样、最大下采样和概率最大下采样,最终产生一个大概缩小4倍的特征映射图。
1.2 分块卷积神经网络结构
从CNN的结构可以看出,整个网络的结构和参数只能单一设定,对于不同尺度的输入图像,不能有效地提取出全局和局部特征,进而限制了网络参数对不同尺度输入图像特征提取的灵活性。本文对同一幅图像构造3个不同尺寸的CNN,不同网络采用不同的卷积核与池化大小,最终输出维数相近的特征图。分块CNN的网络结构如图2所示。
图2中,对每幅输入图像进行尺度变换,得到3种不同尺度的输入图像,然后分别对3种CNN进行训练,使最终的网络输出维数相近。网络中不同CNN的设计如图3所示。
图3中,方框下面的数字表示该层图像的大小,箭头上的数字分别表示卷积核和池化大小,最终将3个网络提取出的特征图排列成一个一维向量,用ELM网络完成分类识别。
2 多尺度目标分类网络
2.1 迁移学习的基本理论
近年来,迁移学习(Transfer Learning)成为了卷积神经网络的发展趋势之一,它降低了CNN学习过程中对样本数量的要求,解决了训练样本和测试样本必须独立同分布,以及训练样本数目需求过大的问题。迁移学习可以通过已有的知识来解决小样本数据的学习问题,从而提升了卷积神经网络在小样本数据集上分类识别的准确率[4-5]。
对于给定的源域Ds及其对应的源任务Ts、目标域Dt及其对应的目标任务Tt,迁移学习即是通过从给定的Ds,Ts中学到相应的知识,从而得到Dt的目标预测函数f(·)。迁移学习与传统方法的对比如图4所示。
从图4中可以看出,传统学习方法对于每个不同的训练任务需要训练出不同的学习系统,而通过迁移学习,可以从不同的任务中学习到相应的知识,进而用于新目标任务的预测。但是,并不是所有的知识都可以用来进行迁移学习,迁移学习过程需要源和目标具有相关性。
2.2 超限学习机模型
超限学习机因其训练参数少、训练速度快得到了广泛关注。相比于传统人工神经网络的复杂调参过程,ELM在网络训练过程中,隐藏层节点参数随机确定,无需调节,仅需求解隐藏层与输出层之间权值的最小二乘范数解。因为网络参数的训练过程中不需要进行迭代过程,从而大大降低了训练过程中对样本数量的需求并提升了网络的训练速度。目前超限学习机在特征学习、聚类、回归和分类等方面得到了广泛的应用[7-8]。ELM的结构如图5所示。
xj表示第j个输入样本,n个节点表示输入的样本维度,隐含层的节点数为L,L越大,表达能力越强,ai表示输入样本与节点i的连接权值,βi表示隐藏层与输出之间的权值连接,oj表示第j个输入样本的输出。
输出权值的最小二乘范数解β的求解过程如下:
假设样本集的输入为X={x1,x2,…,xn},ai表示输入与隐藏层连接的权值,则网络隐藏层的输出公式为
zi=f(aixj+bi)
(2)
式中,zi表示第i个隐藏节点的输出,xj表示第j个输入样本,bi表示第i个隐藏节点的偏置,f(·)表示激活函数。
网络的最终输出结果为
(3)
式中,oj为第j个输入样本的输出结果,βi为第i个隐藏节点与输出之间的权重,f(aixj+bi)为第i个隐藏节点的输出。
假设输入的样本为(xj,tj),其中xj表示n维向量,tj表示样本所对应的标签。令前馈网络输出与标签相等,即oj=tj,得到
(4)
Hβ=T
(5)
通过式(5)可求得β=H-1T[9]。
2.3 混合模型分类网络
本文通过迁移学习的方法降低网络结构对带标签样本数量的需求,并且与ELM结合形成最终的混合分类网络,网络结构如图6所示。
算法步骤如下:
1)将输入图像通过尺度变换为128×128,64×64,32×32三种不同尺度的图像,并用变换后的图像分别对3种CNN进行训练,得到相应的网络 参数;
2)通过迁移学习将CNN与ELM结构结合,进而得到适用于带标签样本数量不足数据的分类识别,并用带标签训练集样本对ELM参数进行训练,得到最终的混合模型分类网络;
3)输入测试集数据,用最终训练好的混合分类模型网络对测试数据进行分类识别,得出相应分类结果。
3 实验仿真
3.1 实验数据集
为对本文提出的方法进行验证,数据集采用美国MSTAR数据库与SAR舰船目标数据集进行实验。MSTAR数据库中图像的分辨率为 0.3 m×0.3 m,大小为128像素×128像素,训练样本为17°俯视角的SAR图像目标,共2 320幅,测试样本为15°俯视角的SAR图像目标,共 2 100幅。为加快网络的训练速度,截取图像中心包含目标的42×42大小的图像块进行实验,如图7所示。
SAR舰船目标数据集对舰船和杂波进行了分类,一共有999幅图片,图片来自多幅不同分辨率的SAR图像,经过目标检测后获得船只的图像切片,通过专家解译对所有船只进行人工标注,数据集分布如表1所示。
表1 SAR舰船数据分布
3.2 MSTAR数据分类结果与分析
首先用T72,ZIL131,ZSU234三类目标数据集(训练样本870个,测试样本810个)对分块CNN的网络参数进行训练,然后通过迁移学习得到最终分类识别网络。最后对BRDM2,BTR60,D7,2S1和T62五类目标(训练样本1 450个,测试样本1 290个)对混合分类网络进行训练,并对测试样本进行分类识别,结果如表2所示。
表2 五类目标的SAR图像分类结果
将本文方法与其他方法进行对比,结果如表3所示。
表3 与其他方法效果对比
从上述结果可以看出,本文方法相比于其他方法有效地提升了目标分类识别的准确率。为验证本文方法对小样本数据集的有效性,将MSTAR目标训练集每次以递增100个样本的方式进行测试实验,测试样本数量保持不变,实验结果如图8所示。
从实验结果可以看出,当训练样本数量达到300时,测试结果就已经超过了改进卷积神经网络,实验证明该方法有助于提升小样本数据的分类识别准确率。
3.3 SAR舰船数据分类结果与分析
实验仍保持分块CNN的网络参数不变,用SAR舰船目标数据集对混合网络进行训练,并对测试集进行分类识别,得到每幅图像是舰船的可能性,对大于等于0.5的判定为舰船,否则为非舰船目标,部分识别效果如图9所示,最终识别结果如表4所示。
测试目标识别结果舰船杂波正确识别率/%舰船1901096.00杂波312797.69整体识别率/%96.06
将本文方法与其他方法进行对比,在训练过程中,训练集每次递增100个样本的方式进行实验,测试样本数量保持不变,实验结果如图10所示,最终对比结果如表5所示。
方法识别率/%CNN方法85.76改进CNN方法93.33本文方法96.06
从上述结果可以看出,本文方法提升了多尺度目标的分类识别准确率,为之后多尺度SAR图像进行目标检测识别提供了可靠保障。
4 结束语
针对SAR图像分辨率差异大,多尺度SAR图像目标的分类效果不佳的问题,提出了一种迁移学习与分块CNN相结合的混合分类网络,通过分块CNN有利于提升多尺度SAR图像的分类准确率;同时由于分块CNN网络参数多,对训练样本需求量大,采用迁移学习方法降低网络对带标签训练样本数量的需求。实验结果表明,两种方法结合后对带标签样本数量不足的多尺度SAR图像的分类效果得到了很大的提升。
参考文献:
[1] CURLANDER J C, MCDONOUGH R N. Synthetic Aperture Radar: Systems and Signal Processing[J]. New York: Wiley, 1991.
[2] 李彦冬, 郝宗波, 雷航. 卷积神经网络研究综述[J]. 计算机应用, 2016, 36(9):2508-2515, 2565.
[3] 连自锋, 景晓军, 孙松林, 等. 一种多尺度嵌套卷积神经网络模型[J]. 北京邮电大学学报, 2016, 39(5):1-5.
[4] 庄福振, 罗平, 何清, 等. 迁移学习研究进展[J]. 软件学报, 2015, 26(1):26-39.
[5] 许敏, 王士同, 顾鑫. TL-SVM: 一种迁移学习算法[J]. 控制与决策, 2014, 29(1):141-146.
[6] PAN S J, YANG Q. A Survey on Transfer Learning[M]. IEEE Trans on Knowledge and Data Engineering, 2010, 22 (10):1345-1359.
[7] HUANG G B, ZHU Q Y, SIEW C K. Extreme Learning Machine: A New Learning Scheme of Feedforward Neural Networks[C]// IEEE International Joint Conference on Neural Networks, Budapest, Hungary: IEEE, 2005:985-990.
[8] 王静. 基于ICA和ELM的图像识别算法研究[D]. 青岛: 中国海洋大学, 2015.
[9] HUANG G B, ZHU Q Y, SIEW C K. Extreme Learning Machine: Theory and Applications[J]. Neurocomputing, 2006, 70(1-3):489-501.