基于改进的CNN和数据增强的SAR目标识别
2022-08-17王彩云吴钇达王佳宁赵焕玥
王彩云, 吴钇达, 王佳宁, 马 璐, 赵焕玥
(1. 南京航空航天大学航天学院, 江苏 南京 210016; 2. 北京电子工程总体研究所, 北京 100854)
0 引 言
合成孔径雷达(synthetic aperture radar, SAR)具有较好的穿透特性,并且能全天时、全天候工作,在军事领域被广泛使用。通过自动目标识别(automatic target recognition, ATR)技术,可以有效获取目标信息,识别感兴趣的目标。主流的ATR方法包括基于模板的方法、基于模型的方法和基于大数据深度学习的方法。在诸多深度学习方法中,卷积神经网络(convolution neural network, CNN)能有效解决传统方法中人工特征提取效率低下的问题,并且提高识别准确率,已成功应用于许多领域。由于CNN的优异性能,一大批学者将其引入SAR图像目标识别。
文献[3]在误差代价函数中引入类别可分性度量,提高了网络的类别区分能力,并利用改进的CNN对SAR图像进行特征提取,采用支持向量机对特征进行分类,实现了基于CNN的SAR图像目标识别;文献[4]采用卷积稀疏编码进行特征提取和数据压缩,融合随机森林、朴素贝叶斯和最小值分类器进行识别,提高了识别精确度,并且对噪声具有鲁棒性;文献[5]使用了CNN及其扩展模型Fast RCNN和Faster RCNN实现了SAR图像的检测与识别;文献[6]提出了一种ZCA白化与主成分分析相结合的方法对SAR图像进行预处理,并对CNN的结构参数进行调整,提高了网络训练速度和目标分类的准确率;文献[7]提出多尺度分解结合CNN的SAR图像识别,解决SAR图像相干斑造成的识别率低、耗时长等问题;文献[8]引入迁移学习,结合CNN进行SAR目标识别,获得了较好的识别性能。
然而,在采用CNN进行SAR图像目标识别时,由于SAR图像存在相干斑点噪声,可标记样本数量少,难以采集,对方位和姿态的变化较为敏感,因此容易出现过拟合的问题。针对该问题,主流方法主要分为对SAR样本进行数据扩充和对神经网络进行优化两种。在数据增强方面,文献[9]通过裁剪和翻转进行数据扩充,采用比率分批处理使模型收敛更快更好;文献[10]通过添加噪声、多分辨率分析、模拟部分遮挡构造了噪声样本、多分辨率样本和不同程度的遮挡样本,提高了网络对其他扩展操作条件的适用性,增强了网络的泛化能力。在网络优化方面,文献[11]在CNN训练阶段引入了Dropout正则化,获得了更好的识别率的同时有效抑制了过拟合问题;文献[12]设计了基于度量学习和深度学习的孪生CNN,采用多任务联合学习的方法训练模型,有效缓解了相干斑噪声对SAR图像的影响,降低了噪声过多引起的过拟合风险。
上述方法仅考虑数据和网络优化中某个方面,难以满足更高的识别要求。本文提出了基于优化CNN和数据增强的SAR图像目标识别方法,为解决SAR样本不足的问题,采用旋转的数据增强方法扩充数据集,为解决模型泛化性的不足,在训练阶段引入Dropout和L2正则化,为解决模型收敛效率低的问题,采用Adam对网络进行优化。实验结果表明,本文方法识别准确率高,且具有较好的泛化性。
1 CNN
CNN是一种多层神经网络结构,包括输入层、卷积层、池化层、全连接层和输出层。其中,卷积层主要用来提取图像特征,池化层主要用于特征选择和信息过滤,全连接层则是对提取的特征进行非线性组合以得到输出。在一个CNN中,一般会采取多个卷积层和下采样层交替设置,靠近输出层的最后几层通常是全连接层。
除了卷积、池化和全连接之外,非线性激活也是CNN的主要操作之一。通过非线性激活,赋予了网络非线性的性质,从而可避免线性模型表达不够的问题。CNN中常用的激励函数包括饱和非线性函数,如Sigmoid函数和正切函数等,非饱和非线性函数如整流线性单元(rectified linear unit, ReLU)和Softplus函数等,其中ReLU避免了梯度消失问题,收敛快、易于学习。不仅如此,它使得网络具有稀疏性,能有效缓解过拟合的问题,因此得到了广泛的应用。
2 改进的CNN
本节设计了一个7层的神经网络架构并对其进行改进,引入Dropout结构并在目标优化函数中添加正则化项,同时采用Adam作为梯度下降算法,以此构建了一个改进的SAR目标识别网络。采用数据增强方法扩充SAR图像数据集后,输入网络进行训练。算法框架如图1所示。
图1 基于改进CNN和数据增强的SAR图像识别算法Fig.1 SAR image recognition algorithm based on improved CNN and data augmentation
2.1 网络架构设计
由于SAR图像数据集样本不足,网络模型过大会导致过拟合,故设计了7层神经网络架构,结构如图2所示。其中,C1、C3、C4层卷积核大小为5×5,激活函数为ReLu,C1通道数为32,C3、C4通道数为64。S2、S5采样最大池化,采样区域为2×2。F6采用ReLu作为激活函数,共有512个节点,F7采用Softmax作为分类函数,共有10个节点。
图2 CNN框架Fig.2 CNN framework
2.2 Dropout设计
Dropout能够在一定程度上达到正则化的效果,有效缓解过拟合的现象。其思想在于通过以一定概率将部分神经元激活值置为0,从而避免对局部特征的过拟合,增强模型的泛化性。有Dropout的神经网络如图3所示。
图3 Dropout CNNFig.3 CNN with Dropout
在运动和静止目标获取与识别(moving and stationary target acquisition and recognition, MSATR)标准工作条件(standard operating condition, SOC)下采集的10类目标上,分别用不使用Dropout、Dropout概率为0.3和Dropout概率为0.5进行实验,结果如表1所示。
表1 不同Dropout概率下识别准确率
从表1可以看出,当Dropout概率为0.3时,SAR图像识别准确率最高,故本文采用Dropout概率为0.3。
2.3 正则化
正则化方法也称为贝叶斯正则化,假设目标优化函数为(,),正则化即在目标函数中添加一个正则化项:
(1)
式中:为样本数量;为控制正则化程度的超参数。
采用32×32尺寸图像下,MSTAR的SOC下采集的10类样本作为数据集,选用不同正则化方法进行比较,结果如表2所示。
表2 不同正则化方案识别准确率
从表2可以看出,L2正则化下=0.005的识别率最高,实现了抑制过拟合的效果。
2.4 数据增强方法选择
传统的数据增强方法有高斯模糊、图像裁剪和缩放、图像镜面翻转等。
在MSTAR的SOC下采集的10类目标上,分别采用5种数据增强方法进行比较,结果如表3所示。
表3 不同数据增强方法的识别准确率
从表3可以看出,采用旋转数据增强方法的效果最优,其识别率达到了99%,其旋转角度为-25°~25°。
3 实验与分析
采用MSTAR的SOC下采集的10类目标作为实验数据集,训练集和测试集的俯仰角分别为17°和15°。设置Dropout概率为0.3,采用L2正则化,权重衰减为0.005,采用Adam作为梯度下降算法,选择旋转-25°~25°进行数据增强,识别结果的混淆矩阵如表4所示。
表4 10类目标识别结果
从表4可以看出,本文设计的网络在10类目标下的最低识别率为97.95%,平均识别率为99.2%,有效抑制了过拟合,取得了较好的识别效果。
在MSTAR的SOC下采集的10类目标上,与其他几类现有的识别方法进行对比,分别记为自适应CNN法、多分辨率表示法、自注意力多尺度特征融合法,对比结果如表5所示。可以看出,本文提出的方法平均识别率高于其他方法。
表5 SOC下结果对比
4 结 论
本文提出了一种基于改进的CNN和数据增强的SAR目标识别方法。针对SAR图像样本不足的问题,采用旋转方法进行数据增强;为了优化网络,引入了Dropout和L2正则化,并采用Adam作为梯度下降算法,有效抑制了过拟合,增强了网络的泛化能力。在MSTAR SOC下的10类目标的实验结果表明,该方法的平均识别准确率达到了99%以上,有效抑制了过拟合,识别性能较好。