基于贝叶斯卷积神经网络与数据增强的SAR图像目标分类方法
2020-12-24涂豫
涂 豫
(1.河南工业职业技术学院,河南 南阳 473000;2.华中科技大学,湖北 武汉 430074)
0 引言
作为一种监督分类问题,合成孔径雷达(SAR)目标分类在近三十年时间内得到了广泛研究[1]。一般地,SAR目标分类方法主要通过特征提取和分类决策两个阶段实施。特征提取阶段获得原始SAR图像中目标的几何形状、投影变换以及电磁散射等特征。文献[2—5]基于目标区域、轮廓、阴影等几何形状特征设计SAR目标分类方法。文献[7—11]采用主成分分析(PCA)、非负矩阵分解(NMF)、单演信号、非下采样剪切波等信号处理算法获得SAR图像特征进而用于目标分类。文献[12—14]以属性散射中心为基本特征进行SAR目标分类。在分类阶阶段,通常采用现有的经典分类器对提取特征进行类别决策,例如K近邻(KNN)[15]、支持向量机(SVM)[16]、稀疏表示分类(SRC)[17]等。可以看出,传统的SAR图像目标分类算法在特征和分类之间存在一定的割裂,这也可能影响最终的分类精度。近年来提出并被广泛运用的深度学习模型在信号、图像处理领域性能十分优越。文献[18—23]就是基于卷积神经网络(CNN)设计SAR目标分类方法。深度学习模型通过端到端的多层网络实现输入到类别的非线性变换,实现了特征学习和分类决策的一体化。根据公开报道,基于CNN的SAR目标分类方法相比传统方法具有一定的性能优势。然而,扩展操作条件下的SAR目标分类问题仍然是本领域的重难点问题。本文针对此问题,提出了基于贝叶斯卷积神经网络与数据增强的SAR图像目标分类方法。
1 贝叶斯卷积神经网络
贝叶斯卷积神经网络[24,-25]是贝叶斯理论与深度学习卷积神经网络结合的产物,通过将贝叶斯概率理论用于网络参数学习获得更为稳健的分类网络。在贝叶斯卷积神经网络中,通过对模型参数w施加一定的先验概率模型可有效推断模型权重的分布规律,从而实现概率意义上的卷积神经网络理解,其中,权重参数w~p(w)服从标准的高斯先验分布。假设fw(x)为网络输出,p(y|fw(x))为模型的似然函数。记L(X,Y)和(x,y)分别为训练集和测试集,根据贝叶斯理论可得权重参数的后验概率为p(w|L)。对于多类别分类问题,采用Softmax函数对输出进行抽样定义似然函数如下:
P(y=c|x,w)=Softmax(fw(x))
(1)
其中,模型的输出预测为:
(2)
具体到分类问题中,可采用Monte-Carlo积分进行求解,分类预测的表达式如下:
(3)
鉴于贝叶斯卷积神经网络的优良特性,本文将其运用于SAR图像目标分类。具体地,设计如表1所示的贝叶斯卷积神经网络(以10类目标分类为例),实现端到端的训练和分类。该网络参照文献[18]中的全卷积结构,共包括四个卷积层。在前两个卷积层后分别接最大值池化层;采用Relu函数作为各个卷积层之后的激活函数;最终,通过Softmax分类器进行分类。通过贝叶斯卷积神经网络的训练算法获得最佳的网络参数,用于后续的分类。
表1 贝叶斯卷积神经网络的各层描述Tab.1 The descriptions of the designed Bayesian CNN
2 目标分类方法
2.1 数据增强
数据增强的目的是获得更多的可用训练样本,从而提高分类网络的适应性和稳健性。为此,本文通过数据增强获得更多的训练样本对表1所示的贝叶斯卷积神经网络进行训练。具体地,本文采用图像平移和噪声添加两种途径进行数据增强。图像平移过程中,以原始SAR图像中心为参照,分割64×64大小的中心区域(与设计的贝叶斯卷积神经网络保持一致),同时对切割区域中心进行平移,步长设置为2像素,最大平移量设置为20像素,最终可获得21倍的训练样本。在部分样本中,目标的一部分区域被切割,可模拟部分遮挡条件下的SAR图像样本。
噪声添加分别采用加性噪声和随机噪声进行样本构造,其具体过程分别参照文献[12]和文献[18]。图1显示了加性噪声(信噪比(SNR)-10 dB)和随机噪声(噪声比例20%)干扰条件下SAR图像样本,可见二者都不同程度影响了目标的形状及像素分布。在实际应用中,加性噪声的信噪比设置为-10、-5、0、5和10 dB;随机噪声的比例设置为5%、10%、15%、20%。通过数据增强可以更为有效地训练贝叶斯卷积神经网络,获得更佳的分类性能。
图1 噪声干扰条件下的SAR图像Fig.1 SAR images under noise corruption
2.2 分类流程
本文提出结合贝叶斯卷积神经网络与数据增强的SAR目标分类方法,具体流程如图2所示。对于原始的训练样本,采用2.1节描述的数据增强方法获得扩充后训练样本。然后,通过扩充后的训练集对表1所示的贝叶斯卷积神经网络进行训练。分类阶段,将测试样本输入训练完毕的网络,对其类别进行判定。
图2 结合贝叶斯卷积神经网络与数据增强的SAR目标分类流程Fig.2 Procedure of SAR target classification based on combination of Bayesian CNN and data augmentation
训练阶段:对训练图像进行图像平移以及噪声添加,基于增强训练集对贝叶斯卷积神经网络进行训练,获得有效的分类网络。
分类阶段:直接将测试样本输入训练完成后的贝叶斯卷积神经网络,获得测试样本的目标类别。
3 实验验证
3.1 实验设置
基于MSTAR数据集开展实验,对提出的方法进行测试。如图3所示,该数据中包含了10类典型军事车辆目标的SAR图像,分辨率达到0.3 m。该数据中样本丰富,各类目标SAR图像覆盖0°~360°方位角以及若干典型的俯仰角,为后续的网络训练和样本分类提供了丰富的素材。
图3 MSTAR目标的光学图像Fig.3 Optical images of the MSTAR targets
实验中,还选用现有文献中3类基于卷积神经网络的SAR目标分类算法进行对比分析,分别为文献[18,21,23]中的“A-ConvNet”、“ResNet”和“ESENet”。与本文方法不同的是,这些网络采用的是传统的深度学习训练方法并且没有充分考察样本中可能出现的各类扩展操作条件。后续实验分别在标准操作条件、噪声干扰以及部分遮挡的条件下进行,测试和分析本文方法的分类有效性和稳健性。
3.2 实验结果与讨论
3.2.1标准操作条件
标准操作条件通常在测试样本与训练样本相似度较高的情形下检验分类方法的基础性能,在SAR目标分类问题中具有广泛性和代表性。
表2给出了依托MSTAR数据集设置的一种典型标准操作条件,10类目标的训练和测试样本分别来自17°和15°俯仰角,其余条件保持一致。据此对本文方法进行测试,获得如图4所示的混淆矩阵,图中横纵坐标分别代表样本的真实类别和决策类别,因此对角线元素则反应了不同目标的正确识别率。该矩阵直观显示了不同类别测试样本经过决策后所属的类别比例,反映了其分类精度。对四类方法的平均分类精度进行统计,如表3所示,可见,在标准操作条件下,各类方法均可以取得99%以上的平均分类精度,表明卷积神经网络对于此情形的有效性。本文方法相比三类对比方法的分类精度更高,体现了贝叶斯卷积神经网络的性能优势。上述实验结果验证了本文方法在标准操作条件下的有效性。
表2 标准操作条件的训练和测试样本Tab.2 Training and test samples under SOC
图4 本文方法标准操作条件下的分类结果Fig.4 Classification results of the proposed method under SOC
表3 标准操作条件下平均分类精度Tab.3 Average classification accuracies under SOC
3.2.2噪声干扰
SAR图像中普遍存在噪声并且形式复杂。本文在数据增强中就分别进行了加性噪声和随机噪声的样本构造,从而提升网络对于复杂干扰的稳健性。本实验向表2中的测试样本添加不同程度的混合噪声,即同时包含加性和随机噪声。其中,加性噪声的信噪比设置为-10、-5、0、5和10 dB;随机噪声的比例设置为5%、10%、15%、20%。分别在各个组合下对四类方法进行测试,统计分类结果如表4—表7所示。对比可见,本文方法在各个噪声水平下均可以保持最高的分类精度,表明其对于复杂噪声干扰的稳健性。贝叶斯卷积神经网络在具体训练过程中考虑了噪声影响,同时在训练样本中加入了不同程度的噪声样本;因此,最终得到的分类网络对于复杂噪声的适应性较强。对于三类对比方法,A-ConvNet、ResNet和ESENet的总体性能依次提升,主要是得益于网络结构的优化。然而,它们自身以及训练集对于噪声干扰的考虑较少,因此在复杂噪声干扰下的性能下降十分剧烈。
表4 本文方法在噪声干扰下性能Tab.4 Performance of the proposed method under noise corruption
表5 A-ConvNet方法在噪声干扰下性能Tab.5 Performance of A-ConvNet under noise corruption
表6 ResNet方法在噪声干扰下性能Tab.6 Performance of ResNet under noise corruption
表7 ESENet方法在噪声干扰下性能Tab.7 Performance of ESENet under noise corruption
3.2.3部分遮挡
在发生部分遮挡的情形下,局部目标不能呈现在获取的SAR图像中。对于采用目标全局结构或分布特性的分类算法,部分遮挡的影响较为显著。按照文献[12]中的思路,本文对表2中的测试样本进行模拟遮挡。具体地,对SAR图像中目标区域按照设定的方向和比例进行分割处理,并对分割后的区域以图像中背景像素填充,最终分别在遮挡比例为10%、20%、30%、40%和50%条件下构建测试集,然后测试并统计四类方法的分类性能如图5所示。本文方法在部分遮挡条件下的性能优势十分明显,特别是在遮挡比例较高的情形下。由于训练过程中进行了平移切割构造样本,一定程度上模拟了目标可能出现的不同方向、不同比例的遮挡情形;因此,最终的分类网络对于部分遮挡的稳健性也得到了提升。与噪声干扰的情形类似,其他三类方法并没有针对性考察可能存在的部分遮挡影响,其在遮挡条件下的性能下降十分显著。
图5 部分遮挡条件下的性能对比Fig.5 Performance comparison under partial occlusions
4 结论
本文提出基于贝叶斯卷积神经网络与数据增强的SAR图像目标分类方法。该方法采用贝叶斯卷积神经网络获得更为可靠的分类网络;通过数据增强可为网络训练提供更为充足的样本数据,覆盖噪声干扰及部分遮挡等情形。实验结果表明,该方法在标准操作条件、噪声干扰及部分遮挡条件下相比现有几类方法具有更强的有效性和稳健性。