基于机器学习的SAR图像目标识别方法
2020-02-02王敬平姜鑫黄子君周洁
王敬平 姜鑫 黄子君 周洁
(中国电子科技集团公司第三十二研究所 上海市 201808)
SAR(合成孔径雷达)普遍运用于较多军民领域,其研究的关键内容之一是抑制噪声。在军事行业中,SAR 目标识别问题始终是一个研究难点与热点,在保持边缘与抑制噪声等目标识别的时候[1],星载以及机载都存在精准度欠缺等问题。本文借助于机器学习理论,以充分提升SAR 图像的目标识别能力。
1 SAR目标识别的具体分类
1.1 在图像分类条件下的SAR-ATR系统
这个系统重点是平板标准参数,以图像像素为核心,比较图像像素的相似程度,能够对图像目标进行分类[2]。一般就是借助于CFAR 分类器实施处理。而在图像分类条件下的SAR-ATR 系统拥有很明显的通用性特点,而在有效检测的过程中会消耗一些时间,其精准性也不够,系统性能还需强化。
1.2 基于特点分类的系统
在SAR-ATR 系统里面,SAR 图像首先要对大场景里面的图像提取对数进行分析,然后实施降噪操作,在SAR 图像里面对目标感应区域的具体范围进行充分确定,开展认真筛选,借助于分类器筛选虚警以及识别各类目标信息[3]。其重点就是开展潜在目标检测以及疑似目标分类识别、SAR 图像预处理三个具体步骤,在处理的时候尽管数据处理更加繁琐,可是在筛选了目标以后,会在源头上对数据的处理量进行简化,如此会提高系统目标的整个识别率。
1.3 增强Lee滤波
如今,关于极化SAR 图像的具体算法分析中经常使用Lee 滤波模式,采取局部统计的手段进一步探究Lee 滤波,能够对乘性噪声的相关信息有效开展处理,然而在实施过程中,强化滤波只会达到对相干噪声进行平滑的目的,不能很好地保持图像的边缘内容。然后把其当作SAR 图像特征的相关信息,对其实施优化[4]。在有效设计时要把滤波的窗口进一步设置成5*5,然后对其开展扫描研究,对数值信息进行有效计算以及判断。
2 卷积神经网络以及优化
2.1 卷积神经网络的核心原理
通常来说,以前的卷积神经网络进一步涵盖了池化层与全连接层、卷积层。池化层以及卷积层有效实施交替连接,以充分提取图像的相关特征,然后由分类器开展分类。初始图像通过若干个卷积核卷积后,进一步产生若干张特征图,特征图的长以及宽保持不变,可深度扩增,接着通过下采样逐渐缩减特征的数量。通过若干次下采样以及卷积后逐渐产生特征图,然后进入分类器进一步实施分类。
伴随数据量的飞速扩增,神经网络的具体深度也持续扩大,以获得更突出的分类技能。可神经网络不断获得加深后,其就容易产生过拟合情况,即在深入训练过程中模型表现突出,可在数据集的验证过程中表现有所下降。为了有效防止过拟合,使卷积神经网络的有效性以及泛化性获得提升[5]。Hinton 明确指出了Dropout 措施,就是利用概率P 使部分神经元失去效果,这些神经元能够短时间不处于网络内部,可依旧保留其权重。
2.2 线性修正单元的优化
为了强化网络提取抽象特征的能力。在池化以及卷积操作结束以后,需导入激活函数[6]。对于Sigmoid 函数的“梯度弥散”情况,能够把(RELU)进一步当作激活函数。
图1:模型流程图
图2:算法整体流程
表1:MSATR 数据集三类(含变体)目标的测试结果
f(x)=x,x>0
f(x)=0,x<0(1)
与Sigmoid 函数相比,RELU 函数包含如下几个优势。第一,RELU 函数的运用不会进一步出现梯度弥散的情况,微分的求解步骤很繁琐,扩增了计算量,而RELU 函数的求导比较单一化,且因为RELU 函数把不超过零的输入置0,在持续计算神经网络的前提下,RELU 使数据变得更加稀疏,可这也将RE-LU 函数的漏洞暴露了出来,就是输入不超过0 的时候,神经元处在‘死亡’的状态。当学习率很大的时候,也许会使得很多的数据节点无法被有效激活,梯度也一直保持零。因此,文章导入了Leaky ReLU 函数:
f(x)=x,x>0
f(x)=ax,x<0(2)
在输入值超过零的时候,Leaky ReLU 函数和RELU 函数保持一致,可对输入值不超过零的部分进行了修改,α 是一个非常小的常数。如此梯度就可以不断传播。
2.3 Adam优化器
Adam 凭借梯度的二阶矩估计以及一阶矩估计有效调整各个参数的相关学习效率。Adam 的核心优势是通过改正偏置之后,每一次迭代的学习率都具有一个明确的范畴,保持参数的稳定性。公式具体如下:
mt=u*mt-1+(1-u)*gt
nt=v*nt-1+(1-v)*gt2
m^t=nt1-ut
n^t=nt1-vt
其中,mt、nt 依次是梯度的二阶以及一阶矩估计,m^t、n^t 是对它们的有效校正。Adam 优化器的特征如下:可以针对各种参数对学习率进行调整,占用的内存也很小。在大量算法中,Adam 优化器的综合效果不错。
3 实验结果研究
3.1 实验数据
本文采取了MSTAR 计划所进一步公布的实测SAR 地面目标数据开展试验。这个数据大部分是车辆进一步保持静止时的图像[7]。本文采用了数据集中BTR70(装甲运兵车)、ZSU234(自行防空炮)以及BMP2(步兵战车)、T72(坦克)、ZILI131(卡车)五种目标当作训练数据集开展模型训练。其中T72 以及BTR70 数据集中涵盖了同个类型图像的多种变体。训练之后采取BMP2 以及BTR70、T72 这三种数据有效实施测试。
3.2 实验模型以及算法流程
本文首先截取图片,得到其中间部分,然后对图像实施滤波处理。处理之后的图像就能够产生训练数据集,然后有效开展神经网络的相关训练。网络共包含5次卷积层有效开展运算,并且在第1、3、5 卷积层后进一步加入池化层实施下采样步骤[8]。经过卷积运算进一步提取特征以后,建立一个三个层次的神经网络。凭借softmax分类器对相关目标进一步实施分类。模型流程图如图1所示,算法整体流程如图2所示。
各层参数详细如下:
(1)卷积层,有卷积核96 个,卷积核步长是4,大小是11×11,激活函数是Leaky ReLU。
(2)池化层,窗口步长是4,大小是2。
(3)卷积层,有卷积核256 个,卷积核步长是1,大小是5×5。凭借LeakyReLU 函数开展激活。
(4)池化层,窗口步长是1,大小是3。
(5)卷积层,有卷积核384 个,卷积核步长是1,大小是3×3。凭借LeakyReLU 函数开展激活[9]。
(6)卷积层,有卷积核384 个,卷积核步长是1,大小是3×3。凭借LeakyReLU 函数开展激活。
(7)卷积层,有卷积核256 个,卷积核步长是1,大小是3×3。凭借LeakyReLU 函数开展激活。
(8)池化层,窗口步长是1,大小是3×3。
(9)全连接层,有神经元节点4096 个。
(10)全连接层,有神经元节点4096 个。
(11)输出层,softmax 实施分类,有神经元节点5 个。
3.3 实验结果
本文采取涵盖ZILI131、BMP2、BTR70、ZSU234 以及T72 五种目标的数据集开展训练,训练之后用涵盖变体数据的BTR70、BMP2 以及T72 图片开展测试。具体结果如表1所示。
从表1 能够得知,本文提出的算法拥有较好的识别成效,关于训练数据集里面的同一种目标识别率很高,而对其他种类的目标的识别率进一步下降。
4 结语
总而言之,SAR 图像的相关目标识别属于一项具有一定难度的工作,本文在这个方面开展了较好的研究工作。本文方法能够进一步降低SAR 目标识别中的图像噪声干扰,通过探究在卷积神经网络前提下的SAR 目标识别策略,有效提升了目标识别率。