APP下载

结合最近邻和拓展稀疏表示的SAR图像目标识别方法

2021-11-11王永利

南京理工大学学报 2021年5期
关键词:训练样本特征向量识别率

徐 斌,曹 娜,王永利

(1.南京铁道职业技术学院 信息管理中心,江苏 南京 210031;2.南京理工大学 计算机科学与工程学院,江苏 南京 210094)

合成孔径雷达(Synthetic aperture radar,SAR)是一种有源传感器,由于其能每天工作24 h,并且拥有不惧恶劣天气的优点,已经被广泛应用于多个领域[1]。

对SAR图像分类识别已经有了很多研究。首先在分类问题上,使用基于模版匹配的算法[2]。此算法可计算出测试样本与训练集生成的模板之间的“距离”,根据“距离”所选择的匹配模板来判定测试样本所属的类。因为添加对象需要创建一组额外的模板,计算较繁重。为了提高性能,一些基于模式识别的方法相继被提出[3,4]。除此之外,学习向量量化(Learning vector quantization,LVQ)已被用于学习分类模板[5],非线性分类器也被用于SAR自动目标识别(Automatic target recognition,ATR)[6],与传统的基于模板的方法相比,此方法的性能有了显著的提升。分类器方法被应用于这些算法中以降低其复杂性,这组分类器是由给定的方位角范围内的训练样本训练出来的,因此方位角估计精度的限制会影响算法的性能。

近来,信号稀疏表示已经成为研究热点[7-11]。在大多数情况下,信号可以由一组基本矢量很好地表示。Wright等[12]首先提出基于稀疏表示的分类(Sparse representation-based classification,SRC),可提取有效特征进而提高分类性能。同时,SRC比支持向量机(Support vector machine,SVM)有更好的分类性能已经得到了验证[13]。

但是,测试样本经过由训练样本训练出的模型,得到对应的稀疏表示时,在有限时间内对特征向量进行彻底地优化难度较大,多数的稀疏表示算法都没有办法达到在复杂情况下的实时识别效果。因此,难以真正应用和推广这种方法。

本文所做工作如下:(1)特征提取上使用二维主成分分析(2 dimension principal component analysis,2DPCA)后,并没有像传统方法中那样,先按照特征值大小排序,再根据排序结果取得特征向量,因为对应的特征值越大,不一定意味区分不同类SAR图像的能力越强。所以提出了根据识别能力选取特征向量的策略,这样的识别效果较好;(2)为了提高SRC的识别速度,提出了结合最近邻和稀疏表示的算法识别SAR图像中的目标。

1 识别流程

本文提出了一种结合最近邻和拓展稀疏表示的算法,将SAR图像目标分类,图1为该方法的流程图。

图1 结合最近邻和拓展稀疏表示的SAR图像识别流程

首先预处理SAR图像,在保留有用信息的同时抑制斑点噪声并且降低维度。接着,采用2DPCA特征提取方法提取特征,达到进一步降低维数的效果。最后结合最近邻和拓展稀疏表示判断样本类别,为找到测试样本的k近邻,本文采用了近邻法,计算测试样本与最近邻属于同一类的置信度,若置信度大于给定阈值(通过多次实验,选取合适的拒识门限T作为阈值),则直接判定测试样本与最近邻同类,否则利用k个近邻组成稀疏字典,进一步利用拓展的稀疏表示方法识别目标。

2 SAR图像预处理

原始SAR图像不仅包含待检测的识别目标,还包含相干斑噪声和背景杂波。为了减少背景杂波和斑点噪声带来的识别效果干扰,以及分布不均匀的目标散射中心给识别性能带来的影响,首先对SAR图像进行预处理,得到利于识别的样本,流程如图2所示。

图2 SAR图像预处理流程

首先对原始图像进行对数变换,抑制斑点噪声,并使图像直方图与高斯分布的相似度更高;接着分割SAR图像,选择二维最大熵阈值分割法对SAR图像进行分割,得到SAR图像的目标图像;然后将原始SAR图像与二值图像进行掩膜处理,以获得二值掩膜图像。注意此处不对阴影区域做相同的操作,因为原始SAR图像阴影区域的灰度值较低,所以掩膜后的阴影区域和背景区域灰度值很接近,无法区分。

此外,为了获得更优的识别性能,还需要进行目标区域处理,对于目标区域掩膜图像,目标区域处理包括图像增强、质心配准和灰度归一化,而分割出的阴影区域只做质心配准这一步。本文应用幂次变换来对图像进行增强[14],运动和静止目标获取与识别(Moving and stationary target acquisitionand recognition,MSTAR)数据中的SAR目标在图像中的位置是不定的,不一定处在中心位置。另外,背景部分占的区域较大,目标区域相对较小,这类样本图像对目标识别的识别效果负面影响较大。对MSTAR数据,以识别对象的质心为中心,向四周扩展切割出50像素×50像素的正方形,即使得此正方形框能够包含完整的识别对象[14]。另外,还需要对SAR图像进行灰度归一化处理,因为根据雷达获取反馈时,反馈结果与雷达作用距离相关,在SAR图像统一灰度归一化处理后,能够剔除由于距离不同所带来的图像明暗程度的差异。

图3为以装甲车BMP2为例的实验效果图。

图3 SAR图像(以BMP2为例)预处理结果

在预处理中,SAR图像中的背景区域被去除,无关信息被大部分剔除,在增强了重要的分类信息以及配准了SAR目标位置的同时,还统一了图像灰度。这些操作将使SAR目标识别的分类效果更加显著,类间差异更加明显。

3 特征提取

为了不破坏图像矩阵的结构,选择针对二维数据的方法——2DPCA[13]对图像进行特征提取。

首先对SAR图像训练样本进行预处理,假设经预处理后的训练样本目标图像集合为{I1,I2,…,IN},其中Ii∈Rm×n,i=1,2,…,N,N为训练样本的个数。2DPCA直接使用这些图像构建图像协方差矩阵,在基于以上协方差矩阵分解的基础上,获取特征向量[15]。协方差矩阵的公式如下

(1)

对图像进行特征值分解能得到2DPCA的特征向量W2dpca=[w1,w2,…,wN]。但是在进行降维和图像识别时,并不会用到全部的特征向量。本文的选取规则是将上述得到的特征值进行降序排列,选择特征值序列中前r个特征值对应的特征向量,r的大小按照设定的阈值来确定

(2)

本文采用根据识别能力选取特征向量的策略,选定特定的特征向量后,以训练样本在这个特征向量上的投影构造样本空间,如果不同类样本的投影之间的距离越近,且同类样本的投影之间的距离越远,则这个特征向量的识别能力越大。若在特征向量空间中选定一个特征向量,假设为w,其识别能力ra的计算过程如下

(3)

(4)

(5)

ra=vb/vw

(6)

取识别效果较好的前r(r

(7)

4 分类器设计

4.1 拓展的稀疏表示模型

假设有P类目标,而第i类有Ni个样本(i=1,2,…,P)。如果以向量的形式来表示每个样本,则Ni样本可以连接成一个矩阵Θi∈Rd×Ni

Θi=[θi,1,…,θi,Ni]

(8)

式中:d是向量的维数,而θi,j(j=1,2,…,Ni)代表i类的第j个样本。当类中的样本数量足够时,属于类别i的测试样本y可以通过这些样本的线性组合很好地近似表示

y=ci,1θi,1+…+ci,Niθi,Ni

(9)

式中:ci,j(j=1,…,Ni)是第j个训练样本对于测试样本y的系数。然而事实上,测试样本y所属的类别是未知的。需要将所有矩阵Θi(i=1,2,…,P)连接成一个大矩阵Θ=[Θ1,…,ΘP]∈Rd×N,将这个大矩阵作为字典,其中N代表训练样本的总数量。则未知样本y可由所有训练样本来表示

y=Θx

(10)

式中:x=[x1,1,…,x1,N1,…,xi,1,…,xP,1,…,xP,NP]是权重向量。因为每一类的样本量很充足,权重向量x预计会是x=[0,…,0,xi,1,…,xi,Ni,0,…,0]这样的形式。换句话说,测试样本y可以由与y同类别的样本近似地表示。此外,在理想情况下,y与其它样本无关。

但在实际应用中,上式中的低维线性模型的前提会被图像遮挡、损坏、噪声等问题打破,因此,本文将上式拓展为

(11)

式中:I为单位矩阵,e是低维线性模型的系数修正向量,表示遮挡、损坏的像素或噪声。

考虑式(10)的构成,测试样本y和字典Θ已给定,接下来是要求解权重向量x。此外,对于不同的字典Θ∈Rd×N,x的求解方法不同。当d>N时,这个等式是已定的,所以求解方程式可以得到唯一解x。但是在大多数情况下,这个等式是未定的,例如当d

(12)

理想情况下,当训练样本体量较大,并且图像中干扰噪声较少时,此模型具有极为稳健的表征能力,因此测试样本能够得到更准确的稀疏表示。但是图像中往往存在影响识别效果的负面因素,可能会出现特征局部稀疏的状况,因此与原始的稀疏表示模型相比,拓展稀疏表示模型会更好。拓展的稀疏表示识别模型可以表示为

(13)

但是,求解式(13)中的l0范数最小化是一个NP-hard问题,可用正交匹配追踪算法(Orthogonal match pursuit,OMP)求解,但是只能求得近似解。幸运的是,有证据表明,如果x足够稀疏,优化问题可以转为l1范数最小化

(14)

此处解决最小化问题采取的方法是梯度投影稀疏重建(Gradient projection for sparse reconstruction,GPSR)算法。

在获得了最优解x和e后,测试样本y的类别将通过最小重构误差得出

(15)

式中:δi(·)是选择类别i的权重系数并将所有其他系数设置为零的算子因式,是i类训练样本的线性组合。最终,符合目标函数的i是y的类别。

4.2 结合最近邻和拓展稀疏表示的图像识别

当测试样本被训练样本稀疏表示时,在有限的时间内获取到复杂情况下测试样本的特征向量稀疏表示,并且对其进行优化和目标分类识别,具有相当难度。目前多数稀疏表示算法都无法满足在复杂情况下目标分类识别的实时性指标,这也是它难以真正应用和推广的重要原因。因此,本文设计了一种结合拓展稀疏表示和近邻法的快速识别SAR图像目标的算法(Nearest neighbor and extended sparse representation classification,NNSRC),如算法1所示:首先寻找测试样本的k近邻,计算字典的每一列向量与测试样本的距离,距离升序排列为[a1,a2,…,ak],然后计算测试样本y与a1属于同一类别的置信度conf,若置信度大于拒识门限T,则直接判决与最近邻a1同类;若置信度小于拒识门限T,则利用k近邻组成稀疏字典Θ=[Θ1,Θ2,…,Θk]∈Rm×k,求得稀疏系数,再结合每一类的重构误差判断测试样本类别。

算法1NNSRC算法

输入:训练样本矩阵Θ,训练样本标签u,训练样本y,近邻数k,拒识门限T;

输出:类标签identity;

(1)Fori=1,2,…,N//(i)计算距离

(2)di←‖Θ(∶,i)-y‖2

(3)End For

(4)[a1,a2,…,ak]←sort(d)//(ii)对换距离排序,选取k个最近邻居

(6)Ifconf>=TThen//(iv)推断类标签

(7)identity←find(u,a1)//获取a1的标签

(8)Else

(9)A=[a1,a2,…,ak]//构建稀疏字典

(10) (x,e)←GPSR(A,y)//对稀疏重建执行梯度投影

(13)End If

(14)Returnidentity

5 实验

5.1 实验数据及参数设置

本文的实验数据采用美国国防高等研究计划署支持的MSTAR计划中的数据集。这个数据集由不同方位角和俯仰角下的各种SAR地面静止军用目标组成,包括3大类:装甲车BMP2、装甲车BMP70、主战坦克T72,在此数据集中,每幅图像的分辨率统一为0.3 m×0.3 m,图像大小统一为128×128像素。为符合真实状况的图像数据,目标的方位角从0°到360°不等,以俯仰角17°和15°的成像数据分别作为训练数据和测试数据。表1给出了训练样本和测试样本分别所属的类别,最后一栏表示样本数量。

表1 样本的类别和数量

训练样本总数N为698,类别数P为3,预处理时,将图像以目标质心为中心切割为50×50的正方形目标区域,则m=n=50 ,特征向量的个数r设为10,因此识别时每个样本的维度d=50×10=500。最近邻的拒识门限T=0.22,近邻数k=15,稀疏表示部分的稀疏度S设为15。

实验计算机配置:Intel core i5-4570 CPU 3.2 GHz处理器,4 G内存,Windows 10 64位操作系统。

5.2 识别结果与分析

结合最近邻和拓展稀疏表示的SAR图像目标识别结果见表2,总体识别率为92.09%,识别时间为18.36 s。从表中可以看出,3类目标中,BTR70类的目标的识别率最高,这是因为T72不存在变体。同样的,BMP2类型中,BMP2-SN9563的识别率最高;T72类型中,T72-SN132的识别率最高,非变体的3类目标平均识别率达到98.98%,因此影响识别性能的主要原因是目标变体。

表2 本文方法的识别结果

在识别率和识别时间方面,将本文提出的方法NNSRC与其他两种方法——最近邻法(Nearest neighbor,NN)和稀疏表示方法SRC进行了比较,结果见图4。

图4 不同方法的识别率和识别时间

从图4可看出,SRC的识别率最高,本文提出的结合最近邻和稀疏表示的方法的识别率略低于SRC,但在识别率上的差异并不大。而就识别时间来说,用时最短的是NN方法,SRC方法用时最长,而NNSRC方法的识别时间明显少于SRC。这是因为部分测试样本置信度较高,当仅使用NN方法时,可以确定样本类别,目标识别速度会有显著提升。

图5展示了当特征向量个数r从2逐步增加到30时,两种方法分别对应的识别率的变化曲线。由实验结果可知,与传统方法相比,基于识别能力选取特征向量的方法在特征向量个数较少的时候,识别效果更好。但是随着用于识别的特征向量个数继续增加,基于识别能力选取特征的方法识别率增长缓慢,当个数超过20时,分类识别效果更好的是基于特征值大小选取特征向量的方法。这是因为此时基于识别能力新选取的特征向量的识别能力越来越小,这样的特征向量越来越多,且和识别能力大的向量发挥相当的识别作用,造成了识别性能的损失。

图5 两种2DPCA的识别率

5.3 参数影响

在结合最近邻和拓展稀疏表示的SAR图像目标识别模型中,近邻数k和拒识门限T显得尤为重要。为了研究NNSRC算法的识别性能,本文在实验中给参数T和k设置了不同值,一般识别率比识别速度更为重要,因此在这次研究过程中,摒弃了对识别时间的考量,主要获取识别率来检测识别效果。

从图6可以看出T和k这两个参数对识别率的影响程度是有差异的。当拒识门限T不变时,k轴方向呈现的起伏细微,且变化趋势也不是递减或递增,即不统一,对识别性能的影响较小,从而说明k这个参数值的选择对分类识别效果的影响程度较小。故在算法的实现中,近邻数k不是很重要,只要在一定范围内即可。而当近邻数k不变时,识别率在T轴方向上变化程度较大,且随着T值增大,识别率大多也提高了,这表明拒识门限T对识别性能的影响较大。原因在于:测试样本的识别比例与拒识门限T的大小相关,T的大小决定了测试样本的识别比例。拓展的稀疏表示识别法比最近邻法的识别率高,故当T增大时,测试样本中被拓展的稀疏表示识别法识别比例较高,识别率会随之提高。由图6可见,当T=0.24、k=24时识别率较高。

图6 不同参数下的识别率情况

6 结束语

本文提出的算法NNSRC结合了最近邻法和拓展的稀疏表示法,当利用最近邻法识别SAR图像目标的置信度不高时,再采用拓展的稀疏表示方法来进一步判定。NNSRC在利用拓展的稀疏表示识别SAR图像目标时,并没有选择全部训练样本组成稀疏字典,而是由从中筛选出的k近邻组成的,因此大大降低了字典的维数。当稀疏表示需要重建时,所需时间减少,因此针对SAR图像目标识别的速度更快。试验证实,与基于稀疏表示的SAR目标识别方法相比,NNSRC方法的识别率略微降低,但是在目标识别速度上有了显著提升。

下一步的工作方向是找到更稳健的稀疏表示分类框架,提高SAR图像目标变体的识别率。

猜你喜欢

训练样本特征向量识别率
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
人工智能
三个高阶微分方程的解法研究
档案数字化过程中OCR技术的应用分析
基于PCA与MLP感知器的人脸图像辨识技术
科技文档中数学表达式的结构分析与识别
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究
人工智能现状和发展