复杂战场对抗环境下空中目标抗干扰识别算法
2022-12-01赵军民魏嘉艺吴思捷李新国吕梅柏
赵军民,魏嘉艺,吴思捷,李新国,吕梅柏
(1.西北工业大学 航天学院,陕西 西安 710072;2.中国兵器工业第203研究所,陕西 西安 710065)
0 引言
为适应新军事变革对攻坚破甲导弹提出的多功能、多任务的作战需求,实现攻坚破甲导弹空地目标立体打击能力是一个重要的研究方向。在攻坚破甲导弹多种制导体制中,红外成像制导具有制导精度高、抗干扰能力强、可昼夜作战的优点,其不仅可分辨出目标的类型,而且能够识别出目标的薄弱部位,对其实施精准打击。红外成像制导己成为攻坚破甲导弹主要制导方式,是攻坚破甲导弹走向智能化的重要技术基础。
攻坚破甲导弹主要打击地面装甲类、工事类目标,具备打击低空直升机、无人机等目标的能力。面对精确制导弹药的威胁,各种对抗技术也在突飞猛进的发展,红外诱饵已经成为一种常规的干扰手段[1-3]。在攻坚破甲导弹与直升机博弈对抗过程中,直升机与低空云层形成了一定程度的融合,视觉显著性下降,同时通过抛射干扰弹诱导红外导引头锁定热辐射更强的诱饵。从干扰起燃到充分燃烧,最后燃烧殆尽的不同阶段,红外干扰弹于成像导引头的视场中呈现的特征在不断变化,造成了与目标的混淆。对空中目标而言,全空域的运动环境形成了复杂多变的对抗态势,导引头中的目标特性在不同成像视角下呈现多样性,如图1所示,进一步增加了目标识别的难度。因此如何在复杂战场对抗环境下,赋能攻坚破甲导弹精准目标识别,是一项关键技术。
攻坚破甲导弹现有目标识别主要采用相关匹配方法或者特征匹配方法[4-6],典型的SLAM-ER导弹的目标识别处理模块采用模板匹配算法[7],将采集的目标区域图像与内部存储的目标基准图进行匹配,该方法实现简单、匹配定位精度高,但对人工基准图像的要求较高,缺乏灵活性[8],易产生误配现象。同时相关匹配算法[9]依赖于模板更新的精确度,目标特性变化较大时易产生积累误差。对于目标运动过程中带来的尺度和旋转等问题,文献[10]提出了基于对数极坐标变换的相关匹配算法,引入主梯度方向,提高了匹配效率。但基于对数极坐标的方法存在着中心区域超采样,而边缘区域欠采样的缺点,易产生混叠现象,影响了匹配精度[11]。基于特征匹配的算法[12-13]对背景和噪声较为敏感,易受复杂战场环境多样化干扰影响,在直升机目标形状特性、辐射特性、运动特性随目标机动及干扰遮蔽发生较大变化的情况下,算法难以自适应各种攻击态势。
受启发于目标检测中通过分阶段逐级处理提升算法性能[14]的思想,考虑到实际工程应用中算法的可移植性,将传统算法与多阶段检测器的思想进行结合,针对攻坚破甲导弹空地一体化的作战需求,在分析其数据特性的基础上,本文提出了复杂对抗环境下融合强判别性特征的空中目标抗干扰识别算法,引入逐级筛选和逐步细化的识别机制,通过多阶段定位对目标进行识别。算法分为图像分析、特征学习和分类识别3个阶段。图像分析阶段,观察到目标和背景区域像素聚合的差异性,通过模糊聚类对各区域进行初步分析定位;特征学习阶段,从多个维度对区域属性进一步分析描述,将特征间的相互联系在模型的框架中进行表述,引入重要性度量评估,选取高权重的特征作为分类模型的输入;分类识别阶段,基于不同对抗态势下的战场环境数据输入和目标的特征描述,学习强判别性的分类模型,进而锁定目标,整体算法框架如图2所示。图2中,黑线箭头部分为训练阶段,蓝线箭头部分为在线运行阶段。下面将分别按照图像分析,特征学习和分类识3个部分对抗干扰识别算法进行阐述。
1 图像分析
图像分析阶段主要通过分析战场输入数据的分布特性,对相似灰度分布的像素进行归纳。通过聚类算法可以将图像中的不同区域进行聚合[15],生成候选区域,以此为基础,将候选区域输入至抗干扰目标识别算法,进行特征提取和分类识别。聚类算法中,基于模糊C-均值的算法在红外图像中提取感兴趣区域已有广泛应用[16-17],不同于“硬”分类中数据完全隶属于某一类,模糊C-均值引入了隶属度函数,考虑了聚类过程数据归属的不确定性问题,更贴合实际中的工程应用。
对于图像中的像素集合X,设将像素集划分成C类,类中心相应定义为ci,共计C个,定义隶属度为μij,表示数据集中的样本xj隶属于ci的程度,样本数量共计n个,其目标函数及其约束条件如下:
(1)
(2)
式中:m为隶属度因子,隶属度总和约束为1;ci和μij随着聚类迭代的过程按下式进行更新:
(3)
(4)
算法迭代初始,设定聚类数目为3类,随机选取初始聚类中心,迭代过程中不断更新隶属度μij和聚类中心ci,将像素分配至相应的类别,当目标函数在变化中趋于稳定后输出聚类结果,生成候选区域,如图3所示。聚类形成的区域按照不同的类别属性赋予其区域属性值,形成候选区域。将目标的搜索区“粗”定位于候选区。将候选区域输入至后续的特征学习模块,进行区域属性的进一步分析,作为目标识别的基础。
2 特征学习
2.1 特征库建立
经过目标候选区域提取算法,导引头图像中的像素会聚集为几个不同的区域,通过进一步建立特征库对区域进行刻画。区域的特征库描述考虑了多个维度,分别从纹理、形状和梯度分布等方面对区域属性进行刻画。其中纹理特征包括平均灰度、能量、信息熵,形状特征包括长宽比、周长、圆形度、面积、傅里叶描述子[18],梯度分布特征采用梯度直方图(HOG)[19]描述子。下面分别对纹理特征、形状特征和梯度分布特征进行介绍。
2.1.1 纹理特征
纹理特征主要表述如下:
(1)平均灰度:原始图像中目标区域像素平均灰度与背景灰度的差值。计算公式为
Ga=fa(x,y)-Gb
(5)
式中:x、y分别为图像平面横、纵坐标;fa(x,y)为目标区域平均灰度;Gb为背景灰度。
(2)能量:原始图像目标区域内像素点相对灰度累加和,其中的相对灰度就是该像素点的灰度值与图像背景灰度值Gb的差值。计算公式为
E=∑(fT(x,y)-Gb)
(6)
式中:fb(x,y)是指目标区域像素点灰度。
(3)熵:描述图像中目标区域的纹理随机性。其最大值对应共生矩阵中所有值相同的情况;当共生矩阵中的值大小分布较为不均匀时,该特征值会变小。计算公式为
(7)
式中:p(i,j)为灰度共生矩阵。
2.1.2 形状特征
形状特征主要表述如下:
1)长宽比:目标最小外接矩形的水平长度与垂直长度之比。计算公式为
(8)
式中:Lb和Wb分别表示目标最小外接矩形的水平长度与垂直长度。
2)周长:目标边界长度,对应物理因素为轮廓信息,计算公式为
P=∑f(x,y)
(9)
式中:f(x,y)为二值图像中的边界像素,对边界像素进行累加计数获取周长。
3)面积:描述图像中的目标连通区域的大小。在二值图像中即为目标区域像素点的个数。计算公式为
Area=∑f(x,y)
(10)
式中:f(x,y)为像素灰度。
4)圆形度:描述物体形状与圆的相似程度,计算公式为面积Area与4π的乘积与周长P平方之比。计算公式为
(11)
5)傅里叶描述子:描述特体全局形状特征,设边界像素坐标(xi,yi),i={1,…,K},K为边界像素总数。提取傅里叶展开式前10项变换系数,将它们进行归一化处理,设定归一化的傅里叶描述子为Fk:
(12)
(13)
式中:Ak和Bk为对应的傅里叶展开变换系数,按(14)式和(15)式进行计算,
(14)
(15)
2.1.3 梯度分布表述
梯度特征是图像描述中的重要表征,HOG特征通过对物体四周像素的梯度或边缘方向的分布进行统计分析,反映图像中的梯度方向信息,能够对物体外形进行较好的描述,在目标检测和跟踪领域有极为广泛的应用[20]。进行HOG特征提取时,先将整幅图像切割成大小相同的像素构成的连通区域称为单元,在每一个单元内对每个像素的梯度按照方向统计直方图,这些直方图的组合可形成特征描述子。将单元组合成较大的区域,称为块,对块内单元的直方图信息进行归一化处理。因为是在图像的单元方格上进行信息的统计,所以HOG特征对图像的几何和光学转化有着良好的不变性[21]。
HOG特征的提取过程实际就是梯度直方图特征的统计过程,目的是构建可供后续分类器使用的图像特征向量,其主要流程如图4所示。HOG特征提取过程中,每16×16个像素组成一个单元,每2×2个单元组成一个块,每个单元内有9维特征,每个块内有36维特征。以16个像素为步长,分别向右和向下进行滑动,每移动一次均产生一个36维的特征向量,最终生成的HOG特征是将检测窗口中所有块的HOG特征组合在一起,使之变成一个直方图特征向量,用来与其余特征融合,以供分类使用。
将分析所得的图像特征能量、面积、周长、平均灰度、圆形度、长宽比、熵、椭圆傅里叶描述子与梯度分布特征作为特征库的基础,将红外图像中候选区域的信息转化为特征级的抽象表述。计算样本库中目标与干扰对应的特征值,统计其特征值分布,绘制不同特征的直方图分布,如图5所示。
从图5中可以看到目标和干扰的特征直方图分布呈现出明显的差异性。将上述纹理特征、形状特征及HOG特征进行级联,构成特征库模型,将融合生成的特征描述符作为下一阶段输入。以包含目标和云层的场景为例,由输入图像生成多个侯选区域,在图像中具体表现为形成了不同的连通区域,如图6所示,再将各连通区域输入至特征提取模块,各区域均存储了自身的特征值信息,用于后续的分类识别。算法运行过程中,需遍历所有侯选区域,计算对应特征值。
2.2 特征选择
(16)
式中:Z为归一化因子;s为样本特征值;μk和σk分别为类别k的均值和方差。根据特征分数形成先验分布ρ,
ρ=diag(ΦY)
(17)
Y为样本标签值,形成新的特征分布,设为F={f1,f2,…,fn}。若样本数为n、类别为2,则每维特征可形成n×2维分数,再选择与样本实际对应类别的分数,最终每维特征保留n×1维分数。由于该分数是基于特征均值和方差映射而得,包含了样本特征的信息,故可看成先验分布。然后引入隐变量Z={z1,z2}分别代表相关和不相关,通过相关性度量对特征分布进行刻画,构造特征值t分布:
P(t|f)=P(t|z1)P(z1|f)+P(t|z2)P(z2|f)
(18)
将各维特征分数映射至6个区间,分别用[1,6]6个特征数值表示,其中6代表特征分数最高的区间,计算各个区间的特征分数数量。其中第4区间~第6区间的特征分数占比s作为P(z1|f)初值,第1区间~第3区间的特征分数占比作为P(z2|f)初值。
对于全部的特征空间可得,
(19)
通过最大化下述似然函数进行求解,
(20)
式中:Q(f,t)为特征值t在特征f出现的次数,可由各个区间的特征分数数量表示。下面采用期望最大化(EM)算法进行迭代求解,分为E步骤和M步骤,其中E步骤根据当前参数值计算隐变量分布,如(21)式所示:
P(z|f,t)=
(21)
M步骤将似然函数最大化获取新的参数值,如(22)式~(24)式所示:
(22)
(23)
(24)
式中:f′、t′分别表示f和t取值的集合。
将E步骤和M步骤迭代优化直至收敛,最终图模型中邻接矩阵{A:ai,j=φ(xi,xj),1≤i,j≤m}按(25)式进行计算,
φ(xi,xj)=P(Z=z1|fi)P(Z=z1|fj)
(25)
可求得各特征分量的度量分数为
(26)
式中:l表示特征向量在图模型中的连接路径;rl为连接路径的权重系数;e为指示向量。通过度量分数对特征向量的各维度的重要性进行度量,进而选择出有较强判别性的特征维度,后续给出实验分析。
3 分类识别
机器学习对目标样本进行训练的方法,可以有效提升算法的适应性和鲁棒性[25]。考虑到支持向量机(SVM)的分类算法在样本较少的情况下仍然能够得到较好的分类识别效果[26],能够充分利用目标特征,“剔除”冗余样本,表现出良好的学习能力[27],通过与样本特征模型的结合,其泛化性能得到进一步的提升[28-29]。故分类模型的学习采用了SVM的训练方式,并在传统SVM的二分类模型的基础上将其改进为多分类模型,进一步提升其判别能力。将上一阶段学习到的特征模型输入至SVM进行分类模型的训练,进而对目标类型进行识别。本文的研究对象中,红外成像导引头视场呈现的图像信息主要包括目标、干扰和云层背景三种类别,而原始SVM是用来解决二分类问题的学习算法,故本文针对多分类问题在原始SVM基础上对其进行扩展和改进,以增加后续跟踪算法的鲁棒性。
实现三分类的基本思想仍是在实现二分类的基础上,对于正负样本的设置进行重构。有两种思路,第1种是“一对多”,第2种是“循环一对一”。方法1依次用一个两类SVM分类器将每一类与其他所有类别区分开来,得到k个分类函数。分类时将未知样本分类为具有最大分类函数值的那类。方法2是在每两类间训练一个分类器,若多目标分类共有k个类别,则分类器的数量应为k×(k-1)/2。
本文需要求解三分类问题,共需3个分类器,与方法1比较,分类器的数目相同,但能够避免方法1可能会产生的分类重叠或不可分类现象。对于本文研究数据集的对象,分别设置样本标签为目标、干扰及背景,在任意两个样本之间设计一个SVM,当对一个未知的样本进行分类时,最后得票最多的类别即为该未知样本的类别。
假设对抗目标库中训练数据样本点为{(x1,y1),(x2,y2),…,(xn,yn)},其中xi∈Rp,yi∈{1,2,…,k}。则可以给出分类超平面函数集:
(27)
式中:wk分类超平面的法向量;bk为位移量。寻找使得类间隔d最大的分类平面:
(28)
s.t.yi(wTxi+b)≥1
(29)
采用拉格朗日乘子法得到其对偶问题:
(30)
令L(w,b,α)对w和b的偏导数等于0,可得
(31)
(32)
原目标函数进一步可转化为
(33)
求解得到
(34)
(35)
最后,分类器决策函数为
f(x)=sign(w*·x+b*)
(36)
4 实验分析
本文采用基于实验室仿真平台的对抗样本库中的8位仿真灰度图像序列,均为640×512单通道,仿真样本集包括初始发射条件、目标机动、干扰投射策略3个维度对抗条件的参数,将参数进行量化。为更贴近实战情况,将仿真图像序列与实拍低空云层图像进行合成,更好地模拟实战场景。为验证抗干扰识别算法的可行性与有效性,选取干扰投射距离为2 000 m以及3 000 m的弹道,红外干扰投射数目分别设为24发及32发,投弹组数分别设为6组及8组,组间隔均为0.1 s,目标进行无机动、左转、右转3种机动方式。通过模拟典型战场环境,生成大量不同对抗态势下的目标特性库训练集,包含0°~360°范围内共8种进入角,样本图共计12 034幅,战场态势想定如表1所示。
表1 算法测试弹道初始态势
将本文选取的特征选择算法与Fisher算法和局部聚类选择特征(LLCFS)算法进行比较,从高维特征选取两维特征进行识别率比较。其中Fisher算法和LLCFS算法性能差距较小,本文采用的特征选择算法在Fisher算法的基础上进一步构造了相关性矩阵,特征间的权重衡量进一步得到优化,识别率有了较大提升,如表2所示。
表2 不同特征选择算法比较分析
不同特征的度量分数和分类识别率的对比实验,如图7所示。其中长宽比、周长、能量、平均灰度、面积、圆形度和熵均为一维特征值,傅里叶描述子为10维特征值,HOG特征展开后为2 480维特征值。不同特征的度量分数如图7所示,其中傅里叶描述子和HOG特征为多维特征,由于HOG特征维数较多,为便于展示,这里仅选取度量分数大于0.5的维度进行绘图,取其平均度量分数进行连线。为进一步对图7进行分析,对图7进行二维投影,如图8所示,在一维特征中,熵的度量分数较低。多维特征中傅里叶描述子的平均度量分数较高。HOG特征中,同时分布了大量高度量分数的特征维度和低度量分数的特征维度,其平均度量分数较低。图9为不同特征的分类识别率。由图9可见:一维特征中平均灰度和圆形度有较高的识别率,多维特征中傅里叶描述子有较高的识别率;平均灰度、圆形度和傅里叶描述子分别对物体从纹理和形状两个方面进行了描述,HOG特征对物体的梯度分布进行了描述。在实际工程应用中,可考虑通过平均灰度、圆形度、傅里叶描述子和HOG特征的组合,对物体多个维度进行刻画,提升识别率。
特征学习阶段的实验分析,纹理、形状和梯度分布特征融合后共可获取2 497维特征,在2.2节中通过特征选择算法可对特征的不同维度的重要性进行度量,并根据重要性进行特征维数重排,原始特征度量及重排后特征分布如图10和图11所示。
特征维度重排后,采用重排后的特征进行分类实验。选取前2维特征,并投影至二维平面进行可视化分析,分类结果如图12所示,从中可见当仅采用二维特征向量时,分类器未能学习到较好的分类平面,存在大量的误分类样本。
当逐渐增加特征维度时,识别率逐步上升,如图13所示。从图13中也可以看到,进行特征选择后,通过选择高权重的特征可以有效提升识别率,当特征维数增加至100维时识别率上升变缓,故在下述实验中选择重排后的前100维特征进行分类实验。
进一步对支持向量机采用的核函数进行对比实验,实验结果如表3所示,其中的训练误差率为对训练样本进行交叉验证处理后测试样本的误差分类率。
表3 3种核函数分类实验结果分析
根据表3的实验结果,当选择高斯径向基核函数时,SVM对标签的分类误差率最低,因此选择基于高斯径向基核函数的SVM作为空中目标的抗干扰分类器。对不同对抗态势下的红外空中目标样本集进行测试,算法识别正确率定义如下:
(37)
式中:Nr表示正确识别目标类别的数量;Nt表示总测试图像数目。干扰投射距离为2 000 m及3 000 m的弹道测试结果如表4所示。
表4 算法识别正确率测试结果
对于不同进入角下的识别正确率进行统计,绘制成折线图如图14所示。
测试的弹道图像数据集通过距离和进入角变化模拟对抗过程中可能出现的各种战况,分析表4可知,在干扰投射距离为2 000 m时,平均识别正确率为85.06%,在干扰投射距离为3 000 m时,平均识别正确率为72.32%。近距时目标在视场中所占像素比较高,有较为明显的纹理及形状等特征,当前阶段识别准确率较高。当距离拉开时,目标在视场中的成像面积减小,特征可分辨性减弱,对应的识别准确率也随之下降。同时随着进入角变化,目标在视场中呈现的特征也随之发生变化,图15分别选取不同图像序列下正确识别的结果(第806帧)和错误识别的结果(第433帧)进行对比。图15的第806帧识别结果中,目标与背景及干扰具备一定的辩识度,识别算法排除了干扰选项,锁定了目标。但在另外一个序列中的第433帧,目标融入云层背景中,并且当前成像视角下,诱饵的拖尾在视场中对目标造成了较强的混淆,识别算法未能正确锁定目标。后续算法拟考虑丰富特征库[31],进一步加强特征判别性,同时引入特征在线更新的机制,根据场景自适应对特征进行选择更新。
综合上述实验结果可知,在大量弹道图像数据集测试中,本文方法的平均识别正确率为78.63%。实验中通过不同因素的分类测试分析了不同阶段的难点和优缺点,为实际工程应用了打下基础。
5 结论
本文针对红外成像攻坚破甲导弹在复杂战场对抗环境中存在的低空云层背景和红外诱饵干扰情况,在分析战场对抗数据的基础上提出了融合强判别性特征的抗干扰识别算法。首先通过聚类分析对相似灰度分布的像素进行聚合,形成目标、云层背景和诱饵区域的初步分离,实现区域“粗粒度”初步定位。进一步对目标和干扰的特征描述进行分析,通过纹理和形状特征的多维度刻画,学习强判别性的特征对目标和干扰进行分类识别。通过多阶段的逐级处理,识别复杂战场对抗环境下的空中红外目标,最后将算法在不同对抗态势下的弹道图像数据集进行验证。通过模拟典型战场环境,对算法进行测评,平均识别正确率达到78.63%,可有效完成目标与干扰之间的区分。同时也针对失败案例进行了回溯,分析算法存在的问题和改进方向,为实际工程应用中的算法研制提供支撑。