基于深度CNN模型的SAR图像有源干扰类型识别方法
2022-11-01陈思伟崔兴超李铭典陶臣嵩李郝亮
陈思伟 崔兴超 李铭典 陶臣嵩 李郝亮
(国防科技大学电子科学学院电子信息系统复杂电磁环境效应国家重点实验室 长沙 410073)
1 引言
合成孔径雷达(Synthetic Aperture Radar,SAR)作为一种全天时、全天候微波成像雷达,能够获得成像场景的高分辨雷达图像,在各个领域都得到了广泛应用[1-4]。作为重要的侦察工具,SAR也是电子干扰领域的重要研究对象。
为破坏SAR对己方的侦察,国内外文献公开报道了一系列对SAR干扰方法,主要包括无源干扰和有源干扰两大类。无源干扰主要有箔条[5]、伪装网[6,7]、角反射器[8-10]、充气模型[11]和人工电磁材料[12]等。有源干扰主要包括同频干扰[13]等无意干扰和噪声压制干扰[14,15]、有源转发干扰[16,17]、散射波干扰[18,19]等有意干扰等。干扰信号给SAR图像目标检测识别以及情报生成等带来了极大困难[20]。为有效应对SAR干扰技术挑战,国内外诸多学者也提出了一系列SAR干扰抑制和抗干扰技术方法[21-27]。这些SAR抗干扰技术方法大多针对给定的单一干扰类型。从SAR侦察和情报生成角度分析,在运用SAR抗干扰技术之前,通常先开展SAR干扰存在性检测。当确定干扰存在后,再开展SAR干扰类型识别。当前,SAR干扰存在性检测只有零星报道[28,29],而SAR干扰类型识别研究则还未见公开报道。
本文针对SAR图像有源干扰类型识别开展研究。选取噪声压制干扰[14,15]、移频类转发干扰[30-33]、间歇采样转发干扰[34,35]、微动调制转发干扰[20,36]和延迟多抽头转发干扰[20]等5种干扰样式,并根据干扰参数,进一步细分为9种干扰类型作为干扰识别对象。通过分析这些典型有源干扰类型的物理原理,构建了干扰数据仿真模型。利用MiniSAR实测数据,通过逆成像处理,在回波域叠加干扰仿真数据,再经过成像处理得到SAR图像有源干扰数据集。
近年来,深度卷积神经网络(Convolutional Neural Network,CNN)在图像处理领域获得成功应用[37-39],通过增加CNN模型的深度能够进一步提高图像分类识别准确率[37]。研究人员提出VGG(Visual Geometry Group)深度CNN模型[37]。根据网络模型深度的不同,VGG模型可进一步细分为VGG-16和VGG-19等。以VGG-16模型为例,其包含13个卷积层以及3个全连接层。为解决CNN模型深度加深后导致的网络优化困难、训练和测试误差增大等问题,研究人员提出一种残差网络ResNet(Residual Network),通过跨层连接的方式使网络对残差值进行优化,取得了更好的分类性能[40]。ResNet主干网络采用ResNet-18,包含8个残差模块,每个残差模块包含2个卷积层、2个Batch Norm层以及2个激活层。除了使用残差结构来解决深度CNN模型训练问题,研究人员还提出一种Inception v4模型[41]。该模型采用并行结构,同样能够很好地训练深度CNN模型。在现有CNN模型的基础上,本文提出了一种结合注意力机制的深度CNN模型,实现SAR图像典型有源干扰类型的识别。
2 对SAR典型有源干扰
本节分别介绍噪声压制干扰、移频类干扰、间歇采样转发干扰、微动调制干扰和延迟多抽头干扰等典型有源干扰样式的基本原理。
2.1 SAR回波模型
SAR通常采用线性调频信号,可表示为
其中,τ为距离向快时间,η为方位向慢时间。ωr(τ)=rect(τ/TP),TP为脉宽。f0为载频,kr为距离向调频率。
2.2 噪声压制干扰
噪声压制干扰有多种生成方式,包括射频噪声干扰、噪声调幅干扰、噪声调频干扰和噪声调相干扰[14,15]等。噪声压制干扰的信号模型可统一建模为
其中,t=τ+η为全时间。信号幅度U0、中心频率ω0和 初始相位φ0均为常数。包络Un(t)、频率调制斜率KFM、相位调制斜率KPM、噪声信号u(t)、相位ϕ(t)为可调干扰参数。
对不同噪声压制干扰类型,式(2)中可调干扰参数是不同的。其中,射频噪声干扰中Un(t)服从瑞利分布,ϕ(t)在 [0,2π)的区间上服从均匀分布,KFM,KPM,u(t)均 为0;噪声调幅干扰中Un(t)服从零均值高斯分布,KFM,KPM,u(t),ϕ(t)均为0;噪声调频干扰中u(t)服 从零均值高斯分布且KFM为非零常数,Un(t),KPM,ϕ(t)均为0;噪声调相干扰中u(t)服 从零均值高斯分布且KPM为 非零常数,Un(t),KFM,ϕ(t)均为0。
需要指出的是,由于射频噪声干扰、噪声调幅干扰、噪声调频干扰和噪声调相干扰在SAR图像上呈现为相近的压制干扰特性,因此在后续的干扰类型中不再细分。
2.3 移频类干扰
线性调频信号在时延和频移之间存在强耦合特性,当频率发生移动时,将产生相应的时间延迟。定义移频量为慢时间η的 函数fd(η),根据移频函数的不同可定义多种移频干扰类型。移频类干扰的信号模型可统一建模为
随机移频干扰的移频量在合成孔径时间内随机变化[31]
其中,ξ(η)为 [a,b]的 随机数且有(-1<a<b<1)。
步进移频干扰的移频量在合成孔径时间内步进变化[32]
其中,fd0为初始移频量,TL为合成孔径时间。
分段移频干扰的移频量在不同的方位时间段内变化。假设分段数量为N,则移频量可以表示为[33]
其中,ηk-1和ηk分别为第k个时间段的起止时间。
综合不同类型的移频干扰,其基本原理都是调制频率的移动以产生时间延迟。时间延迟在SAR图像中指示了假目标干扰出现的位置偏移。当干扰机的转发时延为0时,为产生位置偏移为R的假目标干扰,移频量Δfd为
2.4 间歇采样转发干扰
间歇采样转发干扰包括距离向间歇采样转发干扰和方位向间歇采样转发干扰。距离向间歇采样转发干扰中,干扰机在截获SAR信号后,先高保真地采样其中一小段进行转发,再采样下一小段并转发,采样与转发交替工作至大时宽信号结束。方位向间歇采样转发干扰中,干扰机在截获SAR信号后,通常先进行全脉冲高保真采样,并在下一个脉冲重复周期转发,采样与转发交替工作至合成孔径时间结束[34,35]。
距离向间歇采样信号通常为矩形包络脉冲串,可表示为
方位向间歇采样信号可表示为
其中,Dr为采样脉冲占空比,δ(·)为冲激函数,Ts=c/(2Rkr)为采样周期,R为假目标干扰之间的间隔。
2.5 微动调制干扰
目标的振动和转动等微运动会造成SAR回波方位向多普勒调制,使得目标在SAR图像方位向形成扩展假目标。当目标做匀速旋转运动时,对SAR回波调制相位近似为正弦信号[42,43]。基于此原理,对SAR微动调制干扰信号可表示为[20]
其中,Am=L/(2R)为调制幅度,L为假目标方位向跨度,R为假目标干扰之间的间隔。fm=2Rv/(λR0)为调制频率,其中λ为 波长。φ为调制信号初始相位。
2.6 延迟多抽头干扰
在截获SAR线性调频信号后,延迟多抽头干扰先对雷达信号进行转发,延迟一定时间T后再转发该雷达信号。根据确定的抽头个数N,可延迟转发N次。延迟多抽头干扰可产生N个相互间隔的假目标干扰[20],信号模型可表示为
其中,N表示抽头个数,T=2R/c表示抽头时延,R为假目标干扰之间的间隔。
3 SAR图像有源干扰仿真数据
3.1 仿真数据构建原理
对SAR多种样式的有源干扰实测数据,通常难以直接获取,且无法公开。对此,本文采用实测数据与干扰仿真数据相结合的构建策略,生成SAR图像有源干扰仿真数据集。首先,根据SAR系统参数和干扰参数,仿真干扰回波数据。其次,若有SAR原始回波数据,则将干扰回波与SAR原始回波叠加;若没有SAR原始回波数据,则通过逆成像技术,将SAR复图像数据转换到回波域,并与干扰回波叠加,得到叠加干扰信号的SAR回波数据。最后,通过对叠加有干扰信号的SAR回波数据进行成像处理,得到SAR有源干扰图像。以距离向间歇采样转发干扰为例,给出了SAR有源干扰数据构建流程图,如图1所示。
图1 干扰数据构建流程图Fig.1 Flowchart of jamming data construction
3.2 仿真数据构建
选取美国Sandia实验室2005年的MiniSAR图像数据作为图像模板。MiniSAR系统工作于Ku波段,距离和方位分辨率约为0.1 m。该批次获取的MiniSAR数据共包含20景,部分数据成像场景相同,但观测视角和时间存在差异。成像场景中包含多种地物类型和人造目标,主要包括草地、裸地、机场等地物背景,以及飞机、车辆、建筑物等人造目标。共选取14景观测视角差异较大且包含不同人造目标的数据构造有源干扰仿真数据集。14景数据中根据成像区域的不同可划分为7组,每组包括同一场景的两个不同观测视角或不同时间成像数据对。从每一景数据中提取大小为723×723的矩形区域切片,用于干扰数据集构建。图2给出了14景MiniSAR数据切片图。其中,每一行包括7个区域,选取自7个不同场景的成像数据。每一列包括两个区域,选自同一场景的不同观测角度或不同观测时间的数据。需要指出的是,为提高数据集代表性,同一场景不同观测视角数据中,选取的区域并不相同。因此,图2中每一列数据也存在差异。
图2 MiniSAR数据切片Fig.2 Image chips of MiniSAR data
基于选取的14个SAR图像切片,构造干扰仿真数据集。对于选取的5类干扰样式,移频类干扰可进一步细分为固定移频干扰、随机移频干扰、步进移频干扰和分段移频干扰4种;间歇采样转发干扰可细分为距离向间歇采样转发干扰和方位向间歇采样转发干扰2种。因此,5类干扰样式可细分为9种干扰类型。对于每个切片,假定只有一部干扰机发挥干扰作用,共随机设置9种不同的干扰机位置。设置8种不同的干信比(Jamming to Signal Ratio,JSR),其中干信比定义为干扰功率和原始回波信号功率的比值
其中,PJ表示干扰功率,PS表示原始回波信号功率。
总体而言,干扰仿真数据集中包括14个SAR图像切片,每个切片中分别设置9个干扰机位置,每个干扰机位置分别添加9种干扰类型,表1总结了不同干扰类型的参数设置。每种干扰类型包括5.0 dB,7.5 dB,10.0 dB,12.5 dB,15.0 dB,17.5 dB,20.0 dB和22.5 dB共8种干信比。因此,干扰仿真数据集中切片数量为14×9×9×8=9072个。
表1 干扰参数设置Tab.1 Jamming parameter configuration
以车辆目标SAR图像切片为例,图3为干信比5.0 dB时不同干扰类型和不同干扰机位置的SAR图像干扰样本。其中,每一行从左到右表示不同的干扰类型,依次是噪声压制干扰、固定移频干扰、随机移频干扰、步进移频干扰、分段移频干扰、距离向间歇采样转发干扰、方位向间歇采样转发干扰、微动调制干扰和延迟多抽头干扰。每一列从上到下表示不同的干扰机位置。9种干扰类型呈现出不同的干扰效果。其中,噪声压制干扰覆盖整个场景;固定移频干扰沿距离向产生1个假目标;随机移频干扰在二维图像中产生沿距离向条带状干扰;步进移频干扰沿距离向产生干扰且沿方位向有一定展宽;分段移频干扰、微动调制干扰和延迟多抽头干扰在一定范围内产生若干个假目标;间歇采样转发干扰沿整个方位向或距离向产生假目标串。总体而言,不同类型的有源干扰在SAR图像上表现出不同特性,给干扰类型识别奠定了基础。
4 SAR图像有源干扰类型识别方法
从图3可知,不同类型有源干扰在SAR图像中呈现的效果各异。从计算机视觉角度,有源干扰在SAR图像中更多地表现为一种异常现象,并具有视觉显著性。通常,注意力机制能够敏感于图像中视觉显著性区域。为了使网络模型能够学习到干扰在SAR图像空域中的非局部相关性,本文以VGG-16为主干网络,提出一种结合注意力机制的有源干扰类型识别网络。采用文献[44]提出的一种非局部注意力模块,对图像全局特征进行建模,从而挖掘像素之间的非局部相关性。网络模型的深度特征提取结构由注意力单元组成,如图4(a)所示。每个单元由卷积层、非局部注意力模块、BatchNorm层以及激活层组成。将13个这样的注意力单元与池化层进行拼接,构成深度特征提取结构。最后通过3个全连接层以及Softmax层后得到最终干扰类型识别结果。本文所提网络模型记为VGG-16+Attention Net (VGG-16+AN),网络模型整体结构如图4(b)所示。
图3 包含9种干扰类型和9种干扰机位置的车辆目标SAR图像切片((a) 噪声压制干扰,(b) 固定移频干扰,(c) 随机移频干扰,(d) 步进移频干扰,(e) 分段移频干扰,(f) 距离向间歇采样转发干扰,(g) 方位向间歇采样转发干扰,(h) 微动调制干扰,(i) 延迟多抽头干扰)Fig.3 SAR image chips with vehicle targets containing 9 jamming types and 9 jammer positions((a) Noise suppression jamming,(b) Fixed shift-frequency jamming,(c) Random shift-frequency jamming,(d) Stepped shift-frequency jamming,(e) Blocked shift-frequency jamming,(f) Intermittent sampling repeater jamming in range,(g) Intermittent sampling repeater jamming in azimuth,(h) Micro-motion modulation jamming,(i) Delayed multi-taps jamming)
图4 结合注意力机制的有源干扰类型识别网络模型Fig.4 Active jamming type recognition network model based on attention mechanism
需要指出的是,本文也研究了将注意力机制和ResNet-18模型、Inception v4模型相结合的网络模型,即ResNet-18+AN和Inception v4+AN。然而,初步实验表明,ResNet-18+AN模型训练难以收敛,而Inception v4+AN模型并未带来识别性能的提升。如何优化设计注意力机制模块与ResNet-18和Inception v4等模型的结合,将在以后研究中探讨。因此,在下一节对比实验中,本文只考虑VGG-16,ResNet-18,Inception v4和VGG-16+AN这4种模型方法。
5 对比实验
本节利用构建的SAR图像有源干扰仿真数据集,验证不同深度CNN模型对不同干扰类型的识别性能。所有网络模型均采用ADAM优化器进行参数优化。ADAM优化器参数设置为β1=0.9,β2=0.99 以 及ε=10-8。训练次数为100,初始学习率为10-4,并采用多步学习率衰减策略,即在第40,60以及80次训练时,将学习率衰减为原来的20%,以使得模型在训练后期不会有太大的波动。采用Pytorch框架实现网络模型,并利用NVIDIA RTX A6000显卡进行训练。本文共设计了两组对比实验,验证所提方法的有效性。实验1重点考察干信比的影响,干扰参数设置如表1所示,利用5 dB,10 dB,15 dB和20 dB等4种干信比数据训练网络模型,以7.5 dB,12.5 dB,17.5 dB和22.5 dB等4种干信比数据测试网络性能。实验2重点考察干扰调制参数的影响,在干信比为5 dB,10 dB,15 dB和20 dB的情况下,利用干扰调制参数R=20数据训练网络模型,以R=20,22,24,26,28和30共6种干扰调制参数数据测试网络性能。为避免训练样本随机选取对识别性能的影响,每组实验重复5次。
5.1 不同干信比下的干扰类型识别
干信比是影响干扰效果的重要参数。本节利用4种深度CNN模型对不同干信比条件下典型有源干扰类型开展识别研究。具体地,以5 dB,10 dB,15 dB以及20 dB等4种干信比的有源干扰数据训练网络模型,分别测试该模型对7.5 dB,12.5 dB,17.5 dB和22.5 dB等4种干信比数据的干扰识别性能,分别记为JSR_7.5,JSR_12.5,JSR_17.5以及JSR_22.5。实验1中训练损失值随迭代次数的变化曲线如图5(a)所示,迭代次数超过40次时,4种模型均已达到收敛状态,收敛速度基本相当。
对于实验1,5次实验识别结果的均值和标准差如表2所示。其中,OA (Overall Accuracy)表示总体识别精度。实验1中4种方法的总体识别精度折线图如图5(b)所示,随着测试数据干信比的增加,4种方法识别精度整体呈上升趋势。可以观察到,本文所提方法在不同干信比数据中的总体识别精度最高,达到99.79%以上。除此之外,本文所提方法的总体识别精度标准差是最小的,表明本文方法更加稳健。
表2 实验1有源干扰类型识别结果(%)Tab.2 Active jamming type recognition results of experiment 1 (%)
5.2 不同干扰调制参数下的干扰类型识别
本节对不同干扰调制参数下的干扰类型识别效果开展实验。采用干扰调制参数R分别为20,22,24,26,28和30的数据,分别记为Para_20,Para_22,Para_24,Para_26,Para_28以及Para_30。除干扰调制参数外,训练集和测试集的干信比相同,包括5 dB,10 dB,15 dB和20 dB等4种干信比数据。本文使用数据Para_20训练网络模型,并对数据Para_20,Para_22,Para_24,Para_26,Para_28以及Para_30分别进行测试。
不同网络模型对于不同干扰调制参数的识别结果如表3所示。值得注意的是实验1与实验2使用的训练数据集相同,因此实验2中使用实验1训练好的网络模型进行测试。实验2的平均总体识别精度如图6所示,不同干扰调制参数的识别结果中,本文提出的VGG-16+AN方法的总体识别精度优于其他3种方法。另外,从表3可以观察到,随着干扰调制参数R的增大,即训练集与测试集测差异增大,不同网络的识别精度呈现下降趋势。当干扰调制参数R为30时,本文提出的方法仍取得了83.17%的平均总体识别精度,优于其他3种方法。
图6 实验2平均总体识别精度Fig.6 Mean overall accuracy of experiment 2
表3 实验2有源干扰类型识别结果(%)Tab.3 Active jamming type recognition results of experiment 2 (%)
续表 3
综合上述对比实验,本文验证了基于深度CNN模型对SAR有源干扰类型的识别能力。同时,本文提出的结合注意力机制的VGG-16+AN方法在识别精度和稳健性方面取得了更好的性能。
6 结语
SAR作为电子侦察和遥感情报获取的主力传感器,在电子对抗博弈中发挥着关键作用,也成为复杂电磁干扰的主要对象。为有效应对干扰挑战,发展一套成体系和智能化的SAR抗干扰技术框架具有重要价值。从SAR情报生成流程考虑,该抗干扰技术框架可以包括:干扰存在性检测[28,29]、干扰定位、干扰类型识别、干扰抑制等关键技术。本文着重针对有源干扰类型识别开展研究,提出了一种结合注意力机制的深度CNN模型,实现对9种典型有源干扰类型的有效识别。相比于传统深度CNN模型,对比实验验证了本文方法具有更好的识别精度和稳健性能。
总体而言,本文是SAR图像有源干扰类型识别的初探研究。未来,将着重考虑进一步增加样本数量,丰富可识别的干扰类型,并结合外场实测干扰数据进行深化研究和验证。