无监督时频信息结合的舰船辐射噪声信号抗诱饵干扰方法
2023-10-07段一琛申晓红王海燕闫永胜
段一琛, 申晓红, 王海燕, 闫永胜
(西北工业大学 航海学院, 陕西 西安 710072)
0 引言
舰船辐射噪声信号是舰船在移动过程中发出的声信号,由于海洋环境的特殊性,舰船辐射噪声信号是感知舰船的重要方式之一[1-2]。为了混淆敌方感知系统,一种典型干扰手段是释放诱饵信号。诱饵信号通过模仿目标舰船辐射噪声信号完成对目标舰船的掩护。由于诱饵信号与目标舰船辐射噪声信号高度相似,区别真实目标舰船辐射噪声信号与诱饵信号的难度很高。如果可以在仅采用目标舰船辐射噪声信号数据的条件下,实现对舰船辐射噪声与诱饵信号的识别,将大大提高战时敌方舰船识别效率,从而提高战术行动的效率和成功率。
将目标舰船辐射噪声信号作为目标信号,当诱饵信号进行干扰和掩护时,假设目标信号和诱饵信号在时间上不重叠,则如果可以实现对两类信号进行识别,便可以实现抗诱饵干扰。对于目标信号和诱饵信号的识别,明显是一个二分类问题。在非合作的对抗场景下,难以获取全面的带有两类标签数据的支持。假设可以获取目标舰船辐射噪声信号,识别出目标舰船辐射噪声并能够抵抗诱饵信号的干扰,则抗诱饵干扰问题可以转化为单类分类问题(One-Class Classification)。本文将以真实的舰船辐射噪声信号为目标信号,并且只采用目标信号作为模型的信息来源,设计一种基于无监督对抗训练策略的深度学习方法,实现对舰船辐射噪声信号和诱饵信号的分类。
单类分类问题是一种极端的分类问题,在模型训练过程中只采用一种类别的样本[3-8],在测试时加入其他类别的样本。其主要目的是测试当前数据是否与训练时的数据为同一类数据。由于对已训练完成的分类器而言测试样本中包含未见过样本类别,单类分类问题又叫做新类检测(One-Class Novelty Detection)[9-10]。单类分类一直是分类问题中的难点,并一直受到广泛关注。经典算法通常将其作为一种表示学习问题,旨在获得类内相近类间可分的特征表示[11-16]。经典算法有主成分分析(PCA)和核主成分分析(KPCA),其主要思路为寻找一个低维子空间以表示训练数据空间[17-19]。过完备字典学习(K-SVD)通过寻找到训练数据的稀疏来表示实现单类分类。近年来,随着深度学习方法在各个领域表现突出,目前已有许多采用各种深度学习范式进行单类分类问题的研究[20-23],其中采用生成模型是目前最主流的思路。通过构建生成模型捕捉训练数据的分布,对于测试数据可以通过验证其与所学习的分布的偏差实现数据类别的判别[24-27]。
对抗生成网络(GAN)近些年的研究显示出可靠捕捉数据分布的能力,目前众多学者据此提出了众多以GAN为基本架构的方法,以解决单类分类问题。OCGAN构建一个自动编码器作为生成器,构建两个判别器,其中一个判别器用于确保自动编码器提取到的数据特征符合同一分布,另一个判别器用于确保随机采样的潜变量经过生成数据后的真实性[28]。AnoGAN构建了一个经典GAN网络以实现对异常医学图像检测,在训练阶段采用正常医学图像,在测试阶段通过对生成损失反向传播获得浅空间表示,再通过前向传播获得与原图像的对比判断是否为异常样本[29]。GPND采用自动编码器作为生成器,采用判别器对特征向量进行约束,并提出了一种灵活的新类概率计算方法[30]。OGN采用两个生成器,其中一个对原始图像进行重构,另一个负责生成异常图像副本(Pseudo Anomaly Image),两个生成器的输出视为单类样本输入判别器,让判别器在测试阶段的过程中可以获得对正样本的分辨能力,最后实现对视频的异常检测[31]。Sabokrou等[32]提出了一种端到端对抗训练的单类学习方法,迫使正样本数据经过神经网络提取到的特征尽可能服从高斯分布。在测试阶段,可以同时采用生成器和判别器对数据进行判别。Tagawa等[33]将声信号通过短时傅里叶变换变换为时频图,再采用GAN等深度学习方法实现对实际工业声信号的异常检测。
当前针对舰船辐射噪声的抗诱饵干扰公开研究尚为空白。本文构建一个舰船辐射噪声抗诱饵干扰场景,将舰船辐射噪声信号的抗诱饵干扰问题转化为单类分类问题。其主要工作难点如下:1)诱饵信号与目标舰船辐射噪声信号特征相近,识别难度大;2)单类样本无标签信息条件下,只能采用无监督学习方法实现对舰船辐射噪声信号和诱饵信号的检测与识别,对识别带来更大的挑战。以此为背景,提出一种无监督时频信息结合的舰船辐射噪声信号抗诱饵干扰方法。根据信号不同域下的数据结构特性分别设计信号时域和时频域2个自编码器。然后设计3个判别器,得出时间域、时频域以及融合时间域、时频域信息综合分数。在模型训练阶段,根据对抗训练损失函数完成对抗训练,训练集中只包含舰船辐射噪声信号。在测试阶段,模型面对相似的诱饵信号可以直接从模型输出分数,根据分数差异实现端到端的诱饵信号与目标辐射噪声的判别。
本文的创新点主要包括:1)首次提出采用深度学习方法实现舰船辐射噪声信号的抗诱饵信号干扰;2)采用无监督对抗训练策略,可以做到端到端的舰船辐射噪声抗诱饵干扰;3)本文方法可以捕捉舰船辐射噪声信号时域和时频域的联合分布,提高模型的表示学习能力,获得更好的类间分类的表现。
1 问题的定义和提出
本文将抗诱饵干扰问题转化为单类分类问题,与一般的单类分类问题不同,下面详细说明其定义。舰船辐射噪声信号s∈R1×L(L为时域信号长度),诱饵信号b∈R1×L。将它们分为训练集合Dtrain={s1,s2,…,sm}(m为训练集合中的样本个数)和测试集合Dtest={s1,s2,…,sn,b1,b2,…,bn}(n为测试集合中的信号样本个数)。将辐射噪声信号视为正样本,诱饵信号视为负样本。在实验设定中m≫n。模型在训练集合Dtrain上进行训练,然后通过测试集合Dtest进行性能评估。本文提出的模型旨在通过训练集合Dtrain的训练捕捉舰船辐射噪声的分布,经过目标函数训练后实现端到端的舰船辐射噪声信号的单类分类。
2 提出的方法
对抗生成网络是一种典型的深度学习生成范式,目前已经存在众多的研究证明其在数据生成研究中的优异性能[34]。随着研究的不断深入,GAN也被用于其他机器学习任务,例如分类[35-36]、聚类[37-38]等。GAN的基本思想是构建两个神经网络,采用对抗训练策略使双方竞争学习、获取数据中的知识,最终达成任务目标。GAN通常由两个部分组成:生成器和判别器。对于生成器和判别器的网络结构并没有严格的限制,因此GAN是一种非常灵活的深度学习范式。本文方法遵循GAN的基本思想,其主要任务是在构建模型在无监督的条件下,实现对舰船辐射噪声信号的单类分类。为了很好地捕捉到舰船辐射噪声信号的分布,本文针对不同数据格式的舰船辐射噪声信号构建2个生成器。其中一个生成器负责对舰船辐射噪声时域信号编码后重构,另一个生成器负责对舰船辐射噪声时频域信号编码后重构。构建3个判别器,2个分别负责对2个生成器舰船辐射噪声信号的重构表现进行打分,第3个负责对时域、时频域舰船辐射噪声信号提取到的特征进行融合后再打分。本文舰船辐射噪声信号抗诱饵干扰方法深度学习模型结构如图1所示。图1中,st为舰船辐射噪声时域信号,sf为舰船辐射噪声时频域信号,t为舰船辐射噪声时域信号经过时域生成器重构结果,f为为舰船辐射噪声时频域信号经过时频域生成器重构结果,Pt、Ps、Pf分别为3个判别器对时域生成器表现打分结果、时频域信息融合打分结果、时频域生成器表现打分结果。
图1 本文深度学习模型结构示意图
舰船辐射噪声信号s∈R1×L,对其表示学习的过程就是特征提取的过程。本文假定舰船辐射噪声信号时域与时频域形式都存在有助于舰船辐射噪声信号单类分类任务的信息。首先需要对其进行两种变换:1)为了能够方便处理时域信号,对其进行长度为T的分帧,帧重叠为25%,将分帧后的信号堆叠得到st∈R1×E×T,E为帧个数;2)对舰船辐射噪声信号进行短时傅里叶变换后获得时频矩阵,并对其取Log运算和归一化后获得时频矩阵sf∈R1×N×F,N为时频域信号时间,F为时频域信号频率。完成两种变换后的信号分别作为两个生成器的输入。
针对时域信号、时频域信号数据的不同特性,分别设计两个编解码结构的生成器GT和GF,处理时频域、时域信号。舰船辐射噪声的时频矩阵形式为二维数据,模型采用二维卷积层和批归一化层(Conv2d+BatchNorm2d)组成GF的编码器GF_E。GF_E旨在将时频矩阵形式的输入信号从高维数据空间映射到低维潜空间表示GF_E:sf→zf,zf为时频域信号潜空间表示。模型采用二维反卷积层和批归一化层(Trans2d+BatchNorm2d)组成GF的解码器GF_D。GF_D旨在将低维潜空间表示重构回高维数据GF_D:zf→f。GF结构如图2所示。
图2 GF结构示意图
对于一维时域舰船辐射噪声信号,选择采用门控卷积神经网络(Conv2dGLU)构建GT的编码器GT_E。利用门控卷积神经网络可以捕捉到时间序列上下文信息,从而更好地提取时间域信号特征。舰船辐射噪声时域信号本身为一维数据。经过分帧后处理形成二维矩阵形式,便可以组成批次(Batch),方便进行并行计算。同时希望生成器GT关注于一维时域信息。将GT_E的卷积核大小全部设置为(1,k),其中k在不同层有不同的值,这样可以确保GT_E在对st进行映射后只减少时间分辨率GT_E:st→zt,其中zt∈R1×E×T′,T′为经过GT_E映射后时间分辨率尺度大小。采用一维像素重组(Pixel Shuffle)构建GT_D,将压缩的时间分辨重构为原始尺寸GT_D:zt→t。像素重组常用于图像领域中超分辨率重建研究中[39-40]。这里将其用于恢复信号的时间分辨率,GT结构如图3所示。
图3 GT结构示意图
模型包含有3个判别器DT、DF、DS。其中,DT联合生成器GT的输入st和重构结果f对舰船辐射噪声时域信号重构效果进行打分;DF联合GF的输入sf和重构结果f对舰船辐射噪声时频域信号重构效果进行打分;DT、DF都是由带有残差连接的卷积层和线性层组成。两者的区别仅在卷积核大小等这些超参数的设置不同。特别地,DT的超参数设置类似GT_E,只在时间分辨率上进行特征提取;DF、DS最后一层卷积层的输出在连接后作为DS的输入,DS只由线性层和非线性激活层组成;DT、DF、DS输出都会经过Sigmoid非线性函数后获得分数Pt、Pf、Ps。
本文方法采用无监督的对抗训练策略,在训练阶段只采用舰船辐射噪声信号。生成器的主要任务是对舰船辐射噪声时域、时频域信号降采样后的再重构。对于模型中的判别器,其主要任务是对生成器的表现进行打分。根据生成器和判别器的任务,可以设计模型的目标函数,该目标函数受到BigBiGAN的启发[41]。目标函数如式(1)~式(9)所示。
Pf=DT(st)
(1)
Pf=DF(sf)
(2)
Ps=DS(DT(st),DF(sf))
(3)
GLosscl=sign(Pt+Pf+Ps)
(4)
GLosss=Est~Pst,sf~Psf(GLosscl)+E(GLosscl)
(5)
GLossc=‖st-t‖1+‖sf-f‖1
(6)
GLoss=GLosss+GLossc
(7)
DLosscl=H(sign(Pt))+H(sign(Pf))+H(sign(Ps))
(8)
DLoss=Est~Pst,sf~Psf(DLosscl)+E(DLosscl)
(9)
式中:
(10)
H(x)=max(0,1-x)
(11)
模型在训练过程中,通过最小化DLoss对DT、DF、DS参数进行优化,通过最小化GLoss对GT和GF参数进行优化。DLoss期望3个判别器可以给原始信号和经过生成器生成的重建信号的分数结果尽量差别大,GLoss则确保尽可能将信号重建完整以混淆判别器的判断。通过对抗竞争优化训练策略,最终促使模型捕捉到舰船辐射噪声信号时域与时频域的联合分布。当模型能够捕捉到目标舰船辐射噪声信号的分布后,在测试阶段模型将能够对目标舰船辐射噪声信号打出高分数,面对不符合目标辐射噪声信号分布的诱饵信号则打出低分数。由于分数存在差异,可以设定阈值完成对诱饵信号和目标舰船辐射噪声信号的识别。
3 实验与结果分析
3.1 实验数据
实验所用舰船辐射噪声信号采集于中国南海,时间为1.5 h,期间有短时的远距离船只通过。诱饵信号数据制作方法是对采集到的舰船辐射噪声数据,使用UW350宽带低频声信号换能器发射,然后再次经过沉底声信号采集系统进行采集。声源距离信号发射位置2 km。沉底声信号采集系统采集到的信号即为诱饵信号数据。本文对采集到的数据进行10 s长度分帧,将舰船辐射噪声部分信号作为训练集后,一共有1 790条数据。将诱饵信号和舰船辐射噪声信号作为测试集,一共有1 078条数据。数据采样频率为1 kHz。为了能够更好地说明数据样本,将部分样本进行可视化,可视化后的结果如图4 所示。通过可视化结果可以发现,目标舰船辐射噪声信号和诱饵信号无论在时域和时频域形式下均没有明显的差别。
图4 部分样本时域时频域可视化
3.2 实验设定
本文对原始信号数据采取两种变换,第1种为短时傅里叶变换,短时傅里叶变换参数帧长为512,重叠为75%,获得时频图后将其重构为(256,256)的尺寸。第2种为对原始信号进行分帧,帧长为512,重叠为25%。生成器GT和GF均为10层的编解码器(Encoder-Decoder)结构。GT中编码器5层的卷积核大小设置为(1, 22), (1, 18), (1, 10), (1, 4), (1, 4);GF中编码器5层的卷积核大小设置均为(4,4)。生成器和判别器在训练过程中的优化器均采用AdamW优化算法,学习步长为0.000 01。 共计设定50个Epoch,在连续10个Epoch没有测试性能提升后停止训练。所有实验和对比的深度学习方法均采用PyTorch部署,采用2块英伟达2080TI进行训练。所有实验均进行多次仿真,取其中最优结果作为实验结果展示。
3.3 实验结果
本文方法设计了2个生成器,分别处理舰船辐射噪声信号的时域、时频域信息。如第2节所述,当经过对抗训练后,2个生成器和融合不同域信息的判别器使模型能更有效地捕捉到舰船辐射噪声信号的分布,以可以提升模型的性能,因此设计了消融实验验证上述假设。本文提出的原始模型由2个生成器GT和GF以及3个判别器DT、DF、DS组成。实验设定两个对照实验:模型2只采用生成器GT和判别器DT,模型3只采用生成器GF和判别器DF。模型1即为本文提出的方法。采用AUC(Area Under the Curve)作为评估指标,实验结果如表1所示。由表1 可以发现,模型1取得最佳的效果,实验结果表明融合了时域和时频域信息后可以有效提高模型的性能。融合时频域信息后相较于仅采用时域信号或者时频域信号提升了5%~8%。
表1 消融实验结果
为了进一步证明时域、时频域信息融合会使模型获得更好的性能,分别将3个模型的判别器的倒数第2层的输出作为特征向量,做T-分布随机邻域嵌入(T-Distributed Stochastic Neighbor Embedding,T-SNE)可视化,通过可视化方式验证模型对数据表示学习的性能。可视化结果如图5所示。需要特别说明的是,为了使图像展示结果清晰,在可视化过程中删除了极少部分的异常值,整体上不影响结果。通过观察可视化结果可以发现,模型1特征在高维空间上呈现了类间距离更大、类内距离更小的分布,表现出了更优异的表示学习能力。模型2特征在高维空间上呈现出了类间可分但是类内距离更为扩散的现象。模型3在高维空间上呈现了更聚集的类内距离但是类间显示为不可分的效果。因此可以证明,在联合舰船辐射噪声信号时域和时频域信息后,模型获得了更优异的性能表现,从深度学习模型中特征可视化的角度再次验证了时域、时频域信息融合的有效性。
图5 消融实验T-SNE可视化
根据3个模型对测试集数据的输出分数画出柱状图以显示3个模型分数的分布情况,结果如图6所示。通过柱状图可以发现模型1输出的分数呈现了更加可分的表现。对比图5中的结果可以发现,每个模型输出分布的柱状图和T-SNE可视化的结果是相关的,在特征T-SNE可视化的图像中获得越好的分离性能,最后的分数分布会呈现越好的分离趋势,从而再次验证了上述假设。
图6 消融实验模型输出分布
选择7种在单类分类任务中表现优秀的(State-of-Art)基于深度学习方法与本文的方法进行对比。其中ALAD、GANOMALY、SKIPGAN是以GAN为框架的方法,ANIGD、DASVDD、DeepSVDD、COCA为采用其他深度学习范式的方法。其中DeepSVDD是典型单类分类研究中的标准模型(Baseline Model)。仍然采用AUC作为评价指标,实验结果如表2所示。表2的结果显示,本文方法获得更高的AUC值。实验结果表明本文针对舰船辐射噪声信号抗诱饵信号深度学习方法的改进和提出是可行的。
表2 对比实验结果
4 讨论
针对舰船辐射噪声信号的抗诱饵干扰目前在公开的成果中仍为一个空白。本文将抗诱饵问题转化为单类分类问题,采用深度学习范式尝试性提出了解决方案。本文方法融合舰船辐射噪声信号时域、时频域形式的信息,通过实验发现该方法可以有效提高模型对舰船辐射噪声信号的表示学习能力,实现无监督条件下端到端的舰船辐射噪声信号单类分类任务。本文的实验采用真实舰船辐射噪声信号,模拟产生诱饵信号并进行了实地采集。通过实验验证了分类思想的抗诱饵干扰方法是可行的。当然本文方法也存在着一定的局限性,假设场景单一、没有考虑复杂场景下的问题。例如在多类舰船场景中的特定类别舰船诱饵干扰场景、诱饵信号和目标舰船辐射噪声信号叠加场景。
5 结论
本文首次利用深度学习方法对舰船辐射信号抗诱饵干扰问题进行了研究。通过分析诱饵信号干扰工作原理设定抗诱饵干扰场景,将抗诱饵问题转化为单类分类问题。基于此提出一种无监督时频信息结合的舰船辐射噪声信号抗诱饵干扰方法。经过真实采集舰船辐射噪声信号和诱饵信号进行了消融实验和对比实验,得到较好的结果。得出主要结论如下:
1)采用基于GAN框架的对抗学习策略,针对舰船辐射噪声信号抗诱饵干扰,可以实现端到端的识别与检测。
2)针对舰船辐射噪声信号,通过深度学习模型捕捉其时域、时频域联合分布,可以增强深度学习模型的表示学习能力,获得更好的类间分离性能。
3)采用深度学习范式的分类思想,针对舰船辐射噪声信号抗诱饵干扰问题是可行的。
后续工作将进一步开展在多舰船场景下抗诱饵干扰的研究。