基于卷积神经网络联合多域特征提取的干扰识别算法
2022-06-23王鹏宇程郁凡尚高阳
王鹏宇 程郁凡 徐 昊 尚高阳
(电子科技大学通信抗干扰技术国家级重点实验室,四川成都 611731)
1 引言
在愈发复杂的电磁环境中,大量的自然干扰和人为蓄意干扰正在严重威胁无线通信系统的可靠性和传输效率[1]。现阶段,智能抗干扰通信技术正在成为了新一代抗干扰通信系统的重要研究方向。具备感知能力的通信设备通过对干扰威胁的快速检测和分类识别[2],为系统生成最佳的抗干扰方式提供决策依据[3-4]。
本文重点研究典型压制式干扰的识别技术。典型的干扰识别算法由信号预处理、干扰特征提取和干扰分类三个模块构成。首先,信号预处理过程用于对接收信号进行格式变换和数据增强等,目的是将接收信号中的干扰成分突显出来并抑制其他非目标信号,同时将输入信号转换为易于特征提取的数据形式。特征提取模块将从预处理后的信号中抽取通用性的干扰特征,根据特征提取方法的不同,现有的干扰分类算法可被划分为基于人工特征提取(Manual Feature Extraction,MFE)的干扰分类算法[5-7]和基于卷积神经网络自动特征提取(Auto⁃matic Feature Extraction-based Convolutional Neural Network,AFE-CNN)的干扰分类算法[8-12],其中,人工提取的干扰特征主要指由具备专家知识的研究人员设计的、具有明确物理含义的干扰特征参数,而自动干扰特征主要指通过卷积神经网络(Convo⁃lutional Neural Network,CNN)[13]表示性学习、在网络卷积池化部分获得的、仅具有数值区分意义的干扰特征。最后,干扰分类模块利用分类算法综合干扰特征,确定接收信号中的干扰类型。
基于MFE 的干扰识别算法首先在多个映射域内提取人工设计的多种干扰特征参数,再利用分类算法综合干扰特征判断干扰类型。人工干扰特征的提取方法主要包含映射、观察和压缩三个过程:首先将采集的时域信号变换至所需映射域内(或保留在原域),然后在新的映射域内观察干扰信号以发掘不同干扰的特征差异,最后通过数学工具捕捉干扰的形状特点或者统计特性,将信号压缩为干扰特征,已有的人工干扰特征可划分至时域、频域、时频域和变换域。目前,基于MFE 的干扰识别明确定义的干扰特征能够准确反映特定干扰信号的物理特性,这使得分类器的结构具有较好的透明性和可读性。然而,人工干扰特征丢失了大量的有效信息,提取能力和抗噪声能力并不理想,且需要专家知识制作特征工程。
随着深度学习的迅速发展,深度学习逐渐在各个领域展现出了强大的潜力[14-15]。基于AFE-CNN的干扰识别算法进一步将特征提取的工作由神经网络自动学习来实现。目前,长短期记忆网络(Long Short-Term Memory,LSTM)[16]以及CNN 与LSTM 的级联也开始被用于构建更复杂的特征表示方法,除了使用经典的全连接层(Fully Connected,FC)进行特征综合外,全局池化层(Global Pooling layer,GP)和循环神经网络(Recurrent Neural Net⁃work,RNN)[17]也逐渐引入到网络中来。相比于人工提取的干扰特征,自动特征的表示能力更强,更易于解决复杂的干扰分类问题[18],同时AFE-CNN方法也显著降低了对信号处理专家知识的依赖程度,端到端的网络训练方法使得干扰分类器的构建更加简易且快捷。
CNN 自动特征提取方法针对通信干扰的识别问题时,选择何种数据对象类型,以及如何将CNN表示性学习同传统信号处理方法相结合,以便进一步增强干扰特征提取的效果,都有待进一步研究。为此,本文提出一种基于卷积神经网络联合多域特征提取(Convolutional Neural Network-based Joint Multi-Domain Feature Extraction,CNN-JMDFE)的干扰识别算法,利用CNN 同时从增强后的时频图像与频域序列中提取时频域和频域的干扰特征,以便综合两种数据对象的优势。
本文提出的方法支持识别对于缺乏明显时频规律的动态干扰,如随机梳状干扰,在传统方法中,这些随机动态的干扰识别准确率难以保证。提出的CNN-JMDFE 不仅具有CNN 强大提取能力,还为网络构建了多域特征的输入,使得提出的方法在识别参数随机动态变化的干扰方面更加有效。本文的方法适用于多种通信系统,如跳频系统等,即进行识别和发现干扰后,可通过频率自适应技术规避这些受干扰的频率。同时提出的技术也适用于宽带通信系统与干扰信号共享频带的情况,即通过识别干扰信号的类型,为其他抗干扰技术提供先验信息,如干扰对消,干扰抑制和抗干扰决策等技术,为宽带通信系统与干扰信号频谱重叠时仍能不受干扰的影响达到可靠通信。在通信系统与干扰信号共享频带的情况下要实现可靠通信,干扰识别的准确率和精度尤为重要,采取CNN-JMDFE 人工智能算法以更高的识别性能完成对干扰的识别,这对后续的其他抗干扰处理手段起到关键作用,如干扰对消技术就是根据提供的精准识别的干扰类型为依据进行干扰参数估计从而实现干扰抵消的。干扰识别是干扰消除,干扰抑制和抗干扰决策等抗干扰技术的前提和依据,准确识别各类干扰信号成为抗干扰中的重要环节。
本文内容安排如下:第2 节给出了CNN-JMDFE模型和信号模型;第3 节阐述了提出的CNN-JMDFE干扰识别算法原理;第4节仿真了CNN-JMDFE干扰识别算法的性能,并同单一数据对象下AFE-CNN干扰识别算法和MFE-DNN 干扰识别算法的性能进行了对比;最后,总结全文。
2 算法模型
2.1 干扰分类器模型
典型的干扰识别算法由信号预处理、干扰特征提取和干扰分类三个模块构成,算法的结构模型如图1所示。但这些传统的干扰识别算法没有考虑利用不同的输入对象类型之间的优势来提升干扰识别性能。
CNN-JMDFE 干扰识别模型如图2 所示,整个分类器由信号预处理、CNN特征提取和DNN干扰分类三部分构成。首先在信号预处理阶段,对输入的基带信号分别进行时频分析和功率谱估计,将一维的时域序列(Time Sequence,TS)转换为二维的时频图像(Time-Frequency Image,TFI)和一维的频域序列(Frequency Sequence,FS);然后,采用两个独立的CNN 分别对TFI 和FS 进行时频域和频域的特征提取;最后,利用DNN综合两种干扰特征,确定接收信号中的干扰类型。
2.2 信号模型
设干扰分类器输入的基带信号为r[n],在加性高斯白噪声(Additive White Gaussian Noise,AWGN)信道下,r[n]中通常包含通信信号s[n]、干扰信号j[n]和噪声v[n]三部分,可表示为:
对于干扰信号j[n],本文研究的典型压制类通信干扰包括以下5大类、共14个干扰样式:
(1)瞄准式窄带干扰(Aiming Narrow Band Jam⁃ming,ANBJ),包括:单频连续波(Continuous Wave,CW)干扰、模拟调制类(AM、NAM)、数字调制类(BPSK、QPSK、BFSK)和窄带噪声干扰(Narrow Band Noise Jamming,NBNJ)等;
(2)部分频带噪声干扰(Partial Band Noise Jam⁃ming,PBNJ);
(3)随机梳状干扰(Random Comb Jamming,RCJ),包括:多音干扰(Multi-Tone Jamming,MTJ)和梳状谱噪声干扰(Comb Spectrum Noise Jamming,CSNJ);
(4)周期脉冲噪声干扰(Periodic Pulse Noise Jamming,PPNJ);
(5)调频类干扰(Frequency Modulation Jam⁃ming,FMJ)包括:线性调频(Linear Frequency Modu⁃lation,LFM)干扰、噪声调频(Noise Frequency Modu⁃lation,NFM)和正弦调频(Sinusoid Frequency Modu⁃lation,SFM)干扰等。
3 算法原理
本节将阐述CNN-JMDFE 干扰识别算法的原理,重点说明时频图像(TFI)和频域序列(FS)的获取方法,以及负责特征提取和特征综合的CNN 网络结构。
3.1 时频图像的获取
由于TFI包含了有关接收信号的时间变化信息与频率变化信息,因此可有效反映信号的频率成分随时间的变化情况,但由于时频图像(矩阵)的数据量很大,传统的人工特征难以有效提取丰富的时频分布信息,特别是将二维时频图直接压缩为一个干扰特征参数的方法,虽然特征参数易于理解,但代价是损失了大量的有效信息,干扰的时频分布特定未能得到充分利用。由于CNN 是为解决图像处理的问题而被提出的,因此2D-CNN 对二维的图像数据具有天然的贴合度。为了获得接收信号的时频图像,首先需要对接收信号进行时频分析,再通过时频图像的增强技术突显干扰成分并抑制噪声。
3.1.1 时频分析工具
为了捕捉信号时间随频率变化的特性,本文选择基于短时傅里叶变换(Short-time Fourier Trans⁃form,STFT)的方法来提取干扰信号的时频分布谱图方法,谱图SP[m,k]的计算方法可表示为:
其中,m和k分别表示时间和频率的离散参数,NSTFT为STFT的FFT点数,w[n]为窗函数,w*[n]为窗函数的共轭表示。LSTFT为计算STFT 过程中r[n]的时域分段数。
根据时频不确定性原理,时频分析的时间和频率分辨率在窗函数面积一定的情况下是相互约束的,二者无法同时达到最高精度。考虑到窄带干扰对频率分辨率要求较高,调频类干扰对时间分辨率要求较高,因此在设定窗长时需要兼顾各种干扰的分析需求。此外,相邻窗之间需要重叠一定比例,以便调频类干扰的时频曲线较为平滑,不会出现明显失真。综合以上因素,本文确定了时频分析的主要参数:NSTFT为256 点,w[n]为矩形窗,相邻窗之间的重叠比例调整至时频矩阵为正方形,以避免后续调整图像比例而造成图像失真。
3.1.2 时频图像增强
通过谱图分析,接收信号的一维时序序列被转化为256×256 的时频图像(TFI),参照CNN 经典的输入尺寸,本文采用双三次插值方法(输出像素值是最近4×4 邻点像素的加权平均值)将时频矩阵的尺寸转换为224×224,图3 给出了四种典型干扰的TFI。
考虑到谱图的能量聚集性有限,初步获得的TFI 容易受到噪声的影响,因此在获得TFI 后,需要进一步设计预处理方法来突出TFI中干扰信号。常见的TFI增强方法例如均值滤波、加权滤波、最大值滤波等,本文结合不同通信干扰TFI的特点,设计了一种适用于多种干扰类型的TFI 增强方法,具体步骤如下:
(1)沿时间轴方向均值滤波,卷积核设定为横向2×3 的矩形,以便在平滑噪声点的同时不明显降低时频分辨率;
(2)1.5 次方幂运算,用于时频图像的增强对比度,提高伽马值;
(3)沿时间轴方向均值滤波,卷积核设定为横向2×5 的矩形,以便利用干扰信号频率成分随时间变化的连续性,进一步抑制噪声点、增强信号。
图4 以干噪比(Jamming-to-Noise Ratio,JNR)为-5 dB 的MTJ为例,以便表明干扰信号的TFI经各步骤处理后的效果。
3.2 频域序列的获取
频谱分析是经典的信号分析方法,频谱中能反应出信号的诸多特性。本文通过频域的能量分布信息来增强时频图像的能量聚集效果,因此,我们选择功率谱的幅度作为频域序列(FS),用于提取频域特征。
常用的功率谱估计方法可分为经典谱估计和基于参数模型的现代谱估计。为了兼顾谱估计的频域分析精度和噪声平滑效果,本文采用了基于Hamming 窗的Welch 经典谱估计算法[19],估计接收信号的功率谱密度。基于Hamming 窗的Welch 法来估计接收信号的功率谱密度表示为P[k],如式(3)所示:
其中,L为Welch 谱估计过程中r[n]的时域分段数,每段长度NFFT为4096 点,用于保证频域分析精度。w[n]为窗函数,相邻窗重叠50%以便进一步平滑噪声,U为窗函数的归一化因子,见式(4),用于保证功率谱的估计结果满足无偏性。
将P[k]转化为dB 值放大干扰信号功率谱的变化细节,非线性映射后的FS为LP[k],可表示为:
其中,Pmin为P[k]的最小值,ε为除法的保护量,本文设定为10-6。
3.3 网络结构设计
前节中,我们详细阐述了TFI 和FS 的获取过程和预处理方法,接下来,我们将关注CNN 网络结构的设计,以便网络能够有效从两种数据对象中提取干扰特征,综合后识别出干扰类型。
CNN-JMDFE 干扰识别的网络结构如图5 所示,上支路通过二维卷积池化层的堆叠,用于从二维的TFI 中提取时频域特征;下支路通过一维卷积池化层的堆叠,用于从一维的FS 中提取频域特征;两条支路提取的特征向量经首尾拼接,共同进入FC 层进行特征综合,最终识别出干扰类型。
本文的网络结构设计总体上参考了ResNet-34[13]并做了部分定制化的改进。首先,图5 中的卷积块(ConvBlock)由卷积层、批归一化层和非线性激活层Leaky-ReLU三部分构成。然后,各支路根据输入数据尺寸的不同适当调整残差块(ResBlock)的数目,图6 给出了2D 残差块的结构,残差块的处理过程可表示为:
其中,F(⋅)表示主要支路卷积池化的处理过程,H(⋅)表示残差支路直接映射的处理过程,H(⋅)具体为直连还是1×1 的卷积运算,取决于当前残差块是否需要增加特征图的数目。此外,本文在两条支路的输出位置处增加全局平均池化(Global Average Pool⁃ing,GAP)层,将输出的每个特征图或特征序列用其平均值来代表,在降低全连接网络规模的同时,增强网络的稳定性。最后,在全连接部分同时输入两种特征向量,以便网络能够习得两种特征的关联,综合利用二者的优势给出最佳的干扰分类结果。本文的CNN-JMDFE 采用了端到端的训练方式,损失函数采用了交叉熵。
4 仿真分析
本节将对CNN-JMDFE 干扰分类算法的性能进行仿真分析。首先仿真本文算法对单干扰的分类性能,并与单一数据对象下的AFE-CNN算法和基于人工特征提取深度神经网络(Manual Feature Extraction-based Deep Neural Network,MFE-DNN)的算法[18]进行性能对比;并验证了在对复合干扰的分类性能。仿真中,干扰的分析带宽为50 MHz,采样频率为61.44 MHz,接收信号的采样点数为12288。本文提出的方法支持识别对于缺乏明显时频规律的参数随机变化的动态干扰,如随机梳状干扰,在传统方法中,这些随机动态的干扰识别准确率难以保证,在进行实验之前,首先说明数据集中的随机动态的干扰信号构造方法和网络的训练参数。
4.1 数据集与训练参数
单干扰的干扰参数如表1所示,其中,干扰带宽因子是干扰带宽与分析带宽的比值,干扰中心频率在保证干扰带宽不超出分析带宽的情况下随机选取,JNR 在[-30,30]dB 内间隔2 dB 取值。本文的数据集都为随机干扰类型,它们的中心频率,带宽,周期,占空比,音调个数等参数都为随机产生的,这增加了识别的难度。例如多音干扰,它的中心频率、带宽和音调个数都为随机的,带宽因子服从[0.5,1]之间均匀分布,音调产生的个数在5 到20之间随机产生,且音调的频点间隔也为随机的。本文设定每种干扰样式在每个JNR 下随机生成500个样本,并在每个JNR 下将数据集按照4:1 的比例划分为训练数据集和测试数据集。
另外本文研究的复合干扰是将已有的5种大类单干扰进行两两组合得到的,组合后可得到10种复合干扰样式:ANBJ_PPNJ、PBNJ_PPNJ、RCJ_PPNJ、
FMJ_PPNJ、ANBJ_PBNJ、ANBJ_RCJ、ANBJ_FMJ、PBNJ_RCJ、PBNJ_FMJ 和RCJ_FMJ。其中,大类单干扰样式ANBJ、RCJ 和FMJ 在复合时,从各自对应的干扰样式子集中随机选择一种作为实际生成的干扰类型,复合干扰中两个单干扰的干扰参数同表1。此外,为了产生的复合干扰的与实际场景中类似,单干扰分量功率的相对大小设定在[0,6]dB的范围内波动。
表1 单干扰的随机干扰参数Tab.1 Jamming parameters of single jamming
网络的训练参数如表2所示,网络采用Adam算法更新参数,训练采用早停和退火策略。我们给出了干扰训练集中各个干扰的JNR 的范围,如表3所示。
表2 网络的训练参数Tab.2 Training parameters of the network
表3 TFI和FS训练数据集的有效JNR范围Tab.3 Effective JNR range of TFI and FS training data set
4.2 单干扰分类性能
首先仿真CNN-JMDFE 算法对单干扰的识别性能,网络训练完成后,用JNR 在[-30,30]dB范围内的测试数据评估网络在不同JNR 下的分类准确率,如图7 所示。本文算法对无干扰的分类准确率为99.65%。从仿真结果可以看到,若定义分类准确率达到98%以上为准确分类,在JNR≥-2 dB 时可准确分类全部14种干扰样式,且音调类和窄带类干扰普遍能在JNR 低于-10 dB 时被准确分类,由此可见本文提出的CNN-JMDFE 干扰识别算法兼顾了多种干扰的时频分布特性,对多种类型的通信干扰均具有良好的分类效果。
为了进一步说明本文算法采用联合多域自动特征提取的性能增益,接下来提出的算法与对应的单一数据对象的AFE-CNN 算法进行性能对比。其中,TFI-CNN 算法仅输入TFI,FS-CNN 算法仅输入FS;TFI-CNN 和FS-CNN 的网络结构仅保留CNNJMDFE 网络的单一支路,且GAP 提取的干扰特征不再拼接,直接送入FC 层识别干扰类型。此外,为了说明本文选择TFI 和FS 作为数据对象的合理性,我们还设计了与FS-CNN 相同输入长度的TSCNN 识别作为对照。TS-CNN 算法的网络结构有三个独立的CNN 分支,网络的输入为4096 点功率归一化后的接收信号TS,TS 的实部、虚部和幅度分别通过三个独立的卷积支路中提取时域特征,各支路的网络结构与CNN-JMDFE 中处理FS 的支路相同。
采用相同的数据集完成分类器的训练后,本文的CNN-JMDFE 算法和仅采用单一数据对象的三种AFE-CNN 算法的平均分类准确率如图8 所示。从图中可以看到,当JNR<10 dB 时,CNN-JMDFE 算法和TFI-CNN 和FS-CNN 算法平均分类准确均显著优于TS-CNN。因为本文的通信干扰在频域具有鲜明的频谱特点和能量聚集度而时域上却没有这样的特性,因此采用TS 直接进行处理并不是合理的选择。
从图8可以看到,无论JNR 如何变化,本文算法联合TFI+FS 进行多域特征提取的分类性能始终大于等于单独输入TFI 或FS 的性能。具体而言:当JNR<-14 dB 时,本文算法的平均分类准确率与FS-CNN 很接近,此时两种干扰特征中起主要作用的是FS提供的频域干扰特征。当JNR≥-4 dB 时,本文算法的性能开始与两种数据对象中性能最好的TFI-CNN 基本重合,此时两种干扰特征中起主要作用的是TFI 提供的时频域干扰特征。当-14 dB≤JNR<-4 dB 时,FS 的局限性使得FS-CNN 的性能受到限制,而TFI 由于能量聚集度受限使得TFI-CNN的分类准确率也不稳定,相比之下,本文算法的性能明显优于这两种单一输入算法的任何一种,这充分说明了本文的CNN-JMDFE 网络不仅充分学习了TFI 和FS 各自的特点,还学习了两种数据之间的关联,利用FS 频域能量集中的优势弥补了TFI 的不足。本文的CNN-JMDFE 算法能够同时利用TFI 和FS这两种数据对象各自的特性和优势,准确预测出干扰类型,从TFI 和FS 中联合提取干扰特征取得更优的识别结果。频域序列在JNR值较低时,如JNR=-20 dB时频域序列方法识别精度优于时频图23%,而在JNR较高时,如JNR=-4 dB时,时频图识别精度优于频域序列方法12%。本文正是结合了二者的优势,在低干噪比下依靠频域序列方法提升了识别精度,在高干噪比下依靠时频图方法提升了识别精度,本文选取的JNR 范围较大为-30 dB 到30 dB,来体现出这些实验结果。
最后,我们将对比本文算法和传统MFE-DNN算法的识别性能,以说明CNN 自动特征提取较传统的人工特征提取的性能优势。MFE-DNN 算法的干扰特征库、分类器网络结构和训练数据集JNR 范围与文献[18]相同,训练数据集以本文为准以便进行对比。图9 给出了两种算法的平均分类准确率,从图中可以看到,采用联合多域自动特征提取的CNN-JMDFE 算法显著提升了JNR<-4 dB 时的干扰识别准确率。这是由于两方面原因,一方面自动特征提取方法较人工特征方法具有更好的抗噪效果,另一方面提升的性能则来源于TFI 和FS 的预处理过程,数据对象在增强后提升了干扰成分的显著性。
4.3 复合干扰分类性能
上一节中我们考察了单干扰场景下的分类性能,本节将进一步考察本文算法对复合干扰的分类性能。图10 给出了CNN-JMDFE 算法对10 种复合干扰的分类准确率,从仿真结果可以看到,当JNR达到0 dB 时,本文算法能够准确识别10 种复合干扰,干扰分类准确率达到98%以上。在JNR≥0 dB后,虽 然ANBJ+PPNJ、RCJ+PPNJ、PBNJ+RCJ 和PBNJ+FMJ 这四类干扰的分类准确率始终大于95%。可见,本文提出的CNN-JMDFE算法对组合情况更加复杂的复合干扰依然有良好的识别效果,且对复合干扰中各分量的频率参数、功率参数波动范围均具有良好的泛化性能。
5 结论
针对无线通信系统中典型压制式识别的分类问题,本文提出了CNN-JMDFE 的干扰识别算法,通过CNN 同时对增强后的TFI与FS提取干扰特征,有效利用了两种数据对象的优势,增强了干扰识别的性能。仿真结果表明,针对在识别难度较大缺乏明显时频规律的动态和参数随机的干扰,CNN-JMDFE算法明显优于传统算法。此外,对于复合干扰,本文算法同样可取得良好的识别效果。另外,本文提出的方法可以通过进一步利用网络剪枝等技术进一步优化来降低算法的复杂度,使得提出的算法在计算资源有限的场景下可以实现部署。