基于元学习的畸变雷达电磁信号识别
2022-04-21金炜东黄颖坤朱劼昊
颜 康 金炜东* 黄颖坤 葛 鹏 朱劼昊
①(西南交通大学电气工程学院 成都 610097)
②(电子信息控制重点实验室 成都 610036)
1 引言
雷达电磁波传播受地形、海况、大气、气象等因素影响,存在折射、统射、衰减、多径、波导等典型物理现象。这些物理现象是复杂电磁环境的一个重要组成部分,它将导致接收机接受信号相比于发射信号产生畸变,进而影响信号参数的正确估计[1]。几乎所有频段雷达的电磁波传播都受到各种雷达环境不同程度的影响,雷达环境对雷达电磁波传播的影响是多方面的。其中,多径效应的产生原因是雷达电磁波在照射目标时,由于地海面反射,电磁波的直达波和反射波或多条传播路径回波同时达到接收点而产生的多路径传播干涉衰落效应。这种多路径现象可产生信号交调、误码和虚假目标[2],造成接收信号畸形,会严重影响雷达侦察装备的探测性能。当前国内外学者主要针对雷达辐射源信号进行识别,这些方法或将雷达信号进行实数序列处理[3–8],或将其进行符号化处理后进行分析[9],而对于畸变雷达信号识别的研究较少。文献[1]依据畸变信号的数学模型进行了半实物仿真并分析其对雷达侦察设备的影响。文献[10]研究了多径干涉效应下雷达电波到达角的变化并给出估算方法。因此,探索行之有效的识别畸变雷达信号技术,对于雷达系统的精确感知具有重要现实意义。
当前,深度学习已经在许多方面取得了巨大成功[11–13],诸如计算机视觉、语音识别、自然语言处理等。对于雷达信号的处理,深度学习也发挥了重要的作用。文献[4,14]利用自动编码器(Stacked Auto-Encoder, SAE)对雷达辐射源信号进行特征提取并自动识别;文献[15]基于深度限制波尔兹曼机对雷达辐射源信号进行识别;文献[16]首先将雷达辐射源进行时频变换,然后利用卷积神经网络(Convolutional Neural Network, CNN)对其进行识别。然而,以上研究都需要大量的有标注的样本,而实际应用中,真实的雷达信号通常都较难获得,这成为限制深度学习模型的重要问题。
小样本学习(Few-shot learning) 是元学习(Meta-learning) 在监督学习领域的应用[17]。元学习又称为学习去学习(Learning to learn)。人类具有通过从极少量样本中快速学习的能力。基于这样的启发,元学习通过学习一定类别的数据后,取得一个用于预测的数学模型,对于新的数据,只需要极少量的样本就能快速学习。在图像领域,小样本学习已经取得了很大的进展[18–20]。Finn等人[21]提出的模型无关元学习(Model-Agnostic Meta-Learning,MAML)是一种与任何梯度下降训练的模型兼容的算法,该算法寻找一个模型合适的初始值,使得该模型在新任务的少量训练数据上进行快速学习,在小样本学习中取得了良好的性能。然而,小样本学习在雷达信号处理领域的研究还比较少。
针对雷达电磁波畸变信号样本稀缺的问题,本文提出一种采用元学习的残差网络的畸变电磁信号识别方法,构建了一个深度残差网络,利用MAML算法,用正常的雷达电磁波信号训练元学习器,对于畸变电磁信号,应用已经得到的元学习器,可以在仅有少量样本的情况下对模型进行精调(Finetune),实现多种畸变电磁信号的识别。
2 模型无关元学习
元学习是一种利用以往的知识经验来指导新任务的学习。模型需要结合之前的经验,然后根据当前新任务的少量样本进行学习。少样本学习通常面临在新数据上易发生过拟合的难题[22]。MAML算法很好地解决了这个问题。该算法与模型无关,旨在找出对任务的变化敏感度的模型参数,当参数微小变化时对模型产生较大的改善。算法流程如表1。
表1 算法MAML流程
元学习通常解决少样本分类中N-类别、K-样本(N-way K-shot)学习问题。MAML算法的目的是模型能够适应任务p(T)的分布。在元训练阶段,使用的数据集称为元训练集(Meta-train set),把该数据集分成若干个任务p(T),每个任务中的样本分为支撑集(Support-set)和查询集(Query-set),其中支撑集中的样本数量为N×K个。从若干任务p(T)中随机抽取任务Ti,每个任务用支撑集样本进行训练,训练样本得到损失为LTi;然后利用任务Ti中查询集样本做测试,根据测试样本中的误差来更新模型f的参数。所以,测试样本获得的误差是元训练阶段的训练误差。经过上述过程,算法很好地学习到p(T)中所有任务的内部特征,在新任务上基于梯度下降法对模型进行微调,当参数微小变化时对任务Ti ∼p(T)产生较大的改善,且不易发生过拟合。
该算法对模型的形式没有限制,假设模型由某个参数向量θ参数化,并且损失函数相对于θ足够平滑,这样可以使用梯度下降法进行学习。假设模型fθ由参数向量θ表示。对于新任务Ti,使用梯度下降法将模型的参数θ更新为θ′。这一过程可以使用一个或多个任务Ti利用梯度下降来更新参数向量。对于一次的梯度更新如式(1)
其中,β是元步长的数值,为超参数。
从以上步骤可以看出,算法有两次梯度更新的过程,式(3)计算出的梯度是真正用于更新模型的参数。
3 基于元学习的卷积神经网络电磁畸变信号识别
本文基于MAML的算法,提出一种模型无关元学习的残差网络(Model-Agnostic Meta-Learning Residual convolutional neural Network, MAMLResNet)来实现畸变电磁信号识别。该算法的结构图如图1所示。
图1 基于模型无关元学习的残差网络结构图
算法的输入是将时域信号利用短时傅里叶变换(Short Time Fourier Transform, STFT)获得信号的时频图像,雷达信号的时频域包含了信号的全部有效信息,由此获得的重构信号从时间和频率两个维度描述信号,不同类型的信号具有唯一的时频表示。图2为5种畸变雷达信号线性调频(Linear Frequency Modulation, LFM)、非线性调频(NonLinear Frequency Modulation, NLFM)、二相编码(Binary Phase Shift Keying, BPSK)、四相编码(Quadrature Phase Shift Keying, QPSK)和Costas编码的时频图像。
图2 5种畸变雷达信号时频图像
本文使用残差网络(ResNet)作为时频图像的特征提取与识别。残差网络可以有效地应对深层网络训练导致的梯度爆炸或梯度弥散[13]。残差学习模块如图3所示。
图3 残差模块
该网络不是学习x到H(x)的映射,而是学习两者之间的差别,即残差(residual)。为了计算H(x),将残差直接加到输入上。假设残差是F(x)=H(x)−x,网络将学习F(x)+x,而不是直接学习H(x),在实际中前者更容易学习。
本文采用残差网络作为算法的模型,该网络有18层,包含4个残差结构,大量采用了 3×3 的卷积模板,以减少单层特征图为原则,在不增加滤波器数量的同时,拓展了网络的层次。网络结构详细信息如表2所示。
表2 ResNet结构参数
损失函数采用交叉熵
步骤3 经过以上步骤后,得到一个训练好的元学习器(Mmeta),此模型是对雷达信号识别的一个良好初始化参数。利用具有N类畸变雷达信号的元测试集数据集进行精调。抽取一个任务,用N×K个样本组成的支撑集训练更新模型参数,用其余数据组成的查询集测试模型性能。此步骤只执行1次梯度更新过程。
4 实验分析
实验分别在5 way 5 shot 和5 way 10 shot 的少样本情形下进行。仿真10种常见的雷达电磁信号作为元学习器数据集,分别为常规脉冲(Conventional Pulse, CP)信号、线性调频信号、非线性调频信号、二相编码信号、Chirp子脉冲步进频率信号(CSF)、四相编码信号、Frank八相码信号(8-Phase Shift Keying, PSK)、频率编码信号(Frequency Shift Keying, FSK)、FSK/PSK复合信号、Costas编码信号。信号载频为100 MHz,采样频率为50 MHz,脉宽为10 μs。其中BPSK和QPSK采用13位Barker码,Frank八相码信号为64位,Costas编码信号包含10个子码。在5 shot和10 shot下分别产生450和600个脉冲信号。本文考虑海面环境下的畸变信号,对于雷达侦察接收机来说,最主要的信号干涉是:雷达发射→海面反射→侦察接收机。考虑一种简单的畸变信号:强反射信号叠加形成的畸变信号。这种畸变信号的特点是雷达反射波时延一般均远小于雷达的脉冲宽度,所以可以通过设置时延小于脉冲宽度的做法仿真畸变信号。基于上述方法仿真5种畸变雷达信号作为测试模型的识别性能,分别为BPSK, Costas, LFM,NLFM, QPSK。在5 shot和10 shot下分别产生150和250个脉冲信号。分别在信噪比为0~6 dB,7~13 dB和14~20 dB的情形下产生,所加噪声为高斯白噪声。本次实验使用Pytorch框架搭建,利用Python进行编程。实验所使用的系统为Windows 10,处理器为Intel Core i7-8700 3.20 GHz,显卡型号为NVIDIA QUADRO P6000,显存容量为24 GB。训练用的优化器为Adam。
实验1 为了验证本文提出的方法的有效性,本文采用决策树(Decision Tree),K-近邻(KNearest Neighbor, K-NN)算法(K=1),SVM分类器(采用高斯核函数)和残差网络作为对比。残差网络同样在10种正常信号数据集上训练后,再在5种畸变信号数据集上进行精调。其中决策树、K-近邻和SVM分类器选用几种传统的人工提取特征方法构成的特征集合,相关方法描述如表3。每种方法都在每类shot={5, 10}个样本,信噪比为0~6 dB,7~13 dB和14~20 dB的情况下实验,评价指标为准确率。每种方法进行10次模型训练,然后在测试集检验模型性能。每次实验的训练集采用随机抽取方式,实验结果的均值和标准差如表4。
表3 人工特征提取方法特征集合
表4 畸变雷达信号识别结果(%)
通过实验可以看出,所有算法在样本从5个增加到10个后识别准确率都有一定程度提升。残差网络通常只能在训练样本足够多的情况下才能取得较好的性能,而在少样本的情况下,模型发生过拟合现象,识别准确率较低,其性能低于经传统人工特征提取后的传统机器学习算法分类效果。而本文提出的MAML-ResNet模型通过在10种正常雷达信号样本上学习到了识别雷达信号类型的初始化参数,在5 shot和10 shot分别在3组信噪比情况下都取得了较好的效果,特别在5 shot的情况下,性能表现尤为突出,准确率有超过10%的提高,且实验结果的标准差更低。
实验2 为了进一步验证模型的性能,本文选取MAML-ResNet在信噪比为14~20 dB的正常雷达信号样本训练所得到的元学习器,将信噪比为0~6 dB和7~13 dB的畸变雷达信号样本作为元测试集,实验结果的均值和标准差如表5;选取MAMLResNet在信噪比为0~6 dB的正常雷达信号样本训练所得到的元学习器,将信噪比为7~13 dB和14~20 dB的畸变雷达信号样本作为元测试集,实验结果的均值和标准差如表6。
从表5和表6的结果可以看出,对比实验1,高信噪比元训练集获得的元学习器在低信噪比的畸变信号元测试集上识别准确率均有一定程度的下降,而低信噪比元训练集获得的元学习器在高信噪比元测试集上识别准确率略有上升(除在信噪比7~13 dB 5 shot情况下),说明模型在低信噪比环境下获得了更多识别雷达信号模式的信息。实验2两种情况下实验结果同样优于实验1中的对比算法,说明MAML-ResNet模型学习到了识别雷达信号类型的良好的初始化参数,在小样本的情况下通过微调可以极大地改善模型的性能。
表5 高信噪比元学习器下畸变雷达信号识别结果(%)
表6 低信噪比元学习器下畸变雷达信号识别结果(%)
5 结束语
本文提出了一种基于元学习残差网络的畸变雷达信号识别模型,在小样本的情况下大幅提升了残差网络的识别性能。该模型通过在正常雷达信号样本训练得到元学习器,在畸变雷达信号样本上精调。实验结果表明,模型学习到了识别雷达信号模式的良好初始化参数,在小样本畸变雷达信号下取得了较好的识别准确率。在实际中面临小样本的情况,本文的方法具有一定的参考意义。