APP下载

基于多模态域对抗神经网络的调制识别算法

2022-01-20李保国杜志毅

航天电子对抗 2021年6期
关键词:数据分布源域特征提取

徐 强,李保国,王 翔,邓 文,杜志毅

(国防科技大学电子信息系统复杂电磁环境效应国家重点实验室,湖南 长沙410073)

0 引言

信号调制识别(MR)作为电子侦察系统需要完成的首要任务之一,位于信号检测和信号解调之间,它的目的是在有限或者没有先验信息的条件下,识别接收到的未知信号调制方式,为电子侦察后续工作流程中的信号解调和情报挖掘打下基础[1]。传统的调制识别主要使用基于最大似然和基于特征的方法,但这些方法存在难以适应不断发展的复杂信号调制和严重依赖于人工设置门限的问题。为应对这些问题和挑战,近些年研究人员将深度学习引入非合作通信中的调制识别中,赋予信号调制方式识别技术以机器智能,深度学习的优势在于无需人工设计、提取信号特征,神经网络可自动化进行信号特征提取及信号分类,其提取到的信号特征具有更强的鲁棒性和泛化能力。各式各样的深度学习技术,包括卷积神经网络(CNN)、递归神经网络(RNN)和一些混合模型,应用于调制识别中已显示出优于传统方法的性能。

本文主要是针对实际电子侦察场景中源域调制数据和目标域调制数据因为码速率的差异而导致数据分布不同,预先训练的深度学习模型失配,智能调制识别算法性能急剧恶化且大量无标注目标域调制数据未被利用的问题,利用迁移学习技术进行知识迁移,结合无标签目标域调制数据参与训练,充分挖掘源域和目标域的相关性,使得源域调制数据训练获得的知识能有效地提升目标域调制数据的性能。本文在前人研究的基础上,采用一种基于多模态域对抗神经网络的调制识别算法,在域对抗神经网络基础上同时使用时域和频域的多模态信息对齐源域和目标域调制信号的数据分布,以提升调制识别算法性能,并用仿真结果验证识别算法的有效性。

1 研究现状分析

目前已经有少量的相关研究工作,文献[2]表明目前的MR方法都是基于发射机技术的先验知识(符号持续时间、带宽、上采样和信号整形)和信道条件下设计的,一旦应用于不同的信道条件/发射机特性,其识别性能将会显著下降,因此提出空间变换网络(STN)和嵌入轻量ResNeXt分类器,在只有5%有标签且包含20个复杂高阶调制的大型数据集上提高了10%~30%的平均识别精度。同时研究了不同的信号和信道参数对调制识别系统的影响,并给出可能的优化方向,使基于深度学习的方法对于看不见的信号形状更加鲁棒。文献[3]在Deepsig公开的实采调制信号数据集[4]上使用DANN[5]域对抗网络迁移高信噪比条件信号(18~30 d B)的特征辅助训练低信噪比条件(-6~6 dB)的信号特征,实验验证该算法是可行有效的,但随着源域与目标域信噪比差异过大,识别准确率仍有所下降。文献[6]借鉴了基于差异的域适应技术,采用VGG16提取信号小波变换后系数图像特征并用自编码器对高维度的特征进行降维处理,随后计算训练样本特征与测试样本特征之间的CORAL损失,最后联合优化分类损失和CORAL损失使模型达到最优。实验结果表明,在信号类别存在差异或信道环境存在差异的条件下,引入域适应技术可提高待测信号识别准确率5%以上。文献[7]借鉴ADDA网络[8],提出了一个对抗式迁移学习架构(ATLA)以解决采样率不同引起的数据分布差异而导致的模型性能急剧恶化的问题,用1/10的训练数据,提升的准确率高达17.3%。

文献[2]研究了与源域不同分布的目标域有少量标签情况下如何提高网络的泛化性和鲁棒性;文献[3,6-7]在开展基于域适应的调制识别算法研究时只考虑了信号的单模态信息(仅使用信号的单一维度特征,比如时域或者频域信息),忽略了将信号时域和频域的多模态信息(使用信号的多个维度特征,将时域、频域及其他变换域信息)融合后进行域适应而获得的互补增益[9]。为了解决这个问题,本文提出一种基于多模态域对抗神经网络的调制识别算法,在域对抗神经网络基础上同时使用时域和频域的多模态信息对齐源域和目标域调制信号的数据分布以提升调制识别算法性能,并与文献[3]中的DANN网络、源域训练目标域直接测试、有监督学习进行了性能对比。

2 信号与识别模型

2.1 信号模型和数据预处理

数字调制技术允许数字低频基带信号在高频载波波形上传输,其可以修改载波信号的不同波形特征,包括幅度(MASK)、频率(MFSK)、相位(MPSK)以及幅度和相位的组合(MQAM、MAPSK)。在接收机处,必须结合特定的调制信号特性和经过训练的分类器,将调制信号分配给最合适的调制类别。接收到的无线电信号y(t)的复包络可以写成:

式中,n(t)表示加性高斯白噪声;g(t)表示等效滤波器,具体包括成型滤波、信道滤波和匹配滤波;an表示发送端所发送的符号序列。不同的调制方式,符号序列呈现的样式也不尽相同。

本文主要考虑8种数字调制信号,分别为8PSK、BPSK、CPFSK、GFSK、PAM 4、QAM 16、QAM 64和QPSK。其中数据输入包括调制信号时域和频域的多模态信息,仿真产生的复基带信号为y(n),n=1,2,3,…,N,则I路和Q路分别为y(n)的实部和虚部:

将I路和Q路堆叠得到时域模态F1:

频域模态信息通过提取信号二次方谱和四次方谱得到,二次方谱和四次方谱计算方法如下:

2.2 迁移学习和域适应

迁移学习被赋予这样一个任务:从以前的任务当中去学习知识或经验,并应用于新的任务当中。换句话说,迁移学习目的是从一个或多个源领域中抽取知识、经验,然后应用于一个目标领域当中去。对于常规机器学习和迁移学习的差异和域适应的定位如图1所示,通常将迁移学习技术分为三类:归纳式(inductive)、直推式(transductive)和无监督(unsupervised)。归纳式迁移学习针对的是源域和目标域数据分布相同,源域和目标域的任务不同的情况。直推式迁移学习针对的是源域和目标域数据分布不同,源域和目标域的任务相同的情况。无监督迁移学习针对的是源域和目标域数据分布不同,源域和目标域的任务不同的情况,其中域适应属于直推式迁移学习。

图1 常规机器学习和迁移学习的差异和域适应的定位

本文研究的是基于深度无监督同构对抗域适应的调制识别算法,利用深度域适应[10]中的域对抗技术,解决调制识别任务(任务相同)中源域调制信号有标签,目标域调制信号无标签(无监督)且源域和目标域调制类型相同(同构),数据分布不同的调制识别问题,其中不同域之间的调制数据分布不同主要体现在码速率的差异上。

2.3 基于多模态域对抗神经网络的调制识别算法

使用基于单模态DANN的域适应调制识别网路作为性能对比测试网络,其结构如图2所示。网络的输入为F1时域单模态信息,网络包括2个流向,第一条流向输入为源域数据,是带标签的数据;另一条流向输入是目标域数据,包含的是不带标签的数据,它们使用共享的特征提取器。在源域和目标域数据流过中间的特征提取器之后,源域数据流入标签分类器并计算源域标签分类损失,源域数据和目标域数据共同流入域分类器并计算域分类损失,网络的优化目标是最小化源域标签分类损失的同时最大化域分类损失。其中特征提取器采用文献[7]中的特征提取网络,特征提取器、源域标签分类器及域分类器的网络参数分别如图3-4所示。

图2 基于DANN的域适应调制识别网络

图3 特征提取器参数

本文在域对抗神经网络基础上同时使用时域和频域的多模态信息对齐源域和目标域调制信号的数据分布以提升调制识别算法性能。提出的调制识别模型如图5所示。网络输入为F1和F2时频域多模态特征,其中源域为有标签调制数据,目标域为没有标签调制数据,识别算法训练步骤为:

图5 基于多模态域对抗神经网络调制识别模型

Step1:源域数据F1模态信息和目标域F1模态信息通过特征提取器分别生成256维隐藏层特征s1和t1;

Step2:源域数据F2模态信息和目标域F2模态信息通过特征提取器2生成256维隐藏层特征s2和t2;

Step3:s1和t1分别输入到域分类器1进行域分类并计算域分类损失1;

Step4:s2和t2分别输入到域分类器2进行域分类并计算域分类损失2;

Step5:对s1和s2实施cat操作,将特征进行融合,将融合后的512维特征输入源域标签分类器进行源域标签分类并计算源域标签分类损失;

Step6:将源域标签分类损失和域分类损失1,域分类损失2相加后得到总的loss进行梯度反向传播,其中最终优化目标为:

式中,θf1,θf2,θy,θd2,θd2分别是特征提取器1,特征提取器2,源域标签分类器,域判别器1,域判别器2的参数;Gf1,Gf2,Gy,Gd1,Gd2分别是特征提取器1,特征提取器2,源域标签分类器,域判别器1,域判别器2;ns,nt分别是源域和目标域样本的数量;yi,di分别是类别标签和域标签;λ1,λ2是权重系数;域判别器1,域判别器2,源域标签分类器均使用交叉熵函数通过迭代训练使得总的loss达到最小,模型达到最优,使用训练好的特征分类器和源域标签分类器进行目标域识别分类。其中特征提取器1和2的结构相同,仍采用文献[7]中的特征提取网络,如图3所示,域分类器1和域分类器2的结构相同,其网络参数如图4(左)所示,源域标签分类器网络参数如图4(右)所示,这里源域标签分类器的输入为特征融合后的512维而不再是256维。

图4 域分类器参数(左)和源域标签分类器参数(右)

3 仿真验证及分析

3.1 数据集制作

本小节主要介绍训练和测试数据集的生成,本文数据集制作流程采用文献[4]中的方式。本文设置了莱斯多径信道环境进行数据集的制作以研究在复杂电磁环境中域适应技术性能。

1)数据源

数字调制的数据源使用莎士比亚的整个古登堡作品的ASCII码产生,使用白化随机以确保等符号和比特。

2)调制

随机比特序列依照相应调制方式进行基带星座映射,再进行上采样和脉冲成型。本文所需识别调制类型包含8种常见数字调制信号,按顺序分别为8PSK、BPSK、CPFSK、GFSK、PAM 4、QAM 16、QAM 64,QPSK,其中样本长度为2×128,其中2代表IQ 2路信号,128代表样本长度。

3)通过信道

信道模型如图6所示,包括采样率偏移、中心频率偏移、莱斯多径衰落、高斯白噪声。其中产生数据集的相关参数如中码速率主要由sps(sample per symbol)调节,当采样率固定,sps不同时,信号的码速率也不相同,因此形成不同的域,sps=4、8、16将分别充当源域和目标域来进行交叉验证,可组成6对源域和目标域组合。为引用方便起见,分别将sps=4、8、16的3个域的数据集命名为A、B、C数据集。数据集相关参数见表1。

表1 数据集相关参数

图6 信道模型

3.2 实验环境设置

实验使用深度学习的环境语言配置为Python 3.8.0,Pytorch 1.8.0,cuda10.2,系统为Windows 10专业工作站版20H2版本,硬件使用的CPU为Intel(R)Core(TM)i7-9750H,显卡为NVIDIA GeForce GTX 1650,内存为32 GB。batch size为1 024,类别分类器和域分类器使用Adam优化器进行优化,学习率设为1e-3。

3.3 不同码速率下域适应模型分类性能

本小节中定义的调制识别性能指标为:

在A、B、C数据集上分别使用3种算法进行性能对比测试以评估提出的算法:

1)有监督学习

称该类方法为Supervised,即训练集和测试集数据分布相同时的传统智能调制识别算法,这里目标域有充分的有标签样本进行训练。对目标域训练调制数据进行充分训练后,在目标域测试调制数据上直接进行测试,这里又将Supervised分为两种,即单模态Supervised和多模态Supervised,单模态Supervised的输入为目标域的F1时域模态特征,识别网络使用DANN中的特征提取器和源域标签分类器,剔除域分类器,最终优化目标仅包含标签分类损失;多模态Supervised的输入为目标域的F1时域和F 2频域多模态特征,识别网络使用本文提出的网络中的特征提取器1、特征提取器2、特征融合和源域标签分类器,同样剔除域分类器1和域分类器2,最终优化目标仅包含标签分类损失。设置有监督学习算法进行性能对比测试的目的是探究域适应的识别精度的可能上限。

2)在源域上训练、目标域上直接测试

称该类方法Source-Only,即训练集和测试集数据分布不相同时的传统智能调制识别算法,这里的目标域完全没有标签样本。对源域训练调制数据进行充分训练后,在目标域测试调制数据上直接进行测试,这里又将Source-Only分为两种,即单模态Source-Only和多模态Source-Only:单模态Source-Only的输入为源域的F1时域模态特征,识别网络使用DANN中的特征提取器和源域标签分类器,剔除域分类器,最终优化目标仅包含标签分类损失;多模态Source-Only的输入为源域域的F1时域和F2频域多模态特征,识别网络使用本文提出的网络中的特征提取器1、特征提取器2、特征融合和源域标签分类器,同样剔除域分类器1和域分类器2,最终优化目标仅包含标签分类损失。设置该类算法进行性能对比测试的目的是探究域适应在解决调制识别域适应问题上的性能增益。

3)DANN单模态识别模型

称该类方法DANN,即训练集和测试集数据分布不相同时的单模态调制识别域适应算法,这里目标域没有标签样本。对源域和目标域训练调制数据进行充分训练后,在目标域测试调制数据上直接进行测试,这时输入为源域的F1时域模态特征,识别网络如图2所示。

实验得到的结果如表2所示,表中所示识别率均表示在目标域测试集上进行测试得到。从实验结果中可以看出,本文提出的网络在大多数调制识别跨域适应任务上优于Source-Only和DANN方法,其中相比于单模态Source-Only最大提升了26.3%的识别精度,相比于多模态Source-Only最大提升了20%的识别精度,相比于DANN方法提升了2.5%~4%的识别精度。这些实验结果表明了通过将调制信号的多模态和域对抗技术相结合可以有效学习到更加全面的域间相关信息并进行领域迁移。

表2 结果分析对比

4 结束语

本文提出一种基于多模态域对抗神经网络的调制识别算法,在域对抗神经网络基础上同时使用时域和频域的多模态信息对齐源域和目标域调制信号的数据分布,以提升调制识别算法性能。仿真实验表明,提出的算法相比于在源域训练、目标域直接测试的方法总识别率最大提高26.3%,相比于单模态域适应调制识别算法总识别率提高2.5%~4%,证明基于多模态的深度域对抗神经网络在源域和目标域的数据分布不同时仍有较好的效果,具有较好的应用前景和研究价值。

猜你喜欢

数据分布源域特征提取
多源域适应方法综述
改进的云存储系统数据分布策略
基于参数字典的多源域自适应学习算法
基于Daubechies(dbN)的飞行器音频特征提取
Bagging RCSP脑电特征提取算法
一种基于给定标准对数据进行正态修正的算法
试论大数据之“大”
可迁移测度准则下的协变量偏移修正多源集成方法
基于MED和循环域解调的多故障特征提取
对数据分布特征测度的分析