基于差分星座轨迹图的多任务802.11b/g信号识别方法*
2023-11-25谢星丽谢跃雷
谢星丽,谢跃雷,2
(1.桂林电子科技大学 信息与通信学院,广西 桂林 541001;2.卫星导航定位与位置服务国家地方联合工程研究中心,广西 桂林 541001)
0 引 言
无线信号识别是指通过挖掘电磁波携带的数据信息及发射机个体信息,提取出差异性特征,进而识别出信号的类型及辐射源个体,主要包括调制识别[1]和辐射源个体识别[2]。无线信号识别技术在电子对抗、频谱资源管理、认知无线通信、无线网络物理层安全认证等领域有着广泛的应用前景。近年来,基于深度学习的端到端识别方法成为了无线信号识别的研究热点之一。接收信号的数据表征形式是影响识别性能的一个关键因素,星座图就是一种有效的数据表征形式。
星座图包含了幅度和相位信息,能够将调制信号的信息映射在二维平面上。文献[3]提出了一种基于星座密度矩阵的调制分类算法,使用ResNet-50和 Inception ResNet V2两个模型识别不同阶数的ASK、PSK和QAM,其分类效果优于其他的卷积神经网络(Convolutional Neural Network,CNN)模型。文献[4]中利用二值化深度神经网络对电磁信号的密度星座图进行识别,在保证识别准确率的同时明显降低了模型存储开销以及计算开销。文献[5]提出了一种“FIF-Net”深度卷积神经网络模型,在0 dB信噪比下对8种数字调制方式的星座图进行识别,达到了87%的识别精度。文献[6]使用k-medoids算法对平坦衰落信道中PSK和QAM信号的星座图进行识别,实验结果表明,该算法的性能优于一些现有的分类器,且计算复杂度更低。
发射机的固有频偏及I/Q调制不平衡等硬件缺陷会导致星座图符号产生变化,这些符号中包含了辐射源的个体差异信息。文献[7]通过获得输入信号的差分星座轨迹图,并基于PACGAN的辐射源个体识别算法对5种ZigBee设备进行实验,证明了此算法在小样本条件下相较于其他方法具有更高的准确性。文献[8]提出了一种基于差分星座轨迹图的特征提取方法,完成了无线设备身份的识别。文献[9]基于聚类算法获得信号差分星座轨迹图的聚类中心,采用欧氏距离的相似度计算方法,对设备聚类中心进行匹配,实现终端设备的身份认证。文献[10]提出了一种多区间差分星座轨迹图的射频指纹识别方法,解决了低信噪比下信号特征受噪声影响的问题。
然而,上述所提及对无线信号的调制方式识别和辐射源个体识别的研究是基于单个模型,若需要同时识别多个任务,则要单独训练多个深度学习网络,会消耗更多时间和硬件资源。随着软件无线电技术的发展,同一发射设备可实现的调制方式也越来越多,如何在识别出无线信号的调制方式的同时识别出辐射源个体,变得十分必要。
借鉴多任务学习的思想,本文提出了一种多任务卷积神经网络结构,利用卷积层作为共享模块,将802.11b/g无线信号的差分星座轨迹图送入多任务卷积神经网络进行处理,同时识别出了调制方式和辐射源个体。采用多任务学习的形式,提高了模型的训练速度、准确率和鲁棒性。
1 系统模型
在无线通信系统中,发射机先将二进制信息进行调制转换成复基带信号,复基带信号经过数模转换器后,送入模拟电路部分进行上变频及射频功率放大器,最后经天线以电磁波的形式辐射出去。信号发射过程主要由调制模块、数/模转换器、上变频器、功率放大器等电路实现。接收机接收过程则与信号发射过程相反。
假设发射机发射信号为
s(t)=x(t)e-j2πfct。
(1)
式中:fc为发射机载波频率;x(t)为调制后的复基带信号,表达式如下
x(t)=∑nkng(t-nTb) 。
(2)
式中:kn=an+jbn表示调制符号;g(t)表示成型滤波器;Tb为码元周期。
在理想信道中,接收机的接收信号r(t)=s(t),若接收机载波频率为fr,则接收机进行下变频后的基带信号可表示为
y(t)=r(t)ej2πfrt=s(t)ej2πfrt。
(3)
由于发射机和接收机的载波频率存在偏差,即fc≠fr,故令Δf=fr-fc,φ为相位误差,则
y(t)=x(t)ej(2πΔft+φ)=
(4)
当采用不同调制技术时,式(1)中得到的发射信号s(t)不同,如802.11b信号的物理层采用直接序列扩频(Direct Sequence Spread Spectrum,DSSS)调制技术,802.11g信号的物理层则采用正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)技术。
辐射源的个体差异性信息也称为“射频指纹”,其主要是由于发射机中数/模转换器的分辨率有限、滤波器的频率响应误差、混频器载波频率误差以及功率放大器的非线性所产生的。
假设辐射源个体类标集合为C1={1,2,3,…,m},调制方式类标集合为C2={1,2,3,…,n}。辐射源个体识别任务的目的是通过学习一个函数f1(x),该函数将输入的信号映射到对应的辐射源类别标签空间C1,并且能够实现正确分类。调制方式识别任务的目的则是通过学习函数f2(x),将输入的信号映射到相应的标签空间C2,对预测的信号有效识别出调制类型。
2 信号预处理
2.1 提取差分星座轨迹图
原始星座图是将I/Q信号直接对应在复平面上。复平面中的星座图包含了调制信号的幅度和相位信息,直观表现出了信号具有的调制特征,采用无线信号图像识别方法可以提取出基于星座轨迹图的辐射源指纹特征和调制类型特征。
然而,使用原始星座图作为特征时,由于接收机和发射机之间存在着载频偏差,导致实际接收点和理想接收点产生误差。随着采样时间的变化,会造成星座图整体旋转。图1所示的同心圆则为采用OFDM调制技术的802.11g无线信号对应的原始星座图。为了解决载频偏差,消除实际接收符号偏移而导致的星座图旋转问题,本文采用差分处理的方法,按照一定的差分间隔对星座图进行处理得到差分星座轨迹图(Differential Constellation Trace Figure,DCTF)。
图1 路由器1产生的OFDM调制信号的原始星座图
对式(4)进行公式(5)所示的差分操作:
d(t)=y(t)·y*(t+n)=x(t)·x(t+n)e-j2πΔfn。
(5)
式中:d(t)为差分处理后的信号;y*为共轭值;n为差分间隔。
虽然式中也存在着旋转因子e-j2πΔfn,但差分后的信号d(t)只与载频偏差Δf、发射信号x(t)和差分间隔n有关。
完成处理后的同一路由器设备对应的两种不同调制方式的差分星座轨迹图如图2所示,不同设备相同调制方式的差分星座轨迹图如图3所示。
(a)路由器1产生的OFDM调制信号
(a)路由器1产生的OFDM调制信号
信号差分运算的结果对应在复平面的有限个位置处,符号分布的位置与信号所采用的调制方式有关。对于DSSS和OFDM调制信号,差分后的结果在复平面分布的位置不同,差分星座轨迹图的形状也不同。
同时,设备在生产时存在的物理硬件差异,使得不同的设备差分处理后的差分聚集点角度明显不同。
2.2 差分密度处理
差分处理后,对所得差分星座轨迹图进行密度处理,目的是为了加强突出差分星座轨迹图图像的特征。I路和Q路信号的特征落在像素值内,散点密度处理得到的轨迹图如图4所示。图中差分点的分布情况表现为不同的颜色,颜色越深,差分点越密集。
(a)路由器1产生的DSSS调制信号
3 基于多任务学习的无线信号识别方案
3.1 多任务学习机制
多任务学习(Multi-task Learning,MTL)是迁移学习算法的一种,是指多个任务共同学习、联合训练的过程[11],它能够利用任务之间的相关性来改善每个任务的性能。多任务主要分为硬共享和软共享两种方式[12]。硬参数共享在所有任务的底层中共享参数,在特定任务的顶层使用各自任务的独有参数[13]。而软共享则为每个任务设计相应的网络结构,在参数学习的过程中通过施加范数来进行任务间的约束[14]。文献[15]提出了一种FGNET-MASK多任务深度学习模型,以硬参数共享的形式对配戴口罩者同时进行年龄、性别和表情的识别,结果表明多任务模型减少了工作量且能产生更好的识别精度。文献[16]提出了交叉型结构的JMRPE-Net的深度多任务神经网络,其具有3个卷积层组成共享模块和长短期记忆层分支,主要用于雷达信号的调制识别和参数估计任务。文献[17]提出了一种基于多任务学习的多门专家混合位置倾向性得分预测模型,利用其他场景中的共享信息帮助相似场景任务的学习,解决了多场景数据联合训练时预测准确性不佳的问题。
3.2 网络结构
本文参照如图5所示的VGG16模型,以硬共享的方式构建了一种多任务框架,沿用VGG16中的前三个卷积模块作为MTL网络的共享部分,修改全连接层的结构和参数作为非共享部分,最终得到的MTL结构参数如图6所示。
图5 VGG16模型参数
图6 MTL网络模型参数
卷积(convolution)操作是为了提取特征。本文均采用大小为3×3的二维卷积核,卷积核在卷积操作中自动提取出图片的特征。
最大池化(max pooling)的作用是为了减少冗余特征信息,减少参数数量和计算量,在一定程度上防止过拟合。
全连接层的目的是将卷积层部分提取出来的特征进行映射。通过Flatten层展开成一维向量,连接到全连接层softmax函数用于分类识别任务,其定义式为
(6)
式中:xi为第i个节点的输出值;N为分类类别数。softmax作为最后全连接层的激活函数,将输出结果映射为(0,1)区间的概率分布。
3.3 训练步骤
多任务学习主要采用交替训练和联合训练两种方式。交替训练是指训练数据集各自独立,网络分别交替收敛每个任务的损失函数。联合训练指所有任务使用同一个数据集,但这个数据集带有不同的标签,网络总损失为每个任务对应的损失函数加权和。
本文所提出的多任务802.11b/g识别网络,其数据集采用同一个DCTF样本集制作多标签数据,同时包含辐射源类别标签和调制类别标签,并选用联合训练的方式进行训练。多任务网络的训练过程如图7所示。
图7 多任务无线信号网络训练过程
具体步骤如下:
Step1 数据集统一进行预处理,得到包含辐射源识别任务和调制方式识别任务的属性标签。
Step2 输入的数据集首先通过三个卷积模块构成的共享层挖掘不同任务的潜在联系和浅层的特征,从而实现特征共享。
Step3 各个任务通过非共享部分的全连接层映射卷积层提取的特征,其中两个全连接层分支的结构和参数不同,保留了各自任务独有的特点。
Step4 最后通过Softmax分类器分别输出所对应任务的类别号。网络的总损失为辐射源交叉熵损失和调制方式交叉熵损失之和。整个训练过程均使用ReLU函数作为网络的激活函数。
本文所使用的交叉熵损失函数表达式为
(7)
辐射源识别任务的交叉熵损失函数记为Lossf,调制方式识别任务的交叉熵损失函数记为Lossx,则多任务无线信号识别框架的总损失函数为
Losstotal=α1Lossf+α2Lossx。
(8)
式中:α1,α2表示每个任务所对应的权重系数,用来平衡每个任务之间的关系。通过对每项任务的损失权重系数进行调节,使网络的性能达到最优。在该系统中,由于两个任务所占比重同等重要,故权重系数比设置为1∶1。
基于多任务的无线信号识别模型由于其共享机制的优点使得模型缩短了训练的时间,降低了模型过拟合的风险,在一定程度上提升了性能。
4 实验与分析
4.1 数据来源
实验中采用USRP2954设备接收WiFi路由器发出的信号,由USRP2954中的通信子板对模拟信号进行滤波和下变频后将信号处理至中频段,由ADC元件转换为数字域信号,最后由PC端接收基带信号。
具体地,USRP2954设备过采样接收6个HUAWEI WS5106路由器发射的信号。路由器设备预先设定的IEEE802.11b协议标准和IEEE802.11g协议标准的无线信号,分别对应DSSS和OFDM调制方式,通过交叉组合可得到12组样本数据,采集过程如图8所示。为了保证所采数据的准确性,将路由器设定工作在2.4 GHz频段的信道1,信道1的中心频率为2.412 GHz,接收端过采样频率为20 MHz。
图8 无线信号数据采集
数据采集阶段所采集到的802.11b/g无线信号为物理层I/Q信号。由于I/Q数据点是随时间进行采样,因此接收到的数据会出现间断不连续的情况。对于间断的数据,将其视为无效数据。本文采用滑动窗口的方法进行数据筛选,根据波形图选取一段有效数据的幅值作为阈值进行判断,若选取的N个采样点内的I/Q信号幅值均大于阈值,则筛选为有效数据。
4.2 数据集制作
数据集中包含了7 000个样本,每个样本为2 000个有效采样点绘制的差分星座轨迹图。生成的DCTF数据集按照7∶3的比例划分为训练集和测试集。训练集用于训练卷积神经网络,测试集用于评价模型的识别精度。调制方式识别和辐射源识别均作为图像分类识别问题,根据调制方式类型和辐射源个体制作出相应的类别标签。解决多分类问题时,通常要对标签进行二值化。因此,对辐射源识别任务的标签进行二值化处理得到[1 0 0…0]的形式。
4.3 环境配置
本文使用python3.7,CPU型号为Intel(R) Core(TM)i5-9500,环境为keras 2.2.3+tensorflow 2.1.0,利用keras搭建模型框架,tensorflow作为后端。
4.4 实验结果
在深度学习中,常见的评价指标有准确率、召回率、错误率等。本为采用准确率指标来对实验结果进行分析。
准确率(accuracy)表示预测正确的正负例样本在总样本中所占比例准确率:
(9)
式中:TP表示正例样本预测为正;TN表示负例样本预测为负;FP表示负类样本预测为正;FN表示正例样本预测为负。
在实验过程中,将制作好的DCTF多标签数据集作为输入,用训练集进行模型训练。Epochs为100轮,bitch size大小设置为12,学习率为0.000 1,采用Adam优化器。反复调参训练后得到最佳的模型,使用划分好的测试集进行测试。在实验中,为了对多任务模型的属性进行对比,本文还设置了网络结构、超参数相同的两个辐射源识别和调制方式识别的单任务模型进行比对。
在理想无噪声的情况下,实验测试集结果如图9所示。
图9 无噪声时网络测试集识别精度比较
实验测试集的单任务和多任务的混淆矩阵如图10~13所示。
图10 单任务辐射源识别
图11 多任务辐射源识别
图13 多任务调制方式识别
从上述的混淆矩阵可以得出,在MTL网络中,辐射源个体识别和调制方式识别的准确率在单任务的基础上分别平均提高了1.17%和3%。
为了验证多任务模型在不同噪声环境下的测试性能,通过对采集的数据加入白噪声,得出如图14所示的测试精度。
图14 不同信噪比下模型的测试结果
当信噪比高于20 dB时,多任务辐射源识别和调制方式识别任务的准确率均在92%以上。而随着信噪比的下降,DCTF的特征会由于噪声而变得模糊,导致识别率下降。但对比单任务的实验结果可以看出,即使在低信噪比下,MTL模型识别性能仍然比单任务好。
此外,对比单任务模型和多任务模型在相同超参数下训练所用时长和模型所占内存,得到表1所示的结果。
表1 单任务和多任务模型训练时长和所占内存
从表中可以看出,在相同的超参数设置下,训练多任务模型的网络参数总量以及所消耗的时间均比两个单任务模型总和少,且训练完成的多任务模型所占用的内存也比两个单任务模型所占内存小。
5 结束语
本文提出了一种基于多任务学习的卷积神经网络来实现802.11b/g无线信号的识别。通过对802.11b/g无线信号的星座图进行差分处理获取差分星座轨迹图作为输入特征,并将辐射源个体和调制方式分类同时作为网络的目标函数,联合训练上述两个任务。通过实验证明了该网络在单任务的基础上能够有效提升识别精度和泛化性能,但在低信噪比情况下,识别率有所降低。因此,接下来可以针对如何在低信噪比下提高模型的识别精度展开进一步的研究。