基于VMD 的通信辐射源个体识别方法*
2022-05-10徐晋凯
徐晋凯,谢 钧,俞 璐
(1.中国人民解放军陆军工程大学 指挥控制工程学院,江苏 南京 210007;2.中国人民解放军陆军工程大学 通信工程学院,江苏 南京 210007)
0 引言
辐射源个体识别通过侦收辐射源(各种通信电台或雷达等)的发射信号,利用信号处理、机器学习等技术,从中提取能够区分不同辐射源个体的“指纹”特征,并在此基础上使用分类或聚类方法实现辐射源的个体识别。为获得良好的识别效果,指纹特征应具有普遍性、唯一性、稳定性、独立性和可检测性,然而细微的通信辐射源指纹特征通常淹没在包含噪声和不同传输数据的发射信号中,提取难度很大。因此在辐射源个体识别的研究中,如何有效提取具有高区分性的辐射源指纹特征一直是关注的焦点。
通信辐射源个体特征主要是由发射机硬件工作产生。文献[1]归纳了发射机硬件产生的主要特征有时钟符号率误差、同向正交(In-phase/Quadrature,I/Q)调制器的调制误差、振荡器的频率偏差和相位噪声、混频器和功率放大器的噪声、等效滤波器失真等。常见的指纹提取方式分为人工提取与深度学习提取两种。人工指纹特征提取的研究主要从信号的时域、频域、时频域、调制域和高阶谱等角度进行。文献[2]对射频功率放大器带记忆非线性行为进行建模,通过拟合发射信号的这些非线性变化提取模型参数作为辐射源的指纹特征。文献[3]使用时间序列置换熵作为辐射源的个体特征。文献[4]提出了信号总能量、暂态信号持续时间和最大能量点持续时间3 种全局特征和信号希尔伯特变换时频图的频率轴能量分布、时间轴能量分布和时频平面能量分布3 种时频指纹特征。星座图误差指纹特征又称为调制域误差指纹特征,是由Brik 等人[5]于2008年提出的一种稳态指纹特征。文献[5]对比了星座图的分布差别,使用相位误差、幅度误差和I/Q 偏移等作为识别特征,取得了不错的识别效果。文献[6]提到只要满足时间反向不变性,信号就会具有对称频谱,因此通过测量频谱图的分布特征,以及测量距离与互相关性作为指纹特征,实现信号的识别。文献[7]提出信号双频谱图两个频率轴之间存在非线性相位耦合,因此双谱可以作为特征向量进行分类识别。文献[8]使用小波变换方法提取指纹特征实现高准确度识别。
虽然目前已有不少人工特征提取的研究成果被提出,但是人工特征提取存在着对领域知识要求高和特征普适性差的问题,限制了人工特征辐射源个体识别方法的发展。由于在计算机视觉和自然语言处理等领域取得了巨大成功,深度学习近年来在辐射源个体识别领域也受到广泛关注。典型的深度网络如卷积神经网络(Convolutional Neural Networks,CNN)、长短期记忆网络(Long Short-Term Memory,LSTM)等在辐射源个体识别中都有成功的应用。文献[9]基于深度学习提出了多采样神经网络,由神经网络完成指纹提取与分类识别工作。文献[10]研究了深度神经网络、卷积神经网络和循环神经网络3 种网络模型对无线设备的特征提取识别效果。文献[11]比较了支持向量机(Support Vector Machine,SVM)、深度神经网络和卷积神经网络等不同类型机器学习技术在辐射源个体识别中的应用。文献[12]使用长短时记忆神经网络自动识别特定硬件的特征,并进行发射器分类。文献[13]采用CNN 和循环神经网络(Recurrent Neural Network,RNN)对各种信噪比范围内的物联网(Internet of Things,IoT)设备进行分类。文献[14]利用深度学习研究动态信道对射频指纹的影响。文献[15]使用生成对抗网络识别非法辐射源。文献[16]设计了一个卷积神经网络,对信号的差分星座跟踪图(Differential Constellation Trace Figure,DCTF)进行学习来识别物联网终端个体。
通信辐射源个体指纹信息是信号发射元器件在发射信号时,附加在数据信号上的细微“噪声”信号。这些对传输信息无益的“噪声”信号,正是识别辐射源个体至关重要的“指纹”,而携带不同通信信息的数据信号却是严重影响辐射源个体识别性能的无益“噪声”。由于指纹信号相对于数据信号非常微弱,因此采用端对端深度学习的方法需要大量训练样本才能把这些微弱的指纹特征提取出来。如果能够把辐射源发射的原始信号中的数据信号过滤掉,而仅留下指纹信号,则可以大大提升分类器的性能,同时降低所需的标记样本个数。基于以上分析,本文提出了将发射信号中的数据部分过滤而保留指纹噪声的研究思路。本文采用变分模态分解(Variational Mode Decomposition,VMD)方法提取指纹信号,并使用CNN 进行特征提取和分类识别。在公开数据集ORACLE[17]以及自建数据集上的实验结果均表明,该方法可显著提高辐射源个体识别的性能,特别是在小样本条件下具有明显优势。
1 VMD-CNN 通信辐射源个体识别方法
1.1 基本思想
现有研究表明,通信辐射源个体特征主要来源于发射机硬件工作产生的各种噪声,主要包括时钟符号率误差、I/Q 调制器的调制误差、振荡器的频率偏差和相位噪声、混频器和功率放大器的噪声、从数字模块到天线过程中等效滤波器的失真等[1]。这些发射机硬件工作产生的特有噪声会在发射信号中引入一些微弱的高频分量,而这些微弱的噪声信号正是通信辐射源个体识别的关键,但与携带通信信息的数据信号混杂在一起。现有通信辐射源个体识别研究都是对包含数据和噪声的接收信号直接进行特征提取,特别是基于深度学习的端到端特征提取方法。由于占据主要成分的数据信号随数据不断变化,会对学习过程产生严重干扰,而网络模型通常需要大量的标记样本才能学习到通信辐射源的个体特征。虽然指纹信号与数据信号不是简单的线性叠加,但数据信号会更多地存在于发射信号的低频部分。如果能将包含更多个体特征的高频噪声信号与包含更多数据信号的低频分量分离,再送入网络模型进行学习,将会大大提高模型的学习效率,这正是本文提出的研究思路。
将复杂信号分解为有限个频率分量的常用方法主要有,经验模态分解(Empirical Mode Decomposition,EMD)、集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)、互补集合经验模态分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)以及VMD。EMD 方法受噪声干扰较大,有较严重的端点效应和模态混叠效应。虽然EEMD 方法在一定程度上抑制了EMD 方法分解过程中产生的模态混叠现象,但因其在分解过程中添加了白噪声,导致分解不具有完备性。CEEMD 方法因为添加了成对符号相反的白噪声,重构误差大大减小,但计算量过于庞大,并且仍然存在过多的伪分量。VMD 方法能够自适应地实现信号的频域剖分及各频率分量的有效分离,解决了EMD 方法的模态混叠问题,具有更好的噪声鲁棒性,但缺点是需要利用先验知识确定信号分解的模态数。由于通信辐射源指纹特征主要存在于原始信号的高频分量中,本文选用VMD 方法对原始信号进行2 模态分解,将特征信号(高频分量)与数据信号(低频分量)进行分离,然后将分解后的特征信号送入CNN 网络进行分类识别,如图1 所示。
图1 VMD-CNN 通信辐射源个体识别方法
1.2 变分模态分解
通信信号可以看作是由多个频率分量叠加的复杂信号。VMD[18]可以自适应地将复合信号分解为指定数量的各频率分量。VMD 认为信号是由不同频率占优的子信号叠加而成,并假设信号所有分量都是集中在各自中心频率附近的窄带信号。VMD 通过构建频域变分优化问题,对变分模型进行迭代搜寻,每次迭代求解低频部分中心频率的信号分量,即本征模态函数(Intrinsic Mode Function,IMF),高频部分留待进一步分解。与EMD 不同,IMF 在VMD 中被定义为一个调幅-调频信号,而不局限于窄带信号,其第k个IMF 的表示形式为:
式中:uk(t)为第k个本征模态函数;Ak(t)为随时间变化的幅值函数;Φk(t)为相位函数。
对接收信号进行3 步处理:第一步,Hilbert 变换求解析信号;第二步,将信号平移到基带;第三步,使用H1 Gaussian smoothness 估计信号的带宽。其表达式如下:
式 中:{uk}={u1,u2,…,uK},{ωk}={ω1,ω2,…,ωk};K为分解的模态数;uk和ωk为分解后第k个模态分量和中心频率;δ(t)为狄拉克函数;*为卷积运算符;f为输入信号f(t)。对式(2)添加2 次惩罚项与拉格朗日乘子λ(t),使用交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)进行求解,其迭代求解式为:
用VMD 方法进行信号分解的示例如图2 所示。图2(a)是由频率分别为图2(b)80 Hz、图2(c)200 Hz、图2(d)800 Hz 和图2(e)1 600 Hz 的余弦信号叠加而成的复合信号,其中80 Hz 的信号振幅最大。将图2(a)中的复合信号进行VMD 分解,不断迭代分离出信号中的低频部分。当分解模态数K=4 时,其分解的第一、第二、第三和第四本征模态函数结果为图2(f)、图2(g)、图2(h)和图2(i)。当分解模态数K=2 时,其分解的第一、第二本征模态函数结果为图2(j)和图2(k),可以看出,分解出来的第一本征模态函数与复合信号的主分量基本一致。
图2 VMD 方法信号分解示例
1.3 CNN 结构
本文设计的完整的VMD-CNN 网络如图3 所示,对输入信号先进行VMD 处理,将处理后的数据输入后续的深度网络中。深度网络由3 个卷积层、2个全连接层与1 个softmax 层构成。第一卷积层由50 个1×9 的卷积核构成,提取粗粒度的指纹特征。第二卷积层由50 个1×5 的卷积核构成,提取细粒度的指纹特征。前两层分别学习I 路和Q 路时间序列变化。第三卷积层由50 个2×5 的卷积核构成,使用2×5 的卷积核提取I 路信号与Q 路信号组合特征的指纹信息,3 个卷积层都采用ReLU 激活函数。第一层全连接层设定256 个神经元,第二层全连接层设定80 个神经元,并且在两层全连接层加入Dropout 与l2正则化参数,正则化参数λ=0.000 1,网络的优化器为Adam,学习率为0.000 1。由softmax层输出概率向量,确定产生信号的辐射源个体。
图3 VMD-CNN 网络模型
2 实验验证与分析
2.1 实验数据集
由于目前公开的通信辐射源实采数据集非常少,很多通信辐射源识别论文基于仿真数据进行实验验证,说服力不强。2019 年,美国东北大学公开了通信辐射源实采数据集ORACLE[17],为验证辐射源个体识别方法提供了便利。ORACLE 使用一台通用软件无线电外设(Universal Software Radio Peripheral,USRP) B210 作为接收端,16 台USRP X310 作为发送端。发送的数据是由MATLAB 工具包产生的符合IEEE 802.11a 的数据帧,数据帧包含随机生成的数据并具有相同的地址字段。接收端放置在开放反射少的区域实现信号采集,其中心频率为2.45 GHz,采样频率为5 MHz(每秒采集500 万个采样点),分别对I 路Q 路信号进行采样。
本文为了说明方法的有效性,自建了通信辐射源实采数据集。使用1 台USRP N210 作为接收端,对5 台USRP N210 进行信号采集。接收距离为10 m,环境封闭无遮挡。信号的中心频率为1.00 GHz,以5 MHz 的采样频率对I 路Q 路信号进行采样。
本文将采集的每个辐射源信号序列的前80%用于产生训练样本,后20%用于产生测试样本。使用长度为128,步长为1 的滑动窗,在IQ 信号序列上提取2×128 维的样本。考虑到神经网络训练过程中的随机性,本文采用10 次实验的平均值作为实验结果。
2.2 VMD 指纹信号提取实验
为了验证VMD 方法提取指纹信号的有效性,本文使用文献[17]中ORACLE 的CNN 网络作为分类器,并在ORACLE 数据集上进行实验验证。从ORACLE 数据集中仅随机选取长度为1 万个采样点(在少量标签样本情况)的5类信号序列用于实验。使用VMD 方法对接收信号进行2 模态分解,得到第1 本征模态函数信号(低频分量)和第2 本征模态函数信号(高频分量)。分别以原始接收信号、VMD 第1 本征模态函数信号和VMD 第2 本征模态函数信号作为输入,用ORACLE 的CNN 网络进行训练与测试。实验结果如表1 所示。从5 分类的平均识别率可以看出,输入为VMD 第2 本征模态函数信号的识别率可以达到99.03%,明显高于输入为原始接收信号的识别率,而输入为VMD 第1 本征模态函数信号的识别率最低,仅有82.51%。实验结果表明,辐射源指纹信息主要存在于VMD 第2 本征模态函数信号(高频分量)中,而数据信息主要存在于VMD 第1 本征模态函数信号(低频分量)中。对原始接收信号进行VMD 2 模态分解,并过滤掉第1 本征模态函数信号,可以显著降低数据信号对于指纹特征的干扰。
表1 不同输入信号的平均识别率 %
2.3 不同类别数的实验
为了验证本文CNN 和VMD-CNN 的有效性,在ORACLE 公开数据集上,针对5 分类、10 分类和16 分类,对ORACLE 算法、本文CNN 和VMDCNN 的识别率进行比较。每种类别的信号序列长度为1 万个采样点。实验结果如表2 所示。无论是5分类、10 分类还是16 分类,本文CNN 识别率略高于ORACLE 方法,而VMD-CNN 的识别率明显高于ORACLE 方法。总体上随着类别数的增加,识别率有所下降。
表2 不同类别数的平均识别率 %
2.4 不同训练样本数的实验
为了分析不同训练样本数对实验结果的影响,本文从训练集中随机抽取了5 000、10 000、20 000 和40 000 个不同数量的训练样本对分类器进行训练,类别数为16。3种方法的识别率如表3所示。图4 显示了各方法识别率随训练样本数增大的变化曲线。可以看出,在小样本条件下,VMD-CNN 方法具有更加显著的优势,其优势随着训练样本数的增加而缩小。
表3 不同训练样本数的平均识别率 %
图4 不同训练样本数识别率变化
2.5 自建数据集实验
本文在自建数据集上,进行了5 分类实验。使用5 个USRP N210 设备作为辐射源,每个辐射源采集的信号序列长度为1 万个采样点。实验结果如表4 所示。VMD-CNN 的识别率依然最高,可达99.91%,明显高于ORACEL 和本文CNN 方法。
表4 自建数据集上的平均识别率 %
3 结语
本文提出了将发射信号中的数据部分过滤而保留指纹噪声的研究思路,在此基础上,设计了基于变分模态分解的通信辐射源个体识别方法。该方法能够显著降低数据信号的变化对网络模型学习过程的干扰,提高网络模型学习性能并可明显减少标记样本个数的需求。该方法利用变分模态分解方法将主要传输信息的数据信号与主要包含辐射源个体特征的指纹信号进行有效分离,并使用深度网络模型对时间序列信号进行特征提取和分类识别。本文方法在公开数据集和自建数据集上均获得了很高的识别准确率,在小样本条件下其优势尤为明显。本文的研究为通信辐射源个体识别提供了新的研究思路。