基于Welch功率谱和卷积神经网络的通信辐射源个体识别*
2021-11-02张邦宁魏国峰郭道省
王 检,张邦宁,魏国峰,郭道省
(中国人民解放军陆军工程大学 通信工程学院,南京 210007)
0 引 言
随着无线通信技术和物联网技术的飞速发展,智能无线终端和物联网设备为人们带来了丰富的生活体验,同时也为非法用户的入侵提供了可乘之机。非法用户和网络攻击通常利用截获的身份信息,如密码和MAC地址等来进行设备欺骗,从而造成严重的安全隐患。射频指纹(Radio Frequency Fingerprint,RFF)[1]是辐射源设备发射电磁波所形成的独特特征,无法被截获和模仿。因此,基于射频指纹的辐射源个体识别技术应运而生。
辐射源个体识别研究中,射频指纹的提取方法主要有基于基本参数信息[2]、调制域信息[3-4]、变换域信息、基于信号特征图像信息[5]、神经网络提取[6]等,射频信号的选择通常为辐射源工作功率恒定时的稳态信号。近年来,变换域信息常被作为射频指纹特征在辐射源识别领域的应用较为广泛,与其他提取特征的方法相比,此类方法保留了信号在变换域内的全部特征,而不是提取某个单一特征,不存在因关键特征选择不佳而影响识别性能的问题,同时此类方法不需知晓调制方式等一些先验信息,应用范围更加广泛。变换域信息主要包括时频分析[7]、高阶谱[8]、循环谱等[9-10],但是此类方法中,时频谱分析受制于分析工具性能,自适应性能较差;高阶谱分析往往维度较高,带来的运算压力较大,往往采取切片的手段进行降维处理;循环谱同样维度较高,且十分依赖信号本身的完整性,在信号完整性差或信噪比低时,识别效果不佳。信号的功率谱也是一种变换域特征,它描述了信号功率随着频率变化的情况。相比于其他变换域特征,功率谱具有提取难度小、维度较低且在低信噪比下方差性能良好的优势。
近几年,深度学习理论快速发展,卷积神经网络在图像识别领域取得了令人瞩目的成果。鉴于卷积神经网络在细微特征提取的卓越性能,许多研究也将卷积神经网络应用到辐射源感知[11]和识别[12]的场景中,取得了同样不错的分类性能。Wong等人[13]基于I/Q不平衡理论,直接将原始I/Q数据作为辐射源的指纹特征送入神经网络进行分类识别。对与未经挖掘或人为提取特征的原始I/Q数据而言,数据中包含着辐射源的全部微特征信息,结合卷积神经网络对辐射源进行了有效的分类。然而I/Q数据在低信噪比情况下,其包含的细微特征往往会被噪声湮没,致使卷积神经网络很难提取特征影响分类结果,在全频段功率信噪比为0 dB条件下对10组辐射源设备的识别率仅为64%[12]。
为解决在低信噪比条件下辐射源个体识别率低的问题,本文选用信号的功率谱作为指纹特征,它不仅包含了频域内的所有特征,且比频谱在低信噪比下有更好的方差性能。Welch功率谱算法是一种改进的功率谱算法,相较其他功率谱算法性能更优,结合卷积神经网络可在低信噪比下对辐射源进行有效的分类。本文构建了由20个ZigBee协议的CC2530物联网设备组成的测试平台,CC2530也是目前常用物联网设备。为了避免因调制信息不同带来的影响,截取了信号前同步码(preamble)部分的信号用于特征提取,将辐射源前同步码部分的Welch功率谱数据送入卷积神经网络,在瑞利信道全频段功率信噪比为25 dB信噪比条件下对20个CC2530设备的识别率达到了98.88%,信噪比为0 dB时识别率为92.78%。经过实验对比,本文方法在低信噪比条件下的识别效果明显优于其他方法。
1 基于Welch功率谱和卷积神经网络特征提取模型
本文设计了基于Welch功率谱和卷积神经网络特征提取的通用模型,共分为5个部分,如图1所示。
图1 基于Welch功率谱和卷积神经网络特征提取模型
在实际场景中,非法用户或网络攻击往往会采用和主用户来自同一厂家相同型号的设备,因此在辐射源识别过程中,易获得辐射源的中心频率、码率、通信协议等部分先验知识。基于上文所述的先验知识,可对辐射源信号进行良好的采集、保存,并将辐射源数据进预处理,去除冗余保留辐射源关键部分信息。将Welch功率谱算法得到的信号功率谱数据作为辐射源的指纹特征,送入卷积神经网络训练,最后将测试数据集送入网络得到最终分类结果。
2 数据来源及处理过程
当下广泛采用的智能终端和物联网设备,其通信协议多基于IEEE 802框架,因此本文选用基于ZigBee协议的20个CC2530发射器作为辐射源验证模型性能,信号采集设备为Signal-Hound BB60C实时频谱分析仪,采集的辐射源信号保存在PC端,并利用相关软件进行数据处理。
2.1 数据采集
本文研究的辐射源设备是来自同一厂家相同型号不同序列号的20个ZigBee CC2530设备。ZigBee协议使用IEEE 802.15.4规范作为物理层标准,其物理层协议数据单元包括同步头、物理层报头和载荷,如图2所示。
4 B1 B1 B可变长度前同步码(preamble)帧定界符(SFD)帧长度(7 b)保留(1 b)物理层数据(PSDU)同步头(SHR)物理层报头(PHR)物理层载荷(PHY payload)
图2ZigBee物理层协议数据单元
图3展示了整个采集系统,包括20个CC2530发射器、采集设备和存储设备。信号的采集都是基于Signal-Hound BB60C实时频谱分析仪完成的。由于ZigBee设备的I/Q信道码片速率为1 Mb/s,我们以40 Msample/s的采样率通过有线的方式对每个ZigBee设备的1 000次数据传输进行采集,采集的信号经过BB60C下变频至基带,最终以复数I/Q数据的方式储存至PC,如图4(a)所示。
图3 数据采集系统
(a)一次完整通信的I/Q数据
(b)前同步码的标准化I/Q数据
2.2 数据预处理
2.2.1 数据截取
基于IEEE 802相同协议规范的前同步码(preamble)中包含的数据成分相同,因此将信号前同步码部分的信号特征作为辐射源的指纹特征,能够避免调制信息不同带来的影响,且相较其他特征更加稳健,十分适用于无线网络设备的识别。在先前的研究中,无线信号前同步码的射频特性已被证明能够可靠地区分IEEE 802.11a无线电[14]。鉴于前同步码的射频特性,本文截取ZigBee信号前同步码部分,将其射频特征作为指纹特征用于辐射源识别,同时可以避免数据量庞大带来的运算压力。IEEE 802.15.4协议根据辐射源的频带和调制方案,要求使用基于30~40位的前同步码,本文选用中心频率为2.405 GHz的CC2530发射器,其前同步码长度为4 B共128 μs。因此我们截取每次传输数据前128 μs的前同步码I/Q数据,共计5 120个样本点用于特征提取,并将信号数据进行标准化处理。标准化处理数据不仅利于神经网络的训练和分类,还可以避免信号幅度值不同引入的非指纹特征,如图4(b)所示。
2.2.2 数据去噪
在低信噪比情况下,辐射源的细微特征往往会被噪声湮没,导致特征提取难度加大,进而影响对辐射源的识别。因此,本文设计了低通滤波器对保存的I/Q信号进行去噪处理。Toeplitz矩阵类似于随机矩,大概率地满足了受限等距性质(Restricted Isometry Property,RIP),被广泛用作度量核[15-16]。采取窗函数的方法设计数字低通滤波器,利用Toeplitz矩阵的循环特性实现接收信号与低通滤波器系数的卷积。假设滤波器阶数为K,并且数字滤波器系数由FC表示,则Toeplitz滤波器矩阵为
(1)
式中:Ki=「K/2⎤,「·⎤表示四舍五入,且K< (2) 式中:r表示接收到的信号。因此,滤波后的信号可以矩阵乘法的形式表示为 Sfilter(nrow)=Tr=T(s+n)。 (3) 显然,Sfilter是一个N阶向量。测量值由下式给出: y=XSfilter=XT(s+n)=φ(s+n)。 (4) 式中:X表示信号序列。滤噪核表示为 φM×N=XM×NTN×N。 (5) Toeplitz矩阵去噪能够较好地减小噪声对辐射源射频特征的影响,为提升低信噪比下辐射源识别性能起到了关键作用。 Welch功率谱算法是一种改进的周期图法,在Bartlett法的基础上进行了两方面改进。首先,当信号序列分段时,该算法可将相邻两段重叠以提高方差性能,同时使用非矩形窗函数提升谱估计的分辨率,达到进一步减小方差的目的。Welch功率谱算法如下: xi(n)=x[n+(i-1)k],0≤n≤M-1,1≤i≤L。 (6) 式中:0 图5 Welch算法分段方法 第i段信号的功率谱为 (7) 式中:U为归一化因子,w(n)为非矩形窗函数。则信号的Welch功率谱定义为 (8) Welch功率谱估计在信号含有高噪声的情况下方差性能依然良好,Welch法定义的谱估计方差为 (9) 如果含有噪声x(n)的信号是平稳随机过程,则式(4)的协方差仅取决于r=i-j。公式(4)可以写成简单的求和表达式,即 (10) (11) 根据公式(11),Welch功率谱的方差减少到每段方差的1/L。然而,这些分段实际上是相关的,因此Welch功率谱的真方差大于公式(11)。在下文的结果验证中,也能够得出Welch功率谱对噪声的敏感度较低。这是因为频谱是直接对信号进行傅里叶变换,而Welch功率谱对信号序列进行每段的傅里叶变换,分割后再计算均值。 我们利用Welch功率谱算法得到了前同步码的功率谱,并用归一化幅度表示相对功率的大小。将功率谱与采用相同点数快速傅里叶变换(Fast Fourier Transform,FFT)的频谱进行对比(全频段功率信噪比0 dB时),如图6所示。对比结果表明分割信号序列可以明显改善方差性能,证明了公式(11)的结论,因此Welch功率谱相较频谱在低信噪比环境下能更够更好地提取信号特征。 (a)0 dB信噪比前同步码功率谱 (b)0 dB信噪比前同步码频谱 由于本文的特征数据为一维功率谱数据,因此我们构建一维卷积神经网络(1-Dimensional Convolutional Neural Network,1-DCNN)用于辐射源的个体识别。典型的卷积神经网络由卷积层、池化层、全连接层和输出层组成,1-DCNN与CNN的区别在于其特征的维度是一维,因此1-DCNN由一维卷积层、一维池化层、全连接层和输出层构成。本文所使用的网络结构如图7所示。 图7 1-DCNN网络架构 设S是由辐射源功率谱数据组成输入,Sl是第l层卷积层的输出,卷积计算方法为 (12) 在池化层中我们选用最大池化算法,对经过卷积层的数据进行降采样操作,从而降低运算的复杂度,提升学习效率。 全连接层的目的是将经过卷积层和池化层提取的特征重新组成一组,并输出为 δi=f(wipi+bi),i=1,2,…,k。 (13) 式中:δi表示第i个输出(共k个输出),pi为上一层的输出,wi和bi分别是第i个神经元的权重及阈值,f(x)为激活函数ReLU。 在神经网络的训练过程中,过拟合的问题不容忽视。为了抑制过拟合,本文在全连接层采用Dropout,有效抑制了过拟合的现象。 输出层利用Softmax分类器可以直接完成每一组输出的分类任务,每一个设备的识别概率为 (14) 式中:N为辐射源设备的总数,且所有概率之和为1。 卷积神将网络的损失函数通过Softmax的输出向量与实际的标签做交叉熵计算而来,损失函数的公式为 (15) 式中:yi′表示实际标签中的第i个值,yi为Softmax输出向量中的第i个值。 在网络反向传播过程中,使用Adam算法进行参数优化,利用参数的一阶矩估计和二阶矩估计动态调整每个参数的学习率,从而更新权值求得最优解[17]。 本文构建的卷积神经网络超参数如表1所示,其中输入为Welch功率谱数据(5 120×1),输出为分数向量(维度20×1)。 表1 神经网络超参数 为验证本文提出的模型在实际场景下的识别性能,我们将采集的有线I/Q数据按照文献[18]的处理方法,仿真出在典型城区瑞利衰落下传播的信号,并在信号中添加高斯白噪声。通过仿真,最终得到在瑞利信道条件下,全频段功率信噪比为-30~25 dB(信噪比以5 dB为间隔)、信号带宽与噪声带宽比值为1∶5时的标准化I/Q数据,如图8所示(以0 dB为例)。 图8 瑞利信道下0 dB信噪比前同步码I/Q数据 在Welch功率谱算法中,FFT运算点数对功率谱的分辨率有较大的影响。我们通过Welch算法得到基于5 120、10 240、20 480、40 960点FFT的功率谱数据(如图9所示),将其送入卷积神经网络训练并分析不同FFT点数Welch功率谱数据对识别效果的影响。 (a)5 120点FFT功率谱 (b)10 240点FFT功率谱 (c)20 480点FFT功率谱 (d)40 960点FFT功率谱图9 不同FFT点数Welch功率谱 神经网络的数据集为20个CC2530ZigBee发射器的1 000次传输的前同步码Welch功率谱数据,共20 000组。网络的训练数据集和验证数据集按5∶1划分。训练参数:batch-size为128,Dropout比率为0.5,学习率0.001,epoch为100轮。在不同FFT点数下的Welch功率谱数据对辐射源个体的识别率如图10所示。 图10 不同FFT点数Welch功率谱识别率 由实验结果分析可知,在信噪比高于0 dB时,不同FFT运算点数对辐射源识别率影响较小,在25 dB信噪比条件下,10 240点FFT的Welch功率谱对20个辐射源的识别率达到了98.88%,高于其他点数FFT运算Welch功率谱对辐射源的识别概率;当信噪比低于0 dB时,5 120点FFT的Welch功率谱数据对辐射源的识别性能明显下降,识别率低于其他对照组。 为了对比验证本文算法的识别效果,本文实验还采用了近年来热门的5种基于变换域的识别方式,即基于I/Q数据和卷积神经网络、基于频谱和卷积神经网络、基于短时傅里叶变换和卷积神经网络、基于积分双谱切片、循环谱切片的方法进行实验对比,分析不同算法的性能。瑞利信道下不同信噪比的各种辐射源识别方法的性能如图11所示。 图11 辐射源识别方法性能比较 由图11可知,在瑞利衰落条件下,当全频段功率信噪比大于20 dB时,不同算法对20个辐射源的识别能力相近,但是当信噪比较低时,各种算法的识别性能有明显的降低。本文所提出的基于Welch功率谱和卷积神经网络的辐射源识别算法在全频段功率信噪比为0 dB条件下仍有92.78%的识别率,在低信噪比条件下识别性能明显优于其他算法,证明了本文算法的优越性。 基于深度学习的通信辐射源识别逐渐模糊了辐射源特征提取和分类识别的界限,大大减小了之前凭借提取专家特征进行识别的束缚,能够提取更全面、本质的细微特征。本文通过分析常用通信协议的帧格式,利用Welch功率谱算法得到前同步码的功率谱并将其作为辐射源的特征,在保留辐射源所有的细微特征的同时避免了不同调制信息带来的干扰。因此,本文方法可推广到通信协议已知的各种辐射源识别场景中,具有良好的适用性。在先前的辐射源识别的研究中,信道和信噪比对识别效果的影响常常被忽略,而本文实验场景全部基于典型的瑞利衰落和不同信噪比模型,且经验证,本文方法在低信噪比的条件下识别效果明显优于其他算法,具有很好的鲁棒性。3 基于Welch算法的信号功率谱特征提取
3.1 Welch法估计信号功率谱
3.2 Welch功率谱在低信噪比下性能分析
4 卷积神经网络
5 实验分析
5.1 不同FFT点数Welch功率谱识别率
5.2 不同算法的识别效果
6 结 论