基于注意力残差网络的Wi-Fi设备的射频指纹识别
2022-06-11张凯郭剑黎胡军星任俊霞谭磊
张凯 郭剑黎 胡军星 任俊霞 谭磊
0 引言
随着计算机技术和通信技术的不断发展和日趋成熟,无线网络技术在军事和民用场景都有很重要的研究意义.无线网络通信技术为人类带来了巨大的便利,在推动科学技术发展的同时,也带来了一些安全隐患问题.当前的无线身份认证方式通常基于802.1x安全协议,该协议所存在的安全漏洞使其易受到统计分析攻击[1].因此,寻找一种新型的安全机制对用户和设备进行双重身份认证是非常重要的.近年来,越来越多的人开始致力于物理层技术的研究,提出了基于射频指纹[2]的设备认证方法,其原理是从无线设备的射频信号中提取得到射频指纹,借助这种体现设备物理层特征的射频指纹进行无线设备的身份验证,通过这种将射频指纹和生物指纹相结合的认证方案可以更好地增强无线网络的安全性[3].另外,在全球定位系统或来自卫星的GPS由于各种障碍物不能跟踪信号的情况下,还可以结合射频指纹技术进行室内行人定位[4].将射频指纹识别技术和行人航位推算技术结合,可以估算出更精确的行人位置,弥补传统定位系统的不足.
现代的射频设备认证相关研究主要基于瞬态信号、稳态信号等方向.基于瞬态信号的研究主要局限在于,瞬态信号是由无线发射机设备开关机时发出的瞬时信号,信号的持续时间非常短,通常是微秒级甚至亚微秒级,难以采集.稳态信号相比于瞬态信号持续时间长,易于采集和分析,但是实际环境更为复杂,采集的实验条件通常与实际应用场景中的环境条件有一定的差异,这是普遍存在的一个问题.另外,影响射频指纹识别性能的众多因素还有待研究,因此,从新的角度出发来思考和解决从稳态信号中提取设备的射频指纹特征具有长远的发展前景.
近年来,一些学者开始尝试使用机器学习技术对暂态信号、调制信号等产生的指纹进行设备身份识别,取得了一定的成果,但仍然存在不少问题.实验条件通常与实际应用场景中的环境条件存在着差异,Wi-Fi信号的信息离散、稀疏且存在噪声,降维的方法通常会损失部分信息,而使用二维图的卷积神经网络又很难避免过拟合,所以,以往的方法难以兼顾精度和泛化能力,鲁棒性通常较差.
本文针对特定的实际通信应用场景,提出了基于注意力残差网络的Wi-Fi设备指纹认证技术.残差网络[5]使用低于传统卷积神经网络的参数量,实现深层网络的训练,可以加速神经网络的收敛.使用残差网络构建深层的网络结构用于Wi-Fi设备指纹认证,可以降低过拟合的风险,从而提高识别准确率.瓶颈注意力模块[6]的提出,是为了关注图像中的重要特征,抑制不必要的特征,提高模型的表达能力.利用其提取重要特征的能力,通过提高离散指纹信息的权重并抑制噪声的影响,可以有效应对Wi-Fi信号的离散信息和噪声,获得更好的识别效果.通过制作数据集,改进模型和验证,最后在32个Wi-Fi设备进行了射频指纹识别的测试,取得了超越卷积神经网络和传统特征提取方法的性能,提升了准确率和鲁棒性.本文的主要贡献有:
1)提取Wi-Fi信号的二维射频频谱图像特征作为Wi-Fi信号指纹特征,提取数据对象包含30个以上的Wi-Fi模块,覆盖802.11b标准的2.4 GHz模块.
2)针对二维射频指纹图像的稀疏性特点,分别添加空间和通道上的注意力机制,构建了面向Wi-Fi信号识别的注意力残差网络.
3)制作了覆盖802.11b标准的2.4 GHz模块Wi-Fi射频数据集,对不同设备数量、采样率以及不同信噪比下高斯噪声进行了对比实验.实验结果表明,本文改进的注意力残差网络相比于卷积神经网络方法和传统特征工程方法均有更好的准确率和鲁棒性.
1 相关工作
Tekbas等[7]利用设备开关的暂态特征实现设备身份的指纹识别,最后利用概率神经网络对设备指纹进行识别,取得了一定的效果.Brik等[8]利用无线网络设备的调制信号识别技术来进行设备身份认证.Danev等[9]首次提出了基于调制信号和频谱响应信号的射频设备物理层认证技术.射频指纹(RFF)这一概念最早出现于文献[2],他们通过提取蓝牙通信信号中的射频指纹,进行蓝牙无线设备的识别.随着射频指纹提取技术的研究不断深入,出现了多种射频指纹的提取、分类和识别方法.由于无线信号可以分为瞬态信号和稳定信号,因此相应的射频指纹识别技术也可以分为基于瞬态信号和基于稳定信号两大类[10].1995年,Toonstra等[11]在对VHF(Very High Frequency,甚高频)FM(Frequency Modulation,调频)发射机的研究过程中,提出了一种从瞬态信号中提取出用于识别发射机的特征的方法.瞬态信号研究,在过去十几年有了充分的发展[12-13].虽然瞬态信号能够体现一个无线发射机设备独特的硬件特征,但是瞬态信号是由无线发射机设备开关机时发出的瞬时信号,系统设备需要精确检测可识别信号的起始与结束,这部分信号的持续时间非常短,通常是微秒级甚至亚微秒级,很难采集.此外,精确检测瞬态信号的起始点难度大,并且存在瞬态射频指纹特征受环境、信道变化的影响较大等问题[14].2008年以后,研究者开始更多关注基于稳态信号的射频指纹提取.Kennedy等[15]首次对基于稳态信号的射频指纹提取进行了研究.在其研究中将通用移动通信系统的前导信号变换为频谱,并以此作为设备的射频指纹用于通用移动通信系统设备的识别.之后,稳态信号提取的射频指纹识别技术也得到了关注,并取得了一定的成果[16-18].近年来,有许多研究利用机器学习算法识别设备指纹,从而实现设备身份的认证[19].赵翔等[20]将直流电PWM整流器的电压波形信号做为输入,利用深度神经网络实现了故障识别.李晓波等[21]利用小波变换提取电弧信号特征,提出一种基于深度神经网络的配电网单相接地故障识别.许立武等[22]对扰动信号做不完全S变换,提取电能质量扰动信号的特征,构建深度前馈网络扰动分类器实现了扰动识别.贾济铖等[23]使用围线积分方法将二维双谱降维至一维,再使用SVM进行分类识别.Ding等[24]将双谱作为 RFF,使用卷积神经网络用于设备识别.Pan等[25]使用希尔伯特-黄变换处理信号后再利用深度卷积网络进行识别.
虽然现有研究探索了许多射频指纹识别的方法,但仍存在一些问题.主要体现在:1) 传统方法虽然在特定设备的射频识别上有较好的精度,但射频设备类型繁多,当设备数量较大且类型较多时,传统方法会体现出泛化能力不足、精度下降的问题;2) 当前使用机器学习实现射频指纹识别的研究较少,且射频数据不足,缺乏基于数据特征针对性的改进,在识别精度上相对传统方法提升不大.
2 基于注意力残差网络的射频指纹识别
2.1 射频指纹识别总体方案设计
通常,射频设备识别系统由五部分构成:辐射源设备、信号采集装置、预处理模块、指纹特征提取模块、分类识别模块.信号采集装置通常为示波器、频谱仪及软件无线电等无线信号接收装置,通过对设备参数的合理配置来采集辐射源设备的无线信号;预处理模块的功能是通过信号的截取、功率归一化等处理方法,将采集的无线信号处理成可以进行射频指纹特征计算提取的有用信号段;指纹特征提取模块是通过各种信号处理方法对预处理后的信号进行信号域的变换,并设计算法计算得到射频指纹特征;将该射频指纹特征输入分类识别模块进行辐射源设备的识别,即可得到待识别辐射源设备的身份.信号识别部分是该系统的核心部位.本文基于注意力残差网络实现信号识别,进一步提高信号的识别精度.本文将基于深度学习的方法与射频指纹识别过程相结合,其基本系统框图如图1所示.
图1 射频指纹提取与分类识别系统框图Fig.1 Block diagram of RFF extraction and identification system
2.2 基于双谱变换的射频指纹提取
双谱是现代信号处理高阶统计分析中应用广泛的特征,本文采用非参数化双谱估计法提取双谱二维图像作为射频指纹[24].
1)每个设备采集到的信号数据有N个信号观测值,记为{r(i),i=1,2,3,…,N}.
2)将信号数据平均分为K段,每段包含L个观测值,记第k段信号的L个观测值为rk(1),rk(2),…,rk(L),k=0,1,…,K.
3)计算每段信号的离散傅里叶变换系数:
(1)
式中,λ=0,1,…,L/2.
4)计算三阶相关函数:
Rk(λ2+i2)Rk(-λ1-λ2-i1-i2),
(2)
式中,0≤λ2≤λ1,λ1+λ2≤fs/2,fs为采样频率,Δ0=fs/N,N0与M1满足L=(2M1+1)N.
5)取所有信号段的三阶累积量的平均值作为该组数据的三阶累计量估计值,得到双谱估计图像:
(3)
2.3 基于注意力残差网络的指纹特征分类
残差网络[5]的提出,在深度学习领域很好地缓解了模型冗余、易过拟合和梯度消失等问题.残差结构是训练深层卷积神经网络的一种有效策略.然而,二维射频指纹中包含的有效信息较为稀疏,且包含不确定的噪声,仅使用深层的残差网络进行训练很可能导致过拟合,对噪声的适应能力较差.为解决以上问题,本文对网络模型的改进如下:
1)注意力机制如同人会把焦点目光聚集在图像的重要物体上一样,在网络的前向传播过程中,我们将在空间和通道两个路径上添加注意力机制,使网络能够更关注指纹图像中的有效空间信息.本文在残差网络中添加了瓶颈注意力模块(Bottleneck Attention Module,BAM)[6].BAM模块由三条路径组成,分别是空间注意力、通道注意力和直连的跨层路径(图2).其具体工作机制如下:
图2 BAM 注意力模块Fig.2 Bottleneck attention module
对于任意的输入特征图F∈RC×H×W,都可以得到一个空间注意力特征图As(F)∈RC×H×W和通道注意力特征图Ac(F)∈RC×H×W,并由式(4)计算得到精炼后的特征图F′∈RC×H×W:
F′=F+F⊗σ(As(F)+Ac(F)),
(4)
式中⊗为逐元素相乘,σ为Sigmoid函数.As(F)和Ac(F)的计算方法分别如下:
(5)
Ac(F)=BN(Fc(AvgPool(F))),
(6)
式中f为卷积操作,上标为卷积核尺寸,Fc为全连接层.通过注意力模块精炼特征图的方式,让神经网络更关注射频指纹的有效信息,提高对噪声的适应能力.通过添加BAM注意力机制可以使网络更加关注内部特征的相关性,能够自适应地提取注意力图并细化特征.
经改进后的注意力残差单元如图3所示.其中,x表示上一层的特征输入,F(x)为残差学习后的输出,y为最后整个残差单元的输出,BN为批归一化层[26],BAM为注意力模块.
图3 改进的注意力残差单元Fig.3 Improved attention residual block
2)传统的卷积神经网络中通常会在输出层直接连接全连接层,而所占参数量非常大且易过拟合.为进一步解决过拟合,本文采用全局平均池化层[27](Global Average Pooling)代替网络的全连接层,通过全局平均池化层与最大池化层相融合的池化操作,网络既可以捕捉到全局信息,又可以学习到更细节的特征.
图4 改进注意力残差网络结构Fig.4 Improved attention residual network structure
(7)
式中pj表示全连接层第j个网络节点输出值.
3 仿真实验与结果分析
3.1 数据集及实验环境介绍
本次实验中采用的硬件环境配置为Intel(R) Core(TM) i7-9700 CPU 64位处理器、32 GB内存,并采用GTX 2080运算加速,操作系统为Ubuntu 16.04.数据处理方法为按1 000点的长度信号从头截取,训练集测试集随机拆分,拆分比例为9∶1,损失函数采用交叉熵函数,优化器采用Adam.设置初始学习率为0.001,最大训练轮数为40轮.
数据集为2.4 GHz Wi-Fi模块的Beacon帧信号,来源于Kaggle开源数据(http:∥www.kaggle.com/).在channel 1、2、3、5、6号传输信道使用40、80和160 MHz采样率进行基带信号采集,并使用FSW13及FSV7频谱仪以及FSQ频谱仪设备进行补充采集.基于2.4 GHz Wi-Fi模块构建的数据集如表1所示.
表1 2.4 GHz Wi-Fi模块数据集
3.2 对比实验结果
为进行充分的分析和验证深度学习算法的性能,本文将注意力残差网络、基于积分双谱变换的传统算法[23]以及卷积神经网络(CNN)方法[24],在同等实验环境下进行了对比,实验结果如表2所示.
表2 不同的算法在数据集的识别精度
传统算法的射频指纹识别方法在不同采样率、不同信道环境、不同信号采集方式下有较好的识别效果.基于卷积神经网络的方法在多种工况下超越了传统算法,具有一定的鲁棒性.而本文提出的注意力残差网络的方法的识别精度大多超过90%,均高于卷积神经网络的方法和积分双谱变换法.
3.3 性能分析
本节主要进行射频指纹识别系统的性能仿真测试,包括识别设备数目、高斯噪声信噪比(SNR)对系统识别性能的影响.
3.3.1 待识别设备数目影响测试
设备数量的增加会增大识别难度,实验结果如图5所示.随着待识别设备数目的增加,识别率会有所下降,但在进行32个Wi-Fi模块的识别时注意力残差网络依然可以达到约90%的识别精度,高于积分双谱变换算法86%和卷积神经网络89%的识别率,说明基于注意力残差网络的方法具有一定的进行大量设备准确识别的潜力,相较于传统方法,更能抵御由于设备数目增大带来的负面影响,鲁棒性更强.
图5 不同设备数量的识别率曲线Fig.5 Recognition rate curve for different number of devices
3.3.2 不同SNR下高斯白噪声的影响
本文通过在实际数据集中以不同SNR加入高斯白噪声来模拟有噪信道,并测试这种影响下射频指纹系统的识别性能.使用MATLAB的awgn信道模型进行仿真实验.
实验结果如图6所示.采样率对积分双谱变换法受不同的识别精度产生较大影响,卷积神经网络法受采样率变换影响较小,而注意力残差网络法除-5 dB 时160 MHz采样率的识别精度略微下降,其他SNR下几乎不受采样率的影响,当SNR大于20 dB时可以达到96%的识别精度,表现出了很好的准确度和鲁棒性.
图6 射频指纹识别精度随SNR变化曲线Fig.6 Curve of RFF recognition accuracy change with SNR on sampling rate of 40 MHz (a),80 MHz (b) and 160 MHz (c)
4 结束语
本文采用注意力残差网络对数据进行了识别并取得了优异的识别效果.在同等实验条件下,相比于传统方法和卷积神经网络方法,注意力残差网络拥有更好准确率,并且具有很高的鲁棒性.但该网络计算量较大,下一步将着力于构建轻量化的网络结构,使算法更具实用性.