基于射频指纹的物联网设备身份识别方法
2020-08-19刘念任佳鑫韩晓艺刘铭
刘念,任佳鑫,韩晓艺,刘铭
(北京交通大学计算机与信息技术学院,北京100044)
0 引言
近年来,随着无线网络、人工智能、大数据等技术的迅猛发展,各类物联网应用不断涌现,成为第五代移动通信网络(5G)中主要支持的三大应用场景之一[1]。在物联网应用范围不断扩大、设备数量飞速增长的同时,其所具有的安全问题也日益突出。一方面,由于无线网络本身的开放性,使得恶意用户能够通过一定手段伪装身份,获取进入网络的权限,进而干扰或破坏合法用户的正常通信,严重威胁无线网络安全。另一方面,随着计算机技术的发展及密码破译技术的不断升级,传统的基于密码协议或用户身份信息的高层身份鉴别机制受到了越来越大的挑战。因此,需要提出一种更可靠的设备身份识别方法,以保障无线通信过程中的信息安全。
射频指纹,因其来自于无线设备内部的硬件差异,表征了设备本身的物理层特征,具有个体唯一性且难以篡改,可以作为识别不同无线设备的依据,受到了越来越多的关注[2-3]。构建射频指纹的信号特征是从可识别信号中提取的。依据可识别信号所处状态,可将射频指纹分为两类,即基于瞬态信号特征的射频指纹和基于稳态信号特征的射频指纹。
基于瞬态信号的射频指纹技术,主要是指发射机开启瞬间,信号发射功率从零上升到额定功率这一阶段的信号变化特征。这部分信号不会携带任何与数据有关的信息,仅和发射机硬件特性有关,具有数据独立性。由于瞬态信号的持续时间极为短暂,因此在进行指纹提取之前需要对信号起始点进行精确地检测[4]。常用的起始点检测方法有:门限检测方法[5]、Bayesian阶跃变点检测方法[6]、Bayesian 渐升变点检测方法[7]、方差轨迹法[8]、排列熵方法[9]等。初期的射频指纹提取和识别技术的研究均围绕瞬态信号开展。可提取的信号特征包括瞬态信号持续时间、频谱特征、小波域特征、分形维数以及信号包络等。基于瞬态信号特征的射频指纹提取技术往往需要采用高精度设备进行高速信号采集,信号的捕获和分离较为困难,故实际使用的难度较高。
基于稳态信号的射频指纹依据的是稳态信号的变化规律,相比瞬态信号来说更容易获取,特征也更稳定。得益于以上优点,近年来的研究焦点也逐渐转向基于稳态信号的方案。具体可分为基于频域特征的方法[10]、基于调制特征的方法[11]、基于非线性特征的方法[12]、基于其它变换域的方法[13-14]以及基于信号统计量的方法[15]。总体而言,当前利用射频指纹进行身份识别的研究主要考虑单一的通信方向,即侧重于对用户终端身份的鉴别[16-18],尚未考虑网络中心节点可能遭到恶意入侵的风险。因此存在着严重的安全隐患。物联网设备受限于自身硬件特征,结构相对简单,计算能力不足,更容易受到伪装成中心节点的恶意用户的攻击,安全隐患更为突出。为了解决该问题,本文通过研究通信双方射频指纹间存在的互易规律,提出了一种适用于物联网场景的下行方向身份识别的方法。
1 射频指纹
1.1 射频指纹产生机理
图1 展示了一种典型的数字发射机结构。基带信号经过数字信号处理之后进入模拟电路部分进行调制,得到的射频信号最终通过天线发射。信号调制由模-数转换器、正交调制器、上变频器、功率放大器等模拟电路完成。而射频指纹即源于上述模拟电路中元器件的固有差异。
图1 射频指纹产生机理
在实际的生产、制造过程中,由于存在设备元件差异和硬件加工工艺误差等,无线设备的电学参数和标准值之间存在着不可避免的容差。这些容差的存在,使得即使是同一厂商生产的同一型号的设备,也会存在某些细微的差别。这种硬件上的差异会对所发送的射频信号产生不同的影响。因此,通过分析接收到的射频信号,便可以提取出发射该信号的无线设备所特有的特征,这种特征被称为射频指纹。由于射频指纹中所包含的特征仅由无线设备自身的固有硬件差异所决定,而与无线信号所承载的信息无关,因此可以用来识别无线设备,防止恶意用户仿冒身份,实施攻击行为。
1.2 射频指纹互易性
现有的基于射频指纹的设备身份识别方法仅针对单一的通信方向。即通信的一方若是想要验证另一方的身份,便需要对其射频指纹特征进行学习。若通信双方均需要验证对方身份,则需要双方各自开展独立的学习过程,以掌握对方的射频指纹特征。在具体的物联网场景中,上行通信方向的身份验证,需要物联网中心节点通过学习物联网设备的射频指纹来验证其身份;反之,在下行通信方向上,物联网设备若要验证中心节点的身份,则也需要对中心节点的射频指纹进行学习。
然而,这种传统的设备身份识别方法需要基于一个重要前提,即进行通信的收发信机双方都具有提取射频指纹的信号处理能力以及对身份识别算法的学习能力。而在物联网的场景下,通信双方存在着电源续航、业务流量、存储计算能力等多重不对称性。物联网中心节点具有较强的信号处理、运算能力,能够完成对物联网设备的射频指纹提取和身份识别算法的学习,从而保障上行通信方向的通信安全。而结构简单的物联网终端设备难以胜任对物联网中心节点的射频指纹学习任务,因此在下行通信方向无法使用射频指纹技术增强其通信的安全性。
针对这一难点,本文提出将物联网设备所需完成的学习任务迁移到物联网中心节点完成。具体地,通过研究通信双方的射频指纹之间存在的对应规律,发现基于无线信道的互易性,双向通信链路的射频指纹也具有一定的互易性。众所周知,无线通信的上下行信道具有一定的互易性,主要表现在上下行两个方向的信道响应具有相似的衰落特性、多径特性。因此,时分双工系统中可以利用某个方向上的信道估计结果进行另一个方向上的预编码、波束赋形等操作[19]。类似的,通信链路的双向加密也可以基于这种相似的信道统计特性来实现[20]。双向通信链路在统计特性上的相似性实际表明了无线传播环境、收发双方的射频电路均具有相似的特征。这从本质上保证了由收发双方射频电路所决定的射频指纹也会具有一定的相似特性。需要注意的是,在实际通信过程中,收发双方的射频链路中的元器件可能存在一定规格的差异,从而对射频指纹的互易性造成不同的影响。如收发双方采用不同精度的数模转换器会产生不同的量化噪声,使用不同的采样率也会造成射频信号表示的差异。这类器件规格的差异是不互易的,但由于进行通信的收发设备是确定的,这类不互易的差异在信号的表示中通常是大尺度的、稳定的,因此可以通过对双向通信的信号样本进行学习来获得,故收发双方的射频指纹在整体上仍具有互易性。
图2 多对收发设备基于差分星座轨迹图的射频指纹
为了进一步验证射频指纹互易性,本文通过对软件无线电设备HackRF One 进行信号样本采集、处理,得到如图2 所示的差分星座轨迹图。由图可以直观地看出,不同组合的收发双方间射频指纹均存在上下对称的镜像特征。通过对10 个HackRF One 两两组合进行交叉实验,发现基于差分星座轨迹图的射频指纹在通信双方间均存在此类稳定的对应关系。证明了从根本上来说,基于无线信道的互易性,上下行方向上的射频指纹也具有一定的互易性。简单来说,射频指纹互易性描述的就是通信双方的射频指纹间存在的某种稳定映射关系。通过利用这种互易关系,能够在已知的通信一方的射频指纹的情况下,施加一定的变换手段推出另一方的射频指纹。以此为依据,本文提出了一种适用于无线物联网的下行方向身份鉴别方法,以提高无线物联网的安全性。
2 算法设计
2.1 算法思想
本文所提出方法的核心思想是,基于射频指纹互易性,将下行方向物联网终端设备的身份鉴别任务交由上行方向的网络中心节点完成,以适应无线物联网在设备能力、数据流量等多方面不平衡的特点。具体可分为两个任务,一是设计射频指纹变换网络,将中心节点所收集到的终端设备的射频指纹转换成能够反映中心节点自身身份的射频指纹,也即实际终端设备视角的射频指纹。二是设计射频指纹分类器,对利用变换网络生成的网络中心节点的射频指纹进行特征提取和学习。需要注意的是,以上两个网络的训练任务均由该物联网中的中心汇聚节点来完成。且在训练完成之后,需要将训练好的分类网络的架构及参数安全下发给物联网终端。在实际的通信过程中,终端设备只需在接收到中心节点发来的信号后,提取出射频指纹,并利用训练好的分类网络对该射频指纹所对应的中心节点身份的真伪做出判断,即可实现下行方向身份鉴权的目的。
2.2 网络结构
本文设计的下行方向身份鉴别网络模型如图3 所示。该模型主要分为两部分,第一部分是基于自动编码器(AutoEncoder)的射频指纹互易变换网络,第二部分是基于卷积神经网络(Convolutional Neural Networks,CNN)的射频指纹分类网络。
图3 物联网下行方向身份鉴别网络模型
射频指纹互易变换网络,作用是完成利用通信一方的射频指纹产生另一方的指纹。该网络主要由自动编码器组成,包括一个编码器和一个解码器,编码器GE用于对输入指纹进行高维特征抽取,得到一个潜在向量z,解码器GD用于利用潜在向量z 重构出一个射频指纹。输入的训练集D={(X1,Y1),(X2,Y2),…,(XM,YM)}表示包含M对上下行两个方向的射频指纹的集合,其中XM表示终端设备的射频指纹,YM为期望学到的与终端M相对应的物联网中心节点的射频指纹。通过训练,该网络能够学习到收发双方射频指纹间存在的潜在对应关系,从而利用一方的射频指纹生成另一方的射频指纹。
射频指纹分类网络,是基于CNN 的二分类网络。旨在通过有监督学习的方式,完成对射频指纹特征提取的任务,实现对设备身份合法/非法性的判别。该CNN 网络模型包括:两个卷积层、四个ReLU 层、两个池化层和三个全连接层。详细的网络参数设置如表1所示。
表1 基于卷积神经网络的射频指纹分类网络详细参数
3 算法性能分析
3.1 实验设计
为了使得所提出的算法能取得较好的实际应用价值,本文中的所有实验数据均由真实环境采集获得。具体地,考虑由10 个HackRF One 软件无线电设备组成的物联网应用场景。第一步,通过搭建相应的软件无线电平台,实现对蓝牙信号的模拟收发,并按照10倍过采样率完成信号的采集。第二步,对采样数据进行数据处理,提取基于多差分间隔星座轨迹图的射频指纹。第三步,利用设计好的网络模型进行相应的性能测试。为了更好地模拟真实应用场景,本文对数据集进行人工划分,划分原则为:每次任意选取一个设备作为非法中心节点,组成一个数据集。例如,数据集Abn1 对应着把1 号设备作为非法中心节点,其他设备作为合法中心节点。以此类推,得到Abn2,…,Abn10共十个数据集。每个数据集中,选取全部信号样本的80%作为训练集,20%作为测试集,进行网络性能的测试。实验使用的数据处理软件平台为MATLAB R2017b,神经网络的训练在PyTorch v0.4.1 框架上完成,并通过Adam 优化算法进行网络优化,动量取值分别为β1=0.9,β2=0.999,初始学习率为0.0001,每一批次大小为128。
3.2 实验结果
图4 展示了部分利用射频指纹互易变换网络生成的图像。其中real 表示真实采集到的射频指纹,也即期望学习到的目标指纹;single-generate 和mix-gener⁃ate 分别表示利用单互易变换网络、多互易变换网络生成的重构指纹,即互易变换网络最终的学习结果。两种网络的模型架构完全相同,区别之处在于输入的训练数据所包含的设备种类数。其中,单互易变换网络意为进行通信的每一对收发设备都拥有自身独立的变换网络,输入数据中仅包含这一对特定通信设备的信息。而多互易变换网络则表示处于同一物联网场景的多对用户共用同一个互易变换网络,其输入数据中包含了多对通信设备的信息。总的来说,两种互易变换网络各有所长。单互易变换网络可以对多种不同的互易特征进行独立学习,针对性更强;而多互易变换网络能够对互易特征相同的多组设备进行联合学习,泛化性更强。
图4 互易变换网络生成的图像和真实图像的对比图
通过与真实采集到的图像进行对比可以看出,所设计的射频指纹互易变换网络能够很好的学习到通信双方射频指纹之间存在的互易特征,实现了在已知一方射频指纹的情况下重构出另一方射频指纹的目的。
图5 不同非法中心节点下分类网络识别准确率
为了进一步验证利用射频指纹互易变换网络生成的射频指纹的质量,本文利用射频指纹分类网络对所生成的指纹进行身份识别。图5 展示了分类网络对真实采集到的数据(real)、单互易变换网络生成的数据(single-generate)以及多互易变换网络生成的数据(mix-generate)进行识别的结果。横坐标表示不同设备作为非法中心节点的情况,纵坐标表示相应的识别准确率。
由图5 可以看出,一方面,分类网络对实际采集到的真实数据(real)的分类精度最高能达到100%,最低不小于95%,说明该分类网络具备识别物联网中设备身份是否合法的能力。另一方面,无论是利用单互易变换网络(single-generate)还是多互易变换网络(mixgenerate)生成的数据,都能够达到与真实数据的分类误差不超过2.5%的分类精度。由此可以说明,所设计的射频指纹互易变换网络能够学习到通信双方射频指纹间的互易特性,具备对上下行链路的射频指纹进行转换的能力。此外,在所有数据集上,基于单互易变换网络生成的数据都能够取得比基于多互易变换网络生成的数据更高的识别率。
图6 展示了对真实采集到的数据和利用多互易变换网络生成的数据在不同信噪比下的分类准确率曲线。图中横坐标代表信噪比,纵坐标代表分类准确率。整体来看,随着信噪比的增加,两条曲线的分类准确率都呈现增加趋势。这是由于信噪比越高,信号的接收质量越好,射频指纹中包含的干扰和噪声的影响越小,因此有利于提高分类效果。当信噪比大于等于20db 时,两类数据均能取得高达100%的分类准确率。而在信噪比为10db 时的较低信噪比情况下,两者也能达到不低于92%的分类准确率,且基于多互易变换网络生成的数据整体的分类性能要略优于真实采集到的数据。
4 结语
物联网由于受到设备硬件资源和网络资源的限制,潜在的通信安全问题愈发突出。现有的基于射频指纹进行设备身份识别的方法仅能支持单向身份识别,未充分研究网络中心节点身份存在非法的风险,因而无法很好的满足物联网的需求。针对上述不足,本文提出了一种物联网场景下基于射频指纹的下行方向设备身份鉴权方案。核心思想是通过利用通信双方间射频指纹存在的互易特性,将下行方向的身份识别任务转移到上行方向来完成。该方法充分考虑了物联网场景中终端设备及网络中心节点间的多重不对称性,具有很好的实际应用价值。实验结果表明,所提出的方法能够达到很好的识别性能,弥补了传统单向鉴权中存在的安全漏洞,进一步提高物联网安全。