基于双谱LLE降维的PUE攻击检测
2015-06-23马强郑文秀卢光跃
马强,郑文秀,卢光跃
(西安邮电大学 通信与信息工程学院,陕西 西安 710061)
基于双谱LLE降维的PUE攻击检测
马强,郑文秀,卢光跃
(西安邮电大学 通信与信息工程学院,陕西 西安 710061)
针对认知无线电中的主用户仿冒攻击检测问题,给出了基于矩形积分双谱的局部线性嵌入降维算法,用于识别主用户(PU)和仿冒用户(SU)。选择矩形积分双谱作为识别特征参数,利用局部线性嵌入算法(LLE)进行特征数据约简,通过基于核函数的支持矢量机(SVM)进行个体识别。实验结果表明,该方法具有较高的识别率,并能够较好解决PUE攻击检测问题。
通信辐射源;矩形积分双谱;局部线性嵌入算法;支持矢量机;PUE攻击检测
0 引言
由于认知无线电技术不仅可以提高频谱利用率,而且具有感知能力,其应用范围不断扩大。但认知无线电存在一些安全问题,其中危害最大的是主用户仿冒攻击(Primary User Emulation Attack,PUEA)即仿冒用户(SU)仿冒主用户(PU)从而达到长时间占用信道的目的。
现有的PUE攻击检测方法主要有以下几类:基于无线定位和卡尔曼滤波的检测方法,需要预先定位和跟踪主用户的物理目标位置和运动信息,以区分主用户和攻击者。但是这样的条件限制使其无法工作在主用户移动规律(如速度等)或者位置信息不可知的授权网络中。基于能量指纹匹配的检测方法,依赖于感知节点和主用户的相对位置。当相对位置改变时,能量指纹也随之而改变。这种方法只适用于静态的认知网络。基于加密策略的检测方法是通过增加用户的密码认证机制来实现区分主用户和仿冒用户。这种方案势必会增加认知网络的时间开销和授权复杂度。所以,现有的PUE攻击检测方法对于移动认知网中认知用户的动态识别表现不佳。
SU的信号调制方式、码速率、载波频率等信号参数会模仿PU的信号参数,但信号终究是由不同辐射源发出,信号波形中势必会存在不同程度的差异特征,如交叉调制、寄生调制、器件的非线性特征等。本文通过辐射源识别进行PUE攻击检测,采取了一种基于积分双谱[1-4]和局部现行嵌入算法(LLE)[5]的通信辐射源识别算法,仿真结果表明该算法能够很好地降低SIB的冗余信息,对通信辐射源有较高的识别率。
1 基于SIB的通信辐射源特征提取
高阶谱由于具有时移不变性、尺度变化性和相位保持性,还可以抑制高斯噪声,因此在辐射源识别中应用广泛。双谱是阶数最低的高阶谱,处理方法最为简单而且运算量较小。
假设通信辐射源稳态信号为x(t),则其三阶累量为:
式中,上标*表示复共轭。双谱定义为:
信号的双谱变换将数据量从一维变换成为二维,从而带来了数据量的复杂化。双谱的冗余信息若直接作为信号特征会使得识别概率降低,不仅增加运算量,识别效率也会随之降低。因此,必须考虑进行数据降维。
采用矩形积分双谱(SIB)的方法进行信号双谱积分降维[6,7],定义为:
式中,sl为积分路径。SIB同时满足尺度变化性、相位保持性和时移不变性,信号所有的双谱值全部参与运算,并且没有重复使用,从而能够获取目标识别中的重要信息。对计算出的信号双谱进行矩形积分计算,如对双谱平面上矩形积分采用l条积分路径,于是信号样本所对应的信号双谱特征向量的维数为l维。
SIB在实际计算时需要计算整个双谱平面的双谱值,不仅得到的数据量较大,而且增加了分类器的规模,并影响分类的准确性、降低了分类器的鲁棒性。为了能够提取分类能力强的低维本质特征,本文采用局部线性嵌入算法(Locally Linear Embedding,LLE)对SIB特征参数进行降维。
2 改进的LLE降维分析
LLE是Roweis和Saul[8]于2000年提出的一种非线性降维方法,将全局的非线性转换成局部的线性,并且重叠的局部区域能够体现全局结构的信息。它可以使降维后的数据充分保持原有数据的拓扑结构。LLE方法主要包括3步:①用欧氏距离计算高维空间的每个样本点的K个近邻点;②根据样本点的近邻点计算该点和其他点之间的局部重建权值矩阵;③根据样本点的局部重建权值和其近邻点计算出该样本点的输出值。LLE算法所需输入的参数很少,其最重要的参数就是近邻参数K和本征维数d。K的选取对LLE算法的映射质量影响很大,K过大会造成整体流形结构消除,K过小使连续的流形结构成为分离的流形结构。本征维数d的选取经常是通过经验来获得,本征维数d过大就会将较多的噪声包含进来,相反d较小则会使得降维后的数据包含较多的重叠信息。
2.1 改进的样本点距离计算方法
传统的LLE降维方法是通过计算每个样本近邻点的欧式距离,但是由SIB得到的高维双谱特征数据往往是非线性分布的,依然采用欧氏距离来计算样本近邻点的距离不是十分合理。这会造成我们重建权值矩阵和样本点的输出值不能很好地反映出通信信号双谱的拓扑特征。
本文将采用测地距离[9-11]来替代欧氏距离,测地距离能够反映非线性数据样本点之间的位置关系。由于测地距离加入了样本空间分布形状的先验信息,当样本分布为曲面形状时,测地距离更能真实地度量样本之间的相似性程度。流形上的样本点xi与近邻点的欧氏距离如图1所示;xi与近邻点的测地距离如图2所示;所以在利用测地距离时就可以将“远点”排除在外。
图1 样本点xi与近邻点的欧氏距离
图2 样本点xi与近邻点的测地距离
具体计算步骤如下:
①在取样本点xi的近邻点时,先用欧氏距离‖‖计算xi与近邻点之间的距离Dij;
②将Dij按由小到大的顺序排列,取前K2个点;
③用测地距离重新计算这K2个点的距离,K<<N。当xi与近邻点的距离足够近时可以用欧氏距离逼近;当xi与近邻点的距离较远时,可以用欧氏距离的叠加来代替两点之间的测地距离;即:
xi与相离较远点之间的测地距离可用叠加的方法计算,设t=1,2,…,K2,则通过如下迭代计算所有的Dij:
根据求得的Dij按由小到大排列,取前K个点近邻点。由得到的K个近邻点可以计算局部最优化重建权值矩阵,将所有样本点映射到低维空间中时映射条件满足下式:
式中,ε(Y)为损失函数值,yi是xi的输出向量,yij(j= 1,2,…,K)是yi的K个近邻点,且满足以下约束条件:
式中,M是一个N×N的对称矩阵,表达式为:
如果要使得损失函数ε(Y)达到最小,则取Y为M的最小d个非零特征值所对应的特征向量作为输出维数。
2.2 输出维数d算法
输出维数d的取值对低维空间的映射结果有很大影响:d取值过大使映射结果含有过多噪声;d取值过小使得本来不同的点在低维空间中可能会彼此交叠,这都不利于通信信号侦查。传统的d值估计主要有映射方法、几何学习方法和统计学习方法等。但是这三类方法计算过于复杂。对局部线性低维流形可以采用线性的分析手段,通过其主要特征的维数来表征局部数据的维数。根据这种思想,采用主元分析法(PCA)来对局部数据进行维数约简,根据局部数据约简后主元的个数取其均值,从而得到输出维数d。
实现步骤如下:
③令k=k+1,如果k≤N,那么重复步骤②;否则,执行步骤④;
④令DIM={d1,d2,…,dN},统计DIM中各维数数目,确定一个一致的输出维数估计值
3 核函数SVM的设计及分类方法
通信辐射源识别中所获取的信号样本数量有限,计算信号样本的矩形积分双谱,对双谱值进行LLE降维,从而得到约简后的信号特征,此时由于得到的特征数目比较少,而支持矢量机(SVM)[12]只需少量样本就可以构成最优分类器,故本文采用SVM进行分类识别。SVM思想是通过某种事先选择的非线性映射将输入矢量映射到一个高维特征空间,在这个空间中构造最优分类超平面。
SVM对于线性训练样本的决策函数为:
式中,sgn(·)为符号函数;q为支持向量的个数; ωi(i=1,2,…,q)为权系数;K(xi,xj)为核函数。只要满足Mercer条件的实对称函数都可以作为核函数,不同的核函数会产生不同的识别效果。本文采用高斯径向基函数K(xi,x)=exp(-‖x-xi‖2/σ2)是局部性较强的核函数,其中xi为核函数中心,σ为函数的宽度参数,控制了函数的径向作用范围。通过多次试验不同的参数σ得到不同的识别率,如图3所示。
由图3可知,当高斯核函数参数σ=2时分类识别的效果最好,具有较高的正确识别率。因此,本文选择σ=2。
SVM的本质是二分类,通常做法分为2类:一对一方法(One Against One,OAO)和一对多方法(One Against All,OAA)。一对多方法在调制集合元素数目较少时,识别率较高,但是易产生误判或无法判别的情况;一对一的方法识别率在低信噪比下仍较高,解决分类数目较少的识别问题,性能优良。所以,本文采用OAO的分类方法,对M个辐射源进行识别,则总共需要M(M-1)/2个分类器。
图3 不同参数σ时SVM识别率
综上所述,通信辐射源个体识别的步骤如下:
①对通信辐射源信号进行采样并做幅度归一化和零均值化的处理;②对预处理后的信号应用前面所述方法进行双谱计算,再按照矩形积分路径对双谱结果进行围线积分计算;③根据改进的LLE降维算法对矩形积分双谱值进行非线性降维,降维后的双谱特征分为2部分,一部分用于训练,一部分用于分类测试,如图4所示。
图4 基于SIB-LLE的通信辐射源识别原理图
4 实验及分析
本实验是在Matlab2012b平台上完成,实验一为模拟在认知无线电网络中的主用户仿冒攻击,对PU和仿冒用户进行识别;实验二为实测信号的识别实验。
4.1 实验一
实验所用信号数据为一组BPSK信号,其载波频率为fc=2 700 Hz,码速率为fb=300 B,采样频率fs=15 kHz。将生成的BPSK信号首先进行幅度归一化处理,然后通过中心频率为fc,带宽为3fb的FIR带通滤波器生成通信辐射源S1。将源S1再次通过中心频率为fc,带宽为3fb的IIR带通滤波器生成通信辐射源S2。在S1和S2上叠加3倍码速率的高斯色噪声,噪声能量为0.3。对每个源分别取60个样本信号,前20组信号用于对SVM进行训练,后40组信号用于测试。
对2种采取相同调制方式的通信辐射源信号分别采用SIB、SIB/LLE和SIB/改进LLE的识别率与主分量特征维数的关系如图5所示。实验结果如表1所示,当采用特征维数为50时,SIB/LLE方法的识别率优于直接利用目标的积分双谱进行识别,通过改进后的SIB/LLE可以进一步提高识别率。
图5 信噪比30dB时不同特征维数的识别率
表1 不同方法的正确识别率/(%)
4.2 实验二
实验用信号样本从同型号、同批次的两部ASK电台采集,分别标记为T1和T2。使用的信号采样频率为250 MHz,采样点大小为1 024,并在使用前进行幅度归一化处理。每个电台提供60组样本信号,分别取其特征维数为50,前20个信号用于训练SVM分类器,其余的信号用于分类测试。通过电台的多次分类实验表明,基于改进的SIB/LLE方法提取的特征矢量能够较好地反映同型号、同批次的通信电台个体的细微差异,具有较好的分类能力,如表2所示。
表2 实测信号的正确识别率/(%)
5 结束语
现有的PUEA检测方法有基于无线定位和卡尔曼滤波的检测方法,但其无法工作在主用户移动规律(如速度等)或者位置信息不可知的授权网络中。基于能量指纹匹配的检测方法只适用于静态的认知网络,基于加密策略的检测方法会增加认知网络的时间开销和授权复杂度。故针对以上识别方法的缺陷,通过双谱LLE降维后通过SVM的方法对主用户(PU)和仿冒用户(SU)进行识别,从而解决PUE攻击检测问题。由于积分双谱中包含了许多对个体识别贡献率不大的成分,利用LLE对积分双谱数据集用局部线性低维流形来逼近,充分保持了双谱的拓扑结构,对通信辐射源有较高的识别率。
通过仿真试验和实测数据实验,对仿真信号和实测信号的识别率均超过90%,从而验证了算法的有效性。表明文中提出的应用矩形积分双谱和局部线性嵌入算法得到的特征向量,可以作为主用户和仿冒用户的通信信号指纹特征用于PUE攻击检测。
[1]陈志伟,徐志军,王金明,等.一种基于循环谱切片的通信辐射源识别方法[J].数据采集与处理,2013,28 (3):284-288.
[2]陈涛,姚文杨,林金秋,等.雷达辐射源个体特征的提取与识别[J].应用科学学报,2013,31(4):368-374.
[3]钱祖平,许渊,邵尉,等.基于高阶谱和时域分析的电台稳态特征提取算法[J].电子与信息学报,2013,35 (7):1599-1605.
[4]陶旺林,卢选民,刘李娟.基于局部围线积分双谱的通信辐射源个体识别[J].计算机工程与应用2013,49 (1):131-133,136.
[5]屈治礼.LLE方法的分类与研究[J].计算机系统应用,2013(4):14-17,50.
[6]Xu Shu-hua,Huang Ben-xiong,Xu Zheng-guang,et al.A New Feature Vector Using Local Surrounding-line Integral Bispectra for Identifying Radio Transmitters[C]∥Signal Processing and Its Applications,2007.ISSPA 2007.9th International Symposium on,2007:1-4.
[7]徐书华,黄本雄,徐丽娜.基于SIB/PCA的通信辐射源个体识别[J].华中科技大学学报(自然科学版),2008,36(7):14-17.
[8]Roweis S T,SAUL L K.Nonlinear Dimensionality Reduction by Locally Linear Embedding[J].Science(80-),2000,290(5500):2323-6.
[9]王和勇,郑杰,姚正安,等.基于聚类和改进距离的LLE方法在数据降维中的应用[J].计算机研究与发展2006,43(8):1485-1490.
[10]魏莱,王守觉,徐菲菲.基于测地线距离的自适应局部多维尺度变换[C]∥控制科学与工程全国博士生学生论坛,2007:198-205.
[11]杨庆,陈桂明,刘鲭洁,等.基于测地线距离的核主元分析在齿轮泵故障识别中应用[J].上海交通大学学报,2011,45(11):1632-1636.
[12]宋永东.支持向量机参数选择的研究[D].武汉:华中师范大学,2013:25-33.
PUE Attack Identification Based on Improved Bi-spectrum Dimension Reduction Using LLE
MA Qiang,ZHENG Wen-xiu,LU Guang-yue
(School of Communication and Information Engineering,Xi'an University of Posts&Telecommunications,Xi'an Shaanxi 710061,China)
To address the issue of primary user emulation attack identification in cognitive radio,an improved square integral bi-spectrum dimension reduction method using locally linear embedding algorithm is proposed for the identification of primary user(PU) and secondary user(SU).Square integral bi-spectrum(SIB)is used as the feature parameter,and local linear embedding(LLE)is utilized to reduce the feature dimension,then a support vector machine(SVM)based on kernel-function is used for individual identification.The experimental results demonstrate that the suggested technique has a high recognition rate,and it can solve the problem of PUE attack identification.
radio transmitter;square integral bi-spectrum(SIB);local linear embedding(LLE);support vector machine(SVM); primary user emulation attack identification
TN911.7
A
1003-3114(2015)05-29-4
10.3969/j.issn.1003-3114.2015.05.08
马强,郑文秀,卢光跃.基于双谱LLE降维的PUE攻击检测[J].无线电通信技术,2015,41(5):29-32,45.
2015-05-11
国家自然科学基金面上项目(61271276);陕西省教育厅项目(14JK1668)
马强(1988—),男,硕士研究生,主要研究方向:无线频谱感知、信息融合。郑文秀(1979—),女,副教授,主要研究方向:通信对抗、信号检测。