一种结合EWT和成分分析的无线电指纹提取方法
2019-05-08敏1罗正华黄建刚
张 敏1,罗正华,黄建刚
(1.电信科学技术第五研究所有限公司,成都 610020;2.成都学院 信息科学与工程学院,成都 610106)
0 引言
无线电通信个体识别在无线网络监控和安全中起着重要的作用[1-3]。它可以通过无线电信号识别不同的个体,通过双向的个体识别可以提高通信的安全性。研究发现,因为集成无线电的组件、电路或芯片在制造上存在差异性,所以即使是由同一管道产生出来的相同类型的无线电,也可能存在特性差异,这些特性差异即为无线电的“指纹特征”——硬件差异。这些特征差异是无线电“与生俱来”的,是不能被篡改的特性。由于这些特性,无线电“指纹特征”方面的个体研究也越来越受到关注。
目前,无线电的“指纹特征”个体研究根据研究信号的类别主要可以分为瞬态信号的研究和稳态信号的研究两个方面。瞬态信号的研究主要是研究当无线电打开或关闭瞬间,它产生的瞬态信号上携带的个体差异特征[3]。瞬态信号是没有承载数据信息的,它只与无线电的硬件特性有关。但是瞬态信号的持续时间非常短,对信号的起始点的检测精确度要求极高。由于无线电通信的非合作性,瞬态信号不易获得,所以研究起来存在很大的困难。
因此,人们将无线电的“指纹特征”个体研究视线移到了稳态信号的研究上。稳态信号特征的引入主要是在信号的调制阶段,由于硬件存在的差异性,信号在进行调制时是会产生很多的杂散信号成分,这些杂散信号即为个体调制信号。个体调制信号会因硬件差异的不同而不同,且其具有非线性、非平稳性的特点。所以研究者们试图从杂散信号的研究上找到无线电的“指纹特征”个体研究的突破点。但是由于现代电子设备设计和制造的逐步规范化,个体间的差异越来越小,同时也越来越难以提取,而且,当无线电之间建立了稳定的通信时,稳态信号远高于个体调制信号和系统噪声信号,此时的个体差异更难获得。也就是说,稳态信号为主要成分,将个体差异掩盖在无线电信号的深处。因此,通过稳定信号来识别无线电个体是一个难题。目前在该类研究方法的领域中,现有的方法有双谱法、小波分析、Wigner-Ville分布(Wigner-Ville distribution,WVD)、希尔伯特黄变换(HHT)等,这些算法都存在缺点,主要是计算复杂度高、存在交叉项干扰、所需设备昂贵或识别性能有限等问题[4-7]。
为能更好地对无线电个体进行识别,找到一种性能优异的基于稳定信号的无线电个体“指纹特征”提取方法就显得尤为迫切。本文提出了一种结合EWT和成分分析的无线电“指纹特征”提取方法,该方法与希尔伯特黄变换(HHT)和局部积分双谱分析方法相比,具有更加优越的识别性能和更加优良特征稳定性,同时具有受信噪比的影响较小的特点。实测数据实验结果表明了所提方法的有效性。
1 理论和算法
考虑到个体调制信号的非线性、非平稳性特点,常用的且具有一定代表性的时频分析方法有希尔伯特黄变换(HHT)和局部积分双谱。其中,希尔伯特黄变换(HHT)首先利用经验模态分解(EMD)方法将信号分解成若干个固有模态函数(IMF)分量,再对IMF分量进行Hilbert变换,得到信号的Hilbert谱,根据提取到的信号的Hilbert谱特征对进行信号的区分。但是由于EMD的理论基础不够完善,存在模态混叠、端点效应、过包络、欠包络等问题,信号经EMD分解后会有很多的虚假分量产生,使得计算量变大,提取到的Hilbert谱特征的准确度降低,从而造成个体识别率降低。
局部积分双谱时频分析方法则是利用双谱自身具有的时移不变性、相位保持性和尺度变换性特点,它能够将除线性相位外所有的信号信息完备的保留下来,而且对高斯噪声具有抑制作用,使得此方法在个体识别领域的应用很广泛。但是,由于直接对信号进行双谱计算的运算量极大,所以人们采用将信号局部化的方法,提取局部信号的双谱特征进行个体识别,虽然极大程度地降低了计算量,但是计算量大的问题依然存在。
针对特征提取在这些方面的不足,文章引入了EWT信号处理方法,对信号的傅里叶谱进行自适应的划分,构建自适应的滤波器组,提取出固有模态分量。通过固有模态分量对信号进行无线电的“指纹特征”,此方法不存在虚假分量问题,而且计算量小。
1.1 EWT经验小波变换
EWT经验小波变换是将小波分析的理论框架和EMD分解的特点结合起来的一种新的信号处理方法。它是先对信号进行傅里叶变换,同时,对得到的傅里叶频谱进行自适应分割划分,然后构造与每个划分区域相适应的小波函数和尺度函数,并生成一组带通滤波器组并对傅里叶频谱进行处理,最终实现复杂信号频率成分不同模态的分离[8]。
令复杂信号的傅里叶变换为F(ω),将相应规范化频率范围为[0,π]的傅里叶频谱划分为N个频带。将分割的每个区间定义为Λn=[ωn-1,ωn],n=1,2,…,N,ωn为频带边界的中心频率[9]。以每一个ωn为中心,定义一个宽度为Tn=2τn过渡段,这样就需要N+1个边界,除去第一条边界为0(ω=0),最后一条边界为π(ωn=π),另外还需要N-1条边界,如图1所示。
图1 频谱分割图
在确定每个后,根据Littlewood-Paley和Meyer小波的方式构建经验小波,则经验尺度函数和经验小波函数分别为:
(1)
(2)
设τn=γωn,在式(1)、(2)中,
β(x)=x4(35-84x+70x2-20x3)。
借鉴经典小波变换的构造方法构造经验小波变换,可以得到它的细节系数和近似系数通分别为:
(3)
(4)
信号重构的结果为:
(5)
由以上公式可得经验模态函数fk的公式为:
(6)
(7)
在式(6)、(7)中,*为卷积。
1.2 EMD分解算法
EMD经验模态分解是通过算法的过程来定义的,它利用信号的局部均值信息来真实的反映信号的内在结构和波动模式。该算法步骤如下:
1)首先找到输入信号x(t)的所有极大值点和极小值点,接着用曲线将极大值点和极小值点分别串联起来,得到输入信号x(t)上包络曲线fmax(x)和下包络曲线fmax(x),然后求取上包络曲线和下包络曲线的均值曲线,最后用输入信号减去均值曲线,得到差值曲线包络。令m(t)为fmax(x)和fmin(x)的平均值。记输入信号x(t)与m(t)的差值为h1(t),即:
h1(t)=x(t)-m(t)
(8)
若h1(t)不是基本模式分量(不满足基本模式分量的两个基本条件:①模态分量的极大值点和极小值点数N与过零点数相等或最多相差1;②任意时刻,极大值包络曲线fmax(x)与极小值包络曲线fmax(x)的平均值为零),则将h1(t)作为‘新’的输入信号x′(t),重复以上的求差值操作,直到h1(t)满足基本模式分量的两个条件,为基本模式分量,记作c1(t),即:
c1(t)=h1(t)
(9)
2)用输入信号x(t)减去c1(t)得到余下的信号分量,即:
x1(t)=x(t)-c1(t)
(10)
将x1(t)视为新的x(t),对x1(t)做类似处理。其算法过程可以表述为:
(11)
有式(11)可以看出,对输入信号x(t)进行了n此分解,直到余下的分量不能再进行分解(通常是限制两个连续的分解分量之间的标差满足在0.2~0.3,则将剩下的原始输入信号的余下分量作为残差rn(t),不再进行分解)。即将输入信号x(t)被分解为n个基本分量ci(t),i=1,2,…,n和一个余项rn(t)的线性和,即:
(12)
1.3 基于成分分析的信号特征提取
无线电信号可以划分为3种成分:无线电的自身调制信息成分,无线电的个体特征成分,系统噪声成分。即可以表示为:
X=S+Z+N
(13)
在式(8)中,X表示无线电信号,S表示信号自身调制信息成分,Z表示个体特征成分,N表示系统噪声成分。这3种成分的能量大小关系满足‖S‖>‖Z‖>‖N‖,即S为主要成分,Z为次要成分,无线电的个体差异主要是由次要成分体现出来的。
受到机器学习中“特征脸”的启发[10-13],为了提取到无线电的个体差异,我们将采用成分分析方法,将个体差异放大,达到识别的效果。成分分析方法的步骤如下:
1)记提取的单个样本信号表示为xi=(xi1,xi2,…,xip),则n个样本组成采样矩阵可以表示为X=[x1,x2,…,xn]。
2)求采样矩阵的协方差阵∑。
(14)
3)对协方差矩阵作Σ进行特征值分解。
∑αi=λαi,i=1,2,…,p
(15)
4)对求得的特征值从大到小进行排列,即λ1≥λ2≥…≥λp
5)记第k个特征值对应的特征向量对应的变换矩阵为:A=[αk]。
6)样本xi在第k个特征值对应的特征向量上的投影为:
ξk=ATxi
(16)
7)样本xi的第k个成分可以表示为:
(17)
1.4 多分类支持向量机算法
支持向量机(SVM)是一种以结构风险最小理论(SRM)和VC维理论为基础,能有效解决小样本、非线性、高维模式分类识别等问题的一种机器学习方法[14-15]。但是SVM是针对二分类问题的解决算法,对于多分类问题并不适用,为了实现多类别分类需要对SVM算法进行一些改进。
1.4.1 SVM算法
SVM算法主要是求得一个最优的划分平面,将两个不同种类的样本分离开。令U为一个可分的二分类的样本集。U={(xi,y)},其中,i=1,2,…,n,n为样本的数目。xi为待分类样本数据,yi∈{-1,1}为类别属性。
若能够找到一个划分平面ωT*x+b=0,其中,ω=(ω1,ω2,…,ωn),将上述的二分类样本集准确无误的划分开,则可以认定该训练集是线性可分的,即满足:
(18)
在样本集中,有一些离划分平面距离很近的样本点,这些样本点即为支持向量。SVM的最优划分平面就是在满足式(14)的前提下使两类样本的支持向量距离最大化。即将求最优划分平面问题转化为凸二次规划问题:
(19)
利用拉格朗日乘子法对式(15)进行分析,可得:
(20)
其中:α=(α1,α2,…,αn)T为拉格朗日乘子向量,可以用SMO算法进行求解。利用α可以求得ω和b,即可以得到最优的划分平面。
1.4.2 多分类支持向量机算法
如图2所示为DAG-SVM算法的6分类示意图。将一个待分类的信号,首先通过SVM1,6分类器判断该信号是否为类别1和类别6,如果不是类别1信号则进入SVM2,6分类器继续进行分类判别,否则进入SVM1,5分类器继续进行分类判别……以此类推,直到能够完全判别确定信号的种类,最复杂的情况是需要到达分类节点的最低层才能够确认信号的种类,但是从总体分析可以得出该分类器的分类效率能够满足需求。
图2 DAG-SVM算法6分类
2 EWT算法的有效性验证
为了对EWT算法的有效性进行验证,构造如下仿真信号:
(21)
由式(13)可知,仿真信号x4(t)是由一个线性信号x1(t)、一个4 Hz的余弦信号、一个20 Hz的余弦信号组成。然后给x4(t)添加高斯白噪声,信噪比设置为10 dB。
首先对仿真信号进行EWT分解。EWT是用一个尺度函数和N个小波函数分别对输入信号进行自适应滤波分解的信号处理方法,即对信号的频谱进行自适应分割。对此仿真信号取N=3,即将仿真信号的频谱自适应的划分成4个频带。仿真信号经EWT分解后得到4个信号分量C1、C2、C3与C4,如图3所示,这4个信号分量是按照频率由低到高依次排列的。由图3可以看出EWT分解得到的4个分量分别对应仿真信号的线性信号分量、两个余弦信号分量和高斯噪声信号分量,即仿真信号成分都被有效的分解出来了。由此可以看出EWT对信号的分解准确性很高。
图3 仿真信号的EWT分解结果
其次,对仿真信号进行EMD分解。EMD是依据数据自身的时间尺度特征进行信号分解(局部平稳化),而无须预先设定任何的基函数的信号处理方法,即利用信号的局部信息反映真实信号的内在结构和波动方式。仿真信号的EMD分解结果如图4所示。信号分量按照频率由高到低的顺序排列,可以看到,仿真信号经EMD分解后的分量有10个之多。将图3和图4进行对比可得,信号经EMD分解后明显有很多的虚假分量产生,而这些分量在仿真信号的组成成分中并不存在。可见EMD对仿真信号的分解的准确度不高。
图4 仿真信号的EMD分解结果
3 实验过程与分析
本文根据短波电台信号采集的实测数据进行实验研究,实验信号数据采集自同一型号同一批次的4部短波电台No.1~4,信号的实测载频8.067 MHz,采样频率39.2 kHz,调制方式2 PSK,时长1 s,信噪比为20 dB。
首先研究的是结合EWT和成分分析的无线电指纹提取方法,采样样本长度取L=1000,参数设置为p=100,n=1 024。从实测数据中任意选取一个样本,对其进行EWT分解,取N=7,得到的结果如图5所示。由于EWT分解得结果分量的频率是由低到高的,个体调制信号成分可能位于后面的分量中,因此,选取得到的c3~c7分量的归一化特征值谱作为无线电的“指纹特征”用于个体识别分类。
图5 信号的EWT方法分解结果
依次选取4部短波电台No.1~4的一个信号样本进行EWT分解处理。然后对EWT分解的c3~c7分量进行成分分析,得到No.1~4无线电信号的归一化特征值谱结果如图6所示。从图6可以看到4部短波电台的c3~c7分量的归一化特征值谱的差异明显,特别是c6、c7分量的特征值曲线,低频率分量的特征值曲线的差异较小,可以证明前面的推测个体调制信号成分位于后面的分量中是正确的。以此作为无线电的“指纹特征”是可行的。
图6 No.1~4无线电信号特征值谱
其次研究的是结合EWT和成分分析的无线电指纹提取方法的识别性能。选取No.1电台的100个样本,每个样本长度为1024,将其中一半样本作为训练集,另一半样本作为测试集。根据成分分析的方法和特征值曲线的差异大小的情况,用DAG-SVM多类别分类器对c7、c6、c7+c6、c7+c5、c6+c5、c3~c7这6种成分分量的特征值曲线特征进行分类识别实验,得到的识别率如表1所示。
表1 7种成分分量的特征识别率
从表1的结果可以看出组合分量的识别率明显高于单一分量的识别率,而c3~c7的组合分量的识别率最高。说明杂散成量主要分布在高频率段,使得低频率段的信号差异不大,区分效果不明显。
最后研究的是结合EWT和成分分析的无线电指纹提取识别方法与其他识别方法的性能效果对比。对No.1~4电台分别选取100个样本,每个样本长度为1 024,将其中一半样本作为训练集,另一半样本作为测试集。通过估计信噪比的方法分别测出信号在15 dB、10 dB、5 dB条件下的数据,利用DAG-SVM多类别分类器,分别运用本文提出方法、HHT和局部积分双谱分析方法进行识别分类,得到的识别结果如图7所示。由图7可以得出结论,EWT成分分析的识别方法不仅优于基于经验模态分解的成分分析方法,而且优于双谱分析方法。可以看出此种方法受信噪比影响较小,在信噪比很低的情况下仍然识别效果良好。
图7 不同信噪比下不同方法的识别率
4 结论
无线电指纹识别在电子对抗领域具有很大的应用前景。本文提出了一种结合EWT和成分分析的无线电指纹提取方法,该方法首先对信号进行成分分离,然后选取其中能反映个体差异的分解成分进行信号的特征值分析和识别。实测数据实验结果表明,该方法不仅优于HHT分析方法,而且优于局部积分双谱分析方法,在信噪比很低的情况下仍然识别效果良好,可以看出此方法对噪声不敏感。