通信辐射源的潜在细微特征提取方法

2016-12-21唐哲雷迎科蔡晓霞

电波科学学报 2016年5期

关键词：辐射源傅里叶识别率

唐哲雷迎科蔡晓霞

(1.电子工程学院,合肥 230037;2.通信信息控制和安全技术重点实验室,嘉兴 314033)

通信辐射源的潜在细微特征提取方法

唐哲1,2雷迎科1,2蔡晓霞1

(1.电子工程学院,合肥 230037;2.通信信息控制和安全技术重点实验室,嘉兴 314033)

为了充分挖掘高维特征空间中辐射源的细微特征,提出一种基于全局潜在低秩表示(Global Latent Low Rank Representation,GLat-LRR)的通信辐射源潜在细微特征提取方法.首先,提取通信辐射源信号的瞬时频率,通过傅里叶变换将信号投影到高维特征空间;挖掘特征样本之间全局的低秩结构和维度之间全局的潜在低秩关系,将特征样本集作为整体应用到潜在低秩表示模型中,利用维度之间低秩关系得到特征样本集的潜在部分矩阵,每个列向量即为每个通信辐射源信号的潜在细微特征向量.在实际采集的同厂家同型号FM电台数据集上,该方法提取的潜在细微特征能够显著提高通信辐射源个体识别的性能.

通信辐射源;细微特征;瞬时频率;傅里叶变换;潜在低秩表示

DOI 10.13443/j.cjors.2016011401

引言

由于生产厂家、组件批次以及生产工艺等不同,使得通信辐射源发射的信号存在独一无二的细微特征,从这些信号中提取的细微特征被称为辐射源的指纹,而自动地识别一个辐射源即被称为辐射源的指纹识别[1]．在无线通信安全领域,通信网络攻击日益严重,通过识别入侵的通信辐射源细微特征,可以保障通信网络的安全．同时,在侦察领域,随着战场电磁环境日益复杂,通过截获敌方通信信号,获取细微特征进而识别辐射源个体,对分析敌方通信网组成、确定辐射源威胁等级以及对敌实施电子打击等具有重要的战略意义．

早期的通信辐射源个体识别问题,主要结合“turn-on”暂态信号特征[2-3],通过小波分析、分形等理论对信号的时域信号进行分析．但该方法主要用于识别不同型号的电台[4],并且要求接收机具有极高的采样率,信号的截获时间往往只有几毫秒,因此,在非合作通信中该方法的适用性大大降低．近年来,围绕稳态信号特征例如信号瞬时特性[5]、小波特征[6]和高阶谱特征[7]的研究成为通信辐射源个体识别的主要方向．陆满君[8]在提取频移键控(Frequency-Shift Keying,FSK)信号瞬时频率的基础上,通过定义特征参数k来表示码元持续时间内瞬时频率的变化趋势,以及特征参数b表示固定载波频率与偏差之和的特性,得到较好的特征样本分离效果．随着机器学习等相关理论的发展,以模式识别的思想挖掘信号在高维特征空间中的特性并实现辐射源的个体识别逐渐成为新的研究热点．

在实际通信辐射源个体识别中,通常将已截获的辐射源个体作为已知样本构成数据库即字典,提取其细微特征来识别新截获的辐射源个体信号．在不同传输信道、不同环境条件下截获的同一辐射源个体信号,尽管其工作模式不尽相同、调制参数存在差异以及信号频段互不交叠,信号波形存在较大差异,但其细微特征反映的都是辐射源个体的硬件属性,其最本质的个体细微特征应当反映相同的辐射源内部器件的工作特性,具有一定的唯一性,从而使得辐射源的高维特征样本具有相似的内在维度结构,在高维的特征空间中处于同一个低秩子空间．低秩表示[9-11]在压缩感知的理论基础上能够获得数据整体的低秩子空间结构,在聚类等问题上具有良好性能．而实际的通信辐射源个体识别,信号受噪声影响大,细微特征常常分布在高维的特征空间中,为充分挖掘辐射源信号的潜在细微特征,需要从全局上利用样本所处的低秩子空间,挖掘不同样本之间的关系以及不同特征维度之间的关系,进一步在高维特征空间中提取信号的细微特征．

对于同型号同厂家工作模式下的FM通信辐射源细微特征问题,本文提出基于全局潜在低秩表示(Global Latent Low Rank Representation,GLat-LRR)的通信辐射源潜在细微特征提取方法,首先提取通信辐射源信号的瞬时频率,然后对瞬时频率进行傅里叶变换,最后,在高维的傅里叶特征空间中利用潜在低秩表示挖掘信号的潜在细微特征．通过实际采集的FM电台数据集,验证了该特征提取方法的有效性和鲁棒性．

1 基于潜在低秩表示的细微特征提取方法

1.1 潜在低秩表示

对观测到的一个数据矩阵AO,低秩表示模型将数据矩阵分解为一个低秩矩阵和一个稀疏矩阵，有

s.t.AO=AOZ+E.

(1)

式中：Z表示系数矩阵;E表示噪声矩阵;rank(·)表示矩阵的秩;‖·‖0表示矩阵的l0范数;λ为权重参数．由于式(1)是NP-hard问题,需要在特定几何条件下将其进行凸松弛,即用核范数替换秩函数,l1范数替代l0范数,式(1)变为

s.t.AO=AOZ+E.

(2)

式中：‖·‖*表示矩阵的核范数,即矩阵的奇异值之和;‖·‖1表示矩阵的l1范数,即所有元素的绝对值之和．

低秩表示直接将观测数据矩阵作为字典,这个字典必须包含足够的样本才能很好地表达每个数据元素．在实际的数据分析中,我们所能获取的样本数目是有限的,使得字典缺乏足够的表示信息,从而导致算法不够稳健．潜在低秩表示基于已知的观测数据矩阵AO,构造未观测的隐藏数据矩阵AH,将联合数据矩阵[AO,AH]作为字典,力图解决字典表示信息不充分的问题．潜在低秩表示模型可以描述为

s.t.AO=[AO,AH]Z+E.

(3)

(4)

将式(4)代入式(3),化简得

(5)

(6)

s.t.A=AZ+LA+E.

(7)

式中：λ为控制噪声的权重参数．从式(7)可以发现,通过级联隐藏的数据矩阵AH来表示观测数据矩阵AO,最终将AO分解为两个新的数据矩阵以及一个稀疏噪声矩阵．进一步分析,假设A为D×n的矩阵,则Z为n×n的低秩矩阵,L为D×D的低秩矩阵．求解式(7)的优化问题,可以通过增广拉格朗日算法进行迭代运算，具体步骤如表1所示.

通过增广拉格朗日算法求得低秩系数矩阵Z,其诱导的数据矩阵AZ表示数据矩阵A的主要部分;低秩系数矩阵L,其诱导的数据矩阵LA表示数据矩阵A的潜在部分;稀疏矩阵E表示数据矩阵A中包含的稀疏随机噪声．

1.2 潜在细微特征提取算法

1.2.1 提取通信辐射源信号瞬时频率

假设截获到的FM通信辐射源信号为零中频I/Q正交信号r(t),实部和虚部分别由rR(t)和rI(t)表示,则r(t)可表示

r(t)=rR(t)+jrI(t).

(8)

从式(8)可以发现,FM复信号的调制信息在实部rR(t)和虚部rI(t)中．

信号瞬时特性中,瞬时幅度反映了rR(t)和rI(t)的互补关系,瞬时相位则反映了rR(t)和rI(t)的非线性比例关系,而瞬时频率直观上为相位的微分,反映了r(t)更为复杂的特性．FM零中频I/Q正交信号经过A/D采样后,转化为离散的时间序列{r(l)},并有r(l)=rR(l)+jrI(l),则瞬时频率可以通过瞬时相位间接得到:

(9)

式中：fs为信号采样频率．

表1 算法一

1.2.2 瞬时频率的傅里叶变换

在获取通信辐射源信号瞬时频率的基础上,为进一步挖掘信号的潜在细微特征,需要将信号映射到高维的特征空间．本文将信号的离散瞬时频率序列{fc(l)}进行傅里叶变换,有

(10)

信号瞬时频率的傅里叶特征一定程度上反映了辐射源个体将基带信息调制到频率时的工作特性,较好地在高维特征空间表现辐射源的个体特征．

高阶谱特征本身能够很好克服高斯噪声的影响,得到数据丰富的相位信息．而通过时域FM信号的瞬时频率来表征信号的个体差异,能够很好地反映辐射源将基带信号调制到频率上的工作特性,一定程度上体现了混频器的性能差异,很大程度上弥补了傅里叶特征的表征能力,使辐射源信号的傅里叶特征同样十分明显．同时,由于高阶谱特征是在傅里叶特征基础上进行的相关运算,当傅里叶特征较为明显时,信号的高阶谱特征会出现与傅里叶特征较为相似的波形,其性能与傅里叶特征相近,而实际通信辐射源个体识别常常具有一定的时效性要求,傅里叶特征的运算复杂度大大低于高阶谱特征,更适用于实际应用．因此,本文采用了傅里叶特征对辐射源个体进行特征提取．

1.2.3 基于全局潜在低秩表示的辐射源细微特征

时域信号的瞬时频率经过傅里叶变换后,转化为D维的傅里叶特征向量．在傅里叶特征空间RD中,需要进一步利用潜在低秩表示模型,挖掘能够表征辐射源个体的潜在细微特征．

s.t.X=XZ+LX+E.

(11)

由于X为D×n阶,则分解出来的潜在部分矩阵LX的每个列向量即为提取的信号潜在细微特征．

在上述的潜在低秩表示模型中,是将数据矩阵A本身作为一个对象进行潜在低秩表示．而在辐射源个体识别当中,对于一个D×n的特征样本集,求解后的低秩系数矩阵Z为n×n阶,反映了特征样本之间的全局性低秩关系;低秩系数矩阵L则为D×D阶,反映的是特征维度之间的全局性低秩关系,得到的低秩系数矩阵Z和L如图1所示．

图1 低秩系数矩阵Z和L

从图1可以发现,系数矩阵Z和L的元素在对角线附近较为显著,体现了很强的低秩特性．Z的元素分布说明,类别相同样本具有较强的近邻关系,相互聚集在某一低秩空间中;同时,L的低秩现象说明某些维度的信息具有很强的关联性,进而为后续的特征提取提供了丰富的判别信息．

经过对施工图审核管理工作现状进行梳理，可以看出，咨询单位所做的最为基础的工作是：接收同行完成的设计图文（以纸质版为主，也接收电子图文），向对方分批次地反馈审核意见，设计方对审核意见应予以回复。对于未达成一致的意见，双方可能会往返回复多次，确实无法达成一致，则可申请仲裁。所有往来的审核意见、回复意见均是电子版。

传统的通信辐射源特征提取往往是针对辐射源的单个信号,通过特征映射、高阶运算以及时频分析等得到其特征参数或特征向量,具有很强的局限性,得到的特征仅仅来源于单个信号信息,并没有利用信号之间的关系信息．并且,传统的低秩表示模型也是针对单个信号进行处理,并未涉及信号之间的数据关系,得到的特征往往不能很好地反映样本之间的高维结构．本文算法不仅仅通过傅里叶映射得到信号各自的特征,更通过潜在低秩表示模型,从全局的角度,利用信号特征集中包含的样本之间的全局性信息,挖掘辐射源特征空间中所有样本之间的低秩表示关系及其特征维度之间的潜在低秩关系,保证了特征提取算法的鲁棒性．

在Glat-LRR中,将所有样本构成的特征集作为一个全局对象进行潜在低秩表示,利用了样本之间的全局性信息,得到维度之间的潜在低秩关系,而每个辐射源个体的瞬时频率傅里叶特征即为特征样本集X一个列向量．

表2 算法二

基于GLat-LRR的通信辐射源潜在细微特征算法可以得到信号的潜在细微特征,具体步骤如表2所示．

2 通信辐射源个体识别实验分析

实验数据为10部同厂家同型号FM电台在相同工作模式下,实际采集的零中频I/Q正交信号．信号中心频率为160 MHz,信号带宽为25 kHz,电台接收机的信道带宽为100 kHz．采样频率为204.8 kHz,采样时间为1.5 s,得到由307 200个样本点构成的样本序列,每个电台采集27个样本序列．

图2为利用FM复信号307 200个样本点中连续的2 047个点计算的瞬时频率,进行傅里叶变换后,最终得到10个电台共270个1 024维的傅里叶特征样本,构成傅里叶特征样本集,即为1 024×270的矩阵．如图3所示,利用GLat-LRR算法可以将特征样本集X分解为3个1 024×270的矩阵．在通信辐射源个体识别实验中,提取的电台潜在细微特征即为图3LX矩阵的每个1 024×1列向量．

图2 270个信号构成瞬时频率傅里叶特征样本集

图3 GLat-LRR算法提取的电台潜在细微特征

时域信号的瞬时频率经过傅里叶变换映射到特征空间,通过算法一对特征样本集提取潜在部分矩阵,得到的列向量即为所求通信辐射源信号的潜在细微特征,GLat-LRR的算法流程如图4所示．

在识别实验中,利用图3中的潜在部分LX作为辐射源个体的潜在细微特征进行个体识别实验．同样,针对信号的瞬时频率,采用经典的矩形积分双谱(Square Integrated Bispectra,SIB)特征以及文献[7]提取的矩形积分双谱/主成分(Square Integrated Bispectra /Principal Component Analysis,SIB/PCA)特征作为对比实验．每次实验重复20次,取各个算法的平均识别率作为最终的识别结果．

2.1 10部电台的识别性能

为了验证训练样本个数对识别结果的影响,将每部电台27个样本序列按比例随机划分为训练样本和测试样本,构成训练样本集和测试样本集．利用GLat-LRR算法分别对构造的训练样本集和测试样本集进行特征提取,从而得到各自的潜在细微特征集．

10部FM电台在不同的训练样本个数条件下的实验结果如表3和图5所示．

由表3可知,在所有的实验条件下,GLat-LRR算法的识别率均显著超过了SIB和SIB/PCA两种算法．如:当训练样本个数少于180时,与其他两种算法相比,GLat-LRR算法的识别率均高出10%,随着训练样本继续增多,GLat-LRR算法的识别率高出SIB和SIB/PCA约7%左右．从表3和图5不难发现,SIB和SIB/PCA两种算法在样本数目较少时获得相近的识别率,随着训练样本增多,由于PCA作用,使SIB/PCA算法的识别率超过了SIB算法的识别率．

表3 10部FM电台的平均识别率(%)

2.2 不同电台的识别差异

在实际应用当中,由于辐射源的内部元器件的性能差异、本身生产工艺等因素影响,使得每个辐射源个体的识别难度会有比较大的差异．

图4 GLat-LRR算法处理流程

图5 10部FM电台的识别结果

图6 GLat-LRR算法对不同电台的平均识别率

如图6所示,在不同训练样本个数条件下,GLat-LRR算法对不同电台个体具有显著的识别差异．

从图6可以看出,对每部电台的平均识别率均在60%以上,当训练样本增多后,对每部电台的平均识别率均在80%以上,其中,电台1～3的识别率较高,说明其个体特征较为明显．同样,采用SIB特征和SIB/PCA特征,在不同训练样本个数条件下计算每部电台个体的识别率．在图6实验的基础上,三种算法对每部电台的识别差异如图7所示．

图7 不同电台的平均识别差异

图7显示的是,三种特征提取算法在8种训练样本个数设置下分别进行20次实验后,即对每部电台进行160次识别后的总平均识别率．

综上所述,电台1～3的识别难度最小,其个体特征较为明显,易于识别．对于电台4和电台8,三种特征的总平均识别率较为相近,说明GLat-LRR算法并未很好地提取这两部电台的个体特征,需要进一步分析电台个体特性,改进特征提取算法．而对电台6和电台10,与其他两种特征相比,GLat-LRR算法则能够提取有效的潜在细微特征,使得总平均识别率得到显著提高．

2.3 特征维度

通信辐射源个体在某些频率上往往会体现较为明显的个体差异,在某些局部特征上的判别信息较为明显．

为了验证GLat-LRR算法随特征维度变化的识别性能,分别采用30、90、150及210个样本构成训练样本集,120个样本作为测试样本集,分别取256维的SIB特征中的前32、64、96、128、160、192、224、256维特征,利用GLat-LRR对其进行20次识别实验,其平均识别效果如图8所示．

图8 GLat-LRR算法识别性能随特征维度的变化

从图8可以发现,GLat-LRR在512维之前的识别性能较差,而在512维至768维之间,识别率增长最为明显,普遍能够增加30%的识别率．其原因在于,如图3所示,样本的512维至768维的局部特征作为细微特征的主体,包含大量的判别信息,能够大幅度增加识别效果,而其他维度的特征较为相似,判别信息很少,从而造成图8中识别率增长区域较为集中,幅度较大的现象．

3 结论

本文提出一种基于全局潜在低秩表示的通信辐射源潜在细微特征提取方法,在实际采集的FM信号数据集上取得了令人满意的识别效果,对实际的通信辐射源个体识别具有较强的理论和应用价值．该方法基于通信辐射源信号的瞬时频率,利用全局的潜在低秩表示,得到特征样本之间全局的低秩结构以及特征样本维度之间的全局潜在低秩关系,最终得到每个信号的潜在细微特征．在实际采集的通信辐射源数据集上,实验结果验证了该方法的有效性与鲁棒性．

[1]DIETRICH J.A wavelet analysis of transients in phase-locked loops [D].Winnipeg：University of Manitoba, 1994.

[2]TEKBAS H, RETEN O, SERINKEN N.Improvement of transmitter identification system for low SNR transients[J].Electronics letters, 2004, 40(3)：182-183.

[3]SERKINKEN N, RETEN O.Generalised dimension characterisation of radio transmitter turn-on transients[J].Electronics letters, 2000, 36(12)：1064-1066.

[4]GERDES R, DANIELS T, MINA M, et al.Device identification via analog signal fingerprinting：a matched filter approach[C]// Proceedings of the 13th Annual Network and Distributed System Security Symposium.San Diego：NDSS, 2006.

[5]李学成, 段田东, 徐文艳, 等.基于固有时间尺度分解的信号细微特征识别[J].信息工程大学学报, 2014, 15(5)：570-575.

LI X C, DUAN T D, XU W Y, et al.TD-based identification of signal fine features[J].Journal of Information Engineering University, 2014, 15(5)：570-575.( in Chinese )

[6]徐玉龙, 王金明, 徐志军, 等.基于小波熵的辐射源细微特征提取方法[J].数据采集与处理, 2014, 29(4)：631-635.

XU Y L, WANG J M, XU Z J, et al.Fingerprint feature extraction method for emitters based on wavelet entropy [J].Journal of data acquisition and processing, 2014, 29(4)：631-635.( in Chinese )

[7]徐书华, 黄本雄, 徐丽娜.基于SIB/PCA的通信辐射源个体识别[J].华中科技大学学报, 2008, 36(7)：14-17.

XU S H, HUANG B X, XU L N.Identification of individual radio transmitters using SIB/ PCA[J].Huazhong University of Science &Technology (natural science edition), 2008, 36(7)：14-17.(in Chinese)

[8]陆满君, 詹毅, 司锡才,等.基于瞬时频率细微特征分析的FSK信号个体识别[J].系统工程与电子技术, 2009, 31(5):1043-1046.

LU M J, ZHAN Y, SI X C, et al.Individual identification of FSK signals based on fine feature analysis of instantaneous frequency[J].Systems engineering and electronics, 2009, 31(5):1043-1046.(in Chinese)

[9]LIU G C, YAN S.Latent Low-Rank Representation for subspace segmentation and feature extraction[C]// IEEE International Conference on Computer Vision, 2011:1615-1622.

[10]LIU G C, LIN Z C, YAN S C, et al.Robust recovery of subspace structures by low-rank representation[J].IEEE transactions on pattern analysis &machine intelligence, 2010, 35(1):171-184.

[11]LIU G C, LIN Z C, YU Y.Robust subspace segmentation by low-rank representation[C]// Proceedings of the 27th International Conference on Machine Learning, 2010：663-670.

[12]CHEN M, LIN Z, MA Y, WU L.The augmented Lagrange multiplier method for exact recovery of corrupted low-rank matrices[J].Eprint Arxiv, 2013.10.8, arXiv:1009.5055v3.

唐哲 (1991-),男,山东人,电子工程学院硕士研究生,研究方向为压缩感知、通信信号处理、通信辐射源个体识别.

雷迎科 (1975-),男,安徽人，博士,副研究员,研究方向为机器学习、通信信号处理.

蔡晓霞 (1965-),女,安徽人，博士,教授,研究方向为通信信号处理、通信网效能评估.

The extraction of latent fine feature of communication transmitter

TANG Zhe1,2LEI Yingke1,2CAI Xiaoxia1

(1.ElectronicEngineeringInstitute,Hefei230037,China;2.ScienceandTechnologyonCommunicationInformationSecurityControlLaboratory,Jiaxing314033,China)

In order to fully exploit the fine features of transmitter in the high dimensional feature space, we propose a method for extracting the fine features of communication transmitter based on global latent low rank representation.Firstly, we extract the instantaneous frequency of the signal of communication transmitter, and then transform the signal into a high dimensional feature space by the Fourier transformation.Secondly, the global low-rank structure between samples and global latent low-rank relationship between the dimensions are mined.Therefore, we can put the whole training sample set in the latent low rank representation model and get the latent part matrix of training sample set based on the low rank relationship between feature dimensions.Every column vector of latent part matrix is the latent fine feature vector of each communication transmitter signal.On the actually collected data set of the FM radios with the same model and manufacturer, the latent fine features extracted by our method can significantly improve recognition performance of different transmitter radios which reflects the effectiveness and robustness of our method.

communication transmitter;fine feature;instantaneous frequency;Fourier;latent low rank representation

唐哲, 雷迎科, 蔡晓霞.通信辐射源的潜在细微特征提取方法[J].电波科学学报,2016,31(5):883-890.

10.13443/j.cjors.2016011401

TANG Z, LEI Y K, CAI X X.The extraction of latent fine feature of communication transmitter [J].Chinese journal of radio science,2016,31(4):883-890.(in Chinese).DOI：10.13443/j.cjors.2016011401

2016-01-14

国家自然科学基金(61272333，61473237)；国防科技重点实验室基金(9140C130502140C13068)；总装预研项目基金(9140A33030114JB39470)

TN911.7

1005-0388(2016)05-0883-08

联系人：雷迎科 E-mail：tongxtz@163.com