基于特征融合的跳频信号射频指纹识别技术
2022-12-26李明笛杨鸿杰耿梦婕未争超段亚楠刘冀川
李明笛,谢 军,杨鸿杰,耿梦婕,未争超,段亚楠,刘冀川
(1.中国电子科技集团公司 第54研究所, 石家庄 050081;2.河北省电磁频谱认知与管控重点实验室,石家庄 050011)
0 引言
跳频通信是抗干扰性能极优的通信体制,具有截获概率低,组网能力强等优势,在军事通信领域中应用广泛。跳频电台识别存在两方面难题。一是源于个体识别技术特点,随着通信技术的快速发展,现有的通信辐射源采用稳定度极高、杂散抑制能力很强的数字式器件,电台的一致性、稳定性表现得越来越好,导致传统的通信辐射源个体识别方法无法从时域、频域等方面提取到使得目标个体识别率达到一定标准的有效特征。同样,用跳频周期估计、测向测距、功率测量等信号参数信息实现跳频信号个体识别对参数估计准确度依赖较高,且受噪声干扰时的鲁棒性表现较弱,不适用于战场的复杂环境。二是跳频电台本身的特点。由于跳频电台频率快速跳变的特点,导致跳频电台的指纹特征容易受到环境变化的影响,而且由于信号每个跳频段的长度较短,个体稳态特征表现不够充分,从而使得个体识别变得更加困难。目前对跳频信号个体识别的研究很少,由于跳频电台的开机、关机、频率切换特征表现明显,以提取信号的暂态特征为主,常采用包络瞬时特征提取[1]和频域瞬时特征提取[2]的方法,提取信号的频率切换特征[3]、瞬时相位特征[4]、分形特征[5]等,而且多以提取二维有效特征为主。这些研究多数不使用分类器或者使用机器学习的支持向量机[6]、随机森林[7]等分类器,这使得个体识别准确率不甚理想,且只能识别少数目标,当目标数量增多时需要提升信号特征的维度,使得不同个体之间的差异更易区分。
RFID目前主要分为两种方法,一种是机器学习的方法,另一种是深度学习方法。机器学习方法通过进行特征提取、特征融合、使用分类器进行分类来实现,此流程对提取有效特征的依赖性较强[7],提取的特征有多种类型,有时域特征[8]、频域特征、变换域特征[9]、图像特征[10]等,例如LI J提取信号盒维数作为其包络特征[11],岳嘉颖提取双谱特征[12]并通过降维处理进行简化,通过提取眼图特征[13]和特征融合实现了10 dB信噪比下识别准确率的提升。深度学习不需要过多的先验信息,也不需要进行特征提取,而是直接将数据输入神经网络,通过改变网络结构,网络对参数的自动调整,生成适应于RFID的网络模型。输入网络的可以是基带实信号、信号包络[7]、复信号[14]、星座图[15]、时频图[16]等,也可以使用特征融合,使得网络对特征的提取更加全面。深度学习进行RFID的主要任务为选择合适的网络结构与选择辐射源的输入形式。综合之前国内外的研究来看,虽然深度学习调整网络结构具有一定的随机性、盲目性,且实时性差,需要训练网络耗费大量时间,但是总体上来看,深度学习具有更高的识别准确率,且不依赖于特征的提取,在对非合作未知目标的判别问题中发挥着重要作用,但是绝大多数对基于深度学习的RFID研究仍停留在对网络结构的调整上,残差网络[17]在识别中表现的效果好因此备受青睐,在原始残差网络结构的基础上有许多的改进方法,唐震[18]将I/Q两路信号进行特征融合,使用数据增强技术达到扩充样本的目的,构建了深度残差收缩网络的识别模型,相比于同样复杂度的残差网络模型,识别准确率得到了提升;王春升[19]运用了原型学习的基本思想,提出了原型网络模型,证明了该模型比其它模型具有更好的识别效果,但是残差块往往用于深层网络,训练时间长且容易过拟合,数据输入形式也多为一维信号。
之前的研究工作中,耿梦婕[7]通过将信号包络直接输入神经网络与提取特征后输入分类器进行对比,证明了深度学习比基于特征提取的机器学习具有更高的识别准确率,任进[20]、侯涛[21]等进行了基于深度学习的调制方式识别,在其研究基础上,个体识别是在其基础之上提取更加细微的指纹特征。最近三年,很多方法都加入了差分的思想,如差分Hilbert谱图[22],差分复信号[14],差分星座图[23]等,而且进行了更多提取变换域特征的研究。PENG L[10]提取复信号的差分星座图,从而使得信号在不需要同步等先验条件下获得较高的识别准确率,蒋红亮[15]用等势星座图法进行了个体识别研究,为星座图特征提取开辟新思路,杨鑫[16]基于时频能量谱进行了三部跳频电台的识别,以上都是采用单一特征进行提取,吕昊远[24]利用加权平均思想改进了伪标签的赋值方式,得到了改进的伪标签半监督方法在测试集的识别准确率,但是他们的识别准确率没有超过95%,而且运用星座图特征的识别效果普遍优于时频图;岳嘉颖[12]运用三维双谱图像进行特征提取,但是效果并不理想,通过阅读文献发现,双谱大多数情况下作为一种特征参与特征融合从而提高识别准确率,由于双谱良好的抗噪声性能,对于信噪比较低的情况下选择用双谱特征来提升识别准确率是理论上可行的。
本文设计了一种简单的卷积网络结构和特征提取的改进方法,通过研究不同的特征融合方法对识别准确率的影响,提出了一种基于跳频信号时频域、改进后的星座图、改进的双谱域融合与深度学习的识别方法,并研究了不同图像大小对识别准确率的影响,设计了合适的网络结构来提升识别准确率,与之前的依靠其中某一种特征提取的方法进行了对比实验,证明了设计合理的特征融合方法可提高识别准确率,最后仿真不同传输信道条件,对本文提出方法的鲁棒性进行了研究。
1 信号处理
1.1 Hilbert-Huang谱获取
HHT不受测不准原理制约,适用于非线性的突变信号分析[25],相比于傅里叶变换,能显示出时频关系和各频率分量的大小。所以选择用HHT时频图来进行细微特征提取,能更好地提取信号的时频域特征。将采集的单路基带信号data(t)进行Hilbert变换可得到I/Q两路的复信号:
(1)
(2)
Dataup=Data×e2πfti/fs
(3)
其中:t为采样点序列,f取400 kHz,fs为采样率。取中频信号实部进行HHT变换,经验模态分解(EMD),得到:
(4)
其中:s(t)为中频信号实部,如图1所示。n为固有模态函数(IMF)的个数,imfi(t)为第i个IMF,rn(t)为剩余分量,这样,就将中频信号分解得到了各个频率分量。滤波器使得信号存在延迟,截取有效部分进行分析。
图1 中频信号实部
对每一个IMF求Hilbert变换:
(5)
使用欧拉公式,解析信号hi(t)表示为:
hi(t)=ai(t)eiθi(t)
(6)
ai(t)为瞬时幅度,θi(t)为瞬时相位。
这样就得到了信号的瞬时能量ai(t)2与瞬时频率ωi=dθi(t)/dt。
将信号的ai(t)2大小用颜色表示,绘制其关于时间和频率的函数,如图2所示。
图2 中频信号时频图
1.2 星座图获取与处理
星座图转移轨迹可以将不同内容,不同发射时刻的信号汇聚在一起,表征PSK类信号总体上的差异,经分析得知,不同个体星座图可能存在发散程度、偏移量大小等细微差异。由于目标发射的是8 PSK类信号,复信号Data(t)表示为:
Data(t)=
(7)
其中:ωc为信号载频,g(t)为波形函数,Ts为符号周期,M=8为相移键控的相位个数。对s(t)做M次方非线性变换:
gM(t)e-jMwct,0≤t≤Ts,0≤m≤M-1
(8)
此时M倍载频位置存在离散谱分量,对复信号Data(t)的8次方进行FFT变换,其频谱存在峰值对应的横坐标是快速傅里叶变换(FFT)点数,也就是等比例缩放的频偏。如下所示:
fbias=fft(data8)
(9)
(10)
(11)
得到的频偏曲线如图3所示。其中fbias为频偏,fmax为频偏最大峰值对应的采样点,f0为经过将fmax转换为实际频偏得到的值。从而使得每个数据点t的频偏得以纠正。
图3 八次方频谱图
这时星座图还存在偏移,去除偏移,得到星座转移轨迹图如图4(a)、(b)所示,由于所研究的信号为2 PSK与4 PSK调制方式的叠加,相当于8 PSK调制方式,星座图存在方向性,这里,我们将2 PSK调制的两个星座点的方向调整为纵向,如图4(c)所示,这样可以降低星座图的朝向对识别准确率的影响。具体作法为:选用1.5倍带宽作为窗长的升余弦滤波器进行匹配滤波去除噪声后,通过定时同步,找到最大的同步字相关峰对应的采样点,即最佳采样点,得到如图5所示的定时后聚类清晰的星座图,再用K均值聚类算法的优化算法,即K++算法,找到各个聚类中心,进而判断星座图所处的方向,再进行相应角度的旋转,即可得到方向一致的星座图。
图4 得到的不同方向星座图
图5 定时后与聚类后的星座图
1.3 双谱获取
由于高阶谱对高斯噪声具有很好的抑制作用[26],双谱为三阶累计量的二维傅里叶变换,是最简单的高阶谱,且保留了除了线性相位之外的全部信号特征,所以选择对跳频信号进行双谱估计来提取信号的有效特征。双谱估计的方法分为参量估计与非参量估计法。非参量估计不用对信号建立模型,对实际采集到的信号的分析相对简单,非参量估计又存在直接法与间接法,间接法是先估计信号三阶累积量再对其进行傅里叶变换,直接法是先进行傅里叶变换再估计信号的三阶累积量。本文采用间接法进行双谱估计。
Data的的三阶累计量为:
C3x(τ1,τ2)=
E{data*(t)data(t+τ1)data(t+τ2)}
(12)
其中:data*(t)为实信号data(t)的共轭,τ1,τ2为延迟。经过傅里叶变换,得到双谱为:
D(ω1)D(ω2)D*(ω1+ω2)
(13)
D(ω)为data(t)的傅里叶变换,设置fft长度256,窗长5,每个片段样本数为256,重叠率50%,绘制四层等高线,得到双谱图如图6所示。
图6 四层等高线双谱图
由图可见,不同个体的双谱存在细微差异,但是很难提取某个特征去表征它们之间的差异。之前的研究中对双谱特征提取以对角切片法为主,这会丢失双谱的部分信息,所以本文选择保留双谱的二维特征,将其作为一个整体降维归一化后进行特征提取。
2 卷积网络设计
2.1 批量归一化(BN)层
BN层可以在深层神经网络训练的过程中保证网络中的隐藏层的输入分布保持不变,主要思想是,对输入数据进行白化操作,即减去均值后除以标准差,这样可以加快网络收敛,防止过拟合。BN层有两个参数γ和β,可通过学习参数进行仿射变换,可得到最终的BN层输出。
(14)
(15)
其中:μ,σ,ε分别为输入所有元素的均值,方差和偏移量。
通常,BN层放在卷积层之后,激活函数之前,由于BN层对输入进行归一化后进行线性变换,这样可以使用BN层的参数改变卷积核每一个位置的参数。
2.2 交叉熵损失函数(CrossEntropy Loss)
交叉熵是信息论中一个重要的概念,可以用来作为两个概率分布差异性的评判指标。
相对熵可以衡量某个随机变量的两个概率分布P(x)和Q(x),其中P(x)为样本真实分布,Q(x)为模型预测的分布,将相对熵公式展开:
(16)
前面项H(p(x))是信息熵,后面项是交叉熵,交叉熵公式为:
(17)
由于在网络训练的过程中,输入数据是确定的,所有输入数据的概率分布P(x)是确定的,所有信息熵就是一个常量,我们在网络训练时需要减小真实概率分布与预测概率分布之间的差值,所以需要最小化相对熵,也就相当于最小化交叉熵,因为交叉熵的运算复杂度低,所以采用交叉熵作为损失函数。
2.3 网络结构设计与特征融合
设计神经网络,由于深度卷积网络具有很好的分类效果,且结构相对简单,在深度卷积网络的基础上使用BN层,以减小训练误差,增强网络的泛化能力,防止在训练过程中发生梯度的消失或爆炸,提高网络的训练速度。经过实验发现,多层全连接层可以使得识别准确率提高,使用标签软化(Label-smooth),设置标签权值0.9,防止过拟合。
取星座图,双谱和Hilbert谱具有相同尺寸大小的矩阵。将三个矩阵在通道维上连接,生成的3*n*n矩阵输入网络训练,其中n为样本尺寸的长和宽。网络结构如图7所示,使用了三个卷积层,两个全连接层,网络结构相对简单。
图7 网络训练流程
输入的数据为[1 024*3*n*n]格式的数组。其中批量大小取1 024,通道数为3,由于网络相对简单,训练轮数epoch取10。样本分为训练集,验证集和测试集,三部分的占比为6:2:2。分类问题中,损失函数用来表示预测结果和数据实际标签之间差距的大小,交叉熵损失函数是将LogSofMax和NLLLoss集成到一个类中,在解决多分类问题中效果显著,本文使用交叉熵损失函数,并使用Adam优化方法。激活函数使用Relu激活函数,最后一层为softmax层,选择学习率自适应调整策略,随损失函数变化调整学习率,加快训练收敛速度。
3 实验结果
3.1 预处理
所选取的跳频电台为200~240 MHz,设置采样率1.6 M/s,中心频率220 MHz,带宽60 MHz对信号进行采样。三部跳频电台采样时长为3 min,每个采集时长取1.5 ms,以保证长于每个突发的时长,从而使得采样片段完整。对采集信号进行DDC(变频、下采样、滤波)操作,得到基带信号。其包络如图8所示。通过对Data通过UW前导码进行定时同步:由于采样率设置为符号速率的8倍,用37位UW字和信号每隔8位做相关,如图9所示,找到相关峰,即为最佳采样点,对相关峰设置阈值,去除噪声和无用信号,将得到的信号进行归一化处理,以方便网络训练。
图8 采集到的样本
图9 UW字同步示意图
取其中的30 000个突发信号片段作为样本,由于有6部电台,共有180 000(6*30 000)组样本。为了证明本文方法有效性,分别将比较不同信噪比,不同数据输入形式,相同网络结构下个体识别准确率。信号处理使用Matlab2019,卷积神经网络训练与测试使用Python3.4。
3.2 有效性分析
在第一个对照实验中,将星座转移轨迹散点图转化为热力图[27],如图10所示,图中的渐变颜色代表散点的稀疏程度,图片包括RGB三通道,图片大小256*256。第二个对照实验将通道数为1的星座点图输入。第三个对照实验提取HHT谱输入[22]。第四个对照实验将通道数为1的双谱矩阵输入。
图10 星座转移轨迹热力图
样本被转换到变化域进行特征提取时,矩阵大小选取成为一个重要的影响因素,从经验分析的角度来看,图像尺寸越大,分辨率越高,似乎网络提取到的细微特征越全面,所以在一定范围内增加图像大小是有必要的,但是神经网络计算复杂度会随着图像大小的增加而急剧增加,而且当图像尺寸大小增加时,噪声等无用信息可能会被当成细微特征而使得识别准确率下降。为了对本文方法的结果进行更全面的分析,实验选取在30 dB的高斯白噪声条件下进行,每一个样本分别生成尺寸大小为300*300,400*400,500*500,600*600,700*700和800*800的几种对应的变换域矩阵进行研究,为了证明特征融合的有效性,选取三个特征种的每一个单独输入作为对照实验,还进行了星座热力图输入作为对照实验来研究星座图处理的方式对识别准确率的影响。
实验结果如图11所示,由图可见所有实验在600*600分辨率时的识别准确率都是最高的,当图像分辨率高于700*700时识别准确率降低,因为这时图像包含了大量无用信息,改变了原始的有用信号数据分布,。本文的方法识别准确率比三种特征域中任何一种单独输入时的识别准确率高,在600*600的图像大小条件下可以达到99.29%,远高于其它方法,说明特征融合提高了个体识别准确率,分辨率降低比分辨率提高对识别准确率的影响更明显,星座图包含了更多有效的细微特征,在各个对比的图像大小条件下都能达到90%以上的识别准确率,星座散点图在低分辨率时表现出更高较高的识别准确率,双谱特在不同图像大小情况下差异不明显,但星座热力图特征却受图像分辨率影响显著。
图11 不同输入和图像尺寸条件下个体识别准确率
3.3 鲁棒性分析
当信号通过有线信道传播时,信号中包含的噪声主要是加性高斯白噪声,当信号在无线信道中传播时,信号中噪声的大小服从瑞利分布,由于信噪比过低时,无法通过定时同步生成聚类相对清晰的星座图,也就无法调整星座转移轨迹散点图的方向,所以为了验证本文方法的优越性,仿真了两种信道条件下的样本,选择研究SNR为5 dB、10 dB、15 dB、20 dB、25 dB、30 dB几种情况下本文所提出方法对6个部跳频电台信号的识别准确率,结果如图12所示。
图12 不同噪声条件下的识别准确率
由图可知,在信噪比降低时,识别准确率快速下降,瑞利信道下识别准确率低于高斯信道下的识别准确率,尤其在信噪比降低时,瑞利信道下的识别效果迅速下降,信噪比为5 dB时,相比于高斯信道下识别准确率79.33%,瑞利信道下识别准确率只有66.93%。在高斯信噪比大于10 dB时,本文方法的识别准确率在87%以上,高于[7]中的准确率,说明本文方法具有一定的鲁棒性。
本文方法在高斯信噪比为10 dB与30 dB条件下识别准确率的混淆矩阵如图13所示,由图可知,电台1和2,电台1和3,电台3和4的相似性比较高,在识别中容易混淆,由于电台一致性极高,硬件差异表现差异微小,本文方法依然可以得到很高的识别准确率,说明该方法具有实用性。
图13 SNR为30 dB与10 dB时的混淆矩阵
4 结束语
本文提出了一种基于2 PSK和4 PSK混合调制的星座图生成与预处理方法,同时还提出了一种多特征的融合方法,通过将跳频电台的三种特征融合,结合了各个特征在区分个体中的优势,提升了个体识别识别准确率且具有一定的抗干扰能力。本文还研究了不同图像尺寸和噪声条件对识别准确率的影响。本文设计了一种相对简单的卷积神经网络,节约了训练阶段的运算成本,使得在无干扰的室外环境下,对三部跳频电台的识别准确率达到了99.29%。由于神经网络提取的特征可解释性差,下一步的研究计划结合人为指纹特征提取和神经网络提取特征,来进一步提升识别准确率,并加入更多的目标来测试识别效果。