APP下载

基于残差神经网络的辐射源个体识别

2020-10-16

航天电子对抗 2020年4期
关键词:辐射源识别率时域

张 宁

(中国人民解放军92578 部队,北京102200)

0 引言

特定辐射源识别技术(SEI)通过提取接收信号中能够体现辐射源个体差异的细微特征[1-3],实现对特定辐射源个体的识别。这些独特的细微差异与雷达发射机内部的独特差异有关,与信号形式无关,并且各个发射机的RFF 在不同的发射器中难以伪造,这使得SEI 具有广阔的应用前景[4-6]。最近,SEI 在无线网络安全和通信侦察对抗等民用和军事领域已变得越来越重要。

SEI 的发展主要经历了三个阶段:第一阶段主要采用的方法是特征参数匹配方法,特征参数匹配法的主要特点是直接将测量获得的一个或多个信号特征参数(PA,CF,PW,TOA,AOA 等),与数据库中的己知雷达信号的相应特征参数模板进行匹配,从而识别该辐射源信号,而对原始数据不进行相关、变换等运算处理。

第二阶段是通过提取信号的脉内特征,使用机器学习的方法完成辐射源识别。常见的脉内特征有雷达辐射源信号的小波包特征、复杂度特征、相像系数特征、信息维数、分形盒维数以及特征。目前,雷达辐射源脉内特征提取的一般方法可归纳为:时域自相关法、时频分析、数字中频技术、调制域分析、复倒谱分析、相干检波技术和小波变换等。

第三阶段是引入了深度学习,目前深度学习在图像识别、语音识别、自然语言处理等方面成果显著,特别是对于信号识别是有效的,原因是具有非线性逻辑功能的多个隐藏层使得隐藏在数据中的更深层次的信息能够被学习。深度学习的快速发展带动了雷达信号识别技术的提高。近年来,研究者紧跟科学发展的脚步,将人工智能积极地应用到雷达相关的各个学科,陈森森等人使用RNN 网络,在-10 dB 的时候将信号的识别率提升到91% 以上;车金鸽[7]等人使用DBN 网络,在-10 dB 的时候将信号的识别率保持在90%左右;田得雨[8]等人结合AlexNet 网络,在0 dB 的时候将信号的识别率保持在92%以上。

但是上述方法均需要对时域信号进行变化,具有预处理时间过长、网络深度不足、训练过程中存在着网络退化等缺点。当前常见的基于深度学习的辐射源识别方法的预处理方法是对信号做时频变换,而本文是通过直接输入时域信号对辐射源完成识别,从而节省运算信号预处理的运算时间。首先,通过文献[9]中的奇异值分解方法减少接收信号的双谱维数,减少冗余信息对识别的影响。然后,对信号进行特征增强,通过将信号和降维后的双谱特征融合输入的方式将信号输入到网络中。残差网络通过反向传播的思想来解决网络深度不足、梯度消失/爆炸等问题,并且使用直接映射来连接网络不同层直接的思想。

1 特征提取

1.1 双谱计算

选取双谱特征是由于该特征对噪声不敏感,运算量小,利于实时实现。频谱幅度是常用的平移不变特征,但它丢掉了所有的相位信息,增加了类间的趋同性,双谱特征是另一种得到广泛研究的平移不变特征,与频谱幅度不同,它保留了除线性相位以外的所有相位信息,且对任意对称分布的噪声不敏感。

提取到的目标脉冲x(t)为单频信号,其信号模型可假设为:

式中,x*为共轭,τ1、τ2为延迟。

设X(w) 是x(t) 的傅里叶变换,那么双谱B(w1,w2)可以定义为:

结合上述定义,采用双谱直接估计法对双谱进行计算,具体步骤如下:

1)将提取到的脉冲数据{ x0,x1,…,xM}分为N 段,每段有K 个观测样本,每段的重叠数据为T 个,即M =KN -(K-1)T。

2)计算DFT 系数:

式中,i=0,1,…,K/2,n=1,2,…,N。

3)在2)的基础上计算DFT 系数的三重相关:

式中,n=1,2,…,N,0 ≤λ2≤λ1,λ2+λ1≤fs/2,Δ0=fs/N0,对 于N0,L1需 满 足K=(2L1+1)N0,fs为 信 号的采样频率。

4)信号双谱取N 段双谱的平均值:

1.2 双谱降维

据上文得到单频信号的双谱为B(w1,w2),其中包含着过多的无用信息,并且二维数据矩阵不利于计算机分析,可以将其特征值分解。奇异值分解从理论上能够简化数据。

式中,U 和V 为酉矩阵,分别称为左右奇异矩阵,相应的ui,vi称为左右奇异矢量,设奇异值的排列顺序为λ1>λ2>…>λp>…>λN,λp≥δ,δ 为选取阈值,则由非奇异值构成的奇异值向量为:

考虑到双谱自身就是平移不变量,因此根据奇异值分解得到的奇异值向量是平移不变量,其中,大的奇异值对应的奇异值矢量相对于小奇异值对应的奇异值矢量包含着更多的双谱矩阵的信息,因而具有更多的鉴别信息。奇异值向量和奇异矢量相对于双谱特征维数都大为降低, 而且奇异值向量是实数特征,可以进一步降低识别的复杂度。

本文分别以奇异矢量(U 矩阵)作为输入和特征增强后的信号作为输入进行仿真。

1.3 特征增强

在完成了对信号的双谱特征降维之后,对数据进行特征融合,融合之后的数据就能对原始信号完成特征增强。特征增强的功能是减少无用数据对识别的影响,该方法无需对信号做时频变换,因此减少了对输入信号的运算量。

本文的特征融合方式属于轻量级融合,主要体现在不需要对数据进行尺寸调整。融合策略是将降维后的双谱特征和原始信号进行融合。主要步骤如下:

1)在特征融合中,设X 为时域信号,Y 为降维后的双谱特征,[ X,Y ]为信号X 和降维后的双谱特征Y 首尾相连操作,那么相应的融合操作可以表示为Fconcat=[ X,Y ]。

2)归一化操作,归一化操作旨在将行和列的数据对齐并转化为一致的规则,标准化通过确保所有行和列在机器学习中得到平等对待,让数据的处理保持一致。

计算输入向量的每一个分量的平均值:

式中,mi为第i 维数据的均值,T 为所有的输入数据,xi表示某一分量。

计算其标准差:

此过程不会改变数据集中的信息,但是会通过将输入值放在更适合标准激活函数的范围来改善算法性能。

2 基于残差神经网络(ResNet)的SEI 识别算法

2.1 ResNet

ResNet 可以通过很深层次的网络来实现准确率非常高的识别效果。因此深的网络一般会比浅的网络效果好,如果要进一步地提升模型的准确率,最直接的方法就是把网络设计得越深越好,这样模型的准确率也就会越来越准确。

假设现有一个比较浅的网络已达到了饱和的准确率,这时在它后面再加上几个恒等映射层,这样就增加了网络的深度,并且误差不会增加。ResNet 引入了残差网络结构,通过这种残差网络结构,可以把网络层弄得很深,并且最终的分类效果也非常好。

残差结构图如图1 所示。

图1 残差结构

残差结构表达如下:

式中,F(xl,Wl)是残差部分,l 为当前的层数。

对于一个更深的L 层,和l 层的关系可以表示为:

常用的损失函数ε 为平方误差的平均值(MSE),其定义如下:

根据导数的链式法则,损失函数ε 关于xl的梯度可以表示为:

2.2 识别算法

将降维后的双谱Y 和时域信号x(t)的融合输入Fconcat作为残差神经网络的训练样本,以学习识别出特定的辐射源个体。选用152 层残差神经网络就能保证有效地提取出信号的高维特征,该网络结构包含着5个卷积层。整个网络设置如表1 所示。

表1 网络设置

残差网络的参数设置如表2 所示。

表2 残差网络的参数设置

算法主要思想为:首先,估计接收信号的双谱特征,通过公式(10)―(12)减少其维数,然后将信号和特征融合输入,采用残差神经网络通过特征增强之后的数据完成特定辐射源的识别。具体算法流程如图2所示。

图2 基于特征增强的ResNet 的SEI 识别算法

基于特征增强的ResNet 的SEI 识别算法如下:

1)训练过程:令Bi是第i 个训练信号序列,其中i=1,2,…,Nt,Nt是 来 自K 个 辐 射 源 的 总 的 序 列数目。

①使用公式(7)―(9)估计信号的双谱Bi;

②从每个辐射源序列中选择Nd个双谱,根据公式(11)得到双谱的特征值Λ;

③以特征值Λ 作为Bi的压缩双谱;

④使用信号x(t)和Bi构建特征增强后的数据Ti;

⑤{Ti,lk}作为训练集,其中lk∈{1,…,K }是每类辐射源的类标签,用这些数据开始训练ResNet 模型从而获取最佳网络权重。

2)识别过程:设Tj是第j 个测试序列,其中j=1,2,…,Ns,Ns是K 个辐射源的测试序列的总数。

①使用公式(7)―(9),估计测试样本的双谱;

②通过公式(11)计算测试样本的压缩双谱;

③使用训练好的ResNet 识别测试序列。

3)交叉训练:将上述使用过的训练集和测试集随机打乱,重新选取训练集和测试集,重复上述的训练过程和识别过程。

2.3 识别性能评估

为了验证ResNet 的识别性能,采用2 台USRP N210 采集实测数据,发送端的信号的参数设置如表3所示,发送的信号主要分为4 类:单频信号、BPSK、LFM 和NLFM。

表3 发射信号的参数设置

2 台N210 发送信噪比为18 dB 的单频信号,其时域波形和频域波形如图3 所示。

图3 中2 台设备的单频信号的时域波形的欧氏距离为13.711 7,其中采样点数为1 800,平均每个点之间的欧式距离为0.007 6,表明2 台N210 发射的信号非常相似。

设置接收机采样率为20 MHz,数据收集端使用的是i7-6700HQ 8G GTX960M 4G 独显FHD win10的PC,所有工作在Matlab 2017a 和python 3.6.1 中完成,数据的处理流程如下:

1)实验收集平台为Ubuntu12.0.4 的Gnuradio,收集到的数据长度在10 s,即1 台N210 收集10 000 个脉冲,保存的文件格式为bin 文件。收集平台如图4所示。

文献[7]将信号做时频变换,将时频图作为输入,使用深度学习网络对辐射源完成识别。而本文通过使用直接输入信号大幅度地减少了运算量。文献[7]中的输入预处理分为5 步:时频变换、截取、灰度化处理、平滑处理和归一化处理。文献[10]中以信号的时域图作为输入,根据脉冲长度自适应提取脉冲时域图,将其灰度化。所需的运算时间如表4―6 所示,表中数据单位为s。

从表4―6 中可以看出文献[7]平均对一个脉冲的预处理时间需要0.171 0 s,对10 000 个脉冲而言则需要1 701 s;文献[10]平均对一个脉冲的预处理时间需要0.047 22 s,对10 000 个脉冲而言则需要472.219 7 s。本文提出的方法相对于文献[7]的方法,平均一个脉冲可以节省0.148 3 s,相对于文献[11]的方法,平均一个脉冲可以节省0.025 4 s,因此本文提出的算法节约了大量的运算时间。

图3 2 台设备信号的时域和频域波形(SNR=18 dB)

图4 实验平台

表4 文献[7]预处理运算时间 s

表5 文献[10]预处理运算时间 s

表6 本文预处理运算时间 s

接下来通过实测数据对算法有效性进行验证,值得一提的是文献[7]和文献[10]均采用仿真数据进行验证,验证分为2 步:1)采用文献[10]的输入,与ResNet进行对比;2)将本文算法(奇异值作为输入,特征增强后输入)与文献[7](DBN)、文献[10](CNN)进行对比;

验证1:

每个信噪比下各进行1 000 次蒙特卡洛实验,仿真信号的信噪比变换范围为4~36 dB,步长为2 dB,识别率对比如图5 所示。

图5 识别率对比

从图5 中可以看出,使用ResNet 的识别率比CNN高,这是由于ResNet 引入了残差网络结构,通过残差网络,可以把网络层弄得很深,并且通过在输出和输入之间引入一个短连接,而不是简单地堆叠网络,可以解决网络由于很深出现梯度消失的问题,从而可以把网络做得很深。综上所述,ResNet 的网络性能优于CNN。

验证2:

每个信噪比下各进行1000 次蒙特卡洛实验,N210 发射信号的信噪比变化范围为0~18 dB,步长为2 dB,其中本文使用的输入分为2 种(奇异矢量和特征增强后的信号),文献[7]使用的输入为信号的时频图,文献[11]使用的输入为信号的时域图像,不同信噪比下的识别率结果如图6 所示。

文献[7]表现出较差的识别结果,由于发出的是4种不同信号,通过时域图输入的方法在高信噪比下不能做到100%识别,并且受波形形式影响很大。文献[10]中提出的算法在实测信号中表现出的识别率较好,能够保持92%以上的识别率,但是信号的预处理时间过长。本文通过提取信号的降维双谱特征,通过特征增强的方法,削弱信号形式对识别结果的影响,能够做到在6~18 dB 的时候对辐射源的识别率达到99.99%,并且在0 dB 以上时达到93%以上的识别率,但是通过直接输入奇异值矢量的方法表现出来的识别率不尽如人意,不能做到高识别率。

图6 不同信噪比下的识别率对比图

3 结束语

本文提出了一种新颖的SEI 方法,即基于信号的压缩双谱特征增强的ResNet 辐射源识别方法,该方法削弱了信号形式对识别结果的影响。与现有的深度学习方法进行对比,ResNet 学习了隐藏在数据中的更加高维的特征,提高了对辐射源个体的识别率,仿真结果表明,该算法在预处理上能节约大量的时间,并且通过特征增强的方法可以提高信号的识别率,为SEI 提供了新的解决方法。■

猜你喜欢

辐射源识别率时域
OFDM 系统中的符号时域偏差估计
基于单站干涉仪测向法的未知辐射源定位技术*
基于博弈论的GRA-TOPSIS辐射源威胁评估方法
晚霞浅淡少年糖
硬件时域门技术在宽频带天线罩测试中的应用
频域滤波产生的时域端点效应及避免方法
基于多参数联合模糊处理的雷达辐射源威胁等级判定
档案数字化过程中OCR技术的应用分析
基于PCA与MLP感知器的人脸图像辨识技术
科技文档中数学表达式的结构分析与识别