基于深度学习的雷达辐射源识别算法
2021-04-04殷雪凤
殷雪凤,武 斌
(西安电子科技大学电子工程学院,陕西西安 710126)
0 引言
雷达辐射源识别(REI/RER)技术是电子战中至关重要的一部分,是电子支援措施(ESM)的核心和雷达对抗系统中的关键技术[1]。辐射源识别技术通过从侦察信号中获取目标辐射源的体制、用途、型号等信息,为下一步态势估计、威胁估计和决策调整提供依据。
在辐射源识别研究的早期,信号稳定、调制简单,传统的雷达辐射源识别方法主要是基于脉冲描述字(PDW)的特征提取方法[2]。但随着雷达技术的发展,特别是新体制、新用途雷达的使用,调制形式变得复杂,调制参数转换越来越快捷,时空领域范围内的雷达信号交错,密度增大,传统雷达辐射源识别方法不能有效对辐射源进行识别[3]。因此,最新的电子战系统还对雷达信号的脉内特征进行分析,不少研究人员在这方面做了大量工作。时频特征、小波包特征、分数阶傅里叶变换域特征和小波脊频特征等参数在辐射源识别领域中都取得了不错的效果[4]。但这些方法都需要人工提取特征,费时费力,而且人为提取的特征在辐射源识别系统中的有效性和普适性还有待深入研究,因此,整个系统对人为因素的依赖太强。
随着人工智能的发展,特别是近几年深度学习的崛起,不少专家学者将深度学习模型应用于雷达辐射源识别中,并取得了一定的成果。文献[5]提出了一种基于深度置信网络的识别算法,将信号的时频图输入训练好的深度置信网络,识别不同调制信号。文献[6]对辐射源信号进行幅-相二维图像表征,利用卷积神经网络对二维图像进行特征提取和分类,实现了对不同调制信号的分类识别。文献[4]将辐射源的二维时频图用随机投影和主成分分析方法进行降维,再利用层级编码器(SAE)模型挖掘时频图像的深度联合特征,实现对辐射源信号的识别。然而,这些深度学习识别算法,需要对信号进行处理,变换到时频域或其他维度,增大了信号处理的复杂性。
针对以上问题,本文提出一种基于一维卷积神经网络(CNN)和长短期记忆网络(LSTM)的深度学习雷达辐射源识别模型,首先通过一维CNN的局部特征学习能力自动提取雷达信号的局部特征,然后通过LSTM学习雷达辐射源信号序列在整个时间维度上的信息,最后通过全连接层得到样本数据属于各个辐射源的概率完成分类,实现对原始辐射源时域信号端到端的识别。仿真实验证明了该方法的有效性。
1 深度学习神经网络
1.1 卷积神经网络
卷积神经网络(CNN)常用于计算机视觉领域,它通过直接与图像像素进行卷积来提取图像特征[7]。CNN相邻层的节点不采用全连接的方式,一般由卷积层和池化层交替级联。
卷积层的目的主要是提取输入的特征值点,通过设置一个卷积核,然后以一定的步长滑动卷积核,基于卷积核与输入的卷积,由此得到对应的局部特征矩阵。通过采用不同的卷积核与原始输入进行卷积运算,即可从不同角度提取输入的特征。这样的方式保留了原有输入特征的顺序关系,同时卷积运算特征提取的方式实现了权值共享,减少了参数数量。池化层使用一个过滤器以一定步长对矩阵进行扫描,获取视野域的最大值或平均值,其作用是对卷积层的输入结果进行采样,进一步压缩特征图,实现特征降维,防止过拟合。
1.2 长短期记忆神经网络
长短期记忆网络(LSTM)是一种特殊的循环神经网络,由Hochreiter等人提出[8],它可以根据当前以及过去较远时间的输入,完成输出预测的任务。
LSTM由递归连接的LSTM单元组成,每个LSTM单元结构如图1所示,分别由遗忘门、输入门、输出门组成。首先通过遗忘门σf根据输入xt和上一LSTM单元的输出ht-1对上一时刻的输入状态Ct-1进行控制,丢失不重要的信息;然后输入门的控制信息σj来决定添加有用的信息,得到当前状态Ct;最后通过遗忘门和输入门影响输出门,得到最终输出ht。其中,tanh为激活函数对状态量和输入量进行缩放。这种结构使网络能够选择性地记住对输出重要的信息,遗忘不重要的输入[9]。
图1 LSTM单元结构图
2 基于CNN和LSTM的雷达辐射源识别
在本文提出的辐射源识别算法中,采集得到的不同调制方式的带标签的基带雷达辐射源信号,在经过z-score标准化预处理之后,直接输入搭建好的CNNSLTM深度学习模型中,模型通过反向传播算法调节网络参数,使网络收敛,最终能够实现对不同调制方式的时域信号进行识别。
2.1 数据预处理
本文采用的预处理方式为z-score标准化方法,这是一种在深度学习中常用的数据处理方法,经过处理的数据均值为0,标准差为1,保证不同维度的数据具有相同的分布规模,更有利于网络优化,能有效缩短训练时间。
设原始辐射源采样序列为x=[x1,x2,x3…xN],其中N为采样点数。以第i个采样点为例,标准化之后的采样值为:
通过以上的标准化处理,使得输入数据分布在较为合理的范围以内,有利于减小样本数据间量纲的差异对预测结果的影响。
2.2 网络结构
由于雷达辐射源信号是典型的时间序列数据,因此本文选用擅长处理时间序列的一维CNN网络和LSTM网络解决雷达辐射源识别问题。CNN擅长局部特征的提取,而LSTM则擅长捕获数据时序性,适合处理时间序列。为了更好地提取雷达辐射源信号的特征,本文将二者结合,用CNN提取雷达信号的局部特征,用LSTM挖掘信号整体的关联,提取全局特征,网络结构如图2所示。用3个卷积单元提取输入信号的局部特征,即短时间内各个采样点之间的关系;1个LSTM层用于提取较长时间采样点之间的相关关系;最后通过2个全连接层,实现对于不同调制信号的识别[10]。
图2 CNN-LSTM网络结构示意图
此处的3个卷积单元的结构相同,都由卷积层、批量归一化层(BN)、激活层、池化层构成,如图3所示。卷积层计算信号与不同卷积核的卷积,激活层将卷积得到的特征进行非线性激活。为了更有利于提取信号的局部特征,每个卷积单元的卷积核大小分别为:4×1、3×1、3×1,较小的卷积核具有更小范围的感受野,更有利于关注局部的特征。为了加快网络的训练和收敛速度,降低梯度爆炸和梯度消失的情况发生,防止网络过拟合,在对卷积结果进行激活之前,加入了BN层[11]。最后将激活层的输出输入池化层进行下采样,对特征进行降维,此处池化层采用的池化方式为最大池化,另外,在池化层中为了进一步提高模型的泛化能力,还进行了Dropout操作。卷积单元这样的设置,即保证输入信号的特征能被有效提取,BN层和池化层的加入也能防止网络过拟合,同时提高训练速度。
图3 卷积单元结构示意图
LSTM层将卷积单元得到的特征图进行计算,得到特征之间的全局关系,使得网络对于整个采样时间内的采样值有更加全面的认识。通过CNN之后的网络输出不仅数据规模减小,而且时间维度的局部特征更为明显,这帮助提高了LSTM的训练速度。而LSTM层可以很好地完成时间上的特征提取,更好地发现时间片间的联系,得到更有利于雷达辐射源识别的特征。最后,网络末尾的2个全连接层对LSTM的输出进行处理,实现不同调制信号的分类识别。整个网络部分参数如表1所示;LSTM输出节点数为64;FC1输出节点数为64,激活函数为ReLU,Dropout为0.5;FC2输出节点数为6,激活函数为Softmax。
本文采用的损失函数为交叉熵函数,这是由于本文研究的雷达辐射源识别问题属于机器学习中的多分类问题,采用该函数更利于网络训练。优化算法为随机梯度下降算法,学习率设置为0.001。训练时批处理的大小为256,每次迭代结束后检查验证集损失值,当其连续多次不再发生变化,则表明模型参数训练充分,停止训练,得到训练好的雷达辐射源识别网络模型。
表1 CNN⁃LSTM网络参数
3 仿真结果与分析
本文的仿真实验是在谷歌的Google Colaboratory在线平台上进行的,平台GPU的型号为Tesla T4,内存为12.78 GB,硬盘为40 GB。系统版本为Ubuntu 18.04.3,软件上用python 3语言在以TensorFlow为后端运行的Keras上实现。
3.1 数据集简介
实验中的雷达辐射源数据均是通过Matlab仿真得到,主要包含6类不同的调制信号,分别为:常规脉冲信号(CP)、线性调频信号(LFM)、非线性余弦调频信号(NCFM)、二相编码压缩信号(BPSK)、二频率编码信号(BFSK)和四频率编码信号(QFSK)。为使仿真信号更接近原始雷达辐射源信号,信号调制参数不取固定参数,而是在设置的参数值的一定范围内波动,如常规脉冲信号的载波频率为200 MHz,实际仿真载波频率值在(190 MHz,210 MHz)区间内均匀分布,具体参数如表2所示。统一取采样频率fs=4 GHz,仿真时长T=1.024 μs,脉宽为τ=1 μs,采样点数为4 097个点。其中,BPSK和BFSK采用的编码方式为11位巴克码,码元宽度为0.09 μs;QFSK采用的编码方式为16位Frank码,码元宽度为0.062 5 μs。
为验证模型的抗噪声性能,仿真生成了-12~14 dB、步长为2 dB的样本数据。在模型训练阶段,每类调制信号在一种信噪比条件下仿真了500个样本数据,设置6种调制类型、14个不同的信噪比,共42 000个数据作为训练集。在训练时随机选用37 800个样本训练,4 200个样本用于验证。另外,生成了每种调制信号单一信噪比下100个样本、共8 400个样本的数据集作为测试集,用于测试训练得到的网络性能。
表2 不同调制信号的参数设置
3.2 识别准确率分析
本文提出的基于CNN-LSTM深度神经网络的雷达辐射源识别模型,在训练集上得到充分训练后,最终在测试集上的平均识别准确率达到了91.13%。为了进一步探究CNN-LSTM网络对不同调制信号的识别情况,本文分别统计了每种调制信号在不同信噪比下,样本的识别正确率,如图4所示。由图4可知,在信噪比大于-4 dB时,网络对于6种调制信号的识别正确率都达到了90%以上;当信噪比在4 dB以上时,对于所有调制信号的识别正确率都达到了100%,可见,CNN-LSTM网络对于不同的调制信号都有较好的识别效果,具有较好的抗噪声性能。
图4 不同信噪比下6种调制信号识别结果图
另外,为了说明LSTM层对于网络的影响,在实验中,设置了对照实验,训练了另一个CNN网络,该网络结构将CNN-LSTM网络中的LSTM层改成了Flatten层,直接把多维输入一维化,其他结构和参数与CNN-LSTM完全相同,以同样的方式对该网络进行训练,并在相同的测试集上测试网络,将其识别结果与CNN-LSTM网络识别结果进行对比。图5为CNN-LSTM网络以及CNN网络在不同信噪比下的识别结果。从图5中可以看出,在信噪比高于-6 dB的情况下,CNN-LSTM网络的识别结果的正确率都在90%以上;在信噪比高于2 dB之后,该模型的准确率达到了100%。相比之下,CNN模型在低信噪比的情况下识别结果远不如CNN-LSTM模型,在信噪比为-8 dB时,识别准确率就已降到了70%以下。由此可见,CNN-LSTM模型能更有效识别不同调制信号,具有更好的抗噪声性能。
图5 CNN-LSTM与CNN网络识别结果比较
为了进一步分析模型识别的准确性,对识别结果进行了抗混淆性能分析。表3为测试集识别结果的混淆矩阵,由表3可知,模型对于所有调制类型的信号识别正确率都能达到80% 以上。模型对于LFM和QFSK的识别效果最好,识别的正确率达到了94%以上;不论何种信噪比条件下,模型对于NCFM、BFSK的识别效果也比较好,识别准确率都达到了90%以上;但对于BPSK信号的识别效果不佳,仅为81.57%,模型易把BPSK信号错误识别成CP信号,而对于CP信号,被错分成BPSK信号的概率也是最高的。可见,不论对于何种信号,模型的整体识别能力都是不错的,都达到了80%以上,但对于CP和BPSK信号的识别能力还有待加强。
表3 CNN⁃LSTM网络辐射源识别混淆矩阵 %
3.3 识别处理时间
为了研究批处理大小对单个测试信号处理时间的影响,实验选取设置不同取值的批量,在不同批处理大小下统计处理单个信号的时间,其中批处理的取值为[2,4,8,…,4 096,8 192]。实验结果如图6所示。由图6可知,批量大小对单个样本的测试时间有较大的影响,当批处理大小为2时,单个样本的测试时间约为200 ms,当批量大小大于1 024后,单个样本的测试时间基本稳定在3 ms左右。因此,每次将多个测试样本输入网络能有效降低单个测试信号的处理时间,提高网络工作效率。
图6 不同批处理大小与单个样本测试时间关系图
4 结束语
本文提出了一种基于一维CNN和LSTM的深度学习辐射源识别模型,对辐射源时域信号进行自动特征提取,实现了对6种不同调制信号的识别,避免了人工提取特征的困难;另外,本文用LSTM网络提取辐射源信号的全局关系,提高了网络的抗噪声性能。仿真结果表明,相比于单一CNN网络,加入LSTM层的网络的抗噪声性能更好,在-6 dB的信噪比条件下,识别的准确率能达到90%。CNN-LSTM网络从整体来看具有很好的识别效果,但是对于某些特定调制信号的识别正确率偏低,如常规脉冲信号。未来的工作将进一步改进网络,提高网络对于CP信号的识别率。另外,本文发掘出的LSTM网络结构良好的抗噪声和全局学习性能,可以考虑将其应用到辐射源识别的其他方面,如雷达指纹识别等。