基于LSTM的雷达辐射源识别技术∗
2019-12-26刘括然
刘括然
(海军参谋部 北京 100841)
1 引言
雷达辐射源识别是电子对抗侦察系统中的主要功能之一,是我方侦察设备(雷达侦察)截获敌方雷达信号特征参数,然后进行信号分选,与模板库中的参数数据进行相似度计算,获取该雷达的类型、搭载平台、威胁等级以及用途等信息。雷达辐射源识别为战略战役指挥决策、预警自卫和战术打击提供了重要的判断依据[1~2]。但近年来,随着新体制雷达和作战样式的不断增多,使得电磁环境异常复杂,导致识别雷达信号变得困难,如何在如此复杂的电磁环境中高效快速地识别成为重要问题。目前研究雷达辐射源识别的方法主要是基于传统的机器学习方法,如贝叶斯算法[3]、近邻算法[4]、决策树算法[5]、人工神经网络[6]等方法以及最近几年兴起的深度学习的方法。传统的机器学习,虽原理简单、理论成熟但识别率低、泛化能力弱、有限制使用条件。
近年来,随着在深度学习领域不断的探索和研究,已经在语音识别[7]、图像识别[8]、自然语言[9]领域取得比较大的成功,相对于传统的机器学习方法,深度学习方法性能优异、识别高等,但具有不可解释性以及需要大量的计算能力。本文研究的辐射源雷达识别问题具有时序特征的特点,构建基于LSTM(Long Short-Term Memory)[10]的雷达辐射源信号识别的方法。LSTM是用于处理时序数据的神经网络模型,利用该模型进行提取辐射源信号特征,实现雷达辐射源分类识别。
2 雷达辐射源信号识别
2.1 问题描述
雷达辐射源信号识别是首先通过雷达被动收集、采集一段时间内敌方辐射源信号特征,然后使用数字信号处理技术进行预处理,获取细微特征参数等,最后把特征参数输入到分类器中,识别辐射源类别。对于雷达辐射源识别,本文使用一段时间内的雷达辐射源信号特征数据源,先进行归一化处理,之后输入到构建的LSTM模型中,识别辐射源的类型。图1为整个雷达辐射源识别的过程和流程图。
1)雷达收集辐射源时序信号特征进行标注,构建数据集,然后按照一定的比例进行抽取作为训练集、测试集。
2)对雷达辐射源信号训练集和测试集进行预处理,向量化、归一化、编码等基本预处理操作。
3)使用TensorFlow[11]构建深度LSTM神经网络模型,确定网络层次、节点数量、学习率,网络层次和节点数量等超参数。
4)把预处理后的训练集输入到构建的模型中进行训练,输出辐射源识别结果与已有的标签进行对比,使用训练集准确率进行评估,若达到设定的阈值,则转为下面的步骤,否则转为步骤3)。
5)把预处理后的训练集输入到训练好的LSTM网络模型中识别雷达辐射源类型,比较训练集和测试集的准确率,评估是否泛化的结果很好,判断模型识别的效果。若泛化效果差,则转为步骤3)。
图1 雷达辐射源识别过程
2.2 LSTM基本理论
LSTM网络是一种具有记忆的神经网络模型,使得处理时序的属性数据具有很好的效果。标准LSTM网络架构中的核心单元[12]。主要通过输入门,遗忘门以及输出门这3个门达到了对网络具有记忆效果。基本的LSTM网络模型以及核心单元如图2。
图2 LSTM网络模型核心单元
其中,*表示矩阵的点乘;+表示矩阵相加;ct-1表示细胞状态,即此结构前面的信息;ht-1表示隐藏状态;xt表示输入信息;zf表示遗忘门;zi表示输入门;zo表示输出门;yt表示输出值。
标准LSTM网络架构中的核心单元A,它的精心设计使得模型具有添加和删除信息的状态,主要是使用3个门控制状态,输入门(input gate),遗忘门(forget gate)以及输出门(output gate),每个门都有不同的作用,通过这3个门的设计来控制各个时刻的状态,进而对每个时刻状态特征更好的控制。ct-1表示细胞状态,是经过一些线性操作得到ct。而这三个门就是用于保护和控制细胞状态。Sigmod函数是LSTM的门结构的实现,它输出在0到1之间,反映了信息被保留的程度。
整个细胞状态信息更新过程为模型的前向传播,先通过遗忘门zf对细胞状态信息ct-1进行一定的筛选,输入门zi对当前时刻的输入信息z进行筛选,把这2个筛选的结果进行相加得到更新的细胞状态ct,最后根据输出门确定当前的输出ht。再根据当前的ht确定最终的结果yt。
若是预测的最终结果是分类问题。则ht是通过SoftMax函数确定最终的结果yt,即式(8)。
3 仿真实验
3.1 样本数据
实验采用雷达辐射源信号特征数据集是通过python仿真的。特征参数主要包含雷达脉冲描述字(脉冲到达时间、脉冲载频、脉冲宽度、脉冲幅度、脉冲到达角)、脉冲重复参数、天线扫描特征、脉冲调制特征,型号为6种雷达型号,作为数据特征的标签。为了使得仿真数据更加符合战场上的信号数据,添加高斯白噪声。数据集规模大小为60000,取80%作为训练集,20%作为测试集,训练模型。各个辐射源信号的数据分布图如表1所示。
表1 雷达辐射源数据比例
3.2 实验结果和分析
在对比实验的过程中,首先把仿真的60000的样本数据随机打乱,按照表1的方式划分为训练集和测试集,整体的比例为4:1。图4和图5是LSTM网络模型在不同参数下的损失值和正确率的变化的实验结果。图中表明随着迭代次数的增加,损失值在不断地减小,正确率在增加。图3表明隐藏层的节点数量也对损失值和正确率的变化也有影响,实验中表明,随着节点数的增加,LSTM网络收敛的速度较快,之后在增加收敛速度变慢。最终的网络参数确定如表2。
表2 LSTM网络参数
图3显示了在不同参数下的LSTM网络模型的表现。从图中可以得知,LSTM网络中隐藏层不同的节点个数影响网络的收敛速度以及准确率的大小,文本比较了节点数位为64、128、192、256时的情况,网络收敛速度随着节点数量增加而增加,之后随着节点的数量增加而减少,当节点数为128时效果最好。
图3 不同的隐藏层节点数对网络的影响
图4 和图5显示了训练集和测试集的正确率以及损失值的变化曲线,随着LSTM网络的迭代次数的增加,识别率不断提高,最后稳定在94.3%左右,而损失值稳定在0.32%左右。通过网络的曲线的变化,得知LSTM网络模型在测试集上的泛化程度较好,可以运用到雷达辐射源识别问题上。
图4 训练集和测试集的正确率变化曲线
图5 训练集和测试集的损失值变化曲线
表3 LSTM网络训练集和测试集的识别率
对仿真的数据集采用K-fold(K=5)交叉验证[13]进行训练网络并且得到上述表3中的识别率,从实验结果可以看出,LSTM网络模型对于解决辐射源信号识别有很好的效果,识别率达到了93.2%。
4 结语
雷达辐射源识别是电子对抗系统中的核心内容,LSTM与传统的机器学习识别方法不同,不需要人工设计特征和手动特征提取,而是使用深度学习模型自动筛选特征。本文基于LSTM神经网络模型设计、构造深层次和合适的节点个数的模型。通过雷达辐射源收集的连续信号,然后进行预处理,输入到设计深层次的LSTM模型中进行训练。通过对比不同组合的参数,选择其中较好的结果。实验结果表明,基于LSTM神经网络模型对雷达辐射源分类可以取得很好的效果。