基于果蝇算法优化LSTM 的雷达波束扫描行为预测*
2020-05-11姚家伦黄高明
姚家伦,黄高明,田 威
(海军工程大学电子工程学院,武汉 430033)
0 引言
为了适应更为复杂的电磁空间,美军积极倡导推进认知电子战。DARPA 的研究报告表明,认知电子战是一种将智能算法技术用于电子战领域,达到实时发现、搜索和对抗战场未知干扰信号的新型作战理念[1-2]。
这种理念充分利用机器学习算法的智能性,并融入“人在回路”的思想,实时分析战场态势,基于目标数据和环境数据自适应地调整作战手段。为了有针对性地、准确地对高威胁目标进行对抗,作战对象的特定行为分析与预测至关重要。在认知电子战的体系下,辐射源行为区别于辐射源模式,特指辐射源参数和模式的动态调整与切换,行为推理则是基于历史信息与实时信息对目标辐射源的特定参数与状态进行短时或长时预测。
相控阵雷达资源的时序调度一直是研究的热点问题[3-4]。对相控阵雷达的波束扫描调度规律进行预测能够提高干扰机的瞄准式干扰效率,有效提高电子战攻击能力,因此,极具工程意义。相控阵雷达的波束扫描规律可以抽象为正弦坐标系中的移动轨迹,而基于历史数据的波束行为预测问题实质上是一类轨迹预测和B 样条曲线拟合优化问题。这类问题一般使用自回归或滤波算法解决。文献[5]提出了一种基于差分自回归和卡尔曼滤波的预测方法。这种方法能够很好地解决低阶无周期的时间序列模型,但是所研究对象仅为一维数据,变化特征比较有限。文献[6]为航行器飞行轨迹的预测问题,使用了一种基于贝叶斯正则化的Elman-NARX神经网络方法。在分析飞行模型关键因子的基础上,借鉴Elman 网络特点对NARX 网络进行改进,其本质是利用历史数据对飞行轨迹进行自回归。该算法在保证一定精度的前提下,训练速度和泛化能力得到增强,但是飞行器是一个有惯性的动力学目标,其特征同波束扫描轨迹相比仍有较大区别,且NARX 算法对复杂曲线的适应性有限。文献[7]将长短时记忆网络(Long Short Time Memory,LSTM)与位置分布式表示模型(Location Distributed Representation Model,LDRM)结合,LDRM 模型将高维的位置向量数据转化为易于处理的低维数据,优化了训练数据的形式,便于LSTM 对位置信息进行预测,但是LSTM 网络的人工调参占用了大量人力资源,且调参效率也比较有限。文献[8]基于自适应混沌算法对支持向量回归(Support Vector Regression,SVR)的超参数进行选择,有效地提高了SVR 的泛化性能和求解精度,不过这类算法依然需要预置核函数。文献[9]指出启发式算法能够帮助神经网络调参,保证了网络的适应性与训练效率。在工程实际中,智能化的相控阵雷达会基于多种准则改变波束的扫描方式[10-11],即波束轨迹不是趋势单一的简单路径。相控阵雷达波束在扫描时其轨迹连续,但其波束移动不具有动力学特征,所以传统的牛顿力学体系与卡尔曼滤波的方法无法解决这类轨迹的预测问题。
综上提出基于果蝇算法优化LSTM 网络的相控阵雷达波束行为预测算法,一方面提供了对于相控阵雷达波束扫描规律预测的新思路,另一方面在提高预测精度的前提下,也能自适应调整对应的网络超参数,缓解了网络适应性与训练效率的矛盾问题。
1 问题描述及数据预处理
1.1 问题描述
在多目标探测跟踪和抗饱和干扰等目标的要求下,大量学者进行了有关相控阵雷达的资源调度的研究,其中动态波位编排与搜索波束的时序优化则是研究的重点[12]。相控阵雷达的波束调度通常利用正弦空间坐标系下的波位编排图和搜索波位表表示[13]:
图1 波位编排与传感器监测示意图
在搜索波位排列图的表示下,冗余的波束扫描数据转化为抽象的点信息,便于相控阵雷达对于波束进行控制;如图1,利用多个传感器监测空域(图中一个红圈内的区域由一个传感器负责监控),波束的调度规律等效于其最大波束在逐个波位区域上形成的波束轨迹。
1.2 数据预处理
多传感器网络采集的数据经过分离提取后,扫描轨迹可以表示为在正弦坐标系内的点时序序列。为了便于提取轨迹数据特征,提高对轨迹数据的预测效率,原始的轨迹数据一般需要进行网格化操作。这种处理方法常用于地理学领域,即将m×n 个传感器获取的波位区域扫描图进一步划分为网格图,具体如图2 所示。
图2 监测传感器网格分割示意图
根据研究对象的具体情况来指定不同的划分精细程度。比如对于火控雷达,这个划分就需要细致一些;而对于超视距的远程预警雷达这种划分可以粗略一些,这也可以平衡大数据量对计算资源的要求。参考Geohash 编码[14],依据辐射源识别的情况将波位区域扫描图分为ix×iy个网格,其分辨率为
2 基于果蝇优化算法的LSTM 网络的波束行为预测
2.1 长短时记忆网络预测算法
LSTM 是循环神经网络的改进算法,利用了记忆门的设计,有效解决了梯度消失的问题,可以学习非线性长时序数据的规律[15]。其网络基本单元如图3 所示。
图3 长短时记忆网络单元结构图
基本单元中的特征映射表达式为:
在使用该算法处理数据时,一般将数据分为训练值和观测值,训练值用于网络训练,观测值用于与预测值进行比较。对于变化规律简单的数据而言,这种方法预测精度比较高。但对于复杂数据,预测精度就会大大降低。为了提高算法的适应性,使其能够动态地适应多种扫描模式的波束位置预测问题,网络应使用观测值对网络进行实时更新。即每一时刻始终使用当前观测值训练网络,并在新网络下获得下一时刻的预测值。
2.2 基于果蝇算法优化LSTM 网络的波束行为预测
图4 FOA-LSTM 预测流程图
如图4 所示,经由传感器网络接收到的波束轨迹数据对辐射源数据库进行实时更新,并离线训练获得最优的LSTM 网络超参数,在预测波束扫描位置时根据辐射源类别调用对应的超参数。
将位置信息直角分解,获得序列Sx、Sy,分别送入到两个LSTM。在达到训练门限值后,两个网络同时停止。训练完毕后,输入此刻波束位置的观测值对两个网络分别更新,并获得下一时刻的X 与Y 方向的预测值,经过合成得到下一时刻波束位置的预测值。
3 基于果蝇优化算法的LSTM 超参数调整选择
网络超参数的选择对于网络的训练效率和预测精度至关重要。文献[16]表明在LSTM 的隐藏层单元数目和学习率对于该类网络的影响最大。而超参数选择一般分为两步:1)根据所需预测的雷达类型和预测需求,确定超参数的变化范围;2)在给定范围内使用果蝇优化算法,寻找最优性能的隐藏单元数与学习率。
3.1 果蝇优化算法
果蝇优化算法是一类模仿果蝇觅食行为求取全局最优值的启发式算法。由于这类群智能优化算法在优化速度和参数上存在优势,它很适合用于调整超参数。
果蝇优化算法的思路是在解空间中根据适应度函数(味道浓度判定函数)控制果蝇群体步进寻优。一般可以分为4 个步骤:
1)初始化
初始化就是设定果蝇群体的初始参数,包括果蝇群体的大小、最大迭代次数、初始位置以及果蝇个体寻找目标的步进值,即果蝇飞行的随机方向和距离:
其中,X_axis 和Y_axis 是果蝇的初始位置。
2)判断
判断就是根据适应度函数,求出果蝇个体所处位置的味道浓度(Smell):
其中,味道浓度与果蝇到食物的距离成反比,即:
3)移动
移动就是在果蝇群体中选择浓度最高的个体,记录该个体的位置,并指挥余下果蝇按初始设定的步长向最优果蝇位置移动。
4)迭代
重复步骤2)与步骤3),直到味道浓度满足设定条件或者到达最大迭代次数。
适应度函数选择均方根误差(Root Mean Square Error,RMSE),其定义为
其中,σR为均方根;yi为离散的待处理位置数据;yˆi为位置的预测值,n 为数据个数。
3.2 LSTM 超参数的果蝇优化选取算法
根据历史数据对超参数进行确定,即在离线状态下选择超参数的最优值。基于果蝇优化算法的LSTM 超参数选择具体步骤如下:
step1:根据辐射源识别结果,参照历史数据确定单元数目和学习率的基本搜索范围。
step2:将果蝇种群初始化,把不同的超参数赋值到果蝇个体上。
step3:离线运行LSTM,根据式(7)计算预测误差并评估果蝇个体所代表的超参数适应度,并计算各个果蝇个体位置的味道浓度。
step4:选择适应度函数最优的个体作为群体的移动目标。
step5:其余果蝇个体按步长调整位置。
step6:重复step2~step5,直到RSME 满足要求或者超过最大迭代次数。
step7:更新辐射源数据库中对于此类辐射源的预测网络超参数。
4 仿真实验验证
由于无法获取相控阵雷达的波束扫描时序位置数据,基于典型的3 类扫描方式进行仿真实验:1)在相控阵雷达未在空域中发现高威胁目标或无先验信息的情况下,雷达波束在空域内作栅形覆盖式扫描;2)在雷达经搜索后发现目标或有先验数据支持的情况下,对目标进行范围逐渐缩小的定位扫描;3)雷达对目标进行跟踪,在丢失目标后,对高威胁区域进行范围逐渐扩大的螺旋扫描,如图5 所示。
同时使用NAR 神经网络、LSTM 网络和FOA-LSTM 网络预测相控阵雷达的波束扫描行为。
4.1 参数设置
果蝇优化算法:果蝇群体大小为20,最大迭代次数为50;将优化参数归一化后,固定移动步长为[0.01,0.01]。
LSTM 网络超参数:为了保证训练的速度和精度,最大训练次数为200;学习率与隐含层单元数由优化算法确定,其中学习率范围在[0.001,0.5]内,而单元数范围在[50,500]内。
4.2 波束位置预测仿真实验结果
根据3 种不同的雷达扫描规则设定长度为100的3 组波束扫描位置数据。其中,前70 个数据用于训练,后30 个数据用于评估预测精度。算法运行100 次,结果取平均值。
从下页图6 可以看出,对于栅形扫描这类比较稳定的搜索方式而言,所提算法在X 和Y 方向上预测都没有明显优势,所提算法在X 方向上的预测甚至存在一定的误差积累效应;在对Y 方向位置预测时,两种预测方法的精度基本持平,但所提方法的相对误差还是略优于NAR 神经网络。对于定向搜索和螺旋搜索而言,如图7 与图8 所示。NAR 神经网络方法预测相对误差最大值大于所提算法,这说明所提算法对于这两类搜索的预测精度优于NAR神经网络。虽然所提算法的预测误差仅从相对误差上看优势有限,但对X、Y 方向位置预测时,其预测误差仍然小于1 个网格。
图5 波束扫描位置示意图
图6 栅形搜索波束预测相对误差曲线
图7 定向搜索波束预测相对误差曲线
图8 螺旋搜索波束预测相对误差曲线
为了能够更加清晰地反映所提算法的预测性能,对训练数据进行白噪声加噪处理并进行算法稳定性分析,增加普通的LSTM 算法进行实验验证,结果如表1。可以看出,对于3 种搜索方式而言,所提方法对于噪声的耐受性能整体优于NAR 神经网络,即FOA-LSTM 在数据质量较低、较高的情况下都能保持更好的预测性能。此外,所提方法对于信噪比改善的敏感性更强,在数据质量逐渐提高的条件下,相对于NAR 神经网络的预测精度优势愈发明显,这说明所提算法有着更强的数据质量改善增益。在20 dB 的条件下,所提算法预测误差保持在1个网格以下,能在工程上提供足够质量的预测引导信息。对比普通的LSTM 算法,FOA-LSTM 算法在节省人力的基础上,也进一步提高了预测精度,在3种扫描方式下其RMSE 都有不同程度的降低。
表1 不同信噪比条件下算法预测误差
5 结论
本文提出了一种果蝇算法优化LSTM 的雷达波束扫描行为预测方法。参考动力学轨迹预测思路,对波束扫描的位置变化规律进行了研究,在典型信噪比条件下,对于主要相控阵雷达扫描方式进行了较高精度的预测,显示了较强的鲁棒性,为雷达干扰智能化引导提供了新思路,因此,极具工程意义。未来工作主要包括以下3 个方面:1)所提算法仅根据相控阵雷达单波束扫描行为进行了位置规律预测,下一步需要研究多个波束组合扫描的规律,研究适应性更强的预测算法。2)为了保证超参数调整效率,所提算法使用两个LSTM 网络对X 向和Y 向进行了分离训练,因此,丢失了一些位置相关性信息,也损失了部分预测精度,下一步需要继续深入研究,平衡好超参数调整效率与预测精度的关系。3)智能算法的运行速度比较慢,需要进一步优化算法,提高计算速度。