APP下载

基于优化神经网络的雷达波束分配方法研究*

2021-02-03朱光耀张贞凯

火力与指挥控制 2021年1期
关键词:权值波束调度

朱光耀,张贞凯

(江苏科技大学电子与信息学院,江苏 镇江 212003)

0 引言

在现代的雷达防空体系中,目标类型多样、数目较多,且机动性强,给雷达的跟踪带来了严峻的挑战。而相控阵雷达利用波束可以进行快速照射,可以跟踪扫描单一的目标,可是在实际中目标不只一个,当跟踪目标数目达到上限时,精准快速地对目标威胁度进行评估,分辨重点目标和次要目标,使得雷达波束可以实时地调度多个目标,增强对探测区域的感知性能[1-2],这是目前进行雷达跟踪所需解决的首要任务。

目前雷达跟踪方法包含波束分配方法、波形等方向的研究[3]。在多目标跟踪环境下,相控阵雷达的调度管理模块决定执行申请调度任务的顺序,它之所以具有灵活性和自适应性正是在于调度功能的实现。对于多个目标的波束调度,有规划论、协方差控制、信息论、博弈论等研究方法。文献[4]基于规划论原理将波束调度问题描述成二元混合整数规划问题;文献[5]将协方差引入到雷达资源管理中,提出基于协方差最小准则的调度方法;依据此研究,文献[6-8]提出一系列利用协方差进行波束分配的方法;文献[9-10]利用信息增量来进行波束分配。

基于规划论的方法虽然简单且易于实现,但是针对复杂度较高的问题求解速度较慢。 基于协方差控制的方法能够实现更精细的资源管理,但由于预先设定好了期望协方差,所以实时性较差,且在考虑决策目标时过于单一。而信息增量侧重点在其机动性,不能依据期望的精度来分配波束,追求的是最高精度,不利于节约波束资源。在多目标跟踪的情况下,目标的类型、目标高度、距离、目标速度、加速度、方位角等都影响着目标威胁度,目标是机动变化的,威胁度在实时变化,反映出雷达受到威胁的大小。BP(Back Propagation)神经网络有着很强的适应性和学习性能,对于实际环境下目标数据实时变化的特性,可以很好地解决该问题。文献[11-12]将其用于气象等目标威胁度的评估,缺点是收敛曲线缓慢,但与此同时为本文算法的实现提供了基础理论的支持。

针对上述问题,本文利用混合遗传粒子群优化(Genetic Particle Swarm Optimization,GPSO)算法改善的BP 神经网络,实现了波束分配。该方法首先给出目标威胁评估的因素,对其进行量化和归一化处理,以运动状态信息和目标威胁度分别作为神经网络的输入和输出,得到混合遗传粒子群改进的BP网络的威胁度评估方法。以执行威胁率为性能指标,根据目标威胁值进行波束调度。仿真结果表明了本文算法的高效性。

1 BP 神经网络算法原理

BP 神经网络具有多层的结构[13],利用误差逆转进行训练。包括输入层、数个隐含层和输出层,是一种典型的多层结构,层间全互连,同层单元间没有互联。在本文中,输入的目标威胁因素即为输入层,隐含层节点数目没有固定值,通常根据具体的模型进行选择,输出层取威胁度值。基本BP 神经网络结构如图1 所示。

图1 BP 神经网络结构

BP 算法的样本训练包括正向和逆向传播两个过程。本文中,正向过程将经过量化和归一化处理的数据经隐含层传至输出层,如果输出层的威胁度值满足期望,那么前向过程的训练结束,否则根据输出和预设定值的差,进入逆向过程,改变节点的权值与阈值,使期望值和输出值之间的误差尽可能小,当输出层的误差满足结束条件时训练终止,保存得到的权值与阈值。

2 GPSO 算法原理

2.1 基本粒子群优化算法

粒子群优化(Particle Swarm Optimization,PSO)算法[14]是一种经典的群智能算法。每个个体有各自的飞行速度,历史最佳位置包含个体和全局最佳位置,相应的适应值为个体最佳值和全局最佳值。基础PSO 算法中,第n 代个体,第d 维(1≤d≤D)元素的迭变如式(1)、式(2):

其中,n 表示当前处于第n 代;ω 为惯性权值;c1和c2都为正常数,称为加速系数;r1和r2是两个在[0,1]范围内变化的随机数。惯性权值的选择影响着算法的收敛精度,当惯性权值大时,收敛速度快,但会造成收敛精度的下降。

虽然该算法易于实现,但也存在易陷入局部极值,稳定性较差的缺陷。因此,为了尽量避免局部极值,改善预测精度,就需要对基本粒子群算法进行改善。

2.2 遗传算法改进的粒子群算法

遗传算法(Genetic Algorithm,GA)根据生物遗传,得出的一种进行最优化搜寻且具有随机性的计算方法。由于PSO 容易得到局部极值,GA 不易陷入局部收敛但搜索速率慢,为此以PSO 为主体,将GA的交叉变异步骤加入到PSO 中[15],从而实现快速收敛,得到最优解。

GA-PSO 算法描述及主要步骤如下:

1)种群初始化。包含群体规模,各个体的位置Xi、速度Vi和维数D,设定Vmax和Xmax,以及迭代量Tmax;

2)计算适应值,初始化个体Pbest和全局最优解Gbest;

3)粒子位置速度更新。其表达式如式(1)、式(2)所示。

搜索过程中ω 的变化公式为:

式中,T 为最大迭代次数;ωstart与ωend分别为ω 取值范围的边界值。

4)对种群进行交叉变异操作。以交叉值Pc运算,用新组合的粒子代替原先个体。新个体的位置由式(4)、式(5)来计算,即:

根据变异概率pm选择个体进行变异。

5)更新种群。对比粒子目前值与历史值,若目前值较优,用其代替其历史值;然后把单个粒子的最优解与全局最优解对比,若个体最优值更优则将此位置记录为新的群体最优解。

6)终止条件判断。是否达到迭代值或满足期望的目标值,若没有,转至3);反之,过程结束,输出全局最优。

3 基于GPSO 的BP 神经网络威胁度评估

空中威胁评估是一种NP(Non-Deterministic Polynomial)问题,对于空中目标威胁评估需要考虑的因素有很多,例如天气地理及敌我情况等,在本文中,选取7 个典型因素指标来建立神经网络评估模型,如图2 所示,并对其进行量化。

3.1 目标威胁评估因素

1)目标类型:大型目标、中型目标、小型目标的量化值为3、5、8;

2)目标高度:目标的威胁值随着目标高度减小而变大。按超低、低、中、高、超高依次量化为9、7、5、3、1;

3)目标速度:目标速度直接影响到雷达防空的反应时间。目标威胁度随着速度的增加而减小。

图2 目标威胁度指标

4)目标加速度:威胁值随加速度的增大而增大。

5)目标航向角:目标威胁度随着航向角的增加而减小。从0°~360°等间隔依次划分为9、8、7、6、5、4、3、2、1;

6)目标距离:目标距离表现了目标威胁的概率。目标威胁度随着距离的增大而减小。其隶属度值由式(6)得到:

7)干扰程度:目标干扰性能越强,其对雷达的威胁也就越大。干扰程度按很强、强、中、弱、很弱分为9、7、5、3、1。

3.2 模型建立

该模型的流程图如图3 所示。

图3 模型流程图

具体步骤如下:

1)数据预处理

运动状态信息和目标威胁程度分别为输入和输出量。采用matlab 的归一化模块对各因素进行处理,取值在[0,1]之间。

2)BP 神经网络结构的确定

依据上文得到的参数,设定包含3 层结构的模型。第1 层为输入层,包含类型、高度、速度、航向角、距离、干扰程度、加速度这7 个节点,输入的为其归一化值。隐层有9 个点,隐含层的输出使用Sigmoid 函数。输出为威胁度值,为1 个节点。

3)最优权值和阈值的确定

GPSO 的适应度函数为

GPSO 每次在迭代过程中,根据式(7)计算各元素的值,并完成对个体位置和速率的更新。更新操作完成后,再次计算适应度,直至获取最佳解。

4)样本的训练与模型的实现

由GPSO 得到的最优初始权值和阈值,采用训练集对网络进行训练,计算训练误差,当误差满足要求或达到最大循环次数,训练结束。

5)预测输出结果

网络训练收敛后,就确定了目标威胁评估模型。对训练好的网络进行测试。将测试样本集经过归一化后的7 个评估因素作为输入,输出层则为预测的威胁度值。

3.3 性能指标

执行威胁率(Execution Threat Rate,ETR):成功调度的目标威胁值总和与总的目标威胁值总和的比值。执行威胁率体现了对总体任务的调度能力。

式中,n 为雷达跟踪目标的数目,K 为目标总威胁度值。

4 仿真结果分析

从某数据库中采集315 组数据,部分数值见表1,直升机、大型目标和小型目标均为105 组。训练集选择3 种类型,各100 组数据,剩下的15 组用作测试集。BP 神经网络部分,设置学习因素为0.1,训练期望为1×10-4。GPSO 算法部分,粒子群算法的权值依据式(3)动态变化,经过多次试验,wstart 与wend 分别取0.9 和0.3,加速系数c1和c2均取1.55,种群规模100,速度取值[-1,1],位置范围取值[-3,3],最大寻优次数设置250 次,交叉值Pc为0.3,变异值pm为0.1,基本BP 网络和基本粒子群BP 网络数值设置与本文方法相同。

比较本文算法和另两种算法的预测输出及其误差。模拟雷达在跟踪的某一时刻,2 个波束跟踪4个目标,将按威胁度分配波束、随机分配波束和基于信息增量分配波束进行效益对比,利用执行威胁率(ETR)来进行性能评估。

表1 部分目标威胁值数据

目标主要参数如下:

目标1:初始位置(4 000,-8 000)m,初始速度为90 m/s,做匀速运动。

目标2:初始位置(-2 500,-10 000)m,初始速度为55 m/s,在1 s~50 s 内做匀速直线运动,51 s~100 s 做加速度为-1 m/s2的匀减速直线运动。

目标3:初始位置(-8 000,0)m,初始速度为40 m/s,做加速度为1 m/s2的匀加速直线运动。

目标4:初始位置(0,4 000)m,初始速度为55 m/s,在1 s~80 s 内做匀速直线运动,81 s~100 s 做加速度为2 m/s2的匀加速直线运动。

图4 GPSO 适应度曲线

图5 真实值与预测值对比

表1 3 种方法的平均误差

图4 纵坐标的适应度即为目标真实值和预测值之差。从中得出,和PSO 算法比较,GPSO 算法优化BP 网络迭代收敛速率相差不大,但最终运行结果得到显著改善。由图5 得出,GPSO 优化BP 网络模型的预测值最接近真实的数值。图6 能够清晰得到BP 的预测误差最大,PSO 网络的输出值比BP 网络的误差小,但波动仍较大,本文提出的算法误差最小,其绝对误差明显小于另两种优化模型,并且最稳定。表2 为3 种方法的平均绝对误差,可以清晰看出本文所提算法的平均误差值最小,展现出较好的威胁评估能力。

图6 3 种方法的绝对误差

表2 3 种方法的平均误差

仿真基于本文提出的威胁度评估模型与常规的随机分配波束方法和依据信息增量分配波束方法进行了对比。如图7 所示。

图7 目标轨迹

图8 依据威胁度的波束1 和2 分配

图9 依据信息增量的波束1 和2 分配

表3 3 种波束调度方法对比

从图8 可以看出,由于目标1 和目标2 初始时距雷达较近,目标3 和目标4 距雷达较远,威胁较小,故初始时波束照射目标1 和目标2 较密集;在70 s~100 s 内,目标3 和目标4 朝着雷达运动,且有较大的加速度,机动性强,此时雷达受到的威胁度极高,故波束需要更多地分配给目标3 和目标4。与基于信息增量进行波束分配相比,基于威胁度进行波束分配,实现了对高威胁度目标的实时调度。表3可以看出,依照威胁值进行波束分配的执行率要高于随机分配波束和依据信息增量分配波束的执行率,体现出对重要目标的调度性能要强于另两种。在MATLAB R2014a 的运行环境下,运行100 步仿真的时间为0,276 s,与另两种方法相比相差不大,能够满足系统的实时性要求。对于空中复杂环境下目标数据的动态多变性,本文所提模型不存在主观性的偏差,有着较好的适应性能、学习性能和线性非线性映射性能,且运行简便,易于实现,精度较高。

5 结论

空中目标威胁度的评估是雷达波束调度需要解决的首要任务,本文针对不同目标的特点,利用遗传算法改进粒子群神经网络,建立GPSO 优化的BP 网络目标威胁评估模型。选取目标威胁评估的7个典型因素用于仿真实验。最后仿真结果显示,本文算法的绝对误差远远小于BP 神经网络、基本PSO 神经网络得到的误差,有着良好的预测精准性能,可以有效地预测目标威胁值。实现了对高威胁目标的优先调度,体现了相控阵雷达波束调度的实际情形,对雷达的波束分配起到了关键作用。

猜你喜欢

权值波束调度
基于智慧高速的应急指挥调度系统
基于时空特征融合的水下目标波束形成方法
基于CE-PF算法的舰载机离场调度优化问题
水资源平衡调度在农田水利工程中的应用
基于增益调度与光滑切换的倾转旋翼机最优控制
相控阵天线方向不变恒定束宽波束形成
5G网络扫描波束规划方案探讨
60 GHz无线通信系统中临近波束搜索算法研究
财务风险跟踪评价方法初探
基于洪泛查询的最短路径算法在智能交通系统中的应用