基于最大边缘分配算法的雷达博弈波形设计*
2021-02-25杨庆培尚朝轩
杨庆培,尚朝轩,董 健,王 韩
(1.陆军工程大学(石家庄校区) 电子与光学工程系,石家庄 050003;2.中国电子科技集团公司第五十四研究所,石家庄 050003)
0 引 言
雷达波形通常与探测的目标类型、环境特性以及雷达的用途有关,好的波形能够提高雷达的检测性能和目标参数估计精度。传统波形设计方法通常假设目标是先验知识已知的准确量,并且不去考虑干扰机的相互干扰,这与实战环境相去甚远,会使波形设计性能降低,同时给波形参数优化带来较大的挑战。因此,研究雷达与干扰机相互博弈条件下的波形优化方法,提高雷达的检测、跟踪、识别性能,是当前研究的重要课题。
对于随机目标,可将其冲激响应建模为复宽平稳随机过程。依据这一模型,Bell[1]研究了最大化接收信号和高斯目标之间最大互信息量(Mutual Information,MI)的波形设计方法,Leshem[2]将基于MI的波形设计方法用于多个扩展目标,Romero[3]分析了杂波条件下由MI准则进行波形设计在认知雷达系统中的应用。文献[4]证明基于最大化互信息准则设计的最优波形相较于正交波形,性能有明显提升。文献[5]基于MI和信噪比(Signal-to-Noise Ratio,SNR)准则对确定目标和随机扩展目标波形设计相关理论进行了阐述和论证。文献[6]以互信息最大为设计指标,建立统一信号模型,解决了频谱受限多输入多输出(Multiple-Input Multiple-Output,MIMO)雷达波形设计问题。文献[7]首先对MIMO雷达与干扰机间的相互博弈现象进行了研究,针对Stackelberg博弈模型提出了基于MI准则的波形优化策略。 文献[8]采用极大极小方法,对雷达与干扰机分层博弈模型进行了建模与仿真,通过将目标频谱建模为上下限已知的条带模型,得到了最不利条件下的鲁棒波形,有效提高了雷达的参数估计性能,但是并没有论证条带范围的选取准则,也没有证明相关模型的优越性。文献[9]基于最大信干噪比准则,推导论证了弹载雷达与目标相互博弈过程中波形设计纳什均衡解的存在性,并通过多次迭代注水的方法进行了求解,其方法更接近帕累托最优。但是该算法需要对双拉格朗日乘子进行搜索,计算较复杂。文献[10]研究了单基地雷达和干扰机的博弈策略设计问题,推导并验证了平衡策略的有效性。但是在问题建模时,并没有考虑信号相关杂波的影响。文献[11]应用拉格朗日乘数法和粒子群(Particle Swarm Optimization,PSO)算法得到了Stackelberg平衡,仿真证明了相关算法的有效性,但是同样未考虑信号相关杂波的影响。基于上述研究,本文讨论了杂波条件下雷达与干扰机均衡博弈策略,考虑到注水法对拉格朗日乘子初值设定以及搜索过程要求较高,采用最大边缘分配(Maximum Marginal Allocation,MMA)算法进行求解,并设计了仿真实验进行验证。
本文的创新工作主要是:将MMA算法引入雷达博弈过程,相较于传统迭代注水算法,该算法不需要对拉格朗日乘子进行搜索,并且避免了乘子初值对波形的影响,大大减少了计算量;基于最大互信息准则建立了认知雷达与干扰之间的非合作博弈模型,迭代求解了纳什均衡时雷达波形的能量谱分布,并将均衡策略与maxmin策略以及minmax策略和随机策略进行了对比,仿真实验验证了均衡策略的有效性。
1 问题建模
1.1 有限能量随机目标
定义在时间间隔为[0,Th]内平稳随机目标模型为一广义平稳随机过程,在该区间外为0。图1[12]是有限持续时间的随机目标信号的产生过程,其中g(t)是一个具有确定功率谱密度的复广义平稳随机过程,a(t)是持续时间Tk的矩形窗函数,由此可得输出h(t)=a(t)⊗g(t)是一个仅在[0,Th]有效的有限时间随机过程,且由于g(t)广义平稳,故h(t)在[0,Th]上也是平稳随机过程[13]。
图1 有限时间随机目标模型[12]
该随机过程的能量谱密度(Energy Spectral Density,ESD)可定义为
ξH(f)=E[|H(f)|2] 。
(1)
若随机过程的傅里叶变换函数的均值表示为
μH(f)=E[|H(f)|] ,
(2)
则该过程傅里叶变换H(f)的方差为
(3)
1.2 杂波环境下基于最大化互信息准则的波形设计
图2给出了适用于基于MI波形设计方法的信道模型,其中,单一或扩展随机目标为g(t),其傅里叶变换为g(f);n(t)是具有功率谱密度为Snn(f)的零均值接收机噪声过程,假设Snn(f)是一个双边带功率谱密度,频带范围为[-W/2,W/2];杂波分量c(t)也是一个零均值随机过程,PSD为Scc(f),且在带宽范围内有效;x(t)为复值基带发射信号,其傅里叶变换为X(f);干扰信号为j(t),其PSD为J(f)。
图2 基于MI波形设计方法的信道模型
雷达接收回波为
y(t)=s(t)*g(t)+s(t)*c(t)+n(t)+j(t)。
(4)
用频域相乘代替时域卷积过程:
Y(f)=S(f)G(f)+S(f)C(f)+N(f)+J(f)。
(5)
将带宽W划分为M个等宽的小频段Δf,每个子频段Fk=[fk,fk+Δf],其间信号频谱近似为常数,在时宽t∈[0,T]内对每个子频段的时域采样,则互信息[14]为
(6)
对于一个时间有限的随机目标g(t),它的原始熵是有限的,因此并不存在功率谱密度。
用ESV代替PSD,得到
I(y(t);x(t)/s(t))=
(7)
1.3 均衡博弈波形建模
考虑理想情况,雷达与干扰机均可以根据获得的信息自适应改变发射波形。对于雷达来说,通过改变发射波形的能量谱使得雷达所获得的互信息最大,用数学表示即为
(8)
式中:Ep为发射机能量限制,Ej为干扰机能量限制,BW为频带范围[-W/2,W/2]。
对于干扰机来说刚好相反。干扰机想通过优化干扰波形J(f)使得雷达所获得的互信息最小,数学表示为
(9)
由于目标完全对立,雷达与干扰机构成了二元零和博弈,一方策略的改变将直接影响另一方的策略。在电子战中,雷达处于领先地位,干扰机会根据侦测信息改变策略,以匹配当前环境,使雷达所获得的互信息最小。雷达侦测到干扰机的变化,也会自适应改变发射波形来提高互信息,两者相互博弈直至达到纳什均衡。文献[9]和文献[15]推导论证了纳什均衡解的存在性和收敛性,在此不再赘述,直接引用结论。
2 MMA算法在求解均衡博弈波形中的应用
2.1 MMA算法介绍
MMA算法其实是解决固定资源分配问题,它是在单约束或多约束条件下将固定数量的资源投入给不同的活动,以达到最有效的效果。
假设给定式子
(10)
(11)
(12)
式中:
(13)
(14)
文献[16-17]仿真验证了MMA算法与拉格朗日乘子算法所得的波形能量谱几近重合,前者因为突破了乘子复杂搜索过程,只与最小能量分配单元有关,运行时间极大缩短。
2.2 MMA算法求解均衡博弈波形过程
将上述MMA算法原理运用在基于MI最大的博弈波形设计问题上。将MI离散化后得
(15)
式中:Δf=W/N;k=1,2,3,…,N;fk=kΔf。同时,将能量约束离散化,公式可写为
(16)
(17)
令
u(k)=|S(fk)|2,
(18)
(19)
(20)
则最大化互信息可简写成
(21)
(22)
将umax离散等分成M份,最小单元为Δ,umax=MΔ,u(k)的取值范围为{0,Δ,2Δ,…,MΔ}。该算法每一次都把Δ单位的能量分配给可以获得最大互信息的频段,当所有的能量都分配完,获得的目标与回波之间互信息最大[18]。即:对所有k值,均选择D(u(k),k)中的最大值D(u(kmax),kmax),将Δ的能量分配给u(kmax),在下一次能量分配之前更新D(u(k),k),直至整个能量分配过程结束,此时得到的结果即为目标与回波之间的最大互信息量,且对不同的k值,在各频段分配的能量u(k)就是最优发射波形的能量谱。
本文利用MMA算法对纳什均衡解进行求解,将大大缩短运算时间。均衡博弈波形设计MMA算法流程如下:
Step5 更新干扰波形:|J(fk)|=|J(fk)|1。
Step6 重复Step 2~5,直至互信息不再变化。
3 仿真实验
某型雷达发射信号总能量限定为E=1,信号频率范围为[0,1],最小能量分配单元Δ设为0.2,则能量分配份数也即该算法步骤数M=500,采样点数为100。设高斯白噪声功率谱密度为Pnn(f)=0.05,观测时间T=1。针对随机目标,此时的目标杂波比为-4.8 dB,目标噪声比为5.2 dB。
3.1 固定能量雷达和固定能量干扰机博弈
首先仿真固定能量干扰的博弈策略。干扰能量设置为0.8,图3显示了雷达与干扰机波形能量分配情况。能够发现,当雷达处于主导地位时,雷达与干扰机相互博弈的结果是倾向于将能量分配在目标冲激响应最强烈的频段。图4是两者相互博弈过程中互信息的变化情况。可知经过六次博弈,互信息达到平衡,之后两者的策略均不再对互信息有明显的影响。
图3 固定能量干扰机波形
图4 博弈过程中互信息变化情况
3.2 固定能量雷达和变能量干扰机博弈
接下来对干扰机的变功率情况进行仿真。设定干扰能量变化范围0.6~1,仿真结果如图5和图6所示。由图5可以发现,干扰能量越强,干扰机与雷达的策略越接近。图6给出了变功率情况的互信息变化情况,可见干扰机的能量越强,互信息的整体变化趋势是减少,雷达所获得的有效信息将减少。
(a)干扰能量为0.6
(b)干扰能量为0.7
(c)干扰能量为0.8
(d)干扰能量为1图5 变功率干扰机与雷达博弈波形
图6 变功率干扰机与雷达博弈互信息变化情况
3.3 变能量雷达和变能量干扰机博弈
图7~10给出了变能量雷达与变能量干扰机相互博弈时互信息的变化情况。为了验证均衡博弈策略的有效性,图9和图10给出了maxmin策略和minmax策略时雷达和干扰机能量变化时互信息变化情况的三维图,能够发现几种策略较为接近,但是并不相同。
图7 雷达主导时均衡策略互信息变化情况
图8 干扰机主导时均衡策略互信息变化情况
图9 maxmin策略互信息变化情况
图10 minmax策略互信息变化情况
为了定量分析,图11则对几种策略进行了直观对比。该对比实验固定了雷达能量,可以发现,无论干扰机能量如何变化,均衡博弈策略互信息要始终高于其他策略,性能最优。
图11 几种策略对比
4 结 论
本文通过对雷达与干扰机相互博弈过程的建模,研究了雷达与干扰机的策略设计问题。首先将认知雷达和干扰机之间的关系建模为Stackelberg博弈,然后基于MI效用函数分析推导了平衡策略。仿真实验表明,当雷达处于主导地位时,雷达与干扰机互相博弈的策略都倾向于在目标ESV较大的频率上分配更多的能量,尽管干扰机设计的干扰波形会降低雷达系统的性能,但当雷达处于主导地位时,基于均衡策略设计的发射波形最终可以保证雷达系统的估计性能,为解决干扰条件下提高雷达性能问题提供了有益的指导。