APP下载

多导弹攻击高机动目标的分布式协同制导关键技术

2017-07-28杨剑影周佳玲魏小倩

航空兵器 2017年3期

杨剑影 周佳玲 魏小倩

楊剑影。教授。博士生导师,北京大学力学与空天技术系特聘研究员、北京大学航空航天研究所副所长、北京大学先进技术研究院动力学与控制研究中心副主任,长期从事航空航天飞行控制方面的研究和设计工作。

研究领域:现代控制理论:飞行力学:飞行器导航、控制与制导:复杂高速机动运动的先进控制技术、近空间高速飞行动力学与控制的关键科学问题、卫星轨道机动控制技术。摘要:针对多枚导弹协同攻击高速机动目标的情形,将攻击时间和攻击位置的一致性作为需要实现的协同目标。通过多导弹之间的分布式信息交互和协同制导与控制,实现多导弹之间的协同攻击。针对这一技术,本文从几个不同的侧重点提出了需要解决的关键科学问题,并考虑从飞行制导方法、飞行控制制导一体化方法、多智能体一致性方法、微分博弈相结合的途径提出了可能的解决思路。

关键词:分布式协同攻击;协同制导控制:多智能体一致性:微分博弈

中图分类号:TJ765 文献标识码:A 文章编号:1673-5048(2017)03-0003-10

0引言

多导弹协同攻击是适应未来作战环境的重要作战方式。这种方式不仅可以大大提高突防能力,对目标的探测能力、摧毁能力,还可通过分布式的信息交流降低通信代价,以及通过局部控制达到整体控制效果从而降低控制代价,这种协同配合的作战方式对单枚导弹性能要求大大降低,可大幅度降低导弹研制成本,实现低成本导弹对高成本飞行器目标的毁伤。当目标飞行器的机动性较强且难以准确探测时,单枚导弹攻击通常难以实现精确打击,而多导弹的协同攻击则可凭借数量优势,协同预估目标机动方式和机动能力,采用狼群战术协同包围攻击目标,使多枚导弹的总攻击区域覆盖目标机动的偏离范围。总之,多导弹协同攻击最为重要的是能够完成单枚导弹不可能完成的任务。

多弹协同攻击具有上述诸多优势的同时,也给导弹飞行控制和制导带来了新的挑战。飞行控制从对单枚导弹的控制扩展到对多枚导弹组成的系统群的控制。在处理导弹个体姿态控制和轨迹制导的同时,需要对多枚导弹群体结构进行动态配合和协调。特别是针对多枚小机动低成本导弹对大机动高成本目标的协同拦截难点问题,需要设计合适的预估目标机动方式和机动能力的制导律,才能实现小机动导弹对大机动目标的全向拦截,并需要考虑导弹所能提供的控制能力(控制受限),以及在有限时间内完成对目标的一致性攻击。单纯利用传统飞行制导律理论或传统多智能体一致性理论难以实现这一研究任务,因此需要探索新的方法。

1国内外研究现状

目前国内外对协同攻击问题的研究,从网络交互方式角度看主要有两种实现方式。

一是无交互方式:人为事先为每枚导弹设置指定的相同攻击时间,每枚导弹按任务规定时间要求设计自身的制导律。在制导过程中,各枚导弹之间没有信息交互。从网络协同控制角度看,这是一种开环的控制方法.本质上是带相同攻击时间约束的单枚导弹的控制制导问题。这类方法的优点是攻击中考虑了导引律,最大局限是没有利用网络信息交流的特点,需要预先给每枚导弹规定相同攻击时间,此外,如何确定事先给定攻击时间的有效范围,是无交互方式控制方法未解决的关键问题。由于初始条件和控制能力的局限,所设定的攻击时间过大或过小,都可能导致制导律失效。另外,这一类方法需要精确计算攻击剩余时间,而对运动目标剩余时间的估计,目前尚无准确计算方法。因此,此类开环控制方法目前只能应用于静止或运动非常缓慢的目标。此外,如果在飞行过程中有不确定性或干扰,也无法做到同时命中,缺乏鲁棒性也是其一个致命缺点。由于这种方式本质上是单枚导弹带预定时间约束的控制制导问题,且存在诸多局限性,因此不在本文考虑范围内。

二是网络交互方式:该方式最大的特点是利用多个导弹之间的信息交互,来实现一致性攻击,从网络协同控制角度看,是一种闭环控制方法。这类方式有全局式和分布式两种:全局式制导是所有导弹之间都可以信息交流,其优点是信息全,但从工程角度看,不是一种很实用的方法,因为相距较远的导弹之间可能无法实现信息交互,另外,一旦其中某枚导弹出现故障,就可能导致全局式交互设计的协同制导律失效,因此,全局式交互方式存在鲁棒性较差和通信代价大等问题;另一种更充分利用网络特点的方式是分布式协同制导,其优点是只需要相邻导弹之间有信息交互即可,每枚导弹通过相邻导弹的信息得到整体协同攻击所需要的信息,这种方式可以说是最充分利用了集群控制的特点和优势,即使其中某枚导弹出了故障,也不会影响整体攻击效果,另外也解决了较远之间导弹无法及时通信的问题,通信代价和成本低。这种方式无需预设攻击时间,各枚导弹之间通过协调变量通信相互协调,最终实现对目标的一致性攻击。由于该方法的优点是利用了网络信息,针对不确定性可实时调节,具有很强的鲁棒性,因此是目前研究的热点。国内外从不同角度对闭环控制方式展开了一系列研究,取得成果的同时也反映出各自方法的局限性。目前闭环协同控制方法根据协调变量的选择可分为两类:协调变量为各导弹的剩余时间;协调变量为各导弹与目标的相对距离。

剩余时间协调是通过使攻击的剩余时间达到一致性来实现同时命中,其优点是利用了导引律,缺点是由于采用剩余时间作为协调量,需要有精确估计剩余攻击时间的解析表达式,而目前只对静止目标有比较准确的近似估计表达式,即使匀速目标也没有较为精确的估计式,因此对机动目标无法估计。所以,目前国外文献采用剩余时间协调,大多考虑的是协同攻击静止目标,具有很大的局限性。此外,这类文献中,要求每枚导弹知道其他所有导弹的剩余攻击时间,即剩余时间的全局信息,并没有完全实现分布式的协调。

采用相对距离作为协调量的方法类似多智能体一致性的做法,是通过一致性控制协议,使得包括目标在内的所有个体之间的相对距离最小(脱靶量为0,点命中,协同拦截;脱靶量为杀伤半径覆盖范围,球命中,协同包围),从而实现协同攻击。该方法的优点是无需计算剩余时间,但由于没有利用导引律,无法保证良好的弹道特性和实现全向攻击。值得注意的是,这里未涉及对导弹与目标机动性的讨论.也并未针对一组机动性小的导弹拦截一个机动性较大的目标的问题提出解决思路。从理论上看,这一类利用相对距离协调的方法从原理上无法保证命中前导弹不碰撞,也不能保证同时命中(有可能先后命中),甚至不能保证命中目标(各枚导弹与目标之间的相对距离虽然达到一致,但不一定能收敛)。可以说,这是目前多智能体一致性方法应用在协同攻击问题上的本质性困难。

采用相对距离的协同攻击的另一类方法是采用对策论,假设目标逃逸时使其与各个追击飞行器的相对距离和最大,而对于每枚导弹,以其与目标的相对距离为指标,利用最优理论,设计制导律,该指标最小,即目标和导弹通过脱靶量指标进行博弈。

对于多枚低机动导弹追捕一枚高机动导弹的微分博弈导引律的设计问题,目前并没有成熟的解决方法,仅有一些相关问题的初步研究结果。

文献[39-44]就一对一导弹拦截问题进行了微分博弈制导律设计的研究。一对一的导弹拦截博弈问题主要有两种数学模型:为了易于求解解析形式的最优制导律.往往需要对原始的非线性动态模型做一系列假设,从而近似为线性模型;代价函数是脱靶距离的平方以及两方控制输入代价这三项的加权和,基于这种代价函数的微分博弈被称为线性二次型微分博弈(LQDG)。文献[41]直接以终端时刻两方相对位置向量的范数作为代价函数,基于此的微分博弈被称为范数微分博弈(NDG)。文献[42]对弹道导弹拦截博弈问题进行了研究,考虑了控制环节的动态,根据弹道导弹的特点,对运动学模型进行简化,然后分别基于LQDG和NDG进行了微分博弈导引律的设计,并分析了导弹的“捕获区域”。值得注意的是,“捕获区域”指的是初始状态、双方的最大加速度和双方的控制环节时间常数所应满足的关系,使得在采用该微分博弈导引律的情况下,无论目标采用怎样的导引律,均能保证将其捕获。文献[43-44]在文献[42]的基础上,进一步对导弹捕获区域进行分析,推导出保守性更小的捕获区域。

由于一对一的导弹拦截博弈未涉及网络协同信息,因此,尽管其微分博弈方法可以借鉴,却并非本文关注的重点。本文关注的是多对一和多对多的追逃博弈问题,这类问题的难度较大,多导弹拦截机动目标的追逃博弈的文献非常少。文献[45]研究多枚导弹追捕一个目标,建立了一般形式的非线性模型,每枚导弹的代价函数为其与目标的相对距离的平方,设计导弹的加速度最小化此代价函数;目标的代价函数为所有导弹的代价函数之和,目标的加速度最大化此代价函数。显然,这并非零和微分博弈,所求解双方的最优制导律并不一定是鞍点,因此,导弹捕获区域以及双方的机动性能难以分析。文献[46]研究了两个逃逸者试图逃脱一个追捕者的微分博弈问题,其中逃逸者的最大速度低于追击者的最大速度,其数学模型是假设追逃双方均以最大速度运动,并以速度方向为控制输入,在此文献中,代价函数的选取综合了两个逃逸者与追击者的距离、追捕者锁定其中一个逃逸者进行追捕的直觉以及追捕耗时这三个因素。文献[47-49]研究了目标导弹、攻击导弹和防御导弹三者之间的博弈问题,其中防御导弹和目标导弹为一方,设计制导律使目标导弹远离攻击导弹,防御导弹拦截攻击导弹;攻击导弹为另外一方,设计制导律使其远离防御导弹并攻击目标导弹。其中,代价函数取为防御导弹捕获攻击导弹时,目标导弹与防御导弹的距离。与文献[45]不同的是,文献[47-49]中代价函数的选取充分体现了目标导弹与防御导弹的合作,这是在研究多弹追逃问题时应着重考虑的。

2关键科学问题

从理论角度看。多弹协同攻击的闭环方式可归入多智能体一致性问题范畴,目前被广泛研究的多智能体一致性理论,以及在其基础上发展起来的卫星、无人机、机器人的编队和集结问题,与闭环协同攻击问题有很多相似之处,因此,多智能体一致性问题研究中的一些成熟理论和方法可供借鉴。然而,导弹协同攻击问题本身所具有的一些特点和难点,使得现有的多智能体一致性方法应用到多弹协同攻击和协同包围问题时遇到较大困难,主要体现在:需要在一致性理论框架下处理,既要同时命中,又要避免碰撞;既要保证弹道特性,又要实现全向攻击;既要考虑导弹本身的攻击策略,也要考虑目标可能的机动策略:既要考虑多个运动体相对运动的协同制导,又要考虑与各个运动体自身的动力学控制相互耦合对同时性协同攻击的影响等。

协同攻击在命中前要避免碰撞,因此多导弹相互向目标接近的同时又要避免碰撞,传统的多智能体一致性以状态差作为协调量,在理论上无法保证整体一致性收敛前的可能的局部收敛。具体到协同攻击问题,以导弹和目标的位置作为协调变量很容易出现碰撞问题,而采用各导弹之间以及导弹和目标之间的相对距离作为协调,有可能出现整体命中前部分导弹发生碰撞的可能,或是各枚导弹有先后命中目标的可能,传统的多智能体编队和集结问题中.也有通过远处相互吸引而近处相互排斥的原则,但对于需要同时命中的协同攻击问题却有理论上的困难。此外,对于导弹飞行器来说,在具体运动方式上又不能像机器人和无人机那样向后移动或盘旋,因此,在同时接近又避免碰撞上更加困难。

协同攻击还意味着多枚导弹从各个可能的方位打击目标,这种全向攻击需要采用合适的导引策略才能实现(例如改进的比例导引),而目前多智能体一致性在理论框架中没有考虑导引律的设计,只是利用相对位置差(相对距离)的调节作为接近目标的基本手段,没有考虑命中时法向过载问题,这种做法在弹道特性上存在严重缺陷,无法保证全向攻击,同时对速度范围限制严格。在实际应用中受到很大局限,无法确保协同攻击的实现,也无法实现多枚机动性较小的导弹(低成本导弹)协同攻击大机动、高成本的目标飞行器。

协同攻击问题不仅要考虑轨迹制导层面的协同制导,还要在姿态控制层面实现这种协同制导,难度较大。大多数导弹采用空气舵面进行控制,即通过改变姿态来实现轨迹控制,因此,要实现准确的时间和位置一致性,需要把姿态运动的影响考虑进来,而不能像卫星和机器人编队一致性问题一样,无须考慮平动和转动之间的耦合对一致性的影响。姿态控制的动态在大机动条件下通过耦合效应,有可能使设计好的协同制导策略失效,目前,广泛采用的将姿态控制回路与轨迹制导回路解耦设计的做法,不仅没有充分利用网络资源,而且按上层网络化设计的协同制导,由于下层独立姿态控制的引入,导致协同攻击的一致性可能无法满足,随着机动和协同的快速性要求,传统两个回路的时间尺度差异缩小导致其耦合作用不能忽略,以至这种分离设计的方法可能导致运动发散,无法完成协同任务。

此外.协同攻击时间上的一致性还要求对目标的机动性和机动策略已知,而假定目标加速度和机动策略已知,则问题要通过相对运动学的转化归结为协同攻击静止目标,在理论上无新意,而在实际中,目标加速度和机动策略已知的假设是不成立的,目前通常采用观测器的方法来估计目标加速度,而观测器本身的收敛性、稳定性、快速性和精度误差会极大影响攻击一致性,这一问题在目前协同攻击研究中并未得到很好的解决。而另一种试图采用微分博弈方式来解决目标未知机动性和机动策略问题的途径,目前尚未能把分布式多弹协同这一方式引入到微分博弈思路中,因此,多导弹分布式协同这一协同优点就没能得到利用。如何將协同和博弈两种方法融入到统一的数学框架中,是需要深入研究的科学问题。

综上所述,协同攻击问题虽然从理论上可归结为多智能体一致性问题范畴,但目前已有的理论方法,由于其本身固有的一些局限性,并且未考虑飞行导引策略和姿态控制,因此在解决协同攻击问题时存在本质性的困难,无法在避免碰撞条件下、全向攻击要求下、以及姿态和轨迹共同考虑条件下,实现同时命中和包围,因此,对这一问题展开深入研究具有重要的理论意义和实际应用价值,鉴于其在未来战争中的巨大作用,许多本质性的关键科学问题值得探索解决。

关键科学问题1:多枚小机动导弹对大机动目标的分布式协同攻击,类似狼群战术,这是一个充分显示协同攻击优势并集中体现协同攻击难点的问题。这个问题涉及到三个方面的难点:首先,需要在一致性控制协议中结合导引律的设计,因为只有使用精心设计的具有预估目标机动方式和机动能力的导引律,才能保证小机动导弹对大机动目标的全向拦截,因此,导引律的设计要保证小机动追踪者能实现对大机动目标的跟踪和在其机动范围内的全向攻击;其次,一致性攻击要求多弹攻击一致性的同时避免碰撞.即避免全局收敛前的局部收敛;此外,由于协同攻击在空间分布上范围较广,通常难以实现全局信息共享,就需要利用相邻信息而不是全局信息。针对这类协同拦截难点问题,尝试将飞行制导理论与分布式多智能体一致性理论结合,来研究其分布式一致性协同制导与控制方法,是一种有前途的探索。针对不确定机动目标协同攻击中的狼群战术思想,特别是在一致性方法中利用导引律使得多枚小机动导弹协同攻击大机动目标,是协同攻击的特色之一。新一代的飞行器具有更大的机动能力,当目标飞行器的机动性较强时,单枚导弹攻击可能脱靶,采用多导弹攻击的策略,可对机动目标在其机动能力范围内形成包围,从各个角度攻击目标,当一枚导弹脱靶时,其他导弹能及时拦截逃逸的目标。多导弹的协同攻击是凭借导弹的数量优势,采用狼群战术攻击目标。目标可能采取的机动策略多种多样,要获得目标的机动模型是非常困难的。但目标机动能力是有限的。对其机动方式和机动能力的预估可以大致确定其可能机动的范围,因此,如果能够估计出目标机动的偏离范围,并为导弹设计协同制导规律,使多枚导弹的总攻击区域覆盖这一范围,便可以确保至少有一枚导弹能够捕获目标。

由于技术的发展使得飞行器具有很大的机动能力,对目标机动方式和机动能力的预估是保证多导弹全向攻击的基础,目前传统成熟的比例导引飞行制导律,只有在目标不机动或机动已知的情况下才有效,对未知机动方式和机动能力的目标是无能为力的,而传统的多智能体一致性理论中由于没有考虑接近目标的导引律设计问题,从理论上是无法做到实现多弹全方位以较小过载实现对大机动目标的攻击,如何合理构造一种包含导引策略的分布式一致性控制协议,只利用局部信息来达到对机动目标机动范围的预估,实现避撞、全向攻击和同时命中,是这种协同攻击的难点问题。若在一致性协议中要考虑具有预估目标机动信息的导引律,并且能够保证避免碰撞,那么经典的一致性协议的形式将被破坏,其稳定性和收敛性都无法保证,传统的多智能体一致性理论的成果就无法应用,因此,如何设计引入飞行导引律后的一致性协议来实现小机动多弹协同攻击大机动目标,是一个很有意义的科学问题。

关键科学问题2:多约束条件下姿态控制和轨迹制导一体化设计下的协同攻击。目前协同攻击问题的一致性控制协议研究通常局限在质点动力学层面,即轨迹运动控制层面,姿态运动控制则不涉及网络信息,各导弹姿态信息之间没有交互,但多数导弹恰是通过改变姿态来实现轨迹控制的,因此,各枚导弹姿态运动的互不协调,必然破坏轨迹运动层面的一致性。造成协同攻击时间一致性无法满足。要实现准确的时间和位置的一致性,就需要把姿态运动的影响考虑进来,在制导与控制中将姿态与轨迹运动一体化综合考虑。

协同攻击要求制导层面一致性,这种一致性需要通过姿态协调控制得以实现,特别是机动飞行控制中,姿态与轨迹运动的相互影响必须考虑,否则攻击时间的一致性就无法实现。具体到导弹来说,需要直接通过舵面响应视线变化,将飞行轨迹导引策略、姿态控制与网络一致性控制协议结合在统一的理论框架下。与卫星和机器人不同,导弹飞行器通常是通过舵面改变姿态,由姿态改变气动力分布进而改变轨迹,因此,多导弹轨迹运动的协同需要姿态的协调来保证。仅从质点动力学层面设计的协同方法在实际飞行中就很可能无法保证一致性,甚至失效,需要进一步将姿态动力学及其与轨迹运动的耦合特性考虑进来,从刚体动力学层面来设计协同制导控制律,即姿轨一体化的协同方法。一体化设计的难点在于需要在控制协议构造中保证导弹舵面直接响应弹目视线变化的同时,实现多弹之间的运动协同、各弹自身的动态协调和稳定、以及命中时间的一致性,并具有鲁棒性和自适应性。

导弹的协同攻击任务通常需要在较短时间内完成,即要求有限时间一致性。协同攻击(特别是攻击机动目标)的有限时间一致性需要较大较快的控制来保证的,而导弹气动控制能力有限(超过临界攻角就很快失去控制效率,需要对控制限幅),因此,跟踪机动目标经常会使导弹控制进入饱和状态,从而影响一致性甚至无法实现协同攻击。此外,不确定性是实际飞行过程中必然存在的问题,因此,控制律必须保证在不确定性和控制受限条件下,多导弹能在有限时间内达到对目标攻击的一致性,这个问题是从导弹协同攻击机动目标面临的实际情况中提炼出的,但同时也是一个具有较为普遍意义的理论难点问题。

关键科学问题3:利用网络分布式拓扑结构和拓扑结构可切换特点实现信息变化和控制约束下的协同攻击。多弹协同的一个重要优势在于其可充分利用网络特点来适应不同的任务要求和条件约束。根据所获取信息的不同范围、不同状况和特点以及信息受限、控制受限情况,可以分别采用全向图、有向图、双向图、环状图、链状图、树状图等不同结构,可以在不同的拓扑结构之间进行切换、或改变耦合强度,来适应多种可能的情况。随时间变化的拓扑网络对实现协同攻击有重要的研究意义,因为实际的网络通信由于距离的限制、设备的故障以及人为的攻击和干扰,往往不能长时间保持原有的状态和定常的传输强度,实际运行时往往需要在不同的连接方式上进行切换和改变耦合强度,以保证信息的畅通。进一步研究多弹协同攻击时,复杂网络中增加连接或减少连接、增加或减小连接强度的控制方式,相当于改变了网络的拓扑结构或耦合强度,形成具有最优一致性品质的网络拓扑结构,建立一个有效的算法逐步增加或减少连接,改变其结构达到最优信息协调,并优化其一致性品质(如网络整体输入输出H2与H品质),从而增强协同拦截和包围能力。因此,讨论如何充分利用网络可观和可控性条件、网络的拓扑连接特点,来实现更为有效、优良的协同攻击方法,是一个有意义的科学问题。

多智能体分布式一致性方法是利用相邻节点信息而非全局信息实现协同控制,但其隐含着这样一个假设:各个相邻节点构成的子系统是可观和可控的,否则无法设计分布式控制器。这一隐含的假设是否合理?是否必要?显然,局部结点不可控,并不意味着整体不可控。因为,结点间的耦合交互作用可以使得本来不可控的局部网络形成整体后反而可控。因此,引入网络化观测器和网络化控制器的新思路,给出网络化可观性条件和网络化可控性条件。这个条件并不要求网络局部子系统可观或可控,只要网络系统作为整体可观和可控。在此基础上设计网络化观测器和网络化控制器,完成多导弹系统整体对机动目标攻击。显然,这一条件基础上的协同攻击方法的通信代价和控制代价都将显著减小。这一方法的本质在于充分利用网络的耦合作用,即使自身形成对目标跟踪拦截的控制响应和控制性能不足,也可通过网络耦合作用获得所需的控制指令来弥补局限,即部分导弹对目标构成的系统不可控,可通过多弹信息耦合和协调,达到多弹对目标整体系统可控,从而在放宽对单枚导弹控制性能要求的条件下实现多弹的一致性攻击任务,这是网络化条件下,实现单枚导弹无法完成的攻击任务的一个好思路,不仅可以降低控制代价,还可以实现执行器故障的容错控制。

关键科学问题4:利用追逃微分博弈实现协同攻击。协同攻击还有一个难点问题,就是目标的未知机动性和目标可能的机动策略。目前在协同攻击研究方面较为成熟的结果主要针对静止或缓慢移动的目标,因此实际上是单边的优化问题。若考虑目标的机动能力和可能的逃逸机动策略,协同攻击问题就转化为追逃微分博弈问题。目前,这方面较为成熟的结果主要是一对一的追逃博弈,涉及到多对一或多对多的博弈问题研究尚处于起步阶段,特别是多弹间的协同策略尚未能成功引入到追逃博弈的框架中。

与最优导引律相似,微分博弈导引律也是设计代价函数,通过使代价函数极大或极小,解算出最优控制量。微分博弈导引律与最优导引律的区别在于:最优导引律假定目标的机动策略是已知的,所得到的仅仅是拦截弹的最优机动策略;而微分博弈导引律不需要预测目标下一步的机动策略,是一个双边优化问题,通过最小化代价函数,同时得到拦截弹的最优机动策略和目标的最优逃避策略。由于在实战中目标的机动策略是无法准确预测的,因此,导弹和目标是一对独立受控对象。显然,基于“零和博弈”思想的微分博弈导引律更符合工程需要,但由于双边信息不对称,必须考虑博弈中的很多不确定性,设计具有有效的协同微分博弈制导律难度很大,目前这一方式有价值的研究成果很少。

3可能的解决方法和思路

本文针對多枚导弹协同攻击单个机动目标的情形,将攻击时间和攻击位置的一致性作为需要实现的协同目标,通过多导弹之间的分布式信息交互和协同制导与控制,来实现多导弹之间的协同攻击。以这一思路,针对多弹协同攻击机动目标具体问题,从几个不同的侧重点(多枚小机动导弹协同攻击大机动目标、姿轨一体化综合控制下的协同攻击、利用局部信息和局部控制实现整体打击效果的协同攻击、利用网络特点进行切换实现更好打击效果的协同攻击、利用微分博弈),通过将飞行控制制导理论与多智能体一致性理论有效相结合的方式,给出可能的解决思路和方法。

可以尝试和值得推荐的研究方法是将飞行制导控制理论和多智能体一致性理论相结合,利用改进的比例导引、自适应估计、最优控制、鲁棒控制、鲁棒稳定性方法、Lyapunov方法、滑模变结构制导与控制、分布式协调控制、关联控制、自适应控制方法、大系统理论等,从不同侧重点对多导弹协同攻击机动目标问题进行全面研究,结合网络连接方式,探索有特色的分布式协同攻击制导控制理论方法,以实现研究目标。

对于关键科学问题1,可以尝试结合飞行制导理论和多智能体一致性理论,研究一种新形式的分布式协同制导方法,一方面通过研究具有预估目标机动信息的导引策略,通过制导律优化设计实现小机动导弹对大机动目标的攻击:另外一方面通过构造非线性多协调变量的分布式一致性协议,实现避免碰撞的一致性攻击。不直接计算剩余时间,而是通过调节与剩余时间相关的一些主要参数,诸如导航比、瞬时相对距离和瞬时相对速度、或瞬时相对距离和瞬时相对速度的比值、以及其他相关参数如前置角等的一致性协调,达到对飞行攻击时间的一致性,更直接的做法可以通过协调相对距离和相对速度的比值一致性,当达到相对距离和相对速度一致性时,沿视线加速度控制为零,使得相对运动变为匀速运动,从而使剩余时间由估计式变为精确式,由此避免了利用直接求解的剩余时间进行协调的困难,并且由于不直接利用相对距离作为调节量,极大消除了碰撞的可能性。

这是一种新颖的协调方式:当前研究工作中协调变量大,要么针对相对距离要么针对剩余时间,相对距离协调方式会产生碰撞问题,并且無法保证小过载全向攻击,而剩余时间对机动目标来说难以估算。研究结合导引律和一致性协议思想设计非线性多变量协调方式,只协调与剩余时间及导引律相关的可测量值,不需要计算剩余时间,同时又能发挥导引策略的优势,实现多弹小机动攻击大机动目标。

关于碰撞问题,可以考虑将所有导弹控制在三维空间中独立且互不相交的平面内,如在不同的垂直平面内,由此避开碰撞问题,还可考虑在一致性协议中引入随相对距离变化而变化的安全系数函数项,当相对距离一致性趋于零时,安全系数函数项才为零,从而彻底消除同时命中前的碰撞问题。这一新思路的优点在于充分利用了网络化特点和飞行器制导律的特点,克服了传统多智能体网络一致性方法在本研究中的局限性和几个本质性困难。但新思路的难点在于如何构造能保证避碰且攻击时间一致性的分布式协议,并且引入制导律的非线性多变量一致性控制协议不具有传统一致性协议的数学形式。传统一致性协议的结果无法采用,从理论上保证其收敛性和稳定性也具有很大挑战性。

对于关键科学问题2,本文提出采用姿态控制和轨迹制导在网络化环境下一体化协同的设计思想,采用导弹舵面控制直接响应协同运动中的视线变化、姿态变化和轨迹变化。视线变化,即舵面控制量直接包含分布式轨迹导引的协同信息和姿态控制的协调信息,因此直接从姿态的协调变化上保证了轨迹的协同,避免了分离设计对每个跟踪者造成的攻击时间上的差异,这样设计的协同控制制导律可精确保证攻击的同时性,同时由于包含角度协同信息,还可实现不同指定角度的全向攻击和包围。在此基础上,进一步将控制受限和不确定性因素考虑进来,尝试用控制制导一体化思想和具有鲁棒特性的滑模制导控制方法,来实现更严格意义上的有限时间同时性协同攻击。

对于关键科学问题3,初步研究思路是借鉴线性系统理论中的可控性和可观性概念,将对单枚导弹一目标动力学系统的可控性和可观性问题扩展到多枚导弹一目标组成的系统群,研究系统群整体可控性和可观性条件,对任何单个弹目子系统可以是不可观或不可控的,只要弹目系统群整体可观和可控。在系统群整体可观和可控条件下,建立基于网络化观测器和网络化控制的协同攻击方法,这一思路可以使得仅利用相邻信息的分布式协同控制的适应范围进一步扩大,不仅只利用相邻信息,而且不要求单枚导弹一目标动力学系统必须可控和可观,从而降低通信和控制代价。在此基础上,结合复杂系统理论中的相关成熟研究成果,通过弹目系统群各子系统之间增加或减少通信连接、增加或减小通信连接强度的控制方式,改变网络的拓扑结构或耦合强度,由此改变系统整体的可观性、可控性以及系统的鲁棒性,并建立相应条件下的具有鲁棒和自适应性能的一致性协议,解决一些用传统方法难以达到协同控制的问题。利用通信网络拓扑结构的变化和切换来实现协同攻击过程的稳定性和鲁棒性也是本研究的特色。尽管关于拓扑图特点对网络稳定性影响方面的研究很多,但具体到协同攻击问题中,却未见相关研究。特别是传统的研究结果多基于拓扑结构对称性质,而实际的协同攻击问题中,由于飞行传感器获取信息的方式和作用范围的特点,这种对称性经常是不存在的或被很快破坏的,因此研究非对称拓扑结构以及利用结构的变化和切换.来实现协同攻击过程一致性控制方法的稳定性和鲁棒性,可以说是协同攻击问题中有特色的新课题。

对于关键科学问题4,多枚机动导弹追捕一枚高机动导弹的微分博弈问题目前暂无较为成熟的研究,但一对一导弹拦截的成熟研究成果对此研究有很大裨益,对多方追逃博弈问题中各式各样的代价函数的选取也颇有启发。文献[42]中一对一导弹拦截博弈的研究结果表明,在初始状态满足一定条件,且敌我双方的控制环节的时间常数大于6/7时,若我方导弹的机动性能比敌方强三倍及以上,则我方采取此微分博弈导引律时,无论敌方采取怎样的机动策略,我方均可将敌方捕获。由此可以推想,基于微分博弈的方法,如果采取多枚导弹追捕目标,也许我方导弹所需的机动性能可以低于目标,亦可能实现多枚小机动导弹通过微分博弈协同制导实现对大机动目标的拦截。对于这个问题,有如下研究思路:(1)数学模型的建立。由于所研究的问题是导引律的设计,数学模型即各枚导弹与目标之间的运动学模型,控制输入为加速度。为了使模型更符合实际,可考虑控制环节的动态。在建立模型时,一方面,尽量使模型更符合实际;另一方面,可根据具体的问题做出合理的假设,简化模型,从而使得最优制导律较易于求解。(2)代价函数的构造。这是研究此问题最为关键的一步。此问题宜于采用零和微分博弈模型进行研究,零和是指博弈双方一方有多大收益,另一方就相应的有多大损失,仅需构造一个代价函数,一方欲使其最大,而另一方欲使其最小。基于零和微分博弈求解导弹的导引律时,代价函数的构造直接决定了导弹的协同合作策略。在此问题中,代价函数可取每枚导弹与目标相对距离的平方和的积分,也可取相对距离的势能函数形式。更进一步的,为了体现多导弹对目标的包围,代价函数可取多导弹与目标之间voronoi图的面积形式,也可将控制输入代价作为惩罚项加在代价函数中。总之,代价函数的最佳取法并不直观,但可以通过一一尝试,求解出微分博弈导引律之后进行捕获性分析,从而比较出导弹与目标所需最大加速度的最小比值和相应的最佳策略。(3)微分博弈导引律的求解,即微分博弈的鞍点(又称为均衡)的求解。目前,均衡的存在性及其求解均有很成熟的理论结果。当模型较为简单时,可求解解析形式的导引律;当模型较为复杂时,需要通过数值迭代的方法求解。(4)捕获区域的分析。将所求微分博弈导引律(即均衡)带入原模型,分析满足什么条件时,才能保证目标能被捕获,所需满足的条件与导弹个数、初始状态(体现初始时刻导弹与目标之间的战略位置和速度方向)、导弹与目标的控制环节的时间常数(体现控制环节响应的快慢),以及导弹与目标的最大加速度(体现导弹与目标的机动性能)有关。因此,这一步骤对导弹与目标的机动性要求进行了分析,能考察和验证该微分导引律能否实现多枚小机动的导弹追捕一个大机动的目标。

4结束语

本文针对多枚导弹协同攻击单个机动目标的情形,将攻击时间和攻击位置的一致性作为需要实现的协同目标,通过多导弹之间的分布式信息交互和协同制导与控制,来实现多导弹之间的协同攻击。针对这一问题,从几个不同的侧重点提出了需要解决的关键科学问题:(1)类似狼群战术的多枚小机动导弹对大机动目标的协同攻击;(2)控制受限和有限时间多约束条件下的姿态控制和轨迹制导一体化设计下的协同攻击;(3)利用网络局部特性和切换拓扑实现信息变化和控制约束下的协同攻击;(4)利用微分博弈方法的协同攻击,并考虑从飞行制导方法、飞行控制制导一体化方法和多智能体一致性方法相结合的途径提出了相应的可能解决思路。