从“阿法狗”到“阿法鹰”<br/>——论无人作战飞机智能自主空战技术

从“阿法狗”到“阿法鹰”
——论无人作战飞机智能自主空战技术

2016-10-31黄长强唐上钦

指挥与控制学报 2016年3期

黄长强唐上钦

“阿法狗”作为谷歌公司开发的围棋程序击败了围棋高手李世石,此事件引起了人们对人工智能的极大关注.“阿法鹰”是指无人作战飞机(UCAV),它的发展趋势是自主空战,而实现自主空战的技术基础也是人工智能.所以两者在发展并运用人工智能这一层面是相通的.UCAV是集探测、识别、跟踪、决策和作战功能为一体的先进武器系统,它的使用将使未来的空战成为信息和武器融合的对抗.可以说,UCAV必将成为未来空军的主要作战力量,并将对未来的空战理念和作战模式产生重大影响.

1 “阿法狗”与“阿法鹰”对比分析

“阿法狗”是人类跟机器的对抗,也是人脑智能跟人工智能的对抗,实际上都离不开一个“人”字.而“阿法鹰”,是红方和蓝方的对抗,是红方智能和蓝方智能的对抗.“阿法狗”解决的是怎么自主下围棋,是二维空间内的策略选择问题.而UCAV自主空战是三维空间内策略选择问题.因此说,UCAV自主空战相对围棋来说,更有难度.

“阿法狗”下围棋,双方是由围棋规则来约束的,并且双方的棋面形势是可知的,是完全信息条件下的博弈.而“阿法鹰”敌我双方空战无规则的约束,只有飞机和武器性能的约束,相互都不想让对方知道我怎么攻击,是不完全信息条件下的博弈.这样发明了各种战术战法用于处理空战的复杂性.例如,眼镜蛇机动,就是一种化被动为主动的空战战术.

围棋的走子策略保守估算有10171种可能,那么“阿法狗”怎么赢得了胜利的呢？它依靠深度学习技术和3千亿次/s的高速运算[1].所以,表面上看是围棋的对决,其实后面有大量的人工智能和计算在支撑.对比“阿法狗”下棋走子的可能性,“阿法鹰”作战策略的可能性更多,因为空战的影响因素更复杂.

2 UCAV智能自主空战是UCAV作战的发展方向

目前已装备并成功投入实战使用的典型UCAV均为对地打击武器系统,典型代表为美国的MQ-1B“捕食者”无人机系统(见图1),采用“操控员远程操控”作战模式,必须通过信息传输通道在地面操控员操控下,UCAV完成作战任务[2].对已有战例分析,UCAV实际上对付的是弱敌,打击对象是恐怖分子,没有空中截击威胁,不具有有效防空火力威胁或强大的电磁干扰能力,目标为恐怖分子、车辆等地面低速或静止目标.所以UCAV的飞行速度可以较低,操控员可以很从容地对目标进行攻击.

图1 MQ-1B“捕食者”无人机

然而“操控员远程操控”攻击模式存在明显的局限性.1)信息传输通道易受干扰和作战时间上的延迟问题,影响了无人作战飞机的作战效能;2)大量信息汇集到控制中心,操控员实时处理信息量大,导致操控员负担较重,在复杂战术环境下这个问题更加严重;3)操控员固有生理因素限制,如估算精度、动作准确性、反应时间等,导致此种UCAV攻击模式不能充分利用武器系统的全部效能.并且对于未来复杂作战环境下的高动态制空作战,战机稍纵即逝,“操控员远程操控”攻击模式不能满足未来UCAV空战需求.

为占领未来军事科技制高点,各军事强国竞相开展制空型无人机的技术探索和关键技术攻关.随着信息处理、人工智能等技术和空战理论的进步,自主空战将是UCAV未来的发展方向.我们定义自主空战,就是无人作战飞机进入作战空域并获得授权,独立完成作战信息的处理、态势评估、威胁估计、攻击／规避／干扰决策,武器－目标分配,战术机动、进入攻击区、发射武器及其作战效能评估的作战模式,

美国无人机发展路线图中指出,2020年∼2025年要夺取空中优势.无人机要替代F-15,F-16和海军战斗机,到2025年∼2030年要实现打击和压制防空系统,要替代F-22.并强调要在智能技术的基础上强化UCAV的自主性、综合性和自适应性.因此,UCAV智能自主空战技术既可以突破现有攻击模式下的局限性,也体现了应对对手无人化、智能化作战的需求.

3 UCAV智能自主空战技术研究思路

首先分析“阿法狗”是怎么打败围棋高手的.有3种办法,一种办法根据棋谱的规则把可能性进行穷举,10171种可能,要把这10171种可能穷举需要花费世界所有的计算能力一万年时间,所以这实际是行不通的.另外一个办法是看棋手在下棋的时候怎么想的,他下棋的意识是什么,战略战术是什么,最后怎么形成下棋的步骤.相关研究已经表明,对人类意识的研究还处于非常初级的阶段,因而,这种方法在近期也是不可行的.第三,学习棋手是怎么做的.“阿法狗”通过深度学习技术学习了人类三千万盘棋局,提炼出计算机能识别的棋谱,然后又自己对弈了三千万盘棋局.最后达到可以预测20步,胜算概率70%,这样就战胜了人类围棋高手.

那么我们的无人作战飞机怎么办？也有3种办法,一个办法是在动力学和运动学规则制约情况下,穷举它的可能性.但是,根据前面的分析,空战的可能性数量比围棋的还多,在现有计算条件下用这种方法不行.第2个办法是研究有人机飞行员是怎么想的,飞行员空战时他的意识是什么,怎么形成的战略战术,怎么形成的空战的动作.这也不行,因为人脑太复杂,现在对人脑意识的研究还很初步,连实验室白鼠的大脑也只获得了一些很初步的研究结果.

那么第3个办法,研究有人机飞行员是怎么做的.我们从海量的有人机飞行数据中,获取、提炼空战的动作,形成计算机能识别的空战动作库,通过不确定性理论进行决策推理,使得胜算达到70%,这样形成空战动作.这个办法可能可行.

具体的研究思路是,真实的飞行员通过战法的研究,通过飞行的训练和模拟训练,形成了空战经验,这些空战经验就是UCAV自主空战的学习样本.通过知识获取的办法形成空战模型与战术知识库,通过知识表示与知识推理,形成思维智能体和行为智能体,从而构成无人作战飞机的空战智能体.我们把空战智能体又称为虚拟飞行员.从而进行UCAV的自主空战.这是实现无人自主智能空战的有效途径.

式(1)中：L为航段长度，为航路1中第i类船舶数量，艘；为航路2中第j类船舶数量，艘；为船舶的相对速度，为对遇条件下船舶发生碰撞事故的概率，其计算为

思维智能体就是具备决策与自主学习的能力,完成态势评估和威胁估计,根据作战条件和武器性能进行武器－目标分配,进行机动攻击、规避、干扰等战术决策.行为智能体就是在思维智能体决策基础上,进行综合控制.通过综合控制完成探测系统、火控系统、武器系统的管理与控制,实现目标搜索与跟踪、机动规避与攻击等飞行操控.

因此,空战智能体是源于有人的,就是从空战训练海量飞行参数中提炼飞行作战经验,为无人作战飞机使用,但是它也是别于有人的,一个是它具有自主学习能力,通过机器学习技术,可以添加新的战术动作.第二是因为UCAV没有生理和心理的限制,并且机动能力可以达到几十个G的过载,而有人机的飞行员最多就在5G∼8G,这使得空战智能体也有可能高于有人.

飞行员与虚拟飞行员的能力比较如表1所示：

表1 飞行员与虚拟飞行员能力对比

4 UCAV智能自主空战关键技术

UCAV智能自主空战技术要回答如何构建学习机制,如何进行决策思维,如何实现行为控制3个问题.主要有4个方面的关键技术：1)飞行员空战知识的表示与机器学习机理研究；2)虚拟飞行员空战智能决策机制研究；3)自主空战轨迹规划与火/飞耦合控制原理研究；4)自主空战科学试验与验证方法的研究.下面分别进行介绍.

1)怎么从海量的数据中获取飞行员空战知识并以计算机能理解的形式表示；如何进行建模和学习是“虚拟飞行员”系统构建的关键.通过学习优秀飞行员的战术动作,提炼出一定的战术动作库.

在完备信息情况下,从战术动作库里进行检索,获取战术动作；在不完备信息的条件下,进行战术规则的推理.还有空战阅历丰富,为各层次知识的获取提供相应的知识和规则,积累阅历.飞行员通过不断的飞行来积累阅历,虚拟飞行员也可以.

2)虚拟飞行员空战智能决策机制的研究,形成思维智能体在空战过程中实时对空战态势的变化,进行“进攻-规避”角色的智能切换.空战过程中要通过各种战术机动,来达到消灭敌人,保护自己的目的.对于有人机来说,消灭敌人和保护自己的比重基本上是50%：50%,但是对UCAV来说不是这样,90%的目的消灭敌人,10%保护自己,这个理念在我们作战指挥的时候发生了变化.

另外,要实行空战,必须知道敌人想干什么,所以要从信息中提取事件,进行任务推理,目标意图识别,从而进行态势评估.通过获取战场信息,双方的平台和武器信息,目标的状态和属性,来进行处理,得出敌方的意图,敌方要打击的目标和敌方对我的威胁等级进行评估.有了态势评估、威胁评估以及我方的飞机和机载武器性能,然后从战术动作库中提取战术动作,进行战术决策.

3)按照决策－规划－控制的思路,将自主空战的过程中划分成四个层次即：战术决策层,行为决策层,行为规划层和行为控制层.

4)进行自主空战科学实验和验证.通过构建自主空战仿真系统,在这个系统上无人机能跟有人机对抗,不断积累空战经验,丰富空战的战术动作库.无人机跟无人机对抗,创新一些战术战法.从而达到对UCAV自主空战关键技术进行实验验证.

5 UCAV智能自主空战技术验证方法

在计算机环境下进行模拟仿真验证的基础上,UCAV智能自主空战技术还需要在半实物和实物条件下验证其技术成熟度.下面进行简要介绍.

研制自主空战原理验证样机,通过飞行实验验证虚拟飞行员自主空战关键理论与方法.现在UCAV作战都是人在回路中操控进行攻击,通过人在回路中操控一架UCAV与虚拟飞行员控制一架UCAV进行空战对抗.当然,空战对抗需要实时交互空战态势信息,我们研制的无人机因为小型化等原因不具备完全的态势信息感知能力,我们主要对获得空战双方彼此态势以后对目标意图进行识别,对目标进行攻击这个过程进行验证.

影响UCAV空战的因素主要有空战的方法、武器的引导方式和UCAV的功能.空战主要有3种模式：远距发射、中距拦截和近距格斗.远距发射的导引方式是武器链导引,UCAV的功能是占位和发射,它的空战特征是非敏捷、非精确的,我们定义为自主空战一级.中距拦截的引导方式是指令导引,UCAV的功能是占位发射加导引,它的空战特征是非敏捷和精确,定义为二级.近距格斗采用导弹自寻的方式,UCAV是机动占位进行发射,它的空战特征是敏捷和精确,我们把它定义为三级.通过仿真和飞行实验考核逐级验证UCAV自主空战的能力.

6 结论

自主空战是无人作战飞机作战的发展趋势,人工智能方法是实现自主空战的有效途径.通过凝练飞行员的空战经验为无人作战飞机自主空战所用是可行的研究思路.无人作战飞机,现在还是由人类“纤着绳的风筝”,还是由人在回路中进行操控的.我们力图借鉴“阿法狗”的研究思路和理念,让制空型无人机成为智能自主的“阿法鹰”,让我国无人作战飞机“鹰击长空”.