APP下载

网络信息体系建模、博弈与演化研究

2016-10-31张维明杨国利朱承刘俊先

指挥与控制学报 2016年4期
关键词:状态体系策略

张维明 杨国利 朱承 刘俊先

20世纪末,特别是最近十年来,信息与网络技术的飞速发展,人们面临着众多系统在网络环境中的集成、交互与演化的问题.随着系统集成的兴起,许多超级系统出现,但是这种建设-集成-再建设-再集成的思路导致目标差异过大、共识难以形成、整体作用丧失等问题.因此,体系时代呼唤体系方法来解决问题.

体系[1]一般定义为处于某一动态环境中的若干相互联系、相互制约的独立系统,通过各自有目的的行为,为完成共同使命而形成的整体.通常,体系具备以下属性:成员系统独立,相互关联协同,组织因素凸显,共同完成使命,演化成型涌现.理解和认识体系及其特征,需要进一步明确以下几点:

1)体系需要解决大规模、结构化和异构性系统的建模问题.

2)体系需要处理不完全信息下参与双方的动态博弈问题.

3)体系需要注重拓扑结构和行动策略的自适应调整.

在军事领域,随着科学技术的不断进步,计算机软硬件的更新换代,以及人工智能和大数据科学的突飞猛进,网络信息体系已经逐步演变为信息化战争下作战体系的基本形态.构建有效的网络信息体系,在敌我博弈中不断演化,需要从以下两点出发,提高认识水平,做到有的放矢.

1)从认识问题的角度出发,需要建立网络信息时代的科学思维和理论体系.具体而言,对现代信息技术的认识需要从物质论转移到关系论,从原子论转移到比特论,从个体论转移到群体论,从决定论转移到概率论,从机械论转移到体系论.

2)从解决问题的角度出发,需要应用体系工程的思想解决网络信息体系的构建、博弈与演化问题.具体而言,需要对使命需求与能力空间进行匹配,通过对现有系统的动态配置,引导其协同交互,在不完全信息下的动态博弈过程中,增强其鲁棒性、敏捷性和适应性[2].

图1 网络信息体系示意图

在网络信息体系中,各种军事实体以网络为中心,通过信息互通,实现敏捷适应,其中体系思维和体系方法在此发挥着重要的作用.从体系的角度出发,通过在最佳时机投入有效手段,对各种实体、资源、环境进行合理运用,实现快速响应、精确判断和科学实施,利用结构优势塑造损敌利我的战场状态.特别需要指出的是,所谓的体系优势并不单纯强调技术的领先、装备的性能和力量的规模,而是通过信息共享、精确规划、密切协同来达到结构优势的凸显.

这种围绕网络信息体系实施信息化作战的机制可以通过图1进行展现,其中信息环路和作战环路是网络信息体系的两条重要主线[3].网络信息体系将军事力量、信息处理、后勤保障和指挥决策通过一系列通信链路和指控关系进行互联、互通、互操作、互理解、互遵循和互协同[3].作战活动通过战场观察、情报获取、信息处理、规划决策、指挥控制、行动毁伤、后勤保障等形成闭环.信息传输用以实现战场感知、作战经验、情报知识、指挥命令等各种形式符号的表达与共享.作战环路中的行动都是建立在信息环路的基础之上,并且依赖信息环路的驱动和引导.现实场景中,如何将这两条主线嵌入到网络拓扑中,然后通过动态的网络拓扑刻画一般性的作战模式是网络作战体系研究的核心问题.

自适应网络[2]作为研究复杂动力系统的有效工具,已经广泛应用于网络信息传播[4],演化博弈论[5−8],自组织协同[9]等领域.这些系统的拓扑结构和个体状态都随着时间的推移,不断发展变化,并且相互影响,相互依赖.鉴于网络信息体系在时空维度的动态性符合自适应网络的特征,即信息环路的动态性对应拓扑结构的重组,作战环路的动态性对应个体行动策略的调整,因此,可以借助自适应网络的有关理论推动网络信息体系的研究.但是,必须考虑网络信息体系的一些特有性质,比如异质节点和异质链路导致拓扑结构的状态不能单纯依赖节点类型与联通程度,另外节点的属性服从马尔科夫过程特性,随作战行动的进行发生变化,并引起行动策略空间的变化.因此,本文一个重要内容就是研究网络拓扑和行动策略如何在双方博弈过程中不断影响、不断演化.

由于网络信息体系的演化需要借助大量历史数据来对未来体系动态性、适应性和鲁棒性进行仿真模拟和评估预测.因此,如何定性-定量刻画体系的动态演化过程是该研究的关键.

下面,将从体系建模、体系博弈和体系演化3个层次阐述网络信息体系的运作模式,文章整体架构如图2所示,其中网络信息体系拓扑结构和行动策略的调整源于对体系博弈过程中历史数据的挖掘分析和统计学习.具体而言,紧密围绕网络拓扑和行动策略这两条主线,在体系博弈过程中不断进行状态追踪、数据挖掘、统计学习以及毁伤预测,为体系演化(结构重组和策略调整)提供定性-定量依据.体系建模、体系博弈与体系演化构成的循环构架能够促使网络信息体系不断进行适应性调整,在动态过程中实现作战意图.

1 体系建模

图2 网络信息体系建模、博弈与演化研究架构

现代信息化战争中,网络信息体系通常将各种军事实体、组织关系和行动策略进行有效整合,在物理域、信息域、认知域和社会域实现有机统一.在这种体系中,各个成员彼此独立,为实现共同使命,进行协同关联,并随着外界条件的影响,网络结构将进行演化发展.构建该类体系,需要以使命需求为依据[10],在全局高度遵循“自顶向下”分解原则对作战使命需求进行分解;在局部作战单元和基础设施层面上遵循“自底向上”的聚合原则进行资源的整合.

为有效构建作战体系,将网络信息体系通过以下形式进行展现[11−12]即

其中,N代表作战实体单元,E代表组织通信关系,A代表行动策略集合.这样通过网络铰链,实现信息互通,促进科学决策,整合作战力量,达到作战目的.这种抽象模式能够突出网络拓扑结构对信息流和行动流的融合作用,进而实现各个单元相互关联协同,以松耦合的方式相互作用和相互影响.

作战实体单元包含:

其中,C2(Command&Control)代表指挥控制单元,包含各类通信系统、数据处理、分析和计算平台,以及规划决策、指挥控制实体,根据这些实体的内在属性,它们往往具有不同层次的指挥权限、数据密级和处理能力.F(Force)为火力打击单元,包含各种作战打击力量,如战斗机、驱逐舰、坦克、火炮等,这些火力打击单元的作战能力一般由打击强度、打击半径和机动速度等因素决定.I(Intelligence)代表情报侦察单元,包含各类雷达站、预警机、侦察卫星等战场信息获取实体,其工作能力取决于探测半径与探测精度.另外,L(Logistics)代表各类后勤保障单元,包含各种装备、给养、弹药、油料的供给部门,这些单元保证作战行动的可持续性.上述各类单元涵盖了C4ISR系统的核心要素.

组织通信关系用以展现一系列基本的信息交互模式,实现信息的上传下达,即

这些基本链路的形成依赖作战实体单元的功能和角色,为实现某一能力提供信息通道.在上述关系中,C2−C2代表指挥控制单元之间的信息共享和协同决策关系;C2−X代表各类指挥控制关系,其中X.∈{I,F,L};I−C2表示战场信息的上传;I−F表示探测信息辅助实施精确火力打击;L−Y表示后勤保障单元对各类作战实体提供的供给服务援助和基础设施维护,其中,Y∈{C2,I,F}.

行动策略集合:

其中,C2A代表指挥控制单元的行动策略集,包含情报接收、数据融合、信息挖掘、运筹决策等行为.FA为火力打击单元的行动策略集,包括进攻、防御、迂回、包围、机动等行为.IA为情报侦察单元的行动策略集,包含开机、探测、移动、传输等行为.LA为后勤保障单元行动策略集,包含给养运送、线路维护、能源供给、物资转移等行为.这些行动策略都是为实现使命任务服务的,作战实体单元的能力通过这一系列的行动进行体现,作战环路的正常运行也是建立在这些行动策略有效实施的基础之上.然而,这些行动策略的运作筹划和动态调整必须依赖信息在网络结构中传输流动.

网络信息体系模型如图3所示.通过作战实体单元和组织通信关系的空间部署,获得网络拓扑结构,在此基础上融入作战行动策略,即可获得网络信息体系中个体的行动状态.拓扑结构和行动状态在时间维度上的运动,构成了复杂自适应体系的耦合动态性.上述体系构建过程将要素、结构、机制融入的到信息网络中,形成各种作战能力(包括情报侦察能力、态势感知能力、指挥决策能力、精确打击能力、综合保障能力等),完成作战使命.这种体系形式从时空两个维度刻画了作战过程的动态性,其中时间维度主要体现行动策略的执行部署次序,而空间维度主要体现各个单元结构关系.

2 体系博弈

网络信息体系构建完成之后,在使命任务驱动下,将面临敌我双方的策略博弈.由于战争迷雾带来的信息不透明和稍纵即逝的战机,如何及时准确地把握对方行动策略并判断不同策略下双方的交互收益是体系博弈的关键.

传统博弈论(game theory)[13]通常关注二元对称策略下的完全信息静态博弈,即博弈双方的策略空间都是{C,D},其交互收益矩阵满足以下形式:

在该条件下,当某一博弈参与者选择C而对方同样选择C时,两人得到相同的收益R;当某一参与者选择C而对方选择D时,其收益为S对方收益为T;反之亦然.当二者都选择D时,两人仍然获得相同的收益P.人们根据交互矩阵中参数的相对大小得到不同的博弈场景.其中最经典的莫过于囚徒困境,T>R>P>S,在此约束下,策略D为占优策略.随着时间的推进,出现稳定均衡状态(即纳什均衡),个体的理性选择导致整体收益达到最低.

在类似假设条件下,可以构建三元对称策略博弈下的交互收益矩阵:

在该矩阵中,每个博弈参与者都有3种可供选择的策略,个体之间的交互关系更为复杂,决策过程呈现出更多的不确定性.在此情形下,纯策略均衡将会很难出现,即不存在一个恒定的策略使己方在博弈中无需改变选择,人们会以一定的概率分布随机选择策略集中的策略,使得其他博弈参与者各个可能存在的策略之间无差异.

图3 网络信息体系构建要素及各个要素之间的关系

随着博弈双方策略空间多样性的出现,上述完全对称的交互收益矩阵将不再适用,人们开始关注非对称矩阵交互形式.另外,由于作战行动是在时空维度全面推进的,作战实体单元的行动策略集通常会依赖于其所处的状态空间,例如由于战争损耗,某火力打击单元的打击强度和范围可能下降,甚至完全处于失效状态.那么,在这种条件下,博弈双方的行动策略空间将随时间发生变化.与此同时,交互矩阵的收益参数也会依赖其当前所处的状态空间并随时间变化,因此,交互状态空间也是服从马尔科夫过程特性的.

在上述二元对称博弈的基础上,将非对称策略和马尔科夫特性结合,动态调整博弈双方行动策略集和交互矩阵,使其服从如下形式:

其中,{Ct,Dt}为己方行动策略集合,{ct,dt}为对方行动策略集合.在此场景下,我方策略Ct在对方选择ct时能够获得收益为Rt,对方获得收益为rt.其他博弈场景以此类推.在这种动态条件下,行动策略的选择既要充分考虑双方的行动策略空间,又要判断交互状态空间.特别需要指出的是,上述内容阐述了单步博弈场景,即博弈双方在给定交互状态、给定行动策略集合条件下的风险决策过程.考虑到马尔科夫过程的后续影响,当前状态下的最优策略可能导致在接下来的状态中所有策略都将处于劣势.例如,在上述交互矩阵中,如果收益参数呈现:

那么最优策略将会是Dt.但是,假设当前状态下的最优策略会导致后续状态的博弈劣势:

那么在此场景下我方的任何策略选择都将被对方占优.

网络信息体系博弈将是不确定信息下的动态博弈,双方的策略由一系列同步行动和次序行动交织混合.研究体系博弈需要明确有效的行动策略空间和交互收益参数,而获取上述信息需要准确把握己方、对方以及环境之间的关系,然后进行科学的仿真预测.

3 体系演化

和许多自适应系统[14−17]类似,作战体系适应性和灵活性的一个重要特征就是面向使命目标,各个单元能够根据当前态势进行动态调整.兵无常势,水无常形,体系同样不可能一成不变.因此,需要网络信息体系具备动态演化特征,能够进行改造和调整,具有新能力,适应新环境,履行新使命.

复杂体系不断演化的流程如图4所示.在该演化流程中,体系的拓扑结构和行动策略是在体系目标和博弈历史数据的驱动下不断进行螺旋式的适应性调整.具体而言,作战体系为应对某种使命环境和对方行动策略,需要不断进行目标分析,明确行动规划,通过数据挖掘和统计学习,获得演化特征,对当前体系进行鲁棒性分析和适应性分析,根据评估结果指导拓扑结构和行动策略的调整.不断重复上述过程,即可保证作战体系在行动过程中的结构优势和策略优势.

图4 作战体系演化流程示意图

在敌我双方博弈过程中,对方的行动策略往往是未知的.获取对方行动策略空间以及对应的概率分布对我方使命任务的及时调整和作战计划的顺利实施具有十分重要的作用.基于此,在状态追踪和情报获取的基础上,数据挖掘和统计学习的手段方法能够有助于我方准确得到对方状态空间、策略集合、转移概率等有用信息.借助这些信息,可以开展理论计算和数值仿真,预测作战行动方案的未来形态和毁伤效果,并通过体系测度指标,进行鲁棒性分析和适应性分析,对网络结构和行动策略的反馈提供有效的定性-定量指导.

1)理论解析:构建连续时间的马尔科夫链,刻画重要实体或模块的动力学方程.基于图演化的微分方程组[17](如图5所示)能够快速获得某观测变量在一系列规则驱动下(节点增减、状态变化、关系变化等)的动态过程以及将来的稳定状态.需要指出的是,该方法构建过程比较复杂,需要通过一系列近似技术(Mean-field,pair approximation等)才能实现方程组的闭包.

图5 作战体系实体模块演化微分方程示意图

另外,通过基于图微分方程的理论解析关注的是具备特定结构和状态的实体或子图,这些变量在整个网络中面对同样的规则呈现无差异性.然而,在网络信息体系中几乎所有实体和关系都是异构的,因此,需要对这些变量进行预处理操作,进行模糊表示,才能获得该类变量的动态演化形式.这种在预处理过程中的近似行为必然会导致过程/结构预测结果上的误差.

2)数值仿真:在转移规则和概率的基础上,通过构建多主体系统,对网络信息体系进行动态性仿真.这类方法能够实时获得各个变量状态,以及各种变量的瞬时分布,而且结果准确性较高.但是由于仿真过程中不可避免的随机波动,需要进行大量重复试验才能获得稳定状态分布,这就导致了较大的计算成本和时间成本.

通过上述两种预测技术,将会获得体系未来形态(结构,状态,策略等).在体系测度的基础上,通过一系列定性-定量的评估,即可对网络拓扑和行动策略进行调整(例如:提升打击能力,更改行动策略,增加平台系统,改变使命任务,调整组织结构等),实现网络信息体系对作战过程和环境的自适应.

上述框架涵盖了基于数据挖掘的演化规则预测,基于理论解析和数值仿真的毁伤评估和针对拓扑结构和行动策略的体系调整,这3个要素相辅相成、缺一不可、层层递进,其中数据是基础,评估是手段,调整是目的.

4 结论

网络信息体系在不断发展变化中,展现出越来越多的特性,包括复杂性、敏捷性、演化性、涌现性、可变性、分布性、重用性、自主性、支配性、异构性、规模性、交互性等等[1].从本质上看,这些体系一般会围绕3个基本性质:适应性、涌现性和不确定性,其中适应性导致体系的结构和过程不断改变,涌现性是演化的结果,是每个个体不断进行交互后以自组织的方式产生出来的,不确定性取决于网络信息时代事物的不可度量、不可预测和不完备可知.

本研究提出的理论和方法努力尝试将宏观的体系问题变成一系列可以刻画的微观问题,期间采用了许多假设.任何一个系统的有效运作一定是内部逻辑自洽的,同时有自己的边界,一旦出了这个边界,对应逻辑立即失效.对网络信息体系的研究需要从世界观和方法论两个层面展开,结合军事领域的问题对体系建模、体系博弈和体系演化进行系统性研究.

猜你喜欢

状态体系策略
构建体系,举一反三
例谈未知角三角函数值的求解策略
我说你做讲策略
状态联想
高中数学复习的具体策略
生命的另一种状态
坚持是成功前的状态
“曲线运动”知识体系和方法指导
Passage Four
“三位一体”德育教育体系评说