基于有限理性理论的虚拟士兵感知行为建模研究

2012-04-24曹波伟姚义军

指挥控制与仿真 2012年3期

曹波伟,薛青,姚义军

(装甲兵工程学院,北京 100072)

虚拟士兵能否高逼真度地模拟真实士兵的行为动作,关系到整个作战仿真系统的真实性和有效性,这是一项具有挑战性和前沿性的工作。当前的行为模型都只考虑了感知活动的某一方面,具有一定的片面性,因此虚拟士兵感知活动的逼真度较低。

有限理性最初是由诺贝尔经济学奖获得者西蒙提出来的,主要用来区别“理性经济人”与“有限理性管理人”的本质所在。在人工智能领域,完全智能人与真实人的差别在很大程度上与“理性经济人”与“有限理性管理人”的差别有很大的相似性。因此,本文首次在人工智能领域引入“有限理性”的概念,将人的有限理性特征与人工智能技术结合起来,将有限理性理论应用到虚拟士兵的感知模型中,构建逼真的虚拟士兵感知行为模型,从而充分发挥有限理性的有限特性,使虚拟士兵不仅具有一般智能体的行为特征,而且具有真实人的有限理性特征,从而提高虚拟士兵与真实士兵行为的一致性,摆脱虚拟士兵“盲目”的智能化。

1 有限理性相关概念及特点

1.1 有限理性定义

定义 1 有限理性是指介于完全理性和非完全理性之间的在一定限制下的理性[1]。

定义 2 有限理性虚拟士兵由于受到环境和自身条件等主客观因素的限制,从而所感知的信息具有不完全和不确定性的特点,且决策能力因此呈现出非完全理性的虚拟作战智能体[2]。

1.2 有限理性虚拟士兵感知行为的特征

战场环境中真实士兵的有限理性可以总结如下。

1)在感知活动阶段[3],真实士兵的感知过程受客观条件的影响(如距离、角度、天气、噪音等),因此虚拟士兵不能超越真实人的观察能力去感知战场环境。另外,士兵的感知能力也受自身能力的制约,不可能穷尽所有的感知对象,也不可能获取对象的所有信息和属性[4]。

2)在寻求策略阶段,真实士兵无法找出所有的备选方案,只是作两手准备,总会反应式的生成一个快速反应方案以应对时间的紧迫。只有在时间允许下,真实士兵才能寻求万全之策,找到可能满意的决策方案集。这也体现了真实士兵的决策实时性的特点。

3)在决策活动阶段,真实士兵不可能找出所有的备选行动方案,然后逐个评价,最终选择最大收益的方案[5],而是会在有限资源和有限时间的条件下选择近似最优解。这体现了有限理性理论中的有限最优准则,即真实士兵选择的活动不总是最优的,但总是在有限限制条件下最好的。

通过对真实士兵有限理性特征的分析总结,得到基于有限理性虚拟士兵感知行为的特征。

1)实时性基于有限理性的虚拟士兵必须及时感知到战场周围的突发事件并能够根据战场态势决定是否执行当前任务。感知的实时性可以维持虚拟战场环境中虚拟士兵活动的连贯性和逼真感。

2)局限性局限性是有限理性虚拟士兵感知活动的重要特点。现实中没有无所不知的士兵,更没有无所不能的士兵。因此在获取外界环境信息的能力方面,虚拟士兵受各方面因素影响,如距离、天气、可见度、感知能力等。

3)不完全性不完全性主要表现在虚拟士兵生成的感知信念上。由于虚拟士兵的感知能力和客观条件的影响,虚拟士兵不可能观测到全部的战场信息,只能获取其能力范围内的部分战场信息。这也是有限理性体现的重要方面。

4)客观性虚拟士兵在获取信息时不是凭空想象和主观臆想的,虚拟士兵所感知到的信息来源于虚拟战场环境,与虚拟战场环境的变化一致。因此,虚拟士兵的感知行为具有客观性。

5)主观性感知行为不仅具有很强的客观性,同时,它与感知主体也是息息相关的。相同的事物,不同的感知主体所获取的信息可能是不相同的。例如,对待正北方偏西 30°有敌军一坦克正以 30km/s的速度前进,不同的感知主体,由于其能力的有限性,得到的信念是不同的,带有明显的主观意识,甚至会得到错误的信念。

2 虚拟士兵的有限感知行为建模

图1 虚拟士兵感知模型的总体结构

虚拟士兵的感知是其行为决策的基础,其逼真度直接影响虚拟士兵行为的可信性[6]。同真实士兵一样,虚拟士兵在感知外界环境信息时,与自身因素和环境因素有较大关系。虚拟士兵的有限感知主要体现在有限的视觉、听觉和记忆。图1给出了虚拟士兵感知模型的总体结构。

1)有限视觉视觉是最重要的感知渠道,虚拟士兵 80%以上的感知信息需要由视觉提供,其对战场环境的视觉观察主要有两个特点:首先,其视觉范围是受限的,虚拟士兵不可能观察到其视觉范围之外的物体;其次,虚拟士兵的观察能力是有限的,其不可能获取全部的观察对象及其全部属性信息。

2)有限听觉听觉是感知的重要内容,虚拟士兵往往对声音的变化非常敏感,尤其是在搜索敌人的过程中。虚拟士兵经常能利用听觉发现视力所不及的战场信息,但无法听见所有的声音和分辨出所有的声音。

3)有限记忆感知记忆存储着虚拟士兵感知到的信息,能够为虚拟士兵的感知提供辅助。虚拟士兵的记忆特点是有限的,具体表现在记忆信息会随着时间的推移而慢慢被忘却,只有重要的记忆信息可能长久保留,其余的信息会被忘却。

为了高效地模拟感知效果,满足作战仿真系统对仿真可信度和计算量的要求,首先尽可能地简化感知模型;其次在建模过程中合理应用限制条件,以体现出虚拟士兵感知的有限性。

2.1 有限视觉模型

视觉模块的有限性主要体现在感知事物的不确定性和信息的不完全性两方面。视觉模型的功能是仿真人眼的感知能力,视觉建模的目的是为了生成逼真的行为,所以在设计有限理性虚拟士兵视觉模型时,主要体现了视觉的有限性特征。视觉模型通过对感知对象的可见性分析得出视觉范围内能够被士兵感知到概率分布,并从记忆模块中读出对象的以前信息,最终综合生成视觉感知信念。建立逼真的有限视觉感知模型分为以下8个步骤:

①确定视觉范围;

②判断感知对象是否在虚拟士兵的视觉范围之内;

③对感知对象进行可见性分析;

④判断感知对象是否可见;

⑤确定视觉感知层次;

⑥综合记忆信息;

⑦形成感知信念;

⑧确定视觉范围并判断。

首先判断对象 Oi是否在虚拟士兵D的视觉范围之内。由于虚拟士兵的感知范围不是一个简单的球体,而是以D为半径,以士兵当前的方向垂直的截面为底面的半球体。因此可以将判断过程转换为将虚拟士兵S与感知对象Oi的中心连线向虚拟士兵S横切面做投影,然后判断投影直线与方向向量的夹角ai,如果ai小于 90°,则此感知对象 Oi在视觉感知范围之内,否则不在其视觉感知范围内。

1)基于有限感知因子的可见性分析

在虚拟士兵的视觉感知过程中,当获取某感知对象的信息时,有很多主客观因子会对观察结果产生影响,如感知对象的距离、体积的大小、对象的运行速度等。为了提高模型的运行效率,这里选取几个比较重要的因素对感知对象进行可见性分析:几何因子δ1; 可见度因子δ2;机动速度因子δ3;对比度因子δ4。四个可见性因子后,感知对象的可见性按式(1)计算得出:

可见性δ的含义如下:基于有限理性的虚拟士兵不可能感知到所有在其视觉范围内的对象,只能选择性地去感知。此时的δ值表示该对象在环境中能被虚拟士兵感知到的概率。

2)感知层次的确定

根据可见性能的不同,把感知对象划分为三个层次Ld察觉层次,Li辨认层次,Lc理解层次。察觉层是感知的最低等级,虚拟士兵只能感知到此对象而得不到其具体属性;在辨认层,虚拟士兵可以分辨对象的部分属性;在理解层,虚拟士兵能感知到其感兴趣的属性。感知层次的确定由可见性δ确定:当00.3δ＜≤时,为察觉层次Ld ;当0.30.7δ＜≤时,为辨认层次Li;当0.71δ≤≤时,为理解层次Lc。

3)生成感知信念

确定感知层次后,虚拟士兵形成初步的的感知信念,生成的感知信念可以用五元组的形式来表示

Message1=＜ID,object,attribute,visibility,grade＞

其中,ID表示此信念编号,object表示该对象的名称,attribute表示该对象的若干属性,visibility则表示该对象的可见性,grade表示感知层次。

2.2 有限听觉模型

虚拟士兵的有限听觉主要体现在其有限的听觉范围和有限的声音分辨能力上。虚拟士兵的听觉是通过设置声音触发器实现的,当有声音发生时触发一个声音触发器,以触发半径为球体的范围内的虚拟士兵得到一个声音消息,此消息包括声音的ID号,声源的位置和声音的属性,如强度、频率等。士兵根据当前任务和声音的距离和强弱判断是否将此信息通知视觉感知器,改变视觉感知的方向,将视觉感知方向变换到发声的区域。

在式(2)中,Si表示虚拟士兵感知到的声音强度,sound表示声音信息的强度,dsi表示声音发生点与虚拟士兵的距离,ks为听觉系数。

建立逼真的有限虚拟听觉感知的判断过程分为六个步骤:

①确定声源传播范围D;

②判断虚拟士兵得到的声源强度是否超过域值S0;

③判断虚拟士兵得到的声源频率f是否在听觉范围内;

④判断是否有掩蔽效应;

⑤得到初步听觉感知信念;

⑥综合感知信念,结束。

计算得到的Si与虚拟士兵的声音感知强度阈值Sf比较,若大于阈值就通过感知器接受此听觉信息,若小于此常数则忽略此消息。

此模型较好地体现了虚拟士兵获取声音信息时的有限特征,而不是无限制地去接受所有的声音信息,较真实地模拟了人的听觉感知。

确定听觉感知层次后,虚拟士兵形成初步的的听觉感知信念,生成的听觉感知信念可以用四元组的形式来表示 Message2=＜ID,object,attribute,grade＞

其中,ID表示此信念编号,是暂时的一个编号,object表示该声音的名称,attribute表示该声音的若干属性,如方位、强度等,grade表示感知层次。

初步产生的信念Message1和Message2根据其对象的名称和属性与其记忆库进行比较,得到最终的信念,并可以由此确定产生信念的可信度和精度。最终的信念由一个六元组表示。Message=＜ID,sensor,object,attribute,precision,reliablity＞

其中,ID表示此信念编号,在仿真过程中是唯一的,sensor表示感知方式,object表示该对象的名称,attribute表示该对象的若干属性,precision表示此信念的精度,reliablity表示此信念的可信度。最终产生的信念Message一方面输入决策模型作为虚拟士兵进一步行动的依据,另一方面转化为记忆信息存入记忆库中。最终信念的产生可能来源于一种感知方式,也可能是多种感知方式的综合。当虚拟士兵感知到听觉信息后,生成了听觉信念,根据此信念虚拟士兵可能会有意识的调用视觉模型,判断声源的可见性。类似这种情况时,感知模型产生的最终信念是综合了视觉、听觉甚至记忆等多种初步信念得到的综合信念。

2.3 有限记忆模型

感知模型中的记忆模型起到了缓存器的作用,负责感知信息及其他记忆信息的存储[7]。虽然士兵的记忆容量几乎是无限的,但具体到某一个场景或事件而言,待记忆的信息量是有限的。另外,为了确保仿真系统的实时性,虚拟士兵的记忆信息存储的内存空间必须是有限连续的。参照人类记忆的遗忘现象,对内存空间的维护采用淘汰机制,因为当记忆模型的存储区满时,必须采用一定的置换策略,从存储区淘汰某些陈旧信息。记忆遗忘特性主要是:1)人类记忆中一些重要的信息是很难被遗忘的;2)随着时间的推移,越早的记忆越容易被遗忘[8];3)人类记忆中一些不重要的信息会逐渐被遗忘。

针对以上记忆特点,本文提出用链表型队列来存储记忆模型中的信息。当战场环境中的对象通过视觉和听觉感知器过滤后,被认为是可感知对象时,记忆模型根据感知过滤过程实时生成一条对应的感知信息,存入到链表型队列的当前有效空间。每一条感知信息可以用一下五元组的形式来表示。

Perception=＜ID,Sensor-type,Object,Precision,Term＞

其中,ID为该感知信息在记忆模型中的存储标识,该标识具有唯一性。Object为所感知对象在战场环境中的标识号,通过这一标识可以方便地获取对象的大致信息,Sensor-type表示获取该信息的感知器编号,Precision表示被感知对象的信息描述精度。Term 表示该记忆信息的存储时限,该时限主要根据感知对象的稳定性和重要性来决定。

为记忆模型维护一个大小为T的链表型队列结构,当存储区满时,设当前存储指针指向记录 n,记忆模型将需存储信息与记录n的存储时限值term进行比较。如果记录n的term值更大,则继续与记录n+1比较,若存储指针指向表尾还未找到合适位置时,再次从表头开始,直到找到存储时限相同或更小的记录,并将其替换。由于存储时限长的信息只占记忆模块的小部分空间,并且可以设置存储时限阈值,定期根据阈值淘汰一些过于陈旧的记忆信息。因此可避免最新的感知信息无法找到存储空间情况的发生。由于环形队列的存储结构,在同等优先级中总是将最早的记忆信息淘汰,即虚拟人观察过的大部分对象只能在记忆中存储有限的时间,经过一段时间即会被删除,从而实现了对记忆遗忘特征的模拟。

虚拟人通过感知方式得到的环境信息能够在记忆模型中得以保存。而基于存储优先级的淘汰方式使得其中某些重要信息能够堆积下来,但优先级不高的则被淘汰,淘汰方式有两种:一是被替代,二是被主动删除。这种记忆淘汰的过程很好地体现了虚拟士兵的有限记忆能力,不是什么都遗忘,也不是什么都记住,而是有重点有选择地记忆[9]。

3 结束语

随着计算机技术和人工智能技术的飞速发展,作战仿真系统对逼真度和可信度的要求越来越高。作为模拟参演兵力而加入的智能虚拟士兵,其行为的真实性和可信性将对整个系统的可信度产生重要影响,这也对虚拟士兵行为建模的真实性提出了更高的要求。有限理性理论主要用来解释完全理性人与现实人在行为上的本质差别,客观地阐述了由于有限的信息和决策能力,现实人与完全理性人在选择行为时的客观差异性。并且目前的研究表明,基于有限理性的虚拟士兵,其有限的感知和决策行为能够更好的模拟真实士兵的行为特征,在一定程度上提高了虚拟士兵行为的真实度和可信度。

[1]赫伯特·西蒙.管理行为:管理组织决策过的研究[M].北京:北京经济出版社,1991:36-37,45.

[2]许威威,等.智能虚拟环境中的决策模型及其应用[J].中国图像图形学报,2001,6(5):496-502.

[3]王清.一类有限理性的建模和决策分析方法的研究[D].武汉:华中科技大学博士学位论文,2009:12-15.

[4]李亮.影响有限理性实现程度的因素分析[D].南京南京理工大学硕士学位论文,2005:78-83.

[5]Andrew Ortony,Gerald L Clore,Allan Collins,The cognitive structure of emotions[J].Cambridge University Press,Cambrage,2008,34(11):77-79.

[6]A S Rao,M P Georgeff,Modeling rational Agents within a BDI-architecture[J].Proceedings of the International Conference on Principles of Knowledge Representation and Reasoning,San Mateo,CA,USA,2006:473-484.

[7]Olga Pacheco and Jose Carom.A Role Based Model for the Normative Specification of Organized Collective Agencyand Agents Interaction[J].Autonomous Agents and Multi-Agent Systems,2007,6(2):145-184.

[8]倪慧.自主虚拟人关键技术的研究[D].天津:天津大学计算机科学与技术博士学位论文,2007.

[9]魏阳.基于指令机制的作战 Agent建模与仿真研究[D].北京:装甲兵工程学院博士学位论文,2010:30-41.