信念-愿望-意图逻辑探析

2016-05-06张晓君

重庆理工大学学报(社会科学) 2016年3期

关键词：意图信念

林　颖，张晓君

(1.宁德师范学院经济管理系, 福建宁德　352100；2.四川师范大学信息与逻辑研究所, 成都　610066)

信念-愿望-意图逻辑探析

林颖1，张晓君2

(1.宁德师范学院经济管理系, 福建宁德352100；2.四川师范大学信息与逻辑研究所, 成都610066)

摘要：在理性主体寻求达成其目的的过程中，信念、愿望和意图起着重要的作用。由Rao和Georgeff提出的信念-愿望-意图逻辑是建立在分支时间可能世界模型的基础之上的。说明了该逻辑框架对意图的重要成分(比如：信念、愿望、意图和承诺)是如何进行形式化的。另外，不同类型的理性主体可以通过添加特定的条件来进行建模。

关键词：信念；愿望；意图；承诺；BDI逻辑

一、引言

做知识级分析的系统被称为Agent(多译为 “主体”“智能主体”“智能体”“真体”等，在本文中采用“主体”这一译法。比如：人、具有智能的高级动物、仿人机器人等都可视为Agent)[1]。Agent强调理性作用，是描述机器智能、动物智能和人类智能的统一模型[2]14，而这些智能则是构成社会智能的主要成分。作为认知型智能的Agent，其典型的行为模型就是BDI(Belief-Desire-Intension，简称BDI)逻辑框架[3]。BDI逻辑主要探讨信念、愿望、意图与Agent行为的关系及其形式化描述[4]。

主体和多主体系统的研究是系统工程、分布式人工智能等领域研究的重点和热点问题之一[5]，它在电子商务、自主移动机器人、面向主体的软件工程、军事仿真等诸多领域有着广泛的应用。20年多来，一些学者提出的理论和结构为多Agent系统提供了形式支持[6]。其中，影响最为广泛的形式系统则是Rao和Georgeff[7]建立的BDI逻辑系统，此系统能够帮助设计者根据Agent的信念、愿望和意图对系统所期望的行为进行推理和决策[8]232。

Rao和Georgeff提出的BDI逻辑[7]，是在Bratman[9]信念-愿望-意图理论的基础上提出来的[2]。该逻辑以非线性分支时序逻辑和可能世界语义学为基础，引入了3个基本模态算子：信念、愿望和意图[10]43。本文的主要目的在于为读者展示出Rao和Georgeff提出的BDI逻辑[7]的主要思想及相关内容。

二、信念-愿望-意图逻辑的非形式语义

Rao和Georgeff使用时间树(time tree)对世界进行建模，此时间结构只有一个单一的过去和一个分支时间未来[7]。在一个特定世界中的一个特定时间点叫做一个情境(situation)。事件类型把一个时间点转换成另一个时间点。

时间树上的分支可以看作主体在每一时刻的选项。我们有必要对成功执行的事件和失败执行的事件加以区分，并相应地标注在时间树分支上。Rao和Georgeff使用类似Emerson和Srinivasan[11]中的计算树逻辑(Computation Tree Logic，简称CTL)的方法来刻画这些结构。为此，引进了状态公式和路径公式这两个概念。前者是针对时间树中的某个特定时间点而言的，而后者是针对时间树中的某个特定路径而言的。作用在路径公式上有两个模态算子：可选(optional)算子和必将(inevitable)算子。

定义1：如果路径公式ψ，至少在从时间树的某个时间点出发的一个路径上为真，那么我们就说ψ是可选的。

定义2：如果在时间树的某个时间点，路径公式ψ在从时间树的某个时间点出发的所有路径上为真，那么我们就说ψ是必将成立的。

作用在状态公式和路径公式上的标准时态算子有：○(next)、◇(eventually)、□(always)、∪(until)。

Rao和Georgeff使用可能世界对信念进行建模[7]。每种情境都与一个信念可及世界(即主体相信有可能的世界)的集合相联系。每一信念可及世界就是一个时间树。多种信念可及世界的出现，是由于Agent缺乏关于世界状态的知识。在每一个信念可及的世界中，分支未来表示Agent在选择执行行动时的可供选项。

类似地，每种情境也都与一个目标可及世界(即表示主体目标的世界)的集合相联系。我们要求信念与目标之间具有兼容性：即，目标是具有一致性的愿望，而且主体相信愿望能够达成。Rao和Georgeff采纳强现实性的概念[7]：要求主体相信，经过她对事件的精心选择和策划，她可以选择性地达到目标。我们规定：对于时间t的某个给定时刻的每一个信念可及世界w而言，一定存在某个目标可及世界w′，而且此目标可及世界w′是信念可及世界w的子世界。

意图可以类似地用意图可及的世界来表示，这些世界是主体试图实现的世界。与信念-目标兼容性的要求类似，主体意图可及世界也必须与其目标-可及世界兼容：主体仅仅对与其目标相对应的那些行动产生意图。对于时间t时的每个目标可及世界w而言，必定存在一个意图可及世界w′与之关联，此意图可及世界w′是目标可及世界w的子世界。从直观上看，主体选择了目标可及世界w中的某个行动，并试图执行该行动。

不同的信念、目标和意图可及的世界表示主体所处的不同的场景(scenarios)。在主体看来：现实世界是其信念可及世界之一。如果信念可及世界用b1表示，则对b1而言的目标可及世界就用g1表示，其相应意图可及世界就用i1表示。针对与愿望有关的信念可及世界b1而言，g1和i1是可选性递增的选项，是与行动有关的可能未来进程的承诺(commitment)。

主体的信念、愿望和意图是如何决定其行为的呢？在主体与环境交互的过程中，主体的信念、愿望和意图又是如何形成、维持和修正的呢？不同的主体会采取不同的行为方式，这些行为方式反过来又决定了其行为特征。

三、信念-愿望-意图逻辑的语法理论

Emerson和Srinivasan[11]中的计算树逻辑是用于对程序进行推理的命题分支时间逻辑，此逻辑是一个可靠而完全的公理化系统。Rao和Georgeff的BDI逻辑是使用如下两种方式对计算树逻辑进行扩展而得到的：一是给出了该逻辑的一阶变种，二是通过引入带有信念、目标和意图这3个模态算子的可能世界框架对其进行扩展。

BDI逻辑有两种类型的公式：状态公式和路径公式。状态公式是相对于特定世界的特定时间点进行赋值的，而路径公式则是相对于特定世界的特定路径进行赋值的。

定义3：状态公式

(1) 任何一阶公式都是状态公式；

(2) 如果φ1和φ2是状态公式，x是一个个体或事件变元，那么﹁φ1、φ1∨φ2、∃xφ1(x)是状态公式；

(3) 如果e是一个事件类型，那么，succeeds(e)、fails(e)、does(e)、succeeded(e)、failed(e)和done(e)都是状态公式；

(4) 如果φ是状态公式，那么Bφ、Gφ和Iφ是状态公式；

(5) 如果ψ是一个路径公式，那么optional(ψ)是一个状态公式。

定义4：路径公式

(1) 任何状态公式都是路径公式；

(2) 如果ψ1和ψ2是路径公式，则﹁ψ1、ψ1∨ψ2、ψ1∪ψ2、◇ψ1和○ψ1是路径公式。

其中：succeeded(e)表示刚刚成功完成事件e，failed(e) 示刚刚失败完成事件e，done(e)表示刚刚出现事件e，可能成功，也可能失败。succeeds(e)、fails(e)、does(e)可以类似定义，它们均表示即刻就会发生的事件e。模态算子B、G和I分别表示主体的信念、目标和意图。

四、信念-愿望-意图逻辑的语义理论

Halpern和Moses的传统的信念可能世界语义学，把每个可能世界看作是命题的聚合(collection)，并通过信念可及关系Bel把这些世界关联起来，实现对信念进行建模的目的[12]。一个公式在一个可能世界中是令人相信的，当且仅当，此公式在其所有信念可及的世界中为真。

Cohen和Levesque把每个可能世界处理成表示事件序列的时间线(time-line)[13]，时间被无限延伸到过去和未来[14]。Rao和Georgeff则把每个可能世界看作一个时间树，每个时间树表示在一个特定世界中的主体的可选事件，信念关系则把一个时间点上的一个可能世界映射到另一个可能世界。主体在时间点t有信念φ(记作Bφ)，当且仅当，在时间t时，φ在主体的所有信念可及世界中为真。

信念关系具有时间依赖性，即：信念关系Bel在时间点t2时的映射，可能不同于Bel在时间点t1时的映射。这样，主体就可以改变其信念选择。类似地，我们可以根据目标可及关系Goal给出目标模态算子G的语义。目标可及关系表示主体所愿望的情境。主体在时间点t有目标φ(记作Gφ)，当且仅当，在时间t时，φ在主体的所有目标可及的世界中为真。

我们可以把意图看作主体选择追随的未来路径。意图可及关系Intend把主体的当前情境，映射到其所有意图可及的世界中。主体在时间点t有意图φ(记作Iφ)，当且仅当，在时间t时，φ在主体的所有意图可及世界中为真。

前面已经说明，主体目标可及世界是主体所愿望的信念可及世界的子世界。类似地，意图可及世界也是主体选择追随(即采取行动)的目标可及世界的子世界。这样，通过所愿望的未来路径，我们可以从一个信念可及世界达到一个目标可及世界，也可以通过承诺所愿望的未来路径，从一个目标可及世界到达一个意图可及世界。这一理念可形式地表示为：

定义5

(1) M,v,wtBφ，当且仅当，∀w′∈Belw t，M,v,w′ tφ。

(2) M,v,wtGφ，当且仅当，∀w′∈Goalw t，M,v,w′ tφ。

(3) M,v,wtIφ，当且仅当，∀w′∈Intendw t，M,v,w′ tφ。

Rao和Georgeff允许有对任何合式公式之上的意图，即可以有关于意图的意图，关于目标的意图、关于信念的意图，以及关于采取某个行动的意图。关于采取某个行动的意图对应于我们对意图的通常理解。

五、信念-愿望-意图逻辑的相关公理

Hughes和Cresswell认为，信念的公理化系统是标准的弱S5(即KD45)模态系统[15]。Rao和Georgeff也认为：目标和意图满足D和K公理，即目标和意图在蕴涵下封闭并且具有一致性；信念、目标和意图满足必然化规则。即主体相信所有有效的公式，所有有效的公式都作为其意图和目标。就像大多数可能世界形式化系统一样，这样得到的逻辑系统也会面临逻辑全知的问题[16]。虽然这一问题可以通过采用Chellas的最小模型语义学[17]，并放弃必然化规则和关于信念、目标和意图的K公理而得到改善，但是Rao和Georgeff还是采用了更为传统的模态逻辑语义学。Rao和Georgeff提出了如下8个BDI逻辑公理[7]：

(1)信念-目标兼容性公理：

这一公理本质上是说：如果主体把为真的公式optional(ψ)作为目标，则她相信这一公式，即在所有信念可及的世界中至少存在一个路径使得ψ为真。例如，当ψ=◇p时，这一公理的意思就是：如果在主体的所有的目标可及的世界中，至少存在一个路径，使得p最终为真，那么“在所有信念可及的世界中至少存在一个路径使得p为真”就是必然的。需要注意的是：由于时间的分支特性，主体不必相信，她必将达到p为真的时间点。

(2)目标-意图兼容性公理：

从以上两个兼容性公理可知：如果主体把一个公式α作为意图，则该主体相信公式α。例如：主体意图是做某个事件e，那么就有一个(可选的)做e的目标，并且相信她将(可选的)做e。嵌套(nested)意图会导致一些有趣的结果。如果公式I(inevitable(◇I(does(e))))为真，那么B(optional(◇I(does(e))))为真，而且B(optional(◇B(does(e))))也为真。

(3)意图导致行动公理：

但这并不是说，事件e一定会成功出现，而只是说主体试图使e出现而已。主体能否成功取决于她所处的环境。这样，只要主体有做某一初始行动的意图，那么她将采取行动。这一公理并没有阻止主体做她不想采取的行动。

需要注意的是：如果主体在当前时间点有一个行动选择，只有当她故意选择其中某个行动时，她才会故意采取行动。Russell和Wefald[18]对这种故意进行了建模，把故意过程本身作为主体的一个选择行动。对公理(3)进行修改就可以使得主体任意选择她所意图的行动，并采取行动。

(4)关于意图的信念公理：

古意不肯将那个女婴送入孤儿院，家族对他这种一意孤行自毁前程的行为十分不谅解，古意只得脱离了他那个显赫的家，带着女婴开始了艰辛的创业之路。

(5)关于目标的信念公理：

(6)关于意图的目标公理：

(7)初始事件知道公理：

(8)没有无限延期公理：

这一公理假设与意图相对应的目标也会最终被抛弃。如果有必要的话，这一公理中的φ应该避免被限制成一个行动公式。

公理(1)～(8)的8个公理与关于信念和目标的公理一起，统称为基本的I-系统。

六、关于意图的承诺公理

至此，Rao和Georgeff把意图处理成完成当前行动的承诺。主体的当前意图是如何引导和决定她未来行动的承诺呢？即：主体的当前意图与她未来的意图具有怎样的关系？

主体的当前意图与未来意图的关系可以看作是意图的保持与修正的过程，也可以看作是一个承诺策略(commitment strategy)。不同类型的主体具有不同的承诺策略。Rao和Georgeff讨论了3种不同的承诺策略[7]：盲目(blind)承诺策略、专一(single minded)承诺策略和豁达(open minded)承诺策略。

盲目承诺主体保持她的意图，直到她实际相信已经实现其意图。如果主体的意图是使必然φ最终为真，那么主体将必然保持其意图直到她相信φ为真。即有：

(1)盲目承诺公理：

要判断这一公理究竟是对行动的承诺(即方式)，还是对未来为真的条件的承诺(即目的)，这取决于公式φ是否是一个事件公式。这一公理仅仅是对I-公式而言的(即：仅仅针对导向行动的意图，或在主体意图可及的世界中的所有路径中为真的条件而言的)。

很显然，盲目承诺策略要求很高：因为主体将最终相信她已经实现其意图，或者永远保持这些意图。为了放宽要求，我们可以定义一个专一承诺主体：主体保持其意图，只要她相信这些意图仍然是她的选项。即有：

(2)专一承诺公理：

只要主体相信她的意图是可以实现的，专一主体就不会放弃其意图并力图达成其目标。我们还可以继续放宽这一要求，定义一个豁达主体：主体保持其意图，只要这些意图仍然是其目标。即有：

(3)豁达承诺公理：

根据这些承诺公理，我们就可以分析采纳基本I-系统的不同主体的性质。这些主体叫做基本主体。

一个基本盲目主体将必然最终相信她已经达到她的目的。这是因为：盲目承诺公理仅仅允许在未来的路径中，意图的对象要么最终被相信，要么意图将永远保持。而公理(8)的没有无限延期公理则不允许意图永远保持，这导致主体最终相信她已经实现其意图。

对一个基本的专一主体而言，只要她相信，其意图仍然是其选项，直到她相信已经实现其意图，不然是不会放弃其意图的。类似地，一个豁达主体将最终相信她已经实现其意图，只要她把这些意图作为其目的直到相信它们已经实现。即对一个基本主体而言，有：

定理1：

证明：(a)假设I(inevitable(◇φ))。根据(1)的盲目承诺公理可知：inevitable(I(inevitable(◇φ)∪Bφ))。再根据第5部分的公理(8)的没有无限延期公理和弱定义可知：inevitable(◇Bφ)。(b)与(c)的证明与此类似。

(4)真信念公理：

一个胜任(competent)主体满足真信念公理。在公理(1)～(3)这3个不同的承诺策略下，胜任主体将实际达到其目的，而不是仅仅相信如此。然而，对现实主体而言，真信念公理是很难做到的，因为该公理要求主体具有对其意图的未来实现具有真信念。通过把真信念公理仅仅限制到当前信念或关于初始行动公式的信念，我们就可以定义一个不那么全能的主体，该主体必将实现其意图。

定理2：

在与定理1同样的条件下，对3种类型的承诺且胜任的主体都会得到这样的结论：inevitable(◇φ)。

根据定理1和真信念公理即可证明定理2。事实上，定理1与定理2的条件严苛，对现实主体而言是很难操作的；而且这两个定理并没有充分利用意图导向行动公理，不论主体的行动是否有明确的意图，这两个定理都能够成立，因此并不能够为主体的意图与行动之间的推理提供充分的依据。故，现在我们仅仅考察带有明确意图的行动，这就要求主体在每个时间点的意图是一个单一的初始行动，这样主体在执行了每个带有明确意图的行动后，仍然保持自己的信念，即，主体不会忘记之前保持的信念。即：主体在一个带有明确意图的行动x中保持信念γ，当且仅当，(a)她想执行行动x；(b)如果她相信在执行行动x之后，信念γ成立，那么在执行x之后，γ仍然成立。即有：

如果一个意图是在未来必将为真的φ的专一主体，仅仅执行带有明确意图的行动，并且在执行这些行动时，她相信φ，那么她必将相信φ。如果该主体是胜任主体，则她将实际实现φ。

定理3：

(a) 一个满足基本I-系统和专一承诺公理的基本专一主体具有如下性质：

(b) 一个满足基本I-系统、专一承诺公理和真信念公理的胜任专一主体具有如下性质：

定理3的(a)和(b)的前提的第二个合取支可以通过几种方式来弱化。首先，根据意图导向行动公理，在真实世界中允许我们去掉公式done(x)。其次，主体会根据其意图来采取行动直到她认为已经实现意图。即：inevitable□可以用until算子∪来代替。

假定主体也相信定理3(根据信念的必然化推理规则)，那么她将相信：如果她仅仅执行带有明确意图的行动，而当她这么做时仍然保持她的信念，那么她将最终实现她的目标。同时，她也可以这样推理：如果她被强迫做她不想干的事情，或者不坚持她的信念，那么她将不会实现她的目标。

与带有明确意图的行动的信念保持性类似，我们也可以类似地引入目标保持性的概念，这将使得豁达主体能够实现其意图对象。我们也可以类似地定义具有复合承诺策略的其他类型的主体。比如：目的(ends)豁达而手段(means)专一的主体，这种主体会随意地改变其目的，但一旦未来为实现其目而采取了某种手段，就不会对这些手段是否合理进行再思考；而相对化承诺(relativized commitment)主体是目的和手段均豁达且胜任的主体。

七、结语

(1)Agent行为理论将Agent定义为有意识系统，即Agent的行为是通过归因于信念、期望和理性的方法进行形式化，由于经典的一阶逻辑不能用来表示涉及意识的观念，否则会引起语法和语义问题，因此需要引入模态逻辑和元语言来解决语法问题，并且需要借助可能世界语义和解释的符号结构来解决语义问题。

(2)意图是心智状态(mental state)的一个组成部分，它在理性Agent(主体)追求所期望的目标行为的过程中扮演着重要的作用，Rao 和Georgeff借助分支时间可能世界模型，对意图进行了形式化。

(3)Rao 和Georgeff把意图看成是“完成当前行动的承诺”，这一处理方式很有特色，值得借鉴。

(4)需要我们进一步思考的问题是：应该如何深入挖掘该模型的应用价值，才能够更好地为分布式人工智能、军事仿真和系统工程等领域服务？

参考文献：

[1]高济.人工智能高级技术导论[M].北京：高等教育出版社，2009.

[2]张晓君,郝一江.基于行动逻辑的智能主体行为表征研究[J].重庆理工大学学报(社会科学),2013(1):13-18.

[3]张晓君.等级BDI逻辑：关于行为表征的柔性逻辑[J].哲学动态,2013(1):102-107.

[4]ZHANG XIAOJUN.Graded BDI models for agent architectures based onukasiewicz logic and propositional dynamic logic[C]//Wang F L.Web information system and mining,springer,2012:439-450.

[5]张晓君,周昌乐.情感等级BDI主体模型研究[J].模式识别与人工智能,2013(7):615-622.

[6]ZHANG XIAOJUN.Modeling emotional agents based on graded BDI architectures[C]//Lei J.Network computing and information security,springer,2012:606-616.

[7]RAO A S,GEORGEFF M P.Modeling rational agents within a BDI-architecture[C]//Proceedings of the 2ndinternational conference on principles of knowledge representation and reasoning,1991:473-484.

[8]张晓君,林颖,周昌乐.基于知识情感等级BDI主体的决策行为模型研究[J].计算机科学，2014(3)：232-237.

[9]BRATMAN M E.Intentions,plans,and practical reason[M].[S.l.]:Harvard university press,1987.

[10]张晓君.基于BDI逻辑及其扩展的Agent行为表征研究[R].厦门：厦门大学博士后出站报告,2013.

[11]EMERSON E A,SRINIVASAN J.Branching time temporal logic[C]//de Bakker J W.Linear time,branching time and partial order in logics and models for concurrency,1989:123-172.

[12]HALPEM J Y,MOSES Y O.A guide to the modal logics of knowledge and belief[C]// Procceedings of the ninth International joint conference on artificial intelligence,Detroit,MI,1985.

[13]COHEN P R,LEVESQUE H.Intention is choice with commitment[J].Artificial intelligence,1990,42(3):213-261.

[14]林颖,张晓君.信念-愿望-意图理论及其形式化研究[J].四川师范大学学报(社会科学版)，2015(1):5-9.

[15]HUGHES G E,CRESSWELL M J.A Companion to Modal Logic[M].London： Methuen & Co.Ltd,1984.

[16]VARDI M Y.On epistemic logical omniscience[C]//Proceedings of the first conference on theoretical aspects of reasoning about knowledge,1986:293-306.

[17]CHELLAS B F.Modal logic:an introduction[M].Cambridge：Cambridge university press,1980.

[18]RUSSELL S,WEFFALD E.Principles of metareasoning[C]//Proceeding of the first international conference on principles of knowledge representation and reasoning,Toronto,1989.

(责任编辑张佑法)

Analysis of Belief-Desire-Intention Logic

LIN Ying1, ZHANG Xiao-jun2

(1.Department of Economics & Management, Ningde Normal University, Ningde 352100, China; 2.Institute of Logic and Information, Sichuan Normal University, Chengdu 610066, China)

Abstract:Beliefs, desires and intensions play important roles in determining the behavior of rational agents when they seek to attain their goals. Belief-Desire-Intension logic presented by Rao and Georgeff(1991)was based on a branching-time possible-worlds model. This paper is shown how the formalism realizes many of the important elements of agents’ intensions, such as beliefs, desires intensions and commitments. Different types of rational agents can be modeled by imposing certain conditions.

Key words:belief; desire; intention; commitment; BDI (Belief-Desire-Intention) logic

中图分类号：B81

文献标识码：A

文章编号：1674-8425(2016)03-0018-07

作者简介：林颖(1963—)，女，福建福清人，教授，研究方向:现代逻辑。

基金项目：教育部人文社会科学研究规划基金项目“基于BDI(信念、愿望和意图)逻辑的慎思Agent的行为决策研究”(13YJA72040001)

收稿日期：2015-08-12

doi:10.3969/j.issn.1674-8425(s).2016.03.004

引用格式：林颖，张晓君.信念-愿望-意图逻辑探析[J].重庆理工大学学报(社会科学)，2016(3):18-24.

Citation format：LIN Ying, ZHANG Xiao-jun.Analysis of Belief-Desire-Intention Logic[J].Journal of Chongqing University of Technology(Social Science)，2016(3):18-24.