语境与人工智能

2024-04-07魏屹东

山西大学学报（哲学社会科学版） 2024年1期

魏屹东

(山西大学哲学学院,山西太原 030006)

语境(context),也称脉络、背景、环境、上下文,几乎影响着动物、人类和计算机系统行为的方方面面。它不仅影响我们如何理解世界、如何与他人交流、如何计划和执行我们的行动,也影响着计算机、人工智能以及认知科学的研究策略,特别是计算机和人工智能能够针对其所处情境和用户采取适当的行动方式。在科学哲学领域,20世纪80年代开始的“语境化运动”,不仅给出了现象域和世界之间的指称关联,而且给出了语言中内在关联的意义,从而超越了符号和指称物之间的关联,走向了对符号使用者内在心理意向状态的分析[1]。这种从外在到内在的“语境化运动”使语境在语形、语义、语用和认知上得到了统一,阐明了语境是有界的、相对的并决定研究对象的意义。

然而,在人工智能、机器人学和工程学领域,语境似乎是一个可有可无的概念,使用语境建模和推理要晚得多,比如“建模与使用语境”国际会议从1997年到2019年已召开11届[2],但近几年似乎销声匿迹了。通过研读“建模和使用语境”历届国际会议文集和相关文献,可以发现,这些领域并没有关注哲学中作为世界观或世界假设的“语境论”,也很少注意到科学哲学中的“科学语境论”。这是一个很大的遗憾。它表明哲学与科学技术学科之间仍存在壁垒,需要强化交叉和沟通。笔者一直主张,人的世界是语境化的世界,居于其中的任何人,以及由人类创造的一切知识体系,无论是人文的、社会的、数学的、逻辑的,还是科学的、技术的、工程的,甚至是人工智能和机器人学,都离不开语境。我们对世界、人类社会和文化的理解、解释和说明,均是基于语境的。人工智能要得到很好的解释和通用,即建构通用人工智能(Artificial General Intelligence,AGI),语境是不可或缺的,需要对人工智能进行语境建模。不过,本文的重点不是建构一个人工智能的语境模型,而是要阐明人工智能中语境的意义,语境中的人工智能如何工作,以及多智能体系统中的语境建模及其语境变换问题。

一、人工智能中的语境

在哲学和语言学中,语境是人们非常熟悉的一个概念。在逻辑学中,弗雷格的语境原则也被广泛地运用。人的世界,是语境化的世界。人工智能世界是人创造的世界,因而也一定是语境化的世界。基于这种认识,人工智能的自主学习在增强智能的方法上,都在自觉或不自觉地运用语境,比如语境建模和语境推理[3]。事实上,人工智能中常用的“if-then-else”算法规则,其中的“if”就是语境条件。还有基于案例的推理、基于知识的推理、基于样本和经验的机器学习、贝叶斯网和语义网络的知识表征等,无不凸显了语境条件——案例、知识、样本和经验、范畴结构等。这里的语境既有静态方面(已有知识、常识经验),也有动态方面(当前情境中的感知、决策和行动),比如语境-觉知、树型搜索。总之,推理过程中的前提条件、临时预设以及经验启示,均是语境因素。自然语言处理方面遇到的“常识问题”,实质上是“语境问题”,因为人有常识(成长中习得的),而机器没有(缺乏成长过程)。

然而问题在于,人的语境化能力能够嵌入人工智能吗?即便可以,计算机科学和人工智能中的“语境”究竟指的是什么?语境的多义性使人们普遍担心,相对模糊的语境概念恐怕很难运用于人工智能领域,正如鲍曼(R.Bauman)和布里格斯(C.L.Briggs)指出的,“所有关于语境的定义都具有明显的包容性,我们无法知道语境因素的范围何时被充分涵盖。因此,描述一个性能>语境<这一看似简单的任务可能会成为无限的倒退”[4]。这就是语境的模糊性和相对性问题。这种担忧其实没有必要,因为关于语境是什么的问题在哲学上完全可以澄清。

在计算范式下,关于语境的一个普遍认可的定义是:“语境是可用于描述实体情况的任何信息。实体被认为是与用户和应用程序之间的交互相关的人、地点或对象,包括用户和应用程序本身。”[5]而按照巴齐尔(M.Bazire)和布雷齐隆(P.Brézillon)的说法,“语境可用于表征和解释用户在特定时间与应用交互情境的任何信息”[6]。这是将语境视为信息,即任何与所描述的实体相关的信息都是语境因素。然而,信息本身是缺乏语义的,语义需要语境来限定,而“语境是一个限制解决问题的步骤而又不明确干预它的东西”[7],类似于化学反应中的催化剂(加速反应而又不参与其中)。这意味着,语境的作用类似于一组先定约束,它们对嵌入在给定任务中的系统(用户、计算机或机器人)的行为产生影响。形式地看,一个语境信息系统可描述为:Γ=(U,A,V,C)[8],其中U是一组对象的集合,A是一组属性的集合,V是一组属性值的集合,C是一组语境的集合。每个属性a∈A被定义为从U×C到V的映射,可形式化表达为:a(u,c)=v,表示与对象u关联的属性a在语境c中具有v值。或者说,对象u在语境c∈C中由信息Inf(u,c)表示的信息集可用Inf(u,c)={[a,a(u,c)]|a∈A}来定义,语境c中对象u的信息集是u的所有属性以及它们在语境c中获取的值的集合。

这里是用数学工具“集合”来刻画语境的结构。笔者也曾将语境分为文本语境、实践语境和认知语境三类,认为语境不是定性的、模糊的,而是可表征计算的、结构清晰的,具有可表征性、可计算性和可变换性:“可表征性是指语境的构成要素是有限的,可通过某种形式表达出来。可计算性是指语境的这些要素可通过算法(或步骤)获得数值或非数值的结果。可变换性是指语境是发展变化的,语境的变换导致意义的变化。”[9]认知语境的表征与计算模型可用集合表示为:Ce=(A,O,I,M),其中A表示认知者,O表示认知对象,I表示仪器,M表示方法。就认知活动本身而言,它由认知者和认知对象构成,仪器和方法是中介。其含义是,认知者A使用方法M,并利用仪器I探测对象O,产生了知识K,表示为映射:F:(O)→K。在人工智能中,认知者A指非人的智能体(agent),O是其要实现的目标,I是其算法或程序,M是其实现的路径、策略或框架。这样一来,这个定义也可用于人工智能中的语境刻画或表征(这是另一个问题,这里不展开)。

巴齐尔和布雷齐隆试图通过回答以下问题来指定给定情境的语境:谁?什么?在哪里?何时?为什么?如何?其中“谁”代表主体,即行动者;“什么”代表对象,即动作的作用对象;“在哪里”和“何时”提供所关涉动作的时空位置信息;“为什么”给出了主体的意图、目标(甚至情感);“如何”明确了实现动作所需的程序。这是一个六元素语境集:C={Who,What,Where,When,Why,How}(5W+H)。也就是说,语境可以用来描述实体情况的任何信息。更一般地说,用于描述这种语境信息的要素可归结为五类:个体性、活动、位置、时间和关系,其中个体性即实体(主体),活动决定了语境元素在特定情况下的相关性,而位置和时间则主要驱动实体间关系的建立,并使实体间的语境信息得以交换[10]。

可以看出,语境作为一个抽象概念或一个不变量,与背景、环境、情境密切相关,也与物理学中的“场”(field)、人工智能中的“域”(domain)等概念相关。詹金斯(R.Jenkins)认为,“场是一个重要的中介环境,在这里,外部因素——不断变化的环境——对个人实践和机构产生影响。场的逻辑、政治和结构塑造并引导着‘外部决定’影响场内事情的发生方式,使它们成为场本身正在进行的历史和运作的一部分”[11]。比如多智能体系统,它是语境敏感的。语境通常与“域”概念互用,而“域”代表一个可能世界,其中包括各种研究、开发过程和分析。可能世界就是虚拟现实世界。语境的关键是要决定语义或内容,也就是要让人工智能的字符串产生意义。这个过程必然涉及客体(实体)、问题及其语义。正是在这个意义上,语境概念显得更为适用和准确。

总之,语境是多因素组成的系统或集合,一般包括物理(环境)、认知(知识)、语言(内容)、社会(实体交互关系)、文化(共有信念)和情感(内在心理状态)维度[12]。梅纳(T.B.Mena)等人提出了一个概括性的三元组语境模型:语境{领域,实体,问题},试图来囊括这些因素。但显然这还不够。如果将语境所涉及的元素组成一个集合,那应该是:语境{情境,客体,问题,语义},其含义是:一个当前情境(或领域)中的客体和问题的解决或解释(意义)发生在特定语境中。或者说,语境是为了解决问题而存在的,而问题往往是一个命题或陈述的疑问句,比如“人工智能有智能吗?”(“人工智能有智能”的疑问句)。在复杂系统中,语境有多个,构成一个语境子集,而其中的各个元素也是一个子集。这种复杂系统的语境建模,通常使用集合及其映射来表征。

二、认知科学中的语境

相较于人工智能,认知科学对语境更为重视。在认知科学中,语境一般被理解并定义为在特定场合影响人类(或认知系统)行为的所有实体的集合。这种语境模型假设了当前语境中涉及的心理表征,认为语境至少是由感知、记忆和推理三个过程之间的相互作用形成的[13]——构建当前环境新表征的感知、重新激活或构建以往经验表征的记忆,以及构建生成目标、推断事实、诱导规则等的表征的推理;而且假设了语境反过来会影响感知、记忆和推理过程。这种语境动态理论的主要原则是:语境是一种心理状态,没有明确的界限,由所有关联的相关元素组成,并且是动态的。这种语境观并不新鲜,它源于社会科学。在社会科学中,语境通常被视为相互作用的实体(人、代理和人工制品)的网络,比如知识社会学中的行动者网络理论(1)科学社会学中的“科学共同体”,科学知识社会学中的“行动者网络”,都将某个松散的、无形的“社会团体或组织”视为行动者(主体)的背景或环境,这些背景或环境就是“语境”,所以,“语境”在哲学上得到了认识论的提升和方法论的扩张。参见:魏屹东.科学社会学新论[M].北京:科学出版社,2009:7-10.。这种方法侧重于实体之间反复相互作用所产生的语境的结构属性,包括网络元素和涌现属性。事实上,人工智能中的范畴网、贝叶斯网、多智能体系统都将语境视为网络结构。

在记忆模型中,传统认知主义假设记忆作为语境,是存储的记号、图像或信号。而根据哲学和认知科学中的后认知主义理论(具身认知科学),记忆作为语境不能被视为有意义的图形、噪声或信号,因为在记忆科学中该假设作为框架将人类认知系统描述为一个无维的执行控制单元,接收和转换来自环境输入的信号[14]。因此,传统认知主义的记忆存储假设遭到了尖锐的批评。这意味着,语境在当代记忆模型中所扮演的角色充满了内部和外部的不一致。所以,将内存的“语境”视为可通过类似计算过程的转换、存储的离散项是行不通的。或者说,将记忆的语境视为不影响记忆过程的存储刺激,并没有获得更好的效果。尽管记忆模型的许多元素都表现出经验倾向,且这些倾向只是不完全适合这些模型的编码-存储-检索框架,但语境的确是一个不可忽视的重要问题。所以,具身认知科学的一个标志是拒绝计算启发的建模方法,而建模方法似乎正是这个问题的框架。在大多数情况下,记忆科学家需要根据从大量记忆案例中提取的数据来构建动态模型。在这样的动态模型中,语境既不是刺激,也不是识别刺激的不起眼的背景,而是一种软组装框架,即数据集合包。

在当代学习理论中,语境通常被理解为实验设备所提供的背景刺激,比如心理学实验的斯金纳箱(Skinner box)。这种理解或定义类似于关于人类记忆的研究文献中使用的定义,其中语境被定义为由实验线索提供的刺激,如斯金纳箱提供的食物线索。这意味着在任何情况下,语境都是一个相对持续的刺激,它围绕或嵌入了要学习或记住的目标刺激,无论它们是条件刺激还是判别性刺激,抑或是列表中的项[15]。这种探索允许被试存储语境的整合表征,一旦形成整合表征,探索过程就会减少。这种情境表征对于情境恐惧条件反射也是必要的,因此在电击传递之前,必须给被试(动物)足够的时间来探索其所处空间的情形[16]。

在儿童发育方面,语境实际上指的是儿童环境中相应的长期变化[17]。这些变化主要是指随时间推移的相关性模式,即一个人的生活轨迹(历史记忆),而不是可识别的实体。也就是说,发育是指贯穿整个生命周期的人际环境组装。在这里,语境不再被视为可使人处于愉悦状态的自变量或环境,而是指儿童成长过程的历史或教育背景。

然而问题在于,我们需要说明一个实体(人或智能体)如何工作才能完成其任务。这就要回答以下问题[18]:哪些角色扮演实体X?X如何执行活动Y?在何种语境中X如何与Y交互?哪些事件触发X的功能?X如何协调活动或管理资源?X如何协调自身?在特定时间间隔内,X扮演什么角色?执行哪些活动?使用哪些资源?与哪些实体交互?哪些承诺正在处理?这一系列问题是人际交往和多智能体交互过程中必然会遇到的。

回答这些问题势必需要一个多实体交互的整合架构。在认知建模中,架构被用来解决多主体的复杂性问题。斯洛曼(A.Sloman)认为,认知架构有三个基本部分[19]:感知(智能体)框、行动(智能)框和连接这两个框的内部层(中间层)。内部层又包括反应层(通过感应器)、协商层(多智能体交互)和反映层(反馈循环)。内部层的反应机制定义了智能体的前限定行为;协商机制与计划相对应,调节和决策相对应;反映机制显示了主体变化前几层行为的能力。行动层、决策层和反映层之间存在复杂的相互作用,它们本质上是心理模型的物理实现,因为“心理模型是人类能够生成系统目的和形式描述、系统功能和观察到的系统状态解释以及未来系统状态预测的机制”[20]。

那么,认知或智能的实现为什么要使用语境呢?原因在于,人类记忆系统的排列方式便于使用语境来增强编码和检索。瓦格纳(A.D.Wagner)等人使用fMRI扫描证明,在神经学水平上记忆存在语境依赖性,因为大脑不同区域是否被激活,具体取决于被试是否熟悉语境[21]。换句话说,被试的大脑区域能否被激活,依赖于被试早先是否有某方面的经历或知识。比如问被试是否知道“地球是圆的”,若被试没有这方面的知识,相关脑区就不会激活,因为被试对此问题没有任何记忆反应。这表明基于语境的编码和检索过程极大地影响了人类的认知行为,包括感知、倾向、学习和认知。我们使用语境形成的关联指导我们如何记住信息以及什么情况会触发其检索。这基于语境的推理,人类的记忆和推理均是与语境相关的。[22]所以,学习(人或机器)本质上是一个语境化(解决问题、决策和评估)、去语境化(总结经验、绩效评估)和再语境化(利用经验教训)的过程。

概言之,语境作为要探索的实体或问题的基底,具有整合性。因此,语境是一组联结,联结具有状态,其相关性由知识引导,而且语境是有界的和有影响的,不能无限倒退。如果语境与用户或设备的历史无关,只与特定情况(如位置)相关(如办公室的电脑),那么它就是一种绝对语境。如果语境与用户或设备的历史记录数据相关(如电脑的出厂参数),而与其所处位置无关,那么它就是一种相对语境。因此,语境也具有绝对性和相对性。

三、语境中的人工智能

人造的智能应该是特定语境中的。人工智能、机器人学、虚拟实现技术都是计算机语境中的领域或系统。语境的作用在这些领域中是不言而喻的。比如,一种基于语境的操作决策支持方法[23]侧重于建模和解决动态环境变化的问题。问题由抽象和操作语境建模,语境整合了信息源和领域知识提供的信息。这种方法涉及用于知识集成的范畴管理操作、信息组织的语境管理技术,以及问题定义和面向对象的约束网络机制,其具体应用是针对即时便携式医院配置的自适应服务。

在经典计算机科学中,语境一般被视为一种状态,它操作系统维护表(table)的实现目标,这些表具有所有进程的条目。条目包含相关进程状态(正在运行、阻塞或等待)、程序计数器、堆栈指针、内存分配、打开文件的状态,以及当进程从运行状态切换回就绪或阻塞状态时,必须保存的所有内容信息,以便之后重新启用此条目。

在人工智能中,语境通常被视为与某些特定情况(环境、领域、任务、智能体、交互、对话等)相关的事物(句子、命题、假设、属性、程序、规则、事实、概念、约束、句子等)的集合,即概念的范畴。这就是语境的“盒子隐喻”[24]——语境被视为一个容器或框架,其内容取决于一组情境参数或维度。根据“盒子隐喻”,语境建模在人工智能中的使用主要体现在三方面:

第一,目标导向的表征和自然语言处理。这方面的一个突出例子是环境智能系统(Ambient Intelligent Systems),该系统是通过感知和推理其环境来感知语境的,它们感知用户的需求并通过语境敏感来主动响应这些需求[25]。语境感知是指智能体尝试检测系统处于哪种情境,语境敏感是说智能体根据系统认为它所处的情境而采取行动。这是一种语境依赖(2)表征(尤其是语言表征)是一种语境依赖的推理过程,这种语境依赖表征一般是在三个基本维度——部分性、近似性和透视性——上运行的。部分性是说,当一个表征仅描述更全面的事态的子集时,表征是部分的,无论在形而上学上还是在认知上;近似性是说,当一个表征提炼出给定事态的某些方面时,它是近似的,可用二进制谓词(x,y)近似表征,这是最小表征。透视性是说,当一个表征对事态进行时空、逻辑或认知观编码时,表征是透视的。参见:BENERECETTI M,BOUQUET P,GHIDINI C.On the dimensions of context dependence:partiality, approximation, and perspective[A]∥AKMAN V,BOUQUET P,THOMASON R H,YOUNG R A. Context 2001[C].Berlin Heidelberg:Spring-Verlag,2001:59-72.的适应,即仅在满足相关语境条件时才适应软件系统子部分的行为。因此,语境建模的过程就是适应性表征过程。也就是说,行为细化的一些基本行为,仅在特定语境条件下适用,比如软件系统本身根据语境条件、多重性和解决策略,对基本行为和语境适应的组成部分做出自主决策。还有,语境导向的域分析(Context-Oriented Domain Analysis,简称CODA)也是典型的语境依赖和语境适应的[26],旨在弄清域的潜在相关因素。

第二,语义网络系统。语义网络作为一种图结构,以互连节点和弧模式表征知识[27],它是一种将语言处理的表征系统概念化的简洁而优雅的方式。语义网络强调语言处理中语境关联的有效性,这显然是一种语境依赖的系统,非常适合转化为人工智能系统。实际上,人工智能本身就是一个更大的语义网络。这种结构以图形法表征知识,与认知语义网络的概念结构非常相似。这种方法连接知识中的相关概念,不仅可用于表征概念和知识本身,还可用作其他知识表征系统的支持功能。而且,语义网络有不同的子类型,适合不同的概念关系如定义性、断言性和暗示性的分析。这些结构分别用于评估超型-亚型的关系,断言概念关系的命题,以及表征因果关系或推理的模式。这种多样性在语境依赖的语言处理中非常有用,因为语义网络可以有效地与其他语言系统协同工作,以评估语言输入的语境连接性。

第三,隐马尔可夫模型。人类的情境推理是一个语境建模过程,即个人使用语言语境来突显相关信息,以便从人们听到的无数短语中尽可能捕捉意义,这突出了大脑对语境系统的需求。例如,人工智能中的隐马尔可夫模型使用语境来帮助语音识别,以缩小语句的可能选项数量[28]。但隐马尔可夫系统必须首先通过给出正确、理性的句子来训练,以便构建一个能够运行的概率模型;然后它可以在某种情况下使用此模型来预测序列中的下一个单词。这对于自然语言处理非常有利,因为它依据之前遇到的情况使用其概率模型,从整个词汇表来解析词语系列中下一个可能的单词。ChatGPT的运作机制就是这样,只是后者增加了自注意力机制,语境推理能力更强了。

不过,需要注意的是,在语境感知系统和软件工程中,人们所考虑的语境往往是隐藏的,有些将语境集成到需求分析层次,有些则集成到概念层次,如范畴系统。这种语境工程是人工智能软件工程的一个分支,它处理对语境敏感的系统的设计、开发和制造,同时处理硬件和软件。也就是说,语境工程允许构建基于内容的系统,该系统具有动态推理和知识表征的功能。笔者设想,如果将文化作为语境来建模,就可将文化因素嵌入人工智能这种物理系统,从而实现人工“认知智能”(即通用人工智能)的理念。

四、语境中的多智能体系统

人工智能中的多智能体系统(Multi-Agent System,简称MAS)是一组交互的智能代理,旨在执行一组目标。费伯(J.Ferber)给出了智能体的经典定义:“智能体可以是物理或虚拟实体,可以采取行动,(部分地)感知其环境并与他人交流,是自主的,并且具有实现其目标和趋势的技能。”[29]笔者认为此定义突显了智能体的四个基本属性:

(1)自主性,即智能体是唯一控制自己行为的实体。这意味着行动与否的选择仅由它自己的行为驱动。

(2)感知性,即智能体能够局部感知信息并在局部采取行动的环境(实际的或虚拟的)中进化,此环境是智能体外部的所有目标或内容,充当交互媒介,可由智能体感知。

(3)交互性,即智能体能够直接或通过环境与其他智能体进行交互或通信,其他智能体是人工环境的一部分。

(4)认知性,即智能体对其环境有部分了解,并拥有自己的资源和技能。

根据此定义,智能体就是一个“感知-决策-行动”系统。感知是从环境获得信息,决策是选择行动,行动是选择结果的运用。这种MAS通常在适应性方面具有特别的功能,即智能体可以改变自己的行为以及与其他智能体及其环境的关系,而且整个MAS可以删除或添加新的智能体。

显然,MAS的这种灵活性使其能够高效地应对不确定环境。MAS之所以具有这种类人的能力,是因为MAS中针对问题做决策的智能体通常需要一个语境来进行推理和决策,进而产生我们可以理解的行动(意义)。这意味着,在表征的层次上,任何问题的命题或陈述都是有其语境的,由于人工智能本质上是解决问题的,因而是语境敏感和语境依赖的。因此,语境建模对于人工智能是必要的,比如一个自适应语境学习模式由一个开发机制和一个适应机制构成,二者都与环境相互作用,通过感知与行动构成一个反馈循环[30]。这种语境学习的多智能体AMASCL(Adaptive Multi-Agent Systems for Context Learning)通过使用智能体的合作自组织实现了这种适应性。研究表明,通过最大限度地减少对所研究系统的假设,该方法可用于各种复杂的现实世界问题,如复杂系统控制、机器人或环境系统。通过使用此方法,用户在设备上执行的每个操作都被视为反馈,用户不仅反馈了当前的设备行为能否满足需求,而且还提供了足够的动作来执行。比如适应性多智能体系统(Adaptive Multi-Agent System,简称AMAS),通过实验实现的适应性学习器(Adaptive Learner by Experiments,简称ALEX),就运用基于演示学习(Learning from Demonstration)的方法来应对这一挑战[31]。基于演示的学习方法可将演示期间观察到的内容推广到类似人类的情况,使其与系统的交互尽可能自然。也就是说,AMAS通过ALEX能够动态学习和重用指导者执行的语境,而且每个ALEX创建并自组织其语境智能体,以共同产生用户满意的行为。实验表明,两个ALEX实例可以在没有直接交互的情况下进行协作。这样的过程可通过添加与每个信号相关的感知智能体来完成,这些智能体将负责了解它们对语境智能体的效用并与之合作。

当然,就像人有自己的目标或需求一样,单个智能体也可能是“自私的”,有自己的目标或需求。这种“自私”需求可能与某些全局目标一致,也可能不一致。而MAS必须奉行合作原则,在这种合作系统中,每个智能体努力实现共同目标,以克服单个智能体的“自私性”。因此,多智能体系统是一种“集体合作”行为体,其中适合语境行为对于MAS中的智能体格外重要,即MAS作为一个整体行为必须适合其语境。这意味着MAS的适合语境行为比单个智能体行为适合其语境更加困难。单个智能体的语境总是包括其他智能体,而其他智能体在某种程度上可能是不确定和不可预测的,并且它们本身的行为方式也受其自身语境的影响。所以,单个智能体也有机会从其他智能体那里获得信息,以更好地了解它们的语境,但代价是增加了复杂性、工作量和时间。

合作性要求MAS必须是开放的。这就是开放式多智能体系统(Open Multi-Agent System,简称OMAS),其中智能体是自由移动的,并且可能不受同一实体的控制。然而,OMAS的信任决策可能由于一些因素而变得困难。比如“自私的”智能体(邪恶的智能体)通常具有隐藏的或其他不可预测的效用函数,因此OMAS需要观察它们的行为,以检测其模式可信度。又如,一种基于语境智能体的信任系统使用了明确表征的语境知识来帮助智能体识别和应对“自私的”智能体[32]。其具体做法是:智能体使用被称为语境图示的已知语境或情境,包括环境特征、当前目标和可能的迹象或线索,选择一个或多个匹配的语境图示,实质性地标出当前语境,然后语境图示会针对这种情况给出适当的策略。这种信任系统中的语境图示与适用于所表征语境实例的所有情况的策略相关联,其中的语境是根据策略的变化来界定的。这就是MAS的语境化表征或语境建模。比如,语境建模的树表征可作为MAS——树作为根隐喻,决策者需要一种可视化表征,将开发实际所需的所有语境信息聚集在一起,并允许其方便识别每个实际输出的表征[33]。

为了说明MAS系统如何工作,惠特塞尔(L.Whitsel)和特纳(R.M.Turner)提出了一个思想实验:两个智能体Z和X组成的OMAS系统,其中Z是长期使用的成员。人们对X的行动进行长期观察,形成了它的历史语境。将X标记为值得信赖的,从而在处理X时使用了合作策略。在观察系统中的活动时,人们注意到X受到Z的良好对待,但X对Z进行了不准确的负面声誉报告,即诽谤Z。该系统中的智能体会对这种情况产生许多假设,诸如“X试图破坏Z”“Z的声誉低于应有的水平”“X并不像我们想象的那么值得信赖”等。这些假设一起或单独使用,能通过语境化识别一个新的语境,并推荐OMAS应该使用的新策略。作为语境识别的结果,OMAS应该修改它所持有的信念,以反映关于X行为影响的新假设和信念。具体做法是:首先,OMAS可能会添加关于X和Z关系的新假设,这将需要提出一个新的持久假设。其次,OMAS应该降低对Z声誉的信心,因为它怀疑X的诽谤损害了Z的声誉。由于信念是在每个决策周期开始时重新生成的,因此仅仅更新当前周期的事实是不够的。相反,OMAS的语境化需要修改跟踪和分析工作知识,以便OMAS做出正确的决策。最后,OMAS应该放弃其旧的固有假设,即X是值得信赖的,并通过修改分析做出决策的知识来防止它再次出现,如断言X倾向于诽谤Z。

总之,MAS由自主实体组成,通常被设计为自治的,其趋势是减少人为干预,以便在环境发生变化时维护系统的某些属性或活动。这种系统被称为“自维护”“自修复”或“自组织”系统,当然也是一种适应性表征系统。这种属性使得MAS能够有效地处理非线性、开放性和不确定性的动态系统,如城市交通系统。

五、人工智能的语境性与组合性

鉴于语境概念使用的广泛性,其语境性(contextuality)必然是一种跨学科现象[34],即在各个科学中都可观察到并使用,特别是在物理学、语言学、人工智能和认知科学领域。

根据日本学者丸山(Y.Maruyama)的研究,语境在哲学上具有本体论、认识论和方法论上的语境性。本体论的语境性是指,主体存在于语境中,其中的实体与环境密不可分。这种本体论的语境性源于海德格尔的哲学,与情境人工智能、嵌入式-具身人工智能和海德格尔式人工智能有关。认识论中关于真理的语境性是说,真理是语境的函数,一个命题在一种情况下可能为真,在另一种情况下可能为假,也就是在不同语境中,命题可能有不同的真值。这种认识论的语境论源于维特根斯坦后期哲学。方法论的语境性是关于语言中意义的语境性,即单词在语境中获得意义,它们的含义在不同语境中可能不同,语境在意义确定过程中的不可或缺性导致了某种弱奎因式语义整体论(没有更广语境就没有意义)。这实际上是弗雷格“语境原则”(词的意义由其语境决定)的扩展版。

认知的这种语境性在量子力学中特别明显。这就是量子力学中关于测量实在的语境性,即量子的测量值及其统计数据存在于测量语境中,可能不存在测量值和概率的全局分配。量子力学中的这种语境性源于贝尔和科亨-施佩克尔的No-Go定理(Bell’s and Kochen-Specker’s No-Go)对经典(非局部)实在论的反驳。这就是著名的量子非局域性。这种非局域的语境性意味着在所涉及的不同语境中,所有变量的值或概率分布没有一致的分配。换句话说,测量值或测量统计数据基本上取决于特定的测量语境。我们可以在每个语境中测量每个变量,但当组合在一起时,由此获得的结果作为一个整体并不一致。因此,量子力学中的真值是语境依赖的,即物理命题的真值只存在于特定的测量语境中。

量子测量的语境性可能导致认知在量子力学中的体现,即导致量子认知科学的产生(3)量子认知科学的出现意味着:如果物理学和认知科学都存在共同的结构机制,它将为克服物质和心智的笛卡尔二元论铺平道路,就像查尔默斯的属性二元论或信息的双面理论旨在阐明控制物质和认知的实在规律信息的高级结构定律一样。它最终可能导致查尔默斯属性二元论或信息双面理论的科学合理化。适应性表征作为一个概念框架,试图将物理科学和认知科学统一起来,量子认知科学若成立,也一定是适应性表征系统。。我们知道,在认知科学中,语境性在理性上非常突出,即认知行为是语境的函数(与语境共变)。因此,一个问题在不同语境中可能有不同的答案,现实世界中共存的信息和环境噪音等情境效应可能会影响或改变认知决策的结果。这意味着,认知和智能不是存在于真空中的,它们是嵌入的、具身的和情境化的。如果说认知的语境性是由行动者集体状态动态的统计性和实验设置的特殊结构引起的,那么量子的语境性就是由其单态动力学的统计性和特殊状态或操作的存在引起的。语境性可能是沟通物理系统和认知系统的桥梁,因为语境性具有强烈的适应性表征特征,或者说,适应性表征本身就是基于语境的。

然而,有一个问题需要澄清,那就是组合性和语境性之间的区别[35]。在哲学和社会科学中,实体的语境性较为突出,而在认知科学和人工智能中,组合性较为突出,尤其是人工智能的知识表征,其表现出的智能更多是行为的组合(模块化、积木组合)。丸山将实体在不同领域或学科表现出的这两种特征概括为组合性原则和语境性原则。

组合性原则:整体(表达)的意义是其各部分的含义(以及它们组合在一起的语法方式)的功能,并完全由其决定。这基本上是原子论观念。原子表达式的含义递归生成更复杂的表达式的含义。在人工智能中,组合性被认为是语言生产力、系统性和学习性的来源,如明斯基(M.Minsky)的《心智社会》所描述的那样。由于组合性,我们可以系统地创建新的表达方式,因此我们可以说,人工智能的知识表征主要是基于组合性的。

语境性原则:单词(或更复杂的表达)的含义是语境的函数,并且只能在语境中确定;部分的意义取决于围绕它们的更大整体。这基本上是关于意义的整体论。奎因的整体论可被认为是一种强语境论形式。在原子论中,部分先于整体,整体是次要的;而在整体论中,部分只作为整体的一部分存在。

可以看出,组合性原则给出了形式语言学、符号逻辑和编程语言理论中占主导地位的语义学范式。相比而言,语境性原则似乎显得微不足道。二者之间貌似存在着不可调和的矛盾。在我看来,二者的矛盾可通过适应性表征来消除。因为认知的组合性和语境性都具有目标导向的适应性和表征性,它们是适应性表征这枚“硬币”的两面。或者说,实体的组合需要语境作为介导,因为实体的范畴是语境化的。简言之,凡是需要使用语言描述的对象或目标,不管它们是组合性的还是语境性的,都离不开语境。因此,系统或实体的语境性蕴含了其组合性。

机器人的语境感知建模就是一个典型例子[36]。在这个例子中,情境化的语义智能体在计算机系统中体现了上述两个原则的统一。这可通过沃森(P.Vossen)等人设想的一个社交机器人L的行为来说明。假设L具有认知能力和沟通技巧,以支持其社交行为。打开电源后,L会扫描环境中的对象和人员,并将它们与新的实例化语境相关联。接下来,L尝试通过推理以前的语境或询问可用的来源来确定其位置。在遇到人时,L尝试辨别是第一次见到此人,还是过去已经认识。在这种情况下,一个认识序列就被初始化了。随后,L通过提问或陈述来等待与此人发起对话。这个过程意味着让机器人处于某个语境中,就像人的语境化一样。沃森等人还定义了机器人L的四个层次:传感器处理层、响应传感器输入或内部驱动器的通信层、处理问题和陈述的语言处理层,以及查询或存储通信结果或访问Web的知识层。他们在传感器处理层中利用了几个现成的模块——用于语音检测的WebRTC,用于对象识别的初始神经网络,用于人脸识别的OpenFace和用于语音识别的Google Cloud Speech-to-Text(简称API)。这些现成的模块可被视为不同的已知语境,它们的组合与合作可被视为不同语境的组合和变换。

六、结束语

综上所述,人的行为是语境介导的行为(context-mediated behavior),人工系统和机器人的行为若要有(类人)智能,也应该是这样。这就是系统或实体的语境化或语境建模。未来的通用人工智能也一定是语境化的,是作为适应性表征系统实现的。因此,对于人工智能来说,适合语境的行为与人类一样是十分重要的。毕竟,无法针对其将要实施的语境做出适当行为的机器人,即不能很好适应其语境的机器人,原则上是无用的。尤其是用于模拟人类行为的智能体“虚拟人”(virtual human)[37]更需要语境作为介导,因为尽管这种虚拟人目前只存在于计算机这种特殊语境中,但有着极其广泛的应用,从军事和社会模拟到商用视频游戏无处不在。可以预计,使用语境为人工智能建模是未来人工智能发展的一个主要方向,一种实现通用人工智能的有效方法论。