认知计算主义的六个里程碑
2018-02-08符征李建会
符征 李建会
图灵之前的计算主义者,因为缺少必要的技术工具,对计算与机器的理解总归是不清楚的。霍布斯理解的计算只是简单的算术,莱布尼兹的“普遍语言”还只是设想;而拉美利特的机器还停留在初级机械论时代。图灵在20世纪 30年代清晰的阐明了“可计算函数”理论,他的图灵机这一概念工具,将计算的特征建立在十分简单的机械步骤上。同时也揭示了计算这一长期被视为心灵的高级功能,竟然具有十分笨拙的机械属性。从此,心灵与机器联系在一起。计算的一端是心灵的高级活动,另一端却是低层次的机械操作。在这一理解的基础上,人们对心灵的本质与功能开始提出一些大胆的猜测。
一 图灵测试
1950年,图灵在《计算机器和智能》一文中,设计了一个欺骗性游戏,即“图灵测试(Turing Test)”。图灵认为“机器能不能思维”的问题应当用“机器能否通过测试”来代替——如果机器能通过这个测试,就可以说机器具有思维。图灵测试的规则是:有3个游戏者,图灵强调其中有一位男性(A),一位女性(B)和一位提问者(C)性别不限。提问者在游戏中的目标是:判断另外两个人谁是男性谁是女性(提问者只能通过代码X和Y来称呼他们)。A在游戏中的目标是尽量使C做出错误的判断,而B的目标是帮助提问者。为了消除声音的因素,理想的安排是在两个房间通过电传打印机来通信,问题的范围不限。然后图灵用一台机器来代替A继续原来的游戏。如果机器在某些现实的条件下,能够非常好地模仿人回答问题,以至提问者在相当长时间里误认它不是机器,那么机器就可以被认为是能够思维的。图灵相信不久之后机器的表现会十分出色。那时,计算机将会拥有和人类无差别的智能,人们普遍会接受机器能够思维的结论,因而“机器”和“思维”两个词之间不存在逻辑矛盾。图灵指出“没有理由否认计算机能够像人一样思维”,因而能够完美地模拟一个人的无限制谈话的机器应当是拥有智能。这一主张,为当代认知计算主义埋下第一块基石。
图灵指出机器与思维或智能之间一致性的深刻本质:“现代数字计算机上电子的,神经系统也是电子的,……使用电这一特点看来只是表面上的相似性。我们与其寻求这样的相似性,还不如寻求数学上的功能相似性。”这句话可看作机器功能主义的一个先声。从字面上看,图灵认为神经系统与机器之间不存在物质上的一致性,其一致性存在于在神经系统与机器之上运行的共同的抽象操作。这种抽象操作就是计算,它根本不依赖于具体的物理媒介。反过来,只要计算程序是正确的,那么通过正常的运行,就可获得同样的结果。
命题1:功能强大的计算机将会体现出智能。
图灵为智能或心智提出了一个充分条件,即恰当编程且功能正确的计算机可以看作拥有(和人一般的)智能。但图灵没有说心智就是机器的运行,所以还不是一个必要条件。并且图灵指出的这一命题纯粹是一种设想——当时的计算机还十分初级。这一设想开始扭转笛卡尔的无心机器的想法,将心智本身当作是一种特殊的机械过程。自笛卡尔以来的唯物论者不断地利用技术工具来解构心灵,拉美利特借助于简单的带发条和弹簧的机器,拉什利(Karl Spencer Lashley)借助于电话线网络。图灵的优势在于他创造和掌握的新工具——图灵机及其物理实现计算机器。
二 强人工智能
图灵之后的计算机专家开始考虑:如何让计算机具体实现图灵所设想的智能?1956年达特茅斯会议(Dartmouth Conference)开辟了“人工智能”(artificial Intelligence,简称AI)的新领域。AI的基本任务完全是图灵命题的工程化:“将尝试去发现如何制造出使用语言、形成抽象与概念、解决目前只有人才能解决的问题并且改善自身的机器。”基于这一任务的基本猜想是:
“学习以及其他智能特征的任何方面,在原则上均可以被精确描述,从而可以制造一台机器来模拟它。”
实现智能的策略是逐渐深化的。最简单的智能形式从可经验化的行为开始,其目标是“制造能够完成人的智能所能完成的任务的机器”(科维,1990)。其次是从具有明显逻辑特征的思维方式来理解,其目标是“与人的思维、决策、问题求解和学习等有关活动的自动化”(贝尔曼,1978)。然后是从更复杂的思维来理解,其目标是“研究那些使理解、推理和行为成为可能的计算”(温森,1992)。还有的从智能行为整体来理解,其目标是“通过计算过程力图解释和模仿智能行为”(肖克福,1990)。经过几十年的发展,随着在认知模拟、语义信息加工、控制微世界、知识表达等领域不断突破,有关专家对待心灵与机器的关系越来越强硬,一种较强硬的陈述是:
“将某些信念、知识、自由意志、意向、意识、能力,归于一台机器或计算机程序,就像将它归于人一样是合法的。这种归属有助于帮我们理解机器的结构,它的过去或未来行为,或如何修理或提高它。”
塞尔将这种观点称为“强人工智能”(Strong AI),其基本主张是:
“带有正确程序的计算机确实可被认为具有理解和其他认知状态,在这个意义上,恰当编程的计算机其实就是一个心灵。在强 AI中,由于编程的计算机具有认知状态,这些程序不仅是我们可用来检验心理解释的工具,而且本身就是一种解释。”
“强 AI”不仅具有推理和解决问题的能力,而且还有知觉,有自我意识。也就是说“强 AI”认为计算机不仅是一种工具,而且本身拥有思维。
命题2:恰当编程的计算机就是一个心灵。
在计算机器中计算规则用真实物质状态表征,各项规则由存在于这个机器的物质结构和物质状态中的一个真实物理过程表征。强AI只是说明计算机可以表现出和人一样的智能,换句话说,在适当的操作下,计算机也可以拥有心灵。其研究方向是外在的,即用另外的方式重新建造一个人工体来表现心灵。
三 机器功能主义
对普特南来说,传统心灵理论的困难,很可能涉及当时的研究方法。当时的哲学家只是在用范畴、逻辑、性质、态度等哲学概念来讨论“心灵”,这些概念既是外部的,又是模糊的。这种讨论将“心灵”置于黑箱状态,内部机制无从谈起。同时的AI却在飞速发展,计算机被看作模拟甚至超越人的智能的有效工具。更重要的是,计算机的内部机制是十分清晰的,其机制解释可划分为3个层面:物理层面、逻辑层面和功能层面。这为大脑状态与心理状态的同一性问题提供新的启发。
在《精神状态的本质》(The nature of mental states)中普特南将功能状态和个例同一两个线索合在一起,提出了“处于疼痛状态是整个有机体的一种功能状态”这一命题。其中“感到疼痛就是拥有一适当种类的功能组织”是这一思想的关键。由于普特南的功能主义是沿着图灵开辟的思想道路前进的,所以在解释“功能组织”的时候,普特南特意利用计算机术语来进行说明:“假设FO(S1,…,Sn,i1,…,ik,o1,…,ol)是功能组织,即对内部状态(S1,…,Sn),感觉输入(i1,…,ik),和动力输出(o1,…,ol)之间关系的描述。处于疼痛之中是一个功能组织的状态,比如S5,由它跟其他状态、输入、输出之间的关系来决定;任何其他的有机体也会处于疼痛之中,只要有机体具有(或同构于)FO并处于 S5之中。因此,处于疼痛之中,等价于,处于S5状态中,而且它们的结构关系满足FO。”
对疼痛状态的说明,可扩充至所有的心灵状态。这些心灵状态之所以能实现,是因为它们具有相应的功能组织,而物质部分不一定具有相同的构造与排列。所以具有心灵就是具有某种正确的功能组织;任何精神性质就是某种功能组织实现的结果。根据多重实现原则,心理状态有可能在机器上实现,只要能够构造出等同的功能组织。普特南认为:“……至少作为合理的理想化,人可以被看作是一台图灵机。”所以:
命题3:心灵状态是功能状态;心灵之于大脑正如计算机软件之于硬件。
这个命题指出了心灵与机器关系的必要条件,即心灵是在大脑硬件上运行[心灵]软件的结果。大脑提供硬件基础,而心灵是落实在大脑上的功能组织的输出状态。这个命题呼应了图灵所说的“功能相似性”,为心身关系提出一种新的理解。心灵的实体地位被彻底取消了,心灵的活动依赖于大脑基础却又不能直接还原到大脑基础上——它是功能组织的必然后果,它随附于功能组织而不是随附于大脑的物质结构。
另一方面,因为心灵是功能状态,所以它不依赖于功能组织的物理构成。无论什么材料,只要能形成一个同样完善的功能组织,就可以产生无差别的输出状态,也就是心灵。具体地说,[心灵]软件在计算机上运行的功能状态也就是心灵状态;其中[心灵]软件同构于一个人的心灵的真实的流程图描述,比如具有相应状态和状态之间的关系,以及与输入输出的关系等等,从而在形式上满足[心灵]的功能组织,在计算机上呈现出人类的心理特征。所以这个命题也提供了心灵与机器关系的充分条件:正确的功能状态就是心灵。
四 物理符号系统
1976年纽厄尔(Allen Newell)和西蒙(Herbert A. Simon)在综合了图灵和普特南设想的基础上,提出了“物理符号系统假说(Physical Symbol System Hypothesis,简称PSSH)”,尝试打破功能组织这个黑箱。
根据定义,所谓的物理符号系统就是能够操作由符号构成的表达式的机器。特别地,“表达式”是由“符号”构成的,由一些以某种符合物理定律的方式相联系的符号实体组成,也就是说“表达式”也必须有明确的物理对应物。对符号的任何操作都必须遵守物理规律,而不能是思维中设想的过程。纽厄尔和西蒙特别指出,PSSH可以作为AI的定性结构定律:
“对一般智能行动来说,物理符号系统具有必要的和充分的手段。所谓‘必要的’指:任何展示一般性智能的系统,在分析之下,都会被证明是一个物理符号系统。所谓‘充分的’指:任何足够大的物理符号系统都可以经由进一步组织而表现出一般性的智能。我们用‘一般性智能行为’这个词是要标明跟人类行为相同范围的智能:在实际情景里,适合于系统之目的而且适应于环境要求的行为,可以在一定的速度和复杂性限度内发生。”
PSSH将智能主体(intelligent agent)看作是一个处理物理符号结构的物理机器,当然也包括人。这样的模型可以用来建构机器智能,当然也可以用来理解心灵。PSSH指出了计算机与心灵的关系:心灵是一个计算系统,大脑事实上是在执行计算(计算对智能来说是充分的),它与可能出现在计算机中的计算是完全相同的。人类智能可以通过一组控制着行为和内部信息处理的输入输出规则得到解释。
命题4:物理符号系统对智能来说既是充分和必要的。
PSSH普遍被看作是“符号主义”的代表性主张。并且以PSSH为基础理论的信息加工心理学,以其对思维、问题解决、推理、决策等高级认知功能的强大解释力和可操作性,一直被看作认知心理学的“经典范式”。西蒙认为:“认知心理学所做的,也就是试图用物理符号系统假设中的基本规律来解释人类复杂的行为现象。物理符号系统假设提出来已经30年了,大量的经验材料都支持这个假设和它的三个附带推论。”
五 思想语言假说
根据PSSH,符号是物理的,从而表达式与其语义对象或者过程之间的关系则是物理的因果相互作用关系。指派是指表达式要么能够影响对象要么为对象所影响;而解释则指系统根据指派执行表达式的过程。但这样做只是“……对逻辑符号做指派和解释,是计算机最基本的机制之一,纽厄尔和西蒙只是在重复计算机的基本运行机制,而并没有说明智能的产生机制。”而心灵机制最重要的是说明心理表征是如何与外部世界联系起来的,而不仅仅是表征的活动机制。为此,1975年福多提出“思想语言假说”(The Language of Thought Hypothesis):思想和思考过程在精神语言中产生,这种语言由一套物理上可以在思想者的大脑中实现的表征组成。显然,福多支持物理符号系统,关键是这个符号系统,也就是精神表征,具有可计算化的语义结构。
福多将思想语言的结构与机器语言的结构进行类比,认为思想语言将具有与计算机语言一致的结构。首先要求心理表征构成一个形式化的系统。“这个系统的表征具有一个组合的(combinatorial)语法和语义:结构上复杂(分子)的表征,建立在结构上简单(原子)的成分的基础上;并且一个分子表征的语义内容是,它的原子成分的语义内容及其他的语法/形式结构的函数。”也就是说,基础表征也就是原子表征,是由具有语义性质的原始的心理符号组成的。它们都指称或指示世界上的事物、事件或事态等。然后通过对原子符号做计算操作来获得复杂的语词和语句的表征。显然心理表征作为思维语言中的语句,不仅具有真值条件,而且还具有逻辑关系。然而,与自然语言不同的是,思维语言中的原始的心素符号和句法规则,都是在人脑中物理地得到实现的。这正是心灵的计算理论的核心思想:正是根据被物理编码的语法/形式特征,思想既相互引起而且它们的语义性质的一致性又据此被保持。所以在福多看来,句法是在表征的因果作用与它们的内容之间起调节作用的东西;表征之间的语义关系可以由它们的句法关系得以模仿。
命题5:心智就是表征结构上计算操作的结果。
事实上思想语言并不仅仅是哲学假说,作为一种语言机制,形式语义学强调句法和语义的对应,把通常的语法分析转换成计算过程,而语义则与句法保持一致。但归根结底,复杂的语义内容都是建立在原子语义的基础之上。只有在原子语义的问题解决之后,这一观点才能提供彻底的自然主义解释。
六 联结主义
通常所说的计算往往指符号计算,其物理架构指冯·诺伊曼式计算机器。这与真实神经系统处理存在着很大的差别:它要求每条数据和每条规则在大脑和神经系统中具有一个特定表征,并在寄存器中物理实现。这样处理的信息具有序列性、非自组织性和局部表征性等特点,这使得以符号处理为基础的系统在逻辑推理方面有着十分明显的优势,但是却难以处理那些非明确定义的问题,尤其在模糊识别、知识进化和情景认知等方面。
相对来说,“湿件”认知不是重构大脑功能,而是研究大脑自己究竟是怎样工作的。大脑的细节是巨量的神经元联结,通过频繁的电、化学信号传递来工作的。根据这样的特征,用人工神经网络模型来模拟大脑的机制,就具有天然的优势。1943年麦克洛齐(W. S.McCulloch)和匹茨(W. Pitts)发表《神经系统中所蕴涵思想的逻辑演算》一文,提出了形式神经元的概念和最初的神经网络模型。1958年罗森布拉特(Rosenblatt)提出模拟视知觉的感知机模型。1986年鲁梅哈特(Rumelhart)和麦克莱兰德(MacClelland)发表了《平行分布加工:认知结构的微观探索》一书,提出了多层前馈网络的误差反传算法模型,奠定了联结主义网络模型研究的基础。
人工神经网络模型由大量的神经元相互联结而构成具有自适应性的动态系统。每个神经元的结构和功能比较简单,但大量神经元组合产生的系统,却通过训练和学习来获得能解决特殊问题的联结权重模式。随着训练越来越复杂,形成的模式在模糊识别和情景认知中的能力也会大幅提高。重要的是,通过无意识的联结而形成的认知能力,更接近于真实的模式识别,这与有意识的搜索和匹配过程有着巨大的结构和效率的差异。因为人工神经网络中不存在离散化的、定位式表征。神经元是网络构成的基本单元,但单个甚至部分神经元都不形成某一表征。表征只能在神经网络整体的层面才能表现出来,但这种表征又是动态的,因为只有固定神经网络联结权重之后才能形成表征的某种表明,而在认知过程中,权重是不断变化的。也就是说联结主义的表征通常既不能定位也不能储存,所以是亚符号性的分布式表征。同时人工神经网络中也不存在符号化的推理过程,所谓的计算体现在对多个单元的状态与复杂的联结权重模式的变化之上的解释中。联结主义的基本观点如下。
1. “认知状态是具有内容的心理表征的计算关系。
2. 认知过程(认知状态的转换)是心理表征的计算操作。
3. 计算的结构和表征(1和2提及的)必须是联结的。”
显然,联结主义通常在坚持命题 5的基础上,对表征和计算做出了不同于命题 4的说明,这种区别表现在表征的方式和计算的方式上。
命题6:心智是以联结主义方式进行的表征计算。
结语
当代认知计算主义从图灵提出的一个简单设想,到一个技术纲领,再到一种心理描述,最后发展成为一种哲学态度,前后共提出了多个重要命题。每一个新命题的提出,都是对“心灵与机器”关系的深化与扩展:人工智能希望用外在的技术手段重塑智能,认知心理学希望利用计算模型来解释心智,而哲学理论则为技术进展做理论试探和目标辩护。无论是建构大脑还是剖析心智,都依赖计算这一手段,总之“大脑所做的,可被认为是在某种层面上的一种计算。”这正是认知计算主义的核心观点。但是当前的认知计算主义还远未填满宏观心理与微观神经状态之间的鸿沟,因此,大脑何以是一台计算机,还需要更多命题给予更加透彻的阐明。■
(摘自《科学技术哲学研究》2015年第3期)