智力、人工智能
2009-09-03马刚
马 刚
摘要:本文结合现代脑神经科学的研究成果,从关于儿童智力发展的现有资料及心理学家们的认识变化和讨论入手,考察了人类智力的演化,并在此基础上,探讨人工智能的发展潜势。
关键词:智力人工智能语言
人们普遍认为智力是可以学习、培养和发展的,这种观点便蕴含了对智力演化过程的认识。汉语的“智”是“知”的后起字,本义指聪明、智力强,如“然后智生于忧患”(《荀子》引《孟子》),“智术浅短”(三国志·诸葛亮传),“少年智则国智”(梁启超《少年中国说》)。在1921年举行的学术讨论会上关于智力定义的讨论中。美国心理学家刘易斯·特曼(Lewis M.Terman)强调抽象思考的能力,但是,另一位美国心理学家爱德华·桑岱柯(EdwardL.Thomdike)则认为学习和对问题给出优秀答案的能力才是智力;瑞士心理学家让·皮亚杰(JearlPiaget)认为智力是当你不知道怎么办时动用的东西,他还区分了智力发展的两种基本过程和四个不同阶段,其观点和理论影响深远:而在1986年的讨论中,与会心理学家们则一致认为,对环境的适应能力是理解智力的本质和用途的关键(EncyelopadiaBritannica,2009)。当代学界对智力的这种认识与汉语的“急中生智”这一成语非常合拍。如出一辙.都突出了智力的创造性、动态发展性及其发生的情景。客厅的茶几上摆放一个正在沸腾的火锅,一个两、三岁小孩走过去用筷子而不是用手到锅里面去挑肉吃,或者想要锁在抽屉里的巧克力翻箱倒柜地去找钥匙而不是用拳头或杯子砸抽屉都是动用智力的结果,都是聪明的和具备值得令人称赞的智力的,我们对这小孩的评价是聪明;一个八岁的小孩也这样做,我们认为是正常。类似的。一个四、五岁的小孩能够脱口而出三七二十一之类的数学题,我们也一般认为那小孩的智商高、聪明;但是,一个十一、二岁的孩子再有如此表现,只能说是还不算笨。
智力应该是和生物肌体的进化同时进行的,因为缺乏远古资料.这里我们不打算去猜测和讨论猿人、古人或今人智力的进化历史过程。结合现代脑神经科学的研究成果,我们只从关于儿童智力发展的现有资料及心理学家们的认识变化和讨论人手,来考察人类智力的演化,并在此基础上,探讨人工智能的发展潜势。
人们智力的物质基础主要在于人脑而不在于心,这已经是现代人的基本共识。人的身体生长发育一般经过十几年的时间,基本形体和部件数量在出生时就决定了(后天的手术或意外事故不算),外部形体的发育情况有目共睹.但大脑的情况有点特殊。这里我们不再复述人脑中可能代表不同进化阶段的三重构造,也不讨论对立统一的左右半球和其中不太确定的具体任务功能分区;大脑的主要功能是思维,因此我们通过研究思维的形成过程和脑神经细胞层面活动的关系,来探讨智力的演化过程。
大脑的基本组织结构是神经元细胞,人脑所呈现的瓷白色是其脂肪的颜色,简称为白质,这种脂肪叫“髓磷脂”,它们包裹着神经细胞纤长的突起部分,使之绝缘。突起的部分被称为“轴突”,和电线相似,把神经元的输出传送到附近或远处的目标。白质实际上是走向各处的神经纤维的集合,就像我们在电讯中心大楼的地下室所能见到的成捆电缆一样,只不过颜色和体积不同。脑的主体正是这些绝缘纤维,它们把实现重要功能的脑的各部分相互连接起来。在轴突的一端是球形、膨大的神经元的细胞体,包含细胞核。细胞日常运转和维持所用的DNA模版即在其中。有许多树状分支从细胞体伸展出来,称为树突。神经元的这一部分没有白色的髓磷脂,因此它们大量集合起来便呈灰色,被称为灰质。神经元轴突的另一端通常与一个下游神经元的树突相接触,它们之间的狭小缝隙称为突触。上游神经元释放微量的神经递质至突触,然后扩散至下游神经元的膜,打开某些膜上的通道。每个神经元都是一个典型的计算单元,能把几千个输入的影响综合起来。具有相似功能的神经元倾向于在皮层中作垂直的排列,形成柱形结构,这被称为皮层柱,贯穿皮层的大多数层次。大约100个神经元组成一个环绕锥体神经元顶树突的微型柱,直径约为30微米(如一根纤细的发丝),约100个微型柱组成一个大型柱,一个皮层区有100x100个大型柱,大脑的两个半球共有104个皮层区。这些就是我们思想和智力的物质基础,简单中蕴含着复杂。初生婴儿的大脑重量大约为400克,是成年人脑重的30%。虽然大脑在生长过程中神经元的体积在扩大,联结(树突、轴突和突触)的数目不断增加,但是神经元的总数目基本不变。大脑结构的发育和工作方式是由基因决定的,突触的数目和信息种类则完全受环境的影响。
大脑中存在类似DNA碱基复制的复制机制并且存在复制竞争。锥体神经元释放一种兴奋性神经递质谷氨酸。可以激活NMDA通道.产生长时程增强(LPT,即long-termpotentiation)现象,是短期记忆的最佳基础,它为真正持久的突触结构变化的形成提供骨架,这些变化是永久性“印记”,有助于长期不用的时空模式的重新建立。复制竞争存在于神经激活网络的同步化倾向中,记忆痕迹是以分布的方式存贮的.并没有一个位点对于其复苏是关键性的,变异同时存在,使竞争成为可能,它决定着什么模式能最佳地与连接特性发生共鸣。
人脑的这种活动方式意味着人的思维和智力也是进化的并且也存在着达尔文过程。达尔文主义的主要内容是大量繁殖、生存竞争、遗传、变异和适者生存。卡尔文教授认为思维就是瞬息间的达尔文过程,人的大脑具备达尔文过程的所有要素:模式、复本、模式的持续变化、复制竞争、环境的影响、模式的繁殖。各种事物记忆构成大脑细胞神经活动的时空模式,暂时的印记摹写在永久的印记之上.特定时空模式的重复会留下突触强度的改变.这在神经生理学中被称为“易化”和“长时程增强”。真正持续保存的印记是个体特异的,甚至对每个同卵双生子也是如此。通过对思维的物质基础——大脑的研究分析能够比较客观形象地让我们了解智力产生和演化的过程。
我们的思维活动是动态的达尔文过程,复制竞争的临时赢家成为我们意识的良好候选者。新皮层的达尔文机制可以解释思想如何“自上而下”地影射于神经元群和思想如何“自下而上”地由那些看起来是杂乱无章的神经元集群产生的。这种对智力的解释可以为我们洞察各种生命的智力所循的途径提供启示,包括人工智能(AI)、增强动物、人类甚至地外生命。
我们为适应环境而表现出来的智力时时都在发生:求学者学习掌握通过某课程所需的材料,大夫根据了解的病情对某种未知病症的病人进行治疗,艺术家修改一项作品使其看起来更加协调悦目,等等。面对纷繁多姿的智力表现形式.我们渴望了解的是它的本质。心理学家阿瑟·詹森(ArthurJensen)指出影响智力测试的有两个最主要因素:速度和你在头脑中能同时应付事项的数
目(例如你在一定的时间内能回答多少问题,类比问题时通常要在头脑中同时保持多个概念并比较)。这种认识让我们很自然地联想到当前对计算机运行速度和多功能的要求。研究智力测验试题的编制者们给我们列出的智力测试的项目清单:机械记忆力、数字计算能力、归纳推理、演绎推理、感知速度、语言表达的流畅性、言辞理解力、空间能力等诸如此类的事物;我们发现智力是由许多可以分解出来的能力构成的,它并不是某种单一的因素。
我们知道。分解出的所有能力并不能通过简单地叠加而等于智力。很多自闭症患者都在诸如机械记忆或特定事物的感知速度等方面表现超强,但是在传统观念上往往不被认为是聪明的。而且,行为越是复杂和有目的性,往往越不被认为是智力的表现。智力的最佳标志经常是一些解决比较简单而又不易预料的问题的情况,那体现的是灵活性和创造性。当然,“智力”是由许多东西组成的复合物,它与人们的多种心智能力有关,甚至包括预测、想象和幻想,它们是我们“意识”活动的内容或部分成果。美国心理学家丹尼尔-高曼(DanielColeman)还提出,人类认识自己情绪的能力(即情商)也很重要。
在计算机和自动化相关领域的发展上,也存在着模拟人脑内部智能机制的AI学派和模拟人与环境交流的CHI学派。真正的人造智能形式的出现需要克服至少三个难点:与各种动物组成的生态系统相顺应、价值问题和人类对其潜在挑战的态度。人工智能的特定程式可能产生有智能的机器人,逐渐更新换代的软件通用型计算机将会获得智力性意识,诸如可驾驭的注意力、复述、语言能力、想象、下意识信息处理、对未来的策划、战略上的决策和自言自语。这些只是当前计算机技术、人工智能、神经生理学及人脑神经生物学已有趋势的推测。艾伦·图灵(Alan M.Turing)对智能机器的描述为人们发展人工智能提供了可操作的途径,但是,从知识中提炼智慧肯定要比从资料中提炼知识需要更长的时间和更加复杂些。
生物的进化历史只能给我们提供一些猜测的端倪.而通过语言研究人类的思维过程则很可能是探究智力真谛的捷径。认知语言学奠基者之一的兰盖克(Ronald W Langaeker)起初把其语法称为空间语法,因为他认为空间隐喻是语言中最基本的东西,这种认识倒与大脑神经网络中不同形式的激活从而产生我们的种种不同行为(包括语言)的现象相吻合。比克顿在《语言和物种》(1990)一书中写道:“难以想象没有语言的生灵会怎样思考,但是人们可能猜想,没有语言的世界在某种意义上会和没有货币的世界差不多。”诚然,很多人类学家和语言学家都把语言看作是思想的符号,“语言是思想的外衣”,通过符合句法的语言,我们可以进行比喻和类比推理,做出超前的计划。神经生理学家曾给我们指出大脑的语言处理区在左耳的上方,利用核磁共振成像技术即可研究活生生的语言处理过程。但是我们不得不承认,这种研究其实跟利用半导体研究收音机差不多。人脑的功能和特性决定了我们只能把人脑作为黑箱(black box)来研究,而语言则是最容易被度量的输入输出材料。建立综合的人类知识库和语料库。可能是深入理解人类智力和成功实现人工智能的关键。