认知科学的发展及研究方向*
2014-09-14冯康
冯 康
(淮南师范学院计算机与信息工程系,安徽 淮南 232038)
认知科学的发展及研究方向*
冯 康
(淮南师范学院计算机与信息工程系,安徽 淮南 232038)
研究认知科学的起源、发展、学科结构及研究方向。提出了基于过程的认知定义,探讨了认知科学的起源;将认知科学的发展划分为计算理论、符号处理理论、多理论三个阶段;论述了认知科学的学科结构及研究方向,指出认知模型、大脑存储模型、认知计算是当前认知科学的主要研究方向。研究发现,基于过程的认知定义能够体现认知的本质。一元事件认知模型能够模拟人类的认知,是一种理想的认知模型。
认知科学;认知模型;大脑存储模型;认知计算
1 引言
认知科学研究的任务是发现人类认知的本质和规律,揭示人类心智的奥秘。美国国家科学基金会(NSF)已经将认知科学列为21世纪四大带头学科之一,并启动了人类认知组计划HCP(Human Cognome Project)[1],而我国也在《国家中长期科学和技术发展规划纲要(2006-2020)》中将认知科学列为基础研究的学科前沿问题。因此,非常有必要对认知科学的起源、发展、研究方向及最新的研究成果进行综述。
2 认知及认知科学的定义
2.1 认知的不同定义
2.1.1 心理学定义
心理学认为:认知在广义上是指任何生物体生理特性的一种功能表现,狭义上是指人脑中以信息处理方式进行的认识过程。美国心理学家霍斯顿(Houston J P)等人[2]进一步把这种观点归纳为认知表现的五种主要类型:
(1)认知是信息的处理过程;
(2)认知是思维的过程;
(3)认知是心理学上的符号运算;
(4)认知是对问题的求解;
(5)认知是一组相关的活动,如知觉、思维、学习、记忆、判断、推理、问题求解、概念形成、想象、语言使用等。
2.1.2 哲学定义
哲学从四个层次对认知进行了定义:
(1)认知是人类认识客观事物、获得知识的活动;
(2)认知是人类知觉、记忆、学习、言语、思维和问题解决的过程,是人类对外界信息进行积极加工的过程;
(3)认知可以表示为目标、信念、知识和知觉及对这些表示实施操作的计算;
(4)认知是回答“什么、谁、何时、哪里、怎样”这几个问题的答案[3]。
2.1.3 语言学定义
语言学从语言在认知中的独特作用给出了认知的定义:认知是人类对语言的处理过程。该定义从四个层次概括了语言和认知的关系:
(1)认知是人类语言产生的原因;
(2)语言是人类认知的对象;
(3)语言是人类认知的表达;
(4)认知的发展带动语言的发展[4]。
2.1.4 计算机科学定义
计算机科学从计算的角度对认知给出了既简单而又深刻的定义:认知是大脑的一种计算。计算机科学提出这样的定义,是因为人脑和计算机无论在硬件层次和软件层次有多么的不同, 但是在计算理论这一层次上, 它们都具有产生、操作和处理抽象符号的能力,都是一个信息计算的系统[5]。
2.1.5 基于过程的认知定义
对于认知的本质,文献[6,7]认为,认知不同于感知,人类感觉器官每天都会接收海量的感知信息,但并没有触发相应的认知,只有感知信息间发生了相互作用才会触发认知;认知不是对观察到的感知信息间的相互作用进行简单存储,而是在对它们的计算,并转化为知识加以记忆。认知是一个学习系统,理解世界的知识还可以通过学习直接获取并加以记忆;认知是一个输入/输出系统,输入量是需要完成的任务,输出量是完成任务的方法,而完成任务是通过改造世界来实现的;认知是一个反馈系统,改造世界中方法的有效性会校正理解世界中的知识。根据认知的以上本质,文献[8]提出基于过程的认知定义,定义认知是人类观察世界、理解世界、改造世界的完整过程,如图1所示。
Figure 1 Cognition based on process图1 基于过程的认知
上述定义中,触发人类认知的是外部世界的事件,而事件就是人类感知信息间相互作用的逻辑表达;观察世界是对触发认知的事件进行计算,并转化为认识,而认识就是知识的一种表达;理解世界是对观察世界转化的认识进行记忆,同时理解世界还可以通过学习直接接收外部世界已有的认识加以记忆,体现了认知是一个学习系统的思想;改造世界根据理解世界记忆的认识,完成外部世界输入的任务,并向外部世界输出完成任务的方法,体现了认知是一个输入/输出系统的思想;改造世界中如发现完成任务的方法无效,还可以反过来影响理解世界中的认识,体现了认知是一个反馈系统的思想;而正是观察世界、理解世界、改造世界的完整过程构成了认知。因此,基于过程的认知定义能够体现认知的本质。
2.2 认知科学的定义
认知科学是研究人类认知的本质及规律,揭示人类心智奥秘的科学。它的研究范围包括知觉、注意、记忆、动作、语言、推理、思考乃至意识在内的各个层次和方面的人类的认知活动。认知科学是建立在心理学、计算机科学、神经科学、人类学、语言学、哲学共同关心的交界面上, 即为解释、理解、表达、计算人类乃至机器的智能的共同兴趣上, 涌现出来的高度跨学科的新兴科学。
3 认知科学的起源及发展
3.1 认知科学的起源
认知科学起源于古代,基本上以思辨式的研究为主。从20世纪30年代开始,一批有远见卓识的科学家就已经开始了认知科学的基础研究,1973年,美国心理学家朗盖特第一次在论文中使用“认知科学(Cognitive Science)”一词。1977年,著名的认知科学研究领域的权威期刊《Cognitive Science》创刊。1979年,在著名的斯隆基金会的资助下,由心理学、语言学、计算机科学和哲学界著名的学者Schank R、Collins A、Norman D等人发起,联合其他学科对认知进行深入研究,一些著名的学者在加州共同成立了美国认知科学协会,并将权威期刊《Cognitive Science》确定为认知科学学会会刊。美国认知科学协会的成立标志着认知科学的诞生[9]。从此以后,世界各国的名牌大学及科研院所纷纷成立认知科学的研究中心或研究所,并创刊了一批具有国际影响力的认知科学学术期刊,如《Cognitive Psychology》、《Cognition》、《Cognitive Neuroscience》。上述种种努力,使得认知科学得到了迅速的发展,并逐渐成为世界各国争相发展的前沿学科[10]。
3.2 认知科学的发展
在认知科学近60年的发展历程中,其主要指导理论在发生着变化,因此我们可以按照主要指导理论将认知科学的发展分为以下三个不同的发展阶段。
3.2.1 计算理论阶段
约为20世纪40年代到50年代末,这一阶段认知科学的研究主要是基于“认知即计算”这一经典理论而展开的。其代表人物为丘奇(Church)、图灵、冯·诺伊曼。美国数学家丘奇最早在他的论文《初等数论中的一个不可解问题》中,提出了人类的认知和其它任何具有输入输出关系的函数一样,都是可定义可计算的;图灵在其著名的“图灵机”和“图灵测试”中,进一步表达了对认知和智力的理解,他认为认知和智力的任何一种状态都是图灵机的某一种状态, 认知和智力的任何活动都是图灵机定义的可以表达的、可以一步一步地机械实现的“计算”;冯·诺伊曼在“冯·诺伊曼体系结构计算机”中,将人类的大脑思维模拟为中央处理器对一系列指令序列的处理,而将人类记忆的认知信息和学习技能模拟为存储器中存储的数据和程序,将接受信息和改造世界模拟为输入/输出,从而将认知统一在“计算机”这一认知模拟器中,其中心思想仍然是中央处理器对指令的计算[11]。
3.2.2 符号处理理论阶段
从20世纪50年代末到80年代初期,这一阶段认知科学的研究主要基于“认知是对符号的计算机处理”的理论,又被称为“计算机处理经典符号阶段”,因为它和当时逐渐发展起来的计算机科学紧密相关。符号处理理论实际上是“认知即计算”理论的延伸和拓展。既然认知是计算,所以它一定是个信息处理系统,并将描述认知的基本单元定义为“符号”;而不同的认知活动都可以模拟为一个计算机程序;因此,人类的认知就是计算机程序对符号的一系列处理,包括输入符号、输出符号、存储符号、复制符号、建立符号结构及条件性转移,从而实现智能。艾伦·纽维尔和赫伯特·西蒙是这个阶段认知科学研究的杰出代表,他们将任何可被人类感觉器官感知、智能系统分辨、认知功能实现的有意义的认知模式,如图像、声音、文字、语言、意识等,都编码为物理符号,而将人类的某个认知活动模拟为一个计算机程序。基于这种思想,他们合作开发了最早的模拟人类认知的启发式程序“逻辑理论家(Logic Theorist)”,并在著名的“达特茅斯会议”上发布,引起认知科学研究领域的极大轰动。他们进一步研究人类认知中求解难题的共同思维规律,开发出能够求解11种难题的著名计算机程序“通用问题求解器(General Problems Solver)”,从而将符号处理阶段的认知科学的研究发展到了一个顶峰。
3.2.3 多理论阶段
从20世纪70年代到今天,三种主要的指导理论引领着认知科学的发展,它们分别是人工神经网络理论、模块理论、环境作用理论。
“人工神经网络理论”又称“联结主义理论”,该理论把人类的认知模拟为多个人工神经元所组成的神经网络来处理信息,是一种信息处理系统,信息是交互作用的人工神经元的激活模式,信息并不存在于特定的神经元中,而是存在于神经网络的联结中或权重里,通过调整权重就可以改变网络的联结关系并进而改变网络的功能。
“模块理论”由福德(Forder)首次提出,受计算机硬件和软件中的模块化思想影响,福德认为人类认知的主体—大脑,在结构及功能上实际都可以划分为若干个高度专业化并相对独立的认知模块,这些模块的结合及相互作用实现了人类的认知功能。因此,认知科学研究的重点应该是大脑功能模块的划分及相互作用机制的研究[12]。
“环境作用理论”认为,认知科学的研究不应该仅仅局限在表达(Represention)和推理(Reasoning)等认知方法和理论的研究中,还应该从系统的角度来研究,尤其注重认知体所在的环境及现场对认知的影响。人类的认知不只是认知个体大脑的思维活动,还取决于环境,发生在个体与环境的交互作用之中。这方面研究的代表人物是MIT的Brooks教授,他的《没有表达的智能》、《没有推理的智能》等一系列的论文,强调了认知体与环境交互作用对认知的重大影响,并以研究成果“人造昆虫”将这一理论推到了高峰[13]。
4 认知科学的学科结构及研究方向
4.1 认知科学的学科结构
当前,国际上公认的认知科学的学科结构如图2所示,它是基于美国科学家Pylyshyn Z提出的六角形认知科学学科结构图,分布在六角形六个顶点的是心理学、计算机科学、神经科学、语言学、人类学、哲学六大核心支撑学科,体现了认知科学是上述六大核心支撑学科共同关注的交界面[14]。这六大核心支撑学科之间互相交叉,又产生出11个新兴交叉学科,分别是控制论、神经语言学、神经心理学、认知过程仿真、计算语言学、心理语言学、心理哲学、语言哲学、人类学语言学、认知人类学、脑进化。
Figure 2 Subject structure of cognitive science图2 认知科学的学科结构图
4.2 认知科学的研究方向
当前,认知科学的研究方向主要集中在与计算机科学相关的认知模型、大脑存储模型及认知计算的研究上。
4.2.1 认知模型
认知模型是指模拟人类认知,从而人工构建出的认知对象、认知架构、认知模拟的统一体。考虑到认知科学研究的巨大复杂性,研究认知科学往往摒弃认知的许多表象,而将认知的实质简化在一个认知模型(Cognitive Model)中,并通过对认知模型的研究来发现认知的本质及其规律[15]。
4.2.2 大脑存储模型
大脑存储模型是指仿生人类大脑的存储机制而构造出的人工存储模型。人类的大脑是迄今为止已知的最复杂、最合理、最高效的存储系统。模拟大脑的存储机制构建一个大脑存储模型,以这个大脑存储模型为研究对象进行大脑存储的深入研究,不但可以解决以真正大脑为研究对象进行研究面临的诸多生理和伦理困难,而且可以以一个全新的角度提出大脑存储研究的科学理论和方法,并将这些理论和方法应用于人造存储系统的实践中。因此,大脑存储模型的研究有着很高的理论水平和应用价值[16]。
4.2.3 认知计算
认知计算(Cognitive Computation)是指仿生人类在认知过程中,对所有认知数据连续进行处理时所采用的全部算法。借助于认知计算,我们不但可以将外部世界纷繁复杂的信息进行量化、融合、转达,而且还可以把人类的认知机制建模在一个适合认知科学研究的认知模型中,开展认知实验,记录认知数据,计算认知性能指标,发现认知的本质和规律,并最终构建一个具有人类认知功能的“认知机”[17]。
5 认知模型的相关研究
5.1 符号主义认知模型
符号主义认知模型是最传统的认知模型,它的认知对象是符号。符号主义认知模型主要思想是把认知当成对理性符号的处理,借助于不同的产生式规则,对符号进行替换运算。产生式规则被描述成“条件——动作”形式,它模仿了人类在推理和解决问题对应不同条件执行的相应动作。符号主义认知模型的主要代表是Newell A提出的状态算子和结果模型SOAR(State Operator And Result)、Anderson J K提出的思维适应性控制模型ACT(Adaptive Control of Thought)。SOAR是围绕着算子的选择和应用功能来组织产生式规则,其高层结构由控制策略、成果记忆区和工作记忆区组成。基于上述思想的SOAR实现了短时记忆的功能,并且很好地使概念、事实、规则有机结合在一起[18]。ACT模拟人类高级认知过程的产生式规则, 产生式规则系统由三个记忆部分组成:工作记忆、陈述性记忆和产生式记忆。产生式规则既可以由工作记忆根据现场情况临时产生,也可以是陈述性记忆存储的以往的产生式规则,还可以是产生式记忆中推理出的新的产生式规则。ACT实现了长期记忆的功能,较好地体现了认知过程中“从做中学”的思想[19]。
5.2 联结主义认知模型
联结主义认知模型是一个巨大的信息节点交互网络,各节点与其他每个节点之间相互联结、相互影响,它的认知对象是在这个网络中传递的信息。联结主义认知模型模拟了人类的思维过程,具有自学习和自适应的能力。联结主义的典型代表是McClelland等人创立的平行分配过程模型PDP(Parallel Distributed Processing),又称人工神经网络。PDP模拟了人类的神经网络,其特色在于信息的分布式存储和并行协同处理。虽然单个节点的结构极其简单,功能有限,但大量节点构成的网络系统所能实现的功能却很强大[20]。
5.3 脑逻辑认知模型
脑逻辑认知模型是模拟大脑的认知机制而非生理解剖结构建立起来的认知模型,该模型包括思维引擎、记忆体和感知及动作缓存机制,力图研究记忆的意识对认知行为的影响。该方面的研究尤其以Calgary大学的Wang Ying-xu教授最为有名,Wang Ying-xu教授及其团队自2003年至2011年,连续发表了多篇论文,详细阐述了脑逻辑认知模型对人类认知的模拟、脑逻辑认知模型中如何实现认知中数据、信息、知识和行为间的关联。脑逻辑认知模型为计算机模拟自然智能行为和认知方法建立了基础[21]。国内学者提出的基于粒计算的认知模型和机制主义模型同样属于脑逻辑认知模型。
5.4 认知模型的最新研究——一元事件认知模型
一元事件认知模型如图3所示。
Figure 3 Cognitive model based on single unit event图3 一元事件认知模型
5.4.1 一元事件认知模型的基本概念
(1)认知元。认知的基本单位是认知元,以小写字母x、y、z等表示。
(2)一元事件。记作e=[x1,x2,…,xn]→y(n≥2),一元事件代表了外部世界中触发人类认知的具有因果关系的认知事实。
(3)认识。认识是认知模型到某一时刻止对结元相同的所有一元事件的认知,记作y=[e1u/a][e2u/b][…/…],包含量化的范数、单元数、复杂度及所在行的清晰度等属性值。
(4)任务。任务记作j={r}→k,是一个不完整的一元事件描述。
(5)方法。方法是任务中缺省的必元或结元,是完成任务后输出的结果。
5.4.2 一元事件认知模型的特征
(1)本能。本能是一元事件认知模型各功能机构本身固有的操作序列,在满足一定的外部和内部条件时被触发执行。
(2)hlt。hlt是一元事件认知模型的各功能机构的一种暂停状态,此时,它暂停一切操作,等待该功能机构某种本能被触发。
(3)box。一元事件认知模型内部的各功能机构内都存在着一定数量的box,作为存放数据的中间存储单元。
5.4.3 认知流程
将按时间先后串行作用于一元事件认知模型上的一元事件、认识、任务定义为一个认知流程,如图4所示即是一个认知流程例子。
Figure 4 Sample of a cognitive process图4 一个认知流程
5.4.4 认知性能指标
(1)成功率:认知模型到某一时刻止,完成的任务占提交的任务总数的比例,记作η。
(2)潜能:认知模型到某一时刻止,能够完成的所有任务的总数,记作pl。
(3)水平:某一时刻,记忆体的水平即为认知模型的水平,记作l。
(4)认知量:认知模型在某一时刻,已经存储在记忆体中的认识总量,记作q。
(5)认知率:认知模型在某一时刻之前,认知量和感悟及接受的认识总量之比,记作a。
5.4.5 一元事件认知模型的研究结论
文献[22]认为,理想的认知模型随着认知流程的延续,各个认识的属性值呈动态变化,完成任务能够改变记忆体中存储的认识,而认知指标的变化则与记忆体容量的变化线性相关。
图5a和图5b分别是一元事件认知模型中对应图4的认知流程实验,在容量c=19时,t9和t15两个不同的时刻,记忆体存储的认识属性变化情况。其中,认识y4的范数由1变化为3,单元数由2变化为8,复杂度由3变化为17,而全部认识y1、y2、y3、y4、y5、y6所在行的清晰度由6、3、5、4、2、1改变为0、4、5、1、3、2;而完成任务的前后,即t9和t15两个不同的时刻,记忆体中存储的认识由6个减少为5个。
可见,一元事件认知模型中,随着认知流程的延续,各个认识的属性值都呈动态变化,而完成任务改变了记忆体中存储的认识。
Figure 5 Cognition stored in memory bank at t9 and t15图5 t9时刻和t15时刻记忆体中存储的认识
表1为在t9时刻和t15时刻,容量c变化时一元事件认知模型认知指标的对应变化。
Table 1 Changes in cognitive data
从表1中可以看出,不同时刻,当记忆体的容量c增大时,各项认知指标都相应增大,而当容量减小时,各项认知指标又相应地减小。如认知指标潜能pl,当记忆体的容量c从10增加到19时,潜能pl从20增加到40,而当记忆体的容量c从21减小到19时,潜能pl从44减小到40。可见,认知指标的变化与记忆体容量的变化线性相关。
更多的认知流程实验在一元事件认知模型上的结果和图5a、图5b及表1的结果相似,因此综合以上论述,可知一元事件认知模型是一种理想的认知模型。
6 大脑存储模型的相关研究
6.1 基于神经科学的大脑存储模型
基于神经科学的大脑存储模型认为大脑存储认知信息的最小解剖单位是神经元细胞。大脑左右两个半球的表面是一层平均厚度约2.5 mm的大脑皮层,由150亿个左右的神经元细胞构成,是认知信息存储的主要场所。大量的大脑皮层损伤病例及通过去除大脑皮层的某个区域或对大脑皮层的某个区域给予适当的物理刺激(如电流刺激)发现,大脑皮层的不同物理区域存储不同的认知信息。最新的研究发现,位于大脑前部的额叶(Frontal Lobe)区域存储与人类智能及运动有关的认知信息[23],位于大脑上部的顶叶(Parietal Lobe)区域存储与人类的感觉、知觉及语言有关的信息,位于大脑后部的枕叶(Occipital Lobe)区域存储与人类视觉有关的信息,而位于大脑中部的颞叶(Temporal Lobe)区域则存储与人类听觉、嗅觉有关的信息[24]。籍此,基于神经科学的大脑存储模型认为大脑的存储机制是将不同性质的认知信息在不同的大脑皮层区域分类存储。
6.2 基于神经影像学的大脑存储模型
基于神经影像学的大脑存储模型利用现代神经影像学技术,对人类认知活动产生的认知信息存储在大脑的物理位置进行定位,对大脑对认知信息的响应强度进行测量,对存储认知信息时脑区各部分之间相互关联的变化进行观察,从而建立对应的大脑存储模型。这些神经影像学技术包括直接测量与脑神经活动直接相关的生物电磁场变化信号的弥散张量成像DTI(Diffusion Tensor Imaging)、脑磁图MEG(Magnetoencephalography)、脑电图EEG(Electroencephalography)和事件相关电位(ERPs)等技术,以及间接测量脑神经活动引起的血液动力学变化信号的单光子发射计算层析成像(SPECT)、正电子发射层析成像(PET)和功能磁共振成像fMRI(functional Magnetic Resonance Image)等技术。其中,功能磁共振成像fMRI是在磁共振成像(MRI)技术的基础上发展起来的进行脑功能成像的新技术,可无创伤地对神经元活动进行比较准确的定位,并具有比较高的空间和时间分辨率及较好的可重复性,通过脑血流、葡萄糖代谢和受体的观察,依据血氧水平依赖性BOLD(Blood Oxygen Level Dependent)脑功能成像方法,得到优质的fMRI图像,借助于先进的fMRI图像处理和分析技术,可以更精确地确定各脑功能区以及其内部构造和功能特点,尤其是脑的存储认知信息情况,因此成为目前最先进的大脑存储模型研究手段之一[25]。
基于上述的fMRI技术,人们发现了大脑存储认知信息的更精细结构。对短时间内需要存储和操作的信息—即工作记忆,大脑皮层会分配不同的区域存储不同类型的信息或作为操作的临时存储区。如词语工作记忆中信息是存储在左半球后顶叶皮质区(BA 40),而词语工作记忆进行复述时,由左半球Broca区(BA 44)、左前运动区(BA 6)以及左辅助运动区(BA 6)作为临时存储区;而空间工作记忆中的信息是存储在脑右半球一些脑区,包括右枕前皮质(BA 19)、右前运动区(BA 6)以及右脑前额叶腹侧(BA 47);视觉工作记忆信息主要存储在左半球的顶叶和颞叶下部[26]。对长时间内需要存储和操作的信息——长时记忆,大脑皮层也有相应的存储区域。如长时记忆的情景记忆信息是存储在左额叶、颞叶内侧和顶枕区,长时记忆的语义记忆信息存储在左侧前额叶和颞叶的左侧颞中回(BA 21)和双侧颞顶区(BA 37)[27]。fMRI研究还表明,某个大脑皮层区域存储对应类型的信息不是绝对的,在某些情况下(如另外一个大脑皮层区域被切除)它可以代偿存储另外一个大脑皮层区域应该存储的认知信息;进一步的研究还发现,内颞叶体积的缩小与长时记忆中的提取成功率减少有关,而随着人类年龄的增加,内颞叶体积有逐渐减小的趋势,这也解释了老年人相对于年轻人记忆力减退的原因[28]。
6.3 基于心理学的大脑存储模型
基于心理学的大脑存储模型把大脑当作一个黑箱,通过给被试提供不同的视觉素材、听觉素材及对应的记忆规则,研究被试在该记忆规则下对输入信息的记忆效果,从而把大脑黑箱还原成一个存储认知信息的存储模型。这些不同的视觉素材、听觉素材及对应的记忆规则构成了不同的研究人类大脑存储模型的心理学实验。其中经典的实验有Posner视觉信息编码实验、Clark和Chase句子-图画匹配实验、Sternberg短时记忆信息相加因素法实验、字母转换实验(“开窗”实验)、Peterson和Peterson遗忘进程实验、Waugh和Norman分开痕迹消退与干扰实验、四卡片证真和证伪等一系列心理学实验[29]。通过这一系列的实验,心理学家在关于大脑的存储模型上得出以下的共识:即大脑的存储模型是以Baddeley三成分模型为框架的泛工作记忆模型。Baddeley三成分模型是Baddeley等人最早提出的,他们认为刺激人类认知的信息被分为三种不同的成分,分别存储到大脑中不同功能的存储区中。其中,直接刺激人类感觉器官产生的视觉、听觉等认知信息被称为工作记忆信息,它们暂时存储在大脑的工作记忆区中,如果这些信息不被人类的认知进行处理,则这些信息很快就会从工作记忆区中消失,所以,工作记忆信息又被称为短时记忆信息;当工作记忆信息被人类的认知有意识地进行了一次处理,则生成的信息称为陈述性记忆信息,被存储在陈述性记忆区。而当工作记忆信息被人类的认知有意识地进行了重复的处理,则生成的信息称为程序性记忆信息,被存储在程序性记忆区内;程序性记忆信息存储在大脑中的时间最长,因此又被称为长时记忆信息,而陈述性记忆信息存储在大脑中的时间介于工作记忆信息和程序性记忆信息之间[30]。心理学后续的关于大脑存储模型的研究扩展了工作记忆信息、陈述性记忆信息、程序性记忆信息的内涵和外延,但都基于工作记忆信息,所以统称为泛工作记忆模型。
6.4 基于语言学的大脑存储模型
语言是人类特有的信息交流与存储方式,人类的语言功能受大脑皮层的语言中枢控制,与大脑的关系极其复杂。很多语言学家从人类语言的组成单位及组织规则的角度,映射大脑对应的存储模型。Elissa等人[31]认为,人类语言的组成单位有音节、词语、短语、句子、段落、篇章,它们都具有声学特征或语义特征,人类语言的组织规则是由小的语言组成单位分层递归地组合建构成较大的语言组成单位,正是不同的组织规则才构成了人类不同的语言。音节是最小的语言组成单位,音节的个数是有限的,人类大脑生来就具有识别和控制发出音节的神经元组织,即对音节的掌握是人类大脑的本能;由小的音节组合建构成大的词语,是后天训练学习的结果,这个训练学习的方式或程序构成了人类语言的第一层组织规则,并被牢牢地存储在大脑皮层中;依次类推,由词语构成短语,由短语构成句子,由句子构成段落,由段落构成篇章都是后天训练学习的结果,这些训练学习的方式或程序被作为人类语言不同层次的组织规则,相继存储在大脑皮层中[32]。因此,基于语言学的大脑存储模型认为语言是不同层次的组织规则(程序)在本能音节(数据)上的运行结果(输出),大脑中存储的是语言的组织规则而非语言本身,任一层次组织规则的改变都可以改变语言本身,但处于较低层次的组织规则的改变对语言的改变影响更大[33]。这种存储模型得到很多语言学家的支持。
7 认知计算的相关研究
7.1 基于脑电信号的认知计算
基于脑电(EEG)信号的认知计算是设计一组认知实验,记录被试对应认知实验中不同认知活动的脑电信号,并通过对脑电信号的计算、分析,提取不同的认知活动对应的脑电信号特征。常见的认知实验有图片刺激实验、数字运算实验、规则提取实验等。被试一般经过挑选,文化程度较高且头发不太浓密的短发成年男性是首选。实验中,被试佩戴电极导数适中(如64导、128导)的电极帽,按要求完成认知实验中的任务。实验过程中生成的脑电信号被与电极帽相连的放大器放大,再经降噪、过滤、采样、A/D转换,最终生成特定格式的文件如.cnt文件,作为基于脑电信号的认知计算的原始数据存储在PC机中。
认知计算继续对存储在PC机中的脑电信号的原始数据进行处理。去除坏样本是计算的第一步,比如发生严重漂移的EGA信号或明显的肌电、眼电信号。接着是根据脑电信号对不同认知活动进行特征提取,共空间模式CSP(Common Spatial Pattern)是最新的从多导的脑电信号中提取某种认知活动脑电信号特征的有效算法。该算法将某种认知活动对应的脑电信号进行标记,作为Ⅰ类,而把其它的所有信号进行标记,作为Ⅱ类。CSP通过对两类的脑电信号进行训练,得到一个投影矩阵P,P能将两类数据投影到方差区别最大的方向,从而去除了Ⅱ类信号的干扰,突出了Ⅰ类信号的特征[34]。设V是包含两类信号的原始脑电信号,而Z是经过投影之后得到的可供特征提取及分类的脑电信号,则Z=PV。取A=(P-1)T,A的每一行向量被称为一个空间模式。CSP的关键是求解投影矩阵P,设供训练的输入脑电信号是一个K×T的矩阵,其中K是脑电数据的导数,T是数据的样本点数,X1是Ⅰ类带标记的训练数据,X2是Ⅱ类带标记的训练数据,X1的协方差矩阵为:
X2的协方差矩阵为:
R1和R2均为K×K的方阵,令:
R=R1+R2
作特征值分解,得:
U是R的特征向量矩阵,∑是R的特征值对角阵。对R进行白化,白化矩阵为W,
令:
T1=WR1WT
T2=WR2WT
由于对T1和T2作特征值分解得到的特征向量矩阵Uesp是一样的,因而:
∑1和∑2分别是Ⅰ类、Ⅱ类带标记训练数据特征值的维度,当∑1较大时,则∑2必然较小,从而可以对Ⅰ类、Ⅱ类数据进行有效的区分。于是,投影矩阵P最终确定为:
7.2 基于功能磁共振(fMRI)数据的认知计算
基于fMRI数据的认知计算分为三个步骤:认知活动实验、图像采集、数据分析。
认知活动实验同样需要精心设计,所不同的是,为了提高fMRI图像中BLOD信号的信噪比,同一种认知活动的实验需要重复多次,重复的时间间隔称为刺激时间模式,常用的刺激时间模式有组块设计BD(BlockDesign)和事件相关设计ED(Event-relatedDesign)[35]。
图像采集包括fMRI图像采集和解剖图像采集两部分。fMRI图像通过采用特定的成像序列扫描而获得,扫描与实验同步进行;由于fMRI图像的分辨率和信噪比不高,还需要扫描一幅与fMRI图像位置完全相同的高分辨率解剖图像,从而把fMRI图像得到的脑区激活信息对应到相应的解剖位置上,解剖图像一般采用3D图像或T1解剖结构图像[36]。
数据分析包括对采集的图像数据进行预处理及计算,以确定不同认知活动对应的解剖脑区。预处理一般包括层间时间校正、头动校正、标准化、平滑等;计算包括原始fMRI图像重建、转换成标准格式、fMRI图像层面时间校正和运动校正、fMRI图像的时间域滤波、fMRI图像的空间平滑、去除头皮外伪影、时间序列时间点数据的标准化、空间归一化或标准化、统计、激活脑区与解剖位置对应等[37]。很多新开发的软件已经能够完成fMRI数据分析的某些功能,如美国Wisconxin医学院生物物理研究所研制的ANFI、Friston等人开发的SPM、美国匹兹堡大学CCN实验室(ClinicalCognitiveNeurosciencelaboratory)开发的NIS、商业fMRI数据分析软件BrainVoyage等。
7.3 基于视听觉信息的认知计算
基于视听觉信息的认知计算将认知定义为大脑对视听觉信息的计算,它的认知数据就是被人类直接感知和理解的一组图像、语音和文本(语言)等信息[38]。认知计算的目标是从人类的视听觉认知机理出发,研究并构建新的计算模型与计算方法,提高计算机对非结构化视听觉感知信息的理解能力和海量异构信息的处理效率,克服图像、语音和文本(语言)信息处理所面临的瓶颈困难[39]。认知计算主要解决感知特征提取、表达与整合,感知数据的机器学习与理解,多模态信息协同计算等核心科学问题[40]。目前,基于视听觉信息的认知计算已经在视听觉信息协同计算、自然语言理解以及与视听觉认知相关的人脑―计算机接口等三项关键技术方面取得一定的突破,Google公司已经研制成功集成上述相关研究成果、具有自然环境感知与智能行为决策能力的无人驾驶车辆,并成功地在加州的公路上行驶了20万公里[41]。
8 结束语
认知科学已经在网络态势感知、求解认知难题、自主虚拟人决策等许多领域开展了应用,并产生了动态信任预测认知模型[42]、基于OBDD(OrderedBinaryDecisionDiagram)的动态认知难题的符号化模型检测[43]、IVMiner(IntelligentVirtualMiner)[44]等成功的应用成果。目前,认知科学的研究正得到世界各国的高度重视,对认知的不同定义会引导认知科学的研究朝着不同的方向发展,基于过程的认知定义抓住了认知的本质,该定义将使认知科学的研究立足于科学实验而不再是思辨式论述。当前,认知科学的研究应立足于基于过程的认知定义,紧密结合计算机科学、心理学、神经科学、人类学、语言学、哲学等学科先进的研究手段及最新研究成果,特别是神经科学领域先进研究手段如fMRI等,并以认知模型、大脑存储模型、认知计算作为认知科学研究的主要研究方向。相信经过科学的研究,我们一定能够发现人类认知的本质和规律,揭示人类心智的奥秘,并创造出具有人类认知功能的“认知机”。
[1]ThagardP.Theoryandexperimentincognitivescience[J].ArtificialIntelligence, 2007, 171(18):1104-1106.
[2]ShepardRN.Thesteptorationality:Theefficacyofthoughtexperimentsinscience,ethics,andfreewill[J].CognitiveScience, 2008, 32(1):3-35.
[3]BoudewijnseGA,Braddon-MitchellD,JacksonF(2007).Philosophyofmindandcognition,anintroduction.Victoria(Australia):Blackwell[J].CognitiveSystemsResearch, 2008, 9(3):229-231.
[4]StenningK,OberlanderJ.Acognitivetheoryofgraphicalandlinguisticreasoning:Logicandimplementation[J].CognitiveScience, 1995, 19(1):97-140.
[5]ChaterN,BrownGDA.Fromuniversallawsofcognitiontospecificcognitivemodels[J].CognitiveScience, 2008, 32(1):36-67.
[6]FeiXu,GriffithsTL.Probabilisticmodelsofcognitivedevelopment:Towardsarationalconstructivistapproachtothestudyoflearninganddevelopment[J].Cognition, 2011, 120(3):299-301.
[7]WöllmerM,EybenF,GravesA,etal.BidirectionalLSTMnetworksforcontext-sensitivekeyworddetectioninacognitivevirtualagentframework[J].CognitiveComputation, 2010, 2(3):180-190.
[8]FengKang,YaoNan-sheng.Cognitivemodelbasedonsingleunitevent[J].PatternRecognitionandArtificialIntelligence, 2012, 25(1):172-180. (inChinese)
[9]SimonHA.Cognitivescience:Thenewestscienceoftheartificial[J].CognitiveScience, 1980, 4(1):33-46.
[10] Johnson-Laird P N. Mental models in cognitive science[J]. Cognitive Science, 1980, 4(1):71-115.
[11] Wells A J. Turing’s analysis of computation and theories of cognitive architecture[J]. Cognitive Science, 1998, 22(3):269-294.
[12] Fehling M R. Unified theories of cognition:Modeling cognitive competence[J]. Artificial Intelligence, 1993, 59(1-2):295-328.
[13] Arzi-Gonczarowski Z, Lehmann D. From environments to representations—a mathematical theory of artificial perceptions[J]. Artificial Intelligence, 1998, 102(2):187-247.
[14] Pylyshyn Z. On computation and cognition:Toward a foundation of cognitive science:A response to the reviews by A K Mackworth and M J Stefik[J]. Artificial Intelligence, 1989, 38(2):248-251.
[15] Cooper R, Fox J, Farringdon J, et al. A systematic methodology for cognitive modeling[J]. Artificial Intelligence, 1996, 85(1-2):3-44.
[16] Hernández-Orallo J, Dowe D L. Measuring universal intelligence:Towards an anytime intelligence test[J]. Artificial Intelligence, 2010, 174(18):1508-1539.
[17] Neokleous K C, Avraamides M N, Neocleous C K, et al. Selective attention and consciousness:Investigating their relation through computational modelling[J]. Cognitive Computation, 2011, 3(1):321-331.
[18] Laird J E, Newell A, Rosenbloom P S. Soar:An architecture for general intelligence[J]. Artificial Intelligence, 1987, 33(1):1-64.
[19] Anderson J R, Bothell D, Byrne M D, et al. An integrated theory of the mind[J]. Psychological Review, 2004, 111(4):1036-1060.
[20] Bowers J S. On the biological plausibility of grandmother cells:Implications for neural network theories in psychology and neuroscience[J]. Psychological Review, 2009,116(1):220-251.
[21] Wang Ying-xu, Wang Ying. Cognitive informatics models of the brain[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part C:Applications and Reviews, 2006, 36(2):203-207.
[22] Schockaert S,Prade H.Solving conflicts in information merging by a flexible interpretation of atomic propositions[J]. Artificial Intelligence, 2011, 175(11):1815-1855.
[23] Chepenik L G, Wang Fei, Spencer L, et al. Structure-function associations in hippocampus in bipolar disorder[J]. Biological Psychology, 2012, 90(1):18-22.
[24] Geranmayeh F, Brownsett S L E, Leech R, et al. The contribution of the inferior parietal cortex to spoken language production[J]. Brain and Language, 2012, 121(1):47-57.
[25] Freeman W J,Ahlfors S P,Menon V.Combining fMRI with EEG and MEG in order to relate patterns of brain activity to cognition[J]. International Journal of Psychophysiology, 2009, 73(1):43-52.
[26] Piantadosi S T,Tily H,Gibson E.The communicative function of ambiguity in language[J]. Cognition, 2012, 122(3):280-291.
[27] Bittrich K, Schulze K, Koelsch S. Electrophysiological correlates of verbal and tonal working memory[J]. Brain Research, 2012, 1432(13):84-94.
[28] Krawczyk D C, McClelland M M, Donovan C M, et al. An fMRI investigation of cognitive stages in reasoning by analogy[J]. Brain Research, 2010, 1342(25):63-73.
[29] Möller R, Schenck W. Bootstrapping cognition from behavior—a computerized thought experiment[J]. Cognitive Science, 2008, 32(3):504-542.
[30] Baddeley A.The episodic buffer:A new component of working memory?[J]. Trends in Cognitive Sciences, 2000, 4(11):417-423.
[31] Newport E L, Hauser M D, Spaepen G, et al. Learning at a distance II Statistical learning of non-adjacent dependencies in a non-human primate[J]. Cognitive Psychology, 2004, 49(2):85-117.
[32] Feist M I. Space between languages[J]. Cognitive Science, 2008, 32(7):1177-1199.
[33] Espinilla M, Liu Jun, Martínez L. An extended hierarchical linguistic model for decision-making problems[J]. Computational Intelligence, 2011, 27(3):489-512.
[34] Ye Ning, Sun Yu-ge, Wang Xu, et al. Recognition based on common spatial patterns and ANN for brain-computer interface signal[J]. Journal of Northeastern University(Nature Science), 2010, 31(1):12-15. (in Chinese)
[35] Angelika L,Benno G,Alfonso C.Asymmetric fMRI adaptation reveals no evidence for mirror neurons in humans[J]. Proceedings of the National Academy of Sciences of the United States of America, 2009, 106(24):9925-9930.
[36] Zhi Lian-he, Li Yu-xiao, Zhao Shu-jun, et al. Feature extraction of fMRI data based on discrete wavelet transform[J]. Chinese Journal of Medical Imaging Technology, 2010, 26(6):1151-1154. (in Chinese)
[37] Anderson J R, Carter C S, Fincham J M, et al. Using fMRI to test models of complex cognition[J]. Cognitive Science, 2008,32(8):1323-1348.
[38] Davis D N. Cognitive architectures for affect and motivation[J]. Cognitive Computation, 2010, 2(3):199-216.
[39] van Atteveldt N, Roebroeck A, Goebel R, et al. Interaction of speech and script in human auditory cortex:Insights from neuro-imaging and effective connectivity[J]. Hearing Research,2009,258(1-2):152-164.
[40] Furdea A, Halder S, Krusienski D J, et al. An auditory oddball (P300) spelling system for brain-computer interfaces[J]. Psychophysiology, 2009, 46(3):617-625.
[41] Ulrich A, Markus K, Shah K, et al. Testing the theory of embodied cognition with subliminal words[J]. Cognition, 2010, 116(3):303-320.
[42] Li Xiao-yong,Gui Xiao-lin.Cognitive model of dynamic trust forecasting[J]. Journal of Software, 2010, 21(1):163-176. (in Chinese)
[43] Luo Xiang-yu, Su Kai-le, Gu Ming. A model checking approach for solving epistemic riddles[J]. Chinese Journal of Computers, 2010, 33(3):406-414. (in Chinese)
[44] Cai Lin-qin, Mei Tao, Sun Yi-ning, et al. Research on behavior and cognition models of virtual human for decision training[J]. Journal of System Simulation, 2008, 20(2):368-371. (in Chinese)
附中文参考文献:
[8] 冯康,姚南生. 基于一元事件的认知模型[J]. 模式识别与人工智能,2012, 25(1):172-180.
[34] 叶柠,孙宇舸,王旭,等.基于共空间模式和神经元网络的脑-机接口信号的识别[J].东北大学学报(自然科学版),2010,31(1):12-15.
[36] 支联合,李玉晓,赵书俊,等.基于离散小波变换的fMRI数据特征提取[J]. 中国医学影像技术, 2010, 26(6):1151-1154.
[42] 李小勇,桂小林.动态信任预测的认知模型[J]. 软件学报, 2010, 21(1):163-176.
[43] 骆翔宇,苏开乐,顾明.一种求解认知难题的模型检测方法[J].计算机学报,2010, 33(3):406-414.
[44] 蔡林沁,梅涛,孙怡宁,等.用于决策训练的虚拟人行为认知模型研究[J].系统仿真学报,2008, 20(2):368-371.
FENGKang,born in 1968,associate professor,his research interests include cognitive science, and model checking.
Developmentandresearchdirectionsofcognitivescience
FENG Kang
(Department of Computer and Information Engineering,Huainan Normal University,Huainan 232038,China)
To study the origin, development,subject structure and research direction of cognitive science,the definition of cognition based on process is proposed,and the origin of cognitive science is discussed.The development of cognitive science is divided into computation theory stage,symbols processing theory stage and multi-theory stage,then the subject structure and research direction of cognitive science are introduced,the main research directions of cognitive science include cognitive model,storage model of the brain and cognitive computation.The definition of cognition based on process is able to embody the essence of cognition.Therefore,the cognitive model based on single unit event is able to simulate the cognition,and it is an optimal cognitive model.
cognitive science;cognitive model;storage model of the brain;cognitive computation
1007-130X(2014)05-0906-11
2012-11-26;
:2013-04-03
安徽省高等学校省级自然科学研究项目(KJ2012Z374);国家自然科学基金资助项目(61170060);安徽省自然科学基金资助项目(11040606M135);淮南市科技计划项目(2012A01007)
TP181
:A
10.3969/j.issn.1007-130X.2014.05.021
冯康(1968-),男,安徽淮南人,副教授,研究方向为认知科学和模型检测。E-mail:fenglikanglcq@163.com
通信地址:232038安徽省淮南市淮南师范学院计算机与信息工程系
Address:Department of Computer and Information Engineering,Huainan Normal University,Huainan 232038,Anhui,P.R.China