工作记忆和一般智力关系的研究现状与前瞻
2009-04-29党彩萍刘昌
党彩萍 刘 昌
摘要工作记忆和它的两个子系统——短时记忆和中央执行系统分别与一般智力的关系,在现有研究中争议之处主要表现在前三者与一般智力联系密切还是相关较低。工作记忆和一般智力是两个独立的结构,但二者联系密切,前者能有效预测后者。工作记忆和一般智力联系密切的原因主要在于:前额叶皮层是二者共有的生理机制,控制性注意和复杂策略的运用是二者共有的心理机制,而测试材料内容上的重叠和对潜变量的复合预测又可能夸大这种关系。
关键词工作记忆;一般智力;短时记忆;中央执行系统;控制性注意
分类号B842
探讨工作记忆和智力的关系,对了解智力和其他认知能力具有重要的理论价值(Engle&Kane,2004;Conway,Kane,&Engle,2003;Kane&Engle,2002)。而工作记忆和一般智力或一般流体智力的关系,更详细地说,工作记忆和Raven推理测试或Cattle文化公平测试的关系,一直存在诸多争议。许多研究揭示工作记忆是一般智力的重要预测因子,那么是工作记忆中的什么成分引起了二者的密切联系?本文从工作记忆的两个子成分——短时记忆和中央执行系统、以及工作记忆整体这三者分别与一般智力的关系以及原因分析四个方面来探讨该问题。
1短时记忆与一般智力的关系研究
短时记忆是工作记忆的一个子成分,是一个纯粹的信息储存成分,储存的同时没有加工。简单的广度任务是测量短时记忆的“黄金标准”(Cowan,Elliott,Saults,et al,2005)。
短时记忆和一般智力的联系,可以追溯到短时记忆在经典智力测试中的运用。第一个综合性智力测试Binet-Simon智力测试、Weehsler智力量表从第一版到第三版、以及Woodcock-JohnsonⅢ中的认知测试,都含短时记忆广度的子测试,且这些测验的结构效度也一直比较好。总之,近100年来短时记忆一直是智力评估和智力理论中不可或缺的一部分。记忆的信息加工理论修订后,虽然记忆研究的重点由早期的短时记忆转换到工作记忆上了,但短时记忆和一般智力的关系研究依然进行着,且结论大致表现为以下三种:
第一种:短时记忆与一般智力联系紧密。大部分现代智力理论家主张:Spearman的一般智力是各项认知能力测试中共有的一种抽象能力,是心理能量的普遍基础("general fund of mental energy”)(Spearman,1914),这间接暗示了短时记忆和一般智力的联系。且很多研究显示二者相关显著,如有研究发现:简单的记忆广度任务在一般智力上的平均负荷是0.38(Carroll,1993)。工作记忆子成分(特别是存储和协调功能)在推理中能够解释95%的变异(Buehner,Krumm,&Pick,2005),其中的储存成分体现了短时记忆对一般智力的预测效应。同时考察工作记忆、短时记忆和一般智力的关系,结果虽然工作记忆对一般智力的预测效应大于短时记忆,但是当工作记忆中储存成分的影响被控制后,工作记忆对一般智力的这种独特的预测作用就变得非常小(Colom,Flores-Mendoza,et al,,2005),由此表明工作记忆和一般智力的高相关主要是由工作记忆中的储存成分—短时记忆引起的。
第二种:短时记忆和工作记忆分别与一般智力的相关非常接近。有研究综合了1976~1989年期间发表的探讨顺序记忆与一般智力关系的大部分文章,并以此为基础对工作记忆和短时记忆任务作区分,最后发现短时记忆与一般智力的相关是0.26,而工作记忆与一般智力的相关是0.28(Mukamda&Hall,1992)。这些结论也间接地肯定了短时记忆对一般智力的预测性。但是,短时记忆和工作记忆分别与一般智力的相关非常接近,原因也可能在于工作记忆和短时记忆的测试材料存在一定程度的重叠。
第三种:短时记忆与一般智力的联系并不紧密。比如,短时记忆并没有直接进入Spearman的智力理论中,Spearman也直接指出:把记忆作为一般智力的一个因素,证据并不充分(Spearman&Jones,1950)。而且其他研究也多次证明二者联系微弱。同时评估工作记忆和短时记忆与_般智力的关系,有的发现,工作记忆与一般流体智力之间存在非常强的关系,而短时记忆虽然与工作记忆相关很高,但不是一般流体智力的预测因子(Conway,Cowan,Bunting,etal,2002)。也有的研究结果是:工作记忆和一般流体智力的相关既大又显著,而短时记忆和它的相关几乎可以忽略不计(Engle,Tuholski,Laughlin,&Conway,1999)。还有人提出:“很多调查表明,短时记忆广度和智力存在明显的相关。但是本研究却显示二者的关系并不稳定,无法相互预测”(Blankenship,1938)。也有分析显示:总体相关系数方面,短时记忆和一般智力的显著低于工作记忆和一般智力的(Ackerman,Beier,&Boyle,2005)。可见,这类研究都主张纯粹的记忆过程本身并不能有效解释高级认知能力的变异。
出现以上不同观点的原因,主要在于不同研究使用的测量材料和从工作记忆中提取储存成分的统计手段不尽相同。但多数研究支持了第三种观点,认为二者相关不大。主要原因在于,短时记忆任务的完成,一般只需要简单的自动化操作(如复述和组块),而这些对于完成一般智力的测试材料来说远远不够,后者还需要比前者更复杂的策略。
2中央执行系统与一般智力的关系研究
许多研究显示,工作记忆,尤其是它的中央执行系统,与流体智力关系密切(Engle,et al,,1999;Conway,et al,,2002;Kane,et al,,2005)。那么,中央执行系统中的什么成分在起作用?多数研究提到更新和控制性注意。首先,工作记忆更新这个概念经常出现在最近的文献中(如Friedman,et al,,2006),它是工作记忆的一个执行成分,主要功能是监控输入的信息,并用与当前任务联系较大的新信息来替换与当前任务联系不大的旧信息,以修改工作记忆的内容,(Morris&Jones,1990)。并有研究显示,工作记忆更新并非是消极地维持记忆负荷,而是工作记忆中实时加工的动态活动(Morris&Jones,1990)。工作记忆更新常用的测量方法是动态记忆范式(running memory rusk),即被试先看一些字母或数字串,且并不知道那些项目串的长度,然后按顺序回忆一个指定长度的项目串。
有研究调查工作记忆更新、加工速度在流体智力年龄变化中的作用,结构方程模型分析显示:工作记忆更新(非加工速度)几乎调节所有年龄变化引起的流体智力变化,它是年龄和流体智力变化的
中介(Chert&Li,2007)。可见,更新部分解释了工作记忆和一般智力的密切联系。
其次,工作记忆等于短时记忆加控制性注意(Engle,Tuholski,Laughlin,&Conway,1999;Kane&Engle,2003),可见中央执行系统的功能主要由控制性注意来完成,该成分也类同于Norman和Shallice提出的注意监控系统(SAS)。控制性注意主要用于在信息加工或目标转换过程中激活信息,并解决任务目标、外部刺激以及习惯化反应图式之间的冲突,即激活与目标有关的信息,并抑制与目标无关的信息。那么,这个普遍的控制性注意是否是工作记忆对一般智力的预报效应的决定因素?
智力结构中可能存在一个对信息加工过程进行监控的认知成分,比如Kirby和Das在智力PASS模型中假设了一个计划系统,Steinberg在智力成分理论中提出了元成分,这些因素的功能均类同于控制性注意。注意的资源分配理论,主张注意分配和控制着加工资源,也是控制性注意发挥的功能。而智力就是必须在特定时间内把加工资源分配到特定任务上而忽略无关的新异刺激的能力。
许多研究应用传统的注意测量任务来预测智力。有研究对已有研究结果做了一项矩阵分析表明,注意分数和智力分数存在显著相关(Sehmidt-Atzert&BOhner,2000)。还有研究发现,被试执行双任务的分散注意(即注意的不稳定)成绩与他们的一般智力有显著相关(Ben-Shaldaar&Sheffe~2001)。也有人直接研究注意和一般智力的关系,结果二者相关较高(Schweizer,2004)。调查不同类型的注意和智力的结构,发现所有类型的注意都和一般智力在潜变量水平上相关较高(Sehweizer&Moosbrugger,2005)。可见,这些结论都间接支持了控制性注意对一般智力的预测性。而且,工作记忆容量和流体智力的联系主要表现为二者都需要控制性注意(Engle,et al,1999;Friedman,et all,2006)。
更有甚者,有人将控制性注意与工作记忆等同起来再探讨它与一般智力的关系,得出结论有:“我们的结果也支持了大量文献主张的工作记忆等同于控制性注意”(Bleeldey,Durso,et a1,2003)。Kane等进一步假设,工作记忆与控制性注意同功同构,因为控制性注意是中央执行系统的重要功能之一,中央执行系统又是工作记忆的主要成分(Kane,Blecldey,Conway,&Engle,2001)。另外,工作记忆潜变量剔除掉储存因子后,剩下的变量主要是中央执行系统,那么工作记忆和一般智力产生的影响主要源于中央执行系统,即控制性注意(Engle,Tuholski,Laughlin,&Conway,1999)。由此,控制性注意和一般智力密切联系。
但是仍有大量文献并没有证明:控制性注意任务上的个体差异可以彻底解释或者解释大部分工作记忆的个体差异。因此,控制性注意也只能解释工作记忆和一般智力联系密切的部分原因。
3工作记忆整体与一般智力的关系研究
工作记忆与一般智力的关系比以往研究者提到的还要复杂,因为每提出一种观点总会遭到批评。那么,过去十几年里,有争议的研究结论主要体现在以下几方面:
第一,工作记忆与一般智力密切相关。这类主张最早开始于工作记忆的一些测量任务和理解能力存在的相关(Daneman&Carpenter,1980)。另外,推理一直被认为是一般智力的核心成分,所以工作记忆和一般智力的关系也可以追溯到它和推理的相关研究上。早期发现二者存在中等程度相关(Larson&Saccuzzo,1989)。之后发现,潜在的工作记忆因子和潜在的推理因子之间相关很高(0.80~0.90),于是产生了一个影响较大的推断:“推理能力和工作记忆容量没有差别?!”(Kyllonen&Christal,1990)。不过这个论断后面加的是叹号和问号,表明其有待商榷。
Kyllonen和Chrisml宣言后的10多年来,关于一般智力和工作记忆相关密切的结论也越来越多。比如:工作记忆可以非常显著地预测一般智力(Karl&Helfried,2004),一般智力在工作记忆上的负荷平均为0.96,表明一般智力也可以反过来非常好地预测工作记忆(Coloma,Rebolloa,et al.2004)。总之,大多数研究(Ackerman,Beier,&Boyle,2002;Kane,et al,,2004;Hambrick,2003;Su"B,et al,2002)使用验证性因素分析或结构方程模型对年轻被试研究工作记忆和一般智力的关系,二者路径系数的估计值一般在0.60~0.80,二者共享变异(即测定系数,相关系数的平方)大约在35%~65%。
关于工作记忆在认知能力发展以及一般智力发展中的作用,有研究也支持了二者有密切联系这~观点。工作记忆在认知老年化过程中的重要作用量达到76%(李德明,刘昌,陈天勇等,2003)。工作记忆能够解释儿童流体智力发展变化的85.4%(Liu Chang,2004)。
第二,工作记忆与一般智力(或一般流体智力)是同一个结构。如验证性因素分析发现,分别代表工作记忆和一般智力的两个因素相关达到了0.994,几乎测量的是同一个结构(Stauffer,Ree,&Caretta,1996)。也有人总结到:“简言之,工作记忆容量的测量,要求呈现了大量不同的刺激类型,要求大量不同的加工技巧,这些言语、数学以及空间能力都与流体智力相关很强”,“各种工作记忆容量的测量任务和各种高级能力的测量任务之间的相关太强了,使我们无法否认二者共有的一般机制”(Kane.Engle,2002)。Engle等最初理论推测,工作记忆和一般智力的“同功同构”关系可能只发生在潜变量水平上(Engle,Tuholski,Laughlin,&Conway,1999),后来提出一种更极端的假设:工作记忆和一般流体智力或一般智力是一个整体,二者的相关系数是1.0,几乎是一种“同功同构”的联接(Engle,2002)。
第三,否认工作记忆与一般智力的“同功同构”关系,强调二者是两个独立的结构。许多心理学家表达了对工作记忆和一般智力“同功同构”这一观点的怀疑(Deary,2000)。Conway等对多项能力的结构方程模型分析显示,工作记忆指向一般智力的路径系数达到了0.98,控制了短时记忆的影响后是0.60,并进一步推断:工作记忆容量并非是Spearman的一般智力,而是它的决定因素(Conway,Cowan,Bunting,et al,2002)。后来又提出:“几个潜变量研究表明,工作记忆容量至少可以解释一般智力变
异的三分之一甚至二分之一,”“回顾当前的研究可以看到,工作记忆容量和一般智力确实相关很高,但二者并非同一个结构”(Conway,Kane,&Engle,2003)。
Aekerman等分析那些同时包含工作记忆和Raven推理测试的文献后指出:大量实验表明,工作记忆和一般智力的相关并没有那么高,工作记忆容量和一般智力、或一般流体智力、或推理,都不是同一个结构(Aekerman,Beier,&Boyle,2002)。把没有速度限制的Raven测试改为20分钟内完成,结果显示它和工作记忆的相关仍然比较低,仅是0,55(Babcock,1994)。可见,工作记忆对一般智力的预测效应非常有限(Sfif,Oberauer,Wittmann。Wilhelm,&Schulzc,2002)。
有人收集了测量工作记忆与智力的86项研究,对其元分析发现,工作记忆与一般智力的真分数估计值的相关仅为0.48,二者共享变异还不到25%。于是宣称:工作记忆与一般智力(g)、一般流体智力(gf)、推理或者智力的任何其他因素,均非“同功同构”(Ackerman,Beier,&Boyle,2005)。而且,一般智力的测量往往采用非言语的数字或空间推理材料,如常用的Raven推理测试。理论上,数字,空间工作记忆和一般智力应该是相关最高的一对,但二者的相关仅是0,61(Ackerman,Beier,&Boyle。2005)。可见即使相关最高的一对数据也拒绝了这一许多研究者主张的假设,依然远远不能证明它们同功同构。
然而,也有人认为Ackerman等人2005年的研究方法上的不足低估了工作记忆和智力的关系,并对其报告的数据进行再分析,发现工作记忆与一般智力之间的相关达到0.85,共享变异大约72%。虽然最后得到较大的相关值,但这依然不能证明二者是“同功同构”(Obemuer,Sehulze,Wilhelm,&Situ。2005)。还有研究重新分析最近公开发表的10项研究,结果表明工作记忆与一般流体智力平均相关为0.72,共享变异大约50%。虽然比Ackerman等2005年得到的相关要大,但他们依然主张二者非“同功同构”(Kane,Hambfiek'&Conway,2005)。这些结果虽然有争议,但都表明了一般智力和工作记忆的相关整体上比KyllonenChristal得到的低,二者不是同一个因素。
第四,工作记忆和一般智力的关系是变化的。比如,当选用大写字母和汉语双字词为工作记忆的测量材料,最后会发现以大写字母为材料的工作记忆与一般智力相关显著,而用汉语双字词所测的工作记忆与一般智力相关不显著(王金娥,何利,张庆林,2007)。由此表明,二者的相关不能笼统的说是显著还是不显著,它与工作记忆的测试材料类型也存在关系。
综上所述,就工作记忆和一般智力的关系虽结论各异,但二者是同功同构的结论并不能得到广泛支持。有的研究者偶尔在实验中得出二者高相关,就推测工作记忆容量可以解释一般智力所有的系统变异。其实该类论断缺乏依据,不具有普遍性,理论上也没有理由假设它们是同一个结构。如果二者完全相关,这反倒是一件尴尬的事情。而且更多研究证实了它们的独立性,只能说工作记忆可以有效地预测一般智力。
4工作记忆与一般智力关系密切的原因
总体来看,最近的潜变量研究大都表明,工作记忆容量大约可以解释一般智力变异中的三分之一到二分之一。可见,大部分研究承认工作记忆和一般智力的密切联系,那么导致二者相关的原因可能在于以下几方面:
第一,工作记忆与一般智力的这种密切关系可以从脑机制方面找到支持,即许多研究(Duncan,1995;Ksnc&Engle,2002)间接支持了二者共同激活脑神经基础——前额皮层。这个区域不仅在工作记忆中保存信息,而且在智力活动中能协调各感觉区域的活动。比如一些前额叶受损的病人通常在工作记忆和智力活动中都表现出严重障碍,不能计划和组织等。另外,同时包含储存和加工的任务激活的脑区是背外侧前额皮质(dorsolateral prefi'ontalcortex,DLPFC)和前带状束(anterior eingulate,ACC)(Smith&Jonides,1999)。也有实验发现,工作记忆的中央执行系统和一般流体智力这两种认知活动状态下的大脑前额区存在部分重叠(Kane&Engle,2002),工作记忆更新与前额皮层联系密切(Collette&Van der Linden,2002)。但这些证据仅是间接的,还需考察这些脑区的活动变化是否能调节二者在行为成绩上的差异。
为了考察生理变化是否与行为成绩存在对应,有人使用fiVIRI检测了脑活动和行为成绩的关系,让被试在没有iMRI扫描的情况下进行Raven推理测验(代表一般智力的行为成绩)和有fMRI扫描的情况下操作N-back任务(代表工作记忆的脑机制),N-back任务需要被试记忆最后一个刺激,同时对n个刺激连续刷新。结果发现,推理测验的行为成绩和n-back任务激活的背外侧前额皮质和前带状束生理活动之间有显著相关(Gray,Chabris,&Btavot,2003)。该结论有力地支持了二者共享脑神经基础的观点。
第二,工作记忆和一般智力都是领域一般性的结构,其共同机制在于都需要控制性注意(Engle。Tuholski,Laughlin,&Conway,1999)。双任务范式(dual-taskmethodology)(如阅读广度、计算广度、操作广度)是工作记忆的经典测量方式,其原理是要求两个任务同时竞争同一有限的资源,使被试的注意力在储存和加工活动中来回转换。这就要求保持与目标相关的信息的激活和抑制无关信息的干扰,也就是需要控制性注意发挥核心作用。而Raven推理测验的加工过程可分为三个步骤:记忆信息、判断各单元图形的异同和利用这些信息寻找各单元图形关系的规则。对Raven推理测验做一个详细分析会发现:该任务的一个重要方面就是寻找并记住解决每个图形推理问题的规则。推理问题越难,需要寻找的规则就越多。因此,要想解决那类较难的问题,被试需要在寻找下一个规则的时候必须先发现上一个规则并记住这个规则,以此类推(Carpenter,Just,&Shell,1990)。因此,对于完成Raven~测验至关重要的一项能力同样是控制性注意,即寻找下一个新规则(加工新信息)的同时要先记住上一个旧规则(保持与目标相关的信息的激活),面对干扰信息时要过滤掉无关特征。
可见,工作记忆参与了一般智力(尤其推理)活动的三个过程,在图形推理活动中发挥了两个基本作用:保持信息和形成初步的心理表征。这些需
要控制性注意发挥功能。
第三,对复杂策略的依赖是工作记忆和一般智力联系密切的一个重要因素。工作记忆广度任务比短时记忆的测试材料复杂得多,故完成短时记忆任务必需的那些简单的信息保持和复述方法,是无法满足工作记忆活动的,它需要更复杂的策略。而Raven推理测验需要识别矩阵图形中隐含的规则,并能成功的应用这些规则。这些活动中都包含了对复杂策略的需要。可见,策略应用上的个体差异有助于解释工作记忆和一般智力的联系(Rogers,Hertzog,&Fisk,2000~Schunn&Reder,1998)。
第四,工作记忆和一般智力测试材料内容上的重叠可能膨胀了二者的相关。从理论文献中也可以看到二者测试内容存在重叠,工作记忆的测量主要用来评估控制性注意或注意容量的(Baddeley,2002;Marsh,&Hicks,1998),而一般智力的测试任务部分也代表注意容量(Lohman,1996;Messiek,1996)。有研究发现工作记忆和一般智力的相关,其测试内容重叠时显著高于二者不重叠时的相关(Shah&Miyake,1996)。但也有人对此否定:这种膨胀效应确实存在,但并不是足够大或者非常显著,比如,空间工作记忆和空间能力的相关并没有显著高于空间工作记忆和言语能力的相关(Ackerman,Beier,&Boyle,2005)。虽然Aekerman等人对文献的元分析否定了这一点,但二者测试材料内容上的重叠似乎不容置疑。
两项能力的测试任务并没有清晰地区分开,有些工作记忆的测量任务可以很好地成为一般智力的测验任务,而且缺乏合适的工作记忆任务似乎是研究二者关系的一个主要问题(Schweizer,2005)。而且,Raven推理测试反映的是运用规则和计算几何图形的能力,它和工作记忆的高相关,体现在二者都涉及这两方面的能力。那么,当两类任务激活了同~类心理活动时,用其中的一项去预测另外一项就意义不大了,这类同于同义反复的表述(Babcock,1994)。比如,工作记忆容量的测量中频繁使用计算广度,而这个任务同样可以作为数字推理的测量任务。再如,阅读广度任务要求阅读理解句子的同时再记忆词汇,这对工作记忆和~般智力的测量任务的要求都存在相似性。还有,控制性注意任务常常并不能激发注意过程,而是激发了知觉和运动过程,并没有确保让实验期望激发的目标过程处于能压倒其他心理活动的优势。可见,工作记忆和智力的测量任务之间差异越大,关于二者的研究结论才会有说服力。而且,二者在测量内容上的重叠程度一般很难估计,所以也很难准确地估计二者的精确关系。
另外,工作记忆的测量标准,一般主张双任务范式,即加工的同时包含储存。但有的研究选择的任务并不与之吻合,随机生成和数星星测试(SCT)作为测量工作记忆的指标,其结构效度值得怀疑(Oberauer,Su"B,Schue,Wilhelm,&Wittmann,2000)。可见各种研究中工作记忆的测量成分存在很大差异。
而且,工作记忆与一般智力“同功同构”关系的宣称,也可能是对一般智力的过高估计。一般智力也不能只用单一的非语言的图形推理来测试。仅仅使用一种任务来评价一般智力,只是对一般智力的一种粗略估计,并不能准确地检测出工作记忆和一般智力的关系。所以,测量一般智力的最好材料应该是形式多样的各套认知任务,应该使用形式、内容和方法各异的复合测试。
第五,潜变量分析法的不足也可能夸大二者的联系。工作记忆和一般智力的那些相关系数,大部分不是从原始数据或相关矩阵中直接得到,而是来源于结构方程模型对潜变量的复合预测,这种方法的有效性到底有多大?许多研究者已经讨论该问题,认为对潜变量的预测结果值得怀疑。因为一个潜变量存在很大程度的异质性,异质性越大,潜变量间相关就越大,由此一套较弱的指标也可在潜变量水平上存在高相关。再如观察变量的数目不相等,也容易夸大真实变异(Viswesvaran&Ones,1995;Burke&Landis,2003)。还有,结构方程模型的标准操作应该使用协方差矩阵,特定情况下才可以使用相关矩阵(Cudeck,1989)。但是许多研究的结构方程模型并没有依据该标准,这些都会影响结构方程模型复合预测的有效性。
总之,工作记忆与一般智力的关系研究已经取得了一定的进展,但仍有许多问题尚未达成一致,在实验手段和实验方法上仍存在许多待改进之处,尤其需要重新定义一些基本认知任务。而且未来的研究若能将行为研究和神经心理研究结合起来,并考察年龄变化和工作记忆测试速度在工作记忆对一般智力影响中的作用,可能会得到更有意义的结果。