工作记忆与二语阅读理解关系的多维度考察*
2022-11-01宁波大学
宁波大学
苗丽霞
1. 研究背景
工作记忆指个体在执行认知任务过程中,对信息同时进行存储与加工的一个容量有限的记忆系统,在言语理解等复杂认知活动中具有重要作用(Baddeley,2000)。工作记忆是影响二语阅读理解的重要因素之一(Jeon & Yamashita, 2014; Shin, 2020)。然而,工作记忆与二语阅读理解的关联机制尚需进一步探究。其一,工作记忆的构成成分在二语阅读理解过程中的作用尚需厘清,已有研究结论不一。比如: Alptekin & Erçetin (2010)的研究表明: 只有工作记忆的加工成分与阅读理解显著相关,其存储成分与阅读理解不相关。而孙聪颖等(2012)的研究则发现: 工作记忆的加工和存储成分均对阅读理解能力具有显著的预测力。其二,阅读理解层次对工作记忆作用的影响也有待深入探讨。认知心理学研究表明,阅读理解包含多个层次(比如: 字面理解、推断性理解和评价性理解),不同层次的阅读理解任务在认知过程和认知负荷等方面均存在较大差异(Basaraba et al., 2013; Kintsch, 1998)。前期研究多将阅读理解表征为一个整体构念,未对其层级性本质予以考虑。就研究者视野所及,仅有土耳其学者Alptekin & Erçetin(2009,2010,2011)对该问题进行了探究。Alptekin & Erçetin以土耳其二语英语学习者为受试的研究揭示了阅读理解层次的协变作用。其研究表明: 工作记忆与推断性理解具有正向相关关系,但与字面理解不相关。然而,鉴于其研究受试的单一性,有必要对其研究结果的普适性进行验证。再者,已有研究对工作记忆与二语知识的交互性关注不足,多聚焦于其单独作用。语言知识是长时记忆的重要部分,长时记忆是工作记忆加工内容的主要来源之一(温植胜、易保树,2015)。语言理解过程中,信息首先由感觉记忆编码,然后经过工作记忆的暂时性存储及加工,与长时记忆中的知识建立联结,从而进行命题的建构与整合,以形成连贯的心理表征(鲁忠义,2000)。一语相关研究(Chrysochoou et al., 2011; Dixon et al., 1988; Peng et al., 2018)揭示了词汇知识在工作记忆与阅读理解关系中的调节作用。在二语阅读研究领域,相关研究仅有一项(Joh & Plakans, 2017)。该研究以韩国英语二语学习者为受试,考察二语知识对二语阅读理解过程中工作记忆作用的影响,研究结果揭示了二语知识的调节作用。
基于上述文献回顾,本研究以中国成人英语学习者为受试,考察工作记忆在二语阅读理解中的作用及其与二语词汇知识之间的交互关系,以更好理解二语阅读理解中记忆成分的作用机制,为二语阅读教学提供启示。拟回答具体问题如下: 1) 工作记忆的加工和存储成分是否都与二语阅读理解具有相关关系?2) 工作记忆与二语阅读理解的关系是否会因阅读理解的层次而异?3) 二语词汇知识如何影响工作记忆与二语阅读理解的关系?
2. 研究设计
2.1 受试
研究受试为南方某大学67名二年级英语专业学生,女生60名,男生7名,平均年龄19.87(=0.76)。受试接受英语教育的平均年限为9.66(=0.95)年,多数从三年级开始接受学校英语教育(n=59),少数始于六年级或七年级。
2.2 研究工具
研究共采用了4项工具,分别测量工作记忆、二语词汇知识和阅读理解,二语词汇知识采用了2项工具,分别测量二语词汇宽度和二语词汇深度。
工作记忆采用英语阅读广度任务,用E-prime1.1编程。测试材料为42个英语句子,选自Harrington & Sawyer(1992),每句包含11—13个单词,其中21句为正确句,另外21句是语法错误句。测试包括4个序列,每个序列3次尝试,长度从2至5,共12组,随机呈现。施测时,受试需要按键对每句的语法正确性做出快速判断,并同时记住其句末词,一组句子(一次尝试)呈现完毕后,受试需要按顺序回忆并记录下该组句子的句末词。正式测试前,使用长度2和3的练习序列让受试熟悉测试程序。工作记忆的存储容量为受试回忆正确的句末词数目,加工容量为判断正确的句子数目,存储和加工的满分皆为42分。工作记忆容量以加工容量和存储容量的均值为指标。加工和存储测量的信度系数(Cronbach’s Alpha)分别为.608和.760。
二语词汇宽度选用词汇量测试(Nation & Beglar,2007)。其原始版本包含140个测试项目,测试第1到第14个1 000高频词的接受性知识,每个词频等级随机抽取10个词。测试总体的词频表基于英语国家语料库(BNC)编制。本研究基于先导测试结果选用前100个测试项目,即仅测试第1—10个1 000常用词。测试形式为多项选择题,题干是一个非限定性简短语句。考虑到受试的二语水平以及英文选项阅读可能对测试造成的干扰,研究选用了该测试的双语版,题干为英文,选项为中文,中文是对原版英文选项的汉语翻译。评分时,每题1分,满分100分。该测试的信度系数为.826。
二语词汇深度采用词汇联想测试(Read,1998),使用时略作修订,替换了原测试卷中部分词频较低的测试词,代之以其它高频词,替换词都选自Qian(1998)。该测试测量语义和搭配知识,共包含40个目标词,每个词8个选项,4个联想词,4个干扰项。选项被分为两组,每组4个词,一组包含语义联想词,另一组包含搭配联想词。每个测试词有4个正确选项,选对一个得1分,选错答案,不扣分。测试卷的满分为160分,信度系数是.803。
阅读理解测试采用标准化的多项选择题型,共包含8篇文章,40个问题,每篇文章4—6个问题。文章均选自国内标准化英语测试真题,其中4篇选自大学英语六级考试,2篇选自非英语专业研究生入学考试,另外2篇选自英语专业四级考试。阅读篇章的平均长度为431个单词 (=71)。评分时,每个问题1分,满分40分。所有问题皆由两名长期从事阅读教学的英语教师对其进行分类,将其分别归属为字面或推断性阅读理解题。分类结果为24个字面理解题,16个推断性理解题。两名教师的分类相关值为0.925,二者分歧部分由研究者参与讨论并最后审定其归属类别。该测试卷的信度系数为.535。
2.3 数据收集与分析
二语词汇知识和阅读理解采用纸笔测试,以班级为单位分三次进行。前两次测试阅读理解,每次4篇文章,用时60分钟。第三次测试词汇知识,测试顺序为先宽度后深度,用时共计60分钟。工作记忆在计算机实验室完成,每个受试单独进行测试,用时20分钟。研究者对有效试卷进行了评阅,并将数据输入电脑,采用SPSS18.0统计软件对数据进行分析,分别采用了描述性统计、Pearson相关分析、独立样本检验和逐步法(Baron & Kenny,1986)等统计分析方法。相关和回归分析中均采用了各个变量原始数据的标准分。统计的显著水平定为.05。
3. 结果与讨论
3.1 所有变量的总体情况描述
表1列出了所有变量的平均数、标准差及相关矩阵。相关分析表明,工作记忆及其加工成分与阅读理解和推断性理解相关,但与字面理解不相关,存储成分与三个阅读理解变量均不相关;两个词汇知识变量与三个阅读理解变量都相关;词汇宽度与工作记忆及其加工成分相关,但与存储成分不相关,词汇深度与工作记忆的三个变量均不相关;工作记忆的加工和存储成分不相关;字面和推断性理解相关。
表1. 所有变量的平均数(M)、标准差(SD)及相关分析(r)
3.2 加工和存储成分与阅读理解
如表1所示,阅读理解与加工成分相关,但与存储成分不相关。该结果与Alptekin & Erçetin(2010)等学者的发现相符,支持加工重叠理论(the processing overlap theory)(Friedman & Miyake, 2004)。该理论主张,工作记忆与阅读理解的关联主要归因于加工成分,因为工作记忆的加工成分与阅读理解的加工过程共享相似的心理操作过程。正如Koda(2005)所言,工作记忆的加工能力和阅读理解能力调用的是相同的认知能力。
但阅读理解与存储成分不相关的发现与孙聪颖等(2012)和Alptekin et al.(2014)的结果有分歧。孙聪颖等发现,加工和存储成分都与阅读理解显著相关。其研究采用“视空间和言语交替”任务范式分离测量言语工作记忆的加工和存储成分。本研究和Alptekin & Erçetin等学者(Alptekin & Erçetin,2010;Alptekin et al., 2014)都采用阅读广度任务测量加工和存储资源。其中,采用句法加工任务的实验均发现存储成分与阅读理解不相关,而采用语义加工任务的实验则发现二者显著相关。
研究结果上的差异,可能源于工作记忆测量范式。孙聪颖等的测量范式包含言语和空间两种信息类型。信息类型属于领域特异性成分,对工作记忆资源的评估具有较强的影响(蔡任栋、董燕萍,2012)。前期研究也显示,加工和存储信息分别属于不同的领域,会降低彼此之间可能产生的干扰(Maehara & Saito, 2007)。孙聪颖等的测量范式可能更好地分离了言语工作记忆的存储成分。
此外,由加工任务类型所引发的差异,可以在“任务转换说”(Task-switching account)(Towse & Hitch, 1995)的理论框架内得到解释。根据该假说,加工和存储成分虽然相对独立于彼此,但加工任务的认知负荷和加工时间都会对个体在存储任务上的表现产生影响(Barrouillet & Camos, 2001)。上述由加工任务类型所引发的差异可能就是源于认知负荷。句法加工任务的认知负荷高于语义加工任务,因而对个体在存储任务上的表现产生了更大的影响。对于两类加工任务在认知负荷上的评估主要是基于DP(Declarative/Procedural)语言习得模型(Ullman,2004)。根据该模型,语言习得和加工依赖两套分离的记忆系统,即陈述性和程序性记忆系统,前者负责词汇语义等显性知识的习得和贮存,后者负责形态句法等隐性的、规则性知识的学习和存储。二语学习者与一语使用者在两套记忆系统的使用上存在显性差异。就句法加工而言,一语使用者主要依赖其形态句法知识进行加工,且在必要时能够调用其词汇语义知识。二语学习者则由于其在形态句法知识表征上的局限性主要依赖词汇语义等陈述性记忆资源进行句法加工。这就意味着二语学习者在进行句法加工时需要消耗更多的认知资源。
3.3 工作记忆与字面和推断性理解
表1数据显示: 工作记忆与推断性理解(=.306)相关,但与字面理解不相关。该结果与土耳其学者Alptekin & Erçetin(2009,2010,2011)的发现相符,说明不同层次的阅读理解任务对工作记忆资源的依赖程度有异,且这种差异性可能普适于不同一语背景的二语学习者,不论其一语是字母语言还是形意字语言。为了探究这种差异背后的原因,研究者对受试的字面和推断性理解成绩进行了配对样本检验,以考察其在内部复杂性上的异同。由于阅读理解测试中字面和推断性理解的题目数和总分不同,研究者在进行配对样本检验之前先将两项测试的原始分数转化为百分制分数,检验结果见表2。
表2. 字面和推断理解的t检验结果
表1和表2中的数据较为清晰地揭示了字面和推断性理解的关系。表1数据显示,字面和推断性理解中等程度相关(=.342),说明二者在构念上部分重叠,但二者的低相关系数也揭示出其异质性。表2数据验证了这种差异性的存在,受试在两个阅读理解层次上的成绩存在显著差异,字面理解成绩明显好于推断性理解成绩,说明后者的难度高于前者。从认知负荷理论的视域解读,二者在难度系数上的差异可能源于其内在复杂性,推断性理解的内在复杂性程度更高,因而对工作记忆资源造成了更大的认知负荷(Sweller,1994)。那么字面和推断性理解在内在复杂性上究竟有何差别?字面理解评估学习者从文本中直接获取意义的能力(Basaraba et al.,2013),主要涉及对篇章显性信息的提取和整合。推断性理解测量学习者获取文本中隐性信息的能力,其目标是建构篇章的情境模型,即篇章信息在读者大脑中连贯的心理表征,这就意味着读者不仅需要把分散于篇章不同部分的局部信息进行综合归纳,以对篇章的整体意义实现连贯表征,还需要在必要时激活长时记忆中存储的相关背景知识,并将其与语篇信息进行整合,以实现对篇章信息的连贯性解读(Kintsch,1998;鲁忠义,1999)。很显然,推断性理解所包含的认知过程更为复杂。
3.4 词汇知识、工作记忆与阅读理解
为考察词汇知识与工作记忆在二语阅读理解中可能具有的交互关系,研究者以阅读理解为因变量,以词汇宽度为中介变量,以工作记忆为自变量,采用逐步法检验了词汇宽度的中介作用。逐步法采用逐步检验回归系数的方法,检验自变量对因变量的中介效应或间接效应(温忠麟、叶宝娟,2014)。逐步法中介效应检验中,第一步检验(即自变量对因变量回归总效应的检验)的必要性受到一些统计学家的质疑(MacKinnon & Fairchild,2009),因而本研究也未将其作为中介效应的必要条件予以考虑。检验结果见表3。
表3. 逐步法分析结果
表3数据显示,以工作记忆为自变量,词汇宽度为中介变量,阅读理解为因变量的中介效应分析显示: 第二、三步效应显著,各自的回归系数均达到显著水平,说明工作记忆通过词汇宽度对阅读理解的中介效应显著,然而第四步的回归系数未达到显著水平,说明该中介效应为完全中介,即词汇宽度完全中介了工作记忆对阅读理解的影响。
为进一步解读词汇宽度的中介作用,研究者依据受试的词汇宽度知识得分,将受试分为两组,得分高于平均分的受试归为高词汇宽度组,得分低于平均分的受试归于低词汇宽度组。独立样本检验结果显示组间差异显著(=9.812,=.000),说明高低组在词汇宽度水平上存在显性差异。研究者然后分别计算两个组别内工作记忆与阅读理解的相关关系,结果见表4。
表4. 高低词汇宽度知识组内工作记忆与阅读理解的相关系数
表4数据显示,就总样本而言,工作记忆和阅读理解显著相关,表明它们具有正向相关关系,即工作记忆容量的增大意味着阅读理解成绩的提高;然而分组后工作记忆和阅读理解的关系在两个组别内都发生了显性变化,高词汇宽度组内二者不再相关,低词汇宽度组内二者的相关关系则呈现增强的态势,说明工作记忆与阅读理解的关系因学习者的词汇宽度知识水平而异。综合表3和表4数据,词汇宽度知识在工作记忆和阅读理解的关系中起着中介作用,学习者对工作记忆的依赖程度因其词汇宽度知识水平而异,低词汇宽度知识水平的学习者在阅读理解过程中对工作记忆资源有较高程度的依赖性,而高词汇宽度知识水平的学习者对工作记忆资源的依赖程度较低。换言之,随着词汇宽度知识水平的提高,学习者在阅读理解过程中对工作记忆资源的依赖性逐步减弱。
该结果支持一语研究的相关发现(Chrysochoou et al., 2011; Dixon et al., 1988; Peng et al., 2018)。上述研究关于词汇知识中介作用的发现验证了认知心理学界的“知识就是力量”假说(Hamrick & Engle, 2001),该假说旨在阐析认知活动的作用机制,强调长时记忆中专业领域知识在认知活动中的重要作用,认为工作记忆等认知能力在认知活动中的作用弱于专业领域知识。关于专业领域知识和工作记忆在认知活动中的关系,该假说的补偿观认为专业领域知识会减弱甚至消除工作记忆在认知活动中的影响。本研究的发现也符合认知负荷理论的主张(Sweller,1994),即长时记忆中存储的相关知识可以减弱阅读理解等认知活动对工作记忆资源的依赖,从而减轻工作记忆的认知负荷。换言之,阅读理解对工作记忆的依赖可能被长时记忆中所贮存的相关知识所中介或者削弱,比如在本研究中工作记忆对阅读理解的作用就被词汇宽度知识所中介。
本研究结果与Joh & Planks(2017)的研究发现有些分歧。虽然两项研究均揭示了二语知识在工作记忆与二语阅读理解关系中的调节作用,但在Joh & Planks(2017)的研究中,工作记忆对二语阅读理解的贡献仅限于二语知识水平高的学习者,与低水平学习者的二语阅读理解不相关。研究结果上的差异可能与研究设计有关。两项研究虽然都聚焦于长时记忆中的专业领域知识,但在领域知识的表征和测量方面存在差异。Joh & Planks考察的内容是二语知识,其测量涵盖了句法和词汇两种语言知识类型,本研究直接测量了学习者的二语词汇知识。这些研究设计上的差异可能在一定程度上造成了研究结果上的分歧。
本研究也发现了一个有趣的现象,即词汇深度与工作记忆不相关(见表1)。该结果可能源于词汇深度知识的测量工具。研究采用的是词汇联想测试,其目标词皆选自2 000—3 000英语高频词(Qian,1999)。根据频率效应假说(Ellis,2002),学习者对高频词的语义提取速度快于低频词。由于接触频率高、使用经验丰富,高频词在学习者的心理词库中形成高质量的词汇知识表征,因而提取效率较高,且不会对工作记忆造成认知负荷(Perfetti,2007)。为了验证这种推测,研究者选取了词汇宽度知识测试中受试第1—3个1 000高频词的测试得分,以评估其高频词汇宽度知识,并对其与工作记忆的关系进行了相关分析,结果显示: 受试的高频词汇宽度知识与工作记忆也不相关(=.161,=.193),说明学习者对高频词的提取已经达到较高程度的自动化水平,因而不会消耗较多工作记忆资源。
4. 结语
本研究结果表明: 1)工作记忆的不同成分在二语阅读理解过程中的作用不同,只有加工成分与二语阅读理解具有正向相关关系,存储成分与二语阅读理解不相关;2)工作记忆对二语阅读理解的影响因阅读理解层次而异,仅有推断性理解层次对工作记忆资源具有显性依赖,字面理解与工作记忆不相关;3)二语词汇宽度知识与工作记忆在二语阅读理解过程中具有交互作用,二语词汇宽度水平低的学习者对工作记忆资源的依赖性更强。
研究结果为深入解读二语阅读理解中记忆成分的作用机制提供了实证支持,也对二语阅读教学具有一定的指导意义。首先,教师在选择阅读文本时,应协同文本的语言难度和学习者的二语水平。研究表明,当阅读文本中生词的覆盖率超过5%时,学习者对文本的阅读理解水平会明显下降(Laufer,1989)。对阅读文本中生词比率的控制,有助于降低学习者的认知负荷,提高其学习效率。其次,教师在帮助学习者扩大词汇量的同时,还应注意拓展其词汇知识深度。高质量的词汇知识表征是快速提取词汇的先决条件,也是学习者进行流畅阅读的必要保障(Perfetti,2007)。