学习判断改变记忆表现的元分析
2022-07-18徐杜红赖嘉钒沐守宽
徐杜红 赖嘉钒 沐守宽
(闽南师范大学教育科学学院,漳州 363000)
1 引言
学习判断是个体对自身记忆的预见性判断,它反映了个体对于新近学习的内容在未来测验中正确提取的信心(Fiacconi et al., 2020; Koriat, 1997),学习判断是元记忆监测的主要指标之一,这种监测自己学习情况的能力对学习者至关重要,因为监测的结果决定个体如何调控学习行为,比如对学习时间以及努力程度的分配(Bjork et al., 2013; Nelson, 1990)。过往针对学习判断的研究主要聚焦在学习判断的影响因素(Dunlosky & Matvey, 2001; Mueller, 2016; Yeager, 2019)、学习判断的潜在机制(Koriat, 1997; Koriat et al., 2004; Wang et al., 2020)以及学习判断准确性(Hu et al., 2016; Koriat & Bjork, 2005)。但近年,有部分研究者将研究兴趣转向学习判断反应性,并就该主题展开深入研究(Tekin & Roediger, 2020)。
学习判断反应性是指让学习者进行学习判断活动,监测学习过程可能对学习结果产生的影响,学习者在有无学习判断任务下记忆结果差异显著(Witherby & Tauber, 2017)。学习判断反应性研究最常使用的实验范式为“学习—学习判断—测验”,对学习判断的测量是基于被试的自我报告,让被试进行学习判断会促使被试更多关注自己的记忆情况,以达到实验者的预期,这个判断可能会改变被试真实的记忆表现情况,这便是产生了反应性(Lahey & Harris, 1982)。以往的研究结果发现延迟学习判断能够让被试在呈现线索的记忆条件下表现更优(Kimball & Metcalfe, 2003),产生这一现象可能的原因便是发生了学习判断的反应性,但研究者并没有因此对学习判断反应性产生兴趣,仍旧坚持假定学习判断对记忆不存在任何作用。另外,先前研究较少设置无判断的对照组检验学习判断的反应性。直至近年,学习判断的反应性才作为一个研究问题得到研究者的关注(Ariel et al., 2020; Tauber et al., 2015; Witherby & Tauber, 2017),然而不同研究间设计的异质性导致最终得到的结论并不一致,即学习判断反应性表现出现跨研究的不一致(Dougherty et al., 2018; Mitchum et al., 2016)。
1.1 学习材料类型与学习判断反应性
在学习判断反应性的实验中,虽然不同研究对于学习材料的选择不尽相同,但使用的学习材料大致可以分为两类。一类是以成对词组作为学习材料,一类以文本材料为学习材料,其中词对学习材料又可以根据关联性分为三种,一种是具有高度相关性的词对,一种是不具有相关性的词对,还有一种是两种相关度都包含的混合词对。
以往有关探究材料类型对学习判断反应性影响的研究结果并不一致,其中结果最为混淆的是以低相关词对为学习材料的相关研究。Dougherty等人(2005)使用低相关词对探讨学习判断的反应性,结果发现让学习者进行学习判断会提高个体未来记忆表现。但其在2018年的研究中同样以低相关词对作为实验材料,结果却发现让学习者进行学习判断并不会对其记忆表现产生反应性(Dougherty et al., 2018)。其他探究低相关词对学习判断反应性的研究结果也各有不同。Mitchum等人(2016)使用低相关词对为学习材料发现学习判断对于记忆表现存在负向抑制作用;但Tauber等人(2019)使用低相关词对为学习材料却发现了学习判断对记忆表现的正反应。以上研究同样使用低相关词对作为学习材料,为什么得到的结果却不一致?其中有什么变量在起调节作用?低相关词对学习材料的学习判断反应性究竟是如何?这些问题都需要进一步的解答。
1.2 学习时间与学习判断反应性
对于学习时间的操纵可以分为两类,一类是实验者规定学习时间,即固定学习步调,另一类是学习者自定学习时间,即自定学习步调。
以往研究结果发现两种不同的学习时间可能对学习判断的反应性存在调节作用。Mitchum等人(2016)的研究1与研究2均使用“高相关词对”为学习材料,并采用学习者自定学习时间的方式来探究学习判断的反应性,结果发现学习判断并不会影响个体的学习成绩表现。然而,在另一项研究中,研究者同样使用“高相关词对”作为学习材料,但使用学习者自定学习时间的方式来探究学习判断的反应性,结果却发现存在学习判断反应性(Witherby & Tauber, 2017)。两个研究同样使用“高相关词对”作为学习材料的研究,得到的学习判断反应性却各不相同,这可能是因为这两个研究设计中对于学习时间控制的差异。
综上所述,学习判断的反应性是否存在?学习判断的反应性是否会受到各种实验操纵变量的影响?现存研究的回答还存有一定的争议,需要整合已有研究讨论。
针对学习判断反应性的结果混淆,Double等人(2018)使用元分析方法探究了材料类型、学习时间以及是否进行二次学习等变量是否影响学习判断对于记忆的反应性,结果发现学习判断对于记忆并不存在反应性(Hedges’g=0.05, 95%CI=[0.03, 0.14])(Double et al., 2018),但调节效应检验发现,学习判断反应性在不同学习材料上表现不同:使用高相关词对作为学习材料时表现为学习判断的正反应性,即进行学习判断让个体记忆表现更佳(Hedges’g=0.32, 95%CI=[0.08, 0.56],p<0.01);使用低相关词对(Hedges’g=-0.01, 95%CI=[-0.16, 0.13],p=0.128)或者混合词表(高相关词对+低相关词对)作为学习材料时(Hedges’g=-0.05,95%CI =[-0.17, 0.07],p=0.424)不存在学习判断的反应性。Double等人(2018)的元分析为澄清学习判断反应性的存在与反应方向做出了巨大贡献,帮助研究者综合并梳理了学习判断反应性的效应值及对学习判断反应性产生影响的相关变量,为后续研究者深入研究提供了支撑证据。但该元分析所得到最终结果的原始效应量仅为19个,且其中一部分原始效应量的来源并不是探究学习判断的反应性这一主题的。有关学习判断反应性主题的研究在国内还比较少,王景玉对相关问题进行了文献综述(王景玉等,2019),但关于该主题的研究很少。
在Double等人(2018)文章发表后又有很多研究者就这一主题进行了一系列研究,近两年关于这一主题的研究数量有所增长且独立效应量相比2018年也有增长,因此,本研究再次针对学习判断反应性这一主题进行元分析,在探索学习判断反应性是否存在的前提下进一步探究学习材料类型、学习时间、测验类型如何调节学习判断的反应性。进一步梳理学习判断反应性的存在及其表现形式,有利于研究者清晰地认识学习判断这一广泛使用的元记忆测量方式对于记忆存在的潜在影响,以便在未来使用更合适的元记忆测量方式探究记忆和元记忆的关系。
2 研究方法
2.1 文献搜索
通过关键词: judgement(s)/judgment(s) of learning、 reactivity of judgement(s)/judgment(s) of learning、confidence judgement/judgment、metacognition judgement/judgment在Web of science、 Proquest、 谷歌学术等数据库筛选文献, 另将Double等人(2018)的元分析所使用的参考文献纳入查阅范围。 文献检索的起始时间为1997年1月, 文献检索的截止日期为2022年1月1日。
2.2 筛选标准
文献纳入标准包括:(1)所纳入研究为实验研究,对于没有数据的报告或综述文章予以筛除;(2)所纳入的研究目的均为探索学习判断对于记忆表现的影响,且每个纳入实验中包含学习判断组vs. 无学习判断组(空白对照组);(3)所有研究中被试的学习材料为词对、句子或者文本,学习任务为“请被试记忆所学内容”并且在后续实验中对于被试的学习情况进行测试;(4)所纳入的研究所测量的记忆范畴均为短时记忆范畴,即本研究所纳入的原始研究均在材料学习结束后即刻进行回忆,对于部分间隔24h或者48h再进行回忆的测验本研究予以筛除;(5)所纳入的研究必须明确报告了学习判断组与无学习判断组的测验成绩表现(回忆成绩均数、标准差或者是学习判断组与非学习判断组的t检验数值);(6)相同作者使用同一数据所做的研究只选择最早发表的一篇。纳入研究的每篇论文必须满足所有标准,否则予以筛除。
文献搜索、 纳入及排除流程如图1所示, 按照上述标准进行彻底的文献检索与筛查后,最终纳入研究的论文有11篇,均为同行评审论文,最终纳入元分析的独立效应量为55个,文献具体情况见表1。
图1 文献筛选流程
表1 纳入元分析的原始研究
(续表)
2.3 文献编码
对纳入元分析的文献进行如下编码:文献信息(作者名、 文献发表时间、 实验编号), 样本量大小, 学习材料类型(高相关词对、 低相关词对、 混合词对材料、 文本材料), 学习时间(固定步调、 自定步调),测试类型(自由回忆、 再认测验或者线索呈现的目标词回忆),每个独立样本编码一个效应值,如果一篇文献中存在多个独立样本则分别编码,但在本研究中有个别独立样本分别编码了几个效应量,这是因为该独立样本在不同实验条件下所得到的效应量不同,文献编码具体情况见表1。编码者在不同时段依据文献的纳入标准和排除标准分别进行三次编码,编码的一致性为92.4%,说明文献编码有效。
2.4 元分析过程
2.4.1 效应量计算
使用Hedges’g作为效应量指标,以避免Cohen’sd对小样本研究效应量估计偏高的问题。在分析中,我们最初编码的效应量为每个独立样本所得到的Cohens’d值,由于部分研究未直接报告Cohen’sd值,只报告了学习判断组与无学习判断组记忆成绩的均数、标准差或只报告了两组t检验的结果及其显著性。对于只报告了均数、标准差的研究采用Cohen’sd的计算公式,利用研究中所报告的均数、标准差计算其对应的Cohen’sd值(Cohen, 1988),对于只报告了t检验结果的研究,采用Steiger的相关转换公式将t值转化为Cohen’sd值(Steiger & Fouladi, 1997)。最后,利用R语言(4.0.5)的“esc”程序包将所有编码的Cohen’sd值转化为Hedges’g并使用Hedges’g值进行元分析。
2.4.2 模型的选定与异质性检验
元分析主要采用固定效应模型或随机效应模型,固定效应模型假定研究背后只存在一个真实效应量,而每个研究效应量的不同是由抽样误差引起的,因此固定效应模型的结果推论只适用于当下的研究原始样本范围。随机效应模型则认为每个研究的真实效应量是不同的,这种不同来源于抽样误差外的其他变异来源,如被试群体差异、研究方法差异等,因此随机效应模型得到的效应值只是对真实效应量均值的估计,它所涵盖的置信区间范围更加广泛(Borenstein et al., 2009)。在模型选定上,本研究不符合固定效应模型的选择标准,除抽样误差外还有测量手法等变量会影响学习判断和记忆表现间的真实关系,因此选用随机效应模型。下文中,我们将结合异质性检验的方法进一步评估随机效应模型选择的正确性。
2.4.3 发表偏差
当发表的研究文献不能系统性地代表该领域已经完成的研究总体时,就认为产生了发表偏差(Rothstein et al., 2005)。发表偏差意味着该领域的研究文献不完整,这会严重影响元分析的结果,因为它可能会导致最终得到的效应量高于真实值(Kuppens et al., 2013)。针对发表偏差的问题,最好的办法就是全面检索文献,以减少发表偏倚。此外,在元分析过程中,还采用漏斗图、Egger’s检验以及剪补法来评估发表偏差。
2.4.4 数据分析及处理程序
使用excel进行前期的文献整理与编码,通过R语言(4.0.5)的metafor程序包进行综合效应量计算、发表偏倚检验以及调节效应检验(Balduzzi et al., 2019)。
3 研究结果
3.1 异质性检验
对于纳入元分析的数据进行异质性检验,Q检验表明,纳入元分析的各独立效应量之间是异质的,Q(52)=164.28,p<0.001,I2=67.10%,这一结果对选择随机效应模型的正确性予以佐证。根据Borenstein等人(2009)对I2的解释,说明在学习判断与记忆表现关系的研究中有67.10%的观察变异是由学习判断对记忆表现的真实改变效应引起的。
3.2 发表偏差检验
首先,通过漏斗图检查发表偏差,如图2所示,纳入元分析的55个独立效应量基本均匀分布在总效应量两侧,这表明,针对学习判断对于学习表现影响的研究并不存在严重发表偏差。因为漏斗图只能从视觉对称判断的角度初步检查发表偏差,本研究还使用了Egger’s检验,结果显示本研究存在一定的发表偏差(p=0.009)。
图2 学习判断反应性效应量分布的漏斗图
因此采用剪补法检验发表偏差对元分析结果的影响,对独立效应量进行剪贴之后,使用随机效应模型的总效应值依然显著(Hedges’g=0.33, 95%CI=[0.25, 0.41],p<0.001)。由此可见,本研究元分析纳入的所有独立效应量虽然存在部分发表偏差的因素,但主要结果还是有效的。
3.3 主效应检验
使用随机效应模型进行总体效应检验,使用55个独立效应量,被试总数为3690人,得到学习判断对于记忆表现的影响为正反应(Hedges’g=0.22, 95%CI=[0.14, 0.29],p<0.001)。
3.4 调节效应检验
从图2来看,各个研究的效应量分布于总效应量两侧,而且各研究的效应量之间存在很大的变异,为分析这一变异的可能来源,本研究检验了学习时间、学习材料以及测试类型对于学习判断反应性的调节作用,结果见表2。
表2 调节效应检验
从调节效应分析的结果来看,学习时间的调节效应显著(Qb=7.78,p<0.01),相比于自定步调的学习时间(Hedges’g=0.08),实验者规定被试学习时间影响学习判断反应性的效应量更大(Hedges’g=0.27);学习材料类型的调节效应显著(Qb=17.08,p<0.001),相比于学习无关词对、混合词对和文本材料,学习具有一定关联度的词对影响学习判断反应性的效应量更大(Hedges’g=0.39);测试类型的调节效应不显著(Qb=1.59,p=0.452)。
4 讨论
4.1 学习判断反应性的主效应
本研究就个体在学习结束之后进行学习判断是否会改变其在未来测验中的记忆表现进行了元分析,其主效应结果表明学习判断存在反应性,其效应量为0.22,这说明学习判断对于记忆有一定影响,且这个影响方向表现为正向的促进作用,即进行学习判断能够让个体的记忆测验表现更佳。这与以往的一些研究结果相似(Ariel et al., 2020; Dougherty et al., 2005; Kelemen & Weaver 1997; Soderstrom et al., 2015; Witherby & Tauber, 2017; Yang et al., 2015),出现这一结果的可能原因是学习判断的测量方式为被试自我报告,通过让被试自我估计在未来测验中的记忆表现情况来测量学习判断的基本情况,这在一定程度上向个体提供了测验信息,可能在无形中强化了个体记忆,从而使得个体在有学习判断项目上记忆表现更好(Soderstrom et al., 2015)。另外,让被试进行学习判断会促使他们利用一些材料线索进行估计,这种估计强化了可用的线索,使被试在随后的记忆测试中再运用这种线索时出现了学习判断的正反应性(Koriat, 1997),这与Double等人(2018)的元分析结果不一致,可能是本研究纳入的原始效应量、被试数量更多,因此能够更有效地避免样本抽样误差混淆结果,且本研究中纳入的原始效应量大多来自2017年至2020年,相比于Double等人(2018)纳入的早先研究,这些新近研究对无关变量的控制更加准确,因此能够更多地排除无关变量对于学习判断反应性的影响,从而稳定地解释学习判断反应性的真实表现情况。
综上所述,学习判断的正反应性提示研究者探究元记忆监测相关机制时,要考虑进行学习判断这一行为是否会改变个体的学习行为及其学习结果,一个简单的学习判断行为便可促进个体的记忆结果,这对学生来说或许是一种不错的学习方法,值得广大学习者利用。
4.2 学习判断反应性的调节效应分析
4.2.1 学习材料对学习判断反应性的调节效应
调节效应检验表明,不同学习材料类型对学习判断反应性的影响不同,相比于学习无关词对、混合词对和文本材料,学习具有一定关联度的词对影响学习判断反应性的效应量更大(Hedges’g=0.39)。以往研究结果也表明,使用相关词对作为学习材料进行学习判断的记忆表现更佳,使用无关词对作为学习材料进行学习判断对于记忆的作用可能表现为促进,也可能是抑制或者没有作用(Mitchum et al., 2016; Myers et al., 2020; Witherby & Tauber, 2017)。造成学习材料对学习判断反应性调节效应显著的原因可能是进行学习判断会让学习者更多地关注“材料关联度”这一线索,并根据材料的关联度进行判断,这种判断可能会激活其内在的一些学习信念,即具有关联度的词对更容易学习,无关词对记忆更困难,而这种信念会产生自我验证效应(对于高相关词对抱有更高提取信心),从而导致对于两种材料的回忆结果产生分离。已有研究者发现,高提取信心的个体大多表现为学习判断的正反应性,而低提取信心的个体大多表现为学习判断的负反应性或者无反应性,这一结果印证了我们的猜测,即对于关联度(高vs. 低)不同的材料进行学习判断会改变个体的提取信心,而提取信心的不同又会进一步影响个体的记忆表现(Double & Birney, 2017)。
4.2.2 学习时间对学习判断反应性的调节效应
调节效应检验表明,不同学习时间对学习判断反应性的影响不同(Qb=7.78,p=0.005),表现为相比于自定步调的学习时间(Hedges’g=0.08),实验者规定被试学习时间影响学习判断反应性的效应量更大(Hedges’g=0.27)。以往研究也表明,使用固定学习步调能够揭示学习判断的正反应性(Soderstrom et al., 2015),而使用自定学习步调可能并不会产生学习判断的反应性(Janes et al., 2018),甚至可能产生负反应性(Mitchum et al., 2016)。学习时间对学习判断反应性调节作用显著的原因可能是要求个体做出学习判断行为会促使被试注意到一些更容易记忆的材料(简单),而忽视一些不容易记忆的材料(困难或有挑战的项目)。每个学习者在学习材料时所持有的态度都是要掌握材料,但当学习时间有限时(实验者固定步调),被试更有可能牺牲困难词对,将更多的注意力集中在记忆简单材料上,从而形成一种有效的学习策略;当有足够时间学习材料时(学习者自定步调),被试会以掌握所有材料为目标,可能并不会根据材料难度分配自己的认知资源,最终因为记忆容量有限而在最终测验中表现一般。
4.3 研究不足与展望
首先,在搜集文献时由于部分研究实验数据缺失损失了部分研究样本,一定程度上影响了元分析结果的准确性,未来应该更加采用多渠道更全面的方法搜集元分析所需要的数据。其次,纳入的所有原始研究均为考察学习判断对于短时记忆的反应性,所以目前的结果仅能说明学习判断对于短时记忆的表现有所促进,并不能推广至长时记忆,所以学习判断对于长时记忆表现的影响还需深入探讨。最后,学习判断反应性的影响因素较多,本研究中只选取了三个影响因素进行探究,还有一些影响因素没有涉及,如学习判断范式、实验设计类型、学习材料数量等,未来研究应该更全面地探究学习判断反应性的影响因素,以全面揭示学习判断反应性的产生机制。
5 结论
学习判断会促进学习者的记忆表现,学习判断的反应性受到学习材料、学习时间的调节,不受测验类型的调节。