反馈时间、反馈类型和掩蔽类型对概率类别学习的影响*
2018-11-08王家慰黄秀青
邢 强 王家慰 黄秀青
(广州大学心理学系,广州 510006)
1 引言
在日常生活中,个体经常会通过对刺激进行分类,并根据类别特征对其进行加工以达到快速准确加工的目的。然而,在认识客观事物并尝试对其进行分类时,分类的结果不一定具有唯一性。例如,根据某种天气现象对第二天的天气进行预测,天气有可能是晴天,也有可能是雨天。对具有不确定性的事物进行分类尝试便是概率类别学习(probability category learning)。概率类别学习是指人们通过多次的分类尝试、接受反馈而逐渐获得线索和结果之间概率性关系的学习。
目前研究者主要通过天气预报任务(weather prediction task,WPT)对概率类别学习进行研究。任务线索是由正方形、菱形、圆形、三角形组成的四张卡片(如图1所示)。任务中,向被试随机呈现由这四张卡片中的其中一张,两张或三张组成的不同组合,共14种可能。4张卡片既不会一张也不呈现,也不会同时呈现4张。被试根据卡片上的不同图案以及卡片的组合方式来预测是晴天还是雨天。这四张卡片分别以某一固定概率预测两种天气结果,并且总体上所有组合预测这两种天气结果的概率相同。
概率类别学习是基于单一加工系统还是多重加工系统这一点一直备受关注,但目前仍未达成共识(Ashby & Maddox,2005)。持单一内隐系统观的研究者认为概率类别学习是一个无意识的、不需要注意资源参与的内隐学习过程(Knowlton,Squire,& Gluck,1994;Gluck,Shohamy,& Myers,2002);而持单一外显系统观的研究者认为,概率类别学习是一个需要注意和工作记忆参与的外显学习过程,主要依靠假设检验系统(Lagnado et al.,2006;Newell,Lagnado,& Shanks,2007;Price,2009)。另一方面,多重加工系统,如COVIS(Competition between Verbal and Implicit Systems model)模型,认为在概率类别学习过程中同时存在内隐和外显两种学习系统(Poldrack et al.,2001;徐贵平等,2011;李开云,付秋芳,傅小兰,2012)。
探讨类别学习的加工机制是单一系统还是多系统,研究主要采用操纵性分离的实验范式进行(邢强,孙海龙,2015)。操纵某一变量的不同水平,若对基于规则和信息整合这两种类别结构产生不同影响,发生分离效应,则说明在类别学习中存在不同的加工系统,否则只存在某种单一系统。在知觉类别学习的研究中,研究者已通过操纵反馈时间(即时反馈,延迟反馈)、反馈类型(丰富反馈,简单反馈)、学习方式(观察学习,反馈学习)等发现这几个变量对两类类别结构均有不同的影响(Maddox,Ashby,& Bohil,2003;Maddox & Ing,2005;Maddox et al.,2008;邢强,孙海龙,车敬上,2014;Dunn,Newell,& Kalish,2012)。
COVIS理论认为,延迟反馈削弱内隐学习但不影响外显学习。内隐学习主要由多巴胺调节,而多巴胺从分泌到消失的时间很短。因此,若反馈延迟,将削弱内隐学习;而外显学习依赖于假设检验,将不受影响。已有系列对知觉类别学习的研究结果支持这一观点(Maddox,Ashby,& Bohil,2003;Maddox & Ing,2005;Dunn,Newell,& Kalish,2012;Worthy,Markman,& Maddox,2013;邢强,孙海龙,2015)。但是,Price(2009)发现延迟5秒给予反馈不影响概率类别学习。这是否表明概率类别学习是单一系统加工?值得注意的是,在Price(2009)研究中:(1)使用的掩蔽刺激的图案均是圆点,与线索刺激的相似性不高,知觉噪音水平低。当掩蔽刺激的知觉噪音的水平降低时,反馈延迟对类别学习的削弱作用减弱甚至消失(Ell,Ing,& Maddox,2009;Dunn,Newell,& Kalish,2012;邢强,孙海龙,2015)。(2)刺激一直呈现,直到被试反应才消失。有研究表明,刺激呈现时间的长短影响内隐学习中外显知识的习得,刺激的呈现时间越长,外显知识更易于习得(Fu,Fu,& Dienes,2008)。当刺激呈现时间由被试自由决定时,被试更可能运用语言规则对卡片进行记忆,使得任务中卷入外显知识,而延迟反馈不影响外显学习。因此,为消除这些混淆因素,研究操纵掩蔽类型,使用塔罗牌掩蔽和空白矩形掩蔽(如图2),参考车敬上(2011)探讨反馈时间对类别学习影响的研究,将刺激呈现时间改为5s,探讨延迟反馈对概率类别学习的影响。
图2 塔罗牌掩蔽(上)与空白矩形掩蔽(下)示意
除反馈时间外,研究者通常通过操纵反馈类型探究类别学习的加工机制。Maddox等(2008)考察了反馈类型在知觉类别学习中的作用,结果发现丰富反馈增强基于规则类别学习的学习效果,却减弱了信息整合类别学习的学习效果。Dunn等(2012)在Maddox等(2008)实验的基础上采用新的掩蔽材料——固定方格掩蔽,探讨反馈时间和反馈类型对知觉类别学习的影响。结果发现,当掩蔽材料为光栅图时,实验结果重复了Maddox等(2008)的实验结果;当掩蔽材料更换为固定方格时,不同反馈类型的学习效果不存在显著差异,表明掩蔽类型影响反馈类型的学习效应。
综上,此前关于类别学习机制的研究大多基于知觉类别学习,即操纵某一变量,考察在变量不同水平上,基于规则类别学习与信息整合类别学习之间的差异,探究类别学习是依赖单一系统还是多系统。但是通过这一做法对概率类别学习加工机制的研究却寥寥无几(Price,2009)。此外,研究发现反馈时间、反馈类型均影响类别学习效果,但是这两个变量的学习效应也同样受到掩蔽刺激类型的调节。研究拟通过操纵反馈时间、反馈类型及掩蔽类型,探究概率类别学习的加工机制。
2 研究方法
2.1 方法
2.1.1 被试
在校大学生202人,剔除最后学习阶段正确率低于70%的13名被试,最后有效数据189份,其中男生74人,年龄为19.51±1.41岁。
2.1.2 实验材料
材料为由4张不同几何图形组成的塔罗牌卡片,具体如图1所示。4张卡片预测晴天的概率分别为80%、60%、40%和20%。在整个实验过程中,晴天和雨天这两种天气出现的次数各为100次,具体的卡片结构和天气结果如表1所示。掩蔽材料有两种,一种为由与刺激材料相似图案组成的塔罗牌卡片,知觉噪音水平较高;另一种为由空白矩形组成的卡片,知觉噪音水平较低(如图2所示)。
表1 天气预测任务中卡片的具体结构和天气结果
注:表中的“1”表示卡片组合中对应的卡片出现,“0”表示不出现(Gluck et al.,2002;Lagnado et al.,2006)
2.1.3 实验设计
采用2(反馈时间:即时反馈,延迟反馈)×2(反馈类型:简单反馈,丰富反馈)×2(掩蔽类型:塔罗牌,空白矩形)的三因素被试间实验设计,因变量有3个,分别为预测天气情况的正确率、4张卡片主观预测天晴的概率和卡片强弱线索判断。
2.1.4 实验程序
实验采用的是天气预报任务,包含学习阶段和测试阶段。
在即时反馈条件下,实验程序为:在学习阶段,首先呈现“+”500ms,随后注视点消失,在电脑屏幕左方呈现刺激,屏幕的右方出现“晴天”和“雨天”的图案,被试根据自己的判断进行按键反应,其中“F”代表“晴天”,“J”代表“雨天”。若被试在5s内做出反应,按键后刺激消失,呈现掩蔽刺激500ms,接着给予被试反馈1000ms;若被试在5秒内未按键反应,刺激也会消失,并呈现提示语提醒被试下次尽快反应,同时也将不给予反馈。trails之间间隔5000ms。
延迟反馈条件与之相似,但掩蔽刺激呈现时间为5000ms,trials之间间隔为500ms(如图3所示)。
学习阶段共4个blocks,每个block含50个trails。
测试阶段类似于学习阶段,只是刺激呈现时间变为按键消失,并且刺激消失后,既不出现掩蔽刺激,也不给予反馈。测试阶段共4个blocks,每个block含50个trials。测试阶段结束后,被试需对4张卡片预测天晴的概率以及它们在天气预报任务中预测天气的重要性程度进行评估。
图3 天气预测任务学习阶段trial流程图
2.2 结果与分析
2.2.1 学习成绩
8组被试在4个blocks上的正确率如图4所示。
图4 8组被试在4个blocks的正确率
对被试测试阶段的正确率进行2(反馈时间)×2(反馈类型)×2(掩蔽类型)×4(Blocks)的重复测量方差分析,结果显示:Blocks的主效应显著,F(3,543)=154.43,p<0.05,η2=0.46,表明存在学习效应;反馈时间的主效应显著,F(1,181)=10.23,p<0.05,η2=0.05,即时反馈的成绩(M=0.73)显著优于延迟反馈的成绩(M=0.70);掩蔽类型的主效应显著,F(1,181)=5.77,p<0.05,η2=0.03,在空白掩蔽下的成绩(M=0.72)显著优于塔罗牌掩蔽下的成绩(M=0.71);Blocks与反馈时间的交互作用显著,F(3,543)=6.76,p<0.05,η2=0.04,在前两个Blocks,即时反馈的成绩显著优于延迟反馈的成绩,在后两个Blocks中,即时反馈与延迟反馈的成绩差异不显著;Blocks与掩蔽类型的交互作用显著,F(3,543)=5.61,p<0.05,η2=0.03,在第一个Block中,在空白矩形掩蔽条件下的成绩显著优于在塔罗牌掩蔽条件下的成绩,在后面三个Blocks中,在两种掩蔽类型条件下成绩差异不显著。其余的主效应、交互作用均不显著。
2.2.2 判断卡片代表晴天的概率
完成所有实验trials后,被试分别对4张卡片预测天晴的概率进行评估,其中0代表肯定下雨,50代表下雨和天晴的可能性一样大,100代表肯定是天晴。被试根据要求输入具体数值。被试的判断值如下图所示。
对被试的判断值进行2(反馈时间)×2(反馈类型)×2(掩蔽类型)×4(卡片)的重复测量方差分析,结果显示:卡片的主效应显著,F(3,558)=259.05,p<0.05,η2=0.58;其余的主效应和相互作用均不显著。
图5 8组被试对4张卡片预测晴天概率判断值和客观概率
进一步对8种条件下四张卡片预测天晴的概率估计值和客观概率做单样本t检验,结果发现:即时—简单—塔罗牌组和即时—简单—空白矩形组都倾向于低估卡片2预测天晴的概率,统计值分别为:t(25)=3.01,p<0.05,d’=1.55;t(22)=2.83,p<0.05,d’=1.21。其余条件下对其他卡片的评估与客观概率差异不显著。结果表明:从整体上看,被试倾向于低估卡片2预测天晴的概率。此外,给予被试即时的、简单的反馈,无论使用空白矩形还是塔罗牌掩蔽刺激,被试虽能学会天气预测任务,但不能正确判断卡片预测天晴的概率,倾向内隐学习。
2.2.3 对卡片预测天气情况的重要程度的评价
被试在0~100%的范围内对4张卡片预测天晴情况的重要性进行评估。其中,卡片1和4为强线索,取这两张卡片的均值作为强线索的评价结果,而卡片2和3为弱线索,同样取这两张卡片的均值作为弱线索的评价结果,结果如图6所示。
卡片的主效应显著,F(3,558)=122.98,p<0.001,η2=0.40,被试评价卡片1和卡片4的重要性显著高于卡片2和卡片3的;卡片与反馈时间的交互作用显著,F(3,558)=2.96,p<0.05,η2=0.02,对卡片3的评价,在延迟反馈条件下的评价显著高于在即时反馈条件下,对其余三张卡片的评价,在两种条件下差异不显著。
进一步分别对8种条件下的强弱线索评价结果进行配对样本t检验,结果发现:8组被试对强线索重要程度的评价显著高于弱线索,统计值分别为:t(25)=5.33,p<0.01,d’=0.60;t(22)=7.55,p<0.01,d’=0.75;t(22)=5.93,p<0.01,d’=0.67;t(25)=9.07,p<0.01,d’=0.77;t(25)=9.07,p<0.01,d’=0.77;t(21)=4.62,p<0.01,d’=0.57;t(24)=6.02,p<0.01,d’=0.67;t(21)=8.72,p<0.01,d’=0.75。结果表明,8个组被试都能正确认识到不同线索预测天晴的强弱。
图6 8组被试对卡片预测天气情况重要程度的判断
3 讨论
研究通过操纵反馈时间、反馈类型和掩蔽类型,考察概率类别学习的学习机制。结果发现,被试的学习成绩在即时反馈条件下显著优于在延迟反馈条件下,根据COVIS的观点,延迟反馈削弱内隐学习但不影响外显学习,表明被试倾向内隐学习。此外,在即时反馈条件下,仅给予简单反馈,被试虽能出色地完成天气预报任务,但是不能正确地判断卡片预测晴天的概率,倾向内隐学习。然而,在其他条件下,被试均能正确地判断卡片预测晴天的概率以及各卡片在天气预报任务中预测天气的重要程度,表明被试能外显地意识到这些线索的作用。综上,概率类别学习采用的是双系统学习机制,既依赖内隐学习,又依赖外显学习。
3.1 反馈时间对概率类别学习的影响
研究结果表明,即时反馈学习效果比延迟反馈学习效果好,延迟反馈削弱概率类别学习。此外,在即时反馈条件下,仅基于简单反馈,被试虽能出色地完成天气预报任务,但是不能正确地判断卡片预测晴天的概率,倾向内隐学习。研究结果与Wilkinson等(2008),Leonora等(2014)和李开云等(2012)的一致,即在即时的简单反馈条件下,概率类别学习是内隐学习,依赖于强化学习。根据强化学习理论,反馈对学习的促进效应具有时间敏感性,即时反馈比延迟反馈好。在即时反馈条件下,多巴胺投射到相应的区域,强化了正确的刺激反应联结。
以往研究发现,在知觉噪音水平较高的光栅掩蔽条件下,反馈延迟削弱信息整合学习,但在标准噪音水平较低的黑屏掩蔽或知觉噪音水平较低的网格掩蔽下,反馈延迟对信息整合学习没有影响(Dunn,Newell,& Kalish,2012;邢强,孙海龙,2014)。与以往知觉类别学习的研究结果不同,在本实验中,不论是在空白矩形还是塔罗牌掩蔽类型条件下,反馈延迟都削弱概率类别学习,表明掩蔽类型并未在反馈时间对概率类别学习的影响中起作用。
笔者推断结果的差异可能与任务类型及实验材料有关。前人研究主要使用基于规则和信息整合的类别结构研究知觉类别学习(Ashby et al.,1998;Maddox & Ashby,2004;Smith et al.,2011),在这一类研究中,答案都具有确定性。实验材料一般是在频率和方向上变化的光栅图。信息整合类别结构的分类规则难以用言语描述,需要同时关注条纹频率和方向两个维度。如果在间隔时间出现与刺激相似的掩蔽刺激,刺激的记忆会被破坏,从而增加知觉噪音的水平(Magnussen,2000)。因此当掩蔽刺激为与光栅图刺激相似的光栅图掩蔽刺激时,光栅图的记忆会被破坏,影响被试进行分类学习。但是在天气预报任务中,刺激是4张由不同几何图形组成的卡片,卡片和天气结果之间的关系具有不确定性,分类不是非A即B。因此在天气预报任务中,被试需关注卡片与天气结果之间的关系,而非每张卡片的细节,因此掩蔽类型对其的影响可能会减少。
3.2 反馈类型对概率类别学习的影响
Maddox等(2008)和Dunn,Newell和Kalish(2012)的研究都发现丰富反馈能促进外显学习。Maddox等(2008)认为基于规则类别学习主要依靠外显的贝叶斯假设系统进行调节,当给予被试消极反馈时,在简单反馈条件下,贝叶斯假设系统有助于被试排除不一致的假设;在丰富反馈条件下,贝叶斯假设系统可以加强一致假设并削弱不一致的假设。丰富反馈提供更多的信息,有助于外显的假设检验系统做出判断,从而促进基于规则的类别学习。相比之下,信息整合类别学习主要依赖内隐系统并使用强化学习,使用外显的言语系统无法完成该类别结构的学习。当给予被试消极反馈时,丰富反馈诱发被试进行外显加工。由于外显系统和内隐系统相互竞争,当外显系统占主要优势时,信息整合类别结构将无法习得,在这种条件下信息整合学习效果被削弱。
但在本实验中,并未发现反馈类型对概率类别学习的影响。不论基于简单反馈还是丰富反馈,被试的学习效果相同。结果似乎表明概率类别学习的机制是单一学习系统,然而前面的分析已经表明尽管在学习过程中概率类别学习倾向于内隐学习,但是被试能清晰地意识到每张卡片预测天气的概率及重要性,是双系统学习机制。那么,导致这一差异的原因是什么呢?
在知觉类别学习中,分类具有确定性。在这类研究中,在丰富反馈条件下给予的反馈信息只有两种:当被试判断正确时,“正确!它应该归为A类”;当被试判断错误时,“错误,它应该归为A类”。然而,在概率类别学习中,卡片和天气结果之间的关系具有不确定性,同一张卡片或同一组卡片可能在第一次预测晴天是正确的,但在第七次或第十次预测下雨才是正确的。也就是说,在丰富反馈条件下,被试判断正确或错误都有可能接收两种不同的反馈信息:当被试判断正确时,被试可能接收“正确!卡片预测的天气是天晴”或“正确!卡片预测的天气是下雨”;而当被试判断错误时,被试可能接收“错误!卡片预测的天气是天晴”或“错误!卡片预测的天气是下雨”。由此看来,概率类别学习中丰富反馈的信息量比知觉类别学习研究中丰富反馈条件下的信息量大。研究表明,反馈所提供的信息量适中才有利于学习,一旦信息量太大,超量的信息则成为分心物,降低反馈效应(Phye,1979;Sassenrath & Garverick,1965;Wentling,1973)。
4 结论
(1)即时反馈学习效果比延迟反馈学习好,延迟反馈削弱概率类别学习,被试倾向内隐学习;
(2)被试能正确地判断卡片预测晴天的概率以及各卡片在天气预报任务中预测天气的重要程度,表明被试能外显地意识到这些线索;
(3)概率类别学习采用的是双系统学习机制,既依赖内隐学习,又依赖外显学习。