快慢读者利用语境信息的差异:加工深度的作用*
2022-09-20刘志方朱星宇
仝 文 余 雪 刘志方 朱星宇 齐 琦
(1 山西师范大学教育科学学院,太原 030031) (2 杭州师范大学教育学院,杭州 311121)(3 海南师范大学心理学院,海口 571158)
1 引言
语境预测性是指在句子阅读中,根据前文语境推测出目标词的概率。以往研究发现,语境预测性是影响词汇加工的“三大因素”之一(DeLong et al., 2014)。读者在阅读高预测性词和低预测性词时会有不同的眼动模式,相对于低预测性词来说,高预测性词的注视时间更短,眼跳距离更长,回视次数更少(Balota et al., 1985; Rayner &Well, 1996; Schustack et al., 1987),即表现出预测性效应。以汉语句子为材料的研究也得到了同样的结果(刘志方 等, 2020; Chang et al., 2020)。可见,预测性对于词汇加工的促进作用具有跨语言的一致性(Rayner et al., 2005)。
以不同群体为研究对象的语境预测性相关研究发现,各群体均能利用语境预测性信息来促进词汇加工。眼动研究发现,儿童已经能够利用语境预测性信息促进词汇加工(Perfetti et al., 1979);青年和老年读者的眼动数据也证实他们可以有效利用语境预测性信息(王丽红 等, 2012)。可见,预测性对词汇加工的促进作用具有普遍性。
而在普遍性之外,差异性也是研究者关注的重要内容。以往研究发现高低技能读者均可以利用预测性信息(Hawelka et al., 2015),但不同阅读技能的读者在对语境预测性信息的利用上是存在差异的,主要表现在预测性效应的大小和时间早晚上。
关于高低技能读者利用预测性信息的差异,目前有两种相关的假说:一种是词汇质量假说,认为对于高阅读技能者而言,高质量的词汇表征支持模块化阅读,他们可以利用有效的自下而上的加工来获取词汇信息而无需依赖语境信息,低阅读技能者则需要语境信息来帮助其进行词汇识别(Hersch & Andrews, 2012);另一种是预测编码框架假设,认为在自下而上的信息到达大脑各区域前,低空间频率信息在大脑中的投射就已预先激活了可能的对象,即读者在阅读过程中会不断产生前向推断,而相比于低技能读者,高技能读者自动化产生前向推断的能力较强(Hawelka et al.,2015)。综上所述,词汇质量假说与预测编码框架假设在预测性信息利用的时间进程和大小上有不同预测。具体来看,在对预测性信息利用的时间进程上,词汇质量假说所推断的预测性效应表现时间的早晚是以词汇加工阶段为界。慢速读者由于词汇表征质量较差,需依赖语境信息帮助其进行词汇加工,因此其在词汇加工阶段就会表现出预测性效应,而快速读者在词汇加工阶段不依赖预测性信息,其对预测性信息的利用可能更多地体现在更高层次的加工中;而预测编码框架假设推断快速读者比慢速读者能更早利用预测性信息来促进词汇加工。在预测性效应的大小上,词汇质量假说推断慢速读者的预测性效应较大,而预测编码框架假说推断快速读者利用预测性信息的能力更强。
尽管两种假说在快慢读者预测性信息利用的时间进程和大小上有不同预测,但从以往研究结果来看,两种假说均有证据支持。一些研究者发现英文高技能读者能够产生更大的预测性效应(Klein et al., 1974; Steiner et al., 1971),支持了预测编码框架假设。刘妮娜等(2019)分析中文高低技能读者在预视阶段的预测性效应发现,高技能读者在预视阶段就可以产生预测性效应,而低技能读者在加工晚期(总阅读时间)才能利用预测性信息,同样支持了预测编码框架假设。尽管如此,也有研究显示,相比于低技能读者,高技能读者在词汇加工中对语境信息的依赖性较小(West &Stanovich, 1978; West et al., 1983),支持词汇质量假说。但通过文献梳理发现,其设置的实验任务并非自然的阅读情境。例如,Schvaneveldt 等(1977)比较高低技能儿童在前置关联词和非关联词条件下的词汇判断表现发现,低阅读技能儿童产生了更大的预测性效应。而在West 和Stanovich的研究中,虽然设置了前文语境,但其设置的单词阅读任务需要读者出声阅读,且在前文语境与目标词呈现之间插入了时间间隔,同样不是自然阅读情境。因此,不同研究得出的高低技能读者预测性效应表现的结果差异可能只是不同的任务要求导致的。也就是说,词汇质量假说与预测编码框架假设不是矛盾对立的,而是各有其适用情境。在预视信息可用的自然的阅读情境中,高低技能读者的预测性效应表现可能更符合预测编码框架假设。
此外,即使设置了较为自然的阅读情境,不同阅读任务本身所需的加工深度差异也可能会对预测性效应产生影响。主题扫描是一种比阅读理解加工深度更浅的阅读任务,研究者通过指导语引导被试在头脑中预先形成一个目标,称之为“主题”,被试在主题扫描任务中通过快速移动眼睛,提取关键点并以此来判断该文本与主题的相关性,一旦判断为无关,被试就会放弃进行更高层次的整合(Duggan & Payne, 2009),反之判断为相关后将转为阅读理解过程。White 等(2015)的一项研究对比了主题扫描和阅读理解任务上的词频效应,结果发现,在主题扫描任务中,在第一遍阅读时间指标上表现出了与阅读理解任务相当的词频效应。因此,可以认为,虽然在主题扫描任务中的加工深度较浅,但对单词的加工确实到达了词汇的层面。而阅读理解以获取句义为目的,不仅需要对词汇进行加工,还需要将词汇的意义与上下文进行整合来理解句义,这个过程中词汇的加工程度更深。
Reichle 等(2009)在使用E-Z 读者模型探讨高级语言加工过程对眼动的影响时提出,预测性信息的可用性是基于前一个词的后词汇整合阶段的完成。也就是说,预测性效应的产生是基于一定加工深度的。当加工深度较浅时预测性效应较小,甚至不出现预测性效应;但是对于需要更深入加工的阅读理解来说,预测性效应较大(张丽华 等, 2019)。以往关于高低技能读者预测性效应的研究是在单一的任务中进行的,忽略了加工深度的影响。因此本研究设置主题扫描任务(不需要对句中词汇进行后词汇整合)与阅读理解任务(通过词汇意义的整合来理解句义)来形成两种不同的加工深度,以探讨加工深度对高低技能读者预测性效应大小的调节作用。
根据对以往文献的梳理,本研究提出以下假设:(1)若在自然的阅读情境中,阅读理解任务中快速读者相比于慢速读者更早表现出预测性效应,则快慢读者预测性效应支持预测编码框架假设。(2)加工深度调节快慢读者预测性效应的大小。
2 研究方法
2.1 被试
选取某大学本科生90名,平均年龄为19.72 岁(年龄范围17~26 岁),其中男性18人,女性72人。所有被试的母语均为汉语,无色盲色弱问题,裸眼视力或者矫正视力正常,未参加过类似实验,未参与本实验的材料评定工作。
以往研究对阅读能力进行高低分类主要有两种方法:一种是以任务得分作为划分指标;另一种是在保证一定阅读理解程度下,以阅读速度作为划分指标(Risse, 2014)。Rayner 等(2016)认为,语言技能对阅读速度具有重要影响,阅读速度是代表阅读能力的综合指标。故本研究采用阅读速度作为指标对快慢读者进行分组。记录并整理被试阅读理解练习部分的眼动数据,剔除正确率过低(低于85%)的被试2名,剔除阅读过程中眨眼次数过多的被试8名,共80名被试参与分组(使用G*power3.1.9.2 计算,当统计检验力为0.85 时,被试样本量为75)。本研究以练习句的总阅读时间为指标,采用中位数法对快慢读者进行划分(Rayner et al., 2010),即总阅读时间较短的一半为快速阅读组,较长的一半为慢速阅读组。快速读者(M=2074 ms,SD=391 ms)与慢速读者(M=3395 ms,SD=964 ms)之间差异显著(t=-8.03,p<0.001,d=1.80)。
2.2 实验仪器
使用加拿大SR Research 公司生产的EyeLink II 眼动记录仪,采样频率为500 Hz,被试机屏幕刷新率为75 Hz,分辨率为1024×768 像素。实验时句子以宋体21 号字呈现在灰色背景上,被试眼睛距屏幕约50 cm,每个汉字约为0.8 度视角。
2.3 实验材料
使用96个句子框架,每个句子框架都有高低预测性两种目标词。目标词共192个,均为双字词,材料如表1 所示。选取不参与正式实验的30名大学生对材料通顺性和合理性进行5 点评定(1 表示“非常不通顺/非常不合理”,5 表示“非常通顺/非常合理”),评定结果为:高预测句子的通顺性为4.05,合理性为4.23,低预测句子的通顺性为4.04,合理性为4.22,高低预测性句子在通顺性和合理性上均没有显著差异[通顺性:t(190)=0.29,p=0.776; 合理性:t(190)=0.49,p=0.624]。另外选择30名不参与正式实验的大学生采用句子补全的方法对目标词预测性进行评定(Taylor, 1953),评定结果为:高预测性句子中的目标词预测性为0.51~0.95(M=0.71,SD=0.12);低预测性句子中的目标词预测性为0.00~0.27(M=0.05,SD=0.07),两者之间差异显著[t(190)=44.98,p<0.001,d=6.54]。高预测性句子中的目标词词频平均值为76.17 次/百万,低预测性句子中为49.73 次/百万,高低预测性句子中目标词词频差异不显著[t(190)=1.21,p=0.227]。
表1 实验材料举例
2.4 实验设计
采用2(任务:阅读理解、主题扫描)×2(预测性:高、低)×2(阅读速度:快速读者、慢速读者)的混合实验设计,其中任务和预测性为被试内变量,阅读速度为被试间变量。采用拉丁方分配实验材料和实验条件。
阅读理解任务:阅读64个汉语句子,包括48个实验句和16个填充句(填充句为服装主题相关句,服装有关的词语可在句子任何位置)。为保证被试认真阅读,每个句子后均设有问题句,共64个问题句,形式为是否判断句。
主题扫描任务:阅读64个汉语句子,包括48个实验句和16个填充句(主题相关句),只在主题相关句后设置问题句,整个任务有16个问题句,形式为是否判断句。
2.5 实验程序
采用个别施测。被试调整下颌托高度,佩戴眼动仪,主试进行校准并提醒被试在阅读过程中尽量不要移动头部和眨眼。校准完成后在屏幕上出现阅读理解任务的指导语(“请认真阅读句子,每个句子后均有一个问题需进行是否判断”),请被试认真阅读后开始实验。主题扫描任务指导语如下:“请快速浏览句子并判定句子类型,当句子与服装主题相关时请认真阅读,无关时请快速按手柄上的‘确定’键跳过,主题相关句后设有问题句需进行是否判断”。主题扫描任务的程序与阅读理解任务相同,两种任务间进行休息以免不同任务之间产生干扰。当被试在实验过程中眼睛追踪误差过大时重新进行校准。整个实验过程大约50 分钟(包含休息时间)。
3 结果
在主题相关句阅读上包括主题扫描和主题理解过程,因此在主题扫描任务的结果中只分析主题无关句。在数据的预处理中,删除单个注视点注视时间小于80 ms 以及大于1200 ms 的数据(Rayner, 2009),删除注视点个数少于5个以及多于40个的数据,删除三个标准差以外的数据,数据最大删除比例为4.14%。
选择首次注视时间、凝视时间、总阅读时间、回视路径时间进行分析。其中,首次注视时间、凝视时间是早期指标,回视路径时间和总阅读时间是晚期指标。数据分析均使用R 数据分析软件进行,具体使用线性混合效应模型(linear mixed model)进行(眼动指标均做对数转换,同时,为了分离目标词词频对眼动指标的影响将词频进行对数转换后作为协变量加入模型),以复杂模型为基础,如有未拟合情况则进行逐步简化:首先从项目随机效应入手进行模型简化,如仍无法拟合,则进一步简化被试随机效应。结果如表2 所示。
表2 快慢读者在不同任务中目标词上眼动指标的平均数和标准误(ms)
数据分析结果显示:快速读者回答问题正确率为93.27%,慢速读者为94.20%,二者之间差异不显著[t(78)=-1.10,p=0.274]。任务主效应和阅读速度主效应在各个指标上均显著,任务主效应:首次注视时间:b=-0.09,SE=0.01,t=-9.75;凝视时间:b=-0.12,SE=0.01,t=-10.33;总阅读时间:b=-0.30,SE=0.01,t=-22.60;回视路径时间:b=-0.13,SE=0.01,t=-9.19。阅读速度主效应:首次注视时间:b=0.07,SE=0.02,t=3.02;凝视时间:b=0.07,SE=0.02,t=2.98;总阅读时间:b=0.18,SE=0.03,t=5.74;回视路径时间:b=0.10,SE=0.03,t=3.21。数据表现为:阅读理解任务中的首次注视时间、凝视时间、总阅读时间以及回视路径时间均显著长于主题扫描任务中;快速读者在所有指标上均显著短于慢速读者。
预测性主效应在除凝视时间外的指标上均显著,首次注视时间:b=0.02,SE=0.01,t=2.29;总阅读时间:b=0.06,SE=0.02,t=3.09;回视路径时间:b=0.06,SE=0.03,t=2.21。阅读高预测性词时的首次注视时间、总阅读时间以及回视路径时间均显著短于低预测性词。
三阶交互作用在凝视时间和回视路径时间指标上显著,凝视时间:b=0.07,SE=0.04,t=1.97;回视路径时间:b=0.14,SE=0.06,t=2.51,简单简单效应检验结果显示,只有快速读者在阅读理解任务中表现出了预测性效应,凝视时间:b=-0.05,SE=0.02,t=-2.48;回视路径时间:b=-0.12,SE=0.04,t=-3.39。三阶交互作用在首次注视时间和总阅读时间指标上不显著。
4 讨论
4.1 快慢读者在语境信息利用上的差异
本研究探讨快慢读者在较为自然的阅读情境中对语境预测性信息的利用以及加工深度在其中发挥的作用。结果显示,在除凝视时间外的眼动指标上均表现出了预测性主效应显著,在各个眼动指标上均表现出了阅读速度主效应显著,说明本实验对预测性和阅读速度的操纵是有效的。同时,数据分析结果显示,在阅读理解任务中快慢读者均能利用预测性信息促进词汇加工,这与以往研究的结论一致(Ashby et al., 2005),但本研究发现快慢读者在预测性信息利用的时间进程上有所不同:快速读者在注视的早期阶段就可以利用预测性信息,而慢速读者在词汇加工的晚期(总阅读时间)才能利用预测性信息。相比于慢速读者,快速读者自动化产生前向推理能力较强,结果支持预测编码框架假设。
实验结果支持了研究推论,即预测编码框架假设与词汇质量假说的适用情境不同,在较为自然的阅读情境下,快慢读者对语境信息的利用情况符合预测编码框架假设。本研究认为,当阅读情境较为自然时,信息获取和整合的连续性为读者提供了自动化产生前向推理的条件。王穗苹等(2009)的研究发现,在语义违背条件下,目标词上的首次注视时间显著长于语义一致条件,支持了中文阅读中语义加工的即时性。同时,以往研究发现,相比于慢速读者,快速读者有更强的中央凹加工能力(Ashby et al., 2005)和预视能力(Chace et al., 2005; Wang et al., 2014)。得益于此,相比于低技能读者,高技能读者能够更多地将注意资源用于信息的整合和理解(Kim & Goetz,1994)。在此基础上,快速读者能够更加迅速地利用预测性信息促进词汇加工,因此在词汇加工的早期阶段就表现出了预测性效应。而慢速读者由于信息加工和整合能力较差,速度较慢,其向前产生推断的速度较慢,因此其在较晚阶段才表现出了预测性效应。
综上所述,快速读者得益于较强的信息加工和整合能力而能够自动化地持续产生前向推理,其对预测性信息的利用在词汇加工的早期阶段就已经开始。而对于慢速读者来说,由于其信息加工和整合能力较差,在词汇加工的较晚阶段才能够利用预测性信息。实验结果支持预测编码框架假设,同时也验证了本研究的推论,即阅读情境的自然性是预测编码框架假设成立的重要条件。
4.2 加工深度的调节作用
以往研究发现,任务要求会影响加工深度(Dampuré et al., 2012; Forster & Chambers, 1973;Reichle et al., 2010; Schad et al., 2012)。在主题扫描任务中,对于主题无关句,被试仅需浏览文本内容且没有回答问题的压力,这种情况下被试对文本内容的加工程度较浅(Duggan et al., 2009),而在阅读理解任务中,被试在每个句子后都需回答相关问题,在这种任务要求下,被试需对词汇进行更深层次的加工及语义整合(王穗苹 等, 2009)。本研究发现,被试在完成主题扫描和阅读理解任务时有不同的眼动表现,在主题扫描任务中注视时间更短,这与以往研究结果一致(White et al.,2015),支持了两种任务所要求的加工深度不同的观点。
尽管本研究在首次注视时间、总阅读时间、回视路径时间指标上都发现了阅读高低预测性词的差异,但进一步分析发现,只有快速读者在阅读理解任务中表现出了预测性效应,这种数据模式说明加工深度调节快慢读者对预测性信息的利用程度。具体来说,在阅读主题扫描任务中的主题无关句时,读者只需判断提取的内容要点是否与主题相关而不需要形成句子层面的表征。在这种情况下,不管读者的阅读能力如何,在前文加工较浅的条件下都无法有效利用预测性信息,而更加侧重于依托对自下而上的信息进行加工来完成任务。而阅读理解任务要求读者理解句义并进行问题回答,这种情况下读者需要对文本进行较深层次的加工,也就是说读者需要在词汇加工的基础上不断进行语义整合来完成阅读理解。如前所述,预测性信息的可用性是基于前一个词的后词汇整合阶段的完成,因此,阅读理解任务所要求的加工深度为读者利用预测性信息提供了条件。总体而言,实验结果显示阅读任务类型会对快慢读者预测性信息的利用产生影响,支持了本研究的假设,即加工深度调节快慢读者预测性效应的大小。
本研究探讨了加工深度对语境信息利用的影响,结果发现加工深度是调节快慢读者对语境预测性利用的重要因素,而加工深度与任务类型密切相关。读者可以根据任务需要灵活调整阅读策略,以此来达到一种速度和深度的权衡,进而影响词汇加工过程。这种权衡作为一种阅读策略,其机制及运行时的调整方式还有待继续探索,目前可以确定的是快速读者和慢速读者在阅读策略的转换上均具有灵活性。
5 结论
(1)在自然阅读情境中快速读者能够更早地利用预测性信息,支持预测编码框架假设。(2)快慢读者对预测性信息的利用受加工深度的调节。加工深度较浅时,快慢读者均无法有效利用预测性信息。