中文阅读中快速读者与慢速读者的词频效应 *

2022-07-18张慢慢胡惠兰张志超臧传丽

心理与行为研究 2022年3期

张慢慢胡惠兰边菡李芳张志超臧传丽

(1 教育部人文社会科学重点研究基地天津师范大学心理与行为研究院，天津 300387) (2 天津师范大学心理学部，天津 300387) (3 学生心理发展与学习天津市高校社会科学实验室，天津 300387)

1 引言

词汇加工或词汇识别是阅读理解的一个基本环节，因此，词汇加工能力的发展是阅读能力发展的首要内容（Kuperman & van Dyke, 2011; Perfetti,2007; Taylor & Perfetti, 2016）。词频被认为是衡量词汇加工难易程度最重要的词汇属性之一（Clifton et al., 2016）。词频越高，词汇所需的加工时间越短，越容易被识别，被跳读概率越大，即词频效应（臧传丽等, 2012; Li & Pollatsek, 2020; Rayner et al., 2006）。通过考察词频效应可以检验词汇加工效率。

以往研究主要考察了儿童读者的词汇加工的发展和老年读者的词汇老化过程。对拼音文字阅读的研究发现，当使用适用于儿童阅读能力的实验材料时，儿童读者的词频效应比成人读者更大：成人读者对高频词和低频词的注视时间无明显差异；但儿童对高频词的注视时间显著短于低频词，且对两类词的注视时间显著长于成人（Joseph et al., 2013; Tiffin-Richards & Schroeder,2015）。这表明儿童读者的词汇加工效率低于成人读者。老年读者的词频效应比青年读者更显著，老年读者对高频词的注视时间显著短于低频词；而青年读者对高频词和低频词的注视时间无明显差异，但都短于老年读者（McGowan et al., 2014;Rayner et al., 2006）。这表明老年读者的词汇加工效率低于青年读者。在阅读发展中，词汇加工效率随着儿童阅读经验的不断积累及其认知能力的提高而提高。进入老年阶段后，随着视觉生理机能衰退和认知老化，老年读者的词汇加工效率逐渐降低（McGowan & Reichle, 2018; Reichle et al.,2013）。由此可知，词汇加工效率的变化是阅读发展与老化过程的一个主要内容。根据词汇质量假说，词汇表征质量是阅读能力的决定因素，阅读能力越高的读者，其词汇加工效率也越高（Perfetti, 2007）。基于该观点，E-Z读者模型提出词汇加工效率决定了读者的眼动模式，即语言效率假说（linguistic-proficiency hypothesis），并成功进行了计算机模拟（Reichle et al., 2013）。

成人阶段是阅读能力发展的顶峰（Joseph et al., 2013）。那么对已具备熟练阅读技能的成人读者来说，其词汇加工模式是否存在个体差异？一致性假说（Andrews, 2015）认为，所有熟练读者在阅读中的认知过程是相同的，个体间的差异只是对文本信息提取速度的区别，即“量”的差异，具体的阅读模式（包含词汇加工）没有本质区别（Ashby et al., 2005）。与之相对的差异性观点则认为，阅读个体差异在毕生发展中稳定存在，这种差异不仅是“量”上的，而且具有本质区别，由此推测，熟练读者的阅读模式存在个体差异，具体的词汇加工模式具有本质差异（Kuperman &van Dyke, 2011; Taylor & Perfetti, 2016）。基于拼音文字阅读的研究发现，成人读者的个体差异在词汇加工水平上表现突出。例如，Ashby等人使用了综合阅读能力测试将44名成人被试分为高阅读能力组和一般阅读能力组，检验了两组读者对不同词频和预测性词汇的加工是否存在差异。结果显示，一般阅读能力读者的词频效应比高阅读能力读者更大，两组读者对高频词的注视时间相当，但是一般阅读能力读者在低频词上的注视时间比高阅读能力读者的更长。其他使用阅读经验（Taylor & Perfetti, 2016）和阅读流畅性（Barnes et al., 2017）衡量成人读者个体差异的研究也发现了相似的结果，即阅读经验较少或阅读不流畅的读者具有更大的词频效应，而阅读经验更丰富或阅读更流畅的读者的词频效应相对更小。这些研究表明，阅读经验丰富、阅读流畅或阅读能力高的成人读者的词汇加工效率更高，支持熟练阅读的个体差异性观点和词汇质量假说。

阅读中的个体差异在不同语言中的表现并不完全相同（Chen et al., 2018）。在拼音文字中，成人读者的阅读能力越高，其提取的预视量越大（Chace et al., 2005），而在中文阅读中，快速与慢速读者从副中央凹提取的预视量无明显差异（张慢慢, 臧传丽, 徐宇峰等, 2020）。这些可能是由于中文与拼音文字的书写差异造成的。与拼音文字不同，中文由一系列排列紧密的方块字组成，且词间没有明显的视觉边界，这导致中文读者的阅读模式不完全等同于拼音文字（Li et al., 2022）。例如，中文读者比拼音文字读者对副中央凹信息的预视程度更大，眼跳目标选择更灵活（Li &Pollatsek, 2020），对跳读的决定更保守（张慢慢,臧传丽, 白学军等, 2020）。那么中文阅读中词汇加工的个体差异模式与拼音文字阅读是否存在差异？本研究将为检验该问题提供实证数据。已有对中文阅读的发展与老化研究显示，低年级儿童的词频效应比高年级儿童更大（Guan & Fraundorf,2020），老年读者比青年读者的词频效应更大（Liu et al., 2020）。这与拼音文字阅读中的结果一致，显示了随着儿童年龄增长或老年群体年龄增长，词汇加工效率随之提高或降低。当排除年龄作用时，中文阅读中的成人读者的词汇加工效率是否存在个体差异？本研究旨在对该问题进行考察。

在确保读者阅读准确的前提下，阅读速度可以作为衡量个体阅读差异或阅读能力的一个非常有效的综合指标（Rayner et al., 2016）。例如，以阅读速度衡量个体差异的研究显示，快速读者比慢速读者提取的预视范围更大（Rayner et al.,2010），获得预视量越大（Frömer et al., 2015），能更早利用预测性信息加工词汇（Hawelka et al.,2015）。基于此，本研究以有效阅读速度区分成人读者的个体差异，比较快速与慢速读者对不同词频目标词的加工过程。对该问题的考察有助于检验熟练阅读的个体差异性观点和一致性假说，为完善和检验当前阅读眼动控制模型，如中文阅读模型、E-Z读者模型（Li & Pollatsek, 2020; Reichle et al., 2013），提供来自熟练阅读个体差异的证据。本研究假设：如果熟练读者的阅读过程符合一致性假说，那么快速读者与慢速读者的词汇加工模式一致，二者的词频效应不存在差异；如果熟练读者的阅读过程符合差异性观点和词汇质量假说，那么快速读者比慢速读者的词汇加工效率高，词频效应更小。

2 研究方法

2.1 被试

来自天津师范大学的67名（男性16名）在校学生参加了本实验。其中1名被试由于阅读理解正确率较低且眼动数据记录丢失较多而被排除分析。所有被试视力或矫正视力正常。实验结束后每人获得一定报酬。

参考Yan等人（2018）在注视时间和跳读率上的词频效应值，利用G*power计算得出样本量约为15人时达到的统计检验力为0.8。因此本实验从66名有效被试中选取快速读者与慢速读者各15人。具体选取过程为：（1）按照阅读速度（句子总阅读时间除以句子字数）将66名被试的阅读速度由高到低排序；（2）把阅读速度排名前15的被试划为快速组（M=572字/分,SD=48字/分），把阅读速度排名最后的15名被试划为慢速组（M=265字/分,SD=34字/分）。快速组的阅读速度显著快于慢速组（b=-0.76,SE=0.04,t=-18.75,p＜0.001, 95%CI=[-0.84, -0.68]）。快速组的平均年龄为21±2岁，女生11人；慢速组的平均年龄为21±2岁，女生12人。快速组的高考语文成绩（M=107分,SD=10分）与慢速组（M=111分,SD=9分）无显著差异，F(1, 14)=1.23，p=0.286，表明两组被试的综合语言能力接近。

2.2 实验材料

实验使用了Yan等人（2018）的实验材料，共选用了45组高频-低频实验句子，每组句子框架相同，在句中嵌入了高频-低频的双字词词对。句长均为23个字。高频词与低频词在句中的预测性相同，且都为低预测。高频词的词频为190.50次/百万（SD=269.86次/百万），低频词的词频为3.78次/百万（SD=3.86次/百万），且高频词的词频显著高于低频词，F(1, 44)=21.60，p＜0.001，η2p=0.33。高频词与低频词的笔画数分别为15±4画和14±3画，二者无显著差异，F(1, 44)=1.84，p=0.182。实验材料样例见表1。

表1 实验材料例句

将高频和低频条件下的45组实验句按照拉丁方设计分配到2个组块中。除了实验句以外，每个组块还包括8个练习句。实验中27%的句子后设有阅读理解判断题。每名被试只阅读其中一个组块的句子。

2.3 实验设计

实验为2（阅读组别：快速组、慢速组）×2（词频：高频、低频）混合实验设计。其中，阅读组别为被试间变量，词频为被试内变量。

2.4 实验仪器

采用加拿大SR公司生产的EyeLink1000 Plus塔式眼动仪记录被试阅读时的眼动轨迹。该仪器的采样率为1000 Hz。被试机屏幕的刷新率为144 Hz，分辨率为1024×768像素。所有句子以22号宋体呈现。被试距离屏幕约为55cm，每个汉字视角约为0.89°。

2.5 实验程序

每名被试单独施测。正式实验开始前，被试填写知情同意书。实验在相对安静的实验室中进行。被试的任务是逐句阅读并理解句子，并在一些句子后进行阅读理解判断。在被试机屏幕上呈现指导语，确定被试理解实验要求后，对被试的眼睛进行三点校准。校准结束后，开始练习，确保被试熟悉实验程序后，进入正式实验。被试可根据需要休息。整个实验大约持续25分钟。

3 结果

快速组与慢速组的阅读理解正确率分别为92%（SD=8%）和93%（SD=8%），表明两组被试都能很好地理解句子，且没有显著差异，F(1,14)=0.41，p=0.531。

在筛选原始眼动数据时，首先去除注视时间小于80 ms或大于1200 ms的注视点。然后根据以下标准对句子进行筛选：（1）删除由于被试按键失误或头动导致的追踪丢失的句子（0.15%）；（2）删除句子总注视点少于4个的句子（0.30%）；（3）删除3个标准差以外的数据（句子分析：0.61%；目标词分析：0.95%）。

数据分析包括两个部分。第一部分是以句子为单位的整体分析，用来检验快速组与慢速组在整体阅读上的差异，分析指标包括平均注视时间、总注视次数、向前眼跳长度。第二部分是针对目标词的分析，用来考察快速组与慢速组在词汇加工上的差异。目标词分析指标包括：（1）第一遍阅读过程中的首次注视时间（在注视目标词的首个注视点的时间）、单次注视时间（在目标词上有且只有一次注视的时间）、凝视时间（在目标词上的所有注视时间之和），即第一遍注视时间，反映了早期词汇识别的难易；（2）跳读率（在第一遍阅读中目标词被跳读的次数与该目标词被跳读和被注视的总和的比值），反映了词汇提前被加工的难易；（3）回视路径时间（在首次阅读过程中从目标词上的第一次注视到第一次落到目标词右侧区域前的所有注视点的时间之和），反映了词汇语义整合难易；（4）总注视时间（在目标词上的所有注视点的时间之和），反映了整体的词汇识别和语义整合过程（闫国利等,2013）。

在R语言环境下（R Core Team, 2018）使用lme4数据处理包（Bates et al., 2015）建立线性混合模型（linear mixed model）进行数据分析。在运行模型前，对注视时间、注视次数和眼跳长度进行对数转换。跳读率的分析使用广义线性混合模型（generalized linear mixed model）。在模型中，阅读组别和词频为固定因素，被试和项目被指定为交叉随机效应，同时考虑被试和项目的随机截距和随机斜率（Barr et al., 2013）。

3.1 整体分析

整体分析的描述性结果与统计检验结果见表2和表3。结果显示，阅读组别效应在各个指标上都非常显著（|t|s＞4.00,ps＜0.001），具体表现为快速组比慢速组的平均注视时间更短、向前眼跳更长、总注视次数更少。这些结果提示，与慢速读者相比，快速读者在每次注视中的信息加工效率更高，从副中央凹右侧提取的预视信息更多，总的眼跳次数更少，进而整体阅读效率更高。

表2 快速组与慢速组在句子指标上的平均数和标准差

表3 快速组与慢速组在句子指标上的固定效应估计值

3.2 目标词分析

快速组与慢速组在目标词上各眼动指标的平均数和标准差如表4所示，固定效应估计值见表5。

表4 快速组与慢速组在目标词上的跳读率和注视时间的平均数和标准差

表5 快速组与慢速组在目标词上的固定效应估计值

阅读组别的主效应在各个指标上都非常显著（|t/z|s＞2.70,ps＜0.01），具体表现为，快速读者的第一遍注视时间（首次注视、单次注视和凝视时间）、回视路径时间和总注视时间比慢速读者更短，跳读率比慢速读者更高。

词频主效应在单次注视时间、凝视时间、回视路径时间和总注视时间上非常显著（ts＞2.47,ps＜0.05），在首次注视时间（t=1.91,p=0.057）和跳读率上（z=-1.83,p=0.067）边缘显著。具体表现为，与低频词相比，被试对高频词的第一遍注视时间、回视路径时间和总注视时间更短，跳读较多。

阅读组别与词频的交互作用在注视时间指标上均显著（ts＞2.04,ps＜0.05），在跳读率上的交互作用不显著（z=0.31,p=0.758）。对注视时间的简单效应分析结果表明，快速组的词频效应不显著（首次注视时间:b=-0.001,SE=0.003,t=-0.18,p=0.855; 单次注视时间:b=-0.001,SE=0.003,t=-0.35,p=0.729; 凝视时间:b=-0.001,SE=0.003,t=-0.31,p=0.758; 回视路径时间:b=0.003,SE=0.004,t=0.73,p=0.467; 总注视时间:b=0.002,SE=0.004,t=0.47,p=0.636），即快速组在高频和低频目标词上的注视时间没有显著差异。而慢速组的词频效应非常显著（首次注视时间:b=0.01,SE=0.002,t=3.14,p=0.002; 单次注视时间:b=0.01,SE=0.002,t=4.02,p＜0.001; 凝视时间:b=0.01,SE=0.003,t=4.38,p＜0.001;回视路径时间:b=0.02,SE=0.003,t=5.07,p＜0.001; 总注视时间:b=0.02,SE=0.004,t=4.78,p＜0.001），慢速读者对低频词的注视时间比高频词更长。图1以凝视时间为例呈现了两组被试的词频效应。

图1 快速组与慢速组在凝视时间上的词频效应

4 讨论

本研究通过对比快速读者与慢速读者的词频效应探讨了熟练读者词汇加工的个体差异。从句子分析的结果可知，快速读者比慢速读者的平均注视时间更短、总注视次数更少、向前眼跳距离更长，整体阅读速度更快。这表明快速读者整体的阅读效率更高，与之前的研究一致（张慢慢, 臧传丽, 徐宇峰等, 2020; Rayner et al., 2010; Risse,2014），也说明本研究对快速与慢速读者的分组非常有效。

在目标词上，本研究发现了非常显著的阅读组别主效应，验证了快速读者比慢速读者整体的词汇加工更快（张慢慢, 臧传丽, 徐宇峰等,2020）。本研究也验证了经典的词频效应（臧传丽等, 2012; Clifton et al., 2016），即高频词比低频词更容易识别。更重要的是，本研究发现词频效应在快速组与慢速组上的表现模式不同。快速读者的词频效应在所有注视时间指标上都不显著，即对高频词和低频词的加工都很快且没有差异，这说明他们在早期词汇识别和后期语义整合过程的效率都很高。慢速读者在所有注视时间指标上有显著的词频效应：慢速读者对低频词的第一遍注视时间（首次注视、单次注视和凝视时间）、回视路径时间和总注视时间都长于高频词，即对低频词的早期词汇识别和后期语义整合更困难；这表明了慢速读者的词汇加工受词频影响更大。由此可知，在中文阅读中，快速读者与慢速读者的词汇加工模式存在本质区别，支持熟练阅读的个体差异性观点。该结果与拼音文字阅读关于词频效应个体差异的研究结果一致（Ashby et al., 2005;Barnes et al., 2017; Taylor & Perfetti, 2016）。根据词汇质量假说，阅读能力高是由于读者具有高质量的词汇表征（Perfetti, 2007）。在本研究中，快速读者词汇表征质量可能高于慢速读者，因而整体的词汇加工效率更高，而且由于快速读者阅读经验更丰富（Barnes et al., 2017; Taylor & Perfetti,2016），对高频词和低频词的接触频率都较高，从而对低频词的加工与高频词同样高效。而慢速读者由于词汇表征质量较弱、阅读经验较少，在词汇加工整个过程都表现出较低的效率，特别是对低频词的加工表现出更大的困难，因而存在更大的词频效应或者说受词汇属性的影响更大。本研究使用高考语文成绩匹配了快速与慢速读者的综合语言能力，但是并未详细区分二者在阅读不同方面（如，词汇知识、拼写能力等）的差异，今后需要借助适用于成人阅读的测量工具，进一步检验词汇知识、拼写能力等对词汇加工的个体差异的影响。

上述结果与张慢慢、臧传丽、徐宇峰等人（2020）发现的快速读者与慢速读者的词频效应模式存在差异。该研究除了操纵目标词词频，还操纵了目标词下一个词的预视，结果发现快速读者有显著的词频效应；而慢速读者对高频词和低频词的注视时间无差异，但都长于快速读者。造成该结果的一个原因可能是受下一个词预视的影响。张慢慢、臧传丽、徐宇峰等人的研究结果显示目标词上的词频效应受下一个词预视的调节：在词汇加工的早期阶段（即首次注视上），当下一个词的预视无效时，慢速读者对高频词的加工受到了干扰，导致他们对高频词的加工时间与低频词一样长；而快速读者对不同词频目标词的加工不受预视的影响。本研究排除了不正常预视带来的影响，直接检验了在自然句子阅读中快速读者与慢速读者的词频效应。另一个原因可能是本研究选用的目标词的词频范围以及选取被试的阅读速度范围与以往研究不同。总体来看，无论词频效应的个体差异模式怎样，本研究与以往研究共同表明在有效阅读中快速读者的词汇加工效率高于慢速读者。

本研究结果证明了熟练读者个体间的词汇加工过程并不相同，而是存在本质差异。这否定了熟练阅读的一致性观点，即所有熟练读者的阅读模式相同；而支持个体差异性观点，即阅读的个体差异具有质的区别且在毕生发展过程中一直存在（Rayner et al., 2012; Reichle et al., 2013）。本研究结果也为E-Z读者模型的语言效率假说提供了来自成人读者个体差异的证据（Reichle et al.,2013），证实了快速与慢速读者的眼动模式由其词汇认知过程决定。最近，Li和Pollatsek（2020）针对中文阅读的特殊性构建了中文阅读过程中词汇加工与眼动控制的整合模型，即中文阅读模型（Chinese reading model, CRM），指出词频是影响中文读者眼动控制的一个重要词汇因素，并成功模拟了词频效应。但该模型还未对词汇加工如何受个体差异调节进行具体预测和模拟。当前研究结果将为中文阅读模型提供成人阅读个体差异方面的实证数据，有助于进一步发展和完善该模型。