图片命名中词汇频率效应的眼动研究

2015-04-29陈曦翁秋霞

心理与行为研究 2014年3期

陈曦　翁秋霞

摘要在延时命名范式的基础上，通过控制熟悉性并运用连续图片命名的眼动记录技术，考察图片的注视时间，将词汇提取的过程单独地呈现出来。实验结果表明，在控制熟悉性及延时命名的条件下，图片名称的频率仍影响着图片的注视时间，表现出频率效应，但对出声输出的快慢没有影响，从而进一步证实了图片命名频率效应的“词汇通达假设”。

关键词频率效应，延时命名，词汇通达，注视时间。

分类号 B842.5

1 前言

词汇通达，即从心理词典中提取目标词汇的过程，是言语产生的核心问题（Dhooge&Hartsuiker，2010）。其中最为突出的现象是频率效应：在图片命名时，高频名称的比低频的产生要快。频率效应对于研究词汇通达具有十分重要的意义，它被认为是由于高、低频图片在词汇表征或加工上的差异造成的（Caramazza，1997；Levelt，Roelofs，&Meyer，1999）。但是名称频率又与图片的熟悉性、视觉特征存在很高的相关：高频名称的往往也是熟悉性高的。由此引出一个重要的问题：频率效应是由图片的熟悉性高低引起的，还是由词汇通达快慢造成的？它反映的是图片识别、概念激活，还是目标词汇提取的过程？这就是“输入假设（input hypothesis）”与“词汇通达假设（lexical access hypothesis）”两大理论争论的焦点（Almeida，Knobel，Finkbeiner &Caramazza，2007）。

“输入假设”认为，频率效应发生在图片识别的输入阶段，主要受图片的视觉特征及熟悉性影响（Johnson，Paivio，& Clark，1996）。Bates等人（2003）认为，频率效应就是概念激活效应，它体现的是概念的熟悉性。他们在一个七种语言图片命名的大型研究中发现，即使将目标语言的频率纳入为一个变量，基于其它六种语言的频率等级评定指标，也能解释在这七种语言命名中命名一致性与反应时之间的变异。甚至在其中的四种语言中，目标语言的频率对这个变异没有显著贡献。他们认为不同国家语言的被试命名同一张图片时所产生的反应时的变异，是由不同语言环境下的图片熟悉性、命名一致性及目标词汇频率等变量造成的。将目标语言的频率变量纳入统计分析时（即将其影响分离出来），这个频率综合性评定指标仍能解释命名一致性与反应时之间的变异，说明它反映的就是剩余的变量（熟悉性变量）影响的大小，即图片的熟悉性是影响频率高低的最终原因。因此Bates等人（2003）认为频率综合性评定指标反映的是图片的熟悉性，频率效应是概念加工的结果。另外，在无需命名的、图片真实性与否的判断任务中发现，在真实物体条件下，名称高频的图片比低频的反应快。可见，即使在无需词汇通达的按键反应中也能出现命名时的频率效应，说明这个效应可能是图片识别中的熟悉性效应（Kroll & Potter，1984）。

“词汇通达假设”却认为频率效应反映的是目标词汇提取的过程，是词汇通达快慢的指标。它发生在图片识别、概念激活之后的词汇通达阶段，而不是前期的识别阶段。Jescheniak和Levelt（1994）的按键反应实验发现，当要求被试判断当前目标图片内的物体是否是之前呈现单词的描述物时，高频图片并没有比低频反应快，没有出现频率效应，说明词汇频率没有影响图片识别。Meyer，Sleiderink，Lev-elt（1998）运用连续命名的眼动研究，即要求被试对左右并列的两个图片，按从左到右先后的命名时，发现左边第一个图片的命名反应时及注视时间表现出频率效应：高频的比低频的反应时及注视时间都短，但将命名改为归类的按键任务时，频率效应就消失了。因此他们认为频率效应反映的是词汇提取而不是概念激活的快慢。

显然，Jescheniak（1994）及Meyer（1998）等人在按键判断的实验中没有发现频率效应也并不能真正地否定“输入假设”，因为这可能是实验灵敏度或统计检验力低而没能检测出来。Kroll & Potter（1984）虽然在无需命名按键反应中发现频率效应，但不排除被试会借助激活词汇来帮助判断的可能性：可命名的或名称容易提取的就断定为“真实物体”，不可命名的或名称很难提取就断定为“虚假物体”。Bates等人（2003）也只是通过统计的变异剩余法间接证明“输入假设”的，即由于频率与熟悉性存在相关，同一图片下不同语言的频率综合评定指标可能反映的是物体的熟悉性。由此可见，以上的研究都不能直接对这两大假设进行证伪。Almeida等人（2007）指出，过去的研究都是通过引入只涉及图片命名的输入阶段，而非词汇通达阶段的任务来验证输入假设的，如果在这些任务中出现频率效应则证实该假设，反之则否。但事实上即使在这类任务中没有出现频率效应也不能否定输入假设的观点。为此Almeida等人（2007）采用了延时命名的实验范式，即镶嵌在灰色圆内的目标图片呈现1000ms之后，灰色的圆变成蓝或黄色，此时被试根据颜色进行相应的反应：蓝色为归类反应（动物或人造物），黄色为图片命名。1000ms的界入就是为了让目标图片在反应之前得到充分的加工，即完成识别、概念激活的过程，以消除熟悉性对后期词汇提取的影响。如果在延时条件下图片命名仍会出现频率效应，说明这个效应反映的是词汇提取，而非图片识别、概念激活的快慢，是发生在词汇通达，而非图片识别阶段。作者为了让被试在图片呈现1000ms之后才进行目标词汇的提取，采用了归类与命名两种反应不确定出现的方式，使被试在反应线索（圆的颜色）变化之前不能确定是否要进行图片名称的提取。这两种反应都共同地涉及到概念激活的过程，同时通过增加归类反应出现的概率（归类与命名的比例为3：1），以形成归类反应优势，促进被试产生归类反应的倾向。实验结果表明，即使在延时1000ms之后才进行图片命名，频率效应仍然出现，说明这个效应是发生在排除熟悉性影响下（即概念通达）的词汇通达阶段，反映的是词汇提取的快慢，从而直接地证实了“词汇通达假设”。

但是，言语产生除了有概念激活、词汇通达阶段外，还有输出发音阶段。输出发音阶段包括目标词汇的语音表征进入输出缓冲区，并转换为音位表征，然后提取发音动作程序，最后执行发音动作等通过发音输出通道的一系列复杂过程（Indefrey & Lev-elt，2004；Levelt，et al.，1999）。输出通道对言语产生的影响正是当前反应排除理论的核心观点，即借助图片目标词通过输出通道的快慢来解释图词干扰效应（Finkbeiner & Caramazza，2006；Elisah &Hartsuiker，2010）。反应排除理论认为，在图词干扰的范式中，目标图片的词汇提取与干扰词的激活水平并不存在着选择竞争，语义干扰效应体现的是图片目标词汇与干扰词在反应输出通道的竞争。由于输出系统存在着“瓶颈”限制，即一次只能输出一个词汇，而干扰词又有比图片更具有优先占据输出通道的特性，所以只有将干扰词从输出通道中清除出去，目标词汇才能输出。由于语义相关干扰词的输出表征比无关干扰词的更容易满足反应标准，所以它被清除出去的难度更大，造成目标词汇通达输出通道并命名发音的速度变慢，语义干扰效应便由此产生（Mahon，Costa，Peterson，Vargas &Caramazza，2007；Janssen，Schirm，Mahon，&Caramazza，2008）。可见，与图片有语义相关的干扰词相对无关词会使到目标词汇发音输出变慢，从而产生语义干扰效应。这就引出一个问题：词汇的频率是否也反映音位表征形成、动作程序编制及语音输出等一系列经过输出通道，而非词汇提取的过程？高频的目标词汇是否比低频的通过输出通道并发音快？要弄清楚这个问题就必须将词汇通达与输出阶段分离开来。虽然延时命名能够将输入与词汇通达阶段分开，但由于记录的是反应时，而反应时又是整个加工过程的综合指标，所以很难通过它将词汇提取从输出阶段分离出来。但是，一系列的眼动研究表明，在连续图片命名的任务中（即顺序地命名多张图片），图片的注视时间反映了概念词汇化阶段，即概念激活及词汇提取的过程，与发音输出无关。注视点会在词汇提取完成之后转移到下一个目标，然后才进行发音命名，即被试往往是注视着下一个目标来命名上一个图片的（Meyer，1998；Meyer，Ouellet，& Hacker，2008；Roelofs，2008；Griffin &Oppenheimer，2006；Malpass & Meyer，2010），这样图片的注视时间就与输出反应分隔开来了。

另外，在Almeida等人（2007）的英文实验材料并没有控制高、低频率图片的熟悉性，在Janssen等人（2008）的英文实验材料则清楚地表现出高、低频率图片在熟悉性上存在显著的差异。这可能是由于拼音语言的现象，即熟悉性与图片名称频率高度相关。汉字与拼音文字不同，是一种意音文字，字形与语音的对应关系不明显，正字法透明度低，形音映射任意。在汉语系统中，词频通常表现为书面语言（字形）的使用频率，而概念的熟悉性则更多地受日常生活使用概率（如口语）的影响。由于汉语的形音分离，口语的使用频率（熟悉性）并不一定体现在字形学习时间的早晚和使用率上，这样就会造成熟悉性与词频不一致，即高熟悉性的却是低频词（如“螃蟹”）。我们正是利用汉语的这个特点，通过控制概念的熟悉性，操纵目标词频率的图片（高、低频）将熟悉性与词汇频率分离开来。

本实验为了将词汇提取过程单独地表现出来，在延时命名的基础上（消除频率对概念激活的影响），采用控制图片的熟悉性及连续快速命名的眼动技术，通过目标图片的注视时间来反映词汇提取的快慢，从而进一步验证频率效应与词汇提取的关系。

2 方法

2.1 被试

24名某大学本科生，平均年龄约为18.7岁，所有被试视力正常或矫正正常，实验结束后付给少量报酬。

2.2 实验材料

从张清芳和杨玉芳（2003）修订的标准化图片数据库中，分别在两个类别中（动物和人造物）选择70张普通物体图片，并在每个类别中选择20张图片作为目标图片（要求命名名称），剩下的50张图片作为填充项目（要求命名类别），两者比例为1：2.5。采用两种反应的形式及拉大它们之间的比例，就是促使被试形成类别命名的倾向，降低他们在1000ms图片呈现时提取名称的概率。填充项目不参与统计分析。在每个类别的目标图片中，10张（频率高于500，十万分之一为单位）作为高频组，10张（频率低于100）作为低频组。两组都选择高熟悉性的图片（平均分为4.6，5点量表），以降低它们在熟悉性的差异，进一步消除熟悉性的影响，同时对其它属性进行匹配，统计结果表明只有图片名称的频率主效应显著（见表1）。

2.3 仪器及任务

实验采用SR Research公司的EyeLink 1000眼动仪，取样频率为1000Hz，采用9点随机定标、校准。电脑显示屏幕为21寸，分辨率为1024×768像素，与眼睛的距离为65cm。镶嵌在半径为150像素的颜色圆内的图片，以黑线白底的形式呈现在白底屏幕中央。为了使图片的注视时间能成为表示词汇化加工的有效指标，被试需尽快地将注视点从图片上转移到其他对象上。所以在屏幕最右边的中央，随机地出现较小的“+”（加号）或“*”（星号），并在两侧增设“###”作为侧向掩蔽，目的是使被试只有在注视该对象时才能清楚地识别和反应。“+/*”字符与屏幕的中心距离为11.9cm（10.5°），字符大小为0.32cm×0.32cm（0.28°×0.28°），要求被试又快又准地连续对图片（类属或名称）和最右边的“+/*”命名。

2.4 实验程序

实验分3个阶段。第一阶段为熟悉材料阶段，发给被试一个印有所有实验图片的小册子，每张图片下面标示类属（动物或人造物）和名称，让其熟悉实验图片及名称。第二个阶段为熟悉实验程序的练习阶段，共有20个练习项目。第三个阶段为正式实验，实验流程与第二阶段一样：即首先呈现十字形注视点800ms（注视点校准），接着呈现镶嵌在灰色圆内的图片1000ms，然后圆的颜色变成蓝色或黄色，并在屏幕的最右方出现“###+/###”，要求被试根据圆的颜色又快又准地连续命名图片类属（蓝色）或名称（黄色）和右边的“+或*”，限时3000ms，记录反应时及注视时间，计时始点为圆的颜色变换。项目之间的间隔为1000ms。每张图片只呈现一次。将填充图片分成40个填充组，每个填充组分得2至4个填充项目，将目标项目按假随机分配在每个填充组之后，经此获得的组块同样进行假随机排序。项目的实验顺序受到以下的限制：（1）同一类属的项目不会连续出现3次以上；（2）前后图片之间不存在同音关系。眼动仪配有支托架，能很好地固定头部的位置。

3 实验结果

以下情况将被标记为错误去掉：（1）与目标反应不一致；（2）命名不流畅；（3）语音键错误触动；（4）反应时少于100ms。数据统计只针对图片名称命名反应的，图片类属命名的不参与统计（实验结果见表2）。

3.1 名称命名反应时统计分析

去掉三个标准差之外的数值（1.01%），高频图片的平均命名时比低频的快61ms，差异非常显著t（23）=2.97，p<0.01，说明高频图片的命名比低频的快，表现出明显的频率效应。

3.2 名称命名的图片注视时间统计分析

为了确保注视指标的有效性，在练习时反复强调要又快又准地连续命名两个部分，如“狗，星号”。从眼动轨迹上看，被试的注视点都能从图片转跳到屏幕的最右边，并能很好地完成右边的命名任务（+/*），准确率高达99%以上。

去掉三个标准差之外的数值（1.01%），高频图片的平均注视时间比低频的少72ms，两者差异显著t（23）=2.56，p<0.02，说明高频图片的注视时间比低频的短，表现出明显的频率效应（实验结果见表2）。将命名反应时减去图片注视时间以获得对应的输出发音时间，统计分析表明高低频两者差异不显著，t（23）<1，说明频率的高低并没有影响输出发音的快慢。

4 讨论

研究图片命名频率效应最为关键的就是要熟悉性与名称频率分离开来。首先，最为直接简单的方法就是控制熟悉性，操纵频率变量，比较命名反应时的差异。但是如何获得图片熟悉性的指标呢？目前采用的方法是被试评定法（张清芳，杨玉芳，2003）。显然，这种方法不但存在着被试代表性的问题，而且主观、粗糙（如五点量表）。Bates等人（2003）利用相对客观的频率指标，借助它与熟悉性存在着高度的相关性，创建了不同语言下频率的综合评定指标，并运用统计分析，将目标语言频率的影响消除，间接地说明频率综合评定指标与熟悉性的关系。从中可以看到，如何客观、准确地测定图片的熟悉性是今后需要研究的课题。

其次是采用任务控制法，即通过无需名称命名的任务（如按键判断或归类）以消除词汇提取的过程。如果频率效应在这些任务中仍然出现，则说明它不可能发生在词汇通达阶段。但是实验正反两方面的结果都存在，所以很难就此给予确定的结论。我们认为这可能是由于不同的任务可借助激活名称来帮助判断的程度不同造成的。Kroll和Potter（1984）在判断任务中发现频率效应，而Jescheniak（1994）及Meyer（1998）等没有发现，可能是由于该任务会让被试借助图片的名称进行真假性判断，从而促使词汇提取的产生。而Jescheniak（1994）的前后一致性及Meyer（1998）的归类任务却可以在概念水平上完成，无需借助图片的名称。

第三是延时命名法，就是通过延时命名范式将早期的图片识别及概念激活阶段与后面的加工阶段（词汇通达与出声命名）分离开来。Almeida等人（2007）在被试反应之前预先呈现图片1000ms，目的就是为了让图片得到充分的识别及概念的激活。为了防止被试在此时间内也进行词汇提取等后续的加工，从而降低频率效应出现的概率，实验采用不确定反应方式及增大归类判断的比例。实验结果表明即使在延时命名的条件下，频率效应仍然出现。虽然这种延时反应可以将图片识别与后面的阶段分离开来，但由于记录的是反应时，所以很难进一步将词汇提取与发音输出分离开来。本实验在延时反应的基础上，利用连续命名条件下的图片注视时间将词汇提取阶段单独地呈现出现。实验结果表明高频图片的注视时间要比低频的短，而在发音输出的时间却没有显著的差异。这说明频率影响的是词汇提取而非发音输出，从而进一步证明频率效应的出现就代表着词汇提取过程的发生。

另外，本实验也发现即使在控制熟悉性的条件下，图片名称的频率效应仍能出现，即高频的比低频的在命名时间及图片注视时间都短。本研究所使用的词频数据（张清芳、杨玉芳，2003）来自于《现代汉语频率辞典》，该辞典的语料样本绝大部分是来自书面材料，即词频主要反映的是书面文字，而非口语的出现频率。这说明在进行图片命名时，书面文字的频率对图片命名的快慢产生了影响，表明在口语产生的过程中（即说话）存在着书面语言的提取，书面语言的使用频率决定着口语产生的快慢，即词形提取是语音提取的前提。这个推论对于缺乏文字识别能力的人（如文盲）来说似乎是不合理的，他们虽然缺乏文字阅读的经验，即书面语言的词汇频率对于这些人没有意义，但是对于高熟悉性的概念（如“螃蟹”）的言语表达是没有问题的。为什么实验结果与现实的生活会存在着不一致呢？我们认为这可能是由于言语产生常规的实验程序造成的。图片命名是研究言语产生最为常见的方法，它包含了言语产生的一般过程：概念激活，选择词汇及发音。为了能更好地控制和研究被试的言语产生过程，通常在正式实验前要求被试熟悉每张图片和记住相应的标准名称（以书面文字出现），并在正式实验中要求以该标准名称进行命名反应，否则按错误处理。这样虽然可以避免被试随意命名图片，但也可能造成被试为了保证又快又准地命名图片，会通过提取在图片熟悉阶段中的图片名称进行命名，而不是按照自己常用的名称进行命名，从而引入了书面词汇熟悉程度（即词汇频率）的影响因素，表现出高频词汇比低频提取得快，造成两者在命名反应中存在差异。这说明在实验中发现的图片命名频率效应可能是由于实验程序影响的结果，与自然条件下用自己常用和熟悉的名称进行言语表达的情况不同，这个观点还需进一步检验。同时也说明，要更好地控制和操纵词汇的熟悉性与频率，不但要考虑到书面语言的词频数据，还要兼顾到口语库中的词频数据，而后者往往会被研究者忽视。

5 结论

在图片命名中出现的频率效应，反映的是词汇提取的快慢，体现为词汇提取的指标，与图片的熟悉性及出声输出快慢无关。

心理与行为研究

2014年3期

图片命名中词汇频率效应的眼动研究

杂志排行

心理与行为研究的其它文章