汉语口语词汇识别中声调、语境的作用：来自眼动研究的证据

2018-12-13王露万鹏任桂琴

心理与行为研究 2018年2期

王露万鹏任桂琴

摘要为探讨汉语口语词汇识别过程的影响因素，本研究采用眼动方法，结合视觉一情境范式，通过2个实验考察了不同语境条件下声调对汉语双字词听觉词汇识别的作用。结果发现：（1）在不同语境中，三种竞争词各自的总注视时间显著长于无关控制词；（2）在低限制性语境中，高频词的凝视时间显著短于低频词；（3）在低限制性语境中出现词频效应。该结果表明：音段信息、声调都能够影响口语词汇识别过程，实验结果支持TRACE模型。

关键词：口语词汇识别，声调信息，语境，眼动。

1引言

日常生活中，人们是怎样通过口语加工完成语言理解的？对这一问题的回答主要集中在以英语等拼音文字为材料的研究上。以往大量研究（McClelland&Elman;，1986；Luce&Pisoni;，1998；Norris，McQueen，&Cutler;，2000；Johns，Gruenenfelder，Pisoni，&Jones;，2012）认为，口语词汇识别（spoken word recognition）的认知加工过程可以分为两个阶段：一个是受声调影响的词汇激活阶段，另一个是受词频特征影响的词汇分析阶段。对这两个阶段加工的解释主要有两个模型，即Cohort模型（Marslen-Wilson，1987）和TRACE模型（McClelland&Elman;，1986）。

Cohort模型（McClelland&Elman;，1986；Marslen-Wilson&Zwitserlood;，1989；Allopenna，Magnuson，&Tanenhaus;，199 8；Dahan，Magnuson，Tanenhaus，&Hogan;，2001）認为，在声音信号输入100-150ms内的音首部分，会激活具有相同起始音的若干候选词（首音相同竞争词），这些候选词会与目标词进行竞争。伴随着声音的逐渐展开，与目标词相符合的词激活水平越来越强，直至完全匹配。该模型重视自下而上的加工对词汇的激活功能，强调首音信息对口语词汇的作用。TRACE模型（McClelland&Elman;，1986；Connine，Blasko，&Titone;，1993；龚文进，2007）则认为，听觉语言的加工取决于听觉刺激的输入类型，以及心理词典（mentallexicon）相互匹配的程度，并把这种匹配称为整体效应（global goodness of fit）。当竞争环境越大、词语表征越相似时，竞争词语之间的抑制效果就越明显；即使首音部分不同，只要音节（syllable）的中间部分高相似度也会激活词汇的表征，该模型支持自上而下的加工过程。

近年来Cohort模型和TRACE模型完全对立的观点已趋于缓和，都对高水平语言信息的作用给予了重视，认为高水平语音信息能够影响低水平信息的加工过程（Moss&Marslen-Wilson;，1993；Salverda，Kleinschmidt，&Tanenhaus;，2014）。与孤立语境中的词汇加工相比，句子语境中影响词汇识别的因素更为复杂，需要整合来自语音、语法、语用等多方面的信息。Rayner，Fischer和Pollatsek（1998）对不同语境下词汇识别过程进行了研究，结果发现：在高限制性句子语境中，声调在词汇激活阶段起到了重要作用；而在低限制性句子语境中，声调、字形在词汇激活、识别阶段都发生了作用。后续的研究中也发现语境因素在词汇识别各个阶段的作用（Lotto，Sullivan，&Holt;，2003；Yang，Perfetti，&Liu;，2010）。

汉语是一种声调语言，以往对汉语口语词汇识别过程的探索，主要集中在对音段信息（seg-mental information）、声调的探讨上（Taft&Chen;，1992；Norris，1994；Marslen et al，1996；Soto-Faraco，Sebastifin-Gallds，&Cutler;，2001；Wiener&Ito;，2015）；汉语中的音段信息主要指音节的韵母、声母方面。对于汉语口语词汇识别的加工过程，研究者还没有一致的结论，主要分歧在于声调信息是否在词汇激活阶段发挥即时作用。有的研究虽然肯定声调在激活阶段作用，但认为作用时间是延时发生的（Cutler&Chen;，1997；Ye&Connine;，1999；Zhou，Qu，Hua，Gaskell，&Wilson;，2004；Shen，Deutsch，&Rayner;，2013）。还有研究认为，音段信息和声调发挥了相似的作用（Malins&Joanisse;，2010）；Sereno和Lee（2015）认为音段信息发挥了核心作用，声调的作用其次。这些不同的研究结论体现出汉语独特的口语加工过程。在汉语的口头语言中，存在大量的同音异义词，这意味着要对接收的声音信号中可能包含的多种含义中进行辨析、甄别，才能最终完成口语词汇的通达过程。对汉语语境的研究也发现了其对词汇识别的影响（谭力海，彭聃龄，1990；朱晓平，1991；鲁忠义，熊伟，2001；任桂琴，韩玉昌，刘颖，2012；Bieta1.，2016）。此外，语境中的词频特征也会影响口语词汇识别的时间进程（Lute&Pisoni;，1998）。对汉语的研究发现词频效应出现在低限制性句子中，在高限制性句子中没有发现词频效应（任桂琴，2006；任桂琴，刘颖，于泽，2012）。

本文采用眼动方法，结合视觉一情境范式考察汉语双字词口语识别中的声调、语境信息及不同词频特征对口语加工过程的影响。视觉一情境范式认为，当同时接收听觉刺激和视觉刺激时，被试会倾向注视那些与听觉刺激有关联的视觉刺激（Cooper，1974）。该范式的假设是接收的听觉激活与视觉刺激一致时，被试倾向于长时间或多次注意被激活的视觉刺激（王穗苹，关心，2009）。后续的研究者使用该范式进行了句法歧义消解、语义加工、语音表征、视觉注意等方面的研究（Spivey，Tanenhaus，Eberhard，&Sedivy;，2002；Huettig&Altmann;，2005；Huettig&McQueen;，2007；Altmann&Kamide;，2007；B rown，Salverda，Gunlogson，&Tanenhaus;，2015）。

实验中采用了首次注视时间（First FixationDuration）、总注视时间（Total Fixation Dura-tion）、凝视时间（GazeDuration）这3个眼动指标。首次注视时间指的是通过兴趣区内的首个注视点的注视时间（闫国利等，2013）。总注视时间指落在兴趣区内的所有注视点的持续时间总和，是信息加工过程的综合表现（闫国利等，2013）。凝视时间指从首次注视点开始到注视点首次离开当前兴趣区之间的持续时间，包括兴趣区内的回视（张仙峰，叶文玲，2006）。这些眼动指标已被之前的研究证明能够有效反应出语音信息在词汇加工中的作用（Rayner，1998；Wong&Chen;，1999）。实验一、二均采用区域分析的方法，将汉-语双字竞争词划分成一个兴趣区进行分析，每个兴趣区的大小一致。

2实验一高限制语境条件下声调信息对汉语双字词听觉词汇识别的作用

2.1被试

选取23名辽宁师范大学的本科生和研究生（其中10名男生，13名女生）。年龄21-26岁，平均年龄为23岁。母语均为汉语，裸眼视力及校正视力均正常。无听力及阅读障碍。

2.2实验设计

采用4（竞争词类型：首音相同、尾音相同、声调相同、无关控制词）x2（目标词词频：高频、低频）两因素被试内实验设计。

2.3实验仪器

采用加拿大SR Research公司生产的Eyelink1000眼动仪，1000HZ瞳孔-CR眼部跟踪。实验材料呈现在19英寸纯平显示器上，0.25-0.5度的精确性，0.01度的RMS空间分辨率，屏幕刷新频率为150Hz，屏幕分辨率为1024像素x768像素。

2.4实验材料

从《现代汉语词典》（2005）和《现代汉语频率词典》（1986）中选取40个双字词做为目标双字词，其中20个高频双字词（平均词频M 123.96/百万，SD=74.73），20个低频双字词（平均词频M=3.22/百万，SD=1.74）。另外选取160个双字词作为与匹配的竞争双字词。每个目标双字词分配4个竞争双字词：首音相同的竞争词（首字音节和声调相同、尾字音节和声调不同）、尾音相同的竞争词（尾字音节和声调相同、首字音节和声调不同）、声调相同的竞争词（首尾声调相同、首字音节和尾字音节不同）、无关控制词。

实验呈现的图片由4个双字竞争词组成，对4个竞争双字词的屏幕位置进行平衡，所有trail中的词频高低各半。实验的听觉材料是由普通话一级乙等的人通过语音工作平台录制。控制语音录制的分贝和频率等因素，分贝为70dB。实验一为高限制性句子，图片所匹配的听觉句子是“白鸽代表着和平”。

为确定句子语境对目标双字词预测性的高低，将目标双字词放置于句尾。与以往研究（Rayner et al，1998）类似，句子语境的限制强度是通过不完整句的填充实验得以确定的。请25名同质被试填充省略句，选出填充概率高于70%的句子作为高限制性语境句，低于30%的句子作为低限制性语境句。由此得到含高频词和低频词的句子各半，即高频高限制语境、高频低限制语境、低频高限制语境、低频低限制语境四种实验条件下的句子各10个。

2.5实验程序

（1）被试进入眼动实验室后，坐在离显示器60厘米的地方，下巴放在支架上，额头抵住支架的上部，戴好耳机，适当的调节椅子及显示器的高度。位置坐好后進行九点矫正，矫正成功进入练习实验。（2）向被试呈现指导语：您好！欢迎来到眼动实验室。实验开始后，你将看到一个“+”的注视点，之后屏幕上会出现含四个双字词的图片，呈现图片的同时你会听到一句话。你可以在屏幕上自由浏览，并通过空格键结束浏览。结束浏览后随即出现对前一张图片的提问，如：屏幕上是否出现了句子中的双字词？是，按1；不是，按2。明白要求后，请按空格键开始练习。（3）告知被试实验开始后不要晃动身体和头，左手拇指放在空格键上，右手食指和中指放在1和2上。（4）被试理解指导语后，开始进行练习和正式实验，眼动仪自动记录正式实验中被试的眼动情况及按键反应。（5）整个实验持续约25分钟。

2.6统计结果分析

实验记录数据由Data viewer软件处理。剔除正确率低于75%的2名被试及1名眼动数据记录失败的被试。剔除注视时间小于60ms的注视点及大于1000ms的注视点及数据中三个标准差之外的数据（Malins&Joanisse;，2010），共占整体数据的4.5%。用SPSS16.0对四个兴趣区的多个指标进行4x2重复测量方差分析，得到竞争词类型、词频的描述性统计数据，具体情况如表1所示。

竞争词类型的主效应分析结果：在首次注视时间上的差异不显著，F（3，57）=1.073，p>0.05；凝视时间上的差异不显著F（3，57）=2.064，p>0.05；总注视时间上的差异显著F（3，57）=3.023，p<0.05。多重比较发现，首音相同竞争词、尾音相同竞争词、声调相同竞争词的总注视时间分别显著大于无关控制词。词频的主效应分析结果：首次注视时间上的差异边缘显著F（1，19）=3.262，p<0.05；凝视时间上的差异不显著F（1，19）=2.262，p>0.05；总注视时间上的差异不显著F（1，19）=2.046，p>0.05。

竞争词类型、词频的交互作用分析：首次注视时间上的差异不显著F（3，57）=0.499，p>0.05；凝视时间上的差异不显著F（3，57）=1.130，p>0.05；总注视时间上的差异显著F（3，57）=6.871，p<0.05。

简单效应分析发现，高频词、低频词在尾音竞争词条件下的差异显著（p<0.05），首音相同竞争词、无关控制词在高频条件下差异显著，高频词条件下的尾音相同竞争词的总注视时间显著多于无关控制词。低频词水平上，各竞争词交互作用差异不显著。

实验一的各项指标分析说明：高限制性条件下，被试可以较快的判断出首音相同竞争词，而区分尾音相同竞争词时出现了困难，说明尾音相同竞争词与听觉材料更相似，而不是仅仅靠首音信息的作用，支持了TRACE模型强调语境作用和-整体匹配的观点。声调相同竞争词的总注视时间显著大于无关控制词，体现出声调在双字词识别过程中的即时作用。

3实验二低限制语境条件下声调信息对汉语双字词口语词汇识别的作用

3.1被试

选取20名辽宁师范大学的本科生和研究生（其中10名男生，12名女生）。年龄20-26岁，平均年龄为23岁。母语均为汉语，裸眼视力及校正视力均正常。无听力及阅读障碍。

3.2实验设计

采用4（竞争词类型：首音相同、尾音相同、声调相同、无关控制词）x2（目标词词频：高频、低频）两因素被试内实验设计。

3.3实验材料

从《现代汉语词典》（2005）和《现代汉语频率词典》（1986）中选取20个双字词做为目标双字词，10个为高频词（平均词频M>90/百万），10个为低频词（平均词频M<10/百万）。另外80个双字词作为匹配的竞争词，每个目标双字词都有4个双字竞争词：（首音相同竞争词、尾音相同竞争词、声调相同竞争词、无关控制词）。

竞争双字词呈现及平衡、听觉语句填充及频率控制同实验一。实验二为低限制性句子，实验图片所配的听觉句子是“鸟类的斗争往往比较和平”。

3.4实验仪器及实验程序同实验一

3.5统计结果分析

用SPSS16.0对实验2的四个兴趣区的多个指标进行4x2重复测量方差分析，得到竞争词类型、词频在各个眼动指标下的描述统计数据，具体内容如表2所示。眼动指标选取同实验一。

竞争词类型的主效应分析：首次注视时间上的差异不显著F（3，51）=0.082，p>0.05；凝视时间上的差异边缘显著F（3，51）=3.069，p<0.1，首音相同、声调相同的凝视时间分别高于无关控制词；总注视时间上的差异显著F（3，5 1）=5.269，p<0.05。多重比较发现，首音相同、尾音相同、声调相同的竞争词分别显著大于无关控制词，首音相同竞争词显著大于尾音相同。

词频的主效应分析：首次注视时间上差异不显著F（1，17）=0.260，p>0.05；凝视时间上的差异显著F（1，17）=5.355，p<0.05，高频词的凝视时间显著小于低频词；总注视时间上的差异显著F（1，17）=6.314，p<0.05，高频词的总注视时间显著小于低频词。高频词在凝视时间、总注视时间上的显著差异，反映出词频效应的存在，即对低频词的加工难于高频词。

竞争词类型、词频的交互作用分析：首次注视时间上的差异显著F（3，51）=3.809，p<0.05，无关控制条件下的高频词首次注视时间要显著小于低频词，出现了词频效应。而在首音、尾音、声调相同竞争词中均没有发现词频效应，可能与实验的设计和材料选择有关，即在低限制性语境条件下，句首信息、句尾信息之间的联系弱化，被试凭借句首信息准确预测句尾情况的可能性大大降低了，在这种情况下，被试不能立刻做出明确的判断，只能首先排除有明显不同的无关控制词，而首音、尾音、声调相同竞争词则困扰被试的正确选择。凝视时间的差异不显著F（3，51）=1.069，p>0.05。总注视时间的差异不显著F（3，51）=2.087，p>0.05。

實验二的各项指标分析说明：在低频词条件下的早期加工中，凝视时间上的差异显著反映出激活了首音信息和声调信息，出现词频效应，低频词的总注视时间显著多于高频词的总注视时间，这说明低限制性语境条件下，高频词能够有效促进汉语双字词的听觉词汇识别，与以往研究一致（Becker，1976；卢张龙，白学军，闫国利，2008；任桂琴，韩玉昌等，2012）。随着听觉材料推进，具有相同信息的首字音、尾字音、声调的竞争词都得到激活，音段信息和声调在识别过程中均起作用。说明被试对竞争词的整体匹配更关注，而不是单关注首字音相同词，支持TRACE模型的观点，这与以往关于中文的研究结果不完全一致（张仙峰，叶文玲，2006；Malins&Joanisse;，2010）。

4综合讨论

4.1首音、尾音信息对汉语口语词汇识别的作用

实验1和实验2中，口语词汇的首音、尾音信息均得到激活，这两类信息都参与了词汇识别的过程，实验结果与Cohort模型观点不符。根据Cohort模型，声音信号发生以后，会激活与其有首音相似的候选词群，候选词之间彼此竞争，抑制目标词的激活。当听觉输入继续，仍然符合语音表征的候选词激活量增加，不再符合的候选词则被排除，最后与听觉输入一致的信息即被激活。本研究中，被试并不仅仅激活了首字音信息，同时也激活了尾字音信息及声调信息，所以实验结果不符合Cohort模型。

吕勇、沈德立、杜英春和韩宗义（2004）运用ERP方法和行为实验的语音启动研究，发现首字音、尾字音相同词和启动词有同样的干扰作用，且首字音比尾字音的干扰作用大，实验结果支持Cohort模型。Malins和Joanisse（2010）运用视觉一情景范式研究汉语单字词口语词汇识别，结果证明被试对首音相似词的注视时间显著大于无关控制词，支持了Cohort模型。Allopenna等人（1998）通过视觉一情境范式研究了首字音、尾字音及声调在口语理解中的作用，认为词的完整匹配程度及尾音信息在词汇识别中发挥更大作用，符合TRACE模型。Desroches，Joanisse和Robertson（2006）也根据实验证明尾字音信息的作用更大。

在本实验中不同限制性语境的词汇识别难度大，呈现多个竞争词进行干扰，被试的注意资源更容易被分散，需要对句子进行整合。在这种情况下，被试更注重词汇与句子的整体匹配程度，所以本实验结果更符合TRACE模型。

4.2声调信息在汉语口语词汇识别中的作用

实验一高限制性语境条件下，发现了声调相同竞争词显著大于无关控制词。说明被试激活了听觉词汇的声调信息，即声调信息在双字词听觉词汇识别过程中发挥了作用。实验二低限制语境条件下，发现了和声调竞争词的总注视时间均显著大于无关控制词，说明实验二的声调信息也被激活。虽然实验一和实验二均发现声调一致竞争词与无关控制词的差异显著，但都伴随着音段信息一起影响口语词汇识别的过程，所以本实验中声调信息并不是单独发挥作用，而是与音段信息一起发挥作用，这个结果与Schirmer，Tang，Penney，Gunter和Chen（2005）、Malins和Joanisse（2010）的研究结果一致。

4.3词频和语境对汉语双字词听觉词汇识别的作用

在实验一高限制语境条件下，没有发现词频效应，而在实验二低限制语境条件下，发现词频效应，即高频词的凝视时间、总注视时间要显著小于低频词。这说明，在低限制语境条件下，被试对高频词的加工速度要快于低频词的加工速度，对高频词的加工认知难度也显著低于低频词；在高限制语境条件下，高频词和低频词则没有显著差异，为什么不同的语境条件会出现不同的词频效应呢？因为高限制句子条件下，语境对目标词的限定程度更大，对被试看到的低频词影响也更大，低频与高频词的差异不显著，而在低限制性条件下，语境对被试的注意分配影响较小，词频本身对词语理解的作用就显现出来，于是出现了词频效应。这个结果与卢张龙等人（2008）、任桂琴和韩玉昌等人（2012）及Becker（1976）的实验结果一致。

在本实验中，词频和竞争词类型的交互作用只在高限制性句子条件下的总注视时间差异显著，表现在首字音相同竞争词与无关控制词在高频条件下差异显著，无关控制词的总注视时间显著少于尾字音相同竞争词。而在其他的指标上并不显著。并没有相关的研究证明过词频和竞争词类型的交互作用，可能的原因是实验设计、实验任务的不同，实验一和实验二均有语境的限制，被试需要根据句子的展开分配注意资源，被试的注意不仅仅放在词频和竞争词类型两个维度上，还包括听觉句子的理解、意义的整合等，所以词频和竞争词类型的交互作用在有语境限制的条件下差异不显著。

5结论

（1）本实验结果支持TRACE模型，即在高限制性和低限制性句子语境中，首音信息和尾音信息在汉语双字词听觉词汇识别过程中均起作用。（2）高限制性語境中未发现词频效应，在低限制性语境中存在词频效应。（3）声调信息与音段信息都影响口语词汇识别。