独立言语词识辨的竞争模型研究
2011-08-15周江平
周江平
独立言语词识辨的竞争模型研究
周江平
自激活模型提出以来,言语词究竟以什么模型被激活,一直在心理语言学界存在争论。但目前研究理论一致认为存在竞争的必要性,只不过竞争的机制有所不同。针对独立言语词不同竞争机制进行概述。
言语词;激活模型;竞争机制
一、引言
研究证明,对言语词的识辨会受到一系列与之部分输入信息相一致的替换词(alternatives)的影响。一个词语同其它一些罕见的词语在语音上相似时要比一个词语同其它许多常使用词语的语音相似更容易被识辨,它超出了词语自身频率的影响[1,2]。这表明识辨过程不只是依赖于言语输入信息与特定词语表征所匹配的程度,而且还依赖于输入信息与替换词表征所匹配的程度。当前言语词识辨的所有理论都承认竞争的必要性,只是其完成竞争过程的机制有所不同。
二、独立言语词竞争
最初出现的竞争机制主要集中在独立言语词竞争模型的研究中。流行的竞争模型有规则决策竞争模型(decision rules)与直接竞争模型(direct competition),接着出现了更为流行的自然竞争模型(emergent competition)。
(一)规则决策竞争模型
最初的交股模型(COHORT model)[3]提出,言语词的识辨依赖于多个候选词的激活(首要词交股),但那只是一种间接的形式。交股决定了目的词的特殊特征。因为只有目的词才是与输入信息相匹配的最后候选词。这种模式认为言语词的节首辅音(onset)将会激活所有与其相同的候选词[4]。随着输入信息越来越多,只要那些候选词不匹配就会立刻从竞争集合(competitor set)中去除(如:当听到 /s/时,cat就不再属于castle的交股竞争集合),直到只剩下最后一个候选词。竞争集合是否纳入某个候选词被视为完全无反应且不受频率影响的一种过程。受到理论与实证论点的提示,模型的修正将交股词是否被纳入的机制改变为一种梯度激活(gradient activation)过程。这种过程反应了候选词在输入信息与其频率中显著的程度[5]。在修正后的模型中,候选词不能被简单地描绘为属于或不属于此交股。相反,他们是激活的多与少的问题,并且识辨的标准被修正为一条决策规则。这条规则评价了某一单位的激活水平,它有效地允许了特定词语识辨会受到其它与输入信息相匹配的候选词的影响,但单位之间不会有直接的竞争。任何词条的激活都反应了与输入信息的吻合度。竞争仅存在于决策规则的层次。
早些时候就有人提出了一种相似的机制,如Luce[1][6]等就提出了临近激活模型(Neighbourhood Activation Model or NAM)的一部分。这种模型指出,识辨一个特定词语的可能性近似于目的词语频率的对数与包括此目的词在内同其它所有词条频率之和的对数之比率。NAM的优势在于它是一种正式的激活与竞争数学模型,而不是处理模型。NAM也因其超强的解释力与简洁性突显了它的重要地位。这种可能性简洁地体现了当前理论共有的一般原则,还体现了竞争词语临近概念的特殊性,并且产生了精确的、可检测的假设。然而,NAM却没能具体表现言语词竞争环境的动因(Dynamics)。所谓动因,是Jesperson用来指力图将其认为是有联系的语法现象解释清楚的历史语法。
(二)直接竞争模型
连接主义模型(Connectionist models),如轨迹模型(trace)[7],精简目录模型(shortlist)[8]以及如今的句法分析模型(parsyn)[9]认为,词语单位是通过侧抑制方式(lateral inhibition)发生竞争。词汇层(以及轨迹模型与句法分析模型模型的音位层)的单位相互抑制作为它们各自激活的一种功能,这依赖于它们同输入信息的相似性。比如:一听到输入信息/kat/,cat与cap将都会被激活;cat与cap相比更加同输入信息相似,因此被激活的力度更强,同时也更多地抑制cap(假设词语的使用频率相等),结果有激活优势的词条将最终抑制其候选词。
根据决策规则或侧抑制方式来区分词汇竞争模式是相当困难的,因为它们都作出了很相似的预测[10]。类似的事情也在感知抉择模型中发生过[11]。决策规则竞争机制是一种可论证的较侧抑制更为简洁的计算机制。在决策规则竞争中,随着言语信息的逐渐显露,候选词激活的临时动力(temporal dynamics)只能反应每个候选词的变化。与此相反,通过侧抑制竞争预测的临时动力,既反应了输入信息的影响,又反应了关于候选词激活的循环圈(recurrent loops)的影响。因此,随着时间的推移,决策规则竞争与侧抑制的区分可能要求对词汇激活进行考虑。
(三)自然竞争模型
Gaskell&Marslen-Wilson[12]曾提出一种分布式体系,在这种体系中,词语被节点激活的重叠式与分布式的模式所表征。这些节点的一部分代表音位特征,而另一部分代表语义特征。某特定词语在音位特征与语义特征中被表征为一种激活模式,因此就获取这个词语的形式与意义。当一个词语的首要部分被呈现在模型中时,与输入信息一致的网路模式同时也将被激活。然而,因为激活只有一个底层——分布式节点的同一个集合,最后激活的模式就融合了与其一致的模式。因此,竞争就以干扰的形式出现在与部分输入信息相一致候选词相关联的模式中。处理部分输入信息所产生的激活模式或多或少具有一致性,这主要依赖于节点编码信息的特点,也依赖于同时考虑在内的一致性假设数量。
之所以把这种模式称为自然竞争机制(Emergent competition),是因为竞争动力源于一种相互作用诱发因素的复合式联合。这些诱发因素包括出现的抑制性权重的错综复杂模式,还有构成音位、语义,可能还有输入与输出信息的融合等因素。
模型分布体系作出了一个有吸引力的预测。虽然模型假设了与输入信息相匹配所有候选词的同一时间激活,它也预测了激活的最后模式不会独自表征任何候选词的形式与意义。然而,由于激活模式是一个混合式模式,它们所共有的特征(常常为相同的语音)被如实地表征,但它们不同的特征(比如语义特征,因为音位相似的词语在语义上一般都不相关)被混合了到一起。重新构建候选词语的不同特征将依赖于候选词的数量。
Gaskell&Marslen-Wilson[12]指出有数据支持这种模型的预测,特别是他们表明同几个候选词一致的言语启动表征(比如:/kapt i/,有许多与其相一致的候选词其中包括captain和captive)不会加速关于语义相连的候选词(如:commander)的词汇判断。这表明,激活的语音形式的语义表征是一种混合式,并且不会出现明显的启动效应(priming)。相反,与只有一个候选词相一致的言语词启动表征 (比如:/ga:ment/只与garment相一致)的确有助于与其语义相关的候选词的处理(如:attire)。Gaskell&Marslen-Wilson的模式分布体系可以对这一结果作出解释,因为当出现更多的候选词并且不同的模式(形式相似但意义不相关的候选词模式)出现在同一混合体系时,在语义特征节点中的激活模式就变得越不具有一致性。
局部表征模式 (Models with localist representations)也能对这一结果作出解释。我们并不知道任何当前的模式不加以修正就可以对其解释,但是相互激活的一般原则还是与这一结果相一致的。能起到Gaskell&Marslen-Wilson模式相同效果的解释是语音竞争集合越大,每个语义表征所收到的激活就越弱。语音竞争单位最初从语音输入信息中受到相等的支撑,然而只要语音表征不再受到自下而上(bottemup)输入信息的支撑时,其所对应的语义表征通过启动几乎不会受到激活,从而不会被感知。感知共振模式[13]中,也存在一种相似的机制,在这种机制中,只有当一个候选词或词块的激活水平足以克服其竞争词语的激活时,才会形成一种感知共鸣。
三、结语
以上从言语词的竞争机制出发,回顾了最近几十年来心理语言学家对激活模型的研究。独立言语词竞争模型研究从最初的规则决策竞争机制到直接竞争机制再到如今最为流行的自然竞争机制,但这些模型都局限于言语词的研究,希望在以后的研究中更多地关注词汇语用信息在竞争机制中的表征。
[1]Luce,P.A.A computational analysis of uniqueness points in auditory word recognition[J].Perception&psychophysics,1986(39):155-158.
[2]Luce,P.A,Pisoni,D.B.Recognizing spoken words:The neighborhood activation model[J].Ear and Hearing,1998(19):1-36.
[3]Marslen-Wilson,W,Welsh,A.Processing interactions and lexical access during word recognition in continuous speech[J].Cognitive psychology,1978(10):29-63.
[4]桂诗春.新编心理语言学[M].上海:上海外语教育出版社,2000:294-295.
[5]Marslen-Wilson,W.Function and process in spoken word recognition.In:H.Bouma&D.G.Bouwhis(Eds),Attention and performance x:Control of language processes[J].Hillsdale,NJ:Laurence Erlbaum Associates,1987:125-150
[6]Luce,P.A,Pisoni,D.B,Goldingger,S.D.Similarity neighborhoods of spokenwords.In:G.T.M.Altmann(Ed.),Cognitive modelsofspeechprocessing:Psycholinguisticandcomputational perspectives[M].Canbridge,MA:MITPress,1990:122-147.
[7]McClelland,J.L,Elman,J.L.The TRACE model of speech perception[J].Cognitive Psychology,1986(18):1-86.
[8]Norris,D.Shortlist:A connectionist model of continuous information in speech recognition:Feedback is never necessary[J].Behavioral&Brain Sciences,1994(23):299-370.
[9]Luce,P.A,Goldinger,S.D.,Auer,E.T.,Jr.,&Vitevitch,M.S.Phonetic priming,neighborhood activation,and parsyn[J].Perception and Psychophysics,2000(62):615-625.
[10]Marslen-Wilson,W,Moss,H.E,van Halen,S.Perceptual distance and competition in lexical access[J].Journal of Experimental Psychology:Human Perception&Performance,1996(22):1376-1392.
[11]Usher,M,McClelland,J.L.The time course of perceptual choice:The leaky,competing accumulator model[J].Psychological Review,2001(108):550-592.
[12]Gaskell,M.G,Marslen-Wilson,W.D.Representation and competition in the perception of spoken words[J].Cognitive Psychology,2002(45):220-266.
[13]Grossberg,S,Myers,C.W.The resonant dynamics of speech perception:Interword integration and duration-dependent backward effects [J].Psychological Review,2000(107):735-767.
H030
A
1673-1999(2011)08-0108-03
周江平(1982-),男,四川南充人,西华师范大学(四川南充637000)外国语学院助教,从事心理语言学研究和语言学教学工作。
2011-02-25