二语词义通达模型、影响因素及其交互效应

2019-02-22

四川师范大学学报（社会科学版） 2019年3期

(安徽工程大学外国语学院，安徽芜湖 241000)

一引言

双语表征指两种语言信息在双语者个体大脑中的存在形式，涉及双语者语义储存方式、语义加工方式、双语词汇分布模式、双语心理词汇提取机制、双语语义通达等多个研究课题，长期以来一直是认知心理学、脑科学、心理语言学、神经语言学、人工智能、外语教学和二语习得等领域专家关注的焦点。20世纪五六十年代，受乔姆斯基普遍生成语法的影响，双语研究从先前更多的强调语言间的异质性特点转向强调语言间的同质性特征，形成了两种完全对立的双语语义存储模式：语义共同储存(shared storage)和语义分别储存(separate storage)[1]。1960年代之后，研究重点集中到了双语者的两种语言是如何联接和相互作用上[2]。二语词汇语义通达研究就是在这个背景下发展起来的。

二语词汇语义通达是指人们通过视觉或听觉接受输入的二语词汇信息，并提取词义的过程。通俗地说，就是见其词、闻其音，从而知其义的过程。人们对二语词义通达的研究至今仍存在巨大的争议。争议的核心问题是在二语词义通达过程中，非目标语言是否会被抑制，目标语是否会被直接激活。换言之，双语者是否需要借助母语通达二语词义。围绕该问题，研究者们建构了一系列二语词汇语义通达模型。

二二语词汇语义通达模型

1.语义独立储存理论下二语词汇语义通达模型

语义独立储存理论认为，两种语言的形式与语义系统都独立表征。研究者们通过词汇联想、启动实验等方式观察、研究了双语者语言活动。Kolers通过词汇联想实验发现双语者跨语言联想和语言间联想具有不一致性[3]；Degroot和Nas在非同源词间未能发现跨语言语义联想隐蔽启动效应[4]。这一理论还获得了不少临床病理学和神经学数据的支持。研究发现，部分脑损伤双语病人，其脑损伤有选择性地影响了某一语言的功能；康复过程中，两种语言的恢复也呈现出非同步特征[5，6]。研究者还通过PET、MRI等脑成像技术研究了双语者，结果表明双语者使用不同语言时，激活的脑区不同，双语在大脑中表征机制存在差异性[7，8]。

关于二语词汇语义通达，独立存储的一种观点认为，语言的形式与语义是密不可分的整体。因此，语言形式的转换必须通过语义特征之间相似匹配来完成。通达二语词义的唯一途径是通过学习和训练对应和匹配语言所代表的经验[9]。后来，人们批判了这种语言形式不可分割的观点。独立存储的第二种观点认为：语言和意义是可分的，两种语言通过形式层次联接起来[4]，二语语义激活是非选择性的，双语者需要借助母语与二语相似的语义去通达二语词义。

2.语义共同存储理论下二语词汇语义通达模型

语义共同存储理论认为，语言形式分别表征，概念意义共同表征。主张语义共同储存的研究者在语义通达方面也持有不同观点，体现在Potter等人提出的词汇连接模型和概念调整模型中[10]。在词汇连接模型中，二语单词通过母语单词形式和概念间接联系。而在概念调整模型中，语义是抽象的、超语言的，母语单词和二语单词分别直接与同一个概念表征相联系。在二语词义通达过程中，母语单词不会得到激活。后来，Kroll和Curley在研究中发现，双语熟练程度会影响两种语言形式转化方式[11]。在此基础上，Kroll和Stewart整合了词汇连接模型和概念调整模型，提出了修正的层级模型(Revised Hierarchical Model，RHM)[12]。该模型认为两种语言的词汇表征和语义表征之间都有联系,只是联系的强度不一样。这一模型既承认了形式层次的联结，又承认概念中介的联结，但最终的联结方式取决于双语熟悉程度。

RHM自提出后，就成为了二语词汇语义通达领域最广为接受的理论模型。大量研究证明了熟练双语者是概念中介表征模型，而非熟练双语者为词汇连接模型[13-17]。其中，比较值得一提的是Guo等人采用跨语言启动范式对熟练双语者二语词义通达时间进程进行的一项ERP研究[15]。该研究以熟练中英双语者为被试，采用翻译识别任务(Translation Recognition Task)，要求被试判断词对中的汉语词是否为所给英语词的正确译词。共选取480个词对为语料，其中汉语词为所给英语词正确译词的词对120个，汉语词不是正确译词的词对又分成四类：语义干扰词对(正确译词与所给汉语词语义相关，如：needle(针)-线，从而干扰被试判断)、翻译形式干扰词对(正确译词与所给汉语词音、形相关，如：sugar(糖)-塘，从而干扰被试判断)、语义无关词对、翻译形式无关词对各80对。行为数据显示在长短SOA条件下，相比无关词对，被试在判断语义干扰词对和翻译形式干扰词对时，反应时延长、错误率提高，且两种条件下对比无显著差异，未能清楚说明母语在二语词义通达过程中的作用。ERP数据显示：在长SOA(700ms)条件下，相比控制组，语义相关词对引起了前脑N400、LPC(late positive component)幅值的显著减小，及后脑LPC幅值的显著增加；而翻译相关词对诱发了波幅更大的P200和LPC。由于P200反映早期词汇识别，对刺激词与目标词词形比较敏感，LPC反映语言信息的再加工，这说明在间隔时间长的情况下，在二语早期及晚期加工过程中母语均被激活，但这种激活更可能是由于间隔时间长导致的。因为在短SOA(350ms)条件下，相比控制组，语义相关词对同样诱发了幅值较小的N400和幅值更大的LPC，而翻译相关词对仅诱发了幅值更大的LPC，并没有对P200起到调节作用，这说明在间隔时间短的情况下，在二语加工早期母语未被激活。结果表明熟练双语者可以直接通达语义，母语的激活发生在二语词义通达之后。

然而，也存在相当一部分实验结果与RHM相悖。Thierry和Wu以熟练中英双语者为被试，采用语义决定任务，发现相比翻译形式无关对，翻译形式相关对(其译词对有部分汉字重叠，如：train-ham)所诱发的N400幅值显著降低，由此说明熟练双语者也需要借助母语通达二语词义[18]。Morford等人采用行为实验，对手语(American Sign Languag，ASL)-英语双通道双语者进行的研究也得到了相似的结论[19，20]。在实验中，英语词与手语词形式相近，例如paper(纸)与movie(电影)两词在手语中手型相似，会显著影响聋人双语者判断所给词对是否语义相关的反应时和错误率，由此说明聋人在读英语时也会自动激活大脑中的手语。在一项中英多义词的早期识别研究中，研究者发现熟练中英双语者的词汇表征也有联系[21]。Ma等人采用ERP实验研究了非熟练者的二语词义通达过程，发现同熟练双语者一样，在短SOA(300ms)条件下，只能发现语义干扰效应，由此说明非熟练双语者也能直接通达词义[22]。李嘉华、郑莹和杨静采用语义判断任务，行为实验结果表明汉英双语者二语熟练水平越高，一语作为非目标语言，其自动激活效应更明显，对二语语义加工任务的干扰效应越大[23]。

人们围绕RHM产生的种种争议或许与实验设计有关。首先，研究技术手段具有多样性，ERP、fMRI、MEG、PET等神经学研究技术在双语表征研究中得到了广泛的运用，但实验中神经学数据往往和行为数据不一致。相比于行为学研究，神经学研究可以提供语言认知过程中的大脑活动数据，更准确地反映受试从事语言活动时的脑区分布状态和时间进程。其次，在启动实验中，SOA的长短也会导致实验结果不同。黎明和蒲茂华在双语心理词汇语义表征试验中，采取了6个SOA点，当SOA为60ms时，汉英双语心理词汇语义独立表征；为100ms时，只发现了汉语到英语的跨语言语义启动效应；超过300ms时，却能得出汉英双语心理词汇语义共同表征的结论[24]。再次，实验任务类型也能影响实验结果。Guo等人发现了一个有趣的现象：绝大多数采用翻译识别任务对非熟练双语者表征方式进行的研究都能发现语义干扰[15]。王悦和张积家在研究中日非同形词表征方式时发现：采用词汇决定任务时，非熟练中日双语者通过词汇联系激活中文词汇系统，通达语义；而采用语义决定任务时，却往往直接通达语义[21]。

引发争议的另一原因是实验过程控制不够严谨。二语熟练度是RHM模型最重要的维度，但目前的不少实验对二语熟练度的控制却不够严谨[8]。以熟练者为受试的研究中，如果受试二语水平远未达到母语水平，那么在此基础上得到熟练者不能直接通达二语词义的结论就颇值商榷。不少以熟练度为目标的中英双语研究仅以专业、非专业，或四、六级考试作为水平高低的划分标准，缺乏有效检验，难免会出现一定的误差。还有的研究采用受试的自我水平报告作为受试语言水平高低的依据，缺乏对受试语言水平的客观测试。由于目前对受试语言水平的测试仍缺乏统一范式，解决问题的关键在于在充分考虑实验目的基础上，尽可能结合多种方法对受试二语熟练程度加以控制。

除此之外，还存在受试认识能力、认知压力缺乏测试、受试接受实验时二语接触方式和程度、二语习得年龄及双语平衡度缺乏调查等问题，而这些和词频、词长、受试年龄、性别等因素一样都会影响受试双语表征。刘欢欢、范宁、沈翔鹰和纪江叶采用威斯康星卡片分类任务(Wisconsin Card Sorting Task，WCST)筛选出高低认知灵活性的非熟练汉英双语者，通过语义范畴判断任务研究了认知灵活性对非熟练双语者语言转换的影响，结果发现高认知灵活性受试的双语转换代价是对称的，其N200成分(反映语言转换中对非目标语言的抑制)的平均波幅和峰值显著大于低认知灵活性受试，从而说明高认知灵活性的非熟练者在二语理解过程中可以充分抑制母语，直接通达词义[25]。苏炎奎和李荣宝采用眼动研究范式，通过比较正确同音异形词、错误同音异形词和拼写对照词的凝视时间研究语义通达，结果表明，认知压力也会影响语义通达模式[26]。Comesaa等人证实采用图片学习法习得的二语词汇要比采用母语学习法习得的词汇产生更大的语义干扰效应[27]。Poarch, Hell和Kroll在研究儿童词义通达过程中也发现：词汇教学中采用图片辅助教学、并给予大量听说练习，所习得的二语词汇可以直接通达词义[28]。Mohades等人的研究表明相比课堂语境，自然语言环境下的双语者左下额枕束(the left inferior frontal occipital fasciculus, L-IFOF)脑白质发生变化[29]，而L-IFOF与语义加工有关[30，31]。二语习得年龄(AoA)也会对二语表征产生影响。多数行为实验表明：AoA越早，二语表征方式就越接近母语使用者[32]。近年来，研究人员通过DTI(diffusion tensor imaging)、fMRI等技术手段进行的相关研究也表明，单语者和早期二语习得者大脑皮层结构无明显差异，而晚期二语习得者传统语言区额区皮质层厚度明显增大[33]。还有些研究表明，AoA可能影响二语习得者顶叶区结构差异[34，35]。这些脑成像数据给出了AoA对二语表征产生影响的生理基础。

既然双语者认知水平、二语接触程度与方式、二语习得年龄等因素均能对双语表征产生作用，那么它们与二语熟练度之间的关系又如何？二语熟练度到底是以一种什么样的程度、什么样的方式影响着二语词义通达？Dijkstra在他的双语交互激活扩展模型(BIA+模型)中提出了在双语理解过程中区分词汇识别系统和任务决策系统的假设，认为非语言情景信息，包括任务要求、个体差异等，不能直接影响词汇识别系统的激活，但可以调节任务决策过程；语言信息直接作用于词汇识别系统，通过词汇识别系统向任务决策系统提供信息[36，37]。BIA+模型解释了非语言情景信息对二语词汇语义通达的影响，但并没有涉及各因素之间的关系，而且其有关双语熟练度调节作用的设想也与RHM模型并非完全一致。面对种种争议，未来的研究应该重点关注各因素之间的交互效应，在充分考虑实验目的基础上，严格考察实验任务效应，采用先进研究技术、选择多个SOA点共同观察、尽可能结合多种方法对受试二语熟练程度加以控制，并对受试认识能力、认知压力、当时二语接触程度和方式、二语习得年龄展开充分研究。

3.混合(mixed)语义表征理论下多维二语词汇语义通达模型

随着研究的深入，研究者们逐渐发现还有很多其他因素都能对双语表征产生影响。最早进入研究者视野的就是词型效应(word type effect)：不同类型词汇表征方式不同[4]。很难笼统定义双语者的表征方式，导致一部分研究者转向持有混合语义表征观。持该观点的研究者认为，既存在着语义共同存储，也存在着语义独立存储，二语词汇语义通达受多个维度的影响。

Degroot的共享分布式模型(distributed feature mode)[4]、董燕萍的动态共享(分布式)非对称的模型[38]、Finkbeiner等人的义项模型[39]都可以被视为多维的二语词义通达模型：对共享概念来说，语义是共同储存的；对非共享概念来说，语义是独立储存的。共享概念可以直接通达语义。而对非共享概念来说，由于两种语言形式上是可以连接的，可以借助母语与二语相似的语义去通达。这些模型的建立有着重要理论及实践意义。一方面很好地解释了二语词义通达中出现的词型效应：具象词、高意象词、同源词之所以是概念调节型的，抽象词、低意象词、非同源词之所以是词汇连接型的，主要原因在于前者义项少，双语词汇语义重合程度高；而后者语义义项多，共享语义少。另一方面，在不否认二语熟练程度效应的同时，阐明了语义重合(semantic overlap)对二语通达方式的影响：重合程度高，直接通达，反之则借助母语通达。由此说明了二语词汇语义通达应当是多维的。

然而，目前针对双语表征的不少研究却缺乏对语料语义相关度的有效检验。研究表明，启动词和目标词关联方式会影响启动速度和启动量，比如具象词之间语义等值度高于抽象词。有些单词的语义不但具有联想相关，也具备范畴相关。因此，对二语词义通达的研究必须建立在对语义相关度进行有效检验的基础上，否则将结果简单归因于RHM模型中的二语熟练程度显然缺乏公信。

除了词汇语义重合，两种语言间的相似程度也会影响词义通达。Brauer认为，对于熟练的双语者而言，如果两种语言不相似，概念独立表征；如果两种语言相似，L2词汇既可以直接与共同语义表征联系，也可以经由L1词汇与共同语义表征联系，两种语言之间的联系模式是多维的[40]。多年来，研究者们试图通过同语系内或非同语系之间、表音文字内、表义文字内或表音文字与表意文字之间的多语言对比研究建构起语言相似度对表征方式的影响。近几年，我国研究者将目光聚焦到少数民族语言与汉语或英语对比研究上，发表了大量的研究成果。但是，由于目前仍缺乏相关整合性研究，而且由于实验结果往往受到多个因素的影响，很难单纯地用语言相似度来解释实验结果的不一致性。语言相似度研究的另一个重要视角是同源词。Degroot在形态相似的词之间发现了启动效应，由此说明同源词共同存储，非同源词分别存储[4]。中日、中韩同形近义(同义)词的词汇、语义共同表征，可直接通达二语词义[41，42]。Duyck和Brysbaert通过对比二语和三语词义通达指出，相比语言熟练度，词形相似(lexical form overlap)似乎更能影响双语表征[43]。

词频也会影响二语通达方式。语义表征研究中，词频是影响语义启动效应的一个最明显的客观因素。Ibrahim, Cowell和Varley在研究中发现高频词汇语义启动速度不受翻译方向的影响[44]；Nakayama, Lupker和Taguchi也证实当启动词为二语高频词时，未产生显著翻译启动效应，二语可直接通达语义[45]。此外，还有实验显示，词频对双语表征的影响要受更多其它因素的相互作用。高频目标词受到的背景启动作用要小于低频目标词[46]；词频对同源词效应具有影响，其中高频词受词形相似同源词的影响更大[47，48]。

三未来研究方向

二语词汇语义通达究竟是如RHM模型所说由双语者二语熟练度决定，还是由多维通达模型所说由词汇词形、语义相似度、两种语言相似度、词频等多个维度共同决定？面对这些疑问，一条可能解决问题的思路是：在充分观察不同水平双语者表现的基础上，采用随科技发展而不断推出的先进手段，对影响二语词汇语义通达的各种因素交互效应进行整合性研究。并且在未来的研究中尽可能对各种因素具体量化进一步实验进行赋值和检验，以期能够完善现有二语词汇语义通达模型，使其能够尽可能全面涵盖所有影响因素。

然而，目前大多数研究仍偏重于单个或者几个因素对二语词汇语义通达产生的影响，有关二语熟练度与其他因素交互效应的研究并不太多，且多以行为实验为主。研究视角和方法上的片面性导致结论科学性不足。除同源词与二语熟练度的相关研究之外[43]，还涉及语义重合、语义关系与二语熟练度的交互效应的研究[38，49，50]。其中，比较值得一提的是董燕萍的实验：采用启动范式研究了共享概念；结论显示对共享概念来说，无论双语者水平高低与否，都直接通达；采用词语排序任务(按其与主导词之间相关度由强至弱排列)，对比了汉语单语组、英语单语组、高低水平双语组，对不共有或不完全共有概念的双语表征方式；结果发现：随着双语者语言熟练度的增加，会从一开始更多的依赖一语概念、表征二语概念转向二语单语者的概念系统靠近[38]。该研究在肯定语义重合决定通达方式的同时，提出用一种动态的观点去看待二语熟练度的调节作用，这与BIA+模型相关观点不谋而合。

除却二语熟练度，至今我们并不十分明确双语者二语习得年龄、二语接触程度与方式、认知能力、任务要求等非语言因素在二语通达过程中所起的作用，也十分不明确二语词汇的音、形、义、句法、词频等语言因素之间的相互作用。Perani等人根据二语习得年龄将熟练度高的被试分成两组，使用PET调查了被试使用二语时脑的激活，结果发现在任务中两组被试激活脑区一样，从而认为语言熟练程度是比二语获得年龄更重要的因素[51]。一项ERP实验表明词汇熟悉度对二语词义通达有着重要的调节作用，当二语词汇熟悉度较高时，非熟练中英双语者来说也能直接通达词义[52]。Ferré等人研究了词形相似与语义重叠的交互效应，结果在短SOA条件下仅发现了同源词掩蔽启动效应，却并未发现词语抽象程度的启动效应[53]。面对各种争议，或者只有当研究者们把影响二语词义通达的各个因素效应充分结合起来，在采纳先进技术的同时，采用科学的办法尽可能严格地控制实验过程、有效避免实验中各种无关因素的影响，才有可能掌握双语者二语词汇语义通达机制。