二语学习词典中的搭配信息收录和呈现研究
2020-05-01秦少康
李 华,秦少康
(浙江科技学院 人文与国际教育学院,杭州 310023)
语言学的理论和应用都非常重视搭配。在理论方面,Firth[1]提出了“观其伴,知其义”,重视搭配作为语境在语言中的作用;Hoey[2]认为搭配可以对词汇的语法、语义、社会情境和文本特征提供解释,是构成语言自然度(naturalness)的关键因素。在应用方面,自然语言处理领域把搭配用在词义消岐、机器翻译、自然语言生成等应用[3-4]中,以区别词语的一词多义情况;语言学习领域也认识到搭配学习的困难,由此催生了各种词典中的搭配信息,甚至专门的搭配词典[5-7]。
词典收录高质量搭配信息对二语学习尤为重要。邢红兵[8]认为词语搭配知识既是二语学习者目的语词汇知识的核心,又是难点所在。学习词典作为重要的二语学习工具越来越重视搭配信息的收录和呈现。汉语学习词典也收录和呈现搭配信息,但相较于历史悠久的英语学习词典,“在配例分配、典型性、简明性等方面仍存在一些问题”[9]。对于专门的搭配词典,郝瑜鑫[10]认为从宏观角度论,汉语搭配词典在用户群体的针对性、收词量、语料的使用和信息呈现手段等方面尚存在问题;从微观角度论,在对不同类型搭配的处理、词目词的处理、搭配信息的处理等方面也存在不少问题。叶莹等[11]参考了英语学习词典的代表作之一牛津高阶系列1—8版,对“perform”一词做了个案研究,总结了1—8版《牛津高阶英语词典》学习词典搭配信息的发展趋势,建议中国英汉学习者词典在搭配信息处理上充分利用学习者语料库,提供更加丰富的搭配类型,尽可能按照语义场组织搭配信息。在上述已有研究的基础上,本文首先分析了搭配难于学习的语言原因,进而横向比较总结了最新版的四部英语学习词典——OxfordAdvancedLearner'sDictionary[12](《牛津高阶英语词典》,以下简称《牛津》)、CambridgeAdvancedLearner'sDictionary[13](《剑桥高阶学习者词典》,以下简称《剑桥》)、《柯林斯COBUILD高阶英语学习词典》(以下简称《柯林斯》)[14]、LongmanDictionaryofContemporaryEnglish[15](《朗文当代英语学习词典》,以下简称《朗文》)搭配信息的收录与呈现,并提出了关于汉语二语学习词典搭配信息编撰的一些建议。
1 搭配学习的复杂性
1.1 搭配难学的原因
当前,研究者对搭配是二语学习中的难点已经取得共识。Bahns等[16]的调查发现,语言输出错误中尽管搭配仅涉及23%的词汇却构成了48%的错误。Howarth[17]进行了母语者和非母语者写作语料对比,发现母语者的语料中不标准的搭配有1%,而非母语者为6%。研究者们从不同的角度对搭配习得困难的原因进行分析,显示了这个问题的复杂性。其原因归纳如下:
首先,搭配作为一个单独的部分需要主动学习。Bahns等[16]认为,学习者的搭配知识并不和学习者的词汇知识同步,搭配知识需要单独教,AI-Zahrani[18]也有类似的观点。Farghal等[19]认为第二语言学习者不能处理搭配是因为没有意识到搭配是多词单位的一个基本部分。
其次,搭配受到母语的影响,特别是对初中级水平的学习者。Lombard[20]认为,母语对搭配学习具有决定性的影响作用,体现在四个方面:词汇迁移,如词对词的翻译*open the computer受汉语“开机”影响;词形变化,如用*bond to think代替bound to think;语法,如用*price strategy代替pricing strategy;意义,如用*gather water代替collectwater。AI-Zahrani[18]也认同母语的影响因素,认为与母语相同的搭配比较容易学习,反之亦然。而文化差异、词义不对等也造成学习的困难。
最后,大量接触不能提高搭配的学习效果。Nesselhauf[21]认为学习者在英语国家居留的时间长度对搭配准确性可能只有很小的影响,而在课堂的学习时间长度则对其完全没有影响。
1.2 搭配独特的不可完全类推性
搭配难学主要因其具有不可完全类推性。在语法研究中,语法演变存在一种类推作用,即“用一种规则的形式去铲平那些不规则的例外,使它们进入规则的系统;或者是推广新规则的适用范围,使人们按照这种规则去创造新的结构单位”[22]359。这里我们借用“类推”这一概念来表示词语组合中词语选择所受到的限制。自由组合全部是符合规则的,通常满足一定的语义条件、语法条件就可以组合使用,具有完全类推性;而成语完全是特例,通常只出现一种情况,组合义不是组合构成部分意义简单相加之和,完全不能类推;搭配处于两者之间,不可完全类推。
相对于自由组合,搭配词语的选择是受到限制的,不能像自由组合一样根据语义、语法条件举一反三;相对于成语,搭配词语的选择并不是唯一的,部分满足语法、语义条件的词语是可以构成搭配的。搭配的不可完全类推性同时体现在:部分具有相关或类似语义的词语不能和节点词(指被观察搭配行为的词语)构成搭配;词语构成搭配时,组合义就是组合构成部分的意义之和。凡能够构成搭配的,都是满足一定语义条件、语法条件的,也就是遵守规则的;但反之却不然,也就是即使满足一定语义条件、语法条件也不一定能构成搭配,不一定能通过类推获得正确搭配。因此,学习者很难依据已经学会的类似搭配来断定某一个词语在和另外一个词语搭配时是否合适。
搭配的不可完全类推性——既有规则、但不是所有满足规则的都构成搭配的特点——毫无疑问增大了学习的难度,导致在其他语言学习方面有效的方法手段在学习搭配上不再继续有效,进而出现了前述复杂的学习状况。但是,搭配几乎在每句话、每段文章中都会出现,搭配的重要性毋庸置疑,这对语言学习的重要工具——词典提出了要求。
2 词典实践中搭配的收录和呈现
上述这四部学习词典是英语二语学习者的重要工具,在词典领域一直具有重要的影响,其很多实践都具有开创性的贡献,引领了二语学习词典的发展。此外,随着手机功能、网络技术的发展,在线词典发展迅速,“在线词典在英语专业学生中的使用率(69.34%),已经远远超过英汉双解词典(13.21%)和电子词典(9.43%)”[23],故本文观察对比四部学习词典的纸版和在线版,考察其搭配信息的收录和呈现特点。需说明的是,《牛津》在线版中搭配使用了《牛津英语搭配词典》(OxfordCollocationsDictionary,OCD)第2版中的搭配,因此本文把二者结合起来视为同一考察对象。
2.1 搭配收录范围的特点
首先,四部学习词典对搭配的认定大同小异,见表1。
表1 四部学习词典对搭配的说明Table 1 Definitions of collocation in four learner’s dictionaries
综合来看,四部词典从两个角度认定搭配,一个是从共现角度,即上述定义中的两个词语经常“一起使用”“固定出现”等表述,另一个是从语言自然性角度,即搭配使语言显得自然。四部学习词典中,《剑桥》《朗文》和《牛津》都明确强调了搭配的自然性特点,尤其《朗文》早在第3版就明确指出,“词语搭配是指在日常应用中‘自然地’组合在一起的一群词语。它们和成语有所不同,其含义通常可以通过单个的词反映出来……用错了搭配,听者也许可以理解你的意思,但你的英语听起来就会很不自然。”对自然性的重视是学习词典中搭配概念的一个突出特点,四部学习词典在早期都没有特别强调搭配和语言自然性之间的关系,因此,突出搭配和语言自然性的关系体现了研究者对搭配认识的进一步加深,也体现了词典编纂者对学习者问题和学习者需求的重视。
其次,搭配收录数量有增多的倾向,同时以实词搭配为主。通过分析四部学习词典搭配数量和搭配信息框及词类(A部)可以发现:1)搭配收录数量越来越多,地位越来越重要。历史版本比较显示搭配收录的数量在逐渐增加,如OCD第2版搭配的数量比第1版增加了10 000条。相对于一般的语文词典,四部学习词典都专门强调了搭配的收录,而且数量多。《剑桥》在2007年开始使用搭配信息框,《朗文》于2009年在封底把搭配收录情况作为亮点专门进行了介绍,《柯林斯》第8版对搭配尤为重视,搭配数量和搭配信息框数量均为最多。可见,搭配在学习词典编撰中的地位越来越重要。2)搭配收录以实词搭配为主。尽管所有词典在界定搭配时都没有特别强调语法的限制,但在实际收录时,所有的词典都在分类呈现的时候按照“节点词词类+搭配词”的方式分类,集中在动词、名词、形容词上,体现了英语学习词典搭配主要是实词搭配的特点。如《柯林斯》2014年第8版A部共收录76个搭配信息框,节点词词类为名词、动词、形容词,搭配词为名词、动词、形容词、介词。
最后,学习词典有收录更多自由组合的倾向。对比OCD第1版(2002年)和第2版(2008年),在OCD第1版的序言中,编者解释了何为搭配:语言中的单词组合可以看作一个连续统,从完全自由的如see a man/car/book,到完全固定的或惯用的如not see the wood for the trees,在这两个极端之间,有一系列的名词和see连用,既不完全可预测也不完全透明,所有这些组合,除了那些在极端情况下的组合外,都可称为搭配。而根据对两版搭配词典中搭配词语的观察可以发现,个例中反映了收录更多自由组合的倾向。因为词典编纂中要保持编纂原则的统一,个例中的情况可以反映整部词典的倾向。以apple为例,OCD第2版中的搭配增加crisp/green, red/shiny,slice等。像green/red apple这种完全自由组合的收录显示出编者对搭配词典收录自由组合限制的放宽。从clear作形容词时第一个义项的搭配收录情况中也可以看到这种倾向,相较于OCD第1版,其动词搭配未删除原有条目,增加get sth.一条,其副词搭配删除原有pretty一条,增加absolutely, not exactly, relatively等5条。此外,常用词的搭配数量变化也体现了收录自由组合的倾向。以动词use为例,两版中搭配词语数量也有变化,其中副词搭配词语数量增长明显,由13条增加到41条,而动词搭配词语的数量小幅减少,由18条减少到13条。从语言的历时演变角度看,在不到7年的出版间隔里,use这样的常用词语搭配词不可能自发产生如此显著的变化,只可能是编者调整了界定搭配的标准,在副词部分增加了appropriately, inappropriately, correctly, properly, effectively, successfully等典型的自由组合。
2.2 搭配信息呈现的特点
纸版词典的信息呈现主要包括两种基本方式:一是示例呈现,它也有两种形式,示例中不特意标明搭配的隐式呈现和示例中利用字体变化如加粗、黑体、斜体等方式明确标明搭配的显式呈现;二是搭配信息框呈现,一般按词类、义项、义类等分类呈现。在此基础上,不同词典各自增加其他相关信息,如释义、语用等。四部学习词典搭配示例呈现的方式如下:
2)the feeling that when you want to eat food:Allthatwalkinghasgivenmeanappetite. ∘Iwon'thaveanychocolate,thanks.Itwillspoil(=reduce)myappetite.Ihaven'tgotmuchofanappetite(=Iamnothungry).Thechildrenallhavehealthy/goodappetites(=theyeatalot). ∘Bothvirusescausefeverandlossofappetite.——《剑桥》
3)Your appetite is your desire to eat.Hehasahealthyappetite.Symptomsareaslightfever,headacheandlossofappetite.——《柯林斯》
4)a desire for food:Herhusbandalwayshadahugeappetite.|Symptomsincludetirednessandlossofappetite.
adesireorlikingforaparticularactivity: [+for]Shehasanamazingappetiteforknowledge.|Peopleseemtohaveaninsatiableappetite(=alwayswantingmoreofsomething)fornewsofanykind.|alossofsexualappetite.——《朗文》
从上述可以看出,四部学习词典都采用了示例呈现的方式,除了《柯林斯》隐式呈现外,其余词典都使用了显式呈现的方法,《牛津》采用加粗字体以突出显示搭配中的全部词语,《剑桥》只加粗突出显示的搭配词,《朗文》则有选择性地加粗字体突出显示部分搭配。不难看出,显式呈现比隐式呈现清晰明了,用户友好度高,如示例中loss作为appetite的搭配词,在前两部词典中的显式呈现比在后两部中的隐式呈现效果更好。
四部学习词典的搭配信息框则内容更为丰富,呈现方式见表2。
表2 四部学习词典搭配信息框呈现Table 2 Presentation of collocation information in four learner’s dictionaries
相比之下,《牛津》搭配信息框比较特殊,搭配信息框的提示词语是义类的标记,搭配条目进一步根据相关子义类聚合。比如提示词语Criminal justice条目,下设三个子义类,如breaking the law,the legal process等,每个子义类收录若干搭配,每个搭配在其对应的词条处出现时,通过参见等手段链接到这一义类聚合处。学习者在使用语言时,尤其是输出语言时,总是围绕相关的内容输出,义类的聚合提供了快速获得同一义类下相关搭配的便捷方式,这对拓展口语和书面语的表达大有裨益。
其他几部词典与《牛津》不同,没有采用义类聚合的方式,没有提示词语,都以词条为节点词,它们的主要差别集中在两个方面:一是节点词义项、搭配词词类处理先后的差别。如《剑桥》先提示节点词义项,但没有标明搭配词语的词类,《朗文》不提示或笼统给出节点词义项,然后根据搭配词词类分类,也会个别解释一些搭配的意义,而《柯林斯》则根据词类为搭配词分组,然后再用数字符号标明节点词义项。学习者关注搭配信息时有两种情形:已经知道节点词意义,这时词典中先给出节点词义项有助于学习者根据义项迅速确认搭配;尚未掌握节点词意义,这时词典中先给出搭配词词类更方便缩小查找范围,快速锁定合适的搭配。二是标注解释性信息与否和详略的差别。《剑桥》只提供了节点词的词类和义项,《柯林斯》只提供了搭配词词类和节点词在搭配中的义项,而《朗文》提供了最为详细的信息,如搭配词词类、例句、释义、语用信息(如正式与否、口语书面语)等。简略的优势在于节约篇幅的同时可以满足学习者的基本需要(查询合适的符合语感的搭配),详细的优势在于能更好地满足不同程度学习者的使用需求。
3 对汉语二语学习词典搭配收录和呈现的建议
近些年,国内也编纂了一些汉语学习词典,总体上数量不多,对词语搭配重视程度也不够。综合上述四部英语学习词典收录和呈现搭配的特点,考虑搭配学习的复杂性,对汉语二语学习词典编纂中收录和呈现搭配提出如下建议:
首先,收录更多的自由组合。一般而言,自由组合意义透明,满足语义、语法等各种条件的限制时,可以完全类推,但在二语学习过程中,限制条件非常多,增大了学习难度。比如文化差异的影响,《牛津》收录了baked apple,但汉语真实语言中出现“烤苹果”自由组合的可能性很低;再比如部分受音节的影响,汉语“感情丰富”是搭配,而“多”基本上不能代替“丰富”出现在此上下文中;又如真实二语语料中过度类推的例子“今天早上他打自行车去……”。如此种种,都或多或少限制了自由组合类推的可能性和范围,在一定程度上影响了语言的自然程度,这也是上述词典加大自由组合收录的原因。收录更多的自由组合可以给予学习者更多凭借。
其次,提供丰富的例句、实用的语用信息。在搭配示例中可以看到,《柯林斯》和《剑桥》提供的信息较为简洁,能够基本解决搭配词语之间是否合适的问题,但在具体语言环境中,如何正确使用,则需要更多的信息,《朗文》提供了例句、释义、语体等信息,可以帮助学习者获得学习搭配必须的语境信息、文化信息等,这是很好的实践。如下面的初级汉语水平留学生汉语表达的真实语料例子:一个真倒霉的日,“倒霉日”“倒霉的日子”及“真倒霉”“特别倒霉”两组之中每个都是可以搭配出现的,但在什么样的语言环境下出现还不能一言蔽之,详细的例句则可以提供相应的语境信息,有助于培养学习者的语感。又如另一个语料例子,我可以保持一个热爱的精神去做喜欢的工作,其中“热爱的精神”在汉语中出现频率很高,但在实际语言实践中却很少单用,常以“对某事物热爱的精神”格式出现,显然,这种情况只单独说明“热爱”和“精神”构成搭配是没有意义的,甚至会误导学习者。
4 结 语
搭配在二语学习中的难度很大。本文分析了搭配的特点,指出词语搭配既不像固定短语完全具有个性,必须单独学习,也不像自由短语具有共性,可以通过类推举一反三,这使搭配学习具有鲜明的不同之处,使得搭配在语言研究、语言实践中越来越受到重视,以致学习词典纷纷加重搭配信息的收录和呈现。目前,对搭配的认识和研究还在不断发展,理论研究的深入将有助于搭配的学习。但在词典编纂工作中,实际运用和理论分析总是会存在差距,比如上述建议中提示误用信息就涉及数量、质量的把控原则,因此在目前尚无合适的理论判断依据的情况下,只能通过大量的实践不断总结经验教训以螺旋式提高。本文对权威的四部英语学习词典进行了调查比较,发现他们的搭配收录数量逐步提高,范围逐步扩大,呈现方式越来越多样化,这也从反方向说明搭配学习的难度及独特性。