APP下载

《牛津高阶英语词典》第1至9版释义相似度的历时研究

2021-06-21李仕春

北华大学学报(社会科学版) 2021年5期
关键词:英语词典辞书义项

李仕春

引 言

相似度是指两个或多个事物之间的匹配程度,相似度越大,说明事物之间相似程度越高,反之就越低。目前,相似度作为一种量化方法被广泛应用于自然科学和人文科学等多门学科中。相似度在语言学研究中也有着广泛的应用,郑锦全[1]、陆致极[2]、王士元,沈钟伟[3]、陈海伦[4]讨论了方言相似度及其计算方法的问题,这有利于精确地划定方言分区和确定方言之间的亲属关系。我们在本研究中把相似度引入词典学评价领域,通过比较不同辞书文本之间释义相似度,以量化的形式显示不同辞书文本之间的差异程度。

释义相似度是指不同词典或同一词典的不同版本在释义方面的相似程度,它涉及的主要参数有释义用语、配例、语法信息标注及其他。我们可以通过计算上述释义参数所占比重得出不同版本词典的释义相似度。

“英语词典可能在所有国家都是词典编纂发展的先行者。”[5]与其他英语学习词典相比,《牛津高阶英语词典》(Oxford Advanced Learner’s Dictionary,以下简称《牛高》)是应用面最广、修订次数最多、时间跨度最长的一部外向型学习词典,因此,该词典具备很高的学术研究价值。本文主要从历时角度考查《牛高》第1至9版[6-14]的释义相似度,用量化的形式显示以《牛高》为代表的英语中型语文词典编纂的现代化进程。

英语词典的释义相似度涉及释义用语、配例、语法信息标注及其他四类释义参数。具体来讲,英语词典的释义用语包括义项数量的增减、释义方式的改变、释义元语言、释义提示语、搭配、义频、词频等释义参数;配例包括配例数量的增减、配例内容的改变等;语法信息标注包括标注词性、按词性排列义项,动词时态、单复数,名词可数不可数,形容词比较级、定语或表语的用法等;其他包括字体颜色、语域等释义参数。如果更细化一些,英语词典共涉及四大类八十余种释义参数。

一、《牛高》释义相似度的计算方法

词典编纂的总体趋势是由简单到复杂,相应地释义参数也就由少到多。因此同一部词典后出版本的释义参数要比先出版本的释义参数多,先进辞书文本的释义参数要多于落后辞书文本的释义参数。我们把《牛高》先出版本的释义参数作为分子,后出版本的释义参数作为分母,分子除以分母即为两个版本的释义相似度。本文用S表示释义相似度,下标X表示所求释义相似度的对象词,下标数字1、2、3、4、5、6、7、8、9……分别表示X所在的版本,两个下标数字连在一起表示X所在的两个版本,则Sfly12就表示《牛高》第1版和第2版 “fly”的释义相似度。下文,我们以《牛高》中“fly”第1版和第9版的释义相似度的计算方法为例加以说明。

(一) 释义用语所占分值的计算

释义用语是指解释被释词的语言,在释义相似度公式中它占的分值是65,用字母a表示,具体来讲它又包括以下释义参数:

1.义项数量和释义方式

义项数量的变化是指义项数量的增减分合,在释义相似度公式中,占的分值是25,用a1表示,如“fly”在《牛高》第1版有6个义项,第9版有21个义项。释义方式的改变是指由“以词释词”或“以短语释词”变为“短语释词”或“句子释词”,其作用是把义项和语境结合起来,增加了释义的准确性,在释义相似度公式中,占的分值是40,用a2表示。与第1版相比,“fly”在第9版中的释义方式和义项数量都发生了根本的变化,以至于两个版本的释义语言中只有几个关键的词语相似,因此在Sfly19释义相似度公式中,释义用语的分子估值是a1+a2=4.78。

2.释义元语言

《牛高》自第5版开始使用释义元语言,用a3表示。如第1版至第4版在解释“sit”的第一个义项的时候都使用了单词“buttock”,但在第5版就改用浅显易懂的词语了。在释义相似度公式中,释义元语言占的分值是10。因为“fly”在第1版中没用释义元语言,所以在Sfly19释义相似度公式中,分子估值为a3=0。

3.释义提示语

《牛高》自第6版开始标注释义提示语,用a4表示。在释义相似度公式中它占的分值是10。因为“fly”在第1版中没用释义提示语,所以在Sfly19释义相似度公式中,释义提示语的分子估值为a4=0。

4.义频

《牛高》自第6版开始标注义频,用a5表示。在释义相似度公式中它占的分值是10。因为“fly”在第1版中没有义频标注,所以在Sfly19释义相似度公式中,义频的分子估值为a5=0。

5.词频

《牛高》自第6版开始标注词频,用a6表示。在释义相似度公式中它占的分值是10。因为“fly”在第1版中没有词频标注,所以在Sfly19释义相似度公式中,词频的分子估值为a6=0。

那么,“fly”的释义用语在释义相似度公式中,分母占的分值是65,分子的估值是4.78。

(二) 配例所占分值的计算

配例是以举例的形式对释义用语进行补充,主要以词、短语、句子的形式来体现,在释义相似度公式中占的分值是15,用字母b表示。从《牛高》第1版至第9版,配例的数量在逐渐增加,内容也在改变。例如,相对第1版,第9版中“fly”的配例发生了本质性的变化,所以在Sfly19的释义相似度公式中,配例的分子估值是b=1。

(三)语法信息所占分值的计算

《牛高》中标注的语法信息非常丰富,在释义相似度公式中占的分值是10,用字母c表示。与第1版相比,第9版对“fly”的语法信息标注发生了根本的变化,所以在Sfly19释义相似度公式中,语法信息的分子估值是c=2。

(四)其他信息所占分值的计算

“其他”主要是指除上述释义参数之外的释义参数,在释义相似度公式中所占的分值是10,用字母d表示。《牛高》第9版对“fly”的释义比第1版多了惯用语、颜色、情感等释义参数,所以在Sfly19释义相似度公式中其他信息的分子估值是d=2。

根据上文,我们得出fly在《牛高》第1版和第9版之间的释义相似度是:

我们用同样的方法可以算出其他常用词不同版本的释义相似度。

二、《牛高》不同版本的释义相似度

释义是辞书的灵魂,常用词释义更是判断一部词典能否成为品牌辞书的首要因素。《牛高》修订者非常重视常用词释义的修订,因此我们着重从常用词的释义角度考察《牛高》不同版本的释义相似度。本文主要采用抽样统计的方法研究《牛高》不同版本的释义相似度。具体做法是:首先从《牛高》中随机抽取各版本均有的三组词,每组词有10个;其次计算出每个常用词相邻版本的释义相似度,通过加权的方式得出每组词的相邻版本释义相似度;再次以加权的方式得出三组词相邻版本的释义相似度,并将其视为《牛高》两个版本的释义相似度。

我们在《牛高》中随机抽取的三组词分别是:

第一组:fly、wash、sit、lie、sheep、grass、apple、white、long、dirty;

第二组:drink、push、stand、die、pig、tea、root、black、short、bad;

第三组:sing、kill、walk、hear、hand、blood、water、straight、slow、front

《牛高》不同版本的释义相似度计算结果见表1—27:

(一)《牛高》第1版和第2版的释义相似度

表1 第一组第1版和第2版的个体和平均释义相似度

表2 第二组第1版和第2版的个体和平均释义相似度

表3 第三组第1版和第2版的个体和平均释义相似度

《牛高》第1版和第2版的释义相似度是:S12=(S一组12+ S二组12+ S三组12)/3=(66.60%+ 54.27%+74.10%)/3=64.99%。

(二)《牛高》第2版和第3版的释义相似度

表4 第一组第2版和第3版的个体和平均释义相似度

表5 第二组第2版和第3版的个体和平均释义相似度

表6 第三组第2版和第3版的个体和平均释义相似度

《牛高》第2版和第3版的释义相似度是:S23=(S一组23+ S二组23+ S三组23)/3=(84.20%+ 85.70%+83.60%)/3=84.50%。

(三)《牛高》第3版和第4版的释义相似度

表7 第一组第3版和第4版的个体和平均释义相似度

表8 第二组第3版和第4版的个体和平均释义相似度

表9 第三组第3版和第4版的个体和平均释义相似度

《牛高》第3版和第4版的释义相似度是:S34=(S一组34+ S二组34+ S三组34)/3=(53.10%+62.40%+47.90%)/3=54.47%。

(四)《牛高》第4版和第5版的释义相似度

表10 第一组第4版和第5版的个体和平均释义相似度

表11 第二组第4版和第5版的个体和平均释义相似度

表12 第三组第4版和第5版的个体和平均释义相似度

《牛高》第4版和第5版的释义相似度是:S45=(S一组45+ S二组45+ S三组45)/3=(75.10%+ 75.80%+82.10%)/3=77.67%。

(五)《牛高》第5版和第6版的释义相似度

表13 第一组第5版和第6版的个体和平均释义相似度

表14 第二组第5版和第6版的个体和平均释义相似度

表15 第三组第5版和第6版的个体和平均释义相似度

《牛高》第5版和第6版的释义相似度是:S56=(S一组56+ S二组56+ S三组56)/3=(69.40%+ 67.78%+73.05%)/3=70.08%。

(六)《牛高》第6版和第7版的释义相似度

表16 第一组第6版和第7版的个体和平均释义相似度

表17 第二组第6版和第7版的个体和平均释义相似度

表18 第三组第6版和第7版的个体和平均释义相似度

《牛高》第6版和第7版的释义相似度是:S67=(S一组67+ S二组67+ S三组67)/3=(90.10%+91.60%+93.30%)/3=91.67%。

(七)《牛高》第7版和第8版的释义相似度

表19 第一组第7版和第8版的个体和平均释义相似度

表20 第二组第7版和第8版的个体和平均释义相似度

表21 第三组第7版和第8版之间的个体和平均释义相似度

《牛高》第7版和第8版的释义相似度是:S78=(S一组78+ S二组78+ S三组78)/3=(95.25%+95.70%+93.70%)/3=94.88%。

(八)《牛高》第8版和第9版的释义相似度

表22 第一组第8版和第9版的个体和平均释义相似度

表23 第二组第8版和第9版的个体和平均释义相似度

表24 第三组第8版和第9版的个体和平均释义相似度

《牛高》第8版和第9版的释义相似度是:S89=(S一组89+ S二组89+ S三组89)/3=(98.00%+97.60%%+97.80%)/3=97.80%。

(九)《牛高》第1版和第9版的释义相似度

表25 第一组第1版和第9版的个体和平均释义相似度

表26 第二组第1版和第9版的个体和平均释义相似度

表27 第三组第1版和第9版的个体和平均释义相似度

《牛高》第1版和第9版的释义相似度是:S19=(S一组19+ S二组19+ S三组19)/3=(7.61%+8.58%+6.86%)/3=7.68%。

三、《牛高》各版本释义相似度的学术价值

《牛高》自1948年出版以来,先后于1963、1974、1989、1995、2000、2005、2010、2016年进行了8次修订,其修订幅度大致可以从上文释义相似度的变化情况研判出来。我们可以根据这种变化总结出《牛高》在释义方面的修订特点及动机,进而了解《牛高》释义的现代化进程,以收到“他山之石,可以攻玉”的效果,为外向型汉语学习词典的编纂提供有益启发。

(一)《牛高》的修订特点及动因

《牛高》第1版和第2版、第2版和第3版、第3版和第4版、第4版和第5版、第5版和第6版、第6版和第7版、第7版和第8版、第8版和第9版、第1版和第9版的释义相似度分别是:S12=64.99%、S23=84.50%、S34=54.47%、S45=77.67%、S56=70.08%、S67=91.67%、S78=94.88%、S89=97.80%、S19=7.68%。上述数据表明:

1.《牛高》的释义变化主要集中在第1版至第6版。这说明《牛高》的修订变化主要集中在第1版至第6版,也即2000年以前。《牛高》各个版本的“出版说明”也印证了上述观点,这说明《牛高》词典编纂者非常注重与时俱进。例如:《牛高》第2版的出版说明指出:“This is a completely revised and reset edition of the Dictionary/这是一部彻底重新编纂的修订本。”[7]第3版的出版说明中强调:“This is a completely revised,up-dated and reset edition of the Dictionary/这是一部根据新形势重新编纂的修订本。”[8]第4版的出版说明中写道:“Fully revised and up-to-date,with greatly increased coverage,especially of scientific and technical vocabulary.Clear,precise definition through.Numerous example phrase and sentences carefully chosen to illustrate words in context/(该版本)做了全面修订和更新,词汇覆盖范围大大增加,尤其是增加了科学和技术词,定义更加精确。精心挑选的大量例句和短语,有利于通过语境表明词义。”[9]

2.《牛高》第1版和第9版的释义相似度只有7.68%,这说明《牛高》第1版和第9版之间的修订幅度非常大,这与英美词典编纂者非常注重品牌效应有关。目前英语辞书市场上外向型学习词典主要有《牛津高阶英语词典》《朗文当代高级英语词典》《韦氏高阶英语词典》《柯林斯COBUILD高阶英语学习词典》《麦克米伦高阶英语词典》等系列品牌,内向型词典主要有《牛津简明英语词典》《钱伯斯20世纪词典》《柯林斯英语词典》《韦氏大学词典》等系列品牌。为了能在英语辞书市场上站稳脚跟,赢得稳定的读者群,保障辞书编纂者和出版者的利益,英语词典编纂者就必须不断地修订辞书才行。这是《牛高》编纂者一直在不断超越自我的动力之一。

《牛高》编纂者既有否认自我的勇气和精神,但有时也表现出动摇不定的摇摆态度。例如:“apple”在第1版中有两个义项:一种水果和长这种水果的树,第2版和第3版合并为一个义项,第4版则又分为两个义项;“tea”在第1版中有4个义项,第2版和第3版合为2个义项,第4版又参照第1版再重新分为4个义项。《牛高》编纂者对待同一个词语释义的反复变化,也反映了他们在词典释义方面的审慎态度。

(二)《牛高》释义的现代化进程

用数字变化的规律说明语言变化规律的形式已经成为当今语言学研究的一个重要趋势,因而,我们也可以用数字变化的规律研究英语语文辞书编纂的现代化进程。把上文数字和《牛高》各版本中具体词的释义变化情况结合起来,可知《牛高》释义的现代化进程大致分为三个阶段:以现代语言学知识为指导进行释义的阶段、以词典用户为中心进行释义的阶段和依托语料库技术进行全面释义的阶段。

1.以现代语言学知识为指导进行释义的阶段(第1版—第4版)

以现代语言学知识为指导进行释义(划分词的义项)的阶段主要是指辞书的初创时期,这与时代发展特点密切相关,同时,由于《牛高》的编纂还处于尝试、摸索阶段,所以释义不稳定,变化较大。这种变化在《牛高》的第1版至第4版表现尤为突出。第1版和第2版释义相似度为S12=64.99%,这说明第1、2版的释义非常不稳定。例如:“bad”在《牛高》第1版的解释是:“wicked; evil; not right and good.It is bad to steal.……be in a bad temper.be very angry.”《牛高》第2版则把该义项拆分为两个义项: “1.wicked,evil,immoral.2.unpleasant; disagreeable; unwelcome.”第1版侧重于“bad”的社会意义,把心理意义以配例的形式补充出来,第2版则把两种意义都列为义项。“white”在第1版的解释是: “the contrary of black; the color of clean snow or common salt,as an old man with white hair.”同样的释义在第2版改为:“the color of clean snow or common salt:his hair turned white.”显然第2版的释义更科学一些。

2.以词典用户为中心进行释义的阶段(第4版—第5版)

20世纪70年代中后期,英语辞书市场上先后出现了《朗文当代高级英语词典》(1978年第1版)、《柯林斯COBUILD高阶英语学习词典》(1987年第1版)等一批新型词典,这些词典编纂的共同特征是以词典用户为中心,因此在编纂体例、释义方式方面与以往辞书存在着很大的区别。这种新的编纂理念对《牛高》的修订也产生了很大影响,主要表现在多义词义项的排列和释义方式的改变等方面。《牛高》第1、2、3版中多义词的义项和由其组成的习语、复合词是混合排列在一起的,从第4版开始,则是把多义词的义项排列在前,由其组成的习语和复合词单列于多义词义项后面。除了在释义方面寻求更精确的表述外,《牛高》第4版在释义方面还有一个更大的变化就是用描述性的话语释义代替“以词释词”。《牛高》词典1、2、3版的最常见释义方式是“以词释词”或“短语释义”,如:“blood”在《牛高》第1版的第3个义项是:“family; descent; birth; relationship.”第2版第2个义项是:“passion;temper.”第3个义项:“relationships.”但从第4版开始改为“短语释义”或“句子释义”了。

真正接近现代词典释义的则从第6版开始。例如:“hear”在《牛高》第1、2、3、4、5版的解释是:“to perceive sounds with ears.”在《牛高》第6、7、8、9版的解释是:“to be aware of sounds with your ears.”

“dirty”的动词性义项在《牛高》第4、5版的释义是:“to become or make (sth) dirty.”第6、7、8、9版改为:“to make (sth) dirty.”

“kill”在《牛高》第1版的第1个义项是:“put to death; destroy life; cause the death of.”《牛高》第4版的相应义项改为:“cause death or cause the death of(sb/sth).”第6、7、8、9版的相应义项是:“to make sb/sth die.”

总之,《牛高》第6版的释义最接近现代语言学的意义,其后第7、8、9版相关词的释义和第6版基本一致。

3.依托语料库技术进行释义的阶段(第3版—第6版)

多项研究指标显示,英语词典编纂的语料库化工作始于20世纪70年代中期,《牛高》词典的编纂与语料库技术结合也是始于第3版(1974年),经过20多年的修订:“《牛高》词典编纂者在2000年就已经完成了用语料库技术丰富并补充英语语文词典中多义词义项划分的任务。”[15]语料库技术和词典编纂相结合的直接结果是:“第4版是全新修订的新版本,内容比第3版增加50%以上”[16],第7版则又比第4版的篇幅增了一倍以上。《牛高》词典编纂者主要从补充义项、改“以词释词”为句子释义、增加配例、增加习语等几个方面把词典编纂和语料库技术结合在一起修订已有版本。

结 语

为了能在竞争激烈的英语辞书市场站稳脚跟、赢得稳定的读者群,为了保证辞书编纂者和出版者的利益,不仅《牛高》词典的编纂者,其他英语品牌词典的编纂者也非常注重对已有版本进行革新式的修订,可以这样说,英语词典编纂者在新版本的修订方面一直走着精益求精的路子。

与英语词典编纂者注重辞书修订相反,汉语词典编纂者似乎不是十分注重辞书修订创新,这方面的证据是汉语辞书相邻版本释义的变化幅度并不是很大,例如:《现代汉语词典》第1版和第2版、第2版和第3版……第6版和第7版、第1版和第7版的释义相似度分别是:S12=98%,S23=96%,S34=97%,S45=88%,S56=98%,S67=100%,S17=85%。(1)数据为艾红娟、李仕春在 “《现代汉语词典》第1至第7版释义相似度”课题研究过程中所得。

由此可见,汉语词典编纂者和英语词典编纂者在辞书修订理念和修订意识方面还是有差别的。如果我们从英美等辞书强国的英语中型语文辞书的文本角度看,就会发现国内汉语词典编纂者在辞书版本的修订方面确实需要向国外同行学习。为了早日使我们国家由辞书大国转变为辞书强国,汉语词典编纂者确实应该学习英语词典编纂者这种勇于否定自我、不断革新的勇气和精神。

猜你喜欢

英语词典辞书义项
CISHU YANJIU LEXICOGRAPHICAL STUDIES
大型辞书疑难字考释七则
社会认知语言学视域下年度热词研究——以《牛津英语词典》年度热词为例
小心两用成语中的冷义项
两用成语中的冷义项
Enhanced Precision
《古英语词典》的编纂与启示
《牛津高阶英语词典》(第8版)面世
あたらずといえどもとおからず
认知辞书学引论