APP下载

基于COCA语料库的近义词辨析

2024-01-27钟琼琼董梅

现代商贸工业 2024年2期
关键词:搭配语域近义词

钟琼琼 董梅

摘 要:基于语料库的近义词辨析是语料库语言学研究的重要内容。本文基于COCA语料库的近义词辨析—以terminate和finish为例,使用数据驱动的研究方法,来研究近义词之间的词频、语域、搭配和语义韵的差异,以展示它们的语用差异。结果显示: (1)上述数据表明, 从总频数及每百万次频数来看,terminate和finish使用总频数相差很大,finish 较 terminate常用很多, 并且finish更多地用于电视电影、报纸和杂志领域,而terminate更多地用网络、学术和博客领域;(2)terminate搭配的大多是包含中性语义色彩的动词,该词大多放在被修饰词的右侧,也有放在左侧的;而finish搭配的大多是包含中性偏褒义语义色彩的动词,该词总放在被修饰词的右侧;(3)finish具有積极的语义韵,而terminate带有偏消极的语义韵。

关键词:语料库;近义词;语域;搭配;语义韵

中图分类号:F74     文献标识码:A      doi:10.19311/j.cnki.16723198.2024.02.030

1 美国当代英语语料库(COCA)简介

COCA或Corpus of Contemporary American English包含10亿词的文本,分为小说、流行杂志、报纸、口语和学术期刊5大类别。文本在这5个类别中分布均匀。从创建之初,COCA不仅是一个在线词典,而且还具有检索语料库的功能,能够帮助研究者追溯语言发展中的变迁。除了强大的文本检索功能外,由于将语料按照年份进行了细致的划分,研究者可以追溯语言发展中的变迁。

此外,它与English corpora.org中的大多数其他语料库不同,COCA关注语料库中的前60000个单词,以及每个单词的广泛信息,包括频率信息、定义、同义词、WordNet条目、相关主题、一致性(COCA中的新显示)、集群、将该词作为“关键字”的网站,以及KWIC/协调行。COCA 拥有这些特性,使它成为研究人员、教师和学生的理想语料库。

COCA的几个常见用途:(1)确认表达是否地道:这是语料库最基本也是最重要的一个功能。我们有时会遇到一些模棱两可的表达,例如“用鼠标点击一下”是用鼠标点击还是用鼠标点击一下? “普通人”是中式表达吗?语料库可以解决这些复杂的知识点。COCA 有能力统计一个单词或短语在五种不同的文体(小说、流行杂志、报纸、口语和学术文章)中的出现频率,这让我们能够根据这些词频确定它们的最佳应用。(2)确定单词的使用语境 举个例子,我们通常建议学生在学术写作时使用“很多”而不是“很多”,因为“很多”是一个非正式表达,更多出现在口语中。对此,我们在COCA中可以找到例证。在网站列表中选择“Chart”功能,然后输入“a lot of”,然后点击“See frequency by section”。我们可以看到这个词组在口语、小说、流行杂志、报纸和学术文章这五种文体中的出现频率。(3)比较两个近义词的区别。 COCA 的“比较”功能可以用来比较两个近义词的区别。有时,使用词典,很难找到答案,在这个情况下,语料库的价值就体现出来了。

2 研究结果

大数据时代,用数字说话。数字可以直观,准确地反应客观规律,让人一目了然。COCA语料库具有海量,丰富,多样话文本,通过该语料库的内嵌检索功能,可以快速,准确地呈现出近义词terminate和finish的在不同语域的词频数,搭配及语义韵。

2.1 terminate和finish在不同语域中的词频分布

对比在 COCA 的不同语域中terminate和finish的词频分布:

2.2 terminate和finish的搭配词

Krishnamurthy指出:“有意义的搭配词是指在被研究词的两侧5个词的范围内出现频数比按均匀分布所期望出现的频数高得多的词。”本文将使用BNC语料库自带的MI值来评估搭配强度。首先,我们以terminate为节点词,跨距-5/+5检索其搭配词及MI值,其左右侧各5词之内“频繁出现”的搭配词按MI值(均大于3)的大小排列,分别为pregnancy、contact、decision、rights、agreement、employment、pregnancies、shall、parental、intention、pelationship、immediately、services、suspend,decided.查看这些词的语境共现行,这些词与terminate 的搭配为:

Terminate pregnancy/contact/rights/agreement;

Take the decision to terminate

Terminate employment/pregnancies/shall/parental/intention;

Terminate/pelationship/immediately/services/suspend/decided.

因此,Terminate通常与怀孕、联系、决定、权利、协议、就业、诉求、服务、决定等词汇搭配。权利和诉求出现在学术界,这解释了上文语域分析中提到的动词Terminate在学术界的应用,怀孕出现在网络上,这解释了上文语域分析中提到的动词Terminate在学术界的应用。

同样,我们以finish为节点词,在跨距-5/+5内检索MI≥3的搭配词,按照搭配频次的大小排列,列举前15个搭配词分别为job、sentence、degree、homework、sentences、cooking、meal、digest、packing、hurry、cleaning、sixth、marathon查看这些词的语境共现行,这些词与finish 的搭配为:

Finish job/sentence/degree/homework/sentences;

Finish cooking/meal/digest/packing/hurry;

Finish cleaning/sixth/marathon

由此可见,与finish搭配的大多是工作、句子、學位、作业、烹饪、用餐、消化、包装、清洁、消化、文书工作的词汇。关于工作,作业,烹饪更多地出现在电影和电视中,这同时也解释了上文语域分析中提到的动词FNISH更多地用于电影和电视中的现象;关于清洁和文书工作更多地出现在报纸中,这同时也解释了上文语域分析中提到的动词finish更多地用于报纸中的现象。并且因为工作、句子、学位、作业、烹饪、用餐、消化、包装、清洁、消化、文书工作的词汇相比于怀孕、联系、决定、权利、协议、就业、诉求、服务、决定等词汇更为常用,所以从总频数及每百万次频数来看,terminate和finish使用总频数相差很大,finish 较 terminate常用很多。

2.3 terminate和finish的语义韵

语义韵是现代语料库语言学所关注的,它描述了一个单词或词组的“超越词界的联想色彩”Louw将语义韵分为“好的”和“坏的”,并讨论它在反语的使用和表达作者真实态度方面所起的作用。他认为语义韵实际上是一种语义氛围,它存在于某些词中并可以“传染”给其常用搭配词。

如前所述,terminate搭配通常使用中性语义的动词,通常位于被修饰词的右侧。通过检查这些搭配词所在索引行的扩展语境,我们发现,即使看上去比较中性的词,如联系、决定、权利和协议,也被“传染”上了负面的语义氛围。以下是索引行:

During the Probationary Period, either the company or the employee can terminate the employee contract by following the terms and conditions indicated in the contact.

Qantas shares jump more than six per cent in early trading on the Australian Stock Exchange,following Fair Work Australia's decision to terminate industrial action. Any other attempt to copy,modify,sublicense or distribute the Document is void,and will automatically terminate your rights under this license. They can specify how many times you can sell,lend, give,or lease the same content and what conditions they will use to terminate the agreement to transfer the content.

上文提到,finish搭配中使用的大多数动词是中性或偏褒义语义色彩的,通常位于被修饰词的右侧。通过观察它们所在索引行的扩展语境,我们发现尽管这些词看起来比较中性,但实际上如 job/packing/cooking/homework,却传达一种积极的语义氛围。如下索引行:

All things being equal,we should finish the job tomorrow.

Finish packing your suitcase so we can get going.

After I finish cooking,I will find life's beauty again.

Whenever finish homework,or when the weekend is also the time when I am most happy,because I can talk to me “old friend” - accompanied by a book.

2.4 通过词典义来进行近义词辨析的弊端

使用语料库进行近义词辨析,用数据说话,我们可以直观,深刻地感受到差异。而如果简单通过字典释义辨析,研究发现,finish的释义有:完成;结束;吃完,喝光,用尽(所剩之物);做好;使筋疲力尽;(赛跑、竞赛)得…名;terminate的释义有:终止;结束;停止;到达终点站。这其中是有很多释义是重合的,根本无法直观区分两者的差异,反而容易加深可以混用,互换的错误想法。因为如果单纯只通过释义来辨析,会发现都有结束之意,在使用时如果想当然,在需要表达结束之意时,就会举棋不定,觉得都可以,可以混用。调查发现,习惯于使用词典义来进行近义词辨析的同学,在询问如果要表达结束之意时,怎么选择finish,terminate时都是一脸困惑,说凭感觉,随机用,有的时候用finish比较常见,如果是写作就用terminate感觉用词会比较高级一点。一旦形成这种错误的惯性思维,就会越发不知道如何科学地辨析近义词,在使用时想当然,乱用,误用一通。虽然美国当代英语语料库在2008年已经正式上线了,但是调查发现在国内并不是为大家所熟知。很多同学都还不知道有这么个学习工具,所以只是凭借之前的学习习惯,靠字典释义来进行近义词辨析。好的学习习惯是需要养成的,我们英语学习者应该多方求证,认真思考,选择正确的,合适的学习方式。如果虚心请教,不难发现,那些在外留学过的英语学习者是熟悉并且经常使用COCA语料库的,并且用过之后他们都会推荐使用COCA语料库来进行近义词辨析。

因为与传统词典相比,COCA 有以下优势:(1) 语料库的文本具有较强的实时性,例如生活满意度和社交媒体,这些词在传统词典中没有收录,但语料库中可以找到。(2) 语料库可以提供有关单词的词频数据,这可以帮助我们确定该词在实际应用中出现的频率,并帮助我们准确用词。(3)COCA不仅可以查单个单词,也可以查一整段表达,在搜索查找中,我们的主动性,参与度提高了,理解就更加深刻了。(4) 此外,语料库还具有模糊搜索和单词搭配等功能。

在需要快速认识新单词,宽泛了解释义时通过词典义学习是比较适合的。但近义词辨析本身就属于深度的二次学习,是需要有更加科学的学习工具的。这需要我们有更高的积极性,参与度,深入学习不同。宽泛的被动接受信息是无法进入深度的二次学习状态中的,二次学习是需要我们有更高的积极性,参与度,深入学习不同的。近义词辨析也是需要我们多维度进行辨析,而词典义只有一个简单的释义维度,并且释义是有重合之处,让人从释义也无法辨析。所以通过词典义辨析近义词有的时候反而适得其反,加深了可以互用的错误概念。近义词辨析是教学的重难点,如果我们要成为一个合格的外语学习者,这方面的学习是必不可少。这就需要我们选择正确的学习方向,少走弯路。基于语料库的近义词辨析就给我们指明了一条道路,可以让我们多维度,基于大数据进行近义词辨析。方向选对了,就成功了一半,作为外语学习者,我们要以开放的心态,去接受新的学习工具,学习方式。

3 结束语

基于语料库的近义词辨析是语料库语言学研究的重要内容。本文基于COCA语料库的近义词辨析—以terminate和finish为例,使用数据驱动的研究方法,来研究近义词之间的词频、语域、搭配和语义韵的差异,以展示它们的語用差异。结果显示:(1)上述数据表明, 从总频数及每百万次频数来看,terminate和finish使用总频数相差很大,finish 较 terminate 常用很多, 并且finish更多地用于电视电影、报纸和杂志领域,而terminate更多地用网络、学术和博客领域;(2)terminate搭配的大多是包含中性语义色彩的动词,该词大多放在被修饰词的右侧,也有放在左侧的;而finish搭配的大多是包含中性偏褒义语义色彩的动词,该词总放在被修饰词的右侧;(3)finish具有积极的语义韵,而terminate带有偏消极的语义韵。

大数据时代,数字说话,事实胜于雄辩。利用数据驱动研究方法,用数据科学,直观地展现近义词的不同,可以让我们看得更清楚,理解得更深刻。别人告诉你,你可能理解得浮于表面,当需要实际应用时,仍旧一头雾水,摸不着头脑。但是基于语料库的近义词辨析,是有很多实际操作的过程的,我们通过检查词频可以确定自己的表达是不是地道,避免中式英语。COCA不仅可以查单个单词,也可以查一整段表达。在搜索查找中,我们的参与度提高了,自然就理解深刻了。词典义辨析相当于别人喂饭,我们是被动地接收信息,这种被动的学习方式是远远不如我们主动地学习的。主动的学习往往印象深刻,知识深刻入脑。选好学习工具,事半功倍。我们非英语母语者在辨析近义词时如果只是借助传统的字典,会发现字典释义很多是存在重合的中文意思,这就会让我们非母语者觉得有的时候这两者是可以混用的。一旦习惯于通过词典义来辨析近义词,就会越来越难分辨,感知近义词之间的细微差异,对于适用的语境也会不敏感。

观察发现,很多同学在辨析近义词时存在投机侥幸心理,很多时候都是随机用,凭感觉,乱用一通。这就会导致我们在英文写作表达上用词不当,词不达意,给人一种不地道,不正宗的感觉。如果在实际应用口语表达时近义词误用,更有甚者,会引起母语者的困惑、质疑,感觉摸不着头脑。因此基于语料库的近义词辨析就给我们指明了一条道路,可以让我们多维度,基于大数据进行近义词辨析。方向选对了,就成功了一半,作为外语学习者,我们要以开放的心态,去接受新的学习工具,学习方式。通过语料库辨析近义词,可以通过词频直观感受语域使用的不同,理解近义词的细微差异;并且通过知晓近义词搭配的差异化,可以在使用时迅速判断是否搭配合理,从而避免混淆误用。

参考文献

[1]季佩英.等.全新版大学英语(第二版)[M].上海:上海外语教育出版社,2005.

[2]杨惠中.语科库语言学导论[M].上海:上海外语教育出版社,2002.

[3]Davies,Mark.(2004) BYUBNC:The British National Corpus. Available online at http://corpus.byu.edu/bnc[EB/OL].

[4]Firth,J. Papers in Linguistics:19341951[M].Oxford:Oxford University Press,1957.

[5]卫乃兴.搭配研究50年:概念的演变与方法的发展[J].解放军外国语学院学报,2003,(2).

[6]Sinclair,J. Corpus. Concordance,Collocation[M].Oxford:Oxford University Press,1991.

[7]Stubbs,M. Text and Corpus Linguistics[M].Oxford:Blackwell Publishers,1996.

猜你喜欢

搭配语域近义词
怎样辨析近义词
找找近义词
《约翰·汤普森简易钢琴教程》教材之我见
基于语料库的英语动词open的搭配研究
“反而”的语义韵考察
基于BYU语料库的英语专四词汇试题解析
不由分说
不劳而获
意义隐喻与语域的关系——基于自建英语新闻语料库的研究
浅析语域的特性及教学模式探讨