APP下载

基于COCA语料库的近义词辨析

2024-05-19王艳艳于艳英

现代商贸工业 2024年10期
关键词:搭配语域近义词

王艳艳 于艳英

摘 要:在英语学习中,近义词的辨析一直是英语学习的难点和重点。该文以美国当代英语语料库COCA为研究工具,以近义词size和measure为例,通过检索size 和measure在COCA语料库的使用情况,从词频、语域和搭配这几个方面来分析他们的异同,旨在用真实的语料分析这组近义词的含义以及用法,提升英语学习者对近义词的辨析能力。

关键词:COCA语料库;近义词;词频;语域;搭配

中图分类号:F74     文献标识码:A      doi:10.19311/j.cnki.16723198.2024.10.018

1 研究背景

英语作为世界上使用最广泛的语言之一,其词汇量极其庞大,近义词的出现频率也很高。据统计,英语语言中同义词、近义词的数量约占总词汇量的60%以上。由此可见,近义词的辨析对英语学习者尤为重要。

“size”和“measure”作为名词都有“尺寸”的词典释义,“size”在《牛津高阶英汉双解词典( 8th Edition )》的解释为“how large or small a person or thing is”。其中解释有7个:1.official action正式行动;2.unit of size/quantity度量单位;3.amount程度;4.instrument for measuring测量仪器;5.way of showing/judging展示方式/判断方法;6.suggested new law法案;7.in music音乐。对于第2个的扩展释义有“the size,length,or amount of sth(某物的)尺寸,长度,数量”短语有“to take sb′s waist measure量某人的腰围。”从中可以看出“size”和“measure”虽然都有和尺寸相关的含义,但measure在词典中的尺寸含义更为隐含。两个词的含义和例句没有明确的区别,会使学习者在运用过程中过于纠结。这时需要一种方法区别这两个近义词,以提高这些词的准确使用率。

2 基于COCA语料库对“size”和“measure”进行数据分析

美国当代英语语料库(简称COCA)是当今世界上最大的英语平衡语料库。COCA 语料库规模大、速度快、词性标注明确。该语料库使用模块包括:简单查询、相互信息值查询、语义查询、语体及搭配用法查询、谚语查询等。以 COCA 语料库为工具,在词频、语域和搭配方面对“size”和“measure”进行研究分析。

2.1 词频分布&分析

通过在COCA语料库中的List板块检索,数据显示两个词的使用频率相差2万多(表1)。其中,size的使用频率明显高于measure,高达11万次;而measure的使用频率有9万多次。size在59160篇文本中出现,sizes的次数出现14900,占总频次的约12.9%。measure在41586篇文本中出现,measures的次数出现50892,占总频次的约54.1%。由此得出,在八大类型的语料库中,size 常以单数出现,而measure单复数使用频率相近;对于近义词size 和measure,size的应用更为频繁。

2.2 语域分布差异

语域是指人们在实际的语言活动中,出于交际的需要,或因其从事的职业和兴趣不一样,又或者是因其话语发生的场景、说话的对象、地点和话题的不同而产生的一种语言变体,体现为语言的不同语体风格、用语格调等。所以语域对于近义词辨析具有一定的意义,在辨析近义词时,结合语域可以直观地观察到两者的差别。

通过在COCA语料库的Chart板块分别输入size 和 measure可以得到表2 size和measure在COCA语料库中不同语域的词频分布情況和表3 size和measure在COCA语料库的历史发展轨迹。

从表2可以看出,无论是在口语、小说、杂志、新闻和学术期刊中的使用频率,size在八大文体的词频都高于measure。其中在学术期刊中出现的频率是最高的,这也说明两个词更多的是用于文本写作。上述数据表明,size和measure在口语、新闻、学术的使用频数差别不大。使用频数最为显著的是在博客、网站、杂志和小说中。比较之下measure 更多地用于杂志、报纸和学术领域,而 size可以广泛用于除杂志、报纸和学术之外的博客、小说、网站、电视电影和口语领域。

通过分析COCA语料库数据显示的发展轨迹(表3),size的使用频率保持着较为均衡的状态,总体呈现略微下降的趋势。而measure的使用频率,大体上呈上升趋势,说明measure一词的使用在逐渐增加。

2.3 搭配分析

通过数据化分析搭配词的搭配强度,可以总结出词的特征。这一搭配强度可以用MI值(相互信息值)来判断,如果词与词的搭配度越高,那么MI值越大。利用COCA语料库在size和measure的左右两侧3个词的跨距内检索MI值大于等于3的搭配词,最终选取COCA语料库中两词的前 20 个相互信息值较高的显著搭配词作为示例(表4)。

以measure为节点词,在跨距-3/+3 内检索 MI>3 的搭配词,按照搭配频次列举前20个搭配词(表4所示):used、success、large、designed、ballot、performance、passed、tape、measure、equal、progress、outcome、quality、distance、effectiveness、tests、accurately、approved、achievement、items。查看这些词的共现行,不难发现这些词与measure搭配时,measure 大多体现的是抽象引申义,而没有“测量……尺寸、大小”的本意。由此可见,与measure搭配的大多是抽象概念的名词,而measure常在前面修饰这些名词。

同样地,以size为节点词,在跨距-3/+3 内检索 MI>3 的搭配词,前20个搭配词如下:sample、small、effect、shape、large、population、class、average、twice、increase、larger、smaller、depending、weight、reduce、roughly、size、range、sheer、screen。查看这些词的共现行,这些词大都为形容词修饰size; 还有与size搭配的名词,像样本、人口这样的名词,这些都能看出size和measure有很大的区分,size大都用自己的本意“尺寸、大小”。

3 结束语

基于COCA语料库,从3个方面对size 和measure分别进行有关词频,语域和搭配的对比分析:(1)通过检索该组近义词的词频,size比measure 应用更为频繁。(2)通过检索两词的语域,以及size和measure在COCA语料库中的历史发展轨迹,总结出measure更多地用于杂志、报纸和学术领域,而size可以广泛用于博客、小说、网站、电视电影和口语领域,从而可以看出measure的使用较size相比更为正式。历史角度的数据显示,size的使用频率基本沒有明显的变化,而measure的使用频率则有些变化,大体上呈上升趋势。(3)通过分析搭配词,可以明显看出两词在使用上的区别,size更多应用词的原本义,measure则较多应用词的引申义,修饰抽象词汇。

参考文献

[1]贺晓东.英汉双解英语同义词词典[M].北京:商务印书馆国际有限公司,2003.

[2]方玲,汪兴富.美国当代英语语料库(COCA) 的自主学习应用[J].中国外语,2010,(6):7984,91.

[3]杨惠中.语科库语言学导论 [M].上海:上海外语教育出版社,2002.

猜你喜欢

搭配语域近义词
怎样辨析近义词
找找近义词
《约翰·汤普森简易钢琴教程》教材之我见
基于语料库的英语动词open的搭配研究
“反而”的语义韵考察
基于BYU语料库的英语专四词汇试题解析
意义隐喻与语域的关系——基于自建英语新闻语料库的研究
浅析语域的特性及教学模式探讨
语域语块与外贸英语教学
构式视角下“X+N役事”致使复合词的类推及其语域特定化