APP下载

基于COCA语料库的英语近义词探究
——以furnish,accommodate和feed为例

2022-11-02宋慧莹杜璇瑛

现代英语 2022年19期
关键词:语域词频近义词

宋慧莹 杜璇瑛

(沈阳化工大学,辽宁 沈阳 110142)

一、引言

在教育教学中,词汇是二语习得学习者了解二语国家习俗与文化的基础,而近义词辨析则是教育教学的重难点。由于长期的历史更迭与文化沉淀,本族语与外来语的相互交融使得英语中的近义词错综复杂。语料库语言学的发展为近义词的教育教学开拓了新的思路。近年来,国内外基于语料库,对英语近义词辨析研究日益拓展,为近义词教学提供了新的解决方案(张继东&刘萍2005)[1]。但纵观现有研究发现,教师教学过程中常注重词汇本身的内涵意义,而忽视其所在语域、搭配、语法类联接构建而成的外延意义。因此,本研究选取三个“提供”类动词并进行多维度分析。研究目的可分为以下几点:①对比“提供”类近义词在语料库中使用频率,是否可预见最普遍使用的“提供”词?②根据不同的语域分布,是否可预见词汇应用在正式文体或非正式文体中?③通过检索类联接及搭配,是否可预见词汇的不同搭配方式,并根据MI值相对较高的搭配词对词汇进行定性?④本研究结果为今后的英语教学提供哪些启示?

二、理论框架

词汇语法理论是由语言学家约翰·辛格莱(J.Sinclair)提出的一个与语料库语言学相关的重要理论。他强调词汇的形式与意义不能割裂开来,且应以扩展意义为基本单位来研究词汇的多层次意义。理论包括:其一,类联接与语法搭配。即与词项相伴的语法结构,主要为语法词类的频繁搭配与组合。其二,词汇搭配。即与词项搭配的附近词,通常的前后跨距为-4\+4(4个词以内)的范围。其三,语义偏好。即词项与附近词在语义上有着频繁的共选倾向,关注搭配词的语义特征或类别。

三、语料、工具及研究方法

本研究的主要数据来源于目前世界最大的在线语料库平台,即美国当代英语语料库(Corpus of Contemporary American English,以下简称COCA)[2]。COCA由在美国杨伯翰大学任教的Mark Davies教授开发而成,目前为止包含的词汇量高达5.2亿,其中不乏多种语域包括电影、口语、小说、杂志、报纸以及学术文章等。相比英国国家语料库(BNC),COCA可以单独用来检索与分析数据。在词汇习得与教学中,将传统词典工具的定性分析和语料库的定量分析相互结合,教育者与学习者能够更加直观准确地得到参考数据并进行分析运用。因此,语料库为中国本土学习者在二语习得过程中的学习提供明确适当的辅助作用。

四、基于COCA语料库对比分析

(一)词频分布

词频是一种用于文本检索的常用加权技术,用以评估一个词对语料库中的某一领域文件集的重复程度。词频对教学内容的优先性起着决定性作用。基于词频作用,词汇教学应考虑两个方面,即某一单词在语料库中出现的总频率以及其在语料库中的均匀分布或在不同语域中使用频率的参差。本研究将furnish,accommodate和feed三个均可译为“提供,供给”的近义词分别输入到COCA语料库的List检索界面,随即检索出三词所占总频数及单独作为v.所占频数,将所得结果统计并制成表1。

表1 在COCA语料库中的词频分布

根据表1得出以下结论:①从使用频率来看,将“提 供”一 词 由 高 到 低 可 排 列 为feed,accommodate,furnish,由此可看出,人们在选择“提供”一词时,feed的使用频率远远高于其余两词,因此该词可作为日常首选。②furnish和feed的词性单作为动词时,频数所占比分别为20%和16%,远远高于accommodate的所占比,accommodate作为动词词性在总体词性运用中占比相对较少。基于以上结论可做推断:在语料库中,词汇出现的频率反映其在日常被使用情况,出现频率越高,使用范围越广。因此,利用语料库分析词频能够帮助教育者进行高质量教材编排,高频词汇在各阶段英语教育教学中也应做详尽阐释及教授。

(二)语域分布

语域(Register)是语言使用的场合或领域的总称。英国语言学家韩礼德(Halliday,M.A.K.)在1978年首次提出语域理论这一语言学概念。韩礼德认为,语言是一种社会行为,可以称之为“能够做的事”。根据应用语言学家的观点可总结出,语言有两种形式的变体:其一是基于语言使用者的变体;其二是基于语言运用的变体[3]。语域有两大基本功能,即反映文化和预测语篇[4]。因此,在不同的领域使用的语言会有不同的语体,那么在本研究中就有必要根据不同的语域对所选三个“提供”类词汇进行词频的分析,以便能够清晰地掌握近义词的使用差异。本研究将三词在COCA语料库Chart界面进行检索,在表2中得出六种语域的相关数据。

表2 在COCA语料库中不同语域的词频分布统计

根据表2对比可得出以下结论:①近义词furnish,accommodate,feed均可适用在六种不同语域环境下,但适用频率较高的“提供”词为feed,并且远高于其余两词,说明feed一词在各个语域中的使用情况最为灵活,与大众日常生活紧密相关。②accommodate和feed在学术语域所占频率分别达到20.74%和27.96%,且在口语语域中频率明显占比较少,因此可总结出,accommodate和feed两词多运用于学术语域等书面正式及非口语化语境中。基于以上结论可做推断:语域理论揭示语言变化规则,即随情景变化而有所不同。因此,在英语教学中,教师应将词汇带入多层次语域中进行教学,将新知识寓于不同情境中并为学生营造交流互动场景,以便帮助学生掌握语言融入语境的不同规律。

(三)类联接模式

在英语词汇教学中,类联接(Colligation)指与词汇运用直接相关的英语语法范畴以及语法词构建模式的语法形式。作为词汇搭配研究中的一个重要概念,类联接是“语法范畴之间在句法结构上的相互关系”[5]。研究类联接模式意在研究词汇的语法构建。在《英汉大词典第2版》中,所选三词的常见类联接包括V+n.,V+n.+prep.,V+adj.,V+adv.等。本研究在COCA中分别对三个近义词的四种类联接模式进行检索,具体方法如下:

(1)在Collocates界面中的word一栏按研究需要分别输入furnish.[v*],accommodate.[v*],feed.[v*]。

(2)在Collocates界面中的collocates一栏按研究需要分别输入[n*],[i*],[j*],[r*],设定跨距为-4\+4,随即能够得到相应类联接模式的频数。

(3)根据频数计算出各个模式所占总类联接模式的比重。

为便于讨论,本研究将三词的语法关系归纳为常见的四种类联接模式并制表3得出其频率差异。

表3 在COCA语料库中典型类联接模式

根据表3可得出以下结论:①accommodate和feed使用频率较多的类联接模式为V+n.以及V+n.+prep.,在COCA检索中,若不做特殊设定,则V+n.+prep.可包含在V+n.内。accommodate和feed均有“提供,供给”之意,则在语法中应有两个语义论元,即施事格主语和受事格宾语,这与我们日常所用结构相符。②furnish的V+adv.类联接模式占比高达63%,因此可断定furnish经常与副词连用并为不同的副词所修饰。基于此,教师应在日常教学中帮助学生在情景语域中构建类联接模式,有助于学生对英语语言的完整输出以及从抽象的语法层面研究词汇,提高学生英语词汇量的积累。

(四)搭配差异

在语言学领域中,搭配(Collocation)是一个重要的概念与研究内容。搭配在语言学中是指,在文体中以一定的语法形式按照规律组合成一个词语序列并加以利用。本研究将近义词furnish,accommodate,feed在COCA语料库中检索,检索时以-4\+4为跨距,结合频数分布和互信息值(MI值)两种方式来研究这三个近义词的典型搭配。互信息值(MI值)体现了词汇之间的搭配强度和具体搭配的显著程度。MI值有一定界限,若MI值=0,则表示两词显少搭配使用甚至毫不相干,若MI值≥于3,则表示两词互为搭配。从上文结论可得furnish,accommodate,feed三词使用最频繁的类联结模式为V+n.。基于此,本研究主要探讨三词与名词搭配的使用情况,选取检索后三个词的前10个相互信息值较高的显著搭配词作为示例。

以下词为furnish的前10个MI值相对较高的搭配词,按MI值从大到小排列分别为:information,house,proof,room,secretary,apartment,evidence,home,David,money。从这些搭配词中,可以明显注意到furnish多与房屋、房间、公寓、家等互为搭配,因此furnish多用于“为房间或房屋提供、供应家具”。通过同样的方式检索accommodate,得到前10个MI值相对较高的搭配词,按MI值从大到小排列分别为:people,family,children,food,kids,fish,families,animals,mouths,baby。从中可以发现,accommodate后面的搭配词多以人,食物为主,因此accommodate多用于“为人提供食物、空间等”。将feed检索,得到前10个MI值相对较高的搭配词,按MI值从大到小排列分别为:needs,people,student,space,growth,changes,way,system,children,number。accommodate后面的搭配词多以人为主,除此之外,也可搭配growth,changes,way,system等与国家事务相关的词语,说明feed一词多用于正式文体中。

五、结语

本研究基于语料库的研究方法,选取furnish,accommodate和feed三个近义词为研究对象,从词频分布、语域分布、类联接模式以及搭配差异对其进行多维度的对比分析,研究得出以下结论:①对比这组词汇在语料库中使用频率,可预见最普遍使用的“提供”词为“feed”。②根据不同的语域分布,可预见“accommodate”和“feed”应用在正式文体中。③通过检索不同类联接模式,可预见“提供”类词汇最常见类联接模式为V+n.。④通过检索类联接及搭配,可预见词汇的不同搭配方式,并根据MI值相对较高的搭配词可以对三个近义词定性,实践发现三者有明显差异。

基于以上结论,本研究发现:语料库研究方法的客观性、广泛性及直观性,能够为英语教育教学提供强有力的辅助作用。教学启示可分为以下几点:①教师应利用语料库等工具,鼓励本族语学生使用高频率词汇,争取与二语国家学习者趋于一致,可避免出现低级词汇使用过多而高级词汇使用不足等情况。②在教育教学中,讲解认知词汇不能脱离语域,应深刻体会词汇的音、形、义,搭配及类联接模式。因此,教师应为学生营造不同情景语域,以便帮助学生掌握语言融入语境的不同规律。③在教育教学中,利用语料库教学可促进师生课堂角色的转换,学生在教师的引导下正确规范使用语料库学习,能够有效地改变教师单向输入式的教学模式,提高学生自主学习兴趣。

猜你喜欢

语域词频近义词
怎样辨析近义词
找找近义词
词汇习得中的词频效应研究
汉语阅读中词频与注视时间、跳读的关系
科技术语的语域传播论纲
语域下土木工程英语词汇文体特征
基于语料库的近义词辨析
词频,一部隐秘的历史
汉语音节累积词频对同音字听觉词汇表征的激活作用*
利用语域预测功能突破听力语言焦虑