APP下载

语料库在词义辨析方面的应用研究
——以rather、fairly和quite为例

2020-06-05

天水师范学院学报 2020年4期
关键词:语体频数近义词

卢 蓉

(天水师范学院 外国语学院,甘肃 天水 741001)

英语在其漫长的演变和发展过程中,吸收了大量外来语的词汇,尤其是拉丁语和希腊语,衍生出无数的同义词和近义词,不仅成为世界上词汇量最丰富的语言之一,而且也成为世界上同义词、近义词最丰富多彩的语言之一。[1]近义词辨析是语言教学中的重点和难点之一,其教与学是学习者深度习得词汇并正确使用词语的关键。传统的近义词辨析词汇教学从经验主义出发,简单地说明区别并罗列少量例句。这种被动讲解式的教学方式很难使学生深刻理解并掌握近义词的区别,也很难对词汇的地道用法形成明确的认识。正如双文庭、杨润青(2018)所说,中国大学生对英语词义的理解经常存在两个严重的问题,其一是误解,其二是对词义的推理能力缺乏。[2]

语料库(corpus,复数为corpora)指的是按照一定的采样标准采集而来的、能够代表一种语言或者某语言的一种变体或文类的电子文本集。[3]3语料库是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源,应用于词典编纂、语言教学、传统语言研究、自然语言处理中基于统计或实例的研究等方面。随着越来越多语料库可供普通学习者免费使用,语料库在外语教学中的应用也日益广泛。[4]语料库在教学中的应用给词汇教学提供了一种更加可靠、真实、有效的途径,可以使学习者主动从大量真实、地道的语言材料中进行观察并发现规律,是自我发现、数据驱动式的学习方式,可以更加直观地观察词汇的使用环境,并进行总结发现近义词之间的异同点。与传统的词汇教学方式相比,基于语料库的词汇教学有着鲜明的优势。基于语料库的检索在速度和质量上有了跨越式的发展,不仅如此,语料库的检索结果更加集中,能够直观地帮助学生去思考和挖掘词汇之间的搭配和应用规律,大大提高词汇教学的教学效果。[5]本文拟以英文中常见的三个近义词rather、fairly和quite为例,探讨语料库在近义词辨析方面的应用。

一、研究设计

(一)研究对象

学习英语近义词,辨析它们之间的细微差别,是掌握和应用英语的必经之路。本文以英语中较为常见的一组副词rather、fairly和quite为研究对象,基于BNC语料库,探讨它们在频数分布、搭配、类联接、语义韵等方面的差异,以给英语学习者一些参考,并给英语词汇教学提供一种不同的思路。

(二)研究问题

这组近义词的辨析在中国较为常见的解释是:fairly表示肯定,含有褒义,而rather则表示否定,含有贬义。通过强大的语料库数据支撑和检索分析,我们试图回答以下问题:第一,通过真实语料的分析,这组词的意义差别是否和人们以往的经验相一致?第二,除了在意义方面的差异,它们的使用在文体、语域、性别方面是否存在差异?如果有,是在哪些方面?

(三)语料来源及检索工具

本文以BNC(British National Corpus,英国国家语料库)为语料来源。BNC是目前网络可直接使用的最大的语料库之一,也是目前世界上最具代表性的当代英语语料库之一,其词容量超过一亿,由4124篇代表广泛的现代英式英语文本构成,其中书面语占90%,口语占10%。该语料库既可用其配套的SARA检索软件,也可支持多种通用检索软件,并可直接进行在线检索。本研究使用兰卡斯特大学的网络在线语料库(BNCWeb at Lancaster University),检索工具采用BNCWeb直接在线检索,实现对频数(frequency)、互信息值(MI,mutual information)、分布(distribution)以及其他搭配强度的计算方法,如对数似然比(log-likelihood)、T值(T-score)、Z值(Z-score)等的检索和计算。

二、Rather、fairly和quite在BNC中的频数分布对比

频数(frequency),又称“次数”,指变量值中代表某种特征的数(标志值)出现的次数。按分组依次排列的频数构成频数数列,用来说明各组标志值对全体标志值所起作用的强度。在统计学中,将样本按照一定的方法分成若干组,每组内含有这个样本的个体的数目叫作频数。在语料库语言学中,频数指语料库中某一词汇或短语每百万词出现的次数(Frequency per million words)。通过在同一语料库中检索几个近义词的频数,我们可以对它们在不同语体、语域、性别等方面的分布进行考查,从而更深入地了解它们的区别用法。以下为BNC中rather、fairly和quite在书面语和口语中的频数分布(表1):

表1 Rather、fairly和quite在不同语体的频数分布对比

从表1看,无论是书面体还是口语体,quite的使用频次都是最高的,其次是rather,最后是fairly。就同一个词而言,rather在书面语体中的使用频次高于在口语语体中的使用频次;fairly和quite则多使用在口语语体中,尤其是quite一词,在口语中的使用频次(1042.57)远大于在书面语中的使用频次(329.75)。

除语体外,性别差异也是考察语言使用的一个重要因素。语言作为社会现象的反应形式,长期受历史文化的影响,使男女两性在生活中自觉或不自觉地形成一些他们所属群体的社会认同和行为规范。[6]在BNC语料库中,rather、fairly和quite也体现出了一定的性别差异(表2):

表2 Rather、fairly和quite在不同性别中的频数分布

根据表2中的性别来看,男性使用rather和fairly的频次均高于女性,而女性使用quite一词较男性频繁得多。总体而言,无论是男性还是女性,使用rather的频次高于fairly和quite。

年龄也是语言使用中的一个不可忽视的要素。Chambers在其《社会语言学理论》一书中讨论了社会语言学中与年龄有关的研究。他指出:“年龄对社会人有着巨大的影响,我们的年龄是一个不可改变的社会事实。”不同于社会阶层在政治经济条件下是具有流动性的,也不同于性别更少的限制作用和双重性别的可能性,我们的年龄是固定的,而且年龄在我们的社会生活中几乎是具有决定性作用的(Chambers,2003)。[7]不同年龄段的语言使用者在学习和使用语言时会表现出一些差别,如以下表格中三个不同年龄群体使用rather、fairly和quite时存在的差异(表3):

表3 Rather、fairly和quite在不同年龄群体中的频数分布

从表3来看,在不同年龄群体中,这三个词呈现了完全不同的使用频次。儿童和青少年使用以上三词的频次由大到小排列是:quite>rather>fairly;成人对这三词的使用排列顺序是:rather>quite>fairly。而儿童使用quite的频次明显高于rather和fairly,约是rather的2倍、fairly的14倍。无论是儿童、青少年还是成人,使用fairly的频次远低于使用rather和quite的频次。

因此,根据以上BNC语料库中rather、fairly和quite在不同语体(书面语、口语)、不同性别(男性、女性)和不同年龄群体(成人、青少年、儿童)的频数统计数据,对这三词在语体、性别、年龄方面的用法总结如下:

1.相比较而言,rather多用于书面语中,且成年人使用的频数更高;在性别方面,男性更多使用rather。也可以把rather的使用语体和群体简单概括为:书面语、男性、成年。

2.无论是书面语还是口语语体,fairly的使用频数是这三个词中最低的;较女性群体而言,男性更多使用fairly;无论是成人、青少年还是儿童,都较少使用fairly。

3.quite一词多用在口语中,且女性和儿童使用更频繁。概括起来,quite的语体和群体可概括为:口语、女性、儿童。

三、Rather、fairly和quite在BNC中的搭配强度比较

搭配(collocation)这一概念一直是语言教学中十分关注的问题。伦敦学派创始人J.R.Firth认为搭配是词汇之间的横组合(syntagmatic relations),即两个词之间存在一种相互期待(mutual expectancy)和相互预测(mutual prediction)。[8]40被称为“语料库语言学之父”的著名语言学家John Sinclair对搭配给出了一个更为可操作的定义,认为搭配指两个或两个以上的词在文本中相距不远处共同出现(Collocation is the occurrence of two or more words within a short space of each other in a text)(Sinclair 1991:170)。[8]41在大型语料库中统计并计算搭配的显著性(或称搭配强度,collocation strength),最常见的算法有Z-Score、T-Score、互信息(mutual information,简称MI)、卡方检验 (chi-squared)、对数似然率(loglikelihood ratio)等(Evert 2004)。[8]42语料库中这些不同的搭配强度算法可以使人们得到某个词语和其他词语的共现关系的数据,分析并总结它们的共现规律,尤其是近义词之间不同的搭配强度,可以让人们在词语使用方面更加准确,更加深入地了解近义词的差别。无论是Z-Score、TScore、MI,还是loglikelihood ratio,数值越大,表示两个词的搭配强度越大,它们共现的频率越高。

本文以rather、fairly和quite三个近义词为节点词,在BNC全库中,跨距(collocation window span)为系统默认的3(-3/+3,即左边三词,右边三词),与形容词和副词搭配使用为检索限制,以它们作为副词词性、意义为“相当”的用法在BNC语料库中进行检索,检索结果按照从高到低的顺序排列,对每个节点词的搭配词及其log-likelihood ratio、Z- Score、TScore、MI3①MI3值是MI值的修改版,较MI值更为合理。数据进行比较分析,从而对它们的用法有进一步的认识。由于篇幅限制,只列出排列前10位的单词(见表4):

表4 Rather、fairly和quite在BNC中的搭配形容词及数值

综合以上表4中的各项统计数据,经过计算发现,与rather搭配强度最高、排列前5位的形容词依次是 different,vague,odd,dull和 individual,与fairly搭配强度最高、排列前5位的形容词依次是 easy,straightforward,obvious,simple 和 typical,与quite搭配强度最高、排列前5位的形容词依次是different,sure,happy,few和good。为了更加直观地观察它们的区别,以表格的形式呈现出来如下(见表5):

表5 BNC中与rather、fairly和quite搭配强度最高的形容词

从表5可以看出,除了different外,每个词所搭配的形容词均不同。而且,虽然different与rather和quite的搭配强度都很高,均排在第一位,但相较而言,different与quite在log-likelihood、MI3、Z-Score和T-Score综合数据方面的数值高于与rather的四项综合数值。也就是说,quite与different更常搭配使用。以下摘取BNC中的部分例句,以更加清楚地说明以上区别用法:

1.rather的搭配词例句:

(1) What makes Lewis's criticism rather different is a combination of two very rare qualities.

(2) In particular,the positions of each gear are rather vague and more-than-average effort is needed to shift from one to another.

(3) He sat quite still,looking like a rather odd god in a shrine or a waxwork in a box.

(4)However,my hair is beginning to look rather dull and I'd like to get it back to peak condition as soon as possible.

(5)It is intended to be a contribution to the history of style rather than of individual artists.

2.fairly的搭配词例句:

(1) It should be stressed that these increases should not be attempted unless you are finding the original routine fairly easy.

(2) So it seemed a fairly straightforward move to go and work for the family firm.

(3)Although the mini-trunking will be fairly obvious,it does save a lot of work,especially on decorating.

(4) Fitting the system is a fairly simple matter and all components come on a frame which can be simply attached to most sprayers.

(5)He was a fairly typical boy of his neighbourhood,well liked by his friends,and with facial features that remained pretty unaltered through youth and early life,except for a tendency towards puppy fat.

3.quite的搭配词例句:

(1)In Scotland beer is usually served in a quite different fashion.

(2)More and more convinced he's right,but not quite sure what it needs.

(3)I was beginning to feel quite happy again.

(4) There's quite a few restaurants with people in them having their tea.

(5)He had been quite good at drawing when he was at school.

Rather、fairly和quite作为副词,既可以修饰形容词,也可以修饰副词,下面是这三个词用来修饰副词时在log-likelihood、MI3、Z-Score和T-Score四种不同算法中的具体数值和相应的搭配词(表6):

表6 Rather、fairly和quite在BNC中的搭配副词及数值

通过综合考量表6中的各项搭配强度值,可以计算出在BNC与rather搭配强度最高的前5个副词是:more,less,sooner,simply和merely;与fairly搭配强度最高的前5个副词依次是:quickly,evenly,well,recently和fairly;与quite搭配强度最高的前5个副词依次是:not,often,clearly,apart和well。为方便查看,依然以表格形式呈现(表7):

表7 BNC中与rather、fairly和quite搭配强度最高的副词

基于以上数据,我们可以对rather、fairly和quite与副词的搭配做出以下总结:

第一,rather常与比较级连用,如rather more,rather less,sooner rather (than later) 或(later) rather than sooner等;rather多用在rather than simply和rather than merely结构中,如以下摘自BNC的例句:

(1) As usual,she was rather more in touch with reality than I was.

(2) Exclusion,though,is rather less general a problem than a low status for some categories of painting.

(3) Having come so far in just 3 years,the suggestion is that success might come sooner rather than later.

(4) Some may have plans to return later rather than sooner.

(5)Try observing these outer images rather than simply seeing them.

(6) The dangers of excessive alcohol are perhaps more obvious and the real problem here is that the effect is cumulative rather than merely temporary.

第二,fairly 多和 quickly,evenly,well,recently一起共现,且fairly有时在句中重复使用,如以下摘自BNC的例句:

(1)More sympathetic souls cautioned me against hasty decisions,but the ripples subsided fairly quickly.

(2)Typical projects are expected to be split fairly evenly between hardware,software and services.

(3)The reason is fairly well understood.

(4)Until fairly recently I don't think people have understood the design process or what it can do for the success of their companies.

(5)They tend to be fairly large and fairly expensive devices.

(6)I think there is fairly,fairly universal agreement……

第三,与rather和fairly不同的是,quite最常用于否定句中,并常修饰often,clearly,apart(from)和well等副词,如:

(1)However,that myth is not quite the one which appears to have penetrated everyday life,perhaps because the place of the victory is located within the borders of the Southern state.

(2)Drawings are quite often given survey treatment.

(3)Quite clearly,an urgent rescue plan was needed.

(4)It is natural that the surrealist should deal in super-abundance,quite apart from it being a reflection of his youth.

(5) You usually haveto know someone quite well to hate them.

四、Rather、fairly和quite在BNC中的类联接比较

类联接(colligation)是与搭配关系密切的另一重要概念,指的是语法层面的词类关系、句类关系或其他类似的关系。[8]搭配研究关注的是词语之间的“结伴关系”,而类联接所关注的“结伴关系”不再局限于词汇层面,而上升到词类乃至语法层面,即语法互选,如形容词经常与名词构成类联接。[3]13在Firth的理论体系中,类联接指的是语法范畴的结伴关系,搭配和类联接是一对平行概念,前者用于从词汇层面研究意义,后者用于从语法层面研究意义,两者互为补充。[8]48

本文依然以rather、fairly和quite三个近义词为节点词,在BNC全库中,跨距(collocation window span)为系统默认的3(-3/+3,即左边三词,右边三词),不添加任何其他限制条件在BNC语料库中进行检索,对这三词在语法层面的搭配进行探究,发现它们的类联接规律。检索结果按照从高到低的顺序排列,对每个节点词的类联接成分及其loglikelihood ratio、Z-Score、T-Score、MI3数据进行比较分析,从而对它们语法范畴的结伴关系有一定的了解,进一步明确这三个近义词的用法区别(见表8):

表8 Rather、fairly和quite在BNC中的类联接成分及数值

从以上表格可以看出,综合log-likelihood ratio、Z-Score、T-Score、MI3数据来看,与rather在语法层面搭配排列前5的是:than,'d,a,“,”和more;与fairly在语法层面搭配排列前5的是:a,straightforward,quickly,easy,is 和 simple; 与quite在语法层面搭配排列前5的是:it,lot,different,a和is。除了冠词a,这三个词的类联接成分基本都是不同的。从以上数据,我们可以对这三个词的用法做出一些总结:

1.rather多用在rather than,'d rather和rather more结构中(与比较级连用),或者多用“rather,”(作连词)以表达转折之意,如以下摘自BNC的例句:

(1)ACET is a church-based organisation whose primary concern is practical care rather than counseling,and so these areas are only covered if they are raised by our clients.

(2)I'd rather sleep in the gutter than let that happen.

(3) In London,it was a rather different story,since the literature available needed discrimination,much of it being historical and iconographic,establishing data of little interest to the art student.

(4) That was not the emphasis;rather,it was a preparation for Canadian citizenship.(rather作连词)

(5)An art critic also needs a gift for persuasion,perhaps rather more than a head for exposition and argument.

2.fairly多和形容词straightforward和easy、副词quickly搭配,且多与单数现在时(is,a)连用。

(1) It is also a fairly obvious statement to say that historic pubs have served the function well for hundreds of years.

(2)These are mostly fairly straightforward with clear and concise instructions for jellies,jams,dumplings and suchlike.

(3)Moresympatheticsoulscautioned me against hasty decisions,but the ripples subsided fairly quickly.

(4) This is fairly easy to answer,but only with the proviso that a given conjunction of circumstances will set prices spiralling upward again.

(5) Ben is fairly obedient but he won't beg or fetch slippers.

3.quite多与it连用,it可能是主语、形式主语,也可能是宾语等;quite多和a lot(of)一起连用,构成quite a lot(of)的搭配结构;quite多修饰形容词different;quite也多用在单数现在时的句子中,与is,a较常一起出现。且quite多和a few连用,构成quite a few的搭配结构,意为“相当多,还不少”。

(1)It is quite clear that Rome did not have a policy on catholic schooling at this time,and certainly not one requiring attendance at such schools as a religious duty.(it是形式主语)

(2) It is quite unlike any other public,social or recreational establishment.(it为代词,做主语)

(3) Proximity to the Atlantic means rainfall in Britain contains quite a lot of dissolved salts from the sea.

(4)In Scotland beer is usually served in a quite different fashion.

(5)Finding a character that is true in every moment is quite another matter.

(6) There were quite a few Asian kids at the school but very few blacks—particularly few when you consider how black West London is.

五、Rather、fairly和quite的语义韵对比

语义韵 (semantic prosody) 是 Sinclair(1987)注意到的,具有评价和表明作者态度的作用,同时具有交际功能和语用功能。[8]49很多词看起来并不带有明显的感情色彩,但当它们与特定词汇为伴构成搭配或类联接时,会产生一些联想意义(如褒贬、好恶等)。[3]16对于rather、fairly和quite,各类字典对它们的语义韵其实已有注意。如《牛津高阶英汉双解词典》中rather的释义是:adv.(usu.indicating criticism,disappointment or surprise通常表示批评、失望或惊奇)to a certain extent。在辨析rather和fairly、quite、pretty的用法时,词典指出,“rather或pretty与褒义词连用时,听起来心情愉快。”《英语常用同义词、近义词辨析词典》对rather和fairly的辨析是:fairly表示肯定,含有褒义,而rather则表示否定,含有贬义。[1]380

通过在BNC中对这三个词作为副词,修饰形容词和副词的搭配进行综合统计计算,可以列出综合数值排在前10的形容词和副词如下(表9):

表9 Rather、fairly和quite在BNC中搭配强度最高的形容词和副词

从表9可以看出,rather、fairly和quite的语义韵基本与词典的解释相符,但并不全面。根据BNC语料库的数据和例句,可以对它们的语义韵总结如下:

首先,与rather搭配的形容词和副词部分是含有贬义的,表示厌烦、奇怪、不满等情绪,如vague,odd,dull,difficult,oddly,badly 等,但大部分是中性词,如different,individual,unusual,strange,simply,sooner,merely,differently,surprisingly等,还有褒义词如better等,也有未在表中列出数值较高的褒义词,如nice(整体数值排11位):

The independent Red Army press was rather better adapted to its readership.

It was in fact rather a nice day and my spirits were starting to rise.

It was rather nice to have a woman crying over him.

其次,与fairly搭配的形容词和副词基本都是褒义的,且多是表达“清楚明白”(obvious,clear)、“简单容易”(easy,easily,simple)、“直接”(straightforward)、最近(recently)、“亲密”(close)或 “ 高 ”(high)、“ 大 ”(large)、“好”(well)、“快”(quickly,rapidly,soon) 的含义。

再次,与quite搭配的形容词和副词大部分都是褒义的( 如 sure,happy,clearly,good,well,nice,clear,right,rightly,simple,simply,frankly 等)或者中性的(如different,often,enough等),表达“确定”(sure)、“幸福”(happy)、“清楚”(clearly,clear)、“好、对”(good,well,nice,right,rightly) 和“简单”(simple,simply) 等含义。但quite也多用在否定句中,和not,apart(from)等表示否定意义的词搭配使用。如以下摘自BNC的例句:

However,that myth is not quite the one which appears to have penetrated everyday life,perhaps because the place of the victory is located within the borders of the Southern state.

Quite apart from the facts,however,his Lordship found the greatest difficulty in seeing that the claim was made out in law.

六、结语

语料库不仅为语言研究提供了空前广泛的言语素材,而且使传统语言研究由通过内省、自造例证或诱导询问(elicitation)的取样方法转变为调查取样,材料真实可靠。[9]本研究从分布频数、搭配、类联接、语义韵等方面分析总结了rather、fairly和quite的异同点,通过分析它们在不同语体、年龄的使用频率差异、典型搭配、类联接以及语义韵的不同,可以更加全面地掌握这些词的用法,从而更加地道地使用这些近义词。

由于篇幅所限,本文没法把词表中的整个词汇进行展示,只罗列了与rather、quite和rather搭配的前10个形容词、副词,无法呈现其它搭配词。此外,虽然对于数据的分析是基于大量真实语料和多个语料搭配算法,但总结用法等是基于个人经验,难免有些主观色彩。

然而,语料库研究作为语言研究的新视角、新范式,可以给近义词辨析提供大量且有效的实例,让近义词的异同有数据支撑,而不是仅仅基于经验。与此同时,语料库索引分析软件可以通过各种不同的算法,统计出不同词的搭配强度和类联接,所有数据更加科学、可信、直观。另一方面,简单的语料库检索不需要非常专业的技术知识,如果教师能够掌握这些语料库检索技术,并用之于词汇教学中,可以使教学更加直观、准确。基于语料库的近义词辨析是帮助我们辨清词语细微差异,明晰词语具体使用的有力手段,可以服务于外语教学。[10]另外,从学生层面而言,可以让他们自己通过检索单词并发现它们不同的用法和搭配等,这样可以实现真正的自主式、探究式学习,更加有利于教与学的高质量发展。

猜你喜欢

语体频数近义词
怎样辨析近义词
新时代新闻播音主持的语体变化特点
言语交际中语体的得体性探讨
找找近义词
频数与频率:“统计学”的两个重要指标
中考频数分布直方图题型展示
学习制作频数分布直方图三部曲
语体语法:从“在”字句的语体特征说开去
频数和频率
汉代语体思想浅谈