基于语料库的近义词辨析
——以pretty和attractive为例
2017-09-11鲁宵
鲁宵
(河南工业职业技术学院,河南 南阳 473000)
基于语料库的近义词辨析
——以pretty和attractive为例
(河南工业职业技术学院,河南 南阳 473000)
采用基于语料库的研究方法,通过检索本族语语料库:美国当代英语语料库(COCA)观察并分析pretty和attractive这一对近义词的索引行,发现两者在语域分布、搭配、语义趋向和语义韵有所区别。从语料库的视角对近义词进行辨析,能对这组近义词稍有所区分,同时说明语料库在外语教学方面和词典编纂方面起着不可替代的作用。
语料库;近义词;搭配;语义韵
一、引言
词汇一直以来都是外语教学的重点所在,词汇是句子篇章的基础,没有词汇一切都是空谈。对于词汇的习得,我们不能只关注单词本身,更应该重视其搭配和语义韵等语言特征,从而增加对词汇习得的深度。对于词汇习得而言,近义词的辨析又是英语学习中的难点所在。写作中使用好近义词,可以体现句式多样,结构丰富。掌握好近义词的用法同样有利于学习者阅读水平的提高。据统计,英语语言中,近义词的数量约占总词汇量60%以上。[1]人们对于近义词的辨析往往只能通过查阅字典和少量例句,依赖自身的语言知识水平和经验对其理解,但这往往不能很好地掌握它们的用法和不同之处。语料库语言学近义词辨析带来了新的研究方法。从语料库语言学的视角,即通过检索本族语语料库,分析索引行,在大量真实自然的语料中观察它们的语域分布以及搭配特征,从而能够更好地辨析近义词。本文通过检索美国当代英语语料库(COCA),观察分析pretty和attractive这组近义词用法差异,利用该语料库自带的统计数据比较二者的异同,通过对比它们的语域分布,揭示它们不同的搭配以及语义韵等特征。
二、搭配、语义韵、语义趋向
Sinclair and Renouf认为英语词汇习得的重点应是3个方面:(1)语言中的常用词;(2)常用词用法的主要模式;(3)常用词构成的典型搭配。[2]词的典型组合则是指“在文本中实现一定的非成语意义并以一定语法形式因循组合使用的一个词语序列”。[3]英国语言学家Firth提出的著名论断“由词的结伴可知其词”,就是强调词汇的搭配。[4]对词汇的习得应该注重其惯用搭配,或是词串,这样往往比只记单词本身掌握得更好,搭配指的是一个词所处的最常见和典型的环境,在某一语法型式下两个或多个词的反复共现[5],即词语的组合。
在基于语料库的研究中,近义词语义相似,搭配特征和语义韵有所差异。Sinclair在观察短语sitin和动词happen的词汇——语法语境时注意到二者都趋于与消极搭配词共现。受Sinclair观点的启发,Louw最早公开使用“语义韵”概念[6]。语义韵(semantic prosody)即节点词的典型搭配词在语境中营造的语义氛围,是以节点词为中心的多词序列组合单位的语用功能总结。语义韵是指在节点词语其搭配词项之间既有语义关系又有韵律关系。语义是因为它与意义相关,韵律是因为它不只与一个词相关,而是涉及几个词的组合。语义韵可以分为积极语义韵(positiveprosody)、中性语义韵(neutralprosody)和消极语义韵(negativeprosody)。若节点词吸引的词项几乎都具有积极含义,则该词具有积极语义韵;反之,该词具有消极语义韵。如果节点词吸引的词项中,既有积极含义,也有消极含义,则该词具有中性语义韵。[7]卫乃兴提出了语义韵研究的3种常用方法,通过语义韵的实例研究揭示研究中的理念,并讨论起研究价值和意义。[8]语义韵是概率上的属性,我们说某一词汇的语义韵是消极的,并不排除其积极语义韵的存在[9]。
Sinclair首次提出语义趋向是在类联接基础上对搭配语义特征的抽象概括,是比类联接和搭配词更抽象的扩展意义单位的识别标准之一。现有研究对语义趋向的概念界定基本达成共识:语义趋向是节点词与某类语义特征的词语频繁共现的习惯性搭配行为。[10]
三、研究语料和方法
(一)研究语料
美国当代英语语料库(COCA),是目前最大最新的免费英语语料库,也是当今世界上最大的美国英语平衡语料库。统计了1990—2015年共5.2亿词量,该语料库包含口语、小说、杂志、报纸和学术期刊5种类型的语料,平衡分布。我们可以用该语料库来观察美国本族语者的语言使用模式,查找单词、短语和搭配出现的频数并进行比较。
(二)研究方法
本研究采用基于语料库的方法,比较近义词pretty和attractive的用法差异,揭示其搭配和语义韵等语言特征,探究pretty和attractive在搭配和语义韵上有何差异。
四、研究结果与讨论
(一)语域分布统计
通过检索美国当代英语语料库(COCA),得出pretty和attractive频数统计数据如表1和表2。
表1 Pretty和Attractive在COCA中检索的频数和频率
表2 Pretty和Attractive在各个语域的分布
表1是pretty和attractive在美国当代英语语料库(COCA)中检索的频数和频率,表2是pretty和attractive在各个语域的分布情况。由表1和表2得知,pretty在语料库中出现的总体频率比attractive高,其中pretty在口语、小说中出现的频率明显高于attractive,在学术期刊中,attractive出现的频率比pretty要高,由此,可以得出pretty在口语以及非正式文体中应用更广泛,attractive更多可能出现在正式文体中。
(二)搭配分析
将跨距设置为0—4,互信息值(mutualinformation)简称 MI,设置为3,MI值≥3可视为显著搭配,并且MI值越大,说明节点词对共现词的吸引力越强。检索按照共现频数为标准进行排序,取前20个pretty和attractive的高频搭配词如表3。
分析上表的高频搭配词可知,pretty和attractive都和“女人”搭配,pretty更倾向于修饰“女孩”,pretty常与表“衣服”的名词搭配,如:cloths,dress,dresses等,attractive多与“女人”搭配,如:women,woman,girl,female,lady等,attractive常与表“目标,选择”的词语搭配,如:options,candidate,arget,targets。pretty和attractive都修饰名词居多,形容词较少。
(三)语义趋向和语义韵分析
表4和表5分布显示了pretty和attractive作为形容词,其修饰后置名词的搭配词,跨距0—4,选取的是美国当代英语语料库(COCA)频率最高的前15组词。
表4 Pretty的前15个高频搭配词
表5 Attractive的前15个高频搭配词
由表4和表5可以得知,pretty的前15个高频搭配词中:girl,woman,girls,women,boy,都是表“人”的特征,均为中性含义。face,picture,pictures,thing,things,name,hair,eyes,同样是中性含义的词项,sight,lady具有积极的语义韵。Attractive的前15个高频搭配词中:woman,women,people,man,girl,place,men,way,features,都是中性含义的词,target,candidate,alternative,investors具有积极的语义韵。Pretty和attractive都有与中性词进行搭配的语义趋向。由表4和表5我们可以看出,girl和girls一般用pretty修饰,attractive修饰较少,“女孩”用 pretty修饰更合适。pretty和attractive在修饰woman,place,way等词语时,使用频率相差较少,在修饰这些词时,pretty和attractive可以通用,无明显差别。picture,pictures,boy,sight等中性含义词,只适合用pretty修饰,attractive则不地道。option,alternative,target,investors,candidate等具有积极语义韵的词语,适合用attractive修饰,pretty不适合。由此,我们可以得知,pretty的语义趋向为“孩子”、“衣服”、“五官”等词语,attractive的语义趋向为“目标”、“选择”、“投资”等词语。
五、结论与展望
本文采用基于语料库的方法,通过对美国当代英语语料库(COCA)对近义词组pretty和attractive检索,比较其用法,得出以下结论:1.pretty和attractive虽然为近义词,但是在语域分布、搭配、语义趋向以及语义韵有所差别。pretty在口语和非正式语体中使用更多,attractive在正式语体中应用更广泛。2.针对近义词辨析,通过本族语语料库,如美国当代英语语料库(COCA)或英国国家语料库(BNC)等,通过检索,对大量真实自然的语料分析,可以对近义词的使用模式—语域分布、搭配、语义趋向以及语义韵等有更加直观的了解,对其更好地进行辨析。3.语料库方法,对于词典编纂有着不可替代的作用,通过了解索引词在各个语域的分布及其使用模式,在编纂词典时加以运用。英国伯明翰大学编著的柯林斯系列词典就是基于语料库方法之上进行的。
词汇的习得在英语教学中占重要地位,传统依靠内省和少量例句进行词语辨析的教学手法有其缺陷,借助语料库,依赖大量真实自然的数据对词语进行辨析,辅助教学被证明是有效且有价值的。
语义韵体现一个词项的搭配形式,这种形式只有通过利用语料库,从大量实际使用的语言中总结出来,而远非本族语者的直觉所能体察到的[11]。本研究语义韵和语义趋向的分析,依靠笔者直觉分析得来的,与已有的共识有差异,这也是本次研究的不足之处。本次研究重点在于,通过语料库这一方法,以pretty和attractive这一组近义词为例,对其使用模式进行分析,说明语料库在为教学提供新的视角和手段,同时有利于词典的编纂。
[1]贺晓东.英语同义词词典[Z].北京:商务印书馆,2003:26.
[2]Sinclair.J.&Renouf,A.A Lexical Syllabus for LanguageLearning[A]//Carter&MaCarthy(eds.).Vocabulary and Language Teaching.Longman:Longman,1988.
[3]卫乃兴.专业性搭配初探—语料库语言学的方法[J].解放军外国语学院学报,2001(4):19—23.
[4]Firth,J.R.Papers in Linguistics 1934-1951[C].London:Oxford University Press,1957:12.
[5]濮建忠.英语词汇教学中的类联接、搭配及词[J].外语教学与研究,2003(6):438—445.
[6]Louw,B.Irony in the text or insincerity in the writer?—The diagnostic potential of semantic prosodies[A]//M.Baker,G.Francis&E.Tognini-Bonelli(eds.).Text and Technology:In Honour of John Sinclair.Amsterdam:John Benjamins,1993:157—176.
[7]Stubbs,M.Text and Corpus Analysis[M].Oxford:Blackwell Publishers,1996.
[8]卫乃兴.语义韵研究的一般方法[J].外语教学与研究,2002(4):300—307.
[9]胡开宝.语料库翻译学概论[M].上海:上海交通大学出版社,2011:67.
[10]李晓红,卫乃兴.汉英对应词语单位的语义趋向及语义韵对比研究[J].外语教学与研究,2012(1):20—33.
[11]王海华,王同顺.Cause语义韵的对比研究[J].现代外语,2005(3):297—307.
(责任编辑:张 锐)
A Corpus-Based Comparative Study on Synonym in COCA——Taking"Pretty"and"Attractive"as a Case
LU Xiao-yi
(Henan Polytechnic Institute,Nanyang,Henan 473000))
Based on Corpus of Contemporary American English(COCA),this paper observes and analyzes the concordances of pretty and attractive,finding that the two are dissimilar in word frequency distribution,collocation,semantic preference and semantic prosody.The study distinguishes the synonyms from the perspective of corpus,hoping to make a distinction between the group,meanwhile,the study states that corpus plays an important role in language teaching and lexicography.
corpus;synonym;collocation;semantic prosody
H313.1
A
1008—7427(2017)04—0050—04
2017—01—13
鲁宵昳(1989—),女,河南南阳人,河南工业职业技术学院助教,研究方向:英语教学、英汉对比、翻译。