APP下载

基于语料库的leave5 的语义韵对比研究

2016-01-22李丹丹

关键词:对比分析语料库

李丹丹

(四川外国语大学 研究生院,重庆 400031)



基于语料库的leave5的语义韵对比研究

李丹丹

(四川外国语大学 研究生院,重庆 400031)

摘要:运用美国当代英语语料库(COCA)和英语国家语料库(BNC)两大语料库,对leave5(leave的第五个义项)所出现的搭配词进行语义分析发现,leave5具有明显的消极语义韵倾向。用“中间语对比分析”法,通过AntConc3.2.4w软件检索,比较美国当代英语语料库(COCA)和中国学习者英语语料库(CLEC)中leave5的搭配词及其语义韵倾向,研究表明,中国学习者使用leave5时多用了积极语义韵,少用了中性和消极语义韵。造成这种差异的原因主要是受母语影响、词语学习深度不足和词典编纂存在缺陷。

关键词:leave5;语义韵;语料库;对比分析

一、引言

语料库语言学自20世纪60年代以来,已经得到越来越多人的承认,其应用也越来越广泛,从语言分析、语言教学、词典编撰到人工智能等领域都开始应用语料库。它以基于计算机技术的语料库作为研究工具,在此基础上观察、记录和分析语言,注重详尽、大量地占有语言事实材料,取得了重大的研究成果。语义韵的研究一直是语料库语言学研究的重要领域之一。语义韵,又名语义协调或语义渗透,是种特殊的搭配现象。研究表明,一些节点词(研究人员在语料库中检索其搭配的词项)经常和具有某种意义特征的语言单位共现,最终“感染上”那些共现词的语义特征。根据Stubbs的相关研究,语义韵分为三类:积极语义韵(positive prosody)、中性语义韵(neutral prosody)和消极语义韵(negative prosody)。[1]基于语料库的“中间语对比分析(contrastive interlanguage analysis)”是近年兴起的一种研究方法,它采用语料库研究的基本方法,比较学习者语料库和参照语料库中的相关数据,概括中间语和本族语之间的主要差异,发现中间语的非本族语特征,并探讨导致这些特征的背后原因。

二、文献综述

语义韵这一概念最初由Firth提出,是指用来概括语音研究中切分成分(segmental elements)在语流中具有超切分特征这一具体的音韵现象。20世纪末,一些“后弗斯学派”的语言学家进一步发展了这一概念。如Sinclair发现,set in经常与一些表示令人不愉快的事物搭配,如rot、decay、ill-will等。[2]Louw发现,built up做及物动词 (built up a)时呈积极语义韵,而做不及物动词(built up of)时则带消极语义韵;他还分析了end up doing和get oneself done的消极语义韵。[3]Stubbs提出了cause的消极语义韵和career的积极语义韵倾向。[4]Partington发现,commit、peddle、peddler、dealings具有消极语义韵。[5]在国外语义韵研究方兴未艾之时,我国学者也纷纷加入这一研究大潮。国内语料库语言学界对语义韵的研究主要是引进西方相关理论,对语义韵的含义、分类、研究方法、重要意义、成果应用进行介绍。如卫乃兴探讨了英语专业文本语义韵,[6]还介绍了语义韵研究的一般方法[7]。王海华、王同顺等进行了语义韵的对比分析,并指出语义韵在二语习得中的重要性及其对英语教学的启示。[8]

我国的相关研究大多是对语义韵进行介绍,因而缺乏创新性。另外,我国对词语的语义韵原创研究较少,且基本上都是对前人提出的具有明显语义韵倾向的词进行研究,从而使研究的范围和方向受到极大的限制。因此,在充分吸收国内外理论成果的同时,加强对词语语义韵的原创性研究,发掘更多词语的语义韵倾向,显得极为重要。本文在研究leave5语义韵倾向的同时,还对比了我国学习者与本族语者在使用leave5时语义韵的差异,对英语教学有一定的启示。

三、leave5的语义韵倾向

(一)研究设计

本文旨在研究leave的第五个义项(以下简称leave5)的语义韵倾向。根据OxfordLearner’sDictionary等大型词典的定义,leave5的定义为[transitive]to make or allow someone or something to remain in a particular condition,place,etc.其主要类连接有三种:leave somebody/something (+ adjective);leave somebody/something doing something;leave somebody/something to do something。

本文将采用数据与数据驱动相结合的方法,利用英国国家语料库(British National Corpus,BNC)和当代美语语料库(Corpus of Contemporary American English,COCA)检索leave5的搭配词。BNC是一个封闭语料库,收录了20世纪80年代至1993年的口语与书面语语料库,库容为1亿词。COCA由美国杨百翰大学Mark Davies教授研发,涵盖了从1990年至今的各种类型语料,为当今最大的免费使用的共时语料库,库容为4.5亿词。因此,采用该两大权威语料库得出的数据会具有较大的说服力。

在数据收集过程中,首先按照leave5的三个类连接,分别统计出其搭配的adjective、V-ing、V+infinitive。其中,因为leave5三个常用搭配的搭配词都在leave之后,所以跨距(span)设定为“左0右4”的范围。在共现频率不少于10次内来提取搭配词,并利用相互信息值(MI≥3)来测量搭配词与节点词leave5之间的搭配力(当MI≥3时表明该词与节点词之间有较强的搭配力)。[4]然后人工剔除不符合类连接的实例,接着分析符合条件的搭配词的语义内涵。为较为客观地判断搭配词的语义内涵,设定了如下判断依据:对于每一个搭配词,由语料库中的KEY WORDS IN DISPLAY提供的语境帮助判断其语义内涵,其中语料大于30条的,随机抽取30条作为判断依据,语料小于30条的则全部作为判断依据。

(二)检索结果

通过以上方法检索,可以在BNC中得到表1呈现的结果。

结果1:与leave5搭配的形容词共37个,其中剔除不符合该类连接的搭配词2个: non-stick、gaping,剩下的35个形容词中,有54%带有消极含义,如unattended、speechless、unguarded等(由于搭配词较多,不便一一列举,所以文中只列举MI值排名前几的词,以下列举情况相似,不再赘述)。

结果2:与leave5搭配的动词-ing形式共8个,其中剔除不符合该类连接的搭配词1个:slamming。剩下的7个V-ing中,有71%带有消极含义,如floundering、fuming、reeling等。

结果3:与leave5搭配的动词不定式共7个,全部符合类连接leave somebody/something to do something。其中有4个词带有明显的消极含义:fend、rot、starve和drown,占比57%。

由以上分析可见,leave5在BNC中的搭配词带有明显的消极含义。

表1 BNC中各类含义词在搭配词中所占比例

按照同样方法检索得到COCA中的数据,结果如表2所示。

结果1:与leave5搭配的形容词共79个,人工剔除搭配词5个: forwarding、voice-mail、ventricular、gaping、natal,剩下的74个形容词中,有39%带有消极含义,如unattended、speechless、unguarded等。

结果2:与leave5搭配的动名词共12个,其中剔除不符合该类连接的搭配词1个:scoring。剩下的11个V-ing中,有82%带有消极含义,如reeling、gasping、fuming等。

结果3:与leave5搭配的动词不定式共4个,全部符合类连接leave somebody/something to do something。其中有3个词带有明显的消极含义:fend、rot和languish,比例为75%。

由以上分析可见,leave5在COCA中的搭配词带有明显的消极含义。

表2 COCA中各类含义词在搭配词中所占比例

综上所述,通过调查leave5在BNC和COCA中的搭配词的语义内涵,我们可以得出结论:leave5带有明显的消极语义韵倾向。

四、leave5的语义韵对比

(一)研究设计

在证明了leave5的消极语义韵之后,笔者使用中国学习者英语语料库(Chinese Learner English Corpus,CLEC)和COCA来研究中国英语学习者使用leave5时语义韵与本族语者的异同。CLEC由中国高中至大学各阶段的学习者的考试作文和自由作文构成,共计100 万词左右。使用的工具是AntConc 3.2.4w。首先将CLEC语料导入AntConc 3.2.4w,并在concordance栏里输入“leave|leaving|leaves|left”,得到关于以leave为词根的语料共695条。接着人工检索出leave5的语料共39条。经过统计,其中leave5+adj.共21条,其adj.搭配词及其token频率为alone(9)、 behind (5)、 empty (1)、 far(1 )、out(1)、 quiet(1)、 uneaten(2)、 disappointed(1);leave5+inf.共16条,其V.inf与其token频率为bleeding( 1 )、watching(1);leave5+ing.共2条,其V-ing及其token频率为decide(4)、imagine(3)、dream(3)、watch(2)、stand (2)、 do(1)、 discover(1)、 finish(1)、 have class(1)、 write(1) 、think(1)。

根据上述判断标准,得出数据,具体见表3。

表3 CLEC中各类含义词在搭配词中所占比例

由上述三个语料库中的数据结果可以得出以下结论:

结论一,中国学习者在使用leave5时与本族语用者在语义韵上存在很大的差异。

结论二,在使用leave5时,本族语用者呈现错综复杂的语义韵,其中带积极语义韵的搭配词占比例最小(2%—3%),中性语义韵的词占比例居中(20%—30%),消极语义韵的搭配词占比例最大(60%—80%),是中性语义韵搭配词的2—3倍。

结论三,中国学习者在使用leave5时,呈现出明显的中性语义韵,消极语义韵所占比例极小,积极语义韵搭配词一个也没有。

结论四,中国学习者在使用leave5时,过多使用了中性语义韵,过少使用了积极语义韵,特别是过少使用了消极语义韵。

(二)讨论

中国学习者在使用leave5时与本族语用者在语义韵上存在很大差异的原因主要有以下三点:

第一,受母语的干扰。leave5被解释为“使保留,让……处于(某种状态、某地等)”,这并没有体现明显的消极含义。受汉语翻译的影响,中国学习者在使用leave5时与本族语用者存在一些差异,造成语义韵使用的不恰当现象。例如:(1)I am afraid you leave me no choice.恐怕你没有给我留下选择的余地。[9](2) The documentary left me in a state of shock.那部纪录片使我大为震惊。

第二,词语学习深度不足。很多中国学生在学习单词时,常常是单纯记忆词义,而没有把单词放在具体的语境中仔细地探究词的语境意义。因此,在具体运用中难免会忽略单词语义韵倾向,与本族语用者的语义表达不太一致。

第三,词典编纂的不足。学习词语语义,除了课堂上老师的讲解外,最主要的方法就是查询学习型词典。英语类学习词典对词语的释义多采用传统词典先释义再给出相应例句的方法。然而,由于字典篇幅的原因,给出的例句数量有限,因而并不能很好体现leave5的语义韵倾向。

六、启示

本文在此提出对英语教学及词典编纂的几点建议。

第一,目前中国英语学习者缺乏语义韵意识,在使用一些词语时造成语义冲突。因此,在英语教学中,老师应该引入语义韵的概念,提高学生语义韵意识,适当地进行英汉语言对比,有效回避母语负迁移,并在词汇教学中援引大量的语料库实例,展示该词语的使用语境,引导学生在仔细观察实际语料的基础上归纳出搭配词语的语义倾向。另外,在教授近义词辨析时,也可应用语义韵来比较词语的细微差别,对词义进行细致深入的描写,以帮助学生更好地区分近义词。

第二,对于学习型词典编纂方面存在的不足,主要有两点建议。一是要增加例句。增加例句不是盲目扩大数量,而是要在语义韵归纳的基础上,精心挑选具有典型语义韵代表的例句。让学习者在查阅字典时,可以清楚地了解该词的语义韵倾向。另外,例句的选择要尽量贴近学习者的生活,在保证相同难度的基础上,适当扩展例句涉及的范围,全面反映社会生活各个方面。二是建立基于语料库语言学驱动的词典编纂。现代词典的编纂都是语料库语言学驱动的,词典产品更新快、创新快、兼容空间大,大量从真实语料中提取的语言事实,可使词典更具说服力,尤其是在处理词项搭配问题上,可从语料中归纳词语语义韵倾向,从真实语料中提取简明易懂的句子作为例句。基于语料库的词典编纂可以保证例句来源的丰富性、广泛性、真实性,从而让学习者更容易掌握搭配词的语义韵倾向,减少其词语使用中的语义冲突错误。

[参 考 文 献]

[1]STUBBS M.Text and corpus analysis[M].Oxford: Blaekwell,1996:176.

[2]SINCLAIR J.Looking up: An account of the COBUILD project in lexical computing[M].London: Collins Cobuild,1987:155-156.

[3]LOUW B.Irony in the text or insincerity in the writer?——The diagnostic potential of semantic prosodies[M]//BAKER M,FRANCIS G,TOGNINI-BONELLI E.Text and Technology.Amsterdam: John Benjamins Publishing Company,1993:157-176.

[4]STUHBS M.Collocations and semantic profiles: On the cause of the trouble with quantitative methods[J].Function of Language,1995(1): 1-33.

[5]PARTINGTON A.Utterly content in each other′s company:Semantic prosody and semantic preference[J].International Journal of Corpus Linguistics,2004(9):131-156.

[6]卫乃兴.语料库数据驱动的专业文本语义韵研究[J].现代外语,2002(2):165-175.

[7]卫乃兴.语义韵研究的一般方法[J].外语教学与研究,2002(4):300-307.

[8]王海华,王同顺.CAUSE语义韵的对比研究[J].现代外语,2005(3):297-307.

[9]〔英〕SHORNBY A.牛津高阶英汉双解词典(第7版)[M].北京:商务印书馆,牛津大学出版社(中国)有限公司,2009:1150.

A Corpus-based Comparative Study on Leave5

LI Dandan

(GraduateSchool,SichuanInternationalStudiesUniversity,Chongqing400031,China)

Abstract:By using COCA and BNC, this paper analyzes the collocation of leave5and finds out that leave5has an obvious negative semantic prosody. Then, it makes a comparative study on the collocation and semantic prosody of leave5both in COCA and CLEC, which proves that Chinese learners underuse the negative semantic prosody of leave5. Finally, three causations of this phenomenon have been explored and suggestions on English teaching and lexicography have been put forward.

Key words:leave5; semantic prosody; corpora; comparative study

中图分类号:H313

文献标志码:A

文章编号:1674-3318(2015)01-0073-04

作者简介:李丹丹(1990- ),女,重庆永川人,四川外国语大学研究生院2013级英语语言理论与应用专业硕士研究生,研究方向为认知语言学、社会语言学。

收稿日期:2014-12-04

猜你喜欢

对比分析语料库
平行语料库在翻译教学中的应用研究
《语料库翻译文体学》评介
基于语料库“隐秘”的词类标注初步探究
戴·赫·劳伦斯《菊馨》三个版本对比分析
成渝经济区城市经济发展水平比较研究
英汉动物词汇文化内涵的对比分析
基于COCA语料库的近义词辨析 ——以choose和select为例
基于数据库的唐诗宋词对比研究
基于JAVAEE的维吾尔中介语语料库开发与实现