语料库数据驱动对程度副词pretty和quite的语义韵研究
2016-01-27巩培林上海理工大学外语学院
巩培林上海理工大学外语学院
语料库数据驱动对程度副词pretty和quite的语义韵研究
巩培林
上海理工大学外语学院
摘要:语义韵是当代语料库语言学研究的重要对象。本文通过语料库驱动的方式,利用现代美国英语语料库(COCA)分析了程度副词“pretty”和“quite”的语域分布和语义韵特征。结果发现,这对程度副词的语域分布和语义韵特征均有明显的差异。建议在外语教学中广泛使用语料库工具,提高语义韵感知能力,促进语言教学和学习的顺利进行。
关键词:语料库驱动语义韵语域程度副词
一、引言
语义韵是一种搭配现象,是某些词语由于经常同具有某种语义特征的语言单位共现而产生某种语义色彩的结果。对于语义韵的分类,不同的学者有不同的分类方法。Stubbs(1995)从功能的角度将语义韵划分为积极(positive)、中性(neutral)和消极(negative)语义韵三类,三分法是目前最常见的方法。积极语义韵是指节点词的搭配词大多数具有积极的语义特点;消极语义韵的节点词吸引的搭配词几乎具有鲜明的消极语义特点;中性语义韵词语呈现出错综的语义特点,既可以与具有消极意义的词项共现,也可以与具有积极意义的词项共现。
卫乃兴(2002)将语义韵研究方法归为三类:建立类联接基于数据的方法、计算搭配词数据驱动的方法以及两者相结合的方法。本文采用第二种研究方法。
二、研究设计
(一)研究目的
本研究目的在于通过设定检索条件,统计和分析近义词pretty和quite的显著搭配词所显示的语义韵特征。
(二)研究方法和步骤
本文基于美国当代英语语料库(COCA),该语料库是最大的免费英语语料库,也是唯一的一个大型美式英语平衡语料库。COCA包含4.5亿词的文本,这些文本均衡地分布在口语、小说、流行杂志、报纸和学术五种语域内。这为研究某个词语在不同语域内的分布情况提供了前提条件,使结果更加客观。
采用卫乃兴(2002)所提出的数据驱动方法,通过设定-4/+4的跨距,将节点词pretty和quite所有的搭配词都通过KWIC的方式显示出来,然后通过计算MI值来确定显著搭配词,最后通过逐个分析显著搭配词的性质来确定节点词的语义韵。通常MI值大于3的即视为显著搭配词(邓耀臣,2003)。
值得注意的是,pretty具有多重词性,可做形容词、副词和名词。本文利用高级检索功能“pretty.[r*]”,将研究范围限定在pretty作为副词时的语义韵。
三、pretty和quite在COCA各语域内的分布
图一 副词pretty在各语域中的分布
图二 副词quite在各语域中的分布
图中FREQ为该词在COCA语料库中出现的次数,也即观察频率(observed frequency);PER MIL为每百万词出现的次数,是标准化后的数据,该行数据更加公平地比较两个词之间的差异。SEE ALL SUBSECTIONS AT ONCE表示该词在每个语域下子语域里出现的情况,就本文的研究目的而言,在此不做讨论。
横向来看,pretty在口语中出现的频率最高,为279.86次每百万词,在学术语域中出现的频率最低,仅为16.69次每百万词。在杂志和报纸中出现的频率几乎一样,约为100次每百万词,而在小说语域中略高,为134.24次每百万词。quite在口语中出现的频率也是最高,为258.62次每百万词。而与pretty不同的是,quite出现频率最低的语域是报纸,仅为105次每百万词。杂志和学术文本出现的频率大致相同,约为140次每百万词,而在小说中出现频率略高,达到205.4次每百万词。
纵向来看,pretty和quite都在口语中使用得最多,表明这两个词具有明显的口语化特征。这对词最明显的差异在于它们在学术语域中出现的频率,quite每百万词出现141.71词,而pretty每百万词仅为16.69次,相差8.5倍(141.71/16.69)。从这点上来说,quite比pretty更加正式。
四、pretty和quite的语义韵分析
在以上条件的限制下,通过检索节点词pretty,共发现了104个MI值大于3.0的搭配词,即显著搭配词。quite共发现了89个显著搭配词。
通过分析这些显著搭配词,作者发现在pretty的显著搭配词中,有33个显示出积极含义:neat,amazing, good, impressive, decent, confident, cool, exciting, awesome, smart, clear, clever, excited, pretty, cute等。
有29个显示出消极含义:darn, darned, scary, bleak, grim, boring, rough, tough, damn, nasty, frightening, aweful, weird, ugly, dumb, bad, stupid, harsh, silly, upset, sad, tired, crazy, heavy等。
其余42个搭配词为中性:straightforward, obvious, slim, quick, simple, intense, busy, accurate, quiet, close, solid, typical, serious, normal, rare等。
根据Stubb对语义韵的定义和分类,由此我们知道pretty具有混杂语义韵。
而在quite的89个显著搭配词中,共有42个表现出积极含义,如honestly, rightly, nicely, accomplishment, pleased, confident, capable, impressive, clearly, happily, comfortable, handsome, fascinating, lovely, impressed, interesting, satisfied, honest, amazing, reasonable, attractive等。
5个表现出消极含义:stir, striking, upset, shock, never。
其余42个表示中性含义:frankly, contrary, literally, bit, possibly, opposite, different, naturally, simply, quite, openly, few, accurately, actually, evident, unlike, seriously, often, proved, ready, obviously, similar, reverse, seem, yet, rapidly, possible等。
因此,quite具有明显的积极语义韵。
五、结论
本文借助COCA语料库,利用语料库数据驱动的方法研究了程度副词pretty和quite的语域分布和语义韵。结果发现pretty和quite都在口语中使用得最多,然而在学术文本中,quite比pretty出现的频率更高。pretty具有混杂语义韵,而quite具有积极语义韵。本文的创新之处在于pretty具有多重词性,而作者利用搜索句法“pretty.[r*]”解决了这一问题。同时,作者发现pretty有使用增多的趋势,而quite则恰恰相反,但限于本文的研究目的,在此不做讨论,有兴趣的读者可以深入研究。
参考文献
[1] Changhu Z.An Overview of Corpus-based Studies of Semantic Prosody[J].Asian Social Science,2010(6):190-194.
[2] Hunston,S.Corpora in Applied Linguistics [M].Cambridge:Cambridge University Press,2002:68-79.
[3] Sinclair,J.Corpus,Concordance,Collocation [M].Oxford: Oxford University Press,1991.
[4] Stubbs,M.Collocations and semantic profiles:On the cause of the trouble with quantitative methods [J].Function of Language,1995(2):1-33.
[5]邓耀臣.词语搭配研究中的统计方法[J].大连海事大学学报,2003.
[6]卫乃兴.语义韵研究的一般方法[J].外语教学与研究(外国语文双月刊),2002,34(4):300-307.
[7]卫乃兴.基于语料库和语料库驱动的词语搭配研究[J].当代语言学,2002(4):101-114.
[8]温玲霞,何明刚,张喆.基于语料库数据的近义词语义韵调查——以rather,fairly为例[J].沈阳大学学报,2007,19(5): 56-60.
[9]翟红华,方红秀.国内语义韵研究综述[J].山东外语教学,2009(129):8-11.
[10]张莹.基于语料库的语义韵20年研究概述[J].外语研究,2012(136):23-28.
[11]张碧琼,余毓国.基于语料库的“Heritage”和“Legacy”的语义韵比较研究[J].英语广场,2013(2):32-33.