基于COCA语料库的英语方式动词中的近义词研究
2019-11-22王书盈
王书盈
1.引言
英语运动方式动词的类型丰富,远远多于汉语,意义划分也更加细微,拥有更强的表达力。在描述一种运动方式时通常会有好几种方式动词来区分它们之间的细微差异。这些细微的差别常常困扰着很多中国英语学习者对运动事件表达的掌握。依赖词典提供的字面解释和有限的词条例证或者以往经验,英语学习者往往很难选取合适的方式动词来进行表达。
语料库语言学的发展为近义词的辨析提供了一种新的方法,改变了过去依赖于有限的词典资源和凭借主观直觉判断的局限性,通过提供直观的例子和真实的数据来区分近义词,更加科学精确地描述其细微差别。这一方法为语言教学提供了真实的语言材料,有利于英语学习者更好地掌握近义词。
2.研究设计
2.1 研究工具
语料库是指按照一定的语言学原则,运用随机抽样的方法,收集自然出现的语言运用文本或话语片段而建成的具有一定容量的大型电子文库。(杨慧中,2002)语料库在检验语言学假设和数据检索方面的价值得到越来越多人的认可。语料库被广泛应用于语音分析、词语研究、句法分析、语义分析、词典编纂等各个方面。
美国当代英语语料库(Corpus of Contemporary American English,COCA)是世界上最大的英语平衡语料库。收集了1990-2017年间美国境内多个领域的语料,词汇库容为5.6亿,并且以每年两千万的数量持续扩充。涵盖了口语、小说、杂志、报纸和学术期刊五类内容,分布比较均匀。因其库容大、时效性强、范围广的特点,本文将使用COCA作为研究工具进行检索。
2.2 研究对象
本文选取意义相近的方式动词jump/leap,在权威的英汉字典第8版《牛津高阶英语词典》中对两词作为动词的义项分别进行了统计。
Jump:1.move forward by leaps and bounds
2.move or jump suddenly,as if insurprise or alarm
3.make a sudden physical attack on
4.increase suddenly andsignificantly
5.rise in rank of status
leap:1.To jump high or a long way
2.To move or do sth suddenly and quickly
3.to increase suddenly and by a large amount
可以看出jump和leap的释义中都有跳跃和增加的意思,两者语义有明显的交叉重叠性,从词义上难以看出两者的细微差别。
2.3 研究方法
本文采用基于语料库的研究方法,借助语料库提供的真实语言实例进行归纳总结语言的特征。在COCA语料库中检索jump/leap,统计两词在不同语域中的分布差异、不同历史阶段的使用频次变动以及它们的显著搭配,从而进行辨析。
2.4 研究问题
本文将探究方式动词近义词jump/leap在使用表达中有何异同。
3.结果和分析
3.1 jump/leap在COCA语料库中词性的频率分布
在词典中可以查到jump和leap均既可做动词也可做名词,在COCA语料库中搜索jump和leap的词频,可以看到jump一共出现21380次,而leap仅出现7562次,约为jump出现频率的1/3,jump被使用的次数远多于leap,这个我们在平常的学习阅读中也能切身的感觉到。jump 作为动词出现的次数为13703次约为作为名词出现的7633次的两倍,可见jump大多被使用的词性为动词。与jump恰好相反,leap作为名词使用的频次约为动词的两倍,可见leap更多的场合是作为名词。本文我们主要研究的是他们的动词形式,leap的样本容量仅为jump的1/5。
3.2 jump/leap在COCA语料库中不同语域的频率分布特征
语域(register)是指在实际的语言交际过程中,人们因交际的目的不同或话语发生的情景不同或说话的对象不同而产生的一种语言变体,体现为语言中不同的语体风格及用语格调等。韩礼德(1978)将语域进一步划分为域(field)、旨(tenor)、式(mode)。任何语言都受到语域因素的影响和制约,近义词的使用也是如此。
语域的分布能够体现语言的使用场合,不同的场合我们习惯使用不同词句来获得更好的表达。比如一个单词被更频繁的运用到学术期刊里,那这个单词相对于那些在口语表达中频繁出现的单词来说往往表达的意思更为精准且更为适合正式的场合。有时难以从汉语意思或者语法区分近义词时,语域分布往往可以发挥宏观指导作用,让你能够选择更为适合的单词。
我们在COCA语料库中的chart模块,分布输入jump和leap,由于本文只研究它们作为动词的性质,所以在词性上我们要选择verb.all,得出jump和leap的动词词性的词频分布。
如表2所示,jump在口语小说的使用频次上明显高于其它语域,报刊、杂志上的使用频率次之,学术期刊上的运用频次最少,可以看出jump是一个偏口语的词汇,更多的使用在非正式语境中。Leap在小说中的使用频次接近总使用频次的一半,小说的用词比较形象生动,也比较贴合我们对leap的感受。
jump 的使用频次在口语,小说,杂志,报纸,学术期刊上均高于leap,尤其在口语上表现的更为明显。Jump作为动词的总使用频率约为leap的5倍,在口语这一语域上比例系数升到近15,而在小说和学术期刊上则降为3左右。可见,相对比来说,jump更常用于口语,而leap则更常用于小说和期刊论文上。
3.3 jump/leap在COCA语料库中不同时间段的频率分布特征
COCA 语料库的chart模块不仅可以获悉单词的共时分布,还可以得出单词的历史变化轨迹。表3为jump和leap的历史变化轨迹。从所获得的数据可以看出jump 的变化并不明显,有升有降,leap的变化也不大,但呈下降趋势。但是将每个时间段jump的使用频次比上leap的使用频次,可以发现这一比例系数一直呈现上升趋势,从4.18一直上升到6.08,这说明jump的应用越来越频繁,被接受程度也更高。
3.4 jump/leap的常见搭配及MI值
词语搭配的重要表现形式有词语的结伴关系或共现关系,词语搭配研究之父弗斯说过(Firth,1957)“由词之结伴可知其词”(“you shall know a word by the company it keeps”),可见研究词语的搭配的意义重大,不仅能更好的确立词语的句法结构关系,而且可借助搭配关系消除歧义。广义的词语搭配认为只要两个词语共同出现的频次达到统计学上的显著程度就构成了搭配。
互信息(Mutual Information,MI)是来自信息论中的一个概念,它原本被用来度量一个消息中的两个信号之间的相互依赖程度。这一概念应用在语料库中则能表达一个词的出现为另一个词提供的信息量,可以用来衡量两个词语之间搭配的紧密程度。MI值越大,那么这两个词共现的几率就越大,如果MI值为0,那么就说明这两个词几乎没有共现的几率。Huston提出在实际操作中应以3作为临界值,即如果两个词的互信息值大于3,则这两个词就可以视为有比较紧密的搭配。
因为我们考察的是“jump”和“leap”的动词形式,而且在运动事件中,它们多作为不及物动词使用,故在COCA 语料库中将搭配词限定为介词,将搭配的跨距右侧设置为1,左侧设置为0,MI值设为大于等于3,按照频率降序排序,得到的检索结果如下(见表4附后):
从整体上可以看出,与“jump”搭配的介词种类比与leap搭配的少,仅从运动事件的角度看,说明leap可搭配的路径更多,或者在与某些路径搭配的时候,leap则更为合适。比如与from、over搭配。
与“jump”搭配的介词出现的频率要远多于与leap搭配的介词,这说明在与常用路径搭配时,我们更多时候选用的是方式动词jump。
除on与aboard外的所有与jump搭配的介词均出现在与leap搭配的频次最多的前九个介词中,并且他们所搭配的频次最高的介词均为into。这意味着这两个运动方式动词意思用法接近有很多共通之处。
由于jump和leap均与into搭配的频率最高,我们从COCA语料库中分别随机抽取三个它们与into搭配的例句进行深入分析,所抽取到的例句如下:
Jump+into:
Two men in suits jump into the swimming pool.
The last thing I needed was to jump into another relationship.
I had to jump into my own car and drive a little dangerously myself.
Leap+into:
The preliminaries over,Festus would leap into battle.
The problem is how to leap into the future while holding onto the past.
The first person to leap into action was Mrs.Bennet.
从例句中可以看出jump into 后面可以接真实的物,比如(1)中跳入游泳池(3)中跳入车中。也可以接虚拟的物,如(2)中跳入其它的关系中,说明jump比较通用。而抽取的三个关于leap into的例句中,leap并没有作为真正的运动方式动词来使用,全部使用的是其引申意。如跳入(投入)战斗、跳入(跨越)未来、跳入(加入)行动。为了表明leap在与into 搭配时是有使用其作为方式动词的意思,我在语料库中找到以下两个例句:
Roboticists at UC Berkeley have designed a small robot that can leap into the air.
I watched Maia confidently leap into the ocean to get a better look at manta ray.
同时本文研究也发现leap作为方式动词的例句偏少,这表明leap与into的搭配并不常用于运动事件中。
Jump 与on的搭配频次与into相同,但MI值却明显小于与on的搭配。这说明jump与into的搭配更为紧密。Leap 与from的搭配略低于与into的搭配,而jump与from的搭配由于MI值低于3而没有记录在表中。这说明相对于jump,leap与from的搭配更为紧密。从路径上看,leap from 有一个跳跃的距离,这表明leap更趋向表达带有路径的运动方式,从表中看,jump后搭配的介词大多都没有表达出这种距离感。
在COCA语料库中再将搭配词限定为名词,将搭配的跨距右侧设置为2,左侧设置为0,MI值设为大于等于3,按照频率降序排序,得到的检索结果如下(仅取频率最高的10个单词)。(见表5附后)
从整体上看,他们所搭配的名词中Conclusions、Joy、Feet 是共同的,除了jump与conclusions是固定搭配,其它搭配中这两个动词均表现为真实或虚拟运动方式动词,举例如下:
1.And I take it that Wolf's kisses do make you jump for joy?
2.They can jump 3 feet high.
3.It was easy for her to leap ten feet to the top of a stone wall.
4.My heart didn't know whether to leap for joy or die for the pain.
观察搭配的其它名词可以发现与jump搭配的实物名词较多,频次也比较高,而与实物名词搭配,jump和leap 多表现为运动方式动词。这意味着jump更常做运动方式动词。
4.结论
传统的单词英英释义、英汉释义很难定性的区分leap和jump在运动事件上的微小差别,词典中可以看到这两个单词在表达某一个意思时可以互换。而我们通过COCA语料库的对比,就可以发现即使它们在表达同样的意思时,它们所搭配的词不一样,它们中的某一个往往会更适合,或者说更符合母语者的使用习惯。
我们通过在COCA语料库上对jump和leap作为动词的使用总频次、使用语域的频次分布、使用随历史发展的频次变化以及所接搭配频次和MI值的分析,得出:
1.jump比leap更通用。
2.Jump相对leap更口语化,leap则更常用于小说和期刊论文上。
3.jump的使用频次相对leap越来越高。
4.作为动词使用时,jump更多的被用作运动方式动词,leap则相对更多用其引申意。
语料库收集了词语在实际使用中真实出现过的语言材料大量的例子,我们经过数据分析,对例子总结归纳,能够更清楚明白的感受到近义词的细微差别,这在研究运动事件中是很有意义的,运动事件中很多方式动词表达的意思差别很小,通过COCA语料库的分析我们就可以选择出更合适、准确的词句。