APP下载

基于语料库对近义词Intellectual和Intelligent搭配及语义韵的对比研究

2020-01-02申淑丹

文化学刊 2020年2期
关键词:语料语料库语义

申淑丹

一、介绍

(一)研究背景

词汇作为语言的基础,是表达语言意义的最小单位,在口语和书面语交流中都起着至关重要的作用。同义词一直是词汇研究的核心,在英语中被广泛使用。对于非母语学习者而言,英语学习过程中所出现的同义词是很难把握的,他们往往有看似相同的汉语翻译,但在根本意义上还是存在细微差别。这种现象常常令非本族语学习者非常头痛,一方面他们无法从汉语意思中感知文化意义上的差别,另一方面汉语化语境与真实语境的差异使他们更加无所适从。

大规模语料库的出现为同义词的辨析提供了新的视角和新的途径,语料库使另一种方法成为可能,即通过自然语境来学习单词的意义。一些英语国家的语料库不仅能够为学生提供正宗的、标准的英语语言学习语境,还能够根据常见用法检索出与之搭配的词语以及相关的语义韵。

(二)调查动机和目标

首先,对于中国英语学习者来说,词汇学习中最重要但最困难的部分之一就是识别英语同义词。许多英语学习者发现英语同义词容易理解,但很难正确使用。其次,在现今出现的基于语料库的同义词分析中,大多数都是关于名词和动词的,有关形容词的分析很少。

基于这一现象,笔者根据自身籍贯所在地部分中学老师访谈结果选出两个比较容易出错的形容词来进行语料库的分析,通过对两个形容词同义词的语义韵律和搭配研究,举例说明如何利用新的语料库来发现同义词之间的细微差异,为人们提供更真实的语言材料。本文将解决以下两个基本问题:

(1)这两个同义词在COCA语料库中主要的搭配和语义韵特征有什么差别?

(2)这项研究对今后的同义词教学有什么启示?

二、文献综述

(一)语料库的定义

早期的国外研究者曾对语料库作出过相应的定义。Sinclair[1]将语料库的含义归纳为“为了用作语言的样本,通过一定的特殊规则挑选、分类、排序的语言素材的集合”。肯尼迪[2]对语料库的定义是这样的:“只要是可以用来分析语言和描述语言的,书面文本或演说转录均可称为一个语料库。”

国内对于语料库的研究起步相对较晚。谢家成[3]给出的语料库定义是指“存在计算机里的大量语言材料和定位检索管理软件的结合”。目前国内语言学界普遍认可的是杨慧中[4]教授给出的定义,即“语料库是根据规定的语言学原则,采用随机抽样方式,汇集日常生活中出现的连续语言使用文本及会话片段而建成的具有一定容量的电子文库”。

(二)搭配

Sinclair[5]对搭配的定义为“两个或两个以上的词在一篇文章中在一个很短的空间内出现”。李文中[6]讨论了不同的搭配测量方法及其在语料库中存在的问题。根据搭配的强度,可以将搭配分为自由搭配、限制搭配和习语。自由搭配是指两个或两个以上字面意义上的词的组合,组合中一个词的变化不会影响整个短语。限制搭配与自由搭配是截然相反的。

(三)语义韵

Sinclair在20世纪90年代初探讨了突发事件的发生,发现突发事件往往与否定词同时发生。Sinclair等[7]认为,语义韵表明的是特定语用情境中说话者的态度。Stubbs[8]将语义韵分为三类:积极语义韵、中性语义韵和消极语义韵。

在中国,也有一些关于母语者和中国英语学习者同义词韵的对比研究。孙海燕[9]研究了中国英语学习者形容词的语义韵律。她的研究结果表明中国英语学习者和母语者之间存在着很大的差异。

三、研究方法

(一)研究工具

在本文中,笔者主要采用的是杨百翰大学马克开创的美国当代英语语料库(Corpus of Contemporary American English,COCA)。首先,该语料库中所包含的语料较为全面,其中囊括报纸、新闻等各类媒体中出现的内容,为非本族语使用者提供了较为真实并且全面的本族语者语料。其次,该语料库更新比较及时,基本上每两年会进行一次更新,便于跟进时代的步伐,及时补充词语在新时代的新用法。再次,该语料库可以免费使用,这使得更多的英语教学者和学习者可以免费注册使用该语料库。最后,语料库查找提取速度较快,可以在短短几秒钟内锁定查找词语,检索出使用者所要提取的资料。总之,在规模大小、更新速度、查找速度等方面,该语料库都在同类语料库中处于中上等水平,具有较高的参考价值。

(二)研究过程

根据研究者的经验或一些研究成果,研究者首先提出相应的研究问题,然后利用语料库数据对不同情境下的使用进行详细的查找、证明和总结。

笔者主要采用定量分析和对比分析的方式。定量分析是在观察语言特征的基础上进行统计和解释,而对比分析是在获取语料之后对两词搭配以及语义韵的对比研究。从广义上讲,语料库为研究工作提供了大量的数据,因此很多研究者习惯于利用定量分析得出基于语料库的结论。本研究采用定量分析的方法,在COCA中获取大量的自然数据,用以分析两个词的搭配和语义韵,同时结合对比分析找出两个词在用法上的相同点和不同点。具体分析过程如下。

首先,在COCA语料库“collocate”(搭配)功能项下分别以intellectual(脑力的、智力的)和intelligent(聪颖的、聪明的)为节点词,将搭配词类设置为名词,在跨距为±4(节点词前后4个词)的范围内提取搭配词,并按照频率排序。其次,剔除不符合要求的部分,对两词的语义韵律和搭配进行分析,总结结果。

四、结果分析及讨论

(一)同义词的搭配特征

节点词intellectual在COCA中出现的频数为19,500,节点词intelligent出现的频数为9,688。从这个数据可以看出,在COCA所收集的真实语料中,intellectual的使用频率要比intelligent高。根据列表中MI值来确定与之搭配频度较高的词,本文选取MI值大于3的搭配词并对之进行细致分析。

在对Intellectual进行分析时,笔者发现与之搭配程度较高的词类分别是:

(1)表示人能力的词,如disability(无力、无能)、ability(能力)、capacity(才能)、competence(能力)、skill(技能)、inferiority(低等、低劣);

(2)表示人性格品质的词,如elite(精英)、arrogance(傲慢)、honesty(诚实)、prowess(英勇)、curiosity(好奇)、integrity(正直);

(3)表示权利、机遇、挑战等抽象意义的名词,如rights(权力)、challenge(挑战)、development(发展)、responsibility(责任);

(4)表示规则、传统的词,如discipline(规则)、law(法律)、tradition(传统);

(5)表示活动、时间或者过程的词,如revolution(革命)、exercise(活动)、ventures(冒险行动);

(6)表示和金钱有关的词,如property(财产)、heritage(遗产)。

在对Intelligent进行分析时,笔者发现与之搭配程度较高的词分别是:

(1)表示工具类或者设备装置类的词,如machines(机器)、vehicles(车辆)、transportation(运输工具)、devices(装置)、systems(系统)、computer(电脑)、cars(汽车);

(2)表示物种或者其他有生命的生物,如creature(生物)、species(物种)、animals(动物)、dog(狗);

(3)表示与人的称谓相关的词,如boy(男孩)、girl(女孩)、person(人)、designer(设计者)、kid(孩子)、readers(读者);

(4)表示存在具体事物,如earth(地球)、highway(公路)。

对比两个形容词在COCA语料库的主要用法搭配和语义韵,笔者发现两词虽然在拼写、中文翻译意义上有很多相似之处,但是经常搭配使用的词却有明显的差别。首先,intellectual搭配词的丰富程度更高,较难归纳总结其常用词类,但与之相对,intelligent搭配词固定模式程度较高,较易掌握总结其常见搭配词;其次,形容词intellectual经常和一些表示能力、抽象意义的名词搭配使用,而intelligent则很少与这类词搭配,这一点有很大不同;再次,intelligent经常搭配一些具体的工具词,这在intellectual的搭配中几乎没有出现;最后,intelligent常与一些表示人或者表示其他生物的词连用,但在intellectual的用法中,其出现频率相对较低。

(二)同义词的语义韵特征

笔者先是比较了这两个同义词的显著搭配词的类别以及三种不同语义韵所占的百分比,然后基于此分析解释其语义韵倾向。

在分析COCA语料库中的搭配词之后,笔者发现两词的语义韵存在着一定差异。intellectual的搭配词中有5.39%的词表现出消极语义韵,有4.28%的词表现出积极的语义韵,而剩下的90.33%的搭配词表现出中性的语义韵特征。由此可知形容词intellectual与搭配词之间大部分构成一种中性的语义韵现象。反观intelligent,其搭配词除了少数表现出积极的语义韵特征之外,有98.48%都表现出中性的语义韵。这两个词的语义韵特征为区别两词提供了思路。在教学过程中,教师除了可以强调两词的搭配词类别不同之外,还可以通过语义韵的相关特征来帮助学生更好地进行具体语义的区分辨析。

五、结论

(一)总结

本文主要选取了两个学生较难区分的形容词intellectual与intelligent,借助COCA语料库中的真实语料分析两词的搭配和语义韵特征,进而对两词进行具体的区分。首先,两词的搭配词存在一定差别。intellectual的搭配词较为多样,并且经常与表示能力和抽象意义、感情的词语进行搭配,与之搭配的具体词比较少。反之,intelligent更经常和一些具体存在的事物进行搭配。其次,从两词的语义韵特征来看,intellectual会显示出一些明显的消极的语义韵特征,但intelligent几乎没有出现过这类语义韵特征。通过对这两个形容词的语料库分析,可以给当代教师提供词汇教学上的启示。

(二)启示

首先,外语教师应该注重词语搭配以及语义韵特征的教学。当代中国英语教师在教授词汇时大多采用传统的方式,将单个词汇与其搭配、语境割裂开来,这样就会造成学生不知道怎么运用的问题。特别对于一些汉语意思听起来相同但却存在实际差别的词,学生运用得通常比较混乱。所以,教师在日常教授词汇特别是同义词辨析的时候,需要特别注意结合相应的搭配词和语义韵进行教学,这样学生会对不同的词汇以及相应的运用有更深入的认识。

其次,教师可以借助语料库进行词汇辨析教学。在现实生活中,大多数英语教师在课堂上所应用的例句有很大一部分来源于教学参考书,有些教师甚至自己现场造句。由于教参资料水平参差不齐,有些例句的选取并不是本族语者所真正使用的形式和语境,这可能会造成学生对不同词语语境的理解存在偏差。同时,现场造句有时会受到课堂环境的影响而出现口误,从而给学生提供不具参考价值甚至错误的例句,这样不利于学生体会词语所在的语境,甚至会使他们对已经习得的词语知识产生疑惑。而语料库在英语教学中的应用在很大程度上解决了这个问题。由于所有的语料均来自目标语国家现实生活中的报刊、电影等真实材料,教师在选取例句时会给学生提供更加真实、生动以及准确的语料,从而更有利于学生体会词语所在的真实语境,更好地在真实语言环境中习得词语。

最后,语料库可以作为高年级学生自主学习的工具。在以语料库为基础的教学中,学生可以接触到大量真实的文本,这有利于学生在母语语境中学习词汇,并在自主探究中得出有意义的结论。教师可以加强引导,使学生们自己动手操作,从而加深对词汇的理解。这样做不仅能让学生针对自己不懂不会的内容加强学习,还能培养学生自主学习和小组合作学习的能力。

猜你喜欢

语料语料库语义
真实场景水下语义分割方法及数据集
面向低资源神经机器翻译的回译方法
平行语料库在翻译教学中的应用研究
《语料库翻译文体学》评介
濒危语言与汉语平行语料库动态构建技术研究
“吃+NP”的语义生成机制研究
情感形容词‘うっとうしい’、‘わずらわしい’、‘めんどうくさい’的语义分析
汉语依凭介词的语义范畴
国内外语用学实证研究比较:语料类型与收集方法
语篇元功能的语料库支撑范式介入