基于语料库的中国英语学习者knowledge 搭配研究
2013-08-20吴建晓
钱 敏 吴建晓
(浙江中医药大学 外国语学院,浙江 杭州310053)
0 引言
自从Firth 于半个世纪前提出至今, 语言学者关于词语搭配的研究一直在不断地发展、深入并取得了显著的成就。 研究者试图从不同的角度、使用各不相同的研究方法去探讨和界定词语搭配。 学者们使用的术语也不统一。 过去的词语搭配研究仅限于学者的自觉,难免带有个人的偏好,具有一定的局限性。 而语料库语言学的兴起为词语搭配的研究带来了全新的理念和研究方法。搭配不再是语言学家头脑里的直觉存在,它是成百上千万词容的语料库连续文本(running text )中的语言使用实体,是数据处理的结果显示。 1961 年, Sinclair 开始了第一个基于语料库证据的词语搭配研究项目。 此后,基于语料库的搭配研究在语言学界展开。 目前,语料库语言学已形成一套研究词语搭配的方法和手段。
1 词语搭配的概念
根据Firth(1957 年)对collocation 的界定:“You shall know a word by the company it keeps” (“由词之结伴可知其词”)[1],词语搭配是指词与词的结伴使用这样一种语言现象。Firth 关于collocation 的观点概括起来大致有四条: 第一, collocation 是指词与词的结伴使用; 第二,collocation 是一种意义方式;第三,习惯性词语搭配的各伙伴相互期待和相互预见;第四,类联接(colligation)是高于词语搭配的抽象。 Susan Hunston “…here it is sufficient to note that collocation is the statistical tendency of words to co-occur.”(这足以说明词语搭配是具有统计意义的词语共现)[2]。
2 国内关于词语搭配研究的文献综述
中国期刊全文数据库的检索(CNKI)结果显示, 1999-2006 共发表以词语搭配为题目的论文53 篇。
卫乃兴(2002 年)的《基于语料库和语料库驱动的词语搭配研究》是近年来该研究领域的代表作,在学界引起了广泛的关注,对搭配研究产生了积极的影响。该文介绍和讨论了语料库证据支持的词语搭配研究的基本方法和主要原则。 作者将基本研究方法分为“基于语料库数据”和“语料库数据驱动”两类。 基于数据的方法以语料库索引为基本依据,在传统的句法框架内对词项的搭配进行检查与概括;数据驱动的方法, 基本上不将句法结构作为主要参照, 而设计和采用一套概念体系、步骤和程序提取和计算搭配词,凭借统计测量手段研究词语搭配的模式,或者采用技术手段提取和计算词丛。 主要原则包括:“以自然发生数据”为基本依据,定量分析与定性分析相结合,采用词语中心的研究方法,以发现词组为目的等四项。 文章首先讨论了词语搭配研究的基本方法,之后概括了研究应遵循的主要原则。
卫乃兴(2003 年)的《搭配研究50 年:概念的演变与方法发展》概述了在过去半个世纪里, 搭配(collocation)概念的演变和研究方法的发展。 主要的理论体系包括弗思学派的概念和研究方法, 米切尔等人的综合法, 韩礼德和哈桑的篇章衔接概念, 博林杰等人的惯例化搭配研究,以及语料库研究方法。 该文讨论了各研究体系的界定特点及其差异,并概括了概念演变的脉络与方法发展的趋势。
濮建忠(2003 年)的《英语词汇教学中的类联接、搭配及词块》从类联接、搭配这两个与词汇知识深度相关的关键层面入手,利用中国英语学习者语料库,指出学习者在词汇知识深度上的问题和不足与未能充分掌握常用词在使用时的典型类联接和搭配直接相关,亦即未能充分掌握词块。 作者进而提出:英语词汇教学的重点之一应置于词块教学。
周明亚(2003 年)的《词语搭配现象与大学英语词汇教学》探讨了词语的习惯性搭配与大学英语中的词汇教学。英汉两种语言的词语搭配习惯受各自语言特征与文化因素的制约或影响。掌握目的语中词语的搭配习惯对外语学习者来说至关重要。教师在词汇教学过程中着重讲授词语的搭配知识,帮助学生掌握词语的正确习惯用法,词汇教学方能取得令人满意的效果。
3 研究方法——基于语料库的方法(corpus-basedapproach)
KWIC 索引是语料库语言学主要的技术手段和方法KWIC, 也是基语料库于数据驱动的学习方法(data-driven-learning, DDL)。 最为常见的索引形式为KWIC (key words in context),即“语境中的关键词”。而索引行(concordance line)则是指关键词及其语境的共现。 语料库软件一般都带有索引功能。 键入关键词后,语料库会自动检索出来包括关键词在内的一定数量的语境词并且关键词居中显示。以关键词为中心左右4-5 个词数构成关键词的“跨距”(word span)。跨距中的词语就构成了关键词的语境。 该语境是连续的文本,可以围绕关键词,从关键词所在行、段落乃至语篇扩展显示。检索可广泛用于英语词汇、语法和语篇的学习。 本文运用AntConc 数据库检索软件对knowledge 在CLEC、BNC 以 及CCAE(Corpus of Comtemporary of American English)三 个 数据库中进行了检索,对knowledge 一词的搭配进行研究,对比分析中国英语学习者与本族语者在使用knowledge 一词方面的特点以及不同水平的中国英语学习者之间的特点。 CLEC 收集了包括中学生、大学英语4 级和6 级、专业英语低年级和高年级在内的5 种学生的语料一百多万词,并对言语失误进行标注。 其目的就是观察各类学生的英语特征和言语失误的情况,希望通过语料库方法对中国学习者英语作出较为精确的描写, 为我国学生的英语教学提供有用的反馈信息。BNC 语料库词数100 百万词,包括各个领域的口语(10%)和笔语语料库(90%)。
4 结果与分析
4.1 CLEC 中knowledge 一词搭配的分布状况
首先,knowledge 一词在CLEC 中共978 次,0.978/千词。 与该词搭配的主要动词有:learn, get, study, know, have, improve, broaden,connect, use, acquire, produce, widen, master, grasp, understand, test,teach, go over, gain, remember, add,open, interpret, examine, prepare,tell, increase, forget, enrich, extend, apply, contribute, turn, enlarge,accept, profit, depend on, need, store, respect, pass, like, offer, dedicate,utilize, share, keep up with, give, expand, enhance, make full use of,deepen, stimulate, advance, own, attain, digest, accumulate, review,absorb, give up, rich, collect, contain, impart, enrich, realize, bump,qualify, pay attention to, cover,inform of, hunt for, spread,confine,thirst for,require,arouse,lose,stand for,show,render,push,match up to,equip with,等等。 从以上搭配可以很明显地看出,CLEC 语料库是关于英语学习者的语料库,大部分是关于学习、掌握知识的。同时,众所周知,中国学生在学校学到的knowledge 是不可数名词,但是在实际情况中又是怎样呢。 在CLEC 语料库中,knowledge 作为不可数名词出现的次数为978,0.978/千词;而作为复数名词来用时,却出现55 次。 大约有90 个搭配动词。 而在BNC 中, 搭配词没那么多, 主要是:test, have,disclaim, use, gain, transmit, acquire, attain, advance, prompt, provide,give……等等。在BNC 语料库中,knowledge 作为不可数名词出现的次数为14352,0.144/千词;而作为复数名词来用时,仅仅出现22 次。 从以上分布频率,我们可以得知,knowledge 一词在CLEC 语料库中出现的频率远远高于BNC 语料库,这与CLEC 语料库的特点息息相关,因为它是学习者语料库,关于学习知识的话题较多。但同时,我们可以看出:(1)中国学生产生的与knowledge 搭配动词非常多,自由多变,缺乏本族语者的搭配限制。 (2)学生过度使用有限的动词词群,并作为搭配词与名词交互重叠使用。 同一组动词与某些名词交叉运用,且通过字面直接进入目的语运用,母语文化特征明显。 相互搭配使用的动词和名词在语料库中都属于高频词,在意义上具有联想关系。 这种特征反映了学生的表述母语文化涵义和交际需求。 如在汉语中,“知识”一词与“学,在某些语问”、“阅读”、“文化”、“识字”具有同义性境中可以交替使用;“知识”可以“吸收”(absorb )、“消化”(digest )、“显示”(digest)、“掌握”(grasp )、“积累”(grasp ), 但这些词一旦被转化为英语, grasp 就显得缺乏意义的针对性并导致语用失误。 第三,学生通过意义解释以及类比和推断选择搭配词, 语用失误来自母语迁移和教学迁移的影响。
表1
4.2 不同水平中国学习者之间的比较
表2
通过AntConc 搜索软件,中学生语料库中,knowledge 一词出现77次,; 大学英语四级学习者语料库中出现311 次; 六级学习者中出现228 次;英语专业低年级学习者语料库中出现176 次;高年级出现129次。这样的分布说明还是比较正常的。中学生英语知识面不大,所以节电词出现频率不高,并且搭配词比较单一,时有错误。大学非英语专业学生随着水平的提高,搭配词越来越丰富,且比较高级,不过同时出现一个问题,那就是搭配词用的太过于自由;相比之下,英语专业学习者的搭配既比较丰富又显示出一定的本族语者的搭配限制。
同理,在运用knowledges 一词方面,不同水平的学习者有不同的特点。 随着水平的提高,knowledges 一词的运用出现递减的趋势,这和BNC 语料库的特点相符合。
5 结语
基于语料库证据和语料库证据驱动的词语搭配研究为语言研究提供了一种全新的研究视角和研究手段。 通过语料库检索,建立类联接,计算搭配词,以真实语料为基本依据,采用语料库的方法,对常用词knowledge 进行了基于语料库证据的实证研究, 展示了语料库语言学方法在词语搭配研究方面的优势,揭示了词语搭配的一般规律,为语言研究和语言教学提供了科学、真实、可靠的手段和方法。 同时,也为翻译和写作教学提供了一个可资借鉴的全新的思路与方法,为正确选用词语表达思想指出了一条有效的途径。
[1]卫乃兴.词语搭配的界定与体系研究[M].上海:上海交通大学出版社,2002:102.
[2]Huston S.Corporn in Applied Linguistics [M].London:Cambridge University Press,2002:12.
[3]李文中,濮建中.语料库索引在外语教学中的应用[J].解放军外国语学院学报,2001(2).
[4]濮建忠.英语词汇教学中的类联接、搭配及词块[J].外语教学与研究,2003(6).
[5]卫乃兴.基于语料库和语料库驱动的词语搭配研究[J].北京:当代语言学,2002(2).
[6]卫乃兴.搭配研究50 年:概念的演变与方法的发展[J].解放军外国语学院学报,2003(2).
[7]卫乃兴,李文中,濮建忠.语料库应用研究[M].上海:上海外语教育出版社,2005:138-139.
[8]卫乃兴.专业性搭配初探———语料库语言学方法[J].解放军外国语学院学报,2001(4).
[9]周明亚.词语搭配现象与大学英语词汇教学[J].外语界,2003(2).
[10]甄凤超.语料库数据驱动的外语学习:思想、方法和技术[J].外语界,2005(4).