基于语料库COCA的大学词汇教学实证研究
2019-09-10王琛莹
【摘要】词汇是外语学习的基石,在如今的大学英语课堂中如何在有限的课堂时间提高词汇教学的广度和深度是急需解决的问题。文中以语料库语言学理论为基础,用美国COCA语料库为工具,通过教学实践,证实了语料库驱动学习的方法应用于大学英语词汇教学中能够有效提高学生的词汇能力。
【关键词】词汇教学;COCA语料库;语料驱动学习
【作者简介】王琛莹(1990-),女,汉族,蚌埠医学院公共基础学院外文教研室,助教,研究方向:英语教学法与语料库语言学。
一 、引言
词汇是外语学习的基石,正如英国语言学家Wilkins所说,“没有语法人们可以表达的事物寥寥无几,而没有词汇人们则无法表达任何事物。”由此可见,词汇习得是二语习得中重要的一环,它贯穿着学习者外语学习的始终。词汇教学一直是英语教学的重点,不管是大学听说还是读写课,都会涉及一些重点词汇知识的讲解。但是目前我国大学英语词汇教学遇到了一些问题,即教师教授的单词虽然覆盖全面,但由于教学时间有限,往往缺乏深度,这就导致了英语学习者的词汇学习往往只停留在掌握单词的形式和汉语意义,忽略了其在真实语境下的常用搭配,多义性,语体特征等多个层面的信息,这就使得英语学习者虽然花费大量时间记忆单词,但是收效甚微。而词汇学习得不到正向反馈会进一步导致英语学习者对英语词汇学习丧失兴趣和信心。因此,探索新的词汇教学方法就显得尤为重要,尤其是在当今的大数据时代,结合现代计算机技术和语料库为词汇教学探索出更有利于教师教学以及学生自主学习的新方法。
二、理论背景
数据驱动学习。语料库是自然语言构成的资料库。Laufer认为语料库是“由大量收集的书面语或口头语构成,并通过计算机储存和处理,用于语言学研究的文本库。”語料库中存放的是在语言的实际使用中真实出现过的语言材料。语料驱动学习(data-driven learning)是由Tim Johns 首先提出来的把语料库引入英语课堂的一种新型教学模式。其深层理据是“有成效的语言学习是一个语言探索过程,而语境共现则为激活归纳式的学习策略提供了前所未有的条件。”这对于英语学习者来说至关重要,由于英语学习者平时很少能够接触到真实的语境,所以大量的非真实语料的输入就容易导致其在词汇输出时产生各种错用混淆。语料库主要通过语境共现(concordance)给英语学习者提供大量真实的语言学习材料,有助于英语学习者了解词汇的搭配,语义韵和类联结,这三者决定了英语词汇学习的深度。正如Laufer认为“词汇的学习不只是熟悉新词,完成量的积累,它还包括深化已知词的知识。”所以在词汇学习中,深度和广度都需要得到重视。语料库以数据为基础,频率为索引,帮助外语学习者掌握词汇在最真实语境中的最地道的用法,为英语课堂的词汇教学开辟了一条新道路。
三、研究设计和实行
1.COCA语料库。本试验采用的语料库COCA-美国当代英语语料库(Corpus of Contemporary American English)是由美国Mark Davies教授开发的高达3.6亿词汇量的美国最新当代英语语料库,是当今世界上最大的英语平衡语料库。其规模、速度和词性标注满足了一个好的语料库的三大特征。而且COCA语料库采集的是从近十几年(1990年-2007年)美国本土各个领域的语料,涵盖了这一时期美国的小说,口语,报纸,流行杂志和学术期刊,并且在此后每年进行至少两次的语料库更新,尽最大的可能保证语言的即时性,这是明显优于其他语料库的地方。故此次教学实验选择了COCA语料库作为语料的来源。
2.实验设计。实验对象:由于蚌埠医学院在新生入学后就会进行根据高考英语分数进行分级教学。所以本次实验选取的是同一英语等级的,也即是2017级的大二英语三级的学生,他们的英语水平并无明显差异。从三级班中抽取两个平行班,一个设定为实验班,一个设定为对照班。其中实验班有学生65人,对照班有学生63人,共计128人作为实验对象。
实验方法:在实验班采用以数据驱动学习为理论指导的英语词汇教学,也即是在课堂上对于大学英语选用教材新视野大学英语(第三版)第三册里的词汇学习时采取基于COCA语料库的英语词汇教学模式。为尽可能地确保实验的准确度,对照班使用同样的教材而且提供相似的教学材料,但是针对词汇的教授采取传统的词汇教学模式,也即是以课堂上的词汇意义和例句讲解为主。在这两个班级中进行为期一个学期也即15周的实验。
3.实验过程。在进行课堂教学前,根据课程大纲和教学进度以及教学设计选取出本单元需要让学生着重掌握的单词和词组,在课堂教学前采取语料库在线检索关键词得到语境共现资料,在课件设计时加入这些资料,然后运用到课堂词汇教学供学生进行讨论和学习。通过这种直观的展示,可以让学生主动总结并掌握所学词汇的常见的搭配,能够辨析同义词的区别和其语义韵,从而加深他们对于所学的单词和短语的认知。下面用实例来简要说明COCA语料库怎么应用于课堂实际教学的。
(1)搭配。在英语学习中,有一类词语搭配(collocation)他们既不属于词组范畴,在字典中也查找不到,但是在英语里有自己固定的搭配与表达,并在真实的语言环境下发挥有效交流的作用,这些搭配的掌握与否对于外语习得的成功有着至关重要的影响。语言学家们也早都注意到了这种语言现象,在20世纪90年代语言学家Michael Lewis把这类搭配归类到词块(lexical chunk)中,所谓词块是“形式”和“功能”的联合体,是一串预制的连贯或不连贯的词或其他意义单位,它整体存储在记忆中,使用时直接提取,无须语法生成和分析。词块可以加快语言处理的速度,对于语言习得和语言输出有促进作用。而在此之后国内外的学者经过大量的实证研究证明词块的掌握程度对于英语学习者的词汇习得发挥着至关重要的作用。而语料库恰好能够为词汇教学提供一个平台,使得学生能够了解并掌握一些常用的词块搭配并知道他们如何在真实语言环境下使用,这种教学方式能够让学生的注意力从个别单词转移到词块这个较长的词法结构上来,这样英语学习者对于搭配的掌握不是孤立的碎片化的,而是整体的相互关联的,这样对其用法会有更深的认识和理解,便于长期记忆。
以课堂即兴翻译为例,当学习到一个新词汇ambassador(大使)时,让学生翻译句子: “他是驻联合国的前任大使。”绝大部分学生会翻译为:He is a former ambassador in UN.但当打开COCA语料库界面输入ambassador并勾选其后面的介词搭配时,搜索后的结果如下图可见,可以很清晰地看到ambassador后面搭配频率最高的介词却是“to”,频次达到了4001次,远远超出加in的介词搭配。这就说明了在英美国家的实际应用中,驻某国大使常用搭配应该是to。
还有在实际写作和翻译中,很多学生在描述对于某事的态度中会在attitude(态度)后面加at和to ,实际上在我们在检索以后会发现attitude后面常用的搭配只有toward。掌握这些基本的词汇搭配对于英语学习的有效性和准确性来说至关重要。
(2)词汇的多义性。在英语词汇中,由于语言的变迁和发展,一词多义的现象非常常见。英语单词逐渐由词语原本的意思迁移出不同的意义。前者称为本义,后者称为引申义。掌握词汇的多义性对于扩大学生的词汇量有着非比寻常的重要性。词汇量的大小不仅仅指掌握单词的个数的多少,也包含掌握单词词义的数量。就词汇的产出性而言,常用词汇多义性的习得显得更加重要。在大学英语词汇教学中,以语料库为平台,通过真实展现英语词汇在不同语境中的意义可以帮助英语学习者认识到常用词的一词多义现象,提高他们的意识,并逐步引导学生自主发现词汇的多义性,扩大有效词汇量。
比如单词claim,大部分的学生都知道它有声称、要求的意思,但通过KWIC搜索以后学生们可以发现会有如下句子:
Her heart had been rubbed raw in the time it had taken leukemia to claim her young husband’s life.
She already trembled with the weakness of the first stage of the disease that would claim her life within two or three more days.
通過语料库展现的例句,可以发现claim还有一个学生不熟悉但是实际在英美国家很常用的意思,也即是“夺走某人的生命”。通过这种方式,学生可以快速并且高效地掌握一些常见词或者高频词的不常见的意思。
(3)语义韵。语义韵(semantic prosody)最早是由Sinclair创立的,Stubbs把它定义为超越单个单词界限的隐含意思的扩散。语义韵一般被划分为三种:积极语义韵,消极语义韵,和中性语义韵。一个单词或短语的语义韵是在长久的使用中形成的,比如go through 这个短语,如果我们在COCA语料库中搜寻其后面的搭配和常用词,我们可以发现pain, difficult是比较高频出现的词,由此我们就可以判断,go through这个短语的语义韵应该是消极的。因此,学生不仅可以掌握短语的意义,同时也可以在写作和翻译中更加正确自如地进行运用。
四、实验结果分析
通过一个学期的学习,最后对于实验班和对照班分别采用基于Paribakht and Wesche (1996)提出的Vocabulary Knowledge Scale (VKS)给学生做一个词语能力测验,共计25个书中抽取的单词。其中VKS对于单词的熟悉程度分为五个等级:完全不认识;见过但不知其意义;见过这个单词,但对其意思不太确定;见过这个单词,确切地知道它的意义;对这个单词非常熟悉,不仅知道其意义,还可以熟练地使用它。并且对于五个等级分别赋予分值: 0分,1分,2分,3分,4分,对于最后的测试分数用SPSS进行统计分析。得到结果如下:
从表1结果我们可以看出实验班和对照班在测试后平均分分别是80.79和75.05,实验班高于对照班。并且从表2的t-检验中我们也可以看到试验后两个班的词汇掌握情况有了显著差异(p=0.034,p<0.05)。这就能说明在实验班经过一个学期的基于语料库COCA的词汇学习后,学生的词汇成绩比对照班有了显著的提高。
但是本次实验还有不足之处和有待改进的地方:首先,实验的时间过短,只有一个学期,有可能没有完全展现基于语料库COCA的词汇教学法的效度。其次,实验中一些变量无法完全控制,虽然教师课堂上对实验班学生采用了词汇教学法实施课堂教学,但是课后学生学习的时候无法监控他们是否采用了其他的词汇学习策略,以及无法评测学生课后词汇学习时间投入的多少对实验结果的影响。下次的实验中可以采用访谈和问卷调查的方法剔除这些变量的影响。使得实验结果趋于真实。
五、结论
数据驱动的语料库对学生和老师来说都是一种挑战。作为教师,要帮助学生养成用语料库学习单词的习惯,培养他们使用语料库解决问题的能力。另一方面,学生必须主动地改变自己以往课堂教学中知识信息接收者的被动角色,不断进行课后反思,这样在实际的学习中才能达到事半功倍的效果。
参考文献:
[1]Wilkins D.. Linguistics in Language Teaching[M]. London:1, Edward Arnold,1972:111.
[2]Laufer B.. The Development of Passive and Active Vocabulary in a Second Language :Same or Different?[J]. Applied Linguistics,1998, 19(2):255-271.
[3]Sinclair J M, Renouf A.. A Lexical Syllabus for Language Learning [M]. McCarthy M J.. Cater R A. Vocabulary in Language Teaching. London; Longman Croup UK Limited,1998:148.
[4]Sinclair J M.. Corpus, Concordance,Collocation[M]. Oxford: Oxford University Press,1991:170.
[5]Stubbs M.. Text and Corpus Analysis[M]. Oxford: Blackwell Publisher,1996.
[6]Wesche, M., & Paribakht, T. S.. Assessing Second Language Vocabulary Knowledge: Depth versus Breadth[J]. Canadian Modern Language Review,1996,53:13-40.