APP下载

基于自建教材语料库的DDL词汇学习

2014-06-30马志燕

教育界·下旬 2014年4期
关键词:数据驱动词汇学习

马志燕

【摘 要】本文旨在探讨基于自建《高级职业英语》语料库在数据驱动(DDL)模式下的词汇学习模式,分析了基于《高级职业英语》语料库的DDL模式下词汇学习的具体过程,介绍了利用KWIC分析词汇搭配、近义词辨析、语义韵的词汇学习的具体方式。

【关键词】高级职业英语语料库 数据驱动 DDL 词汇学习

Tim Johns于2O世纪90年代初提出了“数据驱动学习(Data-driven learning,DDL)”的英语学习方法(Johns T.King P,1991)。该法基于语料库,是指在课堂教学中引导学生利用计算机产生的索引(concordance)来对目标语进行检索的教学方法,包括基于索引的各种活动和练习(JohnsT.,1991)。也就是通过“语境共现(key word in context,KWIC)”,把要检索的词置于语境之中展示出来,语料库的使用者通过对大量语境的观察,分析,归纳,从而了解到某一词语,某一句式或某一语法的实际用法,这一过程具有探索性、发现性和自主性,符合当前语言教育的潮流。本文将讨论基于自建的《高级职业英语》教材语料库在数据驱动(DDL)模式下的词汇学习模式。

一、数据驱动学习(DDL)的理论依据

(一)社会建构主义理论。哲学家、心理学家和教育学家和课程设计者常用“建构主义”来强调个体或学生在学习中的重要作用(吴庆麟,2006)。建构主义学习理论认为语言知识的习得并不是知识由教师到学生的单向传递过程,而是学生积极思考、主动选择,在已有信息的基础上对新信息进行探索发现,并与学习环境、学习同伴之间互相作用,重新构建新的知识体系。数据驱动下的英语学习正是重视学习过程、提供良好建构环境的学习模式。语料库为学生提供了大量的带有语境的语料,学生带着问题对这些语料进行观察分析,总结其中规律,不断构建、完善语言知识,而不再是被动地接受传统教学模式中的“规则+例子”的学习方式。应用DDL模式,学习者由知识的被动接受者成为主动探索者,这样学生获得的语言知识会更地道、印象更深、体系性更强、储存更持久。

(二)自主学习理论。Holec(1981)认为自主学习是学习者自我负责管理语言学习的能力,即学习者能够自己决定学习目标,确定学习内容和进度,选择学习方法和技巧,监控习得过程及自我评估学习效果。传统的“填鸭式”英语教学很大程度上限制了学生的个性发展。在DDL模式中,呈现在学习者面前的是一个自然语言的集合体。学习者既可以还原词、词组在口语语料库中的真实语境,又可以在书面语语料库中查看不同类型作品的写作特点。除此之外,学习者还可以根据自己的兴趣和需要结合不同语料库的特点,利用相应的检索软件,来达到自己的学习和研究目的。

(三)语言习得理论。Krashen的“语言输入假说”(input hypothesis)在第二语言习得研究领域是一个具有较大影响的理论(Mitchell R, Myles F.,2004)。Krashen认为,一个人的语言能力主要是通过习得途径而获得的,而第二语言习得则是在自然语言环境下,学习者大量地接触略高于自己现有水平的可理解性语言输入(comprehensive input),自然而然地习得语言。这一理论从质和量两方面谈到了促成语言习得发生的条件。由于语料库中的材料取自实际生活各个方面典型的语言,而不是传统英语课堂上教师仅凭直觉编造的几个例句,这保证了语言输入的真实性;现今所建成的语料库,动辄几千万,甚至上亿词次,这从数量上保证了语言的输入,而且是在不同的语境中反复再现,从认知心理学角度讲,这有利于增加对词语的感性认识和理解 ,加快词语的内化。

二、语料库的应用范畴

(一)语料库作为教学资源。John Sinclair (1991)曾说:“One does not study all of botany by making artificial flowers”,通过内省编造出来的语言例子来研究语言就像生物学家用假花来研究植物一样荒诞不经,自然发生的语言文本即语料库才可作为学习者的语言教学资源。这种资源最大的特点便是自然性,语言学习者可通过观察大量真实语句实例并结合上下文语境来分析语言使用的特定语境并归纳总结,避免孤立、片面地学习语言知识。

(二)语料库作为教学手段。TogniniBonnelli(2001)认为:语料驱动思想的本质在于不承认任何脱离语言事实的理论预设。任何语言学习只能从真实的语言提取使用证据,任何语言学习范畴必须以复现模式及概率分布为基本证据。因此,可利用自建的英语教材语料库和网络语料库结合起来进行教学设计。自建语料库主要可进行主题引入、课文分析、翻译阅读技能训练等一系列教学活动;网络语料库,如COCA、BNC等,可进行重点词汇搭配和语法教学活动以及各种测试练习。总之,语料驱动的教学活动为学习者提供了诸多在做中学的条件和机会。

(三)语料库作为学习工具。随着计算机技术的不断发展和大量基于语料库的软件的开发和应用,各种基于语料库的学习模式不断被提出,其中颇具代表性的是TimJohns提出的DDL模式(data-drivenlearning)和Barbara Seidlhofer(2002)提出的“学习驱动数据”(Learning-Driven Data)。这些学习模式的核心是以学习者为中心,强调在学习过程中进行探索发现并对发现进行自下而上的归纳总结,从而培养学习者自学能力。

三、基于《高级职业英语》语料库的DDL词汇学习

《高级职业英语》教材语料库是由笔者主持建立,以高等教育出版社于2009年出版的《高级职业英语》(Advanced Career English)系列教材为语料来源,该教材分三级,每级含《读写教程》、《听说教程》、《拓展教程》共9册书。《高级职业英语》教材语料库收录了课文、生词、听力文本材料、练习等绝大部分内容,约21万词次。对高职高专非英语专业学生而言,该教材语料库题材丰富、语言规范、规模适中,便于搜索和观察,适合学生进行词汇学习。正如Hunston(2006)指出:教学语料库的优点在于语料均为教材中出现过的内容,学生对其熟悉;而普通语料库收集的语料缺乏针对性,内容陌生,学习难度相对提高。因此,在使用《高级职业英语》语料库检索某一词条时,被检索的词汇将在不同层次的、已往学过的和未来即将学习的语境,以及听力材料和练习材料的语境中反复循环出现,有利于增强学生的语言意识,并有助于他们在短时期内更好地掌握词汇知识。endprint

基于《高级职业英语》语料库的DDL词汇学习多种多样,教师可以根据实际情况灵活使用。比如,教师可以设计学习任务,在语料库中进行相关检索,并适当编辑以凸显学习主题。将编辑后的检索结果通过多媒体展示或印发给学生,提出研究问题,引导学生观察检索结果、解决问题,从而完成对目标词汇的学习。也可安排课外DDL模式的学习,指导学生自行利用检索工具对目标词汇进行检索,观察词汇的使用特点,并辅以小报告、小测验来了解学生的学习效果。具体来说,有以下几种常见的方法与手段。

1. KWIC索引

语料库语言学主要的技术手段是词语索引。词语索引也应是DDL的常用手段形式。最常见的索引形式为KWIC (key words in context),即“语境中的关键词”。索引行(concordance line)指关键词及其语境的共现(甄凤超,2005)。在英语课堂上,老师可以引导学生输入关键词,软件自动检索语料库,将搜索到的关键词提供所在行将索引行提供固定数量的语境词,并以该关键词为中心在屏幕上显示出来。在教师的引导下,学生经过观察讨论,可以发现该词的常用语法结构和意义。

2. 词汇搭配的学习

Sinclair(1991:170)将搭配(collocation)定义为“两个或两个以上的词在文本中短距离内的共现”搭配分析对研究词语行为具有重要的意义。词语与词语搭配不仅对确立句法结构关系起着一定制约作用,而且是意义实现以及消除歧义的基本依据(甄凤超,2005)。因此,通过词汇搭配的学习,学生可以提高语言使用的流利度,表达更地道,摆脱“中式英语”。建立在《高级职业英语》语料库的DDL词汇学习模式中,我们可以凭借该语料库的搜索功能,检索某一词汇在教材中出现的典型搭配,然后引导学生仔细观察索引行,总结搭配规律。

3. 近义词的辨析

学生往往对英语中许多意义、用法相近的词汇感到难以区分,单靠词典给出的解释和一两个例句常常不能清晰地掌握其差别。引入DDL学习模式后,我们在《高级职业英语》语料库中对需要辨析的词分别进行检索,从中找到许多例子,引导学生根据已学到的语言知识对这些语境进行探索归纳,从而区分这些近义词在意义和用法上的异同。必要时,再利用免费的在线本族语语料库获取更多的例证,以便进一步加深印象。

4. 类联接的学习

类联接(colligation)是词语搭配研究中的一个重要概念,指语法范畴间的结合。“类联接不是与词语搭配平行的抽象,而是高一级的抽象”(卫乃兴2002:300 )。类联接是词语搭配发生于其中的语法结构和框架,是“语法范畴之间在句法结构上的相互关系”(卫乃兴,2006)通过建立类联接,可以发现词汇的语法模式。因此在DDL模式下,学生可以观察对于某一词条的检索结果并建立其相关类联接,从而掌握该检索词的语法形式特征。

5. 语义韵的学习

语义韵 (semantic prosody) 是语言的一项重要运作机制,不仅揭示了词项结伴行为的语义特征,还传达了人们通过词汇搭配表达的语用功能(卫乃兴,2006)。有些词汇的使用时总是习惯地、反复地倾向与某一类词汇共现,从而也具有了这一类词的特点,这就使整个语境弥漫着一种特殊的语义氛围,这就是语义韵。语义韵大体分为消极、中性和积极三类。从语义韵学习的角度来说,把语料库引入英语教学是对教学法的一大改进,因为通过语义韵的学习,使学生意识到学习英语的时候,不仅要注意句子的语法要正确,还要注意表达的地道性,避免语用错误,提高表达的精确性,摆脱“中式英语”。比如,在学习“cause”这一明显带有“贬韵”的动词时,教师可以从《高级职业英语》语料库中搜索出具有代表性的语境,学生观察讨论后会发现,其后搭配的宾语频繁出现damage(破坏)、trouble(麻烦)、diseases(疾病)、stress(压力)、problems(问题、麻烦)等消极意义的词,这样学生将了解cause这个词所使用的语义韵,从而正确地使用它。

不管基于语料库对上述哪方面的学习,一般都遵循Tim Johns(1991)提出的DDL的三个步骤:① 提出问题(Identify)。由教师预先提出问题或由学习者自己提出学习过程中产生的疑问。②材料分类(classify)。通过检索工具从语料库中检索出语言数据并进行恰当筛选和分类。③归纳总结(Generalize)。这是整个过程中最重要的一步,即在教师指导下,学生理解、分析并归纳出语言使用规律,解决事先提出的问题。

四、结语

基于语料库的DDL学习模式是一种“颇具吸引力的”有助于提高准确性 (accuracy)和地道性(idiomaticity)的方法(Granger,1998:199),然而由于语料库固有的特点,该模式也有一定的局限性。首先,目前《高级职业英语》语料库只收录了一套高职高专公共英语教材,学习的内容也仅仅覆盖该教材的内容,而不能呈现更大的自然语境。所以在实施过程中,教师在准备DDL学习材料时最好在更大的语料库中对目标词汇进行检索,以弥补单一语料库的片面结果。另外,DDL模式中的练习、活动须精心设计,教师的工作量比较大。这种模式使用过多会太费时,学生容易失去积极性,所以应根据学生的语言基础、观察能力、推理能力和学习内容来使用,教师要充分考虑学生的学习风格,引导他们在DDL学习中使用不同的学习策略。

【参考文献】

[1]Johns T.King P.ClassroomConcordancing[M].Birmingham:University of Birmingham,1991.

[2]JohnsT.Should you be persuaded—two samples ofdata—driven learningmaterials[J].English Language Research Journal,1991(4).endprint

[3]吴庆麟.教育心理学[M].上海:华东师范大学出版社,2006.

[4]Holec H.Autonomy and Foreign Language Learning[M].Oxford:Pergamon,1981.

[5]Mitchell R, Myles F. Second Language Learning Theories[ M].London:Hodder Arnold, 2004.

[6]SinclairJ.Corpus, Concordance, Collocation[M]. Oxford: Oxford University Press,1991.

[7]TogniniBonnelli E.Corpus Linguistics at Work[M]. Amsterdam:JohnBenjamins, 2001.

[8]Seidlhofer B. Pedagogy and local learnercorpora-working withlearning-driven data [A]. In Granger S. Hung J. &Petch-Tyson S.(Eds.) Computer Learner Corpora, Second Language Acquisitionand Foreign Language Teaching [C]. Amsterdam/Philadelphia:John Benjamins Publishing Company,2002:213-234.

[9]Huston,Susan.Corpora in applied linguistics[M]. Beijing:World Book Publishing Company,2006.

[10]甄凤超.语料库数据驱动的外语学习:思想、方法和技术[J].外语界,2005(4).

[11]卫乃兴.语义韵研究的一般方法[J].外语教学与研究,2002 (4 ):300-307.

[12]卫乃兴.基于语料库学生英语中的语义韵对比研究[J].外语学刊,2006(5).

[13]Granger,S.The Computer Learner Corpus:A Versatile New Source of Data for SLA Research[A].In S.Granger (Ed.).Learner English on Computer[C].New York:Longman,1998.endprint

猜你喜欢

数据驱动词汇学习
也谈I’m finished的意义
基于网络与数据智能化的数码印花产品设计定制模式研究
基于智能移动终端设备的英语词汇移动学习可行性分析
数据驱动理念在大学英语课程中的应用