基于语料库的数据驱动学习理念在外语教学中的应用
2023-01-05邹艳丽
张 琦,邹艳丽
(长春师范大学,吉林长春,130123)
语料库语言学是利用计算机技术,对巨量真实语言或语言变体进行系统地描述和探究,包括其语言特征、语境意义、语用功能等。借助计算机的检索优势,直观地观察界面和巨量的语言信息使得语料库语言学成为语言研究与教学的主要手段之一[1]。数据驱动学习(Data Driven Learning)是 Tim-Johns(1991)等人,基于英国伯明翰大学语料库语言学创始人John Sinclair主导的Collins COBUILD研究项目的研究成果提出的语言学习理念,其核心是利用信息化技术手段,基于大量的语料库数据,让学生通过观察、概括,归纳出语言使用现象[2]。数据驱动学习理念凸显语料库在辅助语言教学和培养学生的自主学习能力、研究能力和利用现代化信息技术能力方面的优势。在语言教学中,使用这一学习法的主要目的有两个:首先,语料库语言学强调意义与功能存在于语境之中,因此,从学习内容上看,通过索引行可以使学生更直观地通过上下文探索发现语言的形式、意义和功能[3];其次,从学习和讲授方式上,这种学习方法强调以学生为中心,挑战了以教师和教材为中心的传统外语教学理念,换句话说,数据驱动学习要求教师不直接和明确地向学生传递信息和知识,而是作为引导者和合作者,控制教学流程,以研究探索的方式配合学生知识的输入和产出。这种语言学习方法符合以学生为中心,教师为主导的教育方针,有利于锻炼学生发现问题和独立思考的能力。数据驱动学习提出之初,并没有得到广泛的认可,随着计算机技术与语料库技术在外语教学中的应用与普及,数据驱动学习的重要性日渐显现[4-5]。本文首先简要回顾数据驱动学习的概念和特点,结合Sinclair的词汇语法理论,介绍数据驱动学习具体实践步骤,在此基础上,着力评述并总结此学习理念在国内外的研究和实践现状,最后探讨这一理念应用于实践需要解决的问题及其未来的发展趋势。
一、数据驱动学习理念与特征
语料库语言学的特征是从巨量真实文本中通过频次、搭配和索引行三个方面观察语言特征。建构主义学习理论认为,语言知识的习得不是从教师传授到学生的简单过程,而是由学生自己发现和探索的过程[6]。教师需要构建起新旧知识之间的联系,并引导学生在已有的知识经验和认知结构上进行正向迁移,促使学生自主探索动机的形成,从而掌握新知识。而基于语料库的数据驱动学习理念正具备了以上特征。首先,这一学习理念通过语料库索引行以真实语料为语言输入。其次,数据驱动学习理念要求以学习者为中心,以自主学习为主,学生在学习过程中自我管理、自我监察和自我评估。最后,这是一种自下而上的归纳式学习方法,学生需要从大量的语言数据中找出规则,这一过程不仅可以加深他们对语言知识的理解,还会训练他们从现象找到本质的探究能力[4]。
Sinclair提出的词汇语法理论包括节点词、搭配、类联接、语义倾向、语义韵五要素[7],是语料库语言学研究的基本组成部分。因此,数据驱动学习的实施方法也对应这五个层级体系。具体说来,主要包括以下几个方法和步骤。
检索节点词(node word)和观察索引行(concordance):这一方法主要通过把目标语料文件导入语料库分析软件,检索节点词,界面呈现出索引行,学生们可以直观地通过检索结果观察到节点词出现的频次、所在的上下文,推导出其语境意义与功能。
分析搭配(collocation)与类联接(colligation):搭配的学习主要是根据语料库语言学的短语理念,通过频次和语境意义的分析去认识语言的共现特征。Sinclair将搭配定义为“两个或两个以上的词在文本中短距离内的共现”[8],即同时共现的词项具有语境意义;卫乃兴提出的搭配概念强调了频次特征,“在文本中实现一定的非成语意义并以一定的语法形式因循组合使用的一个词语序列,构成该序列的词语相互预期,以大于偶然的几率共现”[9],也就是统计学意义上的搭配。而作为语料库语言学中词语搭配的一个重要概念,类联接指语言在词汇语法范畴间的结合,即词与语法的共选关系。语料库语言学研究运用类联接来描述横组合层面上的语法结构,“类联接不是与词语搭配平行的抽象,而是高一级的抽象”[9-10]。例如,“turn a blind eye to”体现的是“turn+a+ADJ+NOUN+to”这一词汇语法结构,即类联接。语料库根据频次的高低,给出适用于真实语境的词汇搭配,呈现其语境意义,这一学习方法可以使学生习得更地道的语言表达方式。
认识语义倾向(semantic preference)与扩展语境(semantic prosody):Sinclair提出,意义单位由一个主体词和常与这个词共现的一类词构成,具有较为稳定的语义特征,这就形成了语义倾向和语义韵[7]。通过语义韵能表达出说话人的观点和态度。因此,认识并学习语义倾向和语义韵,可以在避免按照语法规则生造搭配的同时掌握准确恰当的语言形式进行交际[11]。
以上基于数据驱动学习的系列操作可以让学生在看到大量真实的语言样本的同时,做到身临其境,依此策划的课堂教学和语言学习,体现了现代教育的信息性和高科技性,理论上将可以提高学生的探究、归纳和自主学习能力。但将它们运用到外语教学的实践过程中,有收获也有困难。
二、数据驱动学习理念的探索与实践
数据驱动学习理念自提出之日起就有许多专家学者进行了探索,其在高等教育阶段主要集中在通用英语、学术英语及翻译技能教学三个方面。
(一)数据驱动学习与通用英语教学
Hutchinson&Waters把外语教学分为通用英语(General English)和专门用途英语(English forSpecific Purposes)两大类[12]。通用英语的教学集中在培养学生听、说、读、写、译的语言技能,旨在提高学习者的语言交际能力。基于语料库的数据驱动学习方法可以满足通用英语教学的多方面需求。何安平在《语料库语言学与英语教学》一书中提出,语料库可以应用于写作、阅读、语法、词汇等各个课型[13],并给出了详细的教学设计。在此基础上,唐洁仪、何安平首次将语料库运用到英语专业学生的课堂中,让师范生学习语料库语言学理论知识,参与语料库建设过程,并且对自建语料库进行对比分析,提高师范生自身语言教学和研究能力[14]。隗雪燕、王雷把教学研究重心放在写作评阅中出现的问题上,利用写作学习语料库对学生的习作进行评阅,取得了良好的效果[15]。何安平、陈文宜在阅读教学上进行了尝试,通过自建教材语料库,利用AntConc软件设计预读、预测、语境猜词和快读等情节,提供了可行性较高的阅读微型技能教学设计[16]。甄凤超、王华通过教学实践发现,在语法课中,学生能运用语料库从语境共现中归纳语法结构相同特征,分析语法结构模式及其表达的意义,总结并掌握新知识[17]。基于数据驱动学习在通用英语中的实践重点还体现在词汇教学中。词汇一直是外语语言学习的重点,学习者对词汇的掌握程度直接影响其听、说、读、写等各项语言技能,而基于语料库提供的真实语境,学生可以掌握理解更多词汇。鉴于此,与语料库相结合的词汇教学研究也颇具多样性。国外的 Willis[18]首先对 Sinclair和 Reunof的思想进行了提炼,提出了词汇大纲的设想,为词汇教学做出了铺垫。鉴于此,Coniam、Okamoto通过整理教材中的词汇与一般语料库对比,发现测试教材中呈现的词汇倾向不平衡,词汇在语义、用法和难度上存在的局限性[19-20]。国内的相关研究更多关注词汇搭配,如,濮建忠从类联接、搭配这两个与词汇知识深度相关的关键层面入手,表示英语词汇教学的重点之一应置于词块教学。其他众多学者也从单个词的使用特点出发进行个案研究,或针对一种词汇搭配型式进行共时和历时对比研究[22-25]。综上所述,对于外语技能的练习,语料库可以提供更加直观、准确的辅助和参考,而教师作为课堂的组织者和指导者,需要在不同的课型中灵活改变教学方法,适当运用语料库工具,激发学生兴趣,提高教学效率。
(二)数据驱动学习与学术英语教学
专门用途英语根据不同的目的分为学术英语EAP(Englishfor Academic Purposes)和 应 用 英 语EOP(English forOccupational Purposes)。学术英语主要强调通过学科特有的语言规范和话语策略与学术共同体沟通,其目的是实现学术交流,彰显学术创新,提高学术声望等[26-28]。
学术写作是目前数据驱动学习的重点研究和实践领域之一。剑桥大学的Maggie Charles[29-30]致力于学术英语写作的教学改革,开创性地为学生设置了每周固定的语料库课程,要求学生学期结束后评估语料库对他们写作或词汇上的帮助,最初和最终的问卷中90%以上的学生表示数据驱动学习对学术写作的学习有积极作用,可见,有针对性的、合理的课程设置有助于学生语言能力的提高。国内也有很多专家学者专注于试行语料库应用于学术英语教学,如,对比中外学生学术语篇某一类词的使用情况[31-32];探索学习者短语框架的使用特征[33];归结学术论辩与话语实践随社会文化等语境变迁发生变化的原因等[34],这些研究通过语料库研究方法总结语言发展特征,旨在为教学实践提供参考。总之,在学术语篇写作领域,基于数据驱动的学习方法已经成为教学设计和课堂教学的重要依据和教学的目标导向。
(三)数据驱动学习与翻译技能教学
随着机器翻译的普及,语料库提供的统计学建议开始受到重视,翻译中使用的平行语料库可以为翻译教学提供翔实的语言实例,提高翻译的准确性[35]。Mona Baker[36]率先将语料库与翻译教学结合,随后,国外学者如Olohan[37]、Gallego-Hernández[38]对语料库所提供的索引行资源、共现实例及其重要意义进行了讨论。国内学者也从翻译教学设计、师生互动模式等方面提出了改进意见,并给出了语料库辅助翻译教学的实施方案[39-40]。由于口语的转录工作比较复杂,基于语料库的口译教学相对滞后,虽然还没有实践,但随着口语语料库的建成,将数据驱动学习引入口译教学课堂为期不远[41]。总之,语料库为翻译教学与研究提供了参考与线索,有着极其重要的价值。
在语言教学的各个阶段,数据驱动学习的相关研究面向不同的群体进行了广泛的实验和实践,以上三个方面仅为具有代表性的教学领域,不能囊括所有数据驱动学习的历史和基于语料库的教学研究与实践的应用和创新。
三、实践中的问题与建议
综上所述,国内外的学者和教育工作者对数据驱动学习理念和实践进行了深入广泛的探索,在此基础上得出相似的结论和教学启示。如,充分利用语料库数据,将教材编写建立在自然发生的语料基础上;对比学生与本族语者语言运用的差别,检索高频使用搭配,帮助教师和学生掌握地道的词语搭配行为;同时,在词汇教学中,不因过分关注学生词汇量的大小而忽视词汇的语境意义,而是积极运用语料库检索惯例性词块,学会在语境中高效记忆单词;根据不同的课型和授课目标恰当运用语料库工具,提供沉浸式语境,寻求基于数据的、有创新性、有挑战度的教学方式。合理运用数据驱动学习方法,可以充分调动学生的积极性,发挥学生的能动性,给学生足够的思考和表达空间,培养发散思维,提高学生手脑并用能力,达到既定教学目标。
在语言教学中,任何方法应用于实践都要突破一些阻碍,基于数据驱动的学习亦是如此。许多教学研究实践发现不同阶段的学生对语料库技术的接受程度会影响其在学习过程中发挥的作用。学生的语言能力和水平越高,对数据驱动学习方法的掌握效果越好,而语言水平较低的学习者对这一方法的接受情况并不理想[30]。针对这一问题,很多学者提出了有针对性的“微本”概念[42-44]。这一策略主张将在语料库中检索并筛选过的文本带到课堂上与学生讨论,循序渐进地进行亲自操作,让学生更轻松地掌握数据驱动学习方法,熟悉语料库原理和功能,加快学习进度。因此,在数据驱动学习的课堂上,教师既要具备基本的语料库语言学理论知识和语料库工具的使用方法,也要在运用数据驱动学习教学方法时,引导学生合理安排使用语料库进行自主式探究,对不同语言实例背后所蕴含的功能理据进行深入浅出的讲解,让学生足够熟悉这种学习方式,提高学习兴趣及综合运用语言的能力[45]。这对任课教师的前期知识储备、备课投入及课堂掌控和协调能力无疑是一项挑战。
在科学技术的推动下,语料库语言学研究以燎原之势不断发展,基于语料库语言学的外语教学研究与实践也得到广泛的重视和应用。在信息技术高速发展的时代,数据驱动学习方法有望成为主流。对于学生而言,利用语料库工具可以解决许多不确定的词汇用法、句式表达等问题。对于教师而言,基于数据驱动学习的教学模式,有助于实现“两性一度”的教学目标。需要指出的是,尽管数据驱动学习是很多专家和学者提倡的教学法,但依旧处于探索和试用阶段,仍需要广大师生大胆尝试,充分利用一切语料库资源,深入地进行数据驱动学习教学研究,为外语教学拓宽道路。