APP下载

基于四六级语料库的大学英语自主学习

2016-05-14王大鹏

校园英语·上旬 2016年5期
关键词:语料库题型词汇

一、四六级语料库的理论建设依据和意义

虽然应试教育的弊端近年来被学者、专家广为诟病,但考试依旧是考察学生在各个阶段学习水平和能力的主要手段。对于非英语专业的大学生来说,大学英语四、六级考试(CET-4 and CET-6)是大学阶段最为重要的英语水平能力测试。目前的语料库多为研究连贯的篇章,而对于考试题这种很多单句、填空、选择形式的内容则研究不多。目前,国内尚未发现正规的、具备规模的、公开的题库型语料库,只有一些语料库学者自建了一些小规模的四六级阅读或完形填空语料作为实验语料库,但收录题型并不完整,规模也不大。因此,本研究基于计算机、依据语料库的研究方法建立大学英语四级、六级题库型语料库,统称为“渤海大学英语四六级语料库”。旨在帮助非英语专业的学生利用语料库的方式更准确、快速的总结出两大考试题中的词表(Word List)、搭配(Collocation)、类联接(Colligation)和考题规律等相关信息,并且将四六级语料库引入大学英语教学,改变以往传统、主观的教学模式,把实证研究引入课堂教学。本研究对于我国大学生迅速提高英语水平、顺利通过大学英语四六级考试有无法估量的优势和作用,将会为我国大学英语教学注入新的元素。

二、具体研究内容

渤海大学英语四六级语料库下设大学英语四级、六级两大子库,各自独立,又合而为一。建设原则是,收录1990-2011年所有题型,基于XML的基本模式建设本套语料库,填空式答案用X标记、并填于原题空缺处,以此来补全篇章。“听力部分”做了听力语音转写,把音频中的语音都转写成可阅读的文字,从而帮助学生研究听力中的高频词汇和搭配。本库每隔5年系统、全面的更新一次,为可更新的动态语料库。建库完毕后,将自建语料库引入课堂教学,实验对象为渤海大学2014级A班学生,具体研究内容如下:

1.高频词表。语料库语言学对传统语言学的研究方法提出了挑战,传统的词汇研究强调“广而全”,而基于语料库的词汇研究强调研究高频和语篇覆盖率广的词汇。因此,基于语料库的题库首先要研究的是高频词表。即得出大学英语四级、六级的两个高频词表。词表源于真实考题,学生首先应该掌握在历年考试题中多次出现的高频词汇。本词表基于语料库统计软件Wordsmtih或Antconc,通过设定Stop list去除功能词,从而得到考题中高频出现的实意词汇。

2.高频搭配。不同等级的考题必然有其规律和特点,在固定搭配的考察上有其明显规律。本研究基于此题库型语料库研究其词语共现的规律(Co-occurrence),通过跨距调整(Span)和Cluster功能来统计两大英语考试中的两词、三词及四词搭配。所有搭配在统计出其生频数的基础上再计算其搭配强度,最后得出两套搭配词表——生频数搭配词表和按搭配强度高低排列的搭配词表。

3.词语和搭配的题型覆盖率。本研究的一大特色是不仅统计考试中的高频词汇和短语,同时统计其在题型中的覆盖广度。即某一词汇在近20年的考题中出现了多少频数,这些频数又是如何分布在各个题型中的。如:较多的出现在听力中,还是较多的出现在阅读中,分别是多少频数。通过对词语和搭配在不同题型中的分布研究,可以精准的发现词汇和短语的语域分布特点。题型大体可以分为:听力、词汇与语法、完形填空(或十五选十)、阅读、翻译等几大类。学生可以通过掌握词汇和搭配在不同题型中的分布规律,有的放矢的掌握该题型中的高频词汇与短语,从而迅速提高应试能力。

4.统计类联接。本研究的层面不仅局限于文字表面,由于本套语料库采用了词性标注,因此可研究和总结出高于词语层面的类联接信息,即某词较多的与哪类词性的词汇进行搭配。通过更高一级的概括总结考题中词语的运用规律,搭配是从“横向”的角度研究词语的共现,类链接是从“纵向”的角度总结词类之间的搭配特点。最终可以统计出考试中的高频词主要与哪些词性的词进行搭配。

5.语义韵研究。语义韵(semantic prosody)是以通常搭配形式出现的词项展示出与其它词项的联系、自身的含义以及蕴涵的假设,其大体可以分为积极、中性和消极三类。两大等级考试在考察词汇的时候,语义韵规律的考察也是非常明显的。如:某个词在多年的考题中多与消极含义的词汇搭配。到此,对于考题规律的总结可以说基本上可以满足应试的需要。学生用基于语料库的方式从更加纵深的角度掌握了四级、六级的应试规律。

三、基于题库语料库的自主学习

以渤海大学分级教学A班为实验对象,培养学生掌握语料库语言学的基本概念和基本操作,可以使学生自主利用四六级语料库进行基本检索和学习;教师可以将基于语料库的数据变成大学英语课堂教学的一部分,从而改变以往的教学模式,这是本研究的一个最重要的目的。因为,在目前的大学英语课堂教学中,教学内容里不可避免地参杂了授课教师的主观信息,有些是基于经验,缺乏一定的条理性和规范性,甚至可能是谬误。这一现象使得授课教师对于两大英语等级考试的考试重点、高频词表和短语等重要信息的分析还存在大量不客观的因素。同时学生自主学习的积极性还存在一定问题,因而会常常反映课堂所学与考试结合不好或所学的东西无用。本研究的目标是在教学方面进一步帮助教师完整和规范教学内容,同时鼓励学生提高自主学习能力,学会独立使用语料库进行基本的检索、提取信息和学习;为大学英语课堂教学注入新的元素——语料库。同时将这一主题扩展为数据驱动学习,引导学生利用电脑或移动设备进行课下自主学习。

学生自主学习是在教师的指导下,学生根据自己的学习内容、方向和基础等问题自觉的制定学习目标和计划,选择适合自己的学习方式和学习材料;激发内心学习的欲望,把外界逼迫我学习转变为我要学习。其中自主学习的精髓强调的是兴趣和内在驱动。相关理论很多,这里不多熬述,但自主学习如何和基于语料库的数据驱动学习相结合?如何把语料库和具体的英语课堂教学结合起来?具体实施步骤如下:

1.培养学生对语料库的兴趣。语料库是基于计算机平台的产物,其特点就是精度高、速度快。很多疑难问题都可以在语料库中得到答案。首先在大学英语教材中挑选一些具有争议性的知识点,让学生讨论。然后在教师的示范和指导下利用英语本族语者语料库BNC和COCA帮助学生找到答案,同时用自建的大学英语四六级语料库提取本知识点的相关考试信息,通过语料库的对比研究,从英语实际语用和考试考点两方面共同研究某一知识点。这样便可激发学生对新兴事物(语料库)的兴趣。学生会发现语料库给出的数据远远比老师给出的答案要更加翔实、客观,从而认识到语料库的作用和意义。

2.培训学生学会使用语料库。语料库的使用需要具备一定的技能,比如检索、制作词表等技能。应用多媒体教室或机房给学生做生动、直观的演示,在培训过程中应用大量真实地道的例子,通过教师演示不但可教会学生使用语料库,更能进一步激发学生对语料库的浓厚兴趣。

3.教会学生自主使用语料库。当学生大致了解语料库以后,教师需要给学生明确使用语料库的方向性。计划参加大学英语四级、六级的同学,如何在明确自己的学习方向后,自主使用自建的四六级语料库。通过本库自主提取高频词表、搭配等和英语等级考试有关的信息。通过语料库提供的大量客观翔实的参照数据驱动学生自主学习英语,掌握考试的考点和核心词汇,从而真正转变学生的学习动因和教师的主导地位,把自主学习和语料库数据驱动学习完美的结合起来。

4.将语料库与英语课堂教学结合起来。把英语课堂教学和语料库数据提取有机的结合起来,课堂知识的输入主体由教师转变为语料库。将基于语料库的四六级相关信息引入课堂教学,使之成为课堂教学的一个部分,彻底改变传统英语课堂教学中以教师输入为主的模式。

四、结语

基于语料库的研究要多样化,不应只集中在某一个领域。语料库建设方面要避免低层次的重复,最大限度的实现资源共享,同时注重技术方法培训,是我国语料库语言学今后发展中需要重点解决的问题。本研究开创性的建设了具备规模的、全面的等级英语考试语料库,并与实践教学相结合,既有理论高度,又有具有实际意义。语料库、数据驱动学习、自主学习、学习共同体、移动学习等诸多概念同属一个超学科范畴,相信在未来会有更多研究者在本领域取得更大的成就。

参考文献:

[1]王大鹏.XML在语料库建设中的应用——以UAM Corpus Tool为例[J].电子测试,2013(16).

[2]Stubbs,M.Text and Corpus Analysis[M].Oxford:Blackwell,1996.

[3]王大鹏.国内语料库发展现存问题与分析[J].渤海大学学报(哲学社会科学版),2013(3).

[4]李文中,濮建忠,卫乃兴.2003上海语料库语言学国际会议述评[J].解放军外国语学院学报,2004(1).

项目1:省社科联2015年度辽宁经济社会发展立项课题:《基于等级英语语料库的大学英语自主学习探究》,课题编号:2015lslktziwx-06。

项目2:2015年辽宁省社会科学规划基金重点项目:《构式语法理论视域下现代汉英习语变异研究》,项目号:L15AYY001。

作者介绍:王大鹏,渤海大学副教授,硕士研究生(毕业于大连理工大学),研究方向:语料库语言学。

猜你喜欢

语料库题型词汇
常见数列创新题型归纳
基于语料库翻译学的广告翻译平行语料库问题研究
运用语料库辅助高中英语写作
随机抽样题型“晒一晒”
例说数列与不等式的综合题型
词汇小达人
词汇小达人
聚焦圆锥曲线的新颖题型
词汇小达人
词汇小达人