语料库研究在教学和研究中的应用
2014-08-30薛红勤
薛红勤
摘 要: 文章主要介绍了语料库的概念及其发展历程,就语料库在外语教学与研究中的应用进行了介绍。语料库不仅在技术层面上丰富了外语教学的手段,而且使原来停留在理论和空想中的教学理念变为现实。随着语料库研究的不断发展,人们已经在语言研究、语言教学、语言测试、词典编撰、人工智能等领域应用了语料库。
关键词: 语料库 语料库语言学 教学应用
1.语料库概念及发展史
语料库(Corpus)是一个由大量在真实情况下使用的语言信息经过科学的收集和组织而集成的专供研究使用的资料库。语料库中的语料是某种语言中自然出现的,可以是书面的,也可以是口头的。语料库语言学就是在文本语料的基础上进行语言研究的一门学科。语言学家把这种材料作为研究语言的素材。由于电脑语料库容量大,资料真实,信息提取准确,因此,语言学家借助语料库可以多方面多层次地描写语言并验证各种语言理论和假设,甚至建立新的语言模式和语言观。
在没有出现计算机之前,建设语料库是一项十分繁重而成效甚微的工作。Samuel Johnson花了八年时间(1747—1755)才编成了世界上第一部英语词典,其中大部分时间都用在寻找、整理语料与建立语料库上。强调运用语料分析和描写语言的美国结构主义语言学家Sapir和Baos在上个世纪初,为了搜集语料走访一些印第安部落。但是到了上个世纪50年代后期,随着Chomsky的生成语法学派的兴起,“基于语料”的描写语言学受到抨击。因为Chomsky认为语料只不过是对语言行为的取样,不能直接反映存在于人的大脑中的语言能力,因此不能作为语言研究的依据和材料。上世纪60年代初,很少有人对真实的语言素材进行研究。而基于语言学家的语感和直觉所得到的“可能的句子”及“不可能的句子”成了语言研究及语法教学的主要数据来源。
Quirk在1959年宣布建立英语用法调查语料库(SEU),要对英语语法进行全面准确的描写,提出新的语料库语言学研究。随着计算机的出现,不久之后,美国的Francis和Kucera等人利用计算机建立了布朗语料库。在Quirk提出的语料库语言学中,他强调研究自然语言材料的重要性,并引用Aldous Huxley的话说:“我们最精到的理论,我们最细致的描写,都不过是对实际情况极度粗糙而又不讲理的简化,实际情况的每个最简单的实例都是无比复杂的。”同时他指出,实际情况的这种复杂性正是语料库语言学所需要研究的。从Quirk建立SEU语料库开始,五十多年时间来,语料库语言学的研究范围不断扩大,并取得很大的研究成果,语料库语言学在语言学界的地位越来越重要。近些年借助计算机技术建立的语料库,规模大、功能多、检索方便,使语言研究的手段和方法更丰富,对语言的理论探索也产生深远影响。
2.语料库的作用
语料库最直接的用途就是为编纂字典提供大量真实准确的例句,例如,根据COBU ILD语料库编写的词典就有七种。除此之外,Leech(1993)还列出语料库的十几种用途,包括语言理论﹑语法﹑语义研究、语篇分析、儿童语言习得、语言学习、语言测试等。随着计算机网络的发展,基于网络的语料库为外语教学提供了大量新鲜的语言原料, 同时为编写辞典、语法书及各种教材的提供了重要语料。事实上,现在一些对外语教学有重要影响的辞典和语法书都是以基于语料库的方式编写的。除此之外,语料库在外语教学的思想、理论、方法、内容及手段等方面都起着十分重要的作用。为了更好地说明语料库在外语教学和研究中的应用,笔者从下面几个方面介绍语料库的应用。
2.1语料库与词汇教学
在传统外语教学中,词汇教学往往只是“单”词的教学,大部分语言教师都把单词教学作为首位。但是,语言中的词与词之间经常存在音、形、义等各方面的联系,如果单纯地只学习一个词,则是无法看到这种联系的。现在我们可以通过计算机技术,迅速从包含上千万个词的语料库中,把某个在这个语料库中出现的词或短语全部实例检索出来,并同时统计出该词或短语出现的频率。这样更准确更全面地建立词汇之间的关系,从而认识到各语言形式在实际交际中的意义和用法。例如:桂诗春教授主持的国家“九五”社科规划项目“中国英语学习者语料库”项目,她通过收集5个组别(中学﹑大学英语四级﹑大学英语六级﹑专业英语低年级和专业英语高年级)的学生作文语料,共计100多万个词,并按词形﹑动词词组、名词词组、代词、形容词词组、副词、介词词组、连词、词汇、搭配和句法制定了一个有61个细目的言语失误标注表,然后对整个语料库进行标注。从两个方面对中国学生英语进行分析:一是对比其他以英语为母语的语料库分析学习者的语料特征;二是对失误特征进行分析。这个项目属于国际上第一部公开发布的学习者语料库,它对研究中国学生的语言应用和使用失误等特征,以及它们与外语学习之间的关系等都具有十分重要的指导作用。
2.2语料库与句法研究
句法与在其他方面的研究一样,越来越多地依赖语料库,并成为目前利用语料开展研究最多的语言层面。其原因首先是语料标和计算机检索手段的发展,使得对语言中有代表性的语法现象加以量化分析更容易。其次是通过量化具备代表性的语法现象检测根据语法理论所提出的假设。五十年代以来形成注重理论的理性学派(rationalistic)与注重实际语料的经验学派(empirical),从八十年代中期以来呈现出前所未有的交汇,即很难判断两大研究传统的研究者到底属于哪个学派。他们开始用客观的自然语料库检测理性的语法理论。而不只是纯粹地通过描写归纳客观语言现象生成新的语法理论。罗芒( Romaine 1996)以British National Corpus (BNC)为依据,研究了双重比较级现象。荷兰的Njmegen 大学以J.Aarts为首的研究者,首先根据语言学家的内省及现有的语法描述设计了一套形式语法,将其输入电脑在语料库中运行,检测该语法对语料库数据的解释程度,其次根据语料分析结果修订语法,通过这种研究方法,他们认为语料库使理论得到检验和进一步发展。
2.3语料库与心理语言学
语料库是心理语言学家对其收设进行测试研究的有力工具,尤其在语言病理分析方面能帮助研究人员准确确定问题到底发生在语言发展的哪一阶段。
2.4语料库与语言和语言教学
迅猛发展起来的电脑语料库语言学近年来出现从纯语言研究发展到语料库与语言教学相结合研究的新趋势。语料库在语言教学方面得到直接或间接的应用。学生可以从语料库中得到现实生活中真正会碰上的语言材料,并且现有许多专家已经开始利用语料库对现有教学材料进行批评性研究。他们把从课本中发现的问题与语料库中的真实语料进行比较,以此了解英语本族语的人们是如何表达这些意义的。另外,一批研究人员已开始建立“特定用途英语”语料库提供特定领域的语言学习材料,如广州石油英语语料库(约411,000个词)。语料库同时在历史语言学、方言等领域发挥重要作用,这种作用将随着计算机的不断发展而变得更显著。
3.语料库语言学的发展方向及前景
目前,计算机正以惊人的速度向前发展,语料库语言学研究在国外开展得如火如荼。面对硕果累累的国外语料库语言学研究,我们应该转换观念,更新思路,充分认识到语料库研究对我国语言研究的重要意义,密切注意国外语料库语言学发展的最新动态,充分利用一切语料库资源和语料库研究成果,并结合我国的语言教学和研究现状,进行更深入的语言研究和语言应用研究。总之,计算机的发展使得用语料库开展研究的人越来越多,从而扩展到研究的各个领域,同时语料库中所收内容也会更广泛、丰富。
参考文献:
[1]陈建生.关于语料语言学[J].当代语言学,1997(1).
[2]C.J.F illmore(1992).Corpus Linguistics.J.Starvic(ed),1992, Directions in Corpus Linguistics, Berlin: Moutonde Gruyter.
[3]杜秉正,董眉君(1991).大学英语语法与练习[M ].上海:上海外语教育出版社;章振邦.(1989)新编英语语法(修订本)[M]上海:上海译文出版社.
[4]Johansson, S.Times change,and so do corpora[A].In Ajmer,K.&Altenberg ,B.(eds.)English Corpus Linguistics:Studies in Hon our of Jan Svartvik [C] .London and New York : Longman,1991.
[5]曾国强.语料库在外语教学与研究中的应用.福建外语,2004(2).
[6]武和平,王秀秀.基于网络的语料库及其在英语教学中的应用.电化教育学院,2002(10).