APP下载

近5年国内有关语料库研究综述
——基于我国5种外语类核心期刊(2008—2012)的统计分析

2014-07-14缪芙蓉

关键词:外语教学语料库词汇

王 灏,缪芙蓉

(西北师范大学 外国语学院,甘肃 兰州 730070)

一 引言

语料库是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续的语言文本或话语片段而建成的具有一定容量的大型电子文库(杨慧中,2002)。从20世纪90年代初以来,随着第二代大规模语料库的诞生与语料库的技术方法的更加成熟,近年来许多不同领域不断地涌现出有关语料库研究的专著、论文等成果,其中基于语料库与语言教学及语言学习相关的研究成果尤为引人关注。并且语料库在现代语言学研究和语言教育中发挥着越来越重要的作用,为外语教学研究提供了一种崭新的哲学思维模式。

二 研究方法

本研究采用的是论文文献检索和统计分析的方式。统计分析软件使用的是SPSS18.0版本,同时运用了Excel进行了数据分析。首先,根据南京大学关于中国国内外语类核心期刊的分类及排序,筛选出能够代表外语类研究居于前5位的核心期刊,在中国知网中以“语料库”为篇名、关键字和摘要检索词进行检索,选取5种核心期刊上从2008—2012年的有关语料库的研究论文共100篇(表1),笔者将其所有的论文下载后组建成本次研究的自建论文数据库,并根据其发表年份及期刊对其进行SPSS统计得出各期刊及每年发表论文的曲线图,然后从研究内容,研究方法等角度运用EXCEL软件进行了数据统计分析。

表1 2008—2012年5种外语类核心期刊 发表语料库的研究论文情况

三 我国5种核心期刊的语料库研究现状分析

1.总体数量发展趋势。

对外语类的5种核心期刊中的语料库的论文进行SPSS软件分析,2008-2012年间各期刊研究论文数据变化如图1显示,《解放军外国语学院学报》的相关研究论文最多,占所选论文的26%。笔者认为其原因之一是解放军外国语学院学报的发行单位及创办理念:它是由解放军外国语学院主办的外国语言文学学术性刊物,其主要特色是:(1)综述性研究和专题研究并重,前者反映一级学科外国语言文学的前沿动态,后者报告国内外有关的最新研究成果及信息;(2)兼顾纯理论性研究和实证性研究。为了进一步分析并说明这5种核心期刊中所筛选出的论文特征,笔者把这些所有研究按时间分成2个阶段:第一个阶段2008-2010年间发表的语料库研究的论文共计55篇,占本次调查100篇论文总量的55%;第二个阶段2011-2012年间发表在5种期刊上的论文共计45篇,占论文总量的45%。很显然,关于语料库论文研究数量有稍微下降的趋势,但是在《外语教学与研究》期刊上此类论文数量还是有所增加的。

图1 5种核心期刊基于语料库研究的变化情况(2008-2012)

2.基于语料库的研究方法分类。

基于国内以往的语料库研究的分类方法,笔者将100篇关于语料库的论文按照语料库本体研究和其应用性研究进行分类。其中语料库本体的研究是对语料库自身拥有的特点、方法,建设的作用、意义及其素材来源的相关研究。应用性研究就是把语料库作为一种工具,把其运用于其他的领域研究具体内容。本次研究的论文中对语料库本体研究的论文为18篇,占论文总量的18%,而采用语料库的应用性研究的论文共73篇,占总量的73%;论文中还有9篇是关于专家论坛,国际会议及述评的相关研究。图2显示了2008-2012年间基于语料库研究的本体研究与应用性研究的动态变化关系。发现整个相关研究以应用性研究为主,说明语料库研究者们除了对语料库理论进行研究外,还注意到了语料库它本身就是一个供研究者们进行研究时使用的工具,只有通过与语料库的结合,进行相关研究才具有一定说服力,可行性及科学性。

图2 语料库研究方法的变化情况

3.基于语料库的主要研究内容。

本调查通过对研究内容的细化分类,笔者发现100篇研究论文中,主要包括5种研究内容:对语料库本体的研究论文共18篇,占18%;基于语料库研究英语口语的论文共13篇,占13%;基于语料库研究翻译的论文共10篇,占总论文的10%;基于语料库研究课堂教学的论文共9篇,占总论文的9%;基于语料库研究词汇的论文9篇,占9%。总体表明,对语料库的研究内容比较丰富,比较全面。

(1)语料库本体的研究。

在本次研究的论文中对语料库本体的研究论文共18篇,笔者对其进行了细分,发现主要研究内容有:语料标注,词汇重复及差异方面的研究。

其中潘鸣威(2008)提出CEM(Corpus for English Majors),即《英语语料库》为研究者们不仅提供了中国英语专业学习者的真实语料,而且提供不同的学习者之间的语言学习的特点。对其语料的标注进行研究,则可以使研究者、教师或教材编写者更快地通过量化统计处理,为语料的应用寻找更好的依据和支撑。研究主要介绍了66万词次写作语料的言语失误标注原则、言语失误分类及其特点,并列举了失误标注的具体操作方法。张雪梅(2008)主要介绍了中国高校外语专业多语种语料库建设与研究—英语语料库的建设概况和其中的翻译子语料库,然后详细说明了翻译子语料库的标注体系及特色,最后指出了使用语料库进行研究时应注意的问题。此外,语料库语言学的一项基本研究内容就是语料库之间的词汇或其他的特征出现频率的差异研究,具体方法使用的统计方法主要是卡方检验。葛诗利(2010)提出任何统计方法的应用都有相应的前提假设,由于卡方检验不能够完全符合词汇差异的研究,提出其他统计方法包括对数似然率和秩和检验也能够对词汇差异进行研究,并对此做了实验,实验证明,对数似然率与卡方检验类似,在词汇差异检验中也会受到样本量和样本代表性的影响进而产生统计偏误,但是秩和检验却能在一定程度上解决这些问题,得到比较客观的统计结果。

(2)基于语料库研究英语口语的研究。

在基于语料库对英语口语的研究中,笔者发现对口语中的复数信息的重要性及口语中短语动词、情态词语、交互词语、多次惯用及口语中的停顿现象等有相应研究。

胡敏(2011)基于中国英语学习者口语的语料,研究了中国英语学习者复数标记的变异状况及其影响因素。其中有91名大学生参加了本次研究。在数据分析基础上,作者得出如下结论:第一,正确的复数标记和标记缺失并不是复数标记变异的主要形式,主要形式还包括零标记和单数名词被标记。第二,复数标记变异具有系统性,语音、语义、句法和词汇层面都会对其产生不同程度的影响。其中语义层面是最重要的影响因素,而句法层面则是最弱的因素。第三,语体与复数标记变异的影响因素相关性较弱。潘琪(2011)以公共英语考试口语语料库的子库(SECOPETS-4)和英语本族语语料库(NICT-NATIVE)为基础,采用中介语对比分析的方法,分析并研究了中国学习者的英语口语中的三类语用标记语:情态词语、交互词语、多词惯用语的使用特征。研究结果表明了中国学习者在这三个方面的使用程度都过少。然而,中国学生对某些高频的情态助动词和副词的使用过度,并且还存在一些误用现象。本研究进一步说明了中国学习者掌握口语中的语用标记语的词汇数量较少,并且对高频词汇的用法掌握不全面、不准确,导致交流障碍。高莹,樊宇(2011)从分析叙述中的停顿现象比较了中美大学生的口语表达的差异,研究发现美国大学生对使用停顿策略比中国学生更加擅长,前者停顿现象多发生在句子与句子之间或主句与从句之间;而后者的停顿位置除句子(从句) 之间外,更多发生于句子中间。研究表明了有效的停顿策略和语块教学有助于学习者的语速提高,口语流利性增强。

(3)基于语料库对翻译的研究。

自Baker(1993,1995)介绍语料库语言学在翻译研究中的应用以来,语料库翻译研究(corpus-based translation studies)已发展成为一种新研究方式,研究内容涉及译者文体,翻译语言共性特征、翻译转换过程等,其中对翻译共性(translation universals)的研究最为突出。

肖忠华,戴光荣(2010)通过对比分析两个自建汉语译文平衡语料库,探讨了汉语译文的词汇和句法特征,发现:首先,相比于汉语母语,汉语译文词汇的密度略低,尤其是实义词与功能词之比偏低;其次,汉语译文中连接词的使用更多,有很明显的特征;最后,汉语译文中被动结构受英文影响很大,所以对规范化假设进行质疑。

此外,由于英、汉两种语言对人称代词手段在构句层面的依赖程度不同,英汉翻译中人称代词的转换表现出一定的特点。黄立波(2008)通过借助双语平行语料库,考察了英汉翻译中人称代词主语在文学和非文学两种文体类型中的数量、频次和转换的类型。研究表明,在英译汉的过程中,人称代词主语语际转换表现出源语迁移现象,语内类比很突出,根本原因归于两种语言对形式手段在依赖程度上的差异,以及语言相对社会地位和认知规律等因素的作用。

王惠,朱纯深(2012)介绍了自行创建的语料库双模式标注系统及标注抽取的工具,并且探讨了如何通过语料库建设,特别是语料的标注,拓宽了语料库在翻译教学、自学中的应用。最后说明了全面的标注抽取模式不仅方便学习者对特定翻译现象的集中观察和学习,也易于课堂上的举例或者集中讲解。

(4)基于语料库对课堂教学的研究。

如今应用语言学的一个崭新的领域就是语料库语言学的研究成果及技术手段应用于英语课堂教学中,并取得了很大的优势。在本研究的论文中,戈玲玲,李广伟,刘朝晖(2011)通过自建大学英语教学语料库及自主测试语料库,采用计算机编程技术和数据库技术开发了一个基于校园网的Web大学英语教学平台系统,该系统的一个很大优点就是为教师针对不同的学习者使用个性化教学提供了可能性,并给学生提供了趣味性的学习工具。

此外,随着学习者语料库的建立,其已作为新的数据资源为语言研究及二语的学习服务。甄凤超,王华(2010)主要提出了在外语教学中,学习者语料库的两大途径:间接应用和直接应用,前者是把基于学习者语料库的中介语研究发现应用到了外语教学中,有助于教师了解学习者的语言运用特征及其困难,进而实施有效的课堂干预;后者是使用学习者语料库的数据驱动学习,进而让学习者通过分析积极和消极的语言证据以提高语言意识,同时通过练习加强语言的学习。

(5)基于语料库研究词汇的论文。

词汇既是语言交际的基础,又是语言习得的主要内容。第二语言习得的研究成果表明,学习者在语言使用过程中所遇到的困难与词汇有直接的关系,词汇量不足是其中的重要因素(Connor 1996, Nation 1990)。与此同时,国内研究者也开始关注词汇输入频率和词汇习得之间的关系。很多学者(如汤声平,2002;赵勇,郑树棠,2003,等)撰文谈论词汇重复对词汇习得的意义,并提出编写教材时应该考虑这个因素。

罗卫华,邓耀臣(2009)以英国国家语料库(BNC)为基础,通过采用计量语言学的方法,研究了普通书面的英语篇际词汇重复特性,并探讨了对英语词汇习得的启示。研究结果表明,在篇际词汇中占很大比例的是样本组中一次词;字数大约相等的任意两个语篇的词汇重复率较小,词汇重复数也呈正态分布;篇际词汇很小的一部分是重复率在5-15次以上的词汇。进而可以看出,篇际词汇重复模式给英语的词汇教学造成了很大的困难,使英语学习者普遍感觉到词汇不足,且不能转换成积极词汇。

由于英语写作是学生词汇量的直接性体现,对写作中的词汇也有许多的研究。其中词汇的错误分析不仅有助于了解学习者第二语言的掌握程度及学习策略,而且有助于了解学习者共同的学习特点,对促进二语教学具有重要意义。何华清(2009)采用了定量、定性分析方法,对中国学习者英语语料库中290篇作文的词汇错误进行分析,结果表明。中国学生的词汇错误主要有拼写错误、词类错误、替代错误、省略型错误和冗余型错误。所以要克服这些错误,学习者必须在了解英汉语言之间的差异和英语词汇具体使用规则的基础上,通过说、写等各种方法来巩固所学词汇知识,逐步提高词汇运用能力。

四 基于语料库研究需要改善的方面

本次调查发现,国内近5年在语料库方面的研究取得的成就显著,研究方式也趋于多元化,研究内容也细化到各个层面。从整体来看,中国的语料库的研究发展状况良好,但是不足还是存在的。笔者总结了以下几点:(1)相关研究在这5种核心期刊的论文总量所占比例应成增长的态势,为学者做基于语料库的研究做出贡献。(2)研究者们在近5年来,主要是把语料库作为一种工具来进行研究,关于语料库的本体研究也应该得到发展。(3)由于在我国语料库的研究中虽然有自己的特色但也存在不足之处,所以我国的语料库研究应通过与其他国家的语料库的研究进行对比,来对我国的语料库的发展查漏补缺。

五 今后我国语料库的发展趋势

通过回顾和研究我国外语类的5种核心期刊近5年的相关语料库的研究现状,不仅对我国基于语料库的教学模式及学习方法提供了重要的指导,还预示了今后国内语料库的发展方向和趋势:(1)从学习者的角度出发,以英语本族语语料库和中国英语学习者语料库为基础,探讨英语课堂教学的实证研究将会越来越多。(2)由于网络的现代化,今后基于网络的语料库也会得以建设。

由此可以预见,随着我国对语料库研究的更加具体和系统,未来的中国语料库研究会更具有中国特色。

[1]Baker, M. 1993. Corpus Linguistics and Translation Studies: Implications and Applications[A].In M. Baker, G. Francis & E. Tognini-Bonelli(eds.). Text and Technology: In Honour of John Sinclair[C]Amsterdam: John Benjemins. 17-45.

[2]Baker, M. 1995. Corpora in Translation Studies: An Overview and some Suggestions for Future Research[J]. Target 7:223-243.

[3]Connor, U. 1996.Contrastive Rhetoric[M]. Cambridge: CUP.

[4]Nation, I. 1990.Teaching and Learning Vocabulary[M].New York: Newbury House Publishers.

[5]Olophan, M. 2004. Introducing Corpora in Translation Studies[M]. London: Routledge.

[6]高莹,樊宇. 基于语料库的中美大学生口语叙述中停顿现象比较研究[J].解放军外国语学院学报,2011(4):71-77.

[7]戈玲玲,李广伟,刘朝晖. 基于语料库的大学英语教学平台建设及其教学模式研究[J].外语界,2011(5):2-9.

[8]葛诗利. 语料库间词汇差异的统计方法研究[J]. 现代外语,2010(3):249-257.

[9]何华清. 非英语专业学生写作中的词汇错误分析—一项基于语料库的研究[J].外语界,2009(3):2-9.

[10]胡敏. 中国英语学习者书面语料复数标记的变异研究[J]. 现代外语,2011(2):187-219。

[11]黄立波. 英汉翻译中人称代词主语的显化—基于语料库的考察[J].外语教学与研究,2008(6):454-461.

[12]罗卫华,邓耀臣.基于BNC语料库的英语篇际词汇重复模式研究[J].外语教学与研究,2009 (3): 224-229.

[13]潘鸣威.谈谈CEM语料库中翻译语料的标注[J].外语界,2008(4):13-19.

[14]潘琪.中国英语学习者英语口语语用标记语使用特征研究—基于SECOPETS语料库的实证研究[J].外语与外语教学,2011(3):35-40.

[15]汤声平.从教与学的双重视角看大学英语(全新版)系列教材[J].外语界,2002(3):76-80.

[16]王惠,朱纯深. 翻译教学语料库的标注及应用—“英文财经报道中文翻译及注释语料库”介绍[J]. 外语教学与研究,2012(2):246-257.

[17]肖忠华,戴光荣. 寻求“第三语码”—基于汉语译文语料库的翻译共性研究[J]. 外语教学与研究,2010(1):52-60.

[18]杨慧中.语料库语言学导论[M]. 上海:上海外语教育出版社,2002.

[19]张艳莉,潘鸣威. CEM写作语料的标注原则及说明[J].外语界,2008(4):20-26.

[20]赵勇,郑树棠.大学英语教材中的核心词汇的关注[J].外语与外语教学,2003(6):21-24。

[21]甄凤超,王华.学习者语料库数据在外语教学中的应用:思想与方法[J].外语界,2010(6):72-80.

猜你喜欢

外语教学语料库词汇
从震旦到复旦:清末的外语教学与民族主义
本刊可直接用缩写的常用词汇
一些常用词汇可直接用缩写
《语料库翻译文体学》评介
本刊可直接用缩写的常用词汇
The Book Review of Methods of Critical Discourse Analysis
“Less Is More”在大学外语教学中的应用
把课文的优美表达存进语料库
基于JAVAEE的维吾尔中介语语料库开发与实现
外语教学法的进展