语料库应用于大学俄语词汇教学的探索
2016-04-27王莲涔
王莲涔
(西南大学 外国语学院,重庆 400715)
语料库应用于大学俄语词汇教学的探索
王莲涔
(西南大学 外国语学院,重庆 400715)
词汇教学是语料库资源和研究手段应用于外语教学时间最早和成果最多的一个领域。国内学者对语料库应用于外语教学,主要是英语教学进行了深入细致的研究。然而迄今为止,俄语语料库在国内高校俄语专业教育中的应用并不普遍,甚至“几乎空白”,这对功能强大的语料库而言无疑是极大的资源浪费。本文采用语料库方法,通过调查同义词在不同语体中的分布,发现同义词在不同语体中的优先用词原则,运用语义韵律方法,从新的维度反映词语的搭配特征,揭示其不同的类联接。基于语料库的词汇教学,注重量化分析,能揭示一些单纯靠直觉分析不能发现的规律,为大数据时代的大学俄语教学提供新的视角,促进俄语教学。
语料库;词汇教学;词频;词语搭配;语义韵律1
在俄罗斯,现代计算机语料库的起步比较晚。但是,世界上并非没有俄语语料库,近些年来,俄语语料库的发展呈现出加速发展的势头,国内外先后出现了不同类型的俄语语料库。语料库(корпус)和语料库语言学(корпусная лингвистика)从理论、内容和方法等方面对语言教学与研究产生重要的影响。首先,它可以直接影响俄语教学的内容、侧重点以及教学内容的编排顺序等,继而对教学大纲和教材的编写产生影响;其次,它也对语言教学的思想和方法产生直接的影响。
近二十年来,英语学界在语料库语言学应用方面的研究硕果累累,相对而言,俄语界对语料库的应用研究还很缺乏,研究成果不多。但可喜的是,近十年来,国内俄语界学者已经开始关注俄语语料库和基于语料库的俄语研究,也有了些许的研究成果,如,《俄语语料库的新发展》(许汉成,2005);《基于俄汉熟语语料库的俄语熟语模式化及自动识别》(秦立东,2007);《俄语语料库和基于语料库的语法研究》(李绍哲,2012),《俄语国家语料库与俄语专业教学》(于金玲赵娜,2013);《基于语料库的俄语同义词语义韵研究》(孙敏庆,2013)等,研究动态呈现出上升的趋势。但是,总的来说, 俄语语料库的研究和基于俄语语料库的应用研究还有待进一步深入。①
首先,本文对俄语语料库的研究和创建作简要回顾;其次,阐述基于语料库的词汇教学的理据;再次,从词频统计分析、词语搭配、语义韵律和词语辨析等方面探讨语料库在大学俄语词汇教学中的应用模式;最后,对基于语料库的俄语词汇教学的发展趋势进行预测与展望。
一、俄语语料库的创建与发展
语料库,顾名思义就是存放语言材料的仓库, 但是这个仓库里的语言材料不是杂乱无章地堆砌在一起的。语料库是一个由大量在真实情况下使用的语言信息集成的专供研究使用的资料库(Leech & Michael, 1981)。确切地说, 语料库是指存放在计算机里的大量原始语料文本或经过加工后带有语言学信息标注的文本。它是一个庞大的语言素材的集合体,主要用于观察、分析和研究目标语的各种特征(唐洁仪 何安平,2004)。
语料库的建设发轫于欧美,20世纪60年代建立的第一代布朗语料库(Brown Corpus)和80年代建立的伦敦—隆德英语口语语料库(London-Lund Corpus of Spoken English)为现代语料库语言学奠定了坚实的基础。20世纪80-90年代是语料库建设快速发展的时期,建立了一批具有世界影响力的语料库, 如主要用于词典学研究的COBUILD英语语料库、朗文语料库(Longman Corpus Network)、英语国家语料库(BNC)、国际英语语料库(ICE)。语料库是语言学和计算机科学交叉的一个学科,随着计算机技术的发展,建立特大型语料库已经不再是很困难的事,2001年开始建设全球英语监测语料库(The Global English Monitor Corpus)。监测语料库的规模没有最终限制,它像语言一样,处于不断发展之中。
相对于西欧和北美语料库研究的蓬勃发展,其他国家的语料库研究处于相对落后的状态。但,近年来,俄语、汉语、日语及东欧国家的语料库建设成绩斐然。中国的语料库建设开始于20世纪80年代,已经建立的语料库有:现代汉语语料库(MCLC)、科研英语语料库(JDEST)、石油英语语料库(GPEC)、国家现代汉语语料库。日语方面有代表性的语料库有:EDR语料库、青空文库、现代日语书面语语料库、日语口语语料库、近代女性杂志语料库等。
现代俄语语料库的建立与研究相对较晚,直至21世纪之前,俄语方面还没有一个可供世界俄语研究者访问的俄语语料库。俄罗斯国内外的研究者都意识到了建立俄语语料库的必要性,于是,在几个国家几乎同时出现了关于建立可供网上访问的俄语语料库的科研项目。俄语语料库的建设大体可分为两种:俄罗斯自建的语料库和其他国家建立的语料库。在俄罗斯,20世纪70年代,Л.Засорина主持建立了一个语料库,依据该语料库1977年Л.Засорина编纂出版了《俄语频率词典》。但该语料库和基于语料库的词典没有电子版,限制了语料库的使用范围和功能。20世纪70年代末80年代初,俄罗斯数学家А.Ершов在建立自然语言处理系统过程中,通过总结所积累的知识和技术后,得出一个结论:只要建立俄语知识库(машинный фонд русского языка),就可以解决用自然语言与计算机交流,并且让计算机完成某些通常由人承担的语言工作,如机器翻译这样的问题。俄语知识库可以理解为计算机化俄语知识库。该项目曾计划建立若干个子库和相关软件:俄语总词表、文本库、词典库、术语库、语法库、历史俄语库、语音库、方言库等。这样的知识库一旦完成,一方面可以提高俄语语言学各学科的现代化水平,另一方面也会成为建立各种以俄语为界面的人机交互系统以及以俄语为载体的信息处理系统的基础。遗憾的是由于苏联解体,项目没有完成。但在近20年的研发过程中,积累了大量的资源,包括文本语料库、词典和软件,这是俄语工作者一笔宝贵的财富。90年代,俄语研究所词典编纂实验部(Отдел экспериментальной лексикографии Института РЯ)在А.Н. Баранов、М.Н. Михайлов和Х.Томмола的主持下建立了现代政论文本语料库(Корпус текстов по современной публицистике);圣彼得堡大学在В.Б. Касевич主持下建立了圣彼得堡大学俄语语料库。20世纪,在俄罗斯基础研究基金的支持下,莫斯科大学语文系普通和计算机词汇学及词汇编撰学实验室在2000-2002年期间建立了俄语报纸计算机文本语 料 库(компьютерный корпус текстов русских газет конца ХХ века,简称КГТ)。КГТ的建设由实验室主任А.А. Поликарпов和实验室人员共同完成。当前,КГТ对公众仅部分开放,未来将开放全部内容。从2002年起,俄罗斯的语料库建设呈现出加速发展的趋势。В.Плугян, Е.Рахилина在Яндекс公司的支持下建成了标准俄语文学文本语料库(50万词次);俄罗斯信息传递问题研究所建成了词法和句法信息语料库(10万词次);С.Шаров建立了4千万词次的代表性的俄语语料库,在此基础上,通过网络发布了一部新的俄语词频词典。
语料库的出现改变了语言学的研究方式,但是俄语语料库在20世纪一直落后于世界语料库的发展,缺乏系统的理论研究和先进的实践成果。俄语国家语料库(Национальный корпус русского языка--НКРЯ)的出现,改变了这一状况。俄语国家语料库计划建设规模2亿词次,至2012年规模达到3.64亿词次,标注信息包括元文本标注、词法标注、句法标注、语义标注和重音标注。该语料库包括一个主库和9个子库,除11-14世纪的古代俄语文本语料库外,其他部分都对外开放,俄语国家语料库是迄今规模最大的俄语代表性学术语料库。
俄语国家语料库的建设主要参照了英语语料库(特别是布朗语料库和英国国家语料库)的建设经验,最重要的特征有两个:
第一,国家语料库具有代表性和语料库文本类型的平衡性。只有语料库的规模达到一定程度,才能谈得上具有代表性。俄语国家语料库建设之初设计规模为2亿词次。语料库必须尽量包括各种类型的书面语和口语文本类型(各种体裁的文艺作品、政论文、学术著作、商务信函、口语会话、方言等等),而且所有这些类型的文本在语料库里所占的比例要大体相当,基本一致。文本要按照一定的比例选取,文艺作品(包括剧本和回忆录)约占40%。俄语国家语料库包括的文本类型有:不同文体和流派的散文作品、剧本、回忆录-自传、杂志政论文、文艺评论、报纸政论文、新闻、科技文章、科普文本和教材、宗教和宗教哲学文本、正式公文和法律文本、日常生活文本(包括私人信件、日记等)等。
第二,国家语料库具有语料标注信息。是否有标注信息是语料库区别于其他类型电子数据的重要特征,只有对语料进行标注,才能更好地满足语言研究的需要,语料库标注的信息越丰富,它的学术研究价值和使用价值就越高。俄语国家语料库目前进行了四种标注:元文本标注、词法标注、重音标注和语义标注。词法标注是借助专门自动词法分析软件进行的。俄语词形的同形异义现象相当普遍,自动词法分析软件对输出的部分文本进行了人工消歧和校对,这部分文本构成了标注词法语料库,还有一些语料进行了句法标注。
另外,俄语国家语料库还建立了俄语平行文本语料库,在翻译理论和实践、外语教学、机器翻译等方面具有特殊的应用价值。俄语国家语料库的建成彻底改变了俄语语料库发展落后的现状。
除了上述俄罗斯自己建立的俄语语料库外,还有一些其他国家建立的俄语语料库,这些语料库是世界背景下俄语语料库的重要补充。它们有瑞典乌普萨拉—图宾根语料库(Upssala-Tubingen)和芬兰赫尔辛基大学俄语文本标注语料库ХАНКО。2002年,我国学者提出开展俄语语料库研究的问题,介绍了瑞典乌普萨拉—图宾根语料库和莫斯科大学报纸文本语料库(许汉成,2005),近几年关于俄语语料库和基于语料库的研究已经成为国内外俄语学界研究的热点。目前国内建立的俄语语料库有俄汉平行语料库。语料库语言学作为一种新兴的经验主义研究方法或者语言学学科将会影响到语言研究的各个方面,包括构词学、词汇学、词法学、句法学、语义学、语用学及篇章语言学等,不仅如此,语料库也为语言教学带来许多的思想和方法 (Sinclair, 1988 ;Thomas, 2005 )。
二、语料库应用于词汇教学的理论基础
一定的教学法总是依据一定的语言学说,比如,听说法之所以在外语教学中强调模仿与记忆,就是因为它接受了结构主义语言学关于语言是一套习惯的观点;语法—翻译法之所以重视有关语言知识的讲解和分析,是因为它采纳了关于语言是代码的理论;图式理论强调人已有知识和知识结构对当前认知活动的决定作用,是“人们用已有的结构来记住新资料的一种方法”(桂诗春,2003: 5),认知图式构建的关键因素是有一批“具体的语境(context-specif i c)”和“复现的语境(contextual repetitions)”(Aston, 1997:56)。
语料库语言学与从图式建构的角度看待语言发展的观点在理念上有相似之处,两者都认为,语言使用者都是在不断地接触和体验相同或相似的形式结构在不同语境中是如何表达语义内涵与概念之后,才逐步形成抽象的语言知识,发展起语言能力的。建构语言图式的条件是在自然语境下的大量和重复性的接触语料,而语料库的资源极其丰富,语料信息的提取更方便快捷,可以满足这个语料库所提供的大量在形式及语义上相近而又稍有差别的检索行,能够为认知图式的建构、确认、扩展和重构提供良好的语言环境和基础。G.Aston 指出新图式的习得过程其实是不断对已有图式的组构和解构,这个建构过程有两种相辅相成的途径:一是“从具体到抽象”,二是“从抽象到具体”。在这两个过程中,最关键的因素是要由大批在不同语境中反复的东西。而语料库特有的语境共现功能正好能够在相对同质的大量语料中反复呈现不同语境里的同一语言现象,语境共现界面有助于学生在一批相同的、相类似的语境信息刺激下,形成知识的图式化进入大脑记忆。研究表明,语料库的语境共现可以为建构和重构图式提供合适的语言材料。
另外,语料库的工具特别有利于设计教学任务,引导学习者建构外语学习的陈述性和程序性知识。使用语料库不仅可以帮助设计各类教学任务,更可以引导学习者进行甄别、选择、分类、归纳总结与各层次结构相匹配的、较典型的语言表达形式,加强词汇学习的针对性,改善教学效果,提高教学质量。
语料库集中了大量真实的语言素材,这一特性决定了语料库的基本用途就是向学习者提供语言输入。Ellis(1994)认为,输入的频率是影响语言发展的因素之一。Gass和Selinker(2001)指出,输入中频率很高的那部分内容比较容易引起注意。此外,对于语言水平较高的学习者,某些不常出现的内容也会由于其频率之低而引起注意。语料库在其检索工具的配合下,使得频率的集中体现不再是一件难事,通过语料库索引行这种特殊的呈现方式,学习者毫不费力就能够注意到出现频率较高的语言现象,从而了解操本族语者经常使用的语言形式,这样就可以在实际使用中减少误用。
无论是教学还是研究,使用语料库的最根本出发点是索引(concordance), 这是一种以呈现词条索引的方式来描述词条的方法。最为广泛采用的索引方式是“关键词的语境共现”(Key Word In Context, 缩略为KWIC),针对某一事先设定的检索词,计算机在语料库中迅速搜索出包含检索词的所有句子,并将他们以检索词居中的形式排列出来。这种呈现方式提供了有关检索词使用的语境,根据需要,语境的范围小至检索词左右的几个词,大至包含检索词的整个句子甚至整个段落。语料库索引成功地解决了通过多语境学习词汇这一难题。Cobb(1997)的研究证明,当多个语境通过索引行的形式同时呈现时,学习者可以从中获得有变通性的词汇知识。索引式词汇学习的效果在某种程度上可与自然语境中的学习效果媲美。
三、语料库在俄语专业词汇教学上的应用
词汇教学是语料库资源和研究手段应用于外语教学时间最早和成果最多的一个领域。外语教学界长期都在讨论两个重要问题: 一是教什么, 二是怎么教。基于语料库的词汇教学不仅有助于解决 “教什么”的问题,而且有助于解决“怎么教”的问题。
Sinclair早在20世纪80年代就提出外语教学可以从学习词汇入手。他认为,以往的词汇教学仅仅是语法教学的附属品,词的选择缺乏代表性和科学性(Sinclair, 1988)。他和同事联合调查了9套对外英语教材,通过统计研究发现,教材中的高频词缺少最基本的描述。为此,他提出以词汇为纲的外语教学就是:首先从大型自然语料库中选择最常见的词型,然后,学习这些词的最基本的使用模式,继而,学习与这些词最常见的搭配词。
1997年出版的俄罗斯大科学词典中收录的词汇有131257个。在俄语学习过程中, 要全部掌握这样海量的词汇是不可能的, 也是没有必要的。人们学习外语也通常不是因为目的语里有什么就学什么, 而是首先学习那些目的语本族语者最常用,也就是说最有使用价值的词汇和表达方式(何安平,2001)。外语学习是一个由易到难,循序渐进的过程,在俄语词汇教学方面首先应该让初级和中级学习者学习和掌握俄语本族语者最常用的词语。但是词汇的选取应该客观、准确和科学, 不能完全凭借我们的主观判断、经验和直觉。统计语料库可以得到一种新的信息—语言特征的频数和频率。这种新的信息远比语言学家的一般感觉重要,词频和频率信息不仅说明了语言现象的普遍性,同时也是各种语言统计模型的基础数据(傅兴尚等,2009: 293)。“基于俄语国家语料库衍生的词典”网站是俄语国家语料库在词典编撰方面做出的一大贡献。网站包含4类词典,分别是:《俄语新词语法词典》、《新俄语词汇频率词典》、《俄语成语词典》、《俄语非物质名词动词搭配词典》。表1列出了俄语国家语料库中前10个使用频率最高的名词、动词、代词和形容词,我们发现这些词汇在语言运用中具有必不可少的价值,说明学生应该优先学习并掌握这些词汇。基于语料库的词频统计能够为词汇大纲的设计与教材词汇的编排提供可靠的依据, 可以用于解决词汇教学中“教什么”的问题。因此,在俄语教学中应优先教授基于语料库的高频词汇及其常用搭配。
表1 НКРЯ中前10个使用频率最高的词语
在词汇教学中使用语料库还可以有助于解决“怎么教”的问题。同义词、近义词辨析是俄语词汇教学的难点和重点,有时甚至连本族语使用者都很难讲清楚其差别。如果我们借助于从语料库中提取的语言信息作为证据,通过对大量真实的语言实例进行系统分析来揭示语言运用的特征和规律,那么对同义词、近义词的讲解就会更有说服力。于丹红(2007)采用语料库方法区分了同义词одеть和 надеть,孙敏庆(2013)通过语料库对同义词вызвать—пробудить—привлечь进行了语义韵研究。本文以задача和задание为例探讨在俄语词汇教学中如何使用НКРЯ进行同义词辨析。.
同义词由于其内在意义的差异,在不同的语体中往往呈现出不同的分布特征,所以统计它们在不同语体中的频率差异,有助于将它们区分开来。语言用于社会活动的不同领域,便产生不同类型的文体。Кожина(2003)把语体分为一般语体和个别语体。一般语体包括:科学语体、公文语体、报刊政论语体、文艺语体和日常口语体。本文的语料取自俄语国家语料库的书面文本基础语料库和口语语料库。书面文本基础语料库又称现代俄语标准语料库,收集的是俄语书面标准语,书面语篇的时间跨度是从18世纪中叶至21世纪初,而口语语料库语篇的创作时间仅为1900-2000年,因此,我们首先在自建库页面将书面语篇的时间也设定为1900-2000年,然后分别选择文学语篇及非文学语篇中的公文事务、政论、生产技术、学术科研领域进行建库。这样我们得到了与五大功能语体大致对应的五类子库:文学库、公文事务库、政论库、科技库和口语库。
具体操作如下:首先进入检索界面,如图:
在词汇—语法检索栏输入要检索的词 задача 检索条件设为单词频数,语法和语义选项不选。
得到检索结果如下:
由于各子库的词数从100万到6000万不等,为使统计更为科学,需要计算出同等词数下各子库中这两个词的出现频次。我们将子库的词数均设定为100万,得到的频次如下:
总频数 每百万词频数задача 16943 63.8 задание 3036 13.25
表2 задание 和задача 在不同语体中的每百万词的词频分布
上述数据表明,在各个语体中,задача 的使用频率均高于задание,尤其在口语中更是经常使用задача,而不是задание。由此可见,通过调查同义词在不同语体中的分布,可以发现同义词在不同语体中的优先用词原则,这是传统的只从概念意义或句法功能方面辨析近义词所无法做到的。
另外,语义韵律的提出也为同义词辨析提供了新的维度。下面我们借助俄语国家语料库对同义词 произойти/(发生), случиться/(发生)的搭配情况进行考察、量化分析,以揭示出它们的语义韵。具体操作如下:
第一步,在俄语国家语料库基础库页面,建立类联接。通过查阅词典可知,两个词在用于“发生”之意时,均支配非动物名词第四格形式,因此,在基础库检索页面,分别输入关键词的同时,将其支配词的语法特征限定为существительные/(名词),винительные/(四格),неодушевленное/(非动物性),这样得到相应的类联接即为V+N,且N被限定为非动物名词第四格形式。为便于数据提取,我们将расстояниe项设置为от 1 до 1,即要求节点词后边的第一个名词要符合上述语法限制条件。
第二步,将索引行到的语例保存为TXT,以利于语料库软件进行检索。
第三步,借助检索软件AntConc 3.2.1对搭配词进行检索统计。将文本文件导入AntConc3.2.1 中,在searchterm 中勾选words 框, 输入相应的检索词,同时将右跨距设置为1,左跨距设置为0,点击collocates 和start,便可得到动词的搭配词表。通过对315条索引行进行观察、统计其所支配的名词发现(不计重复),与случиться搭配的词语按顺序为,событие/(事件),пожар/(火灾),факт/(事实),время/(时间), скандал/(丑闻),жизнь/(生活),инцидент, случай/(事情),既和消极意义的词汇(火灾,事件等)搭配,又和倾向于中性涵义的词汇搭配(如生活、时间、故事)等。与произойти搭配的名词按顺序为изменение/(改变),перемены/(替换),событие/(事件),вследствие(后果),теракты/(恐怖活动)等,其词汇多为具有消极倾向意义的词语。语义韵律作为语料库语言学的一个重要术语,从新的维度反映词语的搭配特点。可以说,揭示同义词语义韵差异是辨析它们的一个有效途径。同时还发现,这两个词最常见的形式是случившийся/(发生的,阳性形式),случившиеся/(发生的,复数形式), произошедшие/(发生的,复数形式)。
综上所述,使用语料库的检索方法进行的同义词或近义词辨析,主要是通过考察同义词或近义词在不同语域中的词频分布差异,统计各搭配词与关键词共现的显著程度,观察检索行中呈现的同义词或近义词的搭配特征,揭示其不同的类联接、搭配关系和语义韵等语言特征。这种基于语料库的研究方法,注重量化分析,通过所呈现的数据挖掘潜在的语言特征,揭示一些单纯靠直觉分析不能发现的规律。
四、语料库应用于大学俄语词汇教学的展望
本文是对语料库应用于俄语词汇教学的一种探索性研究。根据近年来对语料库及语料库语言学研究动态的观察,笔者认为,基于语料库的词汇教学是大势所趋。因为基于语料库的词汇教学方法符合以学生为中心的教学理念,这使得教师不再是知识的传授者, 而是教学活动的组织者和设计者, 学生是研究者和参与者,学生通过探索了解语言的特征,有利于提高学生的自主学习能力。我们有理由认为,越来越多的师生将接受基于语料库的课堂词汇教学、词语搭配学习、词汇测试等新的学习理念和方法,基于语料库的教学方法将越来越受到重视。随着语料库、语料检索工具的不断发展,语料库的研究方法和技术手段将会不断地运用到俄语词汇教学实践中,在编写词汇大纲和教材等方面也会得到广泛应用,基于语料库的教学研究也将进一步深化。
[1] Aston, G. 1997. Enriching the learning environment: Corpora in ELT [A].Teaching and Language Corpora [C]. In A. Wichmann et al. (eds.). London: Addison Wesley Longman Limited.
[2] Cobb, T. 1997. Is there any measurable learning from hands-on concordancing? [J]. System, (3):301 -315.
[3] Ellis, R. 1994. The Study of Second Language Acquisition [M]. Oxford: Oxford University Press.
[4] Gass, S. & L. Selinker. 2001. Second Language Acquisition: An Introductory Course (2nd Edition) [M]. New Jersey: Lawrence Erlbaum Associates.
[5] Leech, G. & H. Michael. 1981. Short Style in Fiction. A Linguistic Introduction to English Fictional Prose [M]. New York: Longman.
[6] Sinclair, J. 1988. A lexical syllabus for language learning [A]. In R. Carter & & M. McCarthy (eds.). Vocabulary аnd Language Teaching[C]. Harlow: Longman.
[7] Thomas, J. 2005. The use of L1 in an L2 on line chatactivity [J]. Canadian Modern Language Review, (1):161-182
[8] Кожина М.Н. 2003. Стилистический энциклопедический словарь русского языка[M]. М.:Флинта.
[9] 傅兴尚 许汉成 易绵竹等 .2009 .俄罗斯计算语言学与机器翻译[M]. 北京:语文出版社.
[10] 桂诗春. 2003.记忆与英语学习[J].外语界, (3):2-8.
[11] 何安平. 2001.语料库与外语教学[J]. 国外外语教学, (3):15-19.
[12] 李绍哲.2012.俄语语料库和基于语料库的语法研究[D]. 哈尔滨:黑龙江大学.
[13] 秦立东.2007. 基于俄汉熟语语料库的俄语熟语模式化及自动识别[D]. 哈尔滨:黑龙江大学.
[14] 孙敏庆. 2013.基于俄语国家语料库的同义词差异研究[J].天津外国语大学学报, (3):17-22.
[15] 唐洁仪 何安平. 2004.语料库在外语教学中的应用 [J].外语电化教学, (5):42-45 .
[16] 许汉成. 2005 .俄语语料库的新发展[J]. 中国俄语教学,(1):21-26.
[17] 于丹红.2007.俄语国家语料库与俄语词汇教学——以одеть和надетъ为例[J].俄语学习,(6):84-86.
[18] 于金玲 赵娜. 2013.俄语国家语料库与俄语专业教学[J].黑河学院学报, (2):12-15.
Application of Corpus in College Russian Vocabulary Teaching
Vocabulary teaching is an area wherein corpus resources and research methods are applied earliest and achieve the most fruits. Researchers in China have conducted intensive and thorough investigations into the application of corpora in foreign language teaching, mainly in English teaching. Nevertheless, so far Russian corpora are scarcely applied to the teaching of Russian majors in colleges, which is undoubtedly a big waste of corpus resources. Using corpus-based research methodology, this paper discovers the priority principle of the use of synonyms in different genres through looking into the distribution of synonyms in texts of different genres, and with the method of semantic prosody, this paper reveals collocational features of vocabulary and uncovers their linkages between different parts of speech. Corpus-based vocabulary teaching attaches importance to quantitative analysis and, therefore, is able to discover rules that always escape intuitive analysis. Thus, it can provide a new perspective for college Russian teaching in the Big Data Era and promote Russian teaching.
corpus; teaching vocabulary; word frequency; collocation; semantic prosody
H08
A
2095-4948(2016)02-0079-06
本文为中央高校基本科研业务费专项资金项目“基于语料库的中国学习者俄语错误分析”(swu1609007)的阶段 性成果。
王莲涔,女,西南大学外国语学院副教授,博士,研究方向为应用语言学、词典学、教学法。