APP下载

小型教学语料库的研究与构建

2014-07-24郑艳阳

赤峰学院学报·自然科学版 2014年23期
关键词:赋码语料语料库

郑艳阳

(南阳理工学院 外国语学院,河南 南阳 473000)

小型教学语料库的研究与构建

郑艳阳

(南阳理工学院 外国语学院,河南 南阳 473000)

本文通过对外语教学过程中语料库应用现状的分析,提出小型法律英语教学语料库构建的必要性和可行性,并根据法律英语教学实践要求,讨论小型法律英语教学语料库构建的整个过程,并且对该语料库进行了初步测试,以期改善以往传统法律英语教学过程中以语言层面为主的"阅读-翻译"方法,培养学生学习自主性.

法律英语教学;语料库;构建;标注

1 引言

20世纪80年代以来,随着计算机处理技术的快速发展,基于语料库的各项研究也呈逐年递增趋势.语料库已经广泛应用到词典编撰、二语习得、翻译研究、文体学、外语教学、法律语言学等学科,极大地扩宽了应用语言学的视野,特别是在外语教学方面,受到了国内外语言学家和语言教育家的关注,并且把语料库在英语教学的应用作为语料库语言学中的一个重要分支(Sincalir,1991;Aston,1997; Leech,1997).但通过笔者调查研究发现,几乎没有任何语料库研究涉及法律英语教学.因此,本文从语料库构建的可行性与目的,语料收集与分类,标注与赋码,输入与检测等方面讨论了小型法律英语教学语料库构建的整个过程,并且对该语料库也做了初步测试.

2 语料库研究现状

目前国内外对语料库进行研究及应用主要体现在以下几个方面:

第一类是有关英语教学资源语料库的创建:1959年英国著名语言学家RandolphQuirk创建了一百万次的英语用法调查语料库(TheSurveyof EnglishUsage),对英语语法进行了全面准确的描写,为英语学习者提供了语法方面的指导.此后在1964年美国Brown大学建立了第一个计算机语料库布朗大学语料库(BrownUniversityCorpus),收集了当时出版的各种美国英语语料,共计100万词.1982年上海交通大学的黄人杰与杨惠中教授主持建立了“专门用途英语语料库”(JDEST),提供了专业英语领域通用词汇、技术词汇、次技术词汇的应用信息,为大学英语教学大纲制定了科学的量化依据.华南师范大学何安平教授主持建立了“中国英语教育语料库”,其中包括中国英语课堂教学语料库及教材语料,收集了大量的中国英语课堂教学用语及英语教材.

第二类是将语料库应用于英语课堂教学:Barlow(2002)认为语料库可应用于教学大纲制定,教材选择和编写以及课堂教学活动.其中在课堂教学活动中,最为关注的一种方法为TimJones在1991年提出的数据驱动学习(DDL),“让学生自己用语词索引软件去查询本族语者口语或书面语的语料库,给他们提供语言使用的真实样例,而不是一些语法书中设计出的例子.”此理论提出,得到许多语言学者和教师的积极响应,并在实践中对其进行了发展,比如李文中与濮建忠(2001)将数据驱动学习用用到词汇学习中,黄大网等人(2008)将数据驱动学习应用到英语写作教学中的语域知识传授,谢艳红等人(2010)提出“数据驱动学习并非一成不变,针对不同程度的学习者,要注意因材施教.”

第三类是基于语料库的英语教学理论研究:孙莉与蔡金亭(2005)利用口语语料库研究记叙文语篇结构和时体使用的关系.王克非(2004)针对双语平行语料库在翻译教学上的用途作了详细的阐述.由于中介语对比分析需要根据语料来进行,所以SylvianeGranger等人开始筹建国际英语学习者语料库,并开展以学习者语料库为基础的研究,扩展了英语教学理论研究的领域.李文中(1999)阐述了语料库与学习者语料库在外语教学方面的应用.秦平新(2010)基于语料库对专门用途英语教学模式改革进行了探索.

可见现有研究成果虽涉及外语教学资源语料库的建设以及将语料库应用于外语教学研究的各个层面,但大多都只停留在研究层面,缺乏实证支撑,没有适当的教学评价与管理体系,其应用效果还待进一步的考证;对于急需使用语料库进行教学的法律英语课程,几乎没有任何研究涉及.

3 小型法律英语教学语料库的构建

3.1 构建可行性与目的

尽管目前国内外已存在大量有关语料库研究成果以及应用于教学与学习的大型语料库,但大部分的语料库皆为通用语料库.这类语料库语料繁多,包含社会各个领域中的书面及口语语料(如新闻报刊,小说,报告,电视报道及会议记录等),数据规模达到上亿字符,并且将会不断增加.这对教学及学生个人使用而言数据过多,规模过大,很难让教师及学生在众多语料中找到需要的材料,比如使用BNC查找情态动词will,可以得到25万条结果,在大量语料中找到可以引用的例子,实在不易.因此Meryer教授(2008)认为“大型通用语料库更多适用于特定语言的语法结构、词典编撰、语言差异、语言历时变迁、翻译理论、对比分析、语言习得等研究.”此外,大型语料库的适用性比较低,许多大型通用语料库需要付费,如BNC语料库个人授权版的光碟需要50英镑.因此,教师最好能够建立自己的小型教学语料库应用到日常教学中去.个人教学语料库目标明确,所收集材料针对性强,可以根据学生程度和兴趣不断改变、更新或扩展语料,使语料库更好地服务于教学.并且随着计算机技术的不断发展,在网上可以免费下载许多功能强大的检索软件来建立小型法律英语教学语料库,比如Microconcord,Concapp,Concordance及GoTagger等.

3.2 小型法律英语教学语料库结构

小型法律英语教学语料库应包括以下三部分,如下图所示(图1):

其中的原始资料包含(图2)

已标记语料指的是将学生论文,评论或所写案情摘要根据不同性质进行标注,共计120篇文本;最后的工具一项是在建库过程中所使用的检索工具,包含antconc3.2.4w.exe,Concapp.exe,GoTagger等.

3.3 语料收集、分类及标注

为了确保语料的真实性,本语料库的语料主要来自于网络,课本,电影,光盘以及学生们的书写材料.其中包括七本法律英语教材,如宋雷编著的《法律英语》,郭剑晶著译的《实用法律英语》,JayM. Feinman编著的Law101:EverythingYouNeedto KnowabouttheAmericanLegalSystem等;来自于学生法律英语期末考试或LEC考试中的20套试题;50篇美国经典案例文本;30篇法庭话语文本;30篇英美英美法庭电影台词文本,如《波斯顿法律》,《十二怒汉》或《惊爆内幕》等;120篇学生所写案例摘要、评论或论文;50多篇中英对照立法文本以及其他来自于与法律英语相关网站上的材料.

这个小型语料库的创建是以教学为目的,因此所含语料根据教学可以分为口语材料及书面材料,并且根据它们所使用语境,来源及时间进行进一步划分.每一篇语料的文件名可以数字及字母形式输入,如文本T18ALE指的是课本/第一册/第8单元/第一篇文章/书名-《法律英语》,C1102CR指的是案例/裁判时间-2011年/第几宗-第二宗/类别-刑法;此外,中英对照立法文本还可细分为民商法或刑法.然后将语料以单个文件形式保存在电脑里.

文件保存后,就要开始语料的标注工作.标注就是把语料的有用信息用一组符号一一标注出来.其中一篇课文的标注应当包括作者姓名,学生年级、专业、性别、年龄,文章风格,文章长度等.比如一本课本的标注如下所示:

1.=《法律英语》(书名)

2.=第二册

3.=第九单元,第一篇文章

4.=2006版

5.=这篇文章包含2000个单词

学生们书写材料中的错误也可标注,如下所示:

1.=学生们的案例摘要

2.=法学专业

3.=大三学生

4.=11年

5.=男

6.=这篇摘要包含300个单词

7.=文中语法错误

8.=遗漏错误

9.=标点符号错误

10.=拼写错误

3.4 语料赋码及整合

可以使用GoTagger对语料进行赋码.具体方法如下:

先在http://web4u.setsunan.ac.jp/Website/Go-Tagger.htm网站上下载GoTagger软件.然后在该网站上下载Brill赋码方案.接着复制“BinandData”文件夹中的10个方案并将方案文件粘贴到Go-Taggger文件夹的子文件夹“Gdata”中.这时可以使用GoTagger软件了,不过由于该软件不兼容中文,因此各文件夹以英文命名最佳.

随后用该软件给语料赋码,先打开软件,然后选择将要赋码的文章,点击“Add”或“AddAll”,接着点“Start”,赋码就会自动进行.在所有的语料赋码后,就需要用Concapp和Antconc软件将这些语料整合在一起.在此我们先使用Concapp软件将所有的Word文档转换成“.txt”文件.然后在网站上下载Antconc3.2.4w软件.然后点击在“File”选项中点击“OpenaDirectoryof‘txt.Files’”,在里面找到所需文件,选择目标文本并且确定.在此之后,点击“Start”键,可以检测小型法律英语教学语料库的可行性.

3.5 小型法律英语教学语料库适用性检测

在小型法律英语教学语料库建立之后,可使用Antconc来进行定位检索.通过检索,学生可以自主发现词语搭配规则,语言风格,错误类型等.教师可以将索引结果展现给学生,让其自主找出问题所在,提高学生们对法律英语学习的积极性.笔者在教学过程中,发现学生们对情态动词“should”和“shall”的用法存在困惑.因此将10篇共约两万多词的英文发条进行标注,其中所有情态动词全部标注为,然后使用Antconc检索情态动词的用法.在这10篇语料中,检索到的情态动词“shall”的词条总共有455例,而“should”为248例.根据索引结果,我们可以得知“shall”指的是“强制性承担法律或合同所规定的义务”,比如“therightofthepeopletobesecureintheirpersons,houses,papers, andeffects,againstunreasonablesearchesand seizures,shallnotbeviolated,andnowarrants shallissue…”;而“should”在法律文件中则指“如果”之意,从索引中可得知“should”总是和“if”引导的条件状语从句联系在一起,比如“butifthere shouldremaintwoormorewhohaveequalvotes, theSenateshallchoosefromthembyballotthe VicePresident.”因此,“shall”和“should”在法律英语中的应用完全不同,不能混淆.

4 结论

构建小型法律英语教学语料库及将其用于实际教学中,实现了法律英语教学过程中语言层面及教学层面的有效统一.小型法律英语教学语料库可以提供大量有价值的真实语言,反复呈现不同语境中的同一语言现象,有助于提高学生学习自主性,加深学生对法律语境的了解,挖掘法律语言背后所隐含的法的精神,改善以往传统法律英语教学过程中以语言层面为主的“阅读-翻译”方法,使学生真正掌握到英美法精髓,满足我国对涉外法律人才的高素质要求.

〔1〕Gries,S.T.etal.,(Eds.).(2010).Corpus-linguisticApplications:CurrentStudies,NewDirections.Amsterdam:Rodopi.

〔2〕Hunston,S. (2006).CorporainAppliedLinguistics. Cambridge: Cambridge University Press.

〔3〕Sinclair,J.M.(2004).HowtoUseCorporain LanguageTeaching.Amsterdam:John BenjaminsPublishingCompany.

〔4〕宋雷.法律英语教程[M].北京:外语教学与研究出版社,2011.

〔5〕谢家成.论个人教学语料库的构建[J].外语电化教学,2003(6):27-30.

〔6〕杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002.

H319

A

1673-260X(2014)12-0252-03

猜你喜欢

赋码语料语料库
《语料库翻译文体学》评介
英语视频新闻语料库的构建
基于语料调查的“连……都(也)……”出现的语义背景分析
基于COCA语料库的近义词辨析 ——以choose和select为例
基于JAVAEE的维吾尔中介语语料库开发与实现
迎接食品安全新法麒锐与您共谋发展
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
Reliability assessment consideringdependent competing failure process and shifting-threshold
加强科学化管理 全面提高代码工作质量