APP下载

语料库微型文本在英语语言测试材料编写中的应用

2013-09-07

武汉船舶职业技术学院学报 2013年5期
关键词:表达式外语教学语料

梁 波

(广东药学院 外国语学院,广东广州 510006)

在外语教学和研究领域中,新兴的语料库技术受到越来越多的重视。语料库(Corpus)作为语言资料库,收集了大量的语言信息,为研究者提供了一个分析、研究、描述和应用语言的载体。语料库是在随机采样的基础上广泛收集人们实际使用、有代表性的真实语言材料而创建的。通过借助宏大的计算机数据库,语料库为编写词典、语法及各种教材提供了重要的语料资源,并为英语语言研究提供了新的途径。

语料库的突出特点是库中所包含的语言真实、数据庞大,在大型通用语料库中,各种语言现象应有尽有。同时,语料库在语言测试试题的编写方面具有广阔的应用前景。Leech【1】曾指出,由于正确的答案就在语料库之中,利用语料库自动编写语言测试题应该是十分可行的。然而,尽管计算机软硬件飞速发展,对大型语料库进行复杂的检索并不需要耗费很长时间,但教学的各个不同阶段均有比较明确的目标,理应根据不同需要量体裁衣,在实际的外语教学中使用不同难度、适用于不同场合的语言素材,而大型语料库数据的庞杂性使得外语教学工作者很难在短时间内有效地从海量语料库中获取合适的语言素材【2】。

为此,借鉴Sinclair【3】【4】【5】关于分析索引行的做法以及梁茂成、李文中和许家金在《语料库应用教程》一书中提出的关于微型文本的概念,本文以编制英语语法单项选择题为例,探讨如何通过语料库应用软件PowerGREP,从语料库中抽取适当数量的索引行,创建微型文本,建设英语语言测试材料编写素材。

1 微型文本的创建

1.1 语料库和软件准备

考虑到语料库的容量,本文的示范语料选取自英国国家语料库(British National Corpus,BNC)。该语料库含有9000万词次的书面语和1000万词次的口头语语料,语料选取余地较大。完成微型文本中文本处理步骤的软件工具为PowerGREP,该 软 件 可 从 网 页 http://www.powergrep.com上下载。一般对于自建的专业用途语料库或利用网络资源建立的语料库,在最初的文本清洁过程中需要进行简单的分句处理,软件PowerGREP可实现该步骤的操作,通过替换功能实现简单的分句,但由于本文的语料来源于BNC大型语料库,入库语料均已经过分句处理,所以该步骤可省略。

1.2 微型文本的创建与编辑

点击运行PowerGREP软件,选取语料库,创建微型文本。具体步骤如下:

(1)运行PowerGREP软件,在该软件的程序主界面左上区域的【Folders and files】一栏中选择语料库所在文件夹,右键点击后选择【Include Folder and Subfolders】选项(参见图1)。需要注意的是,在这个步骤下进行的语料库选择,须为教学工作者根据自己的需要和学生水平所筛选和编辑的语料,在具体选取时,要考虑这些语料作为素材是否难易适中。

图1 在PowerGREP中选择语料

(2)在PowerGREP主界面上方的功能区域找到【Action Type】一栏,点选Collect data选项(参见图2):

图2 在【Action Type】中设定选项

在图2所处的软件界面中,实际上还包含了上部表达式输入框和下部表达式输入框,其中【Search】一栏为上部表达式,【Collect】一栏为下部表达式。具体可参见图3:

在【Search】和【Collect】这两个输入表达式界面中,需要输入的是相应的表达式语言。笔者在此处选取英文单词vocabulary为例,由于上部表达式需要匹配原语料库中所有包含vocabulary一词的句子,因此将这些句子分为三部分,分别为:句首至vocabulary部分;vocabulary;vocabulary至句末部分。这三部分分别用3个括号分组标记,vocabulary前后的空格用两个\s匹配。具体表述方式为:

图3 输入表达式界面

下部表达式中用$1,$2,$3分别表示上部表达式中对应的三部分,即$1= 句首至vocabulary部分;$2=vocabulary部分;$3=vocabulary至句末部分。Vocabulary一词前后两个空格用制表符( t)表示。具体表述方式为:

将上述两个表达式分别输入表达式框内即显示为图4:

图4 输入上下部表达式界面

(3)按照图5的界面所示,在PowerGREP主界面下方的创建文件设定区,对文件创建方式【Target file creation】和目标文件存放处【Target file location】进行设定。其中,将目标文件创建方式设定为【Save results into a single file】,将目标文件存放处设定为教学研究者自行制定的保存界面,如C:\User\bob\Desktop\vocabulary.txt,具体可见图5:

以上步骤完成后,点击PowerGREP主界面上的【Collect】按钮,便可遵循目标文件存放处地点建立起一个名为vocabulary.txt的文件。该文件中采集了所选语料库中全部还有vocabulary一词的句子,而不含有该词的句子则自动被排除。

图5 设定目标文件

2 语言测试材料的编制

参考以上步骤,教学工作者可根据检索的关键词和词组搭配,随意选取自己认为合适的语料,组建微型文本。将这个步骤运用到英语教学中的语言测试材料编制工作上,则只需要有一个合适的语料库,通过语料库查询的方法将题干从语料库中抽取,再把题干和选项按照一定的格式编排,便可构成一道单项选择题。以下题为例:

这道选择题主要由三部分组成,分别为:(1)题号,即“1”,通常还会在题号后加一个点号和空格,把题号和题干分开;(2)题干,即句子本身,该部分可直接从语料库中抽取真实的语言。同时,题干部分出现下划线“_____I”,是考点所在;(3)选项,一般有A\B\C\D四个标记,其中一个是正确答案,其余为干扰项。

按照单项选择题题型的特点,以上题为例,可以确定答案选项为as a result,in a word,by the way和on the contrary。因此,在创建微型文本时,【Search】和【Collect】两个表达式输入方框内的表达式则应为:

输入PowerGREP界面后如图6:

完成这一操作后,将从语料库中抽取的所有包含四个选项的句子保存到名为choice.txt的微型文本中。然后运行PowerGREP软件,选中微型文本choice.txt,再进行一次Collect。本次操作中,Search不变,Collect的表达式变更为:

图6 创建编制练习题所需微型文本

在本次抽取过程中,所用的是PowerGREP内置的表达式“%MATCHFILENS%”,后边加了点号和空格,之后是“$1”,即微型文本的每个句子中选项之前的部分。微型文本的原选项被替换成了“______”,之后是微型文本原句中选项之后的部分“$3”和一个回车符号和换行符号“\r\n”。最后逐步输入四个选项,点击【Collect】,变成完成操作。随后,将所得文本保存为question.txt,打开后可看到这个文本的格式正符合所需要的单项选择题格式,可直接应用于语言测试的材料编写(图7)。

图7 根据微型文本编制的语言测试材料

同样,使用类似的步骤,可再次抽取练习题的答案,只需要把【Collect】表达式输入框中的表达式改为“%MATCHFILENS%.$2”,将输入文件名改为answer.txt即可(图8)。

图8

3 结 语

语料库应用涉及大纲制定、教材编写、阅读材料选择等多个外语教学研究环节,无论是课前准备阶段还是课堂课后练习题编写阶段,使用语料库时无不涉及索引工具。外语教学工作者利用语料库资源,结合相应软件,抽取适当的索引行,创建微型文本,作为编制英语语言测试素材,既可省去使用大型语料库的种种繁杂操作,也可通过精心挑选,设计出重点突出的微型文本,激发学生学习兴趣。

1 Leech,G.1991.The state of the art in corpus linguistics.In K.Aijmer &B.Altenberg(eds.).English Corpus Linguistics.London:Longman.8-29.

2 梁茂成,李文中,许家金.语料库应用教程[M].北京:外语教学与研究出版社.

3 Sinclair,J.1991.Corpus,Concordance,Collocation.Oxford:Oxford University Press.

4 Sinclair,J.2003.Reading Concordances.London:Pearson.

5 Sinclair,J.2007.The search for units of meaning.In W.Teubert & R.Krishnamurthy (eds.).Corpus Linguistics(Vol.3).London:Routledge.3-29.

猜你喜欢

表达式外语教学语料
从震旦到复旦:清末的外语教学与民族主义
一个混合核Hilbert型积分不等式及其算子范数表达式
表达式转换及求值探析
浅析C语言运算符及表达式的教学误区
The Book Review of Methods of Critical Discourse Analysis
“Less Is More”在大学外语教学中的应用
基于语料调查的“连……都(也)……”出现的语义背景分析
华语电影作为真实语料在翻译教学中的应用
《苗防备览》中的湘西语料
外语教学法的进展