APP下载

英语专业学生高分和低分作文中词块使用研究

2011-12-25天津科技大学陈建生王清华

中国轻工教育 2011年5期
关键词:低分词块语料库

□天津科技大学 陈建生 王清华

英语专业学生高分和低分作文中词块使用研究

□天津科技大学 陈建生 王清华

本文参照Biber(2009)的词块研究框架体系,运用高、低分作文语料库研究不同水平的英语专业学生议论文中四词词块的使用特点,并且参照Biber(2009)对本族语者的考查进行分析。结果表明:英语专业学生高分作文中的词块数量和类型明显多于低分学生作文,但二者作文中都出现很多主题相关词块;二者在词块中空缺处单词的可变性都不强,可填入的单词数量较少,但总体上高分学生作文比低分学生作文更多使用了内部带有可变性空缺的词块且用法更灵活。

语料库语言学;词块;词块类型;可变性

一、引言

写作一直是英语学习的重要输出方式,是英语学习者水平的重要体现。词汇是写作的有机组成部分,在二语习得研究领域,词块研究成为词汇深度研究的一个重要组成部分,近年来受到学者们的普遍关注。在自然语言中存在着大量兼有句子和词汇特征的固定或半固定的语言结构,这种模式化的词语组块以整体的形式存储在人的大脑中。Nattinger&DeCarrico(2000)认为,语言产出的过程就是“对预制语块进行选择,然后将这些语块串联起来的过程。”Biber&Conrad(1999)认为,词块是在语料库中反复出现的词语片段。学习者在语言习得过程中需要使用大量的词块,而本族语者通常掌握了丰富的词块使得其语言表达自然流畅。运用词块可以有效地提高写作的流利度、准确度以及语篇的组织能力。鉴于词块对语言习得的重要作用,所以,对于学生作文中的词块使用特点值得考查。

目前,国内研究英语写作中的词块,多是对比我国学生和英语本族语者的语言特征。但由于目前很难找到与中国学生的作文题目相同的英语母语语料,所以,对比只能基于文体相似的原则。本文则侧重研究在同主题下,以4词词块为切入点,对比分析高分和低分作文在词块运用上的异同。

二、Biber对于词块的研究

词块这个概念首次出现在Biber et al.1999年出版的著作Longman Grammar of Spoken and Written English中。Biber et al.认为,词块是扩展化搭配,它们可以是三词组合、四词组合或者四词以上的组合。这些词的组合不一定是传统意义上的语法单位,在意义上也不像习语那样约定俗成。

Biber&Conrad(1999)以400万词的英国英语口语语料库和530万词的美国英语及英国英语书面语语料库为基础,对比分析了对话及学术文章中的词块差异。研究结果显示:词块是口语及书面语中的基本结构单位,它们可以在语言学习过程中获取。在教学过程中,通过帮助学生掌握各种类型的词块,可以使他们不断提高语言水平。Biber&Conrad(1999)这篇文章在各方面都具有新意:首先,使用的语料库规模较大,用来分析的数据更可靠;其次,之前都是对口语中的词块研究较多,而这项研究则将口语和书面语中的词块进行对比分析;最重要的一点是通过研究发现词块的语法关联性。

Biber et al.(2004)从结构和功能角度分别考查了四词词块在课堂教学和教科书这两个不同领域的使用情况。这个研究是对Biber&Conrad(1999)研究的进一步深化和验证。

此后,Biber(2009)对比分析了规模分别为450万词的美国英语口语语料库和530万词的英语书面语语料库,描述这两种语料库中的四词词块差异。这是一个语料库驱动式(corpus-driven)的研究,选取了这两个语料库中最常出现的四词词块,具体描述了两类词块类型:多词搭配(multi-word collocation)与多词程式序列(multi-word formulaic sequence)。同时,这项研究比较了两种统计方法,即MI值与简单频数。Biber的研究结果表明,MI值适用于二词词块的确定,但是如果涉及词语顺序,MI值则不适用于对二词以上词块的研究。该研究结果还揭示出对话当中的四词词块与学术文章中的四词词块有显著差异。对话中的词块都是固定序列,包括功能词和实义词,而学术文章中的词块由不变的功能词和可变的实义词组成,正如填空一样,空缺处由一定范围内的实义词构成。

笔者在本文中,参照Biber(2009)的框架体系,研究我国英语专业学生TEM八级考试中高分和低分作文在四词词块运用上的异同。之所以选取四词词块作为研究对象,是因为之前对三词词块进行的研究较多,而对三词以上的词块进行的研究则略显不足,此外,四词词块也包含了三词词块。

三、语料库及数据的采集

本文所研究的数据来自两个语料库,分别为高分作文与低分作文语料库。语料均选自上海外语教育出版社2008年出版的CEM语料库(Corpus for English Majors)中2004-2006年英语专业八级部分考试的作文。两个语料库共计约20万词,其中高分作文库(14-18分)约10万词,低分库(7-11分)约10万词。专八考试为全国性的权威考试,其作文评分具有较高的信度。

研究所使用的检索工具为WordSmith语料库检索分析软件。此外,还使用了自编的计算机程序来处理词块的批量检索。

本文设定的词块筛选条件为:4词词块,每10,000词至少出现5次,且至少分布在3个文本中。

词块研究所涉及的类符和形符的概念与单个词的不同。在做词块研究的时候,一般是把不同种类的词块的数量统计为类符数,而某一类词块出现的频数统计为形符数。假如在一个语料库中,四词词块as a result of出现20次,in such a way出现15次,for the first time出现10次,则类符数统计为3,形符数统计为(20+15+10=)45。

四、分析及讨论

1.词块使用的总体特征

根据上述数据采集和统计方法对两个语料库的四词词块进行检索和统计,得到的数据见表1和表2。

表1 四词词块在高、低分作文中数量的对比

从表1的统计结果可知:总的看来,在高分和低分作文总词数相当的情况下,二者在四词词块(即形符)的使用数量上有相当显著的差异。高分学生比低分学生更多使用了四词词块,大体看出高分学生比低分学生更具有词块意识。

表2 四词词块在高、低分作文中的类符数对比

从表2的统计结果可知:总的看来,高分和低分作文在四词词块的使用类型上也存在显著差异。高分学生比低分学生使用的四词词块类型更丰富。

在了解了高、低学生作文的总体特征后,笔者做了进一步的统计和比较,结果见表3和表4。

表3 四词词块在低分作文中的频数分布(次/10,000词)

表4 四词词块在高分作文中的频数分布(次/10000词)

表3和表4中的数据显示,两个语料库中频率较高的词块大部分集中于每10,000词出现5至10次之间,但在各个层次上无论是词块类型还是词块的使用数量上,高分学生作文都优于低分学生作文。通过对具体的词块列表做进一步的观察还可以发现,无论是高分学生作文还是低分学生作文中,都有很多词块具有包含的关系,如to go in for,go in for business均包含在to go in for business这样一个更长的词块当中。但是,Biber(2009)在对本族语者的考查中鲜有此类情况,这说明,无论高分学生还是低分学生使用的词块类型均不如本族语者丰富。

2.词块类型及可变性差异

Biber(2009)认为,词块中每个空缺所占的比例,决定了该空缺是相对固定的还是具有可变性,并将决定词块空缺处可变性程度的百分比定为50%。也就是说,如果四词词块中某一空缺处的单词在该词块中所占比例超过50%以上,那么,就认定这个空缺比较固定,相反,则认为这个空缺具有较大的可变性。Biber用*来表示在一个词块中的可变性空缺。

以低分学生作文语料库中的词块is a good way为例,词语序列*a good way出现了37次,其中有26次都是以is作为第一个空缺处的单词,即占70%;is*good way出现26次,其中有26次都是以a作为第二个空缺处的单词,占100%;is a*way出现36次,其中有26次以good作为第三个空缺处的单词,占72%;这三个空缺处的单词所占比例都很大,这三个空缺处的单词比较固定;而is a good*出现了63次,其中只有26次是以way作为第四个空缺处的单词,只占41%,这一空缺是可变性最强的;因此is a good way即归入123*这一词块类型。以此类推,低分学生作文语料库中we decide and choose这样的词块则应归为1234类型。因为词语序列*decide and choose出现了59次,其中有44次都是以we作为第一个空缺处的单词,即占75%;we*and choose出现44次,其中有44次都是以decide作为第二个空缺处的单词,占100%;we decide*choose出现48次,其中有44次以and作为第三个空缺处的单词,占92%;we decide and*出现了47次,其中44次是以choose作为第四个空缺处的单词,占94%。可见这四个空缺中的每一个相同单词所占比例都很大,说明这四个空缺处的单词都比较固定,可变性小。

经观察与统计,高、低分作文语料库中出现的词块类型都为14类,分别为1234,*234,123*,*23*,12*4,*2*4,1*3*,1*34,12**,**3*,**34,*2**,***4,1***。根据研究需要,在这里只讨论高频词块类型在高、低分作文中的使用情况。

首先,无论是高分作文还是低分作文,出现比例最高的词块类型均为1234。高分作文中1234类型词块比例为60%,低分作文中比例为58%。说明二者的高频词块都和作文命题紧密相连,如the interview as a,get prepared for the等。1234类型词块大量出现的原因还可能是在考试限时的情况下二者均采取了回避策略,回避不熟悉的词块,而直接采用了题目下的写作提示中出现的词块。

其次,在高、低分作文语料库中所占比例都较高的是连续的序列,以可变性空缺为开头或者结尾,如to be a*,*is a good等,所代表词块类型为123*和*234;而Biber(2009)对本族语者语料库的考查中大多数词块不是此类,而是内部带有可变性空缺的结构序列,如the end of the,in the case of等,所代表的词块类型即为1*34和12*4,本族语者使用的四词词块多数具有高度的能产性。经统计,在低分作文语料库中类型为*234和123*的词块总共占22.17%,高分作文语料库中类型为*234和123*的词块总共占21.58%,由此可见高、低分学生作文中都使用了相当数量的此类词块,高分学生用的稍少更接近本族语者。而且经过进一步观察发现,高分学生作文中词块空缺处所运用的词汇也比低分学生作文要丰富。如词块类型a lot of*在两个语料库中均有出现,两者最高频的词块均为a lot of people。a lot of people在低分学生作文语料库中所占比例为7%,在高分语料库中占6%。低分作文在词块类型a lot of*空缺处的其它词汇为time,students;高分作文则为time,money,difficulties。虽然二者在空缺处所填的词汇数量都少且不够丰富,但高分学生作文还是略好一点。

此外,前面已提到Biber(2009)对本族语者语料库的考查中四词词块大多属于1*34,12*4等类型,分别如the end of the,in the case of等词块。Biber认为内部带有可变性空缺的词块具有更高的能产性。接下来,本研究将对内部带有可变性空缺的词块分别在高、低分作文语料库中的使用情况做进一步的统计和比较,结果见表5和表6。

表5 内部带有可变性空缺的词块在低分作文语料库中的使用情况

表6 内部带有可变性空缺的词块在高分作文语料库中的使用情况

表5和表6中的数据显示,低分作文语料库中12*4和1*34类型的词块总数为206,二者总计6.89%;高分作文语料库中12*4和1*34类型的词块总数为421,二者总计9.86%。卡方检验结果表明两者具有非常显著的差异(χ2=16.28,p<0.001)。所以总体而言,高分学生比低分学生更多使用了内部带有可变性空缺的词块,词块更丰富。虽然12*4类型的词块在低分作文语料库中所占的百分比略高于高分作文语料库,但经过进一步观察具体的词块列表发现,低分学生作文中很多是空缺处所填词汇并不丰富的词块,如词块类型it is*that在两个语料库中均有出现,低分学生作文在空缺处填入的词汇为true,said;而高分学生作文在空缺处填入的词汇为true,obvious,ambition。此外obvious,ambition这些长词、难词体现出高分学生比低分学生具有更好的词汇储备。对于1*34类型的词块,高分学生不但比低分学生使用的数量更多,而且词块空缺处所运用的词汇也更丰富。如词块类型students*go in在两个语料库中均有出现,低分学生作文在空缺处填入的词汇为should,can;而高分学生作文在空缺处填入的词汇为should,can,who,这说明与低分学生相比,高分学生更具有使用结构较为复杂的定语从句的意识。再例如表达“同意”的观点时,低分作文中只出现了i agree with*(123*),而高分学生则还应用了变换形式i*agree with(1*34)这种词块,而且空缺处会使用quite,totally这样的副词来修饰动词agree,因此可以看出高分学生能够更灵活使用内部带有可变性空缺的词块,词汇更丰富。

五、结语

本论文以同主题下4词词块为切入点,对比分析了英语专业学生高、低分作文中词块运用的异同。结果显示:高分作文中的词块数量和类型明显多于低分作文,但二者作文中均出现很多主题相关词块。二者在词块中空缺处单词的可变性都不强,可填入的单词数量较少,但总体上高分学生作文比低分学生作文更多使用了内部带有可变性空缺的词块且用法更灵活。通过本研究还可看出,擅长使用词块的学生写作句型也更丰富,写作质量高于其他学生。所以,与高分学生相比,低分学生更应加强对词块的学习,以提高写作的流利性和准确度。

笔者认为,在教学中应注重培养学生的词块意识以及学生词块知识的积累。因为词块结构的稳定性,会使得词块容易习得和应用,而词块结构中可变成分正是创造性使用语言的空间。教师可以引导学生适当进行词块中的词汇填空练习,帮助学生在记忆词块的同时,灵活运用词块。对英语写作教学而言,应突出词块在写作中的重要地位,引导学生在日常的写作练习中运用词块,以提高学生整体的写作能力和水平。

[1]Biber,D.,S.Johansson,G.Leech,S.Conrad&E.Finegan Longman Grammar of Spoken and Written English[M].London and New York:Addison Wesley Longman,1999.

[2]Biber,D.&S.Conrad Lexical Bundles in Conversation and Academic Prose[J].In Hasselgard,H.&S.Oksefjell(eds.).Out of Corpora:Studies inHonourofStig.Johansson,Amsterdam:Rodopi,1999.181-189.

[3]Biber,D.,S.Conrad&V.Cortes If you look at…:Lexical Bundles in University Teaching and Textbooks[J].Applied Linguistics,2004,25(3):371-405.

[4]Biber,D.A corpus-driven approach to formulaic language in English:Multi-word patterns in speech and writing[J].InternationalJournalofCorpusLinguistics,2009,14(3):275-311.

[5]Nattinger,J.&J.DeCarricoLexicalPhrasesand Language Teaching[M].上海:上海外语教育出版社,2000.

[6]濮建忠.英语词汇教学中的类联接、搭配及词块[J].解放军外国语学院学报,2003(6):438-445.

[7]戚焱.预制语块与大学英语写作[J].山东外语教学,2005(5):64-66.

[8]王立非,张岩.基于语料库的大学生英语议论文中的语块使用模式研究[J].外语电化教学,2006(4):36-41.

G642.0

猜你喜欢

低分词块语料库
加氢装置低分气脱硫效果影响因素分析
低分剧成了大众的“情绪容器”
《语料库翻译文体学》评介
词块在英语写作教学中的应用
孩子考了低分以后
英语专业学生与本族语名人演讲中词块使用特点探究
高中英语词块教学现状调查研究及应用策略分析
让“低分”学生道歉不是挫折教育
词块在初中英语写作教学中的应用研究
基于JAVAEE的维吾尔中介语语料库开发与实现