APP下载

二语非限时写作中四词词块使用情况研究

2015-03-03端义镭马广惠

关键词:词块

端义镭, 马广惠, 刘 艳

(1.金陵科技学院,南京 211169;2.南京师范大学,南京 210023)

二语非限时写作中四词词块使用情况研究

端义镭1,马广惠2,刘艳2

(1.金陵科技学院,南京 211169;2.南京师范大学,南京 210023)

摘要:运用语料库语言学技术考察二语非限时写作中四词词块的使用情况。结果显示:大多数本族语者笔语词块在二语写作中低频输出或零输出;学习者在写作中大量使用高频四词组合,但其中有些为本族语者口语词块,绝大部分则在本族语者语篇中相对低频。鉴于学习者与本族语者的词块产出水平差距较大,教师应重视词块教学,并可将语料库引入教学过程。

关键词:词块;程式语;二语写作;语料库语言学

一、引言

我们使用的语言中有相当一部分是程式语。它们作为预制件整体存储,在使用时整体提取,而非依据语法规则进行分析和产出[1]。语料库语言学的兴盛将词块这种特殊的程式语推向研究前沿。词块是通过预先设定提取频点、从语料库中提取的高频多词序列,是“可以独立用于构成句子或者话语,可以实现一定语法、语篇或语用功能的最小的形式和意义的结合体”[2]。

词块能力是衡量二语水平的重要指标之一[3],国内学者借助语料库语言学技术,对通用英语测试写作和学术英语写作中的词块使用情况展开丰富的中介语对比分析[4-7],但较少关注通用英语非测试写作中的词块使用情况。鉴于此,本研究拟以二语非限时作文为语料,从形式、意义、功能上综合分析其中四词词块的使用情况,并探讨影响学习者词块产出的可能性因素。选择四词词块是因为其使用频数远高于五词词块,易从语料库中提取,且结构和功能比三词词块更清晰[3]。

二、描述框架

出现频数和文本分布数是提取词块的两项标准。Biber等将四词词块的提取频点设为10次/百万词,并规定其必须分布于至少5个文本中[8]992-993。但提取频点具有一定的任意性,可根据研究目标和语料库库容适当调整,如Cortes将提取频点设为20次/百万词[3]。对于小型语料库而言,词块提取标准应更严苛,如库容为200 000词时,四词词块的提取频点可设为5次[9],相当于25次/百万词。

词块可依据其结构和功能属性归类,表1和表2为Biber等对本族语者笔语四词词块的结构[8]1014-1015和功能分类[10]。本研究将参考此分类。

表1 本族语者笔语四词词块的结构类型

表2 本族语者笔语四词词块的功能类型

三、研究设计

(一)研究问题

笔者将Biber等所列的276个本族语者笔语四词词块作为目标词块[8]1015-1024,考察其在二语学习者写作中的使用情况,由此产生本研究的第一组问题:目标词块在二语非限时写作中输出率如何?产生此结果的原因是什么?

除目标词块外,二语学习者可能会在写作中频繁使用其他类型的四词组合,由此产生本研究的第二组问题:二语非限时写作中还有哪些四词词块?其高频输出的原因是什么?

(二)研究语料

研究语料为435篇非英语专业大学生优秀习作,均在非限时条件下完成,剔除标题、图表、脚注、尾注及教师批注后,共计187 305词,平均431词/篇,篇幅远大于大学英语四六级测试写作。考虑到话题单一性会影响词块研究的结果[11],研究语料的话题涉及政治、经济、文化、历史、自然科学、体育、艺术等领域,以满足多样性的要求。

(三) 词块检索与提取

研究使用WordSmith Tools 5.0检索和提取词块。笔者先检索出276个目标词块在作文语料中的出现频数和索引行,用以回答第一组研究问题。然后参考Biber和Barbieri针对库容为200 000词的语料库所定的词块提取标准[9],将提取频点设为5次,并规定文本分布数最小值为3,从作文语料中提取所有符合要求的高频四词组合,并检索其索引行,用以回答第二组问题。

四、结果与讨论

(一)二语非限时写作中的目标词块

21个目标词块在二语非限时写作中的使用频数为5次以上,达到Biber和Barbieri为小库容语料库所定的词块提取频点[9],属高频输出;79个目标词块的使用频数为1~ 4次,未达到词块提取频点,属低频输出;176个目标词块零输出。总体而言,学习者对目标词块的产出情况很不理想。

表3 目标词块在本族语者非限时写作和二语非限时写作中的使用频数分布

表3显示,19个本族语者写作中使用频数为40次/百万词以上的目标词块中,7个在二语写作中的使用频数为5次以上,8个为1~ 4次,4个未使用,高频输出率和零输出率分别为36.8%和21.1%。191个本族语者写作中使用频数为10~ 19次/百万词的目标词块中,7个在二语写作中使用频数为5次以上,51个为1~ 4次,133个未使用,高频输出率和零输出率分别为3.7%和69.6%。经SPSS 21.0检验,目标词块在本族语者写作和二语写作中的使用频数存在显著的正相关关系(Kendall’s tau-b=0.227,P=0.000)。出现此结果的原因可部分归结于频率效应[12]。那些在本族语者写作中使用频数极高的词块在二语输入中的出现频数也可能很高,其共性特征易被强化,易于习得;而那些在本族语者写作中使用频数较低的词块在二语输入中的出现频数也可能较低,不易被习得。

21个目标词块在二语写作中高频输出,除频率效应外,还可能是词频等级和词块功能作用的结果。经Range 32检测,21个高频输出的目标词块的成分词均属于最高频1 000词,这些单词是学习者最早接触并习得的。学习者容易注意到二语输入中与之相关的多词组合,通过整体加工内化入心理词库。学习者还可通过组块效应习得这些词块,即将若干单词组合成多词序列,在不断重复的学习体验中达到一定程度的固化,最终以整体为单位在心理词库中形成表征[13]。此外,这21个目标词块中,8个用于时空信息标记,6个用于话题引导、详述和澄清(见表4),具有较强的指示、修饰和连接作用,属于强功能性词块,因此输出率很高。

176个零输出的目标词块中,36个含非最高频1 000词,如:presence or absence of和as a consequence of,学习者可能尚未习得absence和consequence,因此无法掌握与之相关的词块。即便已经习得,学习者也可能会回避使用。文秋芳等的研究表明,学习者在英语写作中普遍存在过度依赖最高频1 000词的问题[14]。

以下三类目标词块零输出率极高,原因可从结构和功能角度来阐释。

1.含定冠词the的词块

主要涉及名词和介词类词块,尤其是“名词短语+of短语片段”,如:the start of the,the time of the和the purpose of the,学习者倾向于分别使用不定冠词a,零冠词和指示代词this来代替the。出现此结果的原因可能是二语学习者对the的习得尚不充分,抑或是对词块的认知与本族语者不同。在学习者看来,the purpose of比the purpose of the更像是需要整体记忆的词块。

表4二语非限时写作中高频输出的目标词块

2.含后置修饰性从句片段的词块

主要涉及“名词短语+其他后置语片段”,如:the fact that the和the way in which,这与马广惠的研究发现一致[4]。此类词块的零输出可能是受到学习者母语的影响。有研究发现,若学习者的母语中没有关系从句或从句位于名词中心语的左边时(如汉语和日语),其二语输出倾向于回避使用位于名词中心语右边的修饰性从句[15]。

3.含被动语态片段的词块

主要涉及“被动动词+介词短语片段”“先行词it+动词/形容词短语片段”“(动词短语+)that-从句片段”“(动词/形容词+)to-从句片段”,如:is based on the,it should be noted,has been suggested that和has been shown to。被动语态牵涉到助动词的使用和及物动词的屈折变化,还会与时态、体和情态动词结合构成更为复杂的结构,因此成为二语习得的难点。此外,被动语态可用来实现特定的语篇、语用功能,如:增强表述的客观性,模糊施事身份等。因此,被动语态使用不足也可能与学习者和本族语者在写作风格和思维方式上的差异有关。

(二)二语非限时写作中的其他词块

除21个目标词块之外,依据在不少于3个文本中至少出现5次这一标准,笔者从作文语料中提取出121个其他类型的高频四词组合。其中13个为本族语者口语词块[8]1002-1014(见表5),这显示出二语学习者书面语的口语化倾向。与本族语者写作相比,二语写作有较高的读者/作者显现度,表现为人称代词I,we,you的过度使用[14]。13个二语写作中高频输出的本族语者口语词块中,8个含有I或you,其中4个用于情态表达,另外4个分别用于认知表述、话题引导、时间信息标记和命题意义表达。

另有108个高频四词组合在本族语者口笔语中均不常用,本文称之为学习者词块,其结构分布见表6。

表5二语非限时写作中高频输出的本族语者口语词块

表6二语非限时写作中学习者词块的结构分布

结构类型子类型名词类词块(26)1.名词短语+of短语片段(15);2.名词短语+其他后置修饰语片段(7);3.结构完整的名词短语(4)介词类词块(18)1.介词+嵌带of短语片段(9);2.其他介词短语片段(9)动词/从句类词块(62)1.先行词it+动词/形容词短语片段(3);2.被动动词+介词短语片段(2);3.系动词be+名词/形容词短语片段(5);4.(动词短语+)that-从句片段(2);5.(动词/形容词+)to-从句片段(10);6.状语从句片段(8);7.人称代词/名词短语+be(+……)片段(14);8.人称代词/名词短语+实义动词短语+(补语从句)片段(10);9.实义动词短语片段(8)其他词块(2)———

表6中的“结构完整的名词短语”“人称代词/名词短语+实义动词短语+(补语从句)片段”和“实义动词短语片段”并非本族语者笔语词块的结构类型(见表1)。其中第一类为学习者词块特有的结构类型,后两类则属于本族语者口语词块的结构类型[8]1001-1002。学习者词块中,动词/从句类词块共计62个,加上高频输出的本族语者口笔语词块,学习者共产出81个动词/从句类词块,占词块总数的57%。Biber等指出,本族语者笔语词块中仅有40%为动词/从句类词块,口语中该比例为90%[8]995。此处的57%再次体现出二语写作的口语化倾向。

进一步分析动词/从句类词块,笔者发现以下两个特点:一是含被动语态的词块仅有4个,而“(动词/形容词+)to-从句片段”“人称代词/名词短语+实义动词短语+(补语从句)片段”和“实义动词短语片段”中包含主动语态的词块共计26个,再次显示出学习者对被动语态的产出情况不理想。二是某些词块是学习者掌握的词汇化句干或其片段,其中大部分出自“状语从句片段”“(动词短语+)that-从句片段”“(动词/形容词+)to-从句片段”和“人称代词/名词短语+be(+……)片段”,如:as the saying goes,NP take-TENSE it for granted that __________,it be/become-TENSE AP for college students to VP和what NP can do is to VP。

学习者词块的功能分布见表7。

表7 二语非限时写作中学习者词块的功能分布

大部分学习者词块用于实现Biber等描述的语篇、语用功能[10]。但有6个词块指称实体概念,如:the national entrance examination和their parents or teachers;18个词块表达命题意义,如:I still remember the和different people have different。这两类四词组合高频输出可能是受写作话题的影响。有研究指出,本族语者产出的词块往往与语篇内容无多大关系,而学习者产出的词块则会与语篇内容直接相关[16]。

需要指出的是,108个学习者词块并不违背本族语者的语言直觉,亦可能在其笔语中出现,只是相对低频达不到词块提取频点,或许本族语者会使用其他形式来实现这些四词组合的意义和功能。但由于形式简单、语义明晰、功能性强,这些四词组合中有相当一部分可能会在二语输入中高频出现,因此易被学习者注意、加工、习得,并实现高频输出。

教学因素也应被考虑进去。很多语言教师要求学生记忆固定搭配、短语和句型,鼓励学生将其运用于会话和写作中。程式语的使用可减轻学习者工作记忆的即时运算负担,有效提高语言表达的流利度。更重要的是,学习者可以避免句法运算,在超越当前实际语言水平的条件下基于“习语原则”[17]表达意义,并采用链接策略将程式语连成话语[18],提高产出的准确性和复杂性。其中尤以词汇化句干的作用最为显著,因此本研究的学习者词块中包含较多的词汇化句干及其片段就不难理解了。

此外,这108个四词组合的成分词有近94%为最高频1 000词,学习者很早就习得了这些单词,很可能会在后续学习过程中通过组块效应生成与之相关的词块。

五、结语

本研究使用语料库语言学技术考察二语非限时写作中的四词词块使用情况。研究发现,大部分本族语者笔语词块在二语非限时写作中低频输出或零输出,影响输出率的可能性因素包括频率效应、词频等级、词块功能、学习者二语水平、母语影响及其在词块认知、写作风格、思维方式上与本族语者的差异。除本族语者笔语词块外,学习者在非限时作文中还使用了本族语者口语词块,显示出二语写作在短语学层面上的口语化倾向。然而,学习者产出的大部分高频四词组合在本族语者口笔语中都不常见,但符合本族语者的语言直觉,其高频输出可能是输入调整、教学因素和词频等级综合作用的结果。

研究表明,二语学习者的笔语词块产出与本族语者相比有较大差距,因此教师应重视对学生词块意识和能力的培养。教师可将语料库技术引入课堂,为学生提供目标词块列表、本族语者语料和词块检索软件,引导学生通过“观察—假设—实验—结论”四步骤学习目标词块,并在口笔语表达中反复使用,最终实现对目标词块的充分习得和自动输出。

参考文献:

[1]Wray A.Formulaic Language and the Lexicon[M].Cambridge:Cambridge University Press,2002:9.

[2]马广惠.词块的界定、分类与识别[J].解放军外国语学院学报,2011(1):1-4.

[3]Cortes V.Lexical bundles in published and student disciplinary writing:Examples from history and biology[J].English for Specific Purposes,2004,23(3):397-423.

[4]马广惠.英语专业学生二语限时写作中的词块研究[J].外语教学与研究,2009(1):54-60.

[5]张霞.基于语料库的中国高级英语学习者词块使用研究[J].外语界,2010(5):48-57.

[6]徐昉.中国学习者英语学术词块的使用及发展特征研究[J].中国外语,2012(4):51-56.

[7]王敏,刘丁.中国学习者英语学术论文手稿中立场标记词块使用研究[J].现代外语,2013(2):190-197, 220.

[8]Biber D,Johansson S,Leech G,et al.Longman Grammar of Spoken and Written English[M].London: Longman,1999.

[9]Biber D,Barbieri F.Lexical bundles in university spoken and written registers[J].English for Specific Purposes,2007,26(3):263-286.

[10]Biber D,Conrad S,Cortes V.If you look at…:Lexical bundles in university teaching and textbooks[J].Applied Linguistics,2004,25(3):371-405.

[11]Levy S A.Lexical Bundles in Professional and Student Writing[D].Stockton:University of the Pacific,2003:36.

[12]Ellis N C.Frequency effects in language processing:A review with implications for theories of implicit and explicit language acquisition[J].Studies in Second Language Acquisition, 2002,24(2):143-188.

[13]Ellis N C.Constructions,chunking,and connectionism:The emergence of second language structure[M]//Doughty C,Long M H.The Handbook of Second Language Acquisition.Oxford: Blackwell,2003:63-103.

[14]文秋芳,丁言仁,王文宇.中国大学生英语书面语中的口语化倾向:高水平英语学习者语料对比分析[J].外语教学与研究,2003(4):268-274.

[15]Ellis R.The Study of Second Language Acquisition[M].Oxford:Oxford University Press,1994: 423.

[16]詹宏伟.语块的认知加工与英语学习[M].杭州:浙江大学出版社,2013:16.

[17]Sinclair J.Corpus, Concordance, Collocation[M].Oxford:Oxford University Press,1991:110.

[18]陈万会.词块的心理现实性及其特征[J].外语学刊,2008(6):60-62.

(责任编辑:李晓梅)

A Study of Four-Word Lexical Bundles in L2 Untimed Writing

DUAN Yilei1, MA Guanghui2, LIU Yan2

(1.Jinling Institute of Technology, Nanjing 211169, China;2.Nanjing Normal University, Nanjing 210023, China)

Abstract:This study employs corpus linguistic techniques to investigate how four-word lexical bundles are used in L2 untimed writing. It shows that most of the native speakers’ written bundles either have a low output rate or do not occur at all in L2 writing. Learners do use a number of high-frequency four-word exemplars in their writing; however, some of them are native speakers’ oral bundles and the majority are relatively infrequent in native speakers’ discourse. Given that learners’ bundle use deviates considerably from native speakers’ use, EFL teachers should attach importance to bundle instruction in which corpus evidence can be utilized.

Key words:lexical bundle; formulaic language; L2 writing; corpus linguistics

中图分类号:H319

文献标识码:A

文章编号:1674-0297(2015)06-0130-05

作者简介:端义镭(1981-),男,江苏南京人,金陵科技学院讲师,研究方向:应用语言学;马广惠(1957-),男,河南浚县人,南京师范大学教授,博士生导师,研究方向:应用语言学;刘艳(1982-),女,安徽阜阳人,南京师范大学讲师,研究方向:应用语言学。

基金项目:江苏高校哲学社会科学研究基金指导项目“江苏省独立学院学生英语水平动态调研以及配套教材建设——以四所学院为例”(2014SJD127)

*收稿日期:2015-05-07

猜你喜欢

词块
医学学术论文英文摘要词块及其结构和功能研究
如何在高中英语词汇教学中运用词块理论
借助词块理论,开展词汇教学
例谈词块理论指导下的高中英语写作教学
词块学习策略与初中英语写作教学
高中英语写作中词块教学的应用策略分析
词块在英语写作教学中的应用
英语专业学生与本族语名人演讲中词块使用特点探究
高中英语词块教学现状调查研究及应用策略分析
词块理论在高中英语写作教学中的应用