APP下载

学习者硕士学位论文中的词串研究

2010-12-07娄宝翠

当代外语研究 2010年9期
关键词:词串语料库短语

娄宝翠

(河南师范大学外国语学院,新乡,453007)

0. 引言

在过去的二十年中,学者对学术英语(English for Academic Purpose,以下简称EAP)进行了大量的研究,且多数研究是关于学术语言的语法和词汇特征。其中,多词序列作为流利语言表达的重要组成部分,引起了学者的关注,并用不同的术语加以研究,如:“词汇短语、固定短语、预制模块、习语、词串”。有关多词序列的研究主要集中于两个话题:一是如何有效地定义和识别多词序列;二是如何分析其语篇功能(Weinert 1995)。多词序列的高频出现表明了这些词汇组合已经成为话语社团中习惯使用的语言(Schmitt & Carter 2002),它在语篇中的重要性可以通过不同角度的实证研究得以证实。对它的研究将有助于观察在特定语境中作者如何使用短语,以及从短语的角度理解好的学术语篇如何形成、学习者写作水平和差距等(Howarth 1996;Scott & Tribble 2006)。

判断外语学习成功与否的标准之一是语言使用的流利性,而能够正确理解并使用多词序列是判断语言表达流利性的一个重要因素(Simpson 2004;Hyland 2008b)。在英语教学和学习中,学生经常会遇到固定短语和习语,如动词短语look after,put up with,这些短语通常会在教材和词典中清晰列出,容易受到教师和学生的注意;同时,也会遇到大量多词序列,如it should be noted,as can be seen,这些多词序列在教材和词典中大多没有明确标出,因此,和前面的固定短语和习语相比,通常不易引起注意。这些多词序列只能通过使用计算机软件进行识别,不能依靠直觉来识别,因为它们在直觉上并不是学术英语典型的序列(Oakey 2002)。因此,需要进行更多的基于EAP语料库的研究,关注学术写作中高频出现的多词序列,为EAP教学提供借鉴。

本研究采用Biber等(1999)提出的研究框架,用数据驱动的方法来识别高频的多词序列(本文称为“词串”),将我国学习者学术英语语料和国际权威期刊发表的学术英语语料进行对比,旨在探讨我国学生写作中词串的频率、结构和功能特征,以便发现学生在学术写作中亟需掌握的词串知识,从而增强其撰写英语学术论文的能力。

1. 文献回顾

Biber等(1999)在《朗文英语口语笔语语法》中将“词串”定义为“文本中反复出现的最高频的词语序列”,这个定义严格以频率为基础,不考虑结构和功能标准。词串有两个典型特征:一、通常不具有习语的意义;二、通常不是完整的语法结构(Biber 2006:134)。

近期有关词串的研究表明:(1)文本中包含许多高频词串;(2)词串通常有强烈的结构倾向性,尽管它们通常不具有完整的结构;(3)它们的语篇功能可以识别;(4)不同领域倾向于偏爱使用不同的词串;(5)词串被储存为不可分割的多词序列,而不是具有能产性的语法结构(Cortes 2002,2004;Biberetal. 2004;Hyland 2008a,2008b;Biber 2009)。词串研究认为,我们日常生活中大量的语言使用是由预制表达式构成的,对语言使用完全是组合而成的观点提出了挑战。词串的重要性体现在其使用频率和明显的语篇功能两个方面。研究表明,词串是一个基本的语言学概念,在学术语篇中极为重要,不仅出现频率较高,而且具有语篇建构的重要功能,是语篇重要的构建模块,体现基本的交际功能。

词串有强烈的结构倾向,例如,Biber等(1999)发现了学术语篇中四词词串最普遍的结构。Biber认为,学术语篇中大多数词串都是不完整的结构单位,用作语篇的构造模块。这些模块倾向于名词模块和介词模块,并且根据是否包含嵌入的of短语,分别可以进一步分类。Biber等(2004)进一步归纳出词串的功能类别:(1)立场表达;(2)语篇组织;(3)指示表达。这种分类能够很有效地对比口语和笔语语体的差异,但是本研究只关注笔语语料,因此,本文将采用Hyland(2008a,2008b)的分类。他认为,词串在学术写作中主要有三类:研究型词串、语篇型词串和参与型词串。研究型词串用来帮助构建外部世界真实的行为和经历;语篇型词串用来组织语篇,将信息或论点根据意义进行组织;参与型词串主要关注文本的作者和读者。每一类又可以根据具体功能进一步分类,如表1:

表1 四词词串功能分类(根据Hyland 2008a略有改动)

(续表)

词串的另一个重要特征是其在不同体裁和领域中系统的变异性。例如,研究发现,词串在课堂教学的口语体裁中与其在教材中的频率和功能大相径庭(Biberetal. 2004;Biber 2006,2009)。学术写作中,不同学科倾向于选择特定的词串,词串不仅对创作学术语篇至关重要,而且还是区分学术写作学科属性的手段。

以往对学习者写作中的词串研究主要是针对英语环境下的学习者(Oakey 2002;Cortes 2002,2004;Hyland 2008a,2008b),并且大多数基于语料库的EAP研究都是基于英语本族语语料库(Thompson 2006;Gilquinetal. 2007),二语学习者写作中的词串研究相对较少。但是这些研究有助于EAP研究,并为EAP教学提供借鉴。国内有关学习者的词串研究主要从错误分析的角度,关注特定词串的使用频率或搭配,较少关注其在语篇中的功能(濮建忠2003;刁琳琳2004),基于学习者EAP语料库的词串研究较为鲜见。

本研究旨在回答以下三个研究问题:(1)我国英语学习者写作和国际权威期刊论文中的高频四词词串分别是什么?(2)这些词串的结构和功能特点分别是什么?(3)学习者写作中四词词串有什么特征?研究假设是学习者写作中的词串将少于国际权威期刊论文中的词串。

2. 方法和步骤

词串只能通过计算机软件识别,而不能通过直觉来判断,因此,需要利用语料库方法来了解学习者在学术写作中是如何使用词串的。

本研究语料由两个语料库组成(见表2):一是由应用语言学专业国际权威期刊的研究论文构成(以下简称PUB_AP),另一个学习者语料库是由高校应用语言学硕士学位论文构成(以下简称HNU_AP)。选择应用语言学专业主要是因为能够搜集到充足的语料,以使对比分析更加可靠。PUP_AP包括以下六个期刊2007年发表的298篇研究论文:AppliedLinguistics,TESOLQuarterly,InternationalJournalofCorpusLinguistics,JournalofEnglishforSpecificPurpose,JournalofPragmatics,JournalofSecondLanguageWriting。HNU_AP选自中国英语语料库的学习者子语料库,由河南师范大学2003-2009年应用语言学专业50篇硕士论文构成,只保留其正文,不包括致谢、论文摘要、目录和附录。

表2 语料库信息

本研究关注的四词词串是学者研究的焦点,主要原因在于四词词串比五词词串更普遍并且比三词词串有着更加清晰的结构和功能特性(Cortes 2002,2004;Biberetal. 2004;Hyland 2008a)。许多四词词串包含三词词串,是三词词串的延伸,在结构上和功能上有更大的变化。

Biber et al.(1999)提出的词串识别标准是:每百万词至少出现10次,并且至少出现在5个文本中。本研究将采用Hyland(2008a,2008b)更为保守的方法,将其最低频率定位每百万词20次,至少出现在总文本数的10%中。

WordSmith 5.0(Scott 2008)主要用来完成两个任务:一、统计出两个语料库中的四词词串,在这个过程中,词串的频率和分布也可以统计出来;二、得到给定词串的索引行及其上下文,以确定其在语篇中的功能。基于此,我们可以进行结构和功能层面的对比分析,从而发现学习者词串使用的特征。

3. 频率和结构特点

通过使用WordSmith 5.0,得出两个语料库中的四词词串,排除掉出版社和期刊名称的专有名词词串,根据设定的标准,即每百万词至少出现20次,而且至少出现在10%的文本中,统计出两个语料库中的词串,其中,PUB_AP中有104个,HNU_AP中有250个。简单进行数量的对比意义不大,但该数据证实了Cortes(2004)和Hyland(2008b)的研究发现,即硕士论文中的词串比研究论文中的词串多。和发表论文相比,学习者不仅使用较多的词串,而且使用频率较高。这说明学习者在展开论证的过程中,较倾向于依赖某些特定的词串。

在整理学习者词串的过程中,有160个词串满足了每百万词20次以上的条件,但是不符合出现在10%以上文本的条件,因此被排除在词串之外。在160个词串中,99个(61.9%)只出现在一个文本中。通过观察发现,其中大多数是话题型序列。这表明有些学习者会过度依赖某些特定的语言项目,使得其写作显得繁琐。

表3 PUB_AP和HUN_AP中最高频的30个词串

表3显示了两个语料库中最高频的30个词串。在PUB_AP中,ontheotherhand,inthecaseof,atthesametime是三个最高频词串。30个最高频的词串频率都在每百万词30次以上,主要是包含不完整of-结构的介词短语。大多数词串是介词短语或名词短语的一部分,以介词、冠词或从句引导词结尾,这和Hyland(2008b)研究结果一致。

在HNU_AP中,17个黑体标记的词串同时也属于PUB_AP的词串,在这17个词串当中,7个同时被标记黑体和斜体的词串属于PUB_AP中的前30个高频词串。HNU_AP中的前30个高频词串的出现频率都在每百万词60次以上,这从另一方面证实外语学习者倾向于依赖有限的语言项目,这种过度频繁的使用词串已被证实是二语写作中的一个问题(Gilquinetal. 2007;Hyland 2008b)。进一步的观察表明,HNU_AP前30个高频词串中,有三分之一以上的词串不属于PUB_AP的词串,这说明学习者较少使用一些典型的EAP写作模式,却反复使用那些PUB_AP中不出现的词串。

在PUB_AP中,9个同时被标记黑体和斜体的词串也出现在HNU_AP的前30个词串中,黑体标记的14个词串在HNU_AP中也是属于词串(满足本研究词串的判定标准,但是不属于前30个),6个黑体标记且下划线的词串虽然在HNU_AP中出现,但其出现频率都小于每百万词20词,因此不属于HNU_AP中的词串。剩下1个不是黑体的词串在HNU_AP中一次都未出现。这个结果表明,学习者在写作中的确使用了国际期刊论文中出现的大多数词串,但是这些词串的使用频数较国际期刊论文中低。EAP课堂应关注这些国际期刊论文中高频出现的但是学习者不经常或从不使用的词串。

根据Biber等(1999)和Biber等(2004)提出的结构分类框架,在两个语料库中共识别出十种结构,其标准频数(每10000词)和分布具体如下:

表4 PUB_AP和HNU_AP中的结构类型及其分布

如表4所示,两个语料库中最基本的结构都是名词结构和介词结构,并且可进一步分为包含或不包含of-不完整短语的结构。HNU_AP中的大多数结构类型的频率分布特征与PUB_AP中相同,有两个例外,即“其它名词短语结构”和“名词/代词+动词短语结构”。

在Pub_AP中,包含of-短语的介词结构频率最高,而在HNU_AP中,其它名词短语结构(如animportantrolein,therelationshipbetweenthe)频率最高。结果证实了Hyland (2008a)的发现,即包含of-短语名词结构在学术语篇中大量地用于确定数量或地点、判断事实或强调特性。名词短语结构的词串中,学习者使用的of-结构少于其它后置修饰成分的结构。例如:

(1) The central research question (“Introduction”) is about the similarities and differences of the three disciplines intheuseofthestrategy of promotion and its hedging in articles published in business journals. (PUB_AP)

First, it sought to understandthenatureofthechallenges that a group of immigrant EL secondary students in one California high school faced with academic writing tasks. (PUB_AP)

As fortheresultsoftheabove empirical researches, almost all of them confirm washback effects of tests on language teaching and learning, more or less, in various aspects. (HNU_AP)

Using the assumptions of EA to analyze the factors, we find L1 interference really exists and playsanimportantroleinthe course of their production. (HNU_AP)

与Pub_AP相比较,HNU_AP中词串结构的另一个特点是“(代词/名词)+动词短语结构”的高频出现,两个语料库对比差异明显(PUB_AP中190,而HNU_AP中880)。根据Biber等(2004)的观察,这种结构基于动词短语,更倾向于在口语语体(如对话、课堂教学)中出现,这表明我国研究生没有充分意识到口语和笔语之间的体裁差异。这个结构在PUB_AP只出现两例,分别是,Iwouldliketo和doesnotseemto,前者主要用来介绍下文的重点,后者主要用作论证过程中的模糊语,是一种写作策略,避免产生过于绝对的论断。例如:

(2) For our purposes, however,Iwouldliketosuggest that the simplest option that the players explicitly randomize may be quite acceptable. (PUB_AP)

It should first be noted that theredoesnotseemtobe anything shared by all cases in the data-set in terms of the exigencies dealt with by the pivots other than the facilitating of turn-continuation past a point of possible syntactic and pragmatic completion. (PUB_AP)

From the table,wecanseethatthe number of low anxiety students is small, taking up 16.8% while the intermediate ... (HNU_AP)

The word is tagged in the corpus BNC as AV0, yet I searched the corpus and findmostofthemareused as an interjection. (HNU_AP)

4. 功能特点

根据Hyland(2008a,2008b)提出的词串分类框架,本研究根据词串在语篇中的功能将其分为三类:研究型词串、语篇型词串和参与型词串。PUB_AP中词串的功能分布与Hyland(2008a)研究中生物专业和电子工程专业研究论文的词串功能分布接近,与其应用语言学专业的分布反而不同。这也许是由于PUB_AP中发表的研究论文大多是实证研究,而不是单纯的理论和逻辑推理。在HNU_AP中,60%是研究型词串,只有33.2%是语篇型词串。研究型词串的高频出现与带有后置修饰成分的名词短语的高频率相对应。

表5 词串在PUB_AP和HNU_AP中的功能分布

4.1 研究型词串

研究型词串用来帮助作者建构自己外部世界的真实行为和经历,按照具体功能,可进一步分为五种:定位词串(如at the beginning of)、过程词串(如the use of the)、量化词串(如a wide range of)、描述词串(如the structure of the)和话题词串(如in English and Chinese)。

在PUB_AP中,过程词串在研究型词串中比重最大,占到三分之一以上(36.5%),这个研究结果与Hyland(2008a)关于过程词串在“硬科学”(生物和电子工程)的分布特点相同。这表明对于研究实施方法的重视不再单单是“硬科学”的传统,可能发展成为社会科学(如应用语言学)学术论文中的惯例。例如:

(3) ...this study of adult classroom acquisition of French looked at the effect of practiceintheuseofcoping strategies as part of an instructional program. (PUB_AP)

...that is, how they are to be employedinthecourseofan interactive exchange between at least two persons. (PUB_AP)

在HNU_AP中,研究型词串最典型的特征是话题词串占压倒性多数,几乎一半(49.3%)的研究型词串描述内容与话题相关。这又一次表明学习者过度依赖一些有限的语言项目,重复使用某些词串说明他们缺乏一些写作技巧,如指称替代的策略。在例(4)中,ChinesecollegeEnglishlearners是频率最高的词串,共在8个文本中出现258次,词串inEnglishandChinese在6个文本中出现54次。

(4) Among them “look” is the seemingly simplest one which is learned in the beginning of learning English and therefore is familiar toChinesecollegeEnglishlearners. In order to avoid errors,ChinesecollegeEnglishlearnerswould prefer to use “look” instead of “seem” or “appear”. (HNU_AP)

For the average sentence length is round 4 to 6 wordsinEnglishandChinesechatrooms, it is almost impossible that there will be a lot of complex sentences. (HNU_AP)

4.2 语篇型词串

语篇型词串关注语篇的组织及其信息或论证的组织,这些词串的使用表明了作者在语言使用中具有更高技巧的能力。根据具体功能,语篇型词串可以进一步分为过渡词串(如ontheotherhand)、结果词串(如asaresultof)、文本结构词串(如inthepresentstudy)和构架词串(如inthecaseof)。

在PUB_AP中,70.7%的语篇型词串是构架词串,通过突出关系、列举案例和表明局限性来为论证进行架构。而在HNU_AP中,构架词串只占语篇型词串的44.6%。这表明,学习者努力使用更具“学术味”的词串,努力使自己融入该领域的话语社团,使自己的论文更具逻辑性和说服力,但是他们对构架词串的使用似乎还不够充分,例如:

(4) ...and TV news broadcast scripts-which varyintermsofthedegree of situational and topic formality. (PUB_AP)

This anticipation is especially obviousinthecaseofcoded narratives: for example,inthecaseoftexts that are today read as gay texts. (PUB_AP)

The recall was scoredonthebasisofthe number and significance of the ideas included in the recall. (HNU_AP)

They believed that stance adverbials mainly convey the attitude or assessment of the writerwithrespecttotheproposition contained in the main clause. (HNU_AP)

值得注意的是,文本结构词串在HNU_AP中占语篇型词串的30.1%,而在PUB_AP中仅占2.4%,在PUB_AP中只有一个文本结构词串in the present study。这或许是因为硕士论文篇幅大约是发表论文的两倍,在较长的语篇中更有必要利用结构词串来描述论证。结构词串可以回指前文内容,也可以表明后文内容。通过使用这些结构词串,使得语篇看起来更具有连贯性并更容易理解。例如:

(5)Inthepresentstudywe expect to find the same pattern of results as for the hearing population, namely the same gradation of difficulty among pragmatic acts of different sorts. (PUB_AP)

Despite the preceding caveat, the “natural methodology” has been employedinthepresentstudyin the anticipation that it might provide speech act data not encountered elsewhere in the literature on speech acts. (PUB_AP)

Inthisstudywetry to explore the unique features of China English in the academic field. (HNU_AP)

Thepresentstudyis mainly concerned with critical discourse analysis of news report, which is an ideologically-loaded text type.

4.3 参与型词串

参与型词串关注的焦点在于文本的作者和读者,其功能是引导读者紧随作者的论证,并帮助理解文本。这些词串主要表达两种意义:立场(stance)和融入(engagement)(Hyland 2008a,2008b)。

参与型词串在PUB_AP中所占的比例是10.6%,而在HNU_AP中的比例是6.8%。这说明我国学习者不大倾向于作判断,这或许是因为作为新手,他们在写作中牵涉到个人因素时不够自信。大多数情况下,这些四词词串的使用表明作者能够意识到论证过程及写作对象的存在,作者在努力使自己成为其领域合格的学者(Hyland 2008b)。

在PUB_AP中,立场词串占参与型词串的45.5%,融入词串占54.5%;在HNU_AP中,立场词串占41.8%,融入词串占58.2%。立场词串的使用表明作者以何种方式明确介入话语,来表达根据自己认识和情感所做的判断和评价。例如:

(6) With regard to the case table,itisimportanttonote that the case functions are given regardless of number, i.e. nominative groups nominative singular and nominative plural. (PUB_AP)

The sense of frustration is a more complex concept than a simple positive or negative evaluation, anditisclearthatit belongs to the sequence as a whole, the unit of meaning, rather than just to the word budge. (PUB_AP)

For the sake of effective and accurate identification of copular construction,itisnecessarytodistinguish copular construction and other constructions that seem similar to copular construction. (HNU_AP)

Given the simple structure of the test items,itisobviousthatthe test is assessing vocabulary knowledge rather than, say, grammatical knowledge or reading comprehension ability. (HNU_AP)

立场的表达大多是通过使用非人称的先行词it的结构,PUB_AP中唯一的人称立场词串是Iwouldliketo,这证实了Hyland(2008a)的发现。

使用融入词串表明,作者在语篇中积极与读者对话,目的在于指导或说服读者领会并接受自己的观点。在PUB_AP中,融入概念大多通过被动语态和情态动词表达,如canbeseenin,canbefoundin。但是在HNU_AP中,学习者除了使用被动语态和情态动词,还用主动语态来表达融入概念,如wecanseethat,wecanfindthat。例如:

(7) Evidence for this claimcanbeseeninthe range of functions backchannels are reported to perform. (PUB_AP)

Several interesting featurescanbefoundineach of these fragments. (PUB_AP)

Some original ideascanbeseenfromthe operational procedure of the TLR Model. (HNU_AP)

From the above investigation,wecanseethatmost of the teachers teach vocabulary superficially to students and... (HNU_AP)

在参与型词串中,HNU_AP 中的wecanfindthat从未出现在PUB_AP中,而PUB_AP中的doesnotseemto在HNU_AP中从未出现。这表明我国学习者使用了一些国际期刊论文中从不使用的词串,而国际期刊论文中频繁出现的一些词串却没有被使用。

学习者能够使用发表论文中的一些词串,但是这些词串的使用可能会出现偏差。例如,立场词串itisimportantto出现在两个语料库中,在PUB_AP中,出现78次,其中59次(75.6%)后面跟的是“动词+that/wh-从句”。在这个模式中,动词大多是表达认知意义和观察力的心理动词,如note,recognize,remember,understand,see,consider,emphasize,stress等,心理动词后面的从句大多由that引导,有时由how、what或whether引导。然而,在HNU_AP中,这个词串出现19次,“动词+that/wh-从句”这个模式仅出现两次,使用的两个心理动词是note和stress。在其他例句中,该词串后的动词大多是由行为动词构成的动词短语,而不是“动词+that/wh-从句”模式。这表明,学习者尽管能够使用这个词串,但是使用中没有意识到该词串后面跟的动词以及句型具有一定的限制。例如:

(8) However,itisimportanttonote that when humour functions as a conduit for negative, subversive, or critical contributions in workplace interaction, the fundamental effect of the humour is... (PUB_AP)

To better understand the complex issues learners face in making pragmatic choicesitisimportanttoexamine more closely what is encompassed by the notion of identity. (PUB_AP)

Itisimportanttostress that the two positions are not irreconcilable. (HNU_AP)

Thus,itisimportanttouse both statistical and substantive analyses at the test and item level in order to ensure that tests are fair and valid for all, regardless of mode of presentation. (HNU_AP)

5. 教学应用

了解二语学习者英语写作中词串特点以及与发表国际期刊论文之间的差异,有助于教师了解学习者在EAP写作中使用词串的频率、形式和功能,从而决定课堂上有关词串的教学重点;也有助于学生了解自己的写作和发表论文之间的差距,从而了解为撰写合格专业论文所需要掌握的知识。我国高级英语学习者大多在毕业之后会从事英语教育工作,这就要求他们经常撰写并发表学术论文,因此,意识到提高其学术写作水平以逐渐缩小与发表研究论文之间的差距非常重要。

作为高级英语学习者,硕士研究生已经掌握了一些EAP写作知识,并能够使用大量不同结构的四词词串,表明他们为了更好地融入其领域的话语社团,参与学术交流,努力使自己的写作更具有“学术味”。他们写作中的问题不仅仅在于语法或词汇层面的错误,而且也由于对词串出现模式的不恰当使用以及对口语笔语体裁差异的意识缺乏,另外,他们没有掌握涉及一些重要功能的约定俗成的方法,例如如何进行总结或表达个人观点等(参见Gilquinetal. 2007)。因此,EAP课程对研究生来说非常有必要。本研究表明,我国的英语学习者需要充分意识到体裁差异、掌握表达某特定功能的不同方法,同时,EAP教师需要将相关的研究结果转化成为具体有效的教学技巧,以提高学生的EAP写作水平。

研究结果表明,尽管学生在其大量的EAP阅读中经常遇到这些词串,但是频繁的接触并没有使其掌握词串的用法,这证实了Cortes(2004)的研究发现。因此,“意识提升”(consciousness raising)非常有必要,即需要让学生意识到学术写作中词串的存在。

在EAP教学中,高频词串的形式和功能需要解释清楚,重点应当放在发表论文中频繁出现而学习者不使用或使用频率较低的词串。同时,也应当找出学习者写作中频繁出现而发表论文中没有出现或出现频率较低的词串,并加以解释。为了达到这个目标,EAP教师需要获得两种数据:学习者的写作语料以及同一领域国际权威英语期刊的论文语料。如果学习者能够参与处理这些语料,效果会更好。在EAP课堂上可行的教学步骤是:(1)教师根据自己基于语料库的研究结果,介绍焦点词串,解释其功能和使用模式;(2)学生识别词串,并基于发表论文语料考察给定词串的功能和使用模式;(3)学生基于自己或其他学生写作的语料考察词串的功能和使用模式;(4)学生对比前两个步骤的结果,找出自己写作中需要改进之处。

6. 结论

与假设相反的是,二语学习者硕士论文中的四词词串多于已发表的国际期刊论文中的词串。学习者能够使用大量的词串,对某些词串的使用频率更频繁,这可能是由于我国的二语学习者倾向于过度依赖有限的语言项目,证实了(Herriman & Aronsson 2009)关于瑞典二语学习者的研究发现,即对多词序列的重复使用可以看作是学习者为了使自己的二语写作精确和流利而采取的学习策略。

结构方面,两个语料库中的大多数词串是名词或介词结构,验证了Biber等(1999),Cortes(2002,2004),Hyland(2008a,2008b)和Biber(2009)的研究发现。学习者似乎已掌握了学术语篇中的这些基本结构,但是存在过度使用某些结构的倾向,如包含后置修饰语成分的名词短语结构等。他们掌握了在学术写作中如何使用前置词it的结构和被动结构,但是动词词串的相对高频率表明,他们还没有完全意识到口语和笔语体裁的差异,口语体裁的典型结构在学习者写作中出现较多。

功能方面,学习者使用较多的研究型词串,其中表达话题的词串使用最频繁,重复使用相同的词串表达与论文主题相关的事物或概念。学习者反复使用一些国际期刊论文中不出现或很少出现的词串,而不使用或较少使用国际期刊论文中频繁出现的一些词串。即便是有些词串在两个语料库中都出现,学习者可能没有注意到其用法的限制而出现偏差。在使用参与型词串时,学习者较少用来表达立场,可能是因为他们不了解学术英语写作的技巧,不明白为什么要使用模糊语言来表达肯定的事物(Cargill & O’Connor 2006)。

Biber, D. 2006.Universitylanguage:acorpus-basedstudyofspokenandwrittenregisters[M]. Amsterdam: John Benjamins.

Biber, D. 2009. A corpus-driven approach to formulaic language in English: Multi-word patterns in speech and writing [J].AppliedLinguistics14 (3): 275-311.

Biber, D., S. Johansson, G. Leech, S. Conrad, & E. Finegan. 1999.TheLongmanGrammarofSpokenandWrittenEnglish[M]. London: Longman.

Bider, D., S. Conrad, & V. Cortes. 2004. If you look at...: Lexical bundles in university teaching and textbooks [J].AppliedLinguistics25(3): 371-405.

Cargill, M. & O’Connor, P. 2006. Developing Chinese scientists’ skill for publishing in English: Evaluating collaborating-colleague workshops based on genre analysis [J].JournalofEnglishforAcademicPurposes(5): 207-221.

Cortes, V. 2002. Lexical bundles in Freshman composition [A]. In R. Reppen, S. Fitzmaurice & D. Biber (eds.).UsingCorporatoExploreLinguisticVariation[C]. Amsterdam: John Benjamins: 131-145.

Cortes, V. 2004. Lexical bundles in published and student disciplinary writing: Examples from history and biology [J].EnglishforSpecificPurposes(23): 397-423.

Cortes, V. 2006. Teaching lexical bundles in the disciplines: An example from a writing intensive history class [J].LinguisticsandEducation(17): 391-406.

Gilquin, G., S. Granger & M. Paquot. 2007. Learner corpora: The missing link in EAP Pedagogy [J].JournalofEnglishforAcademicPurposes6 (4): 319-335.

Granger, S. 2009. The contribution of learner corpora [A]. In K. Aijmer (ed.).CorporaandLanguageTeaching[C]. Amsterdam: John Benjamins: 13-32.

Herriman, J. & M. Aronsson. 2009. Themes in Swedish advanced learners’ writing in English [A]. In K. Aijmer (ed.).CorporaandLanguageTeaching[C]. Amsterdam:John Benjamins: 101-120.

Howarth, P. 1996.PhraseologyinEnglishAcademicWriting[M]. Tübingen: Niemeyer.

Hyland, 2004. Disciplinary interactions: Metadiscourse in L2 postgraduate writing [J].JournalofSecondLanguageWriting13 (2): 133-151.

Hyland, K. 2008a. As can be seen: lexical bundles and discipline variation [J].EnglishforSpecificPurposes27(1): 4-21.

Hyland, K. 2008b. Academic clusters: text patterning in published and postgraduate writing [J].InternationalJournalofAppliedLinguistics18 (1): 41-62.

Nattinger, J. R. & J. Decarrico. 1992.LexicalPhrasesandLanguageTeaching[M]. Oxford: Oxford University Press.

Oakey, D. 2002. Formulaic language in English academic writing [A]. In R. Reppen, S. Fitzmaurice & D. Biber (eds.).UsingCorporatoExploreLinguisticVariation[C]. Amsterdam: John Benjamins: 111-129.

Schmitt, N, S. Grandage, & S. Adolphs. 2004. Are corpus-derived recurrent clusters psycholinguistically valid? [A] In N. Schimitt (ed.).FormulaicSequences:Acquisition,ProcessingandUse[C]. Amsterdam: John Benjamins: 1-22.

Schmitt, N. & R. Carter. 2002. Foumulaic sequences in action [A]. In Schmitt (ed.).FormulaicSequences:Acquisition,ProcessingandUse[C]. Amsterdam: John Benjamins: 1-22.

Scott, M. 2008. WordSmith Tools 5.0 [M]. Oxford: Oxford University Press.

Scott, M. & C. Tribble. 2006.TextualPatterns[M]. Amsterdam: John Benjamins.

Simpson, R. 2004. Stylistic features of academic speech: The role of formulaic expressions [A]. In U. Connor & T. Upton (eds.).DiscourseintheProfessions[C]. Amsterdam: John Benjamins: 37-64.

Thompson, P. 2006. Call for proposals [J].JournalofEnglishforAcademicPurposes5 (3): 248-249.

Weinert, R. 1995. The role of formulaic language in second language acquisition: A review[J].AppliedLinguistics16(2): 180-205.

刁琳琳.2004.英语本科生词块能力调查[J].解放军外国语学院学报(4):35-38.

濮建忠.2003.英语词汇教学中的类连接、搭配和词块[J].外语教学与研究(6):438-445.

猜你喜欢

词串语料库短语
小学语文词串教学之浅见
《语料库翻译文体学》评介
灵动的词串,写话的纽带
报纸新闻标题中的“热词群”和“热词串”
基于COCA语料库的近义词辨析 ——以choose和select为例
《健民短语》一则
基于JAVAEE的维吾尔中介语语料库开发与实现
基于领域类别信息C-value的多词串自动抽取