基于CEM语料库的中国英语专业学习者语块失误研究
2015-07-31陈孚徐添兴
陈孚 徐添兴
(1.上海外国语大学研究生部上海200083;2.上海体育学院体育新闻传播与外语学院上海200438)
基于CEM语料库的中国英语专业学习者语块失误研究
陈孚 徐添兴
(1.上海外国语大学研究生部上海200083;2.上海体育学院体育新闻传播与外语学院上海200438)
语块是二语语言能力的重要组成部分,也是二语学习者实现语言地道性需要克服的一大障碍。本研究首先根据文献设计了语块类型和语块失误类型的赋码方案,在此基础上,对CEM写作语料库中的语块失误进行了人工标注。结果显示,专四、专八写作中的语块失误在三类语块中的分布大体类似,其中词汇语块最常见的失误为成分残缺和搭配不当;语法语块最常见的失误为成分残缺;衔接语块最常见的失误为搭配不当。基于上述结果,本文对语块教学提出了一些具体的建议。
语块CEM语料库语块类型语块失误类型
一、引言
语块(formulaicsequences)是近年来二语习得与教学研究的一大热点。语料库研究表明,在本族语者的口语和书面语产出中,语块所占的比例可达50%-70%[1][2]。因此,语块的重要性很早就引起了研究者的注意[3][4]。在此基础上,Sinclair[5]提出了语言使用的两大原则,即开放原则(the open choice principle)和成语原则(the idiom principle),前者指的是通过句法规则连词成句,而后者则是指语块的频繁使用。他认为成语原则是语言使用的第一原则,只有在陌生的语境下,语块无法表达交际意图时,说话者才会暂时转向开放原则,然后又会很快回到成语原则这一默认模式[5]。
近年来心理语言学研究进一步支持了语块相对于非语块的加工优势[6]。这些研究表明,对于本族语者来说,语块具有心理现实性,可以进行整体存储和提取。换言之,由于语块已被高度词汇化,它们在心理词库中取得了和个体单词相似的地位。这一整体性特征使得语块得以快速识别和产出,从而提高了语言的加工效率。
因此,语块无疑也是二语语言能力的重要组成部分,对于学习者中介语的复杂性、准确性和流利性都具有显著影响[7]。然而对于二语学习者来说,语块却是他们实现目标语地道性的“最后障碍”[8]。由于语块在二语学习中的重要性和习得难度,近年来国内外出现了大量基于语料库的中介语语块研究。然而,在这众多研究中只有少数研究涉及到了二语学习者的语块失误[9][10][11]。Laufer&Walden[9]在研究以色列英语学习者的动名搭配时发现,由语际差异造成的语块错误在高级学习者中依然存在。戚焱、丁言仁[11]调查了英语专业一、四年级56名学生的口头作文,结果发现英语专业学生一、四年级语块错误类型基本相同,其中出现频率最高的错误是介词词块,最低的是动词词块;而最易出错的是含有介词和冠词的词块,共占所有错误的60%左右。不过,这些研究大多仅将语块失误作为附带问题进行简要讨论,或者仅局限于某种特定的语块失误(如动名搭配失误),缺乏对二语学习者各类语块失误的系统、全面的探讨。此外,目前尚无专门针对英语专业学习者写作语块失误的语料库研究。因此,本文旨在调查和分析不同水平英语专业学习者写作中的语块失误类型,以及这些失误类型在不同种类语块中的分布,以期更为全面地了解英语专业学习者语块失误的特点,更好地开展语块教学。
二、语块的分类
现有研究当中对语块的分类可谓多种多样[12][13]。结合本研究的具体目的和性质,我们采用了一套近年来应用较为广泛的语块分类体系[2][14],并进行了一定的合并调整。这一体系从构成成分和句法功能的角度将语块分为词汇语块(lexical chunks)、语法语块(grammatical chunks)和衔接语块(discursive chunks),具体涵义如下:
1、词汇语块
词汇语块应当包含至少一个实意词,常用来描述某一实体或动作,如come across。这类语块在实际使用时往往需要根据时态或主谓一致关系进行词素上的屈折变化。另外,根据是否存在语隙(slots)可以将这类语块进一步分为封闭型词汇语块(如:hindsight wisdom)及开放型词汇语块(如:take charge of_)。
2、语法语块
语法语块包括数量词(如a lot of)、限定词(如a kind of)等。主要用来修饰其它短语或分句。
3、衔接语块
衔接语块包括各种连接词(如on the contrary),其作用主要用来标明篇章信息结构或话轮转换。与词汇语块相比,语法语块和衔接语块在形式上比较固定,一般内部不存在语隙。
三、研究设计
(一)研究问题
本研究试图回答下列两个研究问题:
1、中国英语专业学生的语块失误包含哪些类型,在每类语块中有何分布特点?
2、英语专业基础年级和高年级学习者在语块失误及其分布上有何异同?
(二)采用的语料库
本研究语料来源于英语专业学习者语料库(Corpus for English Majors,简称CEM)[15]中的写作部分。该部分包括2004-2006三年间收集自30所代表性高校的英语专业四、八级作文,在性质上属于限时性命题作文,共计66万词次。其中专业四级作文1114篇,专业八级作文1408篇。
(三)语块的提取和标注
本研究采用短语学方法进行语块提取。短语学方法在界定语块时主要依照语言学理论对语块所做的分类,将句法、语义和语用上的完整性及凸显性(saliency)作为提取标准。因此,依据短语学方法所提取的语块在结构和意义上较为完整,分类较为精细。
CEM语料库已对学习者出现的各类失误进行了标注,其中和语块失误相关的有vp2、np2、aj2、pp2、cj2五类,分别为动词、名词、形容词、介词、连词词组失误。首先用语料库检索软件Antconc3.2.1w将这5类失误全部提取出来。在此基础上,我们依据《朗文当代高级英语辞典》[16]和BNC语料库选取了由两个或两个以上单词组成、意义完整、连续或不连续的语块。接着,我们分别设计了语块分类和失误分类两个赋码方案。其中语块分类依据Erman等人的分类体系(见表1)。
四、研究结果
表3显示了英语专四写作中6种语块失误在4类语块中的分布情况以及卡方拟合优度检验结果。对于专四写作,在4种语块类型中封闭型词汇语块(A1)最易犯的失误为搭配不当(I3),如eat outside(out),in(on)campus(括号内为正确形式或补充成分,下同);而开放型词汇语块(A2)最易犯的失误为成分残缺(I1),如take(the)place of,get(in)touch with;语法语块(B)失误的频数较少,不符合卡方检验的前提假设。但从直观上来看该类型最易犯的失误为成分残缺(I1),如a lot(of),(a)series(of)。对于衔接语块(c),最易犯的失误则是搭配不当(I3),如in(on)one hand,for(from)my point ofview。
表4显示了英语专八写作中6种语块失误在4类语块中的分布情况以及卡方拟合优度检验结果。结果表明,高年级学习者(专八写作)与基础年级学习者类似,在封闭型词汇语块(A1)中最易犯的失误为搭配不当(I3);而其开放型词汇语块(A2)中最易犯的失误也是搭配不当(I3);语法语块(B)最易犯的失误为成分残缺(I1);而衔接语块(C)最易犯的失误则为搭配不当(I3),不过成分冗余(I2)失误也较多。
而失误分类则在借鉴相关研究的基础上进行了一定创新。本研究在总体上将语块失误分为三大类,即整体使用不当、语块内部失误、和混合失误(见表2)。整体使用不当失误(H)指的是语块本身形式正确,但使用语境不当,如*callfor thehospital;语块内部失误(I1-4)则包括成分残缺、成分冗余、搭配不当和词素-语法失误;混合失误(J)指的是在一个语块失误中包含一个以上的失误类型,如在*tryahandin中,a本应为one’s,而in则应为at。依据上述赋码方案,对每一个语块失误所属的语块类型及失误类型进行了人工逐一标注,最终得到的语块总数为1003个。
为了便于直观比较,图1、图2分别以折线图形式展示了专四和专八写作中6种失误类型在每类语块中的分布。
五、讨论
上述研究结果显示,英语专业学习者的语块失误类型基本可归为本研究所采用的三类,即整体使用不当、语块内部失误以及混合失误。对比专四和专八写作中的语块失误分布可知,基础年级和高年级英语专业学习者的语块失误类型在四类语块中的分布十分类似。具体来说,两组学习者在开放型词汇语块(A1)和衔接语块(C)中最易犯的失误都是成分搭配不当。这类错误的典型例子如pay attention on,look up upon等等。造成搭配不当的根本原因在于这些出现失误的语块在学习者的心理词库中不具有心理现实性。也就是说他们没有将这些语块进行整体存储和整体提取,而是将其分解后加以记忆,因此他们的语块知识往往是模糊的、支离破碎的。当然,造成搭配不当的另一个重要原因来自于母语的迁移[17]。在本次语料库检索中可以归因于母语迁移的搭配失误也不在少数。例如:incampus在本次语料中出现了6次。由于汉语中的介词“在”可以与任何地点名词连用(在家、在校园里、在大学),但是英语中不同类型的地点往往要求使用不同的介词(at home,on campus,at university)。再比如,in my point of view这一失误语块共出现了12次。这似乎也受到了汉语表达习惯的影响。在汉语中表达这一概念时,一般说成“在我看来”,而不是“从我看来”,因此这些学习者有可能将汉语中的“在”直接翻译成了该语块中的in。
除此之外,两组学习者在词汇语块使用中的成分残缺错误也非常常见。词汇语块尤其是开放型词汇语块在形式上包含一个或多个语隙,这些语隙可能位于语块内部(如to_extent),也可能位于语块外部(如a lot of_)。语隙的存在从某种程度上破坏了语块的整体性,不利于学习者对语块进行整体感知和识别,因而也不利于习得,这可能是残缺错误出现频率较高的一个重要原因。总之,这两类典型失误说明二语学习者对于开放型词汇语块的掌握是不完整的,这点也得到了心理语言学相关研究的支持[18]。
对于语法语块来说,两组学习者最易犯的失误都是成分残缺,这再次说明两组学习者对这类语块仍处在分解式记忆的阶段,而没有进行整体记忆和整体提取。
另外,特别值得注意的是,高年级英语专业学习者与基础年级英语专业学习者虽然在语言整体水平上有了较大提升,但是每类语块所易犯的失误类型基本类似,这从一个侧面说明他们在语块能力上并未实现明显进步。这再次印证了语块即使对于高级二语学习者来说仍然是一大难题。语块为何难以随着语言整体能力的提升而逐步提高,值得进一步研究探索。
六、结束语
本研究揭示了不同水平英语专业学习者在不同类型语块中的错误类型分布情况。研究发现对EFL教学具有一定借鉴意义。一方面,教师不仅应关注传统语法体系的教学,同时应将培养语块能力有机融合进教学过程当中。另外,外语教师在语块教学中往往着重强调成语等形式固定的语块,而较少重视开放型语块的讲授。而开放型语块由于其形式不完整、常需进行时体变化等特点,在一定程度上更易出错。因此,教师应有意识地引导学生关注开放型语块。此外,教师还应根据每种语块中最易出现的失误类型开展针对性教学和训练。
参考书目:
[1].Altenberg,B.On the phraseology of spoken English:The evidence of recurrent word combinations[A].In A,Cowie(ed.).Phraseology:Theory,Analysis and Applications [C].Oxford:Oxford University Press,1998.
[2].Erman,B.&B.Warren.The idiom principle and the open choice principle[J].Text,2000,20(1):29–62.
[3].Bolinger,D.Aspects of language(2nd edition)[M]. New York:Harcourt Brace Jovanovich,1975.
[4].Pawley,A.and E.H.Syder.Two puzzles for linguistic theory:nativelike selection and nativelike fluency[A].In Richards,J&R.Schmidt(eds.),Language and communication[C].New York:Longman,1983.
[5].Sinclair,J.Corpus,concordance,collocation[M].Oxford:Oxford University Press,1991.
[6].Conklin,K.&Schmitt,N.The Processing of Eormulaic Language[J].Annual Review of Applied Linguistics,2012,32:45–61.
[7].Housen,A.&Kuiken,E.Complexity,accuracy and fluency in second language acquisition[J].Applied Linguistics,2009,30(4):461–473.
[8].Wray,A.,&Eitzpatrick,T.Why can't you just leave it alone?Deviations from memorized language as a gauge of nativelike competence[A].In E.Meunier.,&S.Granger(eds.)Phraseology in language learning and teaching[C]. Amsterdam:John Benjamins,2008:123-148.
[9].Laufer,B.,&Waldman,T.Verb-noun collocations in second language writing:a corpus analysis of learners'English [J].Language Learning,2011,61(2):647-672.
[10].戚焱、丁言仁.中美大学生口语中词块使用特点对比分析[J].外语界,2011,144(3):52-59.
[11].王文宇、黄燕.英语专业高年级学生汉英口译中的语块使用情况[J].外语与外语教学,2011,260(5):73-82.
[12].卫乃兴.中国学生英语口语的短语学特征研究[J].现代外语,2007,30(3):280-291.
[13].Biber,D.,S.Johansson,G.Leech,S.Conrad&E.Einegan.Longman grammar of spoken and written English[M].London:Longman,1999.
[14].Bartning,I.,Eanny.L,&V.Hancock.On the role of linguistic contextual
factorsformorphosyntacticstabilizationinhigh-levelL2 Erench[J].Studies in
Second Language Acquisition,2012,34(special issue 2):243-267.
[15].中国高校外语专业多语种语料库建设与研究:英语语料库[M].上海:上
海外语教育出版社,2008.
[16].朗文当代高级英语辞典(第4版)[Z].外语教学与研究出版社:2011.
[17].Yamashita,J.&Jiang N.L1 Influence on the acquisition of L2 collocations:
Japanese ESL users and EEL learners acquiring English collocations[J].TESOL
Quarterly,2010,44(4):647–668.
[18].Jiang,N.and Nekrasova,M.The processing of formulaic sequences by second language speakers.The Modern Language Journal,2007,91(3):433-445.
H319
A
1009-8534(2015)06-0116-03
2015-11-06
陈孚(1988-),男,山东济宁人,上海外国语大学博士研究生,研究方向:语料库语言学。
徐添兴(1982-),男,四川泸州人,上海体育学院体育新闻传播与外语学院助教,硕士,研究方向:外语教学法。