APP下载

基于语料库的英语学习者口语语块发展特征研究

2017-09-13刘国兵

关键词:语块英语水平语料

刘国兵

(河南师范大学 外国语学院,河南 新乡 453007)

基于语料库的英语学习者口语语块发展特征研究

刘国兵

(河南师范大学 外国语学院,河南 新乡 453007)

跟踪国内某大学英语专业学生四年时间,收集不同阶段口语语料,基于语料库的方法,从多方面探讨学习者口语语块的发展性特征。研究表明:学习者口语中使用语块的数量、种类与语块自身的长度成反比;学习者口语表达时过分依赖名词+动词语块、名词语块和动词语块,而较少使用介词语块,与本族语者之间存在明显差别;随着学习者英语水平的提高,其使用语块的数量呈现正态增长趋势。研究结果对中国英语学习者语块习得与教学具有启发意义。

英语学习者; 口语语块; 发展特征

一、引言

过去二十多年来,在二语习得领域,语块习得成为人们关注的焦点。研究发现人类语言中存在大量块状结构,这种块状结构作为独立的整体单位储存于人类大脑的语言中枢系统,并以类似网络的形式相互联系、交织在一起[1]25。人们在使用语言时,这样的块状结构有利于说话人从大脑中快速识别与提取出所需的语言单位,从而降低大脑信息处理负荷,提高语言处理的速度与效率。熟练的语言使用者大脑中储存了大量的语块,说话时将大量语块建立联系,成串地连接起来,进而实现意义的表达[2]。因此,语块水平通常作为衡量学习者英语水平高低的标准之一。人们普遍认为对于学习者来说,大脑中记忆与储存大量目标语语块是其语言水平达到或接近本族语者水平的关键[3]。也就是说,英语学习者能否熟练掌握并使用目标语,在一定程度上取决于大脑中所掌握语块量的多少。

目前国内涉及语块的研究主要有几个方面:一是中国英语学习者书面语中语块的使用特征研究,如濮建忠[4]、李文中[5]、管博和郑树棠[6]、王立非和张岩[7]、许家金和许宗瑞[8]、马广惠[9]等;二是语块使用情况与英语水平之间的关系研究,如丁言仁和戚焱[10]等;三是研究英语学习者语块知识的掌握情况,如黄强[11]、刁琳琳[12]、濮建忠[13]、张军和李文中[14]、张建琴[15]等。从以上研究不难看出,多数学者针对中国英语学习者的二语语块习得状况进行横断描述,而对学习者语块发展特征研究较少,特别是针对中国英语学习者口语语块发展特征开展的研究更少。本研究跟踪国内某大学英语专业两个自然班学生四年时间,收集不同阶段学生口语语料,从多个方面分析学习者口语中语块的使用情况。

二、语块的界定与分类

(一)语块的界定

关于语块的研究最早可追溯至上个世纪20年代,Jesperson首次提出“程式语”的概念,用来指代不同于一般语言表达的一类特殊表达方式;它不是说话人按照某种语言规则生成的,而是作为一个整体拿来即用[16]。之后Fillmore、Brown和Bolander沿用并完善了Jesperson的定义,强调语言使用中语块的预制性与易提取性[17-19]。在语料库语言学领域,影响较大的是Wray对语块的定义,即“整体储存在大脑中的一连串连贯或不连贯的词语或意义单元,人们在使用时直接提取,无需根据语法规则进行生成与分析”[20]9。

目前学界对语块尚未形成统一的定义,据不完全统计,英语中至少存在40多种不同的叫法[20]9。近些年来,国内学者使用较多的术语有语块、词块、词串、多词序列、预制词块、N元组合等。由于研究目标不同,所使用的术语及其分类会有所差异。本研究使用“语块”一词,主要指的是语料中出现频率较高、功能上能够表达完整意义、且至少由两个词汇构成的连续词语序列。

(二)语块的分类

目前学者对语块进行分类,主要基于两个标准:一是语块的结构特征,二是语块的功能。最早对语块进行分类的学者是Beeker,他从英语口语和书面语中提取语块,并从结构上把语块划分为六种类型:聚合词语、限制型短语、元语篇、句子构成成分、情景会话和原文片段[21]。同样,基于其结构特征,Nattinger和DeCarrico把语块分为多元语块、惯用语语块、短语语块以及句子构建语块[22]33。其次是根据语块的功能进行分类。Pawley和Syder根据语块在语篇中的功能,将其划分为多词词汇、常用表达式、限制型短语以及句型框架四类[1]205;而Lewis将语块分为具有习语性质的聚合词(如on the end)、共现率较高的搭配词(v+n、adj+n等)、形式上固定以及半固定且具有一定语用功能的单词序列(如if I were you)、句子框架引导词(secondly、finally)等四类[23]。除以上学者的分类外,还有其他学者也对语块进行过分类。限于篇幅,在此不一一赘述。

三、研究设计

(一)研究问题

本研究重点回答以下两个问题:一是英语学习者口语中常用语块的总体特征是什么?二是在不同学习阶段,英语学习者使用不同类别语块时有何异同?体现了哪些发展性特征?

(二)数据收集

本研究所用语料来自于国内某大学2012级英语专业两个自然班的62名学生。从2012年9月开始,至2016年5月结束,笔者利用近四年时间,跟踪英语专业两个自然班的62名学生口语发展状况。其中女生55人,男生7人。语料收集采用口语测试的方式,即提前5分钟给定学生题目,要求学生围绕题目发表观点。考试采取单独测试的方式,每位考生均有5分钟准备时间。基础阶段即一、二年级时,测试时间为2分钟,另有1分钟回答问题时间,要求回答主考教师根据给定题目即席提出的问题;高级阶段即三、四年级时,要求学生围绕特定话题谈论3分钟,无回答问题环节。学生每次测试的内容相同,即每次考试只提供一个话题。为保证考试公平公正,所有参加测试学生集中候考,测试结束后离开。学生所答内容全程录音,之后将录音转写并整理,输入计算机,创建小型语料库。语料详细情况见表1。

表1 语料收集情况

① 三年级时出国1人,四年级时1人修学,1人因故无法参加,总人数少了3人,3人均为女生。

(三)数据处理

语料收集完成之后,利用TreeTagger 3.0附码软件②该软件为梁茂成的TreeTagger for Windows(Multilingual Edition)3.0.软件,2013版。下载网址:http://www.bfsu-corpus.org/channels/tools。对语料进行词性附码,之后利用WordSmith Tools 6.0对语料中符合要求的语块进行提取,并统计分析。因四个年级所收集语料多少不等,在对语块进行统计分析时,同时提供标准化频数,即每1万词出现的频数。本研究主要考察学习者口语中语块的使用情况,相比较书面语而言,口语语料的收集更加费时费力。加上本研究属于耗时较长的跟踪研究,语料收集需要克服更大困难。参照已有文献,本研究把语块的界定标准适当降低,具体标准为:2词≥10次/万词、3词≥5次/万词、4词及以上≥3次/万词。只要标准化频数达以上标准,即认定为语块中的一种。

四、结果与讨论

(一)语块使用总体特征

据表2显示,学习者口语中语块使用总体情况基本符合预期,学习者使用语块的数量、种类与语块自身的长度成反比。也就是说,2词语块使用数量最多,频数达到3 834次,共计628种。随着语块长度的增加,如3词语块、4词语块等,其使用数量呈明显的下降趋势。特别是6词及6词以上语块共出现394次,总数只有32种。从标准化频数来看,随着语块长度的增加,使用数量下降趋势非常明显。从2词语块的312.6个/万词下降到6词及6词以上语块的32.1个/万词。这与De Cock和Biber针对学习者书面语得出的研究结论基本吻合:基于相同标准的情况下,学习者使用的语块越长,其数量与种类就越少[24][25]69。随着语块长度的增加,反映在数量与种类方面的递减趋势非常明显。

表2 学习者语块使用总体情况

根据Biber的研究发现,本族语者每万词使用的3词语块为25个,4词语块为20个[25]66。与本族语者相比,在3词与4词语块的使用上(标准化频数分别达到了183.2与112.9),貌似学习者口语中使用更多语块。但需要说明的是,本研究在提取语块时,对语块的界定标准更加宽泛。此外,从学习者的学习特点来看,过度重复使用某些熟悉的语块是二语习得过程中的一个共性。特别是在词汇量有限的情况下,学习者使用的语块丰富程度远远不够。这与De Cock的研究发现一致。

(二)语块词性分布情况

为进一步了解中国英语学习者口语中语块的分布情况,我们对语料中2~6词及6词以上语块进行提取,并统计分析他们的词性。之所以把6词及6词以上语块统计在内,是在提取过程中发现,尽管此类语块只有32种,多数属于教材中出现的惯用语及常用句式,但该类语块的熟练运用在一定程度上能够体现学习者的语言水平。根据Biber的分类[25]66,提取并归类后,在学习者口语语料中共发现9类语块,分别是名词+动词语块①按照Biber(1999)的做法,“代词+动词”语块也归为此类,即“名词+动词”结构。、名词语块、动词语块、连词语块、介词语块、形容词语块、to语块、惯用语语块、从句语块。此外,还有少部分无法归入以上9类,也没有较为明显的一致特征,按照Biber的做法,将其归为“其他”一类。语块具体词性分布情况见表3。

表3 学习者口语语块词性分布情况统计

从表3可以看出,学习者口语中使用最多的语块主要有3类,分别是名词+动词语块、名词语块和动词语块,百分比分别达到了28.2%、22.7%和19.6%。如果把三者相加,百分比达70.5%。特别是第一类名词+动词语块,其数量占到了语块总数的近1/3。这表明学习者在口语表达中倾向于使用传统的主语+谓语结构。此外,名词语块占到了1/5强,说明学习者在使用英语表达时明显受到母语的影响。总体来看,汉语中以名词为核心的名词短语结构比英语要多得多,这与本族语者的语块分布情况有明显差别。Biber通过分析本族语者口语与书面语后发现,本族语者表达时最常用的成分为动词语块,常用句式结构为名词(人称代词)+动词+补语[25]112。对于本族语者来说,介词语块运用也较多,在部分语体如学术论文中能够占到语块总数的1/3以上。这从一定程度上说明中国英语学习者口语表达时,语块量及相关目的语知识的储备不够,母语迁移现象明显,表达思想时很大程度上依赖于汉语中常见句式结构。学习者口语语块词性分布还有一个明显特征,是从句语块数量偏少,仅占语块总量的0.8%。这不但大大低于本族语者的从句语块使用比例,而且与学习者书面语中该类语块相比,其使用量明显偏低。

(三)不同阶段英语学习者口语语块特征分析

通过对不同阶段英语学习者口语语块的对比分析,我们发现了以下特征:

第一,随着学习者英语水平的提高,其使用语块的数量呈现正态增长趋势。即学习者英语水平越高,其使用的语块数量越多,种类也越丰富。从其标准化频数来看(详见表4),一年级时所有语块共出现4 993次、821种,每万词出现的频数为407.1次;随着英语水平的提高,二年级时,语块种类增加到了897种,频数增长了近1 000次,达到5 842次;到了大学四年级,学习者使用的语块种类达到了1 017种,共出现6 425次。从一定程度上来说,特定学习阶段内中国英语学习者口语中所用语块的数量与种类会随着语言水平的提高而增加,基本呈现出线性增长的趋势。

表4 不同年级学习者语块使用情况

第二,词汇性语块(Lexical chunks,也称为Lexical phrases)的使用量随着英语水平的提高而增长。Ketko研究发现,与其他类语块相比,词汇性语块的使用更能体现学习者的英语水平[26]。本研究专门对不同年级学习者口语中的词汇性语块使用情况进行提取与分析。在对词汇性语块进行识别时,参考了Nattinger和DeCarrico的做法,按照

其功能特点进行界定[22]112。他们的主要特点有:一是非形成性,即语义上具有约定俗成的特点,而不是根据具体语境临时构成;二是稳固性,即语块的形式相对稳固,特殊情况下可以留有缺词,比如“___days ago”,但其基本形式高度稳定;三是具有惯用语特点,即在一定的语境下使用,其用法已经形成惯例;四是具有特定功能,如打招呼用的“How are you?”等。在对不同年级学习者使用的语块进行提取后,按照以上特征进行人工筛选①因人工筛选工作量较大,该部分仅对2012—2015年秋季学期采集的语料进行处理,春季学期的语料暂未处理。,剔除非词汇性语块。然后按照语块的功能,将符合条件的语块分主题相关语块、语篇构造语块、交际功能语块和其他语块4个类别分别统计。统计结果见表5。

表5详细反映了不同水平的英语学习者口语中词汇性语块的使用情况。首先,从词汇性语块的使用总数来看,不同年级学生之间并不存在明显差异。一年级学生口语中使用的词汇性语块总数为2 935个,四年级学生使用了3 360个。四年级学生在使用数量上较一年级时有所提高,但一、二年级之间,二、三年级之间差别较小,进入高年级阶段,使用数量没有大幅度增多。其次,随着英语水平的提高,学习者使用词汇性语块的频率越来越高。一年级时,30 380词的口语语料中共使用词汇性语块2 935个,平均每12.21个词使用1次;二、三年级时,词汇性语块使用率分别下降到了11.7和9.66;四年级达到8.24。也就是说,二年级时学生口语中平均每11.7个词会使用一个词汇性语块,三年级平均每9.66个词使用一个词汇性语块,四年级学生在口语中平均每8.24个词就使用一个词汇性语块。可见,学习者英语水平越高,口语中使用词汇性语块越频繁。

表5 不同年级学习者词汇性语块使用情况②词汇性语块使用频率的计算方法为语料总词数减去词汇性短语词数之后除以词汇短语总数。

下面分析不同水平英语学习者在使用不同类型词汇性语块方面表现出来的特征。首先是主题相关语块。从表5来看,各年级之间不存在显著差异。一年级学习者共使用了792个,占所有词汇性语块的27%;四年级使用该类语块974个,占总数的29%。由此看出,英语学习者不管语言水平的高低,其口语表达均能紧扣主题,始终围绕主题展开。其次是语篇构造语块,在该类语块的使用方面,学习者不同阶段表现出的差别非常明显。一年级共使用263个语篇构造类语块,占词汇性语块的9%;随着学习水平的提高,二年级语篇构造语块所占比例提高到了14%;四年级语篇构造语块使用量最多,所有语料中共使用了741个,占总数的22%。这说明随着英语水平的提高,学习者能够更多使用语篇构造语块,以增加话语的流利性与连贯性。第三是交际功能语块。单从表5来看,四个阶段学生口语中使用该类语块的情况稍有差别,从一年级的24%增长到四年级的30%,呈现缓慢增长趋势。但在对不同年级提取出的交际功能语块进行定性分析时,我们发现不同语言水平学习者表现出显著差异。例如学习者在一年级时使用最多的交际功能语块是“I think”,占到了此类语块总数的近30%。尽管四年级学生也用了很多“I think”,但比例已大大降低。第四是与低年级相比,学生高年级阶段口语中使用词汇性语块的种类更加丰富,变化更加多样。在表达同一内容时,学生能够选择不同语块进行自由表达,这恰恰是低年级时所欠缺的。

五、结语

本研究基于语料库的方法,通过跟踪国内某大学英语专业两个自然班学生,重点探讨了英语学习者口语中语块使用的频率、种类、词性分布以及词汇性语块的使用情况。通过分析,我们得出以下结论:一是学习者口语中语块使用总体情况基本符合预期,学习者使用语块的数量、种类与语块自身的长度成反比。二是英语学习者口语表达时过分依赖名词+动词语块、名词语块和动词语块,较少使用介词语块,这与本族语者之间存在差异。三是随着学习者英语水平的提高,其使用语块的数量呈正态增长趋势。即学习者英语水平越高,其使用的语块数量越多,种类也越丰富。四是在词汇性语块使用方面,不同水平学习者尽管在不同类型语块的使用方面存在差异,但其使用总量会随着英语水平的提高而增长。

本研究还存在不足之处。虽然利用语料库的方法,但该研究基于小样本进行调查,要想深入研究英语学习者口语语块的发展特征,还需扩大研究样本。此外,为了增加研究结果的客观性,研究形式可更加多样化,如增加学生访谈、问卷调查等。期待英语教学界同仁今后对此进行更加深入的探讨。

[1] PAWLEY A,SYDER H.Two puzzles for linguistic theory:native-like selection and native-like fluency [C]//RICHARDS J,SCHMIDT R.Language and communication.New York:Longman,1983.

[2] SINCLAIR J.Corpus,concordance,collocation[M].Oxford:Oxford University Press, 1991:16.

[3] 刘国兵.中国英语学习者虚化动词TAKE词汇型式研究[J].当代外语研究,2011(10):58-63.

[4] 濮建忠.中国学生英语动词语法和词汇型式使用特点初探[J].现代外语,2000(1):24-44.

[5] 李文中.基于COLEC的中介语搭配及学习者策略分析[J].河南师范大学学报(哲学社会科学版),2004(5):202-205.

[6] 管博,郑树棠.中国大学生英语写作中的复现组合[J].现代外语,2005(3):288-296.

[7] 王立非,张岩.大学生英语议论文中高频动词使用的语料库研究[J].外语教学与研究, 2007(2):110-116.

[8] 许家金,许宗瑞.中国大学生英语口语中的互动话语词块研究[J].外语教学与研究,2007 (6):437-443.

[9] 马广惠.英语专业学生二语限时写作中的词块研究[J].外语教学与研究,2009(1):54-60.

[10] 丁言仁,戚焱.词块运用与英语口语和写作水平的相关性研究[J].解放军外国语学院学报,2005(3):49-53.

[11] 黄强.高年级英语学生词汇搭配习得的实证性研究[J].解放军外国语学院学报,2002 (4):76-79.

[12] 刁琳琳.英语本科生词块能力调查[J].解放军外国语学院学报,2004(4):35-38.

[13] 濮建忠.英语词汇教学中的类联接、搭配及词块[J].外语教学与研究,2003(6):438-445.

[14] 张军,李文中.COLEC中动名搭配模式及失误分析[J].外语教学,2004(4):30-32.

[15] 张建琴.中国高、中、初级英语学习者词汇短语使用的对比研究[J].外语界,2004 (1):10-14.

[16] JESPERSEN O.Living grammar[M]//BOR-NSTEIN D D.Readings in the theory of grammar.Cambridge:MA Winthrop Publishers,1976:82.

[17] FILLMORE L W.The second time around co-gnitive and social strategies in second language acquisition[D].Stanford:Stanford University,1976.

[18] BROWN R.A first language[M].London:Allen & Unwin,1973.

[19] BOLANDER M.Prefabs, patterns and rules in interaction? Formulaic speech in adult lea-rners’ L2 Swedish[M]//HYLTENSTAM K,OBLER L K.Bilingualism across the lifespan.Cambridge:Cambridge University Pre-ss,1989:73-86.

[20] WRAY A.Formulaic language and the lexicon[M].Cambridge:Cambridge University Press,2002.

[21] BEEKER J.The phrasal lexicon[M]//SHANK R,NASH-WWBBER B I.Theoretical issues in natural language processing.Cambridge:Bolt Beranek and Newman,1975: 60-63.

[22] NATTINGER J,DECARRICO J.Lexical phr-ases and language teaching[M].Oxford: Oxford University Press,1992.

[23] LEWIS M.Pedagogical implications of the lexical approach [M]//COADY J, HUCKIN T.Second language vocabulary acquisition.Cambridge:Cambridge University Press,1997:255-270.

[24] DE COCK S,GRANGER S,LEECH G,et al.An automated approach to the phrasicon of EFL learners [C]//GRANGER S.Learner English on computer.London:Longman,1998: 78.

[25] BIBER D,JOHANSSON S,LECCH G,et al.Longman grammar of spoken and written English[M].London:Pearson Education Limited,1999.

[26] KETKO H.A comparative study in the use of multi-word chunks between English native speakers and Japanese learners of English[D].Birmingham:Aston University,2000.

(责任编辑:李晓梅)

The Developmental Features of Learners’ Chunks in Written Corpus

LIU Guobing

(Faculty of Foreign Languages, Henan Normal University, Xinxiang, Henan 453007, China)

Based on the spoken materials collected from the English majors in the past four years, the developmental features of Chinese EFL learners’ chunks in their spoken English are reported. The results indicate that there is an inverse increase between the length of learners’ spoken chunks and their number and type. Chinese EFL learners depend too much upon the n.+v. chunks, n. chunks and v. chunks, but use less prep. chunks. With the development of learners’ English ability, they use more and more chunks in their spoken English.

English learner; chunks in written English; developmental feature

2017-04-20

国家社会科学基金项目“英语学习者书面语语篇连贯自动评价系统研究”(14BYY084)

刘国兵(1978—),男,河南滑县人,河南师范大学语料库应用研发中心学术带头人,校聘教授,外国语言学及应用语言学博士,硕士生导师,研究方向:语料库语言学及外语教学。

H319.3

A

1674-0297(2017)04-0111-06

猜你喜欢

语块英语水平语料
从中式英语探析我国大学生英语水平现状
通道形式与英语水平对大学生英语听力成绩的影响
基于语料调查的“连……都(也)……”出现的语义背景分析
《苗防备览》中的湘西语料
英语语块在汉英翻译中的积极作用
国内外语用学实证研究比较:语料类型与收集方法
英语水平
Reliability assessment consideringdependent competing failure process and shifting-threshold
从语块类型看英语专业大学生语块获取能力与听力理解能力的相关性研究
语块的性质及汉语语块系统的层级关系