基于语料库的中外口语程式语的对比研究
2017-02-21王鹤云
王鹤云
摘 要: 考虑到程式语在英语口语学习中的重要作用,本文旨在通过对比SECCL2.0语料库和MICASE语料库中程式语的不同使用特点,探讨中国英语学习者同英语本族语者之间在程式语的功能特征这一方面的相同点及不同点。结果表明,中国英语学习者的口语程式语存在多用、少用及混用的特点。此研究结果在一定程度上反映了中国英语学习者在口语程式语的使用上所存在的问题,认清这些问题有助于学习者掌握地道的英语口语,同时为广大英语教师进行口语教学提出建议。
关键词: 英语口语 程式语 功能特征
1.引言
口语,作为书面语的基础,是语言系统中最基本的一种存在形式。语言的目的在于交流,而口语作为最简便快捷又时效的一种方式便显得极为重要,尤其是在外语学习中,口语是否流利准确已成为检测学习者水平高低的一个重要指标。然而,由于应试教育在中国根深蒂固,教师们通常过多地注重英语的读和写,却忽视对学生进行听和说这两方面的锻炼。相关资料显示,当今一些大学毕业生的英语口语能力不容乐观。并且学生表示,同外国友人的交流仅仅局限于表面层次,还没说上几句就不知该如何继续将谈话深入下去。因此,提高英语学习者的口语能力以使表达更自然、更地道,应当成为我国英语教学工作的重点之一。
那么,如何掌握一口地道的英语口语呢?从相关的语料库研究可以了解到,语言的使用呈现出程式化的特征(Wray 2002),即自然语言的产出中存在着大量的预制、半预制的词语序列,并且这些程式化序列基本上构成自然话语总量的60%~80%(Altenberg 1998),成为自然话语的重要组成部分。由此可见,掌握流利地道的口语的关键是熟练运用这些程式化序列。
在这一研究中,笔者采用语料库对比分析的方法,以SECCL2.0语料库为基础,通过对比MICASE语料庫,确定中国英语学习者同英语本族语者的口语程式语在功能特征上的不同特点,进而对英语口语的教学工作提出可行建议。
2.文献综述
不管是在一语还是二语习得中,程式语都发挥着重要作用。程式语,又被称为词块、固定搭配、惯用语等,指的是由连续或者非连续的单词或其他部分组成的预制性语块,它们以整体为单位在记忆中存储或提取,无需经过语法的分析和生成(Wray 2002),具有预制性、整体性和归约性。
根据Biber等和Butler的分类方法,笔者将程式语按照功能特征分为三类:语篇衔接词、人际关系词和话题内容词。语篇衔接词起到连接上下文的作用,如in the first place等;人际关系词表达说话人的态度及看法,如I think等;话题内容词涉及体验功能,与身体或抽象实体发生直接关系,反映某种经验模式,它又可细分为动词、名词、形容词、副词及介词词块,如in the world、a good job等。
在过去的三十年中,对程式语的研究越来越引起国内外学者的关注。Decock通过对比法国英语学习者同英语本族语者的口语语料库,研究了两者中高频出现的2至6词词长的程式语之间的特点差异。结果表明,法国英语学习者比本族语者更多使用高频出现的词汇搭配,并且在语法结构及语用功能上呈现出显著差异。
许家金和许宗瑞采用语料库对比分析的方法,研究了中国英语学习者同英语本族语者在互动话语词块的使用上的异同。结果表明,中国英语学习者在这一词块的使用上呈现出表达形式单一、受母语迁移影响过重的特点。
戚焱和丁言仁通过对比中国英语专业大学生的4年跟踪口语语料和美国大学生的口语语料,研究了中美大学生口头独白中的词块在流利性、准确性和多样性这三方面的不同特点。结果表明,中美大学生口语中的词块使用异同并存,且中国学生的词块使用在准确性上仍有待提高。
3.研究方法
3.1研究问题
3.1.1SECCL2.0和MICASE中程式语的功能特征分别有哪些?
3.1.2中国英语学习者同英语本族语者在程式语的使用上有何异同?
3.2语料库
本次研究采用的学习者语料库为中国学生英语口笔语语料库(SWECCL 2.0)中的口语子库(SECCL 2.0)。该语料库共计100余万词,收录了2003年至2007年间全国英语专业四、八级口试,其语料内容涉及社会、生活及文化等方面。考虑到口语考试的任务类型,本研究选取了专四口试中的任务二、任务三,以及专八口试中的任务三为语料来源。
采用的本族语参照语料库为密歇根学术英语口语语料库(the Michigan Corpus of Academic Spoken English,以下简称MICASE)。该库共收录约180万词,包括不同场合的英语学术口语,如学生课堂讨论、演讲、学术会议等,与SECCL2.0具有较强的可比性。
3.3程式语的提取与筛选
本研究中采用AntConc对程式语进行提取,通过确定程式语的长度,即词块长度为四词词块,提取的频点为40次/mw,由此初步得到所需的程式语。其次,用人工筛选的办法将所有无意义及不符合语法规范的程式语排除,得到符合条件的程式语。最终,MICASE中总共提取出57个符合条件的目标词块,SECCL中提取出107个。
4.结果及讨论
4.1中国英语学习者口语程式语的功能特征
4.1.1语篇衔接词
仅有5个,占总数的4.67%(5/107)。
4.1.2人际关系词
共有45个,占总数的42.06%(45/107),其中使用频率最高的为Ithink...,所占比例为57.78%(26/45),其次为Iwantto…,所占比例为20%(9/45)。
4.1.3话题内容词
使用数量最多,共有52个,占总数的48.6%(52/107),其中使用频率较高的为动词词块和名词词块,所占比例分别为57.69%(30/52)、32.69%(17/52),其次是介词词块(7.69%(4/52))和从句类词块(3.85%(2/52))。
4.2英语本族语者口语程式语的功能特征
4.2.1语篇衔接词
共计10个,占总数的17.54%(10/57)。
4.2.2人际关系词
共有17个,占总数的29.82%(17/57)。其中,使用最频繁的为Ithink,Imean这两种,所占比例分别为23.53%(4/17)、29.41%(5/17)。另外,还有want,tryingto,goingto和gonna等表达方式的使用,类型较多。
4.2.3话题内容词
使用数量最多,共有30个,占总数的52.63%(30/57)。具体来说,动词词块、名词词块和从句类词块更为经常使用,其比例分别为17.54%(10/57)、12.28%(7/57)、10.53%(6/57)。
表1 三类词块在两个语料库中的比较
表2 话题内容词的具体分类在两个语料库中的比较
通过以上数据我们可以发现,中国英语学习者同本族语者在这三类词块的使用上异同并存。
相同之处在于,两者都是话题内容词使用量最多,其次是人际关系词,最后是语篇衔接词。这体现了口语的特点,即注重信息的交互性,因为人们在交谈的过程中更多的是涉及实质的内容。
两者的不同之处主要有以下几点:(1)在话题内容词的使用上,我国英语学习者同本族语者之间虽然差异不大,但根据此类词块的具体分类来看,我国学生过多地使用动词词块,且某些动词词块的使用呈现出书面语的特征,比如try our best to,pay more attention to等。究其原因,这与我国英语教学过于强调英语的写作输出有关,导致学生在进行口语交流的时候对口语及书面语的语体差异认识不清,从而使口语受到书面语的影响。另外,我国学生过多使用名词词块,考虑到这一点应该是与专四专八口试的语篇任务有密切关系。其口试大多是就某一话题发表自我看法或者是讨论交流,因此会涉及较多与话题内容相关的名词词块,比如a part time job,a lot of time,a big financial burden等。最后同英语本族语者相比,我国学生过少地使用从句类词块,这表明我国学生在口语表达时倾向于使用结构简单的句式,同时考虑到是口语测试的原因,学生也可能会采取回避策略以免出现错误表达。(2)在人际关系词的使用上,同本族语者相比,我国学生过多使用这一类词块,且类型比较单一,其中以I think类词块使用最多(57.78%),超过半数,而本族语者则并没有局限于某一类词的过度使用。另外,本族语者在这一类词块中缩略语的使用较多,比如gonna、wanna等,而我国学生则没有出现任何一种,这同样表明我国学生的口语化特征不明显。(3)在语篇衔接词的使用上,我国学生呈现出使用过少的特点。这说明我国学生在口语表达时忽视了语句之间逻辑上的连贯性,这与平日口语输出不足有一定关系。
5.结语
我国学生的英语口语程式语的使用存在多用、少用及混用的特点,这与所选取的学习者语料库中的任务类型有一定相关性,但更多地揭示了我国学生在口语表达上存在的一些问题,比如口语与书面语语体差异认识不清,从而导致两者混用。另外,口语程式语的使用形式单一,结构简单,与本族语者存在较大的差距。因此,为了使学生的口语水平更接近本族语者,教师及学生双方需要作出共同努力。此外,对于英语口语教材编写者来说,这也是实行改革创新的一个切入点,在教材编写的原有基础上可以更多地增加一些本族语者的口语程式语表达方式,使学生从源头上感受到地道而又真实的英语口语,提高口语表达能力。
参考文献:
[1]Altenberg B.On the phraseology of spoken English:The evidence of recurrent word combinations[A].In Cowie AP(eds.).Phraseology:Theory,Analysis and Applications[C].Oxford:Oxford University Press,1998.
[2]Biber D,Johansson S,Leech G,Conrad S & Finegan E.Longman Grammar of Spoken and Written English[Z].London:Longman,1999.
[3]Butler C S.A recurrent word combination approach to the study of formulae in the speech of native and non-native speakers of English[J].International Journal of Corpus Linguistics,1998,3(1):59-80.
[4]DeCock S.(2004).Preferred sequences of words in NS and NN Sspeech[J].Belgian Journal of English Language and Literatures(BELL),2004(2):225-246.
[5]Wray A.Formulaic Language and the Lexicon[M].Cambridge:Cambridge University Press,2002.
[6]胡元江.基于语料库的英语专业高年级学生口语词块结构特征研究[J].外语研究,2015(5):26-30.
[7]刘仕明.第二语言习得中的程式语研究[J].天津外国语学院学报,2002(2):25-29.
[8]马广惠.词块的界定、分类与识别[J].解放军外国语学院学报,2011(1):1-4.
[9]戚炎,丁言仁.中美大学生口语中词块使用特点对比分析[J].外语界,2011(3):52-59.
[10]許家金,许宗瑞.中国大学生英语口语中的互动化语词块研究[J].外语教学与研究,2007(6):437-443.