基于CLEC语料库的中国学生英语作文超用词研究报告
2017-02-26张馨文
(广西民族大学,广西 南宁 530000)
摘要:本文基于中国学习者语料库CLEC,与参照语料库LOB进行对比,同时将CLEC中的五个子语料库分为三组,分别与LOB语料库进行对比,研究中国学习者写作中的超用词现象。分析五大词类超用词即介词、代词、连词、情态动词和虚化动词中的若干词,并研究英语学习者写作中的超用趋势是否随英语学习者的水平的提高而减弱,从而揭示其对外语教学的启示。
关键词:超用词;中国英语学习者;语料库
中图分类号:H319 文献标识码:A 文章编号:1671-864X(2016)11-0249-02
一、引言
随着计算机语料库的出现和普遍应用, 基于学习者实际使用的语料库对比研究成为可能。杨慧中在2003年上海语料库语言学国际会议的开幕式发言中指出“中国的语料库语言学研究从20世纪80 年代中期建成第一个语料库起,就与外语教学结下了不解之缘”。语料库能帮助语言研究者在研究学习者词语的超用中使用定量方法,做各种统计推断,从而避免了判断上的主观性。本报告通过分析CLEC中的词语超用情况,主要回答以下三个问题:第一,与LOB相比,中国英语学习者写作中的超用词主要的词类;第二,中国英语学习者写作中的超用词的使用频率是否随着英语水平的提高而减小;第三,中国英语学习者写作中的超用词使用频率比英语本族语者使用频率高出的百分比以及英语学习者写作中的超用趋势是否随英语学习者的水平的变化而变化。词语的超用很大程度上反映出的是学习者对词语知识深度的掌握和运用的精确度高低,本报告所做的分析旨在揭示词语的超用情况对外语教学的启示。
二、研究对象
英语本族语者语料库LOB,是1978年由英国Lancaster大学和挪威Oslo大学以及Bergen大学共同创建的,收录了1961年英式英语书面语,共有一百多万词。中国学习者英语语料库CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词。LOB语料库和CLEC语料库都是书面语语料,选取这两个语料库为研究对象,能保证结果的有效性。另外,本文将CLEC中的5个子语料库化分成中学生学习者、大学生非英语专业学习者和英语专业学习者三组,如表1所示。将三组学习者分别对照LOB语料库,观察分析介词、代词、连词、情态动词和虚化动词等超用词超用率变化情况。其中介词包括to、In、about、For、和At;代词包括I、we、you、they、them、me、We、 us和 They;连词包括so、But、So、And、If和Because;情態动词包括:can、will、should和must;虚化动词包括do、make、get和take。以上超用词选自CLEC对照LOB获得的按照频数排列的前一百个超用词列表。
表1 CLEC语料库分组
学习者类型 代号 形符
高中生 ST2 215525
大学1-2年级非英语专业学习者
大学3-4年级非英语专业学习者 ST3和
ST4 371906
英语专业1-2年级学习者
英语专业3-4年级学习者 ST5和
ST6 445901
总计 1033332
三、研究工具和方法
本文借助语料库索引软件AntConc3.2.4w,对英语本族语者语料库LOB和中国学习者语料库CLEC以及将其分成的三组不同水平的中国学习者进行对比分析,得出中国学生英语作文超用词研究报告。首先在AntConc3.2.4w软件中打开Tool Preferences, 在Choose file选项下选择参照语料库LOB,点击Apply。 然后在Open file中打开目标语料库CLEC。最后点击Keyword List和sort by frequency,获取以词频排序的CLEC中的前一百个超用词列表。从列表中归纳出主要的超用词类,分析5大词类即介词、代词、连词、情态动词和虚化动词的超用情况,即在C LEC三组不同水平英语学习者中5大词类的使用频率的变化情况。经过上述同样办法,得出这些词在CLEC的三组语料库中也是超用词。通过Word List分别搜索出三组不同水平英语学习者在上述五大词类的各自使用频数总数,然后分别除以各自型符数得出使用频率。将各组使用频率进行对比,观察高频词的使用频率是否随英语水平的变化而改变。再将中国英语学习者英语写作中五大类超用词使用频率与LOB中的相应的使用频率相比,观察中国英语学习者的高频词的使用率高于本族语者多少,这种超用趋势是否随英语学习者的水平变化而改变。
四、数据分析
为了回答第一个研究问题,本文把CLEC与LOB相对比,统计出中国英语学习者写作中的超用词主要有五大超用词类分别是介词、代词、连词、情态动词和虚化动词。本报告选取了按词频排序的CLEC中的前一百个超用词列表,见附录1。并将其中的五大词类的超用词在LOB和CLEC以及三组不同水平英语学习者中的使用频数和使用频率列出,分别见表2和表3。从表2和表3可以看出第二个研究问题的答案。代词和连词的使用频率会随英语学习者水平的升高而降低。从大学英语四六级组到英语专业组,各类词的使用频率分别降低了。在一定程度上可以得出:中国英语学习者写作中的超用词的使用频率会随着英语水平的提高而减小。
表2 五大超用词类的使用频数
使用频数 LOB CLEC ST2 ST3和ST4 ST5和ST6
型符 1022326 1033332 215525 371906 445901
介词(5) 30391 38278 6990 14818 16470
代词(11) 31862 66871 15808 26853 22538
连词(6) 5657 13133 3307 5285 4541
情态(4) 9664 20507 2595 10656 7256
虚化动词(3) 2067 6005 802 3316 1887
表3 五大超用词类的使用频率
使用频率 LOB CLEC ST2 ST3和ST4 ST5和ST6
介词(5) 2.97% 3.70% 3.24% 3.98% 3.69%
代词(11) 3.12% 6.47% 7.33% 7.22% 5.05%
连词(6) 0.55% 1.27% 1.53% 1.42% 1.02%
情态(4) 0.95% 1.98% 1.20% 2.87% 1.63%
虚化动词(3) 0.20% 0.58% 0.37% 0.89% 0.42%
表4 CLEC、ST2、ST3和ST4、ST5和ST6的五大超用词类使用频率与LOB的使用频率之差
使用频率之差 CLEC-LOB ST2-LOB ST3和ST4-LOB ST5和ST6-LOB
介词(5) 0.73% 0.27% 1.01% 0.72%
代詞(11) 3.35% 4.22% 4.10% 1.94%
连词(6) 0.72% 0.98% 0.87% 0.47%
情态(4) 1.04% 0.26% 1.92% 0.68%
虚化动词(3) 0.38% 0.17% 0.67% 0.22%
说明:表中的(5)、(11)、(6)、(4)和(4)分别代表各项词类的数目。表中统计的五大词类的各自的种类分别包括介词to、In、about、For、和At;代词I、it、we、you、they、it、them、me、We、 us和 They;连词so、But、So、And、If和Because;情态动词:can、will、should和must和虚化动词make、get和take。
通过表4,可以回答第三个研究问题中的第一问,从表中直观地看出五类词在CLEC语料库中使用率分别比LOB高出0.73%、3.35%、0.72%、1.04%、0.72%。为了回答第三个研究问题中的第二问,本文做了以下分析。
代词、连词在三组学习者的使用率与LOB中的使用率之差随着学习者水平的提高而减小,说明代词和连词的超用趋势会随英语学习者的水平提高而减弱。
关于介词,本报告只是选取了使用频数较高的to、In、about、For、和At这五大类介词,所以表四中中学学习者的介词超用率低于后两者。主要原因是初级学习者主要把介词用于时间状语和地点状与以及一些简单的词组例如In fact, talk about和worry about等,对于一些搭配用法例如in order to等不清楚。但是从表中可以看出英语专业学习者的介词超用率明显低于大学英语学习者。随着英语水平的提高,英语专业学生的语言运用能力越来越接近本族语者,而且词汇量增大,掌握了一些替代用法,因此超用率会相对降低。
关于情态动词的使用,大学英语学习者的写作中表达观点的用法多,例如经常会用到“我们应该怎样或必须怎样”。所以can、will、should和must这四类词的超用率高于中学学习者。但是随着英语水平的提高,英语专业学习者的情态动词超用率明显降低。因为英语专业的学习者不仅能区别它们的文体意义也能较准确地区别语义功能。
虚化动词指的是语义较弱的高频动词,本身没有非常具体的意义,其意义通过其搭配使用的名词表现出来。虚化动词与其搭配使用的名词之间往往是一种任意关系,没有较强的语义理据,例如:make a speech, have a meeting和get together。中学学习者词汇量少,能运用的与虚化动词搭配的名词少,所以本报告涉及的虚化动词make、get和take的使用频率低,超用率也低。在大学英语学习者中虚化动词使用频率最高,但是在英语专业学习者中的使用率呈降低趋势,而且超用比率也呈减弱趋势。因为英语专业同学词汇量增加,而且经过更多的训练,会运用于其他词组或表达方法代替虚化动词,避免重复使用。
五、结论和启示
通过数据分析,可以得出:由于本报告选词有限,因此个别词类的高中学习者的超用情况相比较于大学英语学习者较弱。但相对于大学英语学习者,英语专业学习者中的超用情况都呈现出减弱趋势。在一定程度上,说明了:中国英语学习者写作中的超用现象会随着英语水平的提高而减弱。这也说明了,不同的词的超用情况会不同,本报告在此不做具体分析,旨在发现其中超用规律,从而获得更好的教学启示。
对于大学英语写作中常用词超用现象有两种常识性解释:学习者能用性词汇量缺乏,过分依赖熟悉词(濮建忠2005)。本报告的结果证明词汇教学应该注重以下三方面:第一,教师在教学过程中帮助学生提高避免超用意识,让学生认识到这一现象,使学生有意识地减少高频词的过度使用。第二,在教学中,注意比较高频常用词及其同义词的用法,将其置于具体语境中教授学生。这有助于更好的领会词汇意义,增加学生的词汇量,提高学生词汇使用的多样性。第三,在教学过程中,老师应引领学生多接触本土英语语言材料,避免母语的迁移,学习地道的语言表达方法,在听说读写各个方面都养成用英语思维思考的习惯,从而提高英语表达水平。
参考文献:
[1]Granger,S.The learner corpus:A revolution in applied linguistic[J].English Today.1994,(10/3):25-29.
[2]陈鹏.基于语料库的中国英语学习者连接词使用研究[J].当代外语研究,2010(6):28-34.
[3]桂诗春.不确定性判断和中国英语学习者的虚化动词习得[J].外语教学与研究,2007(1):3-12.
[4]桂诗春.中国学习者英语言语失误分析.基于CLEC语料库的中国学习者英语分析.上海:上海外语教育出版社,2005.
[5]龚嵘.大学英语写作中常用词超用现象矫正训练程序的有效性论证[J].当代外语研究,2012(1):32-36.
[6]蒋婷,高霞.中国英语学习者写作中超用词现象透视——一项基于语料库的实证研究[J].西南民族大学学报,2008(198):263-266.
[7]李建平,王传鹏.从高考英语测试看我国中学生情态动词的使用情况——一项基于语料库的对比研究[J].考试与招生.2014:49-54.
[8]王立非,文秋芳.母语水平对二语写作的迁移:跨语言的理据与路径[J].外语教学与研究,2004(3):205-212.
[9]文秋芳,丁言仁,王文宇.中国大学生英语书面语中的口语化倾向——高水平英语学习者语料对比分析[J].外语教学与研究,2003(4):268-274.
[10]谢家成.基于语料库的英语教材虚化动词对比研究——以虚化动词“do”为例[J].外语教学理论与实践,2010(3):13-17.
[11]杨惠中主编.语料库语言学导论[M].上海:上海外语教育出版.
[12]杨惠中,桂诗春,杨达复.基于CLEC语料库的中国学习者英语分析[M].上海:上海外语教育出版社.
作者简介:张馨文(1991-),女,汉族,山东枣庄人,硕士,广西民族大学,研究方向:隐喻学。