基于语料库的雅思写作词汇特点分析
2013-12-31沈小婷
考试周刊 2013年39期
摘要: 本研究通过软件分析对比雅思写作满分范文和考生作文词汇密度、词汇多样性、词汇复杂度三方面的词汇特点,旨在发现词汇特点对中国雅思考生写作成绩的影响,以及这些影响主要体现在写作的哪些方面。结果表明:雅思写作满分范文与学生作文的词汇密度差别不大;考官使用的词汇更多样;考官与学生使用的词汇难度差异不明显,然而小作文所使用的词汇难度比大作文略微大些。此研究的结果将有助于考生和老师制订科学的提高方案。
关键词: 语料库雅思写作词汇特点
1.引言
雅思考试(IELTS - International English Language Testing System)是听说读写四项英语交流能力的语言测试。作为英联邦国家的主要认证考试,雅思考试已经成为中国学生留学的必要环节。然而,中国学生的雅思成绩却不十分理想,尤其是在写作方面,满分9分,中国考生的平均分在5分左右,位居世界倒数,严重影响了出国学子留学申请及深造的成功录取率。雅思的授课老师和学生都在写作方面投入了不少时间和精力,可是结果仍然不尽如人意。根据观察,从事雅思教学的教师多为英语培训机构的教职人员,不少老师对考试的特点了解不够,对学生在写作中存在的问题尚缺乏研究对策和科学的剖析。
通常,在经过一定训练后,大部分考生都能完成雅思考试的基本写作任务。因此,影响考生的雅思作文分数的主要原因在词汇量和句子多样性上。为了使中国雅思考生和授课教师进一步了解雅思考试并且通过科学的方式提高考试成绩,本研究通过自建小型语料库,利用软件对比雅思写作“满分范文”和“学生作文”词汇特点,剖析雅思学生作文中的症结。
2.文献回顾
学术界对于词汇特点的衡量标准没有一致的结论。根据Laufer和Nation(1995),词汇特点可以用词汇密度、词汇多样性、词汇难度体现。
词汇密度(lexical density)指文本中实词数量占文本总词数的比例[1]。Linnarud(1986)和Engber(1995)[2]研究发现,词汇密度与英语写作的分数关系不显著。本研究中,实词指的三名词、形容词、动词、副词、人称代词和数词,主要起传递信息的作用。词汇密度指实词总数占文本总词数的比例。
词汇多样性又名为词汇差异度(lexical diversity),指的是语言学习者在语言使用中展示出的词汇使用范围,可以通过采用类符与形符比(STTR)测量。
词汇复杂度(lexical complicity)是指学习者在文本中不常用词汇或高级词汇所占的比例。词汇复杂度同样可以通过软件分析而得出。比如,Laufer与Nation(1995)曾经开发出词汇频度库(lexical frequency profile)测量词汇难度。
本研究将以Laufer和Nation词汇分析理论为基础,通过语料库软件分析雅思写作满分范文和学生作文词汇密度、词汇多样性、词汇复杂度三方面的特点,从而为雅思写作作真实、科学的指导。具体解决的问题如下:
(1)雅思写作大作文和小作文在词汇密度方面有何差异?
(2)雅思写作满分范文和学生作文在词汇多样性方面有何差异?
(3)雅思写作满分范文和学生作文在大作文的词汇难度方面有何差异?
3.研究设计
3.1建库过程
雅思写作考试分为小作文和大作文两部分。小作文为图表表示,属描述性说明文性质,字数要求150词以上;大作文为大家所熟悉的议论文,字数要求250词以上。根据考试风格,本研究所建立的雅思写作语料库主要分为“满分范文语料库”和“考生作文语料库”两部分。其中,“满分范文语料库”分为《小作文满分范文》和《大作文满分范文》两个子语料库,研究语料来自于《剑桥雅思真题系列集4-9册》、新东方引进教材“Collins: Writing for Ielts”[3]、雅思权威网站www.yasi9.com三部分。《学生大作文》来源于西安新东方学生作业。由于语料的来源途径有限,外加小作文考法稳定,学生小作文暂不列入对比范畴。具体的语料库信息如下:
表3-1:雅思写作语料库
3.2主要研究工具
(1)语料库标注软件(BFSU Stanford POS Tagger1.1.2):用于词性标注[4];
(2)语料库检索软件(AntConc3.2.1):利用正则表达式检索统计不同词性词数和词类;统计标记词数和TTR值[5];
(3)词性复杂度分析软件(Antwordprofiler 1.200w):用于测量文本中的词汇难度[6]。
4.结果与讨论
本研究主要涉及的步骤包括:建立语料库,标注文本,统计词性,统计TTR值,分析词汇梯度。所获得的结果按照研究问题分成以下三部分。
4.1雅思写作大作文和小作文的词汇密度差异
通过标注与统计(见表4-1),三个子语料库的词性统计求和结果表明:大作文满分范文、小作文满分范文、学生大作文的实词所占比例分别为66%、68%和70%。不同语料库的实词总数并无显著差别,说明词汇密度与作文分数无必然关系。
研究进一步发现,大作文中,满分范文与学生作文各类词性的使用频率几乎一致,略有差别的是范文使用的人称代词比学生少,原因可能为范文作者更擅长使用不同的句型,如用被动句取代人称为主语的主动句。
表4-1雅思写作词性分析
注:词汇密度的计算公式为:词汇密度(LD)=实词总数/文本总词数
根据表4-1进一步观察发现,在小作文满分范文与大作文满分范文两个语料库中,不同词性的数量出现较为明显的差异。首先,小作文使用的名词和数词比例高于大作文,尤其是数词,大作文和小作文中所使用的数词比例分别为7.37%和0.69%。这主要跟文体有关,小作文为图表描述说明文,较为客观,所涉及的数词比大作文多,主要用于描述数据。然而,大作文使用的动词的比例则明显高于小作文(分别为20.16%和13.86%),原因可能在于小作文的动词相对固定,主要用于客观描述变化,而大作文是以论证说明为主,所需表达的信息更多样。
4.2雅思写作满分范文和学生作文在词汇多样性方面的差异
满分范文和学生作文的词汇多样性可通过表4-2体现。如表所示,大作文满分范文和学生作文在所使用的词汇的平均长度几乎一致,分别为4.88和4.89;然而满分范文所使用的句子平均句长比学生作文多了约3个词。在实际写作中,需要使用一定的长句,增加提分的可能性。
表4-2:满分范文与学生范文STTR值
在类符/型符比概念中,形符(token)指文章中的每个词符/字符;类符(type):文章中每个不同的词符;类符/形符比(Type-Token Ratio):文章内不同单词数和词的总数之比(表明重复率)。因此,TTR值越高,说明文本词汇的重复率越高,词汇多样性弱;TTR值越低,说明文本中词汇的重复率越低,词汇多样性越强。表中满分大作文的TTR值比学生大作文和满分小作文低,说明三个库中满分大作文的用词最多样,满分小作文其次,学生大作文的用词多样性相对较欠缺。
此外,在词汇多样性方面,满分范文大作文的TTR值比满分范文小作文和学生大作文都低,说明高分大作文具有用词多样的特点。原因可能为,小作文作为图表作文,使用的词汇较为固定。比如,在小作文中,常见词有:
表4-3:雅思小作文常用词汇
学生大作文的词汇多样性不如大作文满分范文,原因可能在于学生对于词汇的掌握和应用能力仍有待提高。因此,为提高成绩,学生应多积累更多不同词汇并学会正确地道地应用。
4.3雅思写作满分范文和学生作文在大作文的词汇难度方面的差异
本研究在测量词汇难度方面采用2008年日本早稻田大学的Anthony Laurence开发的测量网页易读性的软件通过Antwordprofiler(AWP)软件自带的三级词表划分而成。Antwordprofiler在处理输入的目标文本过程中,会自动以其三个基础词表为单位(分别为nation_basewords 1,nation_basewords 2,和nation_basewords 3),词表级别越高,说明难度越大。通过Antwordprofiler软件对三个语料库进行词级分析,可以发现雅思写作中满分作文和非满分作文的不同词汇量的指标及这些词汇的词频分布。
表4-4:雅思写作词汇级别分布情况
根据表格4-4可以发现,Antwordprofile分别对三个库进行了分析,其中小作文满分范文所分析的7970个词中,75.76%覆盖在一级词表中;5.97%被覆盖在二级词表中,另有8.14%覆盖在三级词表。大作文满分范文三个等级词表的覆盖率分别为81.34%,6%和7.69%。大作文学生作文的词表覆盖情况与满分作文极为接近。整体而言,雅思作文所使用的词汇主要为一级词汇,覆盖率均为75%以上。小作文所使用的词汇难度比大作文大些。
小作文的复杂度比大作文相对难些,这主要跟说明文的科学性有关。通过满分范文与学生作文的对比分析发现,满分范文和学生作文中所使用的词汇难度相差并不明显,进一步说明词汇难度与雅思写作成绩关系不大。因此,笔者认为,通过应用高级词汇提高雅思写作成绩是一个误区,考生应该把更多的注意力放在词汇搭配和应用方面,除了词汇本身的拼写、意义选择之外,还应注意语法正确及使用语境得当等方面。
比如,在名词的搭配方面,文本中共检索到20个family的使用。在满分范文中,跟“family”这个词的搭配中包括形容词(regular,large,typical,whole,smaller,each),人称代词(their),动词(replace),介词(in)四类。在学生作文中,跟family搭配的词自由冠词(a,the)和介词(of,for,about),颇显单一。相形之下,满分作文在词汇搭配方面比学生作文更加丰富。因此,学生在雅思作文中应该多使用恰当的修饰成分,提高表达的科学准确性。
4.结语
本研究主要通过对比满分范文和学生作文两个子语料库,从大作文和小作文两部分探究雅思写作词汇密度、词汇多样性和词汇复杂性三方面的特点。语料库总词数为3万词,所得出的结果可为授课老师和考生提高雅思写作水平提供指导。
整体而言,词汇对雅思写作的成绩在某些方面不特别明显,因此雅思写作老师在授课方面还应更多地注意语法、内容丰富度、逻辑连贯等方面的训练。然而,词汇多样性是影响作文成绩的主要因素,学生应多了解自己在词汇方面的掌握情况,在备考过程中多阅读满分范文,积累更多的修饰技巧,并提高语言表达的准确性。此外,雅思写作老师在指导学生时不应该过于强调使用难词,而应该根据学生情况补充相对应级别的词汇,并且把重点放在如何提高词汇使用的准确性上。本次实验所收集的学生语料库的文章主要源于西安新东方老师收到的学生作业,学生在完成作业过程中主要按照课堂要求完成,所使用的词汇部分为课堂上老师讲过的示例,从一定程度上会减少满分范文和学生作文的词汇特点差异。
参考文献:
[1]汪顺义.大学英语四级写作样卷的词汇复杂度分析[J].重庆邮电大学学报(社会科学版),2011.
[2]张金福.基于美国当代英语语料库对中国学生英语作文中词汇应用能力研究[J].2012.
[3]Karen Kovacs. Collins English for Exams - Writing for IELTS[M].London: Harper Collins Publishers,2012.
[4]许家金,贾云龙.BFSU Standford POS Tagger:图形界面Windows版本.北京:北京外国语大学中国外语教育研究中心,2011.
[5]Laurence Anthony.Ant Conc 3.2.4w (Windows). Center for English Language Education in Science and Engineering Faculty of Science and Engineering,Waseda University,Japan,2011.
[6]Laurence Anthony.Ant Word Profiler. Center for English Language Education in Science and Engineering,Japan. Faculty of Science and Engineering,Waseda University,2009.