基于语料库的托福与考研英语一的阅读理解的对比分析
2021-11-12杨朵朵
杨朵朵
郑州西亚斯学院堪萨斯国际学院
一、研究设计
本研究随机抽取的托福阅读理解30篇共22485字和考研英语一(以下简称英一)的阅读理解文本40篇共19343字,自建两个小型语料库分别为语料库1(托福阅读文本语料库)和语料库2(英一阅读文本语料库)。研究所用的语料库软件为Range32,Antconc3.2.4,WordSmith,Wordart和卡方检验等。本研究采用定量研究与定性研究相结合的方法对比分析托福阅读理解文本与英一阅读理解文本的难度差异。
二、数据分析
1.表层结构。
篇章的长度、句长、词长、语篇中的生词数量等影响着文章的可读性,所以首先从这几个方面对文本进行解读。
(1)文本长度。英一的阅读理解文本共有40个,文本的平均词数为472个。其中最短的文本为457词,最长的文本为507词,极差为52词。托福的阅读理解文本共有30个,文本的平均词数为708个。其中最短的文本为676词,最长的文本为754词,极差为78词。托福文本长度的变化略大于考研文本,但是托福文本的平均长度远大于考研文本,如果单纯从文章长度来看,可以推测托福阅读理解的难度要远远高于考研英语的阅读理解。但是单从文本的长度来判断难易度并不十分可靠,所以接下来还会对文本的词汇等级水平进行考察。
(2)词汇密度。形符一般是指语料库中出现的所有的词,类符指的是语料库文本中任何一类独特的词,排除重复、忽略大小写和曲折变化。标准类符形符比是文本中每1000词计算出类符形符比再求出其平均值。比值越高说明文本的词汇量越丰富,词汇涉及范围越广。平均词长为文中类符的平均长度,一般而言平均词长越长表明文本中的长词较多,文本更深奥复杂。(李敏杰,朱薇 2012:177-180)平均句长是能够表达一个完整意思的语言单位所包含的平均词数。托福阅读理解文本的平均词长与英一的平均词长都为5,二者保持均衡;而标准类符形符比为50.64大于英一的标准类符形符比45.35,说明托福阅读文本的词汇丰富度大,文章的词汇涉及范围更广,这就会使读者更不容易掌握;平均句长为23也略大于英一的平均句长,说明文章中长难句的比例要高;长难句的出现会减慢读者的阅读速度,甚至造成误解或不解。以上两项都会造成读者阅读的障碍,所以可以推测托福的文章难度要大于英一。
(3)词汇难度。三级词表中,第三级和词表外词汇(not in the lists),特别是第三级词表对文本整体的词汇难度有较好的判别能力。(梁茂成、李文中、许家金2010:138)数据显示在一级和二级词汇上不管从类符还是形符上说英一的使用情况都要高于托福的使用情况,而在三级和词表外词汇的使用上,托福的使用情况都要高于英一。这说明英一阅读理解中低级词汇比较多,而托福阅读理解中高级词汇比较多,这就会给阅读造成很大的障碍,所以可以推测托福文章的难度要大于英一。
2.小结。
经过对表层结构进行分析,可以得出结论:托福文章词汇和句子难度都要大于英一。这似乎大家的普遍认识是一致的。但是现在下结论似乎为时过早,因为影响文本难度的因素不止语篇的词汇难度、句子长度和复杂度等,还包括语篇涉及的主题、文章的体裁句子的结构等深层因素。下面会继续对文本进行深层次的解读。
3.深层结构。
文本的题材和体裁特征对读者的认知要求有很大的不同,因而从深层次影响文本的难度。
(1)文章题材。Wordart在生成词云图的时候已经去除所有的功能词和数字,并把所有的词进行词形还原。其中单词越大说明该词在文章中出现的频率越高。首先,从词云图中的 water,plant,area,change,century,rock,fossil等词可以看出来:托福考试阅读理解的题材以生物、历史、化学、地理、环境、考古等学科性文章为主。而另一词云图中的company,world,research,public,change,busy,educated,job等词可以看出来:英一则是以一些有关经济、管理、社会、文化、科普等为题材的描写叙述科技进展,社会变化,公众生活等社科类的文章为主。虽然两者的主题有所不同但都偏向于自然科学和社会科学等题材。
另外,由于托福文本的文章题材涉及生物、历史、化学、地理、环境、考古等方面,而在这些学科领域有大量的术语和专有名词,比如在生物学上DNA分子的双螺旋结构的表述及其构成成分的术语都是一些我们不常见的长难词;如在化学学科领域,元素周期表上的各种元素名称及组成也都在术语的范畴内;在考古领域,各种已经灭绝了的生物名称如寒武纪的恐龙等等也都是非常复杂的不在低级词汇的范围的单词。而考研英语里虽然也有一些长难词但像这些偏僻的高级专业词汇就没有那么多。这就造成了前面的数据表里呈现的:托福词汇里出现的高级词汇远大于考研英语。但是实际上,这些单词并不影响我们对文章的基本理解,只不过是考生心理感觉特别难。一旦克服自己的心理障碍,我们做题的正确率就会有显著的提升。
(2)文章体裁特征。文本语体可分为五种:庄严文体、正式文体、商议文体、随意文体和亲密文体。(曾用强 2001:3)发现托福文章高频动词集中在:indicate,record, perform, reflect, observe, represent,measure 等偏正式和书面化的文体风格的词汇。英一的文章高频词汇也集中在:publish,perform,observe,record, regulate 等偏正式或书面化的文体风格的词汇上面,所以二者在体裁上都属于正式文体。
正式文体讲究句式的规整,词语的搭配,层次的递进。以上述高频词中record和research为节点词,随机从托福文本和英一文本中抽取两个句子。Eg1 为托福文本中的句子。Eg2为英一文本中的句子。从结构上来看,这两个句子都是复合句,结构都很复杂但条理清晰,句子虽长但表意明确,要理解这样的句子均需要较高的英语水平,而这正是正式文体在句法层面上的表现。在这一点上托福文本与英一文本并无差异,说明两者在难度上均衡。
Eg1:To the extent that the coverage of the global climate from these records can provide a measure of its true variability, it should at least indicate how all the natural cause of climate change have combined.
Eg2:To those who are unaware that animal research was needed to produce these treatments,as well as new treatments and vaccines, animal research seems wasteful at best and cruel at worst.
(3)共现词的差异性分析。传统语法和语言学研究都把动词作为核心,认为动词的信息量最大,是预测句子语义的首选词。(刘润清 2013:461)故而从英一高频词中在频率>3的高频动词中随机选择10个,并找出其在托福文本中出现的相应频率,经过卡方检验进行差异性对比生成表四,发现其中7个词(也就是70%)在使用上无差异,其中2个(也就是20%)有差异但差异性不大,只有一个(也就是10%)出现了显著性差异。这说明在文章的可读性上二者基本上保持均衡。
4.小结。
虽然在题材上托福文本和英一文本侧重点有所不同但都是偏向于自然科学和社会科学的取材,学术性比较明显;在体裁上,两者都属于正式文体;在高频动词的使用上很大程度上也没有太大差异,所以从深层结构分析来看,托福文本和英一文本的难度基本相当。
三、结论
基于语料库的视角,本研究采用定量和定性研究相结合的方法,从表层结构和深层结构两方面对托福阅读理解文本及英一阅读理解文本进行比较,发现在表层结构方面托福文本的难度要大于英一的难度,这也解释了大众的错误印象,但是经过深层剖析,发现造成表层结构难度差异的原因以及深层结构的相似性,得出结论:托福阅读理解文本的难度与英一持衡,难度基本相当。希望可以借此纠正大家的误区并给广大考生提供一些建设性的备考方案。