基于语料库的高考英语阅读理解试题语言复杂性分析
——以2008—2012年重庆市高考英语试题为例
2014-09-07文忠毅王雪玮
文忠毅,王雪玮
(重庆邮电大学 外国语学院,重庆 400065)
一、引言
阅读是理解和吸收书面信息最重要的手段,而提高阅读能力是中学英语教学的目的之一。[1]对学生阅读能力的考察也是高考英语试题的一个重要部分,其分值几乎占了总分值的三分之一。因此对阅读理解试题的研究一直是高考英语试题研究的热点之一。
目前对高考英语阅读试题的定性研究主要可分为试题解析和理论应用,前者主要是根据考试大纲和教学大纲分析阅读理解试题的命题特点,命题趋向和答题策略(如:蒋玉强[2];李汶蔓[3];胥少先[4]), 而后者主要是运用各种语言学理论对阅读理解语篇或试题进行分析(如李养龙,李莉文[5];陆辉[6];郑博[7])。就定量研究而言,除了极少数对阅读心理过程进行的实证研究外(蔡艳,丁树良,涂冬波[8]),绝大部分是对阅读测试的效度和信度的分析(如董曼霞[9];辜向东[10];邱劲[11])。尽管效度研究涉及了对语篇复杂性的分析,但基于语料库的研究极少。且已有研究对语篇“易读度”这一衡量的语言复杂性和测试效度的重要指标几乎都是通过Flesh的易读公式来确定的,但顾正广[12]对江苏省阅读试题分析发现使用语料库工具测量TTR(形符和类符比)反映的易读度和传统的易读公式计算出的结果有一定差异,这说明通过语料库方法进一步分析高考语篇的语言复杂性是十分必要的。
本文结合《普通高等学校招生全国统一考试大纲(英语)》[13](以下简称《考纲》) 和《全日制普通高级中学英语教学大纲(2000 实验修订版)》[14](以下简称《教纲》),基于语料库研究方法从语篇体裁、语篇长度、生词率和词汇密度等方面详细分析了2008—2012年重庆市高考英语阅读理解语篇的语言复杂性,以期对高考英语阅读试题的命题和备考提供参考。
二、研究方法
(一)研究对象
根据2008—2012年的重庆市高考阅读理解语篇自建语料库。建语料库时,去除了语篇中的乱码和不相关的符号,如中文解释等,并根据研究需要将年份、语篇顺序和语篇类型等相关信息分别标注为〈YEAR〉、〈PASSAGE〉和〈GENRE〉。
(二)分析方法
1. 分析框架
本文依据Bachman和Palmer提出的“任务特点”模式,[15]根据《考纲》和语料库研究方法确立以下分析框架(见表1),该框架从语篇输入方面着手分析。
表1 2008—2012年重庆市高考英语阅读理解语言复杂性分析框架
2. 分析过程
本文利用Range软件对阅读文本进行了分析。Range是由P. Nation和 A. Coxhead设计的可分析文本中词汇量和词汇丰富程度的软件。Range分析词汇的基本原理为:将某一文本中的词汇与某一词汇表相比较,通过观察哪些词出现或没有出现在该词汇表中以及出现在该词汇表中词汇的比例,来考察该文本的用词情况。[16]Range自带有若干基础词表,按难度高低分成级别,本文采用的是Range软件自带的通用大纲三级词表进行分析。第一级和第二级词表中包含的两千词族(word families)源自Michael West(1953)所编的《通用英语词表》(A General Service List of English Words),第三级词表的570个词族源自Coxhead(2000)的“学术英语词表”(Academic Word List)。[17]在三个词表中,第三级词表对文本整体的词汇难度有较好的判别能力,三级词表中类符所占的比例越大,词汇难度越大。因此,我们可以通过判断三级词表中类符所占的比例来初步判断阅读理解语篇词汇的难度[17]。
除了词汇量外,词汇的丰富程度也是衡量语篇难度的指标。因此我们通过考察语篇中类符和形符的比例(Type/Token Ratio,TTR)来进一步验证语篇难度,其中形符(token)是语言单位,类似于我们日常说的“词”,类符(type)指不重复计算的形符数。[17]
为了考察阅读语篇的复杂性是否符合《大纲》和《考纲》要求,我们分别用各年重庆市高考大纲词表替换Range词表,对2008—2012年的阅读理解语篇词汇进行了分析。由于大纲词表分为简单词汇和复杂词汇两个词表,我们将两个词表分别制作为一级词表和二级词表替换原有的Range分级词表。分析得出的词表外词汇即生词的数量,词表外词级别的类符所占的比例即为生词率,文本在二级词表和词表外词汇中的类符比越高说明语篇难度越大。
三、结果与讨论
(一)体裁分析
根据《大纲》要求,学生应“阅读生词率不超过3%的有关人物传记、寓言故事、活动记述、社会文化、文史知识、科普小品等内容的材料”。[13]根据体裁可将以上材料类型分为记叙文、说明文和议论文。此外,《考纲》规定,考生要能读懂熟悉的有关日常生活话题的简短文字材料,例如公告、说明、广告以及书报、杂志中关于一般性话题的简短文章。[14]表2是对2008—2012年重庆市高考英语阅读语篇体裁的统计情况。
表2 2008—2012年重庆市高考英语阅读理解语篇体裁
由表2可知,2008年—2012年高考阅读语篇的体裁都是记叙文、说明文和议论文,没有应用文。这不符合《大纲》和《考纲》对应用文阅读的要求。从董曼霞[9]可知,重庆市2004—2009年的阅读中仅有2004和2007年分别有一篇应用文。综合2004到2012的高考题可见,应用文在2007年以后都没有出现,而除了2011年以外,说明文和议论文分别占40%,这说明高考试题越来越重视学生对说明文和议论文的理解,但忽视了对应用文的考察。
高考阅读应大体符合由浅入深的出题规律。从体裁特点可知,记叙文的对象常常是日常生活中发生的事情,内容具体形象。通过记人记事的方式叙述的记叙文体裁使考生比较容易接受和理解,有利于考生进入阅读理解的答题状态。而议论文具有较强的思辨性,对理解要求较高。2008—2012年重庆市高考阅读理解的第一篇都是记叙文,而除了2011年以外,最后一篇都是议论文,说明阅读语篇在难易度安排上基本符合由易到难的规律。
(二)长度和生词量
《考纲》中对于词数的要求是每分钟读70—80个单词。阅读语篇总长度不少于1000词。[14]就生词量而言,《大纲》中规定阅读文章的生词量应低于 3%。[13]表3是2008—2012年重庆市高考阅读语篇词长度和生词率统计情况。
根据表3,2008—2012年每年的重庆市高考英语阅读语篇的总长度均达到大纲要求的1000词以上,在1400词左右,符合大纲要求。在选择阅读文章时,除了要考虑《大纲》对文章总长度的要求,每篇文章的长度也应引起重视,文章太长或太短都不利于有效检测学生的阅读能力。《考纲》规定35分钟内要完成不少于1000词的阅读理解试题。按照阅读语篇与答题时间1:0.75的比例计算,如果有5篇文章, 每篇语篇词数应平均在280到320之间。表3显示,历年的语篇的平均长度是在270—300个单词之间,最少的平均长度是267.8词,最多的平均长度是284词,均在上述范围内。就生词率而言,历年的生词率都在2.5以下,符合《大纲》和《考纲》要求。
为了更好地了解高考阅读试题的发展趋势,我们需要将2008—2012年的阅读语篇进行纵向对比。在语篇的总长度上,2010年最低,2012年最高。进一步对比语篇的平均长度可知(如图1所示),2008—2010三年间语篇平均长度先升后降,而2010—2012年则连续三年上升,到2012年语篇平均长度升至近300字/篇,由于考试时间不变,语篇长度的增加意味着对考生阅读速度的要求逐年提高。
图1 2008—2012年重庆市高考英语阅读理解文章平均长度
在语篇的平均生词率上作纵向对比可以发现,2008—2010年重庆市高考英语阅读理解语篇的平均生词都低于2%,且率略微呈下降趋势,但从2011年开始逐步上升, 2012年大幅升至2.294%,如图2所示。
图2 2008—2012年重庆市高考英语阅读理解文章平均生词率
综上,2008—2012年的重庆市高考阅读试题在语篇总长度,平均长度和生词率上都符合大纲要求。纵观这五年的阅读语篇可知,语篇的总长度,平均长度和生词率在2010后都呈现大幅上升的趋势。这说明近年来高考阅读试题对阅读速度和词汇量的要求都有较大提高。
(三)难易度
“测试阅读理解用的阅读材料,其易读度应适当,太难或太易都考不出学生的实际阅读能力” 。[18]本文通过反应词汇密度的形符和类符比(TTR)来衡量语篇难易度。一般说来,TTR值越高,用词变化性越高,语篇的词汇密度就越大,语篇的难度也就越高。[16]我们选取2010,2011,2012三年为研究对象,各年TTR值如表4所示。
表4 2010,2011,2012年各年阅读语篇的TTR值
由上表的TTR值可知,每年都有一篇语篇比较难, 三篇语篇中等, 一篇语篇容易,难易搭配结合,具有较好的区分作用。2010年到2012年的TTR平均值逐年增加,说明文章难度逐年提高,这与2010—2012年语篇总长度,平均长度和生词率的逐年增加的趋势完全吻合。说明近3年来重庆市高考英语阅读试题在阅读速度,词汇量和语篇难易度上都逐年上升,从而也对高中英语教学提出了更高的要求。
四、结语
本文利用Range软件对2008—2012年重庆市高考英语阅读试题的体裁、语篇长度、生词率和词汇密度进行了分析,研究结果如下:首先,阅读语篇的体裁均为记叙文,说明文和议论文,而后两者比重较大,但《大纲》要求的部分体裁,如应用文在近5年来都没有涉及,说明阅读试题的体裁覆盖不够全面。其次,历年阅读语篇在总长度、平均长度和生词量上都较好地反映了《大纲》要求,并同时考虑文章难易梯度,体现了《大纲》对考试的指导作用。从2010和2012年的阅读语篇来看,语篇长度,生词率和词汇密度上都有较往年较大幅度提高,这要求教师在教学中应更加注重学生阅读速度的提高和词汇量的积累。
参考文献:
[1]中华人民共和国教育部.普通高中英语课程标准(实验)[M].北京:人民教育出版社,2003.
[2]玉强.高考英语阅读理解中的主旨大意题[J].教育实践与研究(B),2010,(11):19-23.
[3]李汶蔓.2007—2011年宁夏高考英语阅读理解命题的对比分析及阅读建议[J].中国校外教育,2013,(11):90-99.
[4]胥少先.2012年高考英语阅读的走向及教学应对策略初探[J].英语广场(学术研究版),2011,(4):96-97.
[5]李养龙,李莉文.高考英语科阅读能力测试与思辨能力培养——基于布卢姆认知能力分层理论的探讨[J].山东外语教学,2013,(2):57-61.
[6]陆辉.知隐喻理论视角下的高中英语阅读教学[J].内蒙古师范大学学报(教育科学版),2010,(06):106-109.
[7]郑博.浅析高考英语阅读理解中的衔接现象[J].科技信息,2011,(08):564.
[8]蔡艳,丁树良,涂冬波.英语阅读问题解决的认知诊断[J].心理科学,2011,(02):272-277.
[9]董曼霞.重庆市2004—2009高考英语阅读理解测试内容效度历时研究[J].教育测量与评价,2011.
[10]辜向东.高考英语全国卷与各省市自主命题卷共时与历时研究[C].成都:四川大学出版社,2008.
[11]邱劲.从语篇变量看高考英语阅读测试的效度[J].重庆邮电大学学报(社会科学版),2010.
[12]顾正广.基于语料库的江苏高考英语(2008—2011)阅读理解试题效度分析[J].牡丹江教育学院学报,2012,(2):157-158.
[13]中华人民共和国教育部.《全日制普通高级中学英语教学大纲(试验修订版)》[M].北京:人民教育出版社,2000.
[14]中华人民共和国教育部.普通高等学校招生全国统一考试英语考试大纲(2009)[M].北京:人民教育出版社,2000.
[15]Bachman,L.F.&Palmer.A.S.Language Testing in Practice[M].Shanghai: Shanghai Foreign Language Education Press, 1999.
[16]程实.语料库工具Range在文体研究中的应用[J].语文学刊,外语教育教学,2009.
[17]梁茂成,李文中,许家金.语料库应用教程[M].北京:外语教学和研究出版社,2010.
[18]杨惠中,Weir,C.J.大学英语四、六级考试效度研究[M].上海:上海外语教育出版社,1998.