APP下载

国内主要英语测试的效度研究综述

2016-07-21

关键词:国内效度综述

张 安

(山东大学 外国语学院,山东 济南 250100)



国内主要英语测试的效度研究综述

张安

(山东大学 外国语学院,山东 济南250100)

摘要:效度可以说是测试最重要的标准,也是语言测试的基本出发点。通过回顾国内外语类、教育类核心期刊近十五年刊载的关于国内英语测试效度的文章,分析后发现:(1) 高考英语的效度研究是一个相对的热点;(2) 对四六级考试效度研究的数量少于高考;(3) 与专四考试题型的效度分析相比,专八考试的效度分析不够全面。最后还就教师的教学与学生的学习等方面提出了建议。

关键词:效度;英语测试;国内;综述

一般而言,测试的各要素都有其适当性,而测试效率把该适当性称之为一种衡量,旨在检测事物的标尺。[1]效度可以说是测试最重要的标准,也是语言测试的基本出发点。[2]根据不同的分类标准,效度可分为翻译效度、效标效度以及构念效度。其中,翻译效度又有表面效度与内容效度之分。效度有其具体细分种类。近年来,许多学者对效度的研究颇感兴趣,研究成果层出不穷。目前国外对语言测试效度的研究较为成熟,相比而言,国内对此的研究正在不断发展的过程中,由于英语学习在国内越来越受到重视,所以,国内英语测试的重要性也得以凸显。因此,有必要回顾关于国内英语测试效度的研究,以分析优势和不足,启发教学。

一文献的选择

作者在中国知网键入关键词“英语测试效度”“效度分析与测试”,有效筛选出相关文章,它们均刊登在国内外语类和教育类核心期刊。上述刊物在国内较权威,且具有代表性,它们在英语测试效度方面的研究成果,可以很好地体现此方面研究的趋势。

二国内主要英语测试的效度研究回顾

本文对国内主要的英语测试效度研究进行了回顾,涉及到的主要英语测试有:高考英语、四六级、专四专八考试。

1.高考英语效度研究。

下表体现的是1998-2015年期间,每年发表的文献数量。可发现:从2007年以后,文献数量变多,对此方面的研究逐步发展。

表1 高考英语效度研究数量(1998-2015年)

从细节来看,对此方面较早的研究始于1998年,内容是对当年高考英语试题的完形填空部分进行考点效度的分析。[3]2005年的一篇文献也分析了高考英语完形填空的考点效度, 但与1998年的研究不同之处在于,2005年的研究对1998-2004年期间的高考题目做了统计分析,探讨了影响考点效度的因素。[4]因此,2005年的研究比1998年更注重实用性。2009年的研究与之前不同,其比较了高考英语和雅思考试在阅读部分的效度,分析得出:雅思考试的内容效度优于高考。[5]2013年研究更为具体,通过运用读者变量和语篇变量,文章发现:上海英语高考试题的内容效度正逐年变好。[6]2015年的研究较之前更加创新,韩宝成和张允提出了“任务—能力”设计框架并分析内容效度,[7]而张春青则运用Rasch模型和Winsteps软件分析了广东高考英语语法填空题的构念效度。[8]

下表是对上述研究的总结,它表明:2005年之前,研究重点是效度的某方面,而从2007-2010年,重点开始转向整体效度的研究,但对内容效度的研究一直热度不减,而对结构效度的研究正在逐步发展。

表2 不同年份效度研究的不同内容(1998-2015年)

下图显示的是上述文献对不同题型的效度分析,可以发现:对高考英语全部题型的效度分析占最大比例,其次较多的是阅读部分。未来的研究可注重听力、写作等部分的效度分析。

图1 对高考英语各题型效度分析的饼图

2.大学英语四六级效度研究。

下表显示了这些文章分布的不同年份。它们大致分布比较平均,每年约1-2篇,最近的研究是在2011年,其研究热度不如对高考效度的研究。

表3 大学英语四六级效度研究数量

在这方面,较早的研究是在1998年,其运用了内省法分析大学英语四六级考试中阅读理解的效度,并得出结论:该部分能有效确保语言测试的效度。[9]该研究为后来的研究奠定了基础。随后,2005年,一篇文章选取了较为新颖的视角,分析了基于计算机的口语水平测试和面对面口语测试的效度,发现前者效度要好于后者。[10]2009年的研究类型与之前有所不同,它回顾了之前对四六级的研究,提出需要把四六级的效度和信度结合起来考虑。[11]而此方面最新的研究是关于四级考试完形填空部分的内容效度,运用语料库提高干扰选项的效度,可提升此部分的效度。[12]

对大学英语四六级考试效度的分析,多是基于整体效度层面,而对不同效度分类的分析较少,下面的饼图体现了对不同效度分类的分析比例。所以,今后在此方面的研究可侧重对试题的各类效度的分析,如构念效度、效标效度等。

图2 对大学英语四六级考试各类效度分析的饼图

3.专四、专八考试效度分析。

下表统计了文章发表的数量和对应的年份。可以发现,在此方面的研究时间和数量均不及上述两方面。因此,专四、专八考试的效度研究有待发展。

表4 专四、专八考试效度研究数量

对专四考试的效度分析,题型主要涉及口试和阅读理解。较早的研究基于专四考试的理念、标准,分析了口试的表面效度和内容效度,得出这两方面效度均不错。[13]对专四口试的效度分析,从某一效度发展到整体效度,研究视角日益综合。在阅读方面,杨卫健运用了调查问卷,发现大部分阅读题整体效度好,但个别题目效度不佳。[14]

对专八考试的研究数量比专四少,仅有两篇文章。其中一篇文章探讨了专八考试独有的人文知识题目的内容效度,其区分度和内容效度均不好,建议改变题型。[15]另一篇文章则是分析了专八写作题的理论效度,建议提高其理论效度。[16]

通过比较对专四和专八考试的研究,发现有如下不同点:1. 对专八考试题型的效度分析数量较少,不够全面;2. 对专八效度的研究热度不及专四;3.对专八效度的研究均具体到各个题型,较专四的视角更具体。因此,之后效度的研究可多关注专八,分析专八整体命题的效度。同时,研究专四、专八可选取其他效度类型的视角,以实现研究更加全面。

三结语

本文回顾并探讨分析了关于国内主要英语测试效度研究的文章,以下是主要的结论。

1. 高考英语的效度研究是一个相对的热点,研究数量最多,研究范围较广,研究的发展较成熟。今后的研究也会保持研究热度,最新的研究视角是关于构念效度的研究。

2. 对四六级的效度研究热度不及高考,近年来呈减退趋势,且很少关注具体题型的某一效度。今后可加强在此方面的研究。

3. 对专四、专八考试效度的研究晚于上述两方面,研究数量较少。其中,对专八的研究不及专四,数量较少、范围较窄。所以,今后的研究可侧重于对专八各类题型的各种效度的分析。此外,可多关注另外的英语测试,如:高中英语入学考试、社会上的其他英语考试等。

基于上述结论,本文提出对今后教师教学与学生学习的启示。首先,教师要系统学习关于语言测试的基本理论,理论联系实际,真正运用到实际教学之中。其次,教师应重视学生实际运用语言的能力,引导学生关注实际语境。然后,学生在课后练习时,应选择样题或真题,确保较高的测试效度,可查缺补漏,不断完善自己。

参考文献

[1]Henning, G.AGuidetoLanguageTesting[M]. Cambridge, Mass.: Newbury House, 1987.

[2]刘美华. 高考英语阅读理解题型分析与解题方略[J]. 现代中小学教育,2007(2): 39-40.

[3]周长银.98年高考英语完形填空题的考点效度分析[J]. 外语与外语教学, 1999(4): 32-34.

[4]聂建中, 赵秀红. 高考英语完形填空的考点效度分析[J].教育理论与实践, 2005(6): 54-56.

[5]李鑫, 修旭东.雅思和我国高考英语阅读测试题型的对比[J].解放军外国语学院学报, 2009(5): 60-64.

[6]徐良, 邹申. 高考英语(上海卷)语法评价模式的对比分析与思考[J]. 外语电化教学, 2013(6): 11-16.

[7]韩宝成, 张允. 高考英语测试目标和内容设置框架探讨[J].外语教学与研究, 2015,47(3): 426-436.

[8]张春青. 高考英语语法填空题构念效度的 Rasch 模型分析[J].现代外语,2015,38(2): 258.

[9]金艳, 吴江. 以 “内省” 法检验 CET 阅读理解测试的效度[J].外语界, 1998, 2(3): 23-25.

[10]蔡基刚. 大学英语四, 六级计算机口语测试效度, 信度和可操作性研究[J].外语界,2005(4): 66-75.

[11]蔡基刚, 汪中平. 英语网考的写作效度和信度研究[J]. 外语界, 2009(3): 52-58.

[12]穆惠峰. 基于语料库的大学英语四级完型填空测试内容效度验证研究[J].外语电化教学, 2011(4): 66-70.

[13]黄永红. 英语专业四级口语测试的信度和效度[J].外语研究, 2006(3): 36-38.

[14]杨卫健. 英语专业四级考试阅读理解测试的答题效度验证[J].外语教学, 2011(6): 53-56.

[15]汪顺玉,刘世英.英语专业八级考试人文知识部分测验效度分析[J].外语教学,2007, 28(5): 35-39.

[16]修旭东. 我国高校英语专业八级测试写作项目的理论效度检验研究[J].外语教学与研究: 外国语文双月刊,2008, 40(6): 447-453.

Class No.:H310.42Document Mark:A

(责任编辑:郑英玲)

Review of Research on Validity of English Language Tests in China

Zhang An

(School of Foreign Languages and Literature,Shandong University,Ji’nan,Shandong 250100,China)

Abstract:Validity is arguably the most important criterion of a test and a basic starting point of a language test. It collects and reviews articles from major linguistic journals on the aspect of validity of major English language tests in China. Conclusions can be drawn: 1) Research on NMET (National Matriculation English Test) is a relatively hot spot among the above four aspects. 2) Studies on validity of CET (College English Test) are not so hot. 3) The analysis of validity of TEM8 (Test for English Majors) is less comprehensive than that of TEM4. Besides, implications for both teachers and students are also provided.

Key words:validity; English language tests; China; review

作者简介:张安,在读硕士,山东大学。

文章编号:1672-6758(2016)07-0094-3

中图分类号:H310.42

文献标识码:A

猜你喜欢

国内效度综述
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
SEBS改性沥青综述
NBA新赛季综述
国内不动产登记制度初探
浅论我国宏观法律环境探析
移动电子商务的发展对国内二手市场交易模式的影响研究
国内私募股权投资基金发展现状及对策研究
JOURNAL OF FUNCTIONAL POLYMERS
被看重感指数在中国大学生中的构念效度
外语形成性评估的效度验证框架