从“浙江高考英语事件” 看题库建设
2019-01-28郭幸菲任杰
郭幸菲 任杰
题库是基于教育测量学相关理论,经过分类、编码的大量试题的集合。随着计算机技术的发展,题库不仅仅用来存放编制好的试题,还是一个集命题、审题、组卷、分析等为一体的动态管理系统。本文从浙江高考英语事件入手,分析在当前教育改革背景下建设题库的必要性及诸多优势,并简要介绍题库建设所需的条件,提出应吸取此次浙江高考英语事件的教训,重视考试题库的建设,充分利用题库资源的优势,更好地保障考试质量与考试公平。
一、前言
2018年11月24日,浙江省高考英语成绩公布后,许多学生反映查到的英语成绩与自己的能力不相符合,有的学生甚至出现了“倒加分”的情况。随后,浙江省教育考试院表示,为保证英语一年两考的试题难度大体相当,“面向所有考生,对难度系数较大的第二部分(阅读理解)、第三部分(语言运用)的部分试题进行难度系数调整,实施加权赋分”。后来浙江省政府经调查认定,这是一起因决策严重错误造成的重大责任事故,决定取消这次考试的加权赋分,恢复原始得分。
浙江省高考推行英语“一年两考”,是对打破“一考定终身”这一现状的勇敢尝试,其初衷值得肯定。但如果想把这项政策真正落到实处,关键在于要使考生在不同时间的考试分数具有可比性,这就需要测验等值技术和大型题库作为支持。舉个简单的例子,假设有两位同学分别参加了两次英语考试,第一位同学参加第一次考试的成绩是80分,而另一位同学参加了第二次考试,成绩为75分,那我们是否可以认为80分就一定好过75分?答案显然是否定的,因为这两次考试的难度不一,因而无法直接进行分数的比较。而等值的目的就是平衡试卷难度,使两次测验的分数可以相互转换,从而形成稳定的评价标准。那么题库又是什么呢?会有哪些作用?建设题库需要哪些条件呢?
二、题库及其作用
Brennan 主编的《教育测量》(第四版)一书提出:题库是测试项目的集合,这些项目可以被不同的测验开发者所使用,并且能以不同的形式向被试者施测。题库不仅可以组织和存贮项目,而且还能在测验存在多种形式、需要不断生成试卷和互换试题时有效地管理项目。也有学者指出,“题库是以一定的教育测量理论为基础,编制、收集的具有一定质量要求,并附有代表试题特性的参数,经过分类编码便于检索的大量试题的集合” 。不难发现,题库的概念就好比一个超市,其中的每个商品都有自己对应的标签、条码及销售区,而题库中的试题也是按照一定的规则进行了分类与储存,以方便随时调取与使用。
在近些年教育改革的背景下,尽管“题库”越来越多地受到各方关注,但许多人对“题库”一词依然有着很深的误解。有人认为,题量大的练习册就是题库,也有人认为存放试题的系统就是题库。针对这一误区,测量领域专家谢小庆老师提出:“题库不是习题集。”随着计算机技术的发展,题库不仅仅被用来存放编制好的试题,还是一个集远程命题、在线审题、在线组卷等为一体的动态管理系统。因此,如今市面上很多题量很大、被称为“题库”的教辅资料,顶多是个“题集”。
较传统的命题与考试方式而言,题库建设的作用主要表现在以下几方面:
第一,建设题库有助于把控命题、组卷的质量。进入题库中的试题都会被标注参数,不仅包括试题的内容、考查的能力层次、题型、字数等描述性参数,还包括已经等值过的试题难度和区分度、题目使用次数等统计参数,这些参数的标定将为试卷的组建提供科学的参考,从而有效提高命题及试卷的质量。
第二,建设题库将改变传统的命题入闱的方式,有效提高命题的效率。所谓命题入闱,是指将经选拔的命题人集中到封闭的命题环境,在一定的期限内命制一定量的题目。那么题库的建设,可以将考前沉重的命题任务分散到平时,在保障安全的前提下利用系统进行试题的命制、提交、复审,可以提高命题效率。
第三,题库中包含着大量试题,可以根据考试需要提前组建多套平行试卷。对于同一次考试而言,可以更好地应对泄题、漏题等突发状况;对于多次考试而言,可以较好地平衡不同试卷间试题的难度、区分度等,从而实现不同试卷间分数的比较。
第四,建设题库也是为未来将计算机化自适应测试及计算机化多阶段自适应测试应用到大规模考试中提供坚实的基础。近年来,自适应考试凭借其因人施测的优势受到各方关注,它的原理是根据考生在一定题目上的作答,自动地从题库中抽取既符合考生能力又符合考试要求的题目,并让考生作答,最后根据考生在所有题目上的作答表现精确地估计出考生的能力。那么,题库的建设正是为计算机化自适应测试搭建了平台,不仅可以储存大量试题,而且可根据考试需要进行试题的导入与分配。
三、题库的建设
在高考英语“一年两考”的背景下,如何保证高考的科学性和公平性是个非常重要的议题。要实现一年多考,就必须实现测验的等值。但就目前的情况来看,测验等值技术在我国高考中还有很长的路要走,一方面要考虑等值技术的科学性和合理性,另一方面还要考虑相关配套政策及社会影响。考生在某次难度较小的考试中得到的原始分数经等值很可能会降低,这样的分数调整在广大学生和家长群体中很难被接受。那么,在“一年两考”成绩报告采用原始分的情况下,建设一个真正意义上的题库就为把握试卷难度提供了依据。一般来说,题库的建设需要以下条件:
(一)试题的命制与审核
题库建设的核心在于命题,只有命题质量高、符合考试要求的试题才能发挥题库的作用。因此,首先命题人员需要根据课程标准或考试大纲,严格按照其规定的考核内容要求、能力要求、试题编制技巧等进行命题。其次,审题专家对于征集上来的试题需进行严格审核,从政治性、科学性、规范性等多方面判断试题能否被采用。
(二)试测与等值
通常,试题的参数要经过试测和等值才可获得。试测时需根据一定的等值设计,找一批代表性较好的考生样本作答待等值试卷,然后采用基于经典测验理论或项目反应理论的等值方法进行等值,从而获得相应的试题的统计参数。只有经过等值技术处理,来自于不同试卷的题目之间的难度参数才是可以比较的。
(三)参数标定与试题入库
试题参数是对试题的各种特性及相互关系的记录,对试题参数的标定有利于试题的管理与储存,对建立题库而言意义重大。标定的参数主要包括两大方面:一是试题的题型、分值、题目内容、能力范围、命题时间等描述性参数。随着科学技术的发展,利用人工智能技术可实现对试题的内容进行分析,从而实现参数的自动标定。二是试题的难度、区分度等统计参数。高考这种高利害的考试对试题的安全性要求更高,因此对其难度的把控要更加谨慎。那么经过参数的标定以后,符合考试要求的试题就可以录入题库中。至于题库中试题的数量,一般要为实际试卷题量的十倍以上。而高考这样的国家级考试题库,试题的数量应该更多。
(四)题库系统的开发与维护
当前题库的试题管理、组卷、考试等功能,都需要计算机技术作为支撑,建构一个运行良好的题库系统离不开与计算机专业人员的合作。题库系统的开发应包括以下几个核心系统:试题征集系统、试题审核系统、组卷系统、印刷系统、统计分析系统等。由于题库中的试题需要根据实际需求进行删减或增添,因此做好题库的维护也非常重要。
通过以上分析不难发现,题库的建设与运行需要学科专家、命题专家、审题专家、教育测量学专家与计算机专家的相互配合,缺一不可。同时,无论是命题审题、参数标定,或者是试题入库及题库系统的开发与维护,保障题库的安全都是重中之重,基于这样的题库组出的试卷难度才容易保持一致。因此,在题库建设的过程中,应提高保密意识,做好保密工作,严格管理相关人员进入题库的权限。