天津市学科基本能力测试实践与思考
2014-06-12高凤萍
高凤萍
教育事业改革和发展的核心目标,在于注重提高教育质量,这是当前各国政府及国际组织普遍关注的一个教育热点问题。有数据表明,我国基础教育已呈现规模效益,教育重点正在从数量扩张、硬件优化向关注教育质量内涵,提高教育质量转变。[1][2]教育部《2003—2007年教育振兴行动计划》中提出:“深化基础教育课程改革,建立国家和省两级新课程的跟踪、监测、评估、反馈机制,加强对基础教育质量的监测。”《国家中长期教育改革和发展规划纲要(2010—2020)》也明确提出要“完善监测评估体系,定期发布监测评估报告;加强教育监督检查,完善教育问责机制。”对教育质量进行大规模的监测成为当前我国教育改革的迫切要求,也是推进义务教育均衡发展和提高教育教学质量的重要举措。
天津市教育招生考试院(以下简称“天津考试院”)为研究建立与国家、省相配套的具有天津特点的义务教育学业质量监测体系,认真研究学习了国际发达国家或组织的先进理念和经验,如美国的国家级教育评估项目(NAEP)[3]、州级的加州标准化测试和报告项目(STAR)、英国普通中等教育证书项目(GCSE)、 澳大利亚国家评估计划(NAP)、经济合作与发展组织(OECD)的 “国际学生评价项目”(PISA)等。[4]研究确定,通过开发有效评量教学效果的测评项目, 提供专业、系统的监测报告,为在我市基础教育阶段开展大规模的教育质量监测做好技术准备。据此,2007年天津考试院开发出针对小学阶段的高质量考试项目——小学基本能力测试项目(BCA,Basic Competency Assessments,以下简称“学能测试”)。学能测试是以《全日制义务教育课程标准(实验稿)》为蓝本,以教育教学实践需求为导向,以学科测试理论为依托,以现代教育测量技术为支撑开发的一套标准化成就测验。
一、学能测试的特点
(一)学能测试理念先进
学能测试由专业技术团队开发,借鉴国际教育先进理念和专业测量技术,在追求甄别的准确性同时,突出强调评价的诊断、激励、反馈、调整等功能,强调评价促进学生发展、改进教师教学和提高管理决策的服务理念。依据国际相关研究,一个人所具备的阅读、数学、科学素养是他学习能力的基本考查学科,项目选择包括三、五年级数学,四年级阅读,三、五年级科学三个关键学科和若干关键年级,以具体学科知识为背景,通过对基本知识、基本能力的考查,科学公正地评价学生对课程标准规定的学习目标的掌握状况和水平,帮助学生和家长了解学习成效,有效提高自主学习的能力,帮助教师了解教学效果,全面提高教学效率。
(二)学能测试内容活泼,突出应用能力
学能测试试题内容与形式活泼、新颖,寓考于乐,深受广大师生的欢迎,尤其强调考查学生在现实情境中运用所学知识和技能去思考和解决问题的能力。学生们看到试卷觉得好玩,答题时也没什么心理压力,题目看起来挺简单,但需要认真思考,卷子也和平时考试不同,配有很多彩色的趣味插图,试卷被很多学生拿回家收藏。学能测试坚持能力立意,试题比较灵活,和实际社会生活相关联,学生能开扩视野。学生普遍反映,该测试与平时在学校的考试不同,学生无须专门备考,不用背诸多公式,真实地考出学生知识和能力水平。
(三)学能测试成绩报告全面
学能测试借助先进的统计模型,对学生作答状况进行科学评判,通过清单式的诊断报告为教师、家长、学生提供了丰富全面的信息。通过学生版诊断报告提供的反馈信息,能够获得学生学习强项、弱项最准确、翔实的信息。此外,通过反馈也可以激励学生,强化其学习的积极性。学校版诊断报告提供的本校学生的整体情况、班级之间、学校之间的比对信息以及市、区总体状况等,都是重要的教学反馈信息,可以更有效地实施教学管理和开展教学活动。
二、学能测试的实施技术
2001年7月,中华人民共和国教育部制定的《全日制义务教育课程标准(实验稿)》(以下简称“课程标准” )正式颁布。课程标准取代了教学大纲,然而,要使课程标准真正发挥作用,成为教材编写、教师教学和学生学业成就评价的依据都不是一件简单的事情。因此学科基本能力测试在实施技术方面,首先关注基于课程标准的测试框架的建立,使课程标准和学业成就评价建立起有意义的联系;其次规范试题命题要求,有效地控制试题质量,确保在真实性较高的情境中测试出学生分析和解决实际问题的能力;再次运用现代测量技术,科学、全面地进行分析和报告,为管理决策、教学指导和学生学习提供有效的信息服务。具体实施如下。
(一)建立基于课程标准的测试框架
学能测试是兼具甄别与安置、诊断与矫正、反馈与激励功能的标准参照测验。标准参照测验是将被试的分数与某种标准比较来解释,因此该测试在编制测试试题时应参照一组明确界定的标准(或能力),用以测查考生对于既定标准的实现状况,反映考生绝对水平。[5](P12)2001年颁布的课程标准是以学段为基本单位设定课程目标,分为1~3,4~6,7~9年级三个学段。课程标准中列出了较为明确的课程目标,但对某些目标的描述尚显粗略,同时每一学段目标均包含了三个年级的目标,因此该课程目标不符合直接用于编制标准化测验的要求。下面以数学为例具体分析。见表1。
4~6年级学段“数与代数领域”“数的认识”主题学段目标[6](P20~21)
学能测试在开发过程中,首先将学段目标分解为年级目标。学科专家对各年级教材、教学目标进行了梳理和分析,参考《数学》(人民教育出版社2006年版),最终厘定5年级测试目标,同时也对个别目标进行了细化和局部修订,最终形成“测试内容框架”。“ 测试内容框架”由测试内容、认知能力两个基本维度构成,是开展命题工作的直接根据。数学测验内容包括“数与代数”、“空间与图形”、“统计与概率”三个领域;认知能力采用布鲁姆认知目标分类体系,包括识记、理解、应用三个层次;重要程度包括重点、次重点、一般,见表2。对照表1,该测试内容框架即测试目标,可以满足编制标准化测验试题的要求。
表2. 5年级数学测试内容框架(数的认识部分)
(二)规范试题命题要求,确保有效测试
命题工作是影响考试质量的核心环节。学能测试的命题充分体现了科学性、准确性、有效性及规范性等原则。
首先科学性是命题最基本的要求,主要指试题内容和参考答案无科学性错误,试题表述简明,用词准确、得当,概念用语及符号表示规范,在学术上无争议。
其次是命题的准确性,即准确地把握测试内容标准,保证试题体现的认知层次和内容领域与内容标准相一致,确保测试具有较高的效度和信度。对此,在对命题教师反复培训、演练使用“测试内容框架”命题的基础上,又采用专用命题题卡的方式,有效地控制命题教师的命题符合测试内容标准的要求。题卡主要内容见表3。
表3. 5年级数题卡
再次,试题内容生动新颖,紧密联系社会生活实际是该测试的特点。现代认知或学习理论都强调学习的真实性、情境性。该测试在设计测试题时,充分考虑问题的真实性和情境性,加强测试内容与社会实际和学生生活实际的联系,重视考查考生面对真实情境分析问题、解决问题的能力,同时选取生动有趣的素材,适度地引入现代科学中新的内容与新的技术等以激发学生参与测试的积极性和加强测试对学生发展的引导性。在试题呈现上,尽可能广泛地从各种书籍、杂志上摘取文章、图片,或自行设计及制作卡通、图画、图表、照片等,以增强试题的视觉效果,为学生提供丰富的情境,增强其接受测试的兴趣和投入测试的程度。见例一。
例一(小学五年级数学,2011年第22题,答案C)以下图案是我国几家银行标志,其中轴对称图形有几个?(A)1 (B)2 (C)3 (D)4
(三)运用现代测量技术,对考试进行全面报告
学能测试对测试结果摒弃了以百分制形式报告成绩并根据原始分数排列名次的传统做法,结合使用项目反应理论(Item Response Theory,IRT)和经典测量理论(Classical Test Theory,CTT)对学生作答状况进行数据分析,对考试结果进行全面报告。[7]
首先,学能测试从试卷整体和题目个体两个角度分析测验质量。对试卷整体的分析包含难度是否适宜、整体试卷的项目一致性是否达到较理想的水平。在对试题分析中,考虑到经典测量理论的不足,学能测试采用了可以将试题参数与能力参数定义在同一个量表上,精确估计测量误差的Rasch模型进行试题分析,得到难度评价结果分别为过易(0.8以上)、较易(0.6~0.8)、中等(0.4~0.6)、较难(0.2~0.4)、过难(0.2以下)的具体试题;得到区分度评价结果优良(0.6以上)、较好(0.4~0.59)、合格(0.3~0.39)、需修改(0.2~0.29)的具体试题。
其次,学能测试提供全市、学校和学生三种测试报告。学能测试在结果的报告方面,主要使用由课程标准衍生出的测试内容框架为参照,同时也使用学生在群体中的相对位置为参照,以更全面地反馈信息。其中全市表现报告提供各区县在学科、内容领域、认知层次等不同层面上的总体表现情况比较信息,为区县教育行政部门教育决策服务。学校表现报告提供总体概况、按照知识范畴掌握情况进行的统计分析、按照成绩顺序呈现各学生的作答信息、依次报告各班级在各个题目上的作答情况,为各校检查教学效果提供依据。学生表现报告包含三部分,各部分均以文字及图表进行描述。第一部分运用ANGOFF方法,对测试结果进行等级划界,合理地区分出三个能力水平组,即优秀、达标、尚需努力,描述学生总体作答情况;第二部分为基于项目反应理论对学生试题作答能力的分析,指出基于学生能力学生应该回答正确但却回答错误的题目;第三部分将试题按照难度值排序呈现学生各题目作答情况,具体指出学生在哪些内容方面未能掌握。
三、改进建议
天津市学科基本能力测试设计理念和实施技术均达到较高的水平,在当前我国小学教育评价改革潮流中,可谓排头兵,但在实施过程中我们仍需进一步提高和改进。
(一)不断扩大考试规模
本项目是由天津考试院开发设计,目的是以科学的测量和分析为手段,监测小学教学现状, 寻找提高教学质量的共同规律,有针对性地加强指导,为大面积提高教育质量提供保障。项目初创期,全市报名参加考试的学生人数较多,甚至有区县对应年级学生全体参加,但随着教育 “减负”政令的下达,考生完全实行自愿报名,报考人数锐减,致考试效率降低,评价反馈功能减弱。我们分析造成这种现象的原因是多方面的,在今后的工作中还应加强宣传和引导,但最重要还是应建立政府主导的教育评价反馈的机制,由政府委托天津考试院,组织如学能测试类的考试项目,适时地、有针对性地对基础教育教学进行监测和评价,督促基层教育机构不仅要履行教育职责,更要强化质量意识,及时解决教学中的问题。
(二)创设更加灵活考试形式
学能测试还应通过提供多次考试机会来发挥其更强的反馈功能。目前,学能测试只在每年5月中下旬组织一次考试,考试报告发回学校后,已近各校的期末考试,学生和教师都来不及进行学习和教学的调整。同时,目前采用的纸笔考试形式也是桎梏学能测试项目发展的原因之一,天津考试院应尽快提供在计算机上考试的环境,学生在计算机上做答完成后,立即可打印出自己的测评报告,考试全部结束后便能很快做出学校、班级报告,真正达到帮助学生和家长了解学习成效,有效提高自主学习的能力,帮助教师了解教学成效,全面提高教学效率的目的,发挥其专业机构的作用。
(三)建立题库系统
作为考试重要的组成部分和核心环节的命题工作,其优劣直接影响考试的质量。为确保命题试卷的平行性、稳定性,使测试具有较高的信度和效度,建设题库系统是十分必要的,也应成为学能测试的重点发展目标。[7]题库作为一种新型的命题工作方式,已经广泛在各类考试中得到应用,理论和技术比较成熟,但对于学能测试的题库建设应特别强调两大核心问题:一是基于课程标准,即准确地把握测试内容标准,保证试题体现的认知层次和内容领域与内容标准相一致,确保测试具有较高的效度和信度。二是建立“锚”题库,通过“锚”题对征集的试题进行锚定测试,以精确估计每道试题的项目参数。并将不同年度的被试分数等值到基准上,以比较不同年份间被试群体能力的发展变化。[8]
总之,天津市学科基本能力测试实现了为基础教育服务的目标,同时,从理念、技术、组织实施均达到较高水平,今后,必将为深化基础教育课程改革,完善监测评估体系,推进义务教育均衡发展和提高教育教学质量发挥更加重要作用。
参考文献:
[1] 龚国胜.义务教育学业质量监测:问题与思考[J].教育理论与实践,2012(20).
[2] 项目组.“建立中小学生学业质量分析、反馈与指导系统” 项目介绍[J].基础教育课程,2009(7).
[3] 马文琴.NAEP美国公民教育进步评估[J].外国教育研究,2008(6).
[4] 王蕾.PISA2006中国试测研究的实践与启示[J].当代教育科学,2007(3).
[5] 郑日昌,蔡永红.心理测量学[M].北京:人民教育出版社,1999.
[6] 中华人民共和国教育部.义务教育数学课程标准(实验稿)[M].北京:北京师范大学出版社,2001.
[7] 焦璨等.中小学教学质量监测技术的开发与应用[J].教育测量与评价,2009(6).
[8] 董洪亮.建立学生学业质量分析与指导系统——意义与关键[J].基础教育课程,2008(2).