国外大学入学考试分数合成方式及其启示
2018-02-08辛涛
辛 涛
(北京师范大学,北京 100875)
考试招生制度是国家的基本教育制度,关系到学生的全面发展和健康成长,关系到千万家庭的切身利益,影响到国家人力资源开发水平。深化考试招生制度改革是教育体制改革的重点领域和关键环节,是监测和保障教育质量、促进国家教育公平的有力抓手。继2014年9月国务院发布《关于深化招生考试制度改革的实施意见》之后,2018年《政府工作报告》又进一步提出改革考试招生制度。浙江省和上海市作为首批高考综合改革的试点省份,它们的成功经验促进了学业水平考试改革,推动了素质教育发展,也为其他省份高考改革方案的制定提供了宝贵的经验。当前已有的高考制度仍有待改善,其中一个较为突出的问题是如何实现选考背景下分数合成的公平性。由于不同科目等级性考试在题目、评估考生能力结构、认知复杂度等方面的不同,选考不同科目的考生的能力分布也有所差异,这些都使得不同科目考试分数之间的可比性存在挑战。
世界上一些国家在其大学入学考试制度中,采取科目选考、对选考科目分数进行加合是一种常见的做法。美国、英国、法国等国家均有较为成熟的考试方案以及分数转换合成机制。本文以美国、英国、法国和澳大利亚为例,介绍这些国家的大学入学考试的基本情况,然后,结合我国高考改革新方案,阐述国外大学入学考试,尤其是分数合成方法对我们的启示。
1 国外大学入学考试模式
1.1 美国
美国与我国高考相类似的考试主要包括美国大学入学考试(American College Testing,ACT)和学术评估考试(Scholastic Assessment Test,SAT)2类,它们是高中生申请美国大学及其奖学金的重要依据。ACT由美国ACT公司主办,关注考生的综合能力,重视考生对基础课程的掌握,检查考生的一般学术能力,同时附有中学所学课程和等级、考生个人信息以及考生兴趣3份资料。ACT必考部分为215道选择题,分为英语、数学、阅读、科学推理4个部分;选做部分是时长为30分钟的作文考试[1]。最终得分是通过各部分原始分相加,转换成范围在0~36分的量表分,再平均每个部分得分,得到ACT综合得分。
SAT由美国大学委员会委托教育测验服务中心(Educational Testing Service,ETS)举办,包括推理考试(SAT1)与学科考试(SAT2)2个部分。推理考试包含循证性阅读与写作、数学、论文写作3个部分。循证性阅读与写作、数学为必考;论文写作为选考并单独计分,由考生申请的大学决定考生是否需要完成该部分考试。学科考试为选考,包括20门科目,由考生申请的大学决定考生是否需要参加学科考试以及具体的科目。为了体现考生成绩的位置,SAT将考生的原始分转化为标准分。SAT单科成绩的上、下限分别为200分与800分,各等级分差为10分,共有60种分数情况[2]。由于各大学对考生不同方面的能力要求不同,不同考试科目的难度也存在差异,因此,SAT不同科目的成绩标准由各大学确定。
1.2 英国
A-Level证书考试(General Certificate of Educa⁃tion Advanced Level)是英国高校招生考试。每一门课程考试的内容分为几大模块,考试时间分散并设有多次考试,因此考生可选择最优成绩申请大学。A-Level考试共有72门课程供考生选择,不仅包括科学、语言、艺术等传统学科,也包括娱乐等新型学科。英国高中课程的学制为2年,学生通常在第一年根据自己的情况选择3~4门课程,通过考试,可获得AS(Advanced Subsidiary)证书;第二年继续选择AS水准中优秀的3门课程继续学习,通过考试获得A-Level证书[3]。
A-level考试成绩以等级形式呈现,等级由高到低依次为A*、A、B、C、D、E、F、G和U,其中U为不及格。为了平衡不同考试的差异,英国政府设置了统一标识尺度量表(Uniform Mark Scale,UMS),将不同考试局、不同难度、不同试题、不同时间点上所得ALevel课程考试的成绩通过UMS转换成可比的成绩,并通过考生成绩与满分间的比例将成绩转换为UTP(University Transfer Program)分数后来确定考生的等级[4]。
1.3 法国
法国高中会考属于全国性考试,分普通、技术和职业会考3类。其中,职业会考班要求企业实习的课时量占总课时量的23%以上(总课时69周,至少实习16周)。会考在高二期末和高三期末分2阶段进行。考试形式有口试、笔试、现场操作等多种方法。3类会考科目可分为必考科目、专业科目和任选科目。必考科目有4门:哲学、外语1、历史地理、外语2或地区语。普通类会考又分为经济社会、文学和科学3个类别。每个类别均有不同的课程选择要求。每门科目的分数会根据其权重乘以一个系数,再按照系数得出此次会考的最终成绩,并分为不同等级[5]。
1.4 澳大利亚
世界上部分国家并没有单独设置大学入学考试,澳大利亚是其中的代表之一。澳大利亚大学主要根据高中学业证书考试的成绩等信息选拔录取新生。从2009年开始,澳大利亚联邦(除昆士兰州外)开始统一采用澳大利亚高等大学入学排名(Australian Tertiary Admission Rank,ATAR)作为大学入学的主要标准。
ATAR分数的计算基于各门课程的学科分数,并依托于澳大利亚各州高中阶段的课程设置与考试。与许多国家一样,澳大利亚为考生在中学阶段提供的课程种类十分丰富,数量多达数十门甚至上百门。由于选择各门课程的考生数量不同,不同课程的分数之间不具可比性。为了保证相对公平,在计算ATAR分数之前,每门课程的学科分数都需要进行一定的“标准化”,依据考生在学科取得一定成绩的相对难度来调整学科分数的原始分,进而得到考生在课程上调整后的“标准化”分数。系统根据“标准化”分数的高低自动选择计入ATAR 6门课程,6门课程总分是由分数最高的4门课程得分加和,再加上其余2门课程分数的10%得出。所有学生的总分最后将被从高到低进行排名,再根据学生分数所在的位置进行百分比换算后得到最终的AT⁃AR分数[6]。
2 国外经验带来的启示
2.1 增强学生自主选择能力
我国新一轮高考改革鼓励学生自主选择考试科目,学生可根据报考高校要求,结合自身特长,在思想政治、历史、地理、物理、化学、生物等科目中自主选择3门计入高考总成绩。这一举措和国际上许多国家一致,凸显了以学生为中心的育人模式。为了避免家长和学校干扰学生选择其优势学科、放弃兴趣学科的现象发生,同时避免科目选择的不均衡[7],需要采取多方面的措施以增强学生的自主选择能力。首先,应落实新高考理念的宣传工作,消除学生和家长的困惑疑虑和不正确的认识,防止盲目跟风选科;其次,应要求学校和教师尊重学生的自我选择,不能过多干涉或影响学生的决定;最后,应对学生进行正确的职业生涯规划指导。等级性考试科目的选择直接影响到大学专业的录取和今后的就业方向,让学生有自己的想法和规划是增强学生自主选择能力最有效的途径。
2.2 建立通用量尺促进考分公平
借鉴英国和澳大利亚的做法,我国新一轮高考综合改革可以尝试建立适合现行高考方案的等级性考试科目的通用量尺。目前,多数省份的新一轮高考综合改革采取合格性考试与等级性考试相结合的方案,要求考生参加所有科目的合格性考试(语文、数学、外语3门必考科目的合格性考试可用统一高考科目考试替代)。在这种情况下,可以借助统考的合格性考试为选考科目建立通用量尺,尝试用统考科目来对选考科目进行锚定,从而实现不同科目考试考生成绩的可比性。
2.3 基于IRT理论估计考生能力水平
目前,试点省份高考综合改革方案中合格性考试和等级性考试的计分方式均基于经典测验理论(Classical Testing Theory,CTT)。相较CTT,项目反应理论(Item Response Theory,IRT)具有明显的优势。首先,在量尺固定的条件下,题目统计量不随考生群体的变化而变化,更有利于对高考测验工具进行质量评价;同样,考生的测验分数不随题目难度的变化而变化[8],也就是说,作答不同题目考生的能力参数是可比的。因此,使用IRT理论估计考生的能力水平,更容易解决“不同科目等级性考试成绩的可比性问题”。其次,可通过信息函数计算每个考生的能力参数估计误差,帮助我们更加准确地评估考生的能力水平。IRT估计的能力参数均等距,无需进一步地转化运算处理;在IRT理论框架下,可以提供各题目及测验在固定量尺上具有最大区分度的能力点,为高考命题者优化题目提供参考依据。以高考数学考试数据为基础的相关研究也表明,使用IRT理论进行考生能力评价和题目质量分析得到的题目参数和能力参数估计更加精确,更能反映学生的能力水平,在高考数学考试评价中也更具优越性[9]。
总体来说,新一轮高考综合改革兼顾了学生多元化的成长发展和高校多样化的人才培养,尊重了不同学生的兴趣爱好和不同学科的人才需求[10]。在为学生提供更多选择机会、培养学生全面发展的考试制度改革中,不但对教学管理机制、高校人才培养等方面提出挑战,也对心理和教育测量提出了更高的要求。在将测量方法和人才培养实际结合的过程中,一方面,我们需要学习借鉴其他国家成熟的选拔模式和考试分数的处理方法,在细节上做到精益求精;另一方面,也要知晓不同国家的考试方案都是依据本国发展和人才培养的特色建立起来的,一味地模仿或者推崇他国的做法并不可取。相信在学者和社会各界的共同努力下,我国的考试制度会更加完善和公平,能够为我国新时代的人才培养和选拔提供更加可靠的依据。