美国高校招生“新模式”的启示
2018-02-09王晓平齐森谢小庆
王晓平 齐森 谢小庆
(1.美国爱荷华州教育部,美国爱荷华州 50319;2.美国华盛顿盖劳德特大学,美国华盛顿特区 20002;3.北京语言大学,中国北京 100083)
2017年5月10日,由逾百所美国顶尖私立高中组成的MTC联盟(Mastery Transcript Consortium)正式推出了一种新的学生评价体系——“新模式”(A New Model)。“新模式”目前已获帮助申请者择校的美国“入学、资助以及成功联盟”(Coalition for Access,Affordability and Success,CAAS)的支持。CAAS的用户包括哈佛大学、耶鲁大学、普林斯顿大学等80余所美国著名高校。
“新模式”的发起人为全美排名前25的俄亥俄州霍肯高中的校长Scott Looney,他同时也是MTC联盟发起人。他于2016年3月在美国私立学校协会年度会议上首次提出自己的构想,很快吸引到不少顶级私立高中的响应。
“新模式”包含两个突出特点:第一,没有分数,没有级别,只是持续追踪、记录、评估学生的8项能力,报告学生在8项能力上的“掌握学分”(Mastery Credits),用描述性的评价取代分数评价,并配以直观的放射图说明。第二,成绩报告与课程脱钩,在学生的成绩报告中没有课程、科目的名称,仅仅包含学生的“掌握学分”和相关描述。
SAT和ACT是美国现行的“高考”。有人说,“新模式”将逐渐取代SAT和ACT,成为美国大学录取的新依据。这种可能性有吗?
1 美国高校招生不可能出现革命性变化
在美国,标准化考试SAT、ACT仅是美国大学招生的参考依据,既不唯一,也非重要依据。在美国考试行业的行业标准中规定:在高利益相关(high stakes)考试中,在将考试分数作为升学、安置依据时,不能仅仅依据考试分数作出决策,必须同时参考其他方面的证据。对此,早在1985年,由美国教育研究协会(American Educational Research Association,AERA)、美国心理学会(American Psychological Association,APA)和美国国家教育测量学会(National Council on Measurement in Education,NCME)共同制定的《教育与心理测验标准》(Standards for Educational and Psychological Testing)就作出明确规定[1],2014年修订版的表述是:“在教育环境中,不能仅仅凭一个单独的测验分数去作出那些可能对学生产生重要影响的决定或定性,决策还需要依据其他的相关信息。”[2-3]这既是美国考试行业的规定,也是美国教育界以及整个美国社会的共识。
美国的大学招生并无统一模式,非常个性化,各个大学具有自己不同的特点,对标准化考试的重视程度也不同。各个大学以及下属的各学院、各系、各专业招生的标准与评估方式都有可能不同。大学、学院、系、专业通常都有一个自己的招生计分算法,按照不同的加权,计算得到录取指数(Admission Index)。通常,计分方式属于内部掌握,不会对外公布。
总体讲,在大学招生中最看重的还是报考者在中学的平均分数(Grade Point Average,GPA)或平均等级(Rank)。此外,还会考虑大学先修测试(Advanced Placement,AP)成绩、竞赛获奖、参与社会公益活动、文艺体育特长、教师推荐信、发表作品、自我陈述、面试等方面的信息。许多大学要求申请者提交的申请材料包括高中所学所有课程的详细列表和成绩单。
美国有多种层次、多种类型的大学,可以满足普通大众和精英人才的多种需求。个人只要愿意读大学,总能找到适合自己的学校,不会出现“一考定终身”的现象,某个考生即使由于考试成绩或经济原因而进入了社区大学,只要肯努力,有很多机会可以最终考入自己心仪的名校。
近些年,报考SAT和ACT的人数不但没有下降,而且每年都在增加,这是由于根据奥巴马总统在2015年签署的《每一个学生成功法案》(Every Student Succeeds Act),一些州将SAT和ACT成绩用于教育问责(Accountability)。
在美国,对SAT等标准化考试的批评由来已久,用更有效、可靠的评价方式来取代标准化考试的呼声一直不断。从20世纪90年代初开始,在美国教育界就兴起了一股表现性评估(performance assessment)、真实性评估(authentic assessment)和档案袋评估(portfolio assessment)的潮流。不少人主张用一些更有效的评估办法取代标准化考试,主张用一个覆盖较长时间段的形成性评估(formative assessment)取代某一特定时间点的终结性评估(summative assessment)。
在成绩报告方面,21世纪初美国各个主要的教育测量机构就开始注意避免向分数的使用者(包括学生、教师、家长、招生招工机构)仅仅提供一个“总分”,而是向测验的使用者提供描述性成绩报告(descriptive scoring)。为此,广泛开展了认知诊断(cognitive diagnosis)方面的研究。
基于认知诊断的思路,获得相同总分的人可能具有不同的认知结构和学习路径。认知诊断研究将认知心理学和心理测量学结合,借助现代的统计方法和计算机技术,对学生的认知结构和认知过程进行个性化的诊断分析,向测验的使用者提供更丰富的反馈信息,对进一步的学习和教学提出更具体、更有针对性的建议。认知诊断过程可以发现每个学习者的知识掌握状况,发现每个学习者的认知结构,发现每个学习者不同的学习路径,并提出帮助和补救建议,如SAT就采用了描述性计分和成绩报告。只有借助现代的统计工具、高速计算机和网络环境,才可能根据每个考生在考试中的反应作出认知诊断。今天,已经发展出多种认知诊断的数学模型,包括规则空间模型(Rule Space Model)、统一模型(Unified Model)、融合模型(Fusion Model)、DINA模型(Deterministic Inputs,Noisy“And”Gate Model),等等。描述性记分的关键步骤是对测验所要测量的能力进行特征定义,定义这种能力所具有的属性,详细描述学习的进程,界定不同的认知模式和不同的问题解决路径。
当今,计算机技术和互联网正在改变着世界,未来互联网将冲击传统的教育和心理测量领域。可以展望,未来的招生评价将不再是基于一次性考试的评价,也不再是基于某一时间横断面的信息,借助于大数据和云资源,招生机构可以收集到考生各方面的资料,从而获得申请者全方位的、立体的信息,这些信息无疑将成为决策更可靠的依据。从1916年约翰·杜威发表《民主主义的教育》以来,教育观念的变革已经持续了百余年。在快速变化的新时代,教育的变革必须与社会的变革相适应,尤其是在移动互联时代。今天,面对铺天盖地奔涌而来的信息大潮,重要的已经不再是“获取”信息,而是对信息进行“过滤”和“筛选”。
由于传统和习惯的力量,重视知识传授而忽略能力发展是各国教育的痼疾。与以往相比,发展能力在今天变得更加重要。在美国高校招生的“新模式”中,彰显了继续淡化知识传授和强化能力发展的努力。可以展望,伴随技术的发展,不仅知识的存储、检索和提取工作将被机器所取代,甚至一部分知识的分类和整理工作也会被机器所取代,人的注意力将更加集中于对知识的评价和运用,集中于运用知识解决实际问题。
Looney校长倡议采用“新模式”的初衷并非要用“新模式”取代SAT和ACT标准化考试,而是为了改进高中的学生评价系统,为每个学生提供更有针对性、更个性化的反馈信息,提高学习的效率。尽管SAT等标准化考试也开始采用描述性计分,但这些考试仍然主要是预测选拔性考试,而不是认知诊断性考试。今天,认知诊断性考试在实践中主要用于帮助教师了解学生,以便因材施教。此类测验模式不适合也并没有被全面引入大学招生考试。
从上述对美国招生“新模式”的分析可以看出,“新模式”主要是为了改进和完善学校的评价系统,是改进教育种种努力的自然延续。当然,这种模式也会对改进大学招生产生促进作用。考虑到“新模式”需要较多的人力物力投入,考虑到“新模式”对教师和教育管理人员有更高的要求,我们估计,至少在未来的10年间,“新模式”将仅仅被应用于少数私立学校,并且也主要用于一些尖子生的录取,被广泛应用于公立学校的可能性不大,更不可能取代SAT和ACT等标准化考试。但是,伴随基于大数据的新型形成性评价系统的建设,SAT和ACT等标准化考试在大学招生中的比重有可能越来越小。
尽管30年来对SAT等标准化考试的批评一波未平一波又起,尽管20多年前在美国就兴起了表现型评估和真实性评估的热潮,但标准化考试在大学招生中的作用并未削弱。出现这种情况,缘于三个因素:其一,标准化考试是一种比较经济、便宜的评价方式,而表现型评估则花费高昂;其二,尽管就一个班级或一所学校的学生而言,表现型评估具有更高的效度,但是在不同学校、不同地区之间却缺乏可比性,也较难保证评估的公平性;其三,SAT等标准化考试一直在根据大学和高中的要求进行改进,努力满足大学和高中的需求。未来这三个因素会继续存在,因此,美国的大学招生不大可能出现革命性的变化。
2 中国需要更坚定地推进考试评价制度改革
我国从1977年恢复高考以来,虽然已经在考试科学化方面取得了显著成绩,但与社会发展的要求之间还存在一定差距。中国的基础教育于2001年启动“新课程改革”,17年来,为了挽救“小范进”们,中小学教师付出了许多心血,承担了种种压力,在他们的努力下,我国基础教育已经发生了明显变化,中小学课堂已经出现了可喜变化,“小组学习”正在取代教师的“独角戏”和“一言堂”,“能力发展”正在取代“知识传授”,思维训练正在取代“死记硬背”。但是,积极从事“课改”的教师、校长和教育局局长们长期面临着一个困惑:如何评价新的教学方法达到了更好的教学效果?教学改革的效果如何体现?显然,传统的“以分数为纬、以学科为经”的评价方式已经不足以反映教学改革在发展学生核心胜任力和提高学生思维水平方面所取得的成效,不足以反映教学改革在提高学生核心素养方面的成效。因此,迫切需要加速考试评价的科学化进程,美国高校招生“新模式”中淡化分数、淡化学科的尝试,值得我们借鉴和参考。好在2014年启动的新一轮高考综合改革已经迈出了一步,未来的路还很长,任务还很艰巨,需要全社会转变观念,需要考试评价研究工作者提出符合中国国情的评价技术和方法,在吸收借鉴美国教育同行经验的基础上,坚定不移地推进中国的考试评价制度改革。
[1]American Educational Research Association,American Psychological Association,National Council on Measurement in Education.Standards for educational and psychological testing[M].Washington,DC:AERA,1985:54.
[2]American Educational Research Association,American Psychological Association,National Council on Measurement in Education.Standards for educational and psychological testing[M].Washington,DC:AERA,2014:198.
[3]美国教育研究协会,美国心理学会,美国国家教育测量学会.教育与心理测验标准[M].燕娓琴,谢小庆,译.沈阳:沈阳出版社,2003:250.