循证改革背景下的教育评价变革及其启示
2021-08-02姚继军
【摘 要】在教育循证改革的背景下,如何令教育评价更为科学有效,成为教育循证改革的核心任务。在这一过程中,西方国家的教育评价重视证据的因果关系揭示,注重通过评价推动跨国比较与合作,改进教育实践,获取更为稳健的证据。这些研究对完善我国当前的教育评价工作具有参考价值。为提高教育评价的科学化水平,在我国的教育评价改革中应强化评价的“证据意识”,坚持评价的价值导向,提高评价机构和人员的专业化水平,促进评价结果的应用转化,为教育改革与发展提供更为科学有效的证据。
【关键词】循证改革;教育评价;教育启示
【中图分类号】G40-058.1 【文献标志码】A 【文章编号】1005-6009(2021)44-0007-04
【作者简介】姚继军,南京师范大学(南京,210024)教育科学学院教授,主要研究方向为教育评价、教育经济与管理。
2020年10月13日,中共中央、国务院印发了《深化新时代教育评价改革总体方案》(以下简称《总体方案》),提出“到2035年,基本形成富有时代特征、彰显中国特色、体现世界水平的教育评价体系”。自此,我国以教育评价改革为突破口,开启了新时代教育综合改革的新征程。
《总体方案》直面当前教育改革与发展过程中的问题和矛盾,提出“提高教育评价的科学性、专业性、客观性”的原则要求。这既是对当前教育评价过程中存在问题的回应,也指明了教育评价改革的必由之路。就全球的教育改革而言,基于科学证据进行决策与改革已经成为世界主要发达国家的共识。在这一过程中,如何实现更为科学有效的评价,是教育循证改革(Evidence-Based Reform)的核心任务和目标。本文通过分析西方国家循证改革过程中的教育评价变革,力图为我国教育评价的改革提供可以“攻玉”的“他山之石”。
一、教育改革为何要“循证”
循证教育研究的“执牛耳者”、美国霍普金斯大学教授Robert Slavin,在2002年发表《循证教育政策:转变教育实践与研究》一文,认为在既往的教育改革中,由于缺少严谨的科学证据,从而使一些看上去热闹无比的改革,实际上只是“流行时尚”和“品位特征”的改变,这种变化犹如钟摆来回往复却并非科学和技术的进步。[1]
在缺失严谨科学证据的情况下,人们往往只能根据经验、情怀来进行决策和选择教育教学策略,这难免会带来误判和效率低下等问题。20世纪80年代,兴起于临床医学领域的循证医学(Evidence-Based Medicine),着力于对“最佳证据”的追求,这样的思路及方法迅速向其他社会科学领域渗透,形成了席卷全球的“循证思潮”。1996年,Hargreaves首次提出了“循证教育学”(Evidence-Based Education)的概念,认为教育学的研究和实践也应该像循证医学一样,严格遵守循证研究证据,来改进教育实践。[2]20世纪末到21世纪初,这样的理念受到了西方学界与官方的广泛认可。各国政府、学术组织、研究者和实践者们,采取了大量的行动推进循证教育的研究和实践,在这一背景下,教育循证改革取得了显著成效。
就教育循证改革的本质而言,循证改革是将教育政策制订和教育实践建构于“最佳证据”基础之上的一种努力,它要求在进行教育改革时,首先要收集和获得足够的科学证据,在进行科学评价之后再实施具体的教育干预、对策或政策。在这一过程中,最关键的要素是证据本身的质量,这就对教育评价的科学性和专业性提出了更高要求。我国的国情、教情虽有别于其他发达国家,但这种立足于科学证据的教育发展与改进思路,仍对我国有重要的借鉴价值。在未来相当长的一段时间内,我国都面临着推进教育高质量发展、实现教育现代化、建设教育强国的艰巨任务。这无疑会对科学决策和科学育人提出更高的标准,要求我们在尊重科学规律的基础上,运用科学手段,实现科学发展。
二、循证改革对教育评价的影响
教育评价的变革既是教育循证改革的内容,又是推动教育循证改革不断深化的重要力量,在教育循證改革过程中扮演着重要角色,其自身也受教育循证改革的影响进而不断变革。
1.更加重视证据的因果关系揭示。
为教育改革提供“最佳证据”是循证改革背景下教育评价的核心任务。这意味着教育评价为教育实践提供的证据,必须要满足一定的标准与要求,以确保证据的有效性。以美国为例,该国在《每个学生都成功法案》(Every Student Succeeds Act, ESSA)中,以联邦法律的形式定义了证据的强度,包括:强证据(strong evidence),指最少有一个良好设计或应用的实验研究;中等强度证据(moderate evidence),指最少有一个良好设计或应用的准实验研究;有前景的证据(promising evidence),指最少有一个良好设计或应用,在统计上控制选择偏误的相关性研究。在这些证据中,实验研究和准实验研究被给予了更多的关注,甚至被定义为评价和研究中的“金标准”。这是因为,相对于简单的数据描述和相关性研究,实验研究能够较好地控制混淆变量,进而更好地揭示因果关系。
2.教育评价的方法更为科学专业。
循证改革对证据的高标准,在很大程度上是通过更为科学规范的评价流程和方法来实现的。以美国有效教学策略网(简称WWC,网址为:http://ies.ed.gov/ncee/wwc/)为例,该网站为美国教育科学研究所直接管理的教育证据网站,通过对各种教育项目、产品、实践及政策进行评估,免费向公众提供教育的“最佳证据”。除此之外,该网站还颁布了证据评价的手册,详细阐释了相关评价的流程和方法。相比传统的基于经验的评价而言,这些流程和方法更加严谨缜密,对评价样本的筛选和处理更严格,更能够保证评估结果的稳健性。近二十年来,包括WWC在内的诸多循证教育机构和研究者,通过不断完善证据评价的方法和流程,不但构建循证教育学的方法体系及评价标准,而且使相关评价更为科学、严谨与专业,为教育的决策者与实践者提供了大量科学证据,促进了教育循证改革的不断深化。
3.注重通過评价推动教育实践的改进。
人们之所以对循证改革寄予厚望,很大程度上是因为循证改革在一开始,就具有鲜明的“理实结合”特征。它通过专业的研究和评价,为实践工作者提供具有操作性的证据,从而完成优化教育政策和改进教育教学的使命。例如,2007年欧盟委员会教育、视听及文化执行署(Education,Audiovisual and Culture Executive Agency,EACEA)针对PISA评价中所发现的问题,启动了“为了学生学业的领导力改进”项目(Leadership Improvement for Student Achievement,LISA)。这个项目联合学术界和实践界的力量,共同探究学校领导力与成绩之间的关系、作用机制及学校领导的改进之路。同时该项目基于科学的评价,不但发现了实践中存在的问题,而且通过进一步的证据收集和评价,为实践的改进提供了扎实的科学证据,实现了教育研究、教育政策和教育教学实践的良性互动。[3]173在循证改革背景下,有很多的评价通过干预实验的方式实施,这同样促进了学界和实践界的合作。以美国约翰斯·霍普金斯大学Slavin教授和Madden教授发起的“为了所有人的成功”(Success for All, SFA)项目为例,该项目通过与学校合作,在学校实施以提高学生学业表现为目的的干预实验,并通过持续的评价给学校提供综合性的改进建议,推进学校层面的改革,提高学生的成绩。
4.大力推动跨国比较和合作。
在教育循证改革的背景下,世界发达国家高度重视证据的权威性和普适性:一方面,发起并推进了诸如PISA这样的国际监测评估项目,以获得跨国评估数据,进而比较不同文化背景和制度框架下教育体系的运作,为各国政府提供反思、干预和完善教育政策的线索;[4]另一方面,各国均高度重视对国际评估证据的应用。以德国为例,2006年德国各联邦文教部长联席会议颁布了《教育监测全局战略》,该战略将PISA、TIMSS、PIRLS、TALIS等国际大规模教育评价的结果作为“全局战略”的支柱之一,与德国国内的学业水平评价、学校评估及国家教育发展评价结果一起,“为所有州的循证式教育政策奠定共同基石”。[3]174这样的举措,使该国内部的教育改革能够得到更广范围的证据支持,从而在充分吸收他国经验的基础上,更为顺利和有效地实施。
三、循证改革对我国教育评价改革的启示
无论是教育的实践改进,还是教育政策的制定与完善,都需要“言之有理”且“言之有据”。西方国家的教育循证改革为改进我国的教育评价工作,提供了有益借鉴。
1.教育评价应有强烈的“证据意识”。
就我国当前的教育评价工作而言,虽然在科学化水平上有了长足的进步,但毋庸讳言的是,依然存在着大量不严谨、不科学的现象。树立教育评价的证据意识,要求评价主体无论在评价指标的设定、评价的实施,还是结果的分析过程中,都必须坚持“基于证据”的理念,将评价的随意性降到最低。与此同时,还应当严格把控证据的质量,着力寻找和纳入具有更高信度和效度的证据,进而为教育改革与实践提供更为稳健的评价结果。
2.强化专业评价机构和人才队伍的建设。
教育评价的结果是否科学、是否可靠、是否有效,很大程度上取决于评价主体的专业能力和水准。就我国现状而言,掌握前沿方法技术的评估机构和人员仍然不足,尤其缺少类似WWC这样的具备研制、修订证据标准及评价流程的专业机构。因此,在整合当前力量,组建和壮大证据收集、分析和评价的专业机构的同时,加大对评价专业人才的培养和培训力度,同样是改进我国教育评价工作的当务之急。
3.加大评价结果应用、转化和宣传的力度。
西方教育循证改革极大地推进了学术研究和教育实践的结合,除了建立证据数据库,向所有人公布经评估获得的有效证据外,很多国家还通过立法规定,教育改革与决策必须有科学证据支撑,这就在制度层面保证了研究证据的使用和转化。而以实验干预的方式进行评价,并以评价的结果推动学校改进和政策完善,则更是研究和实践相互结合、相互促进的有效途径。这些有效的方法,对转变我国教育评价方式,形成评价与实践双向促进的教育改革与发展机制,具有重要的参考价值。
需要指出的是,循证背景下的教育评价虽然高度重视证据的获得和使用,但这并不意味着这样的评价是无涉价值的。Biesta认为,价值是教育实践不可或缺的组成部分,证据需要经过价值的过滤,才能避免教育改革过程中出现价值和证据的二元对立。[5]正因如此,Whitehurst认为循证教育(Evidence-Based Education)应该由“实证证据”(包括以科学基础研究和实证信息)和“专业智慧”(包括个人经历和共识)两部分构成。[6]这意味着,在教育评价过程中,既要高度重视证据,也不能被证据牵着鼻子走,必须坚持立德树人、全面发展的价值导向,通过充分发挥科学评价指挥棒的作用,提高教育治理的水平,办好人民满意的教育。
【参考文献】
[1]SLAVIN R E.Evidence-based Education Policies:Transforming Education Practice and Research[J].Education Researcher,2020,31(7):15-21.
[2]杨文登,叶浩生.缩短教育理论与实践的距离:基于循证教育学的视野[J].教育研究与实验,2010(3):11-17.
[3]俞可,陈丹,赵帅.循证:欧盟教育实证研究新趋向[J],华东师范大学学报(教育科学版),2017,35(3).
[4]BOS W,SCHWIPPERT K. The Use and Abuse of International Comparative Research on Student Achievement[J].European Educational Research Journal,2003,2(4):559-573.
[5]BIESTA G. How to Exist Politically and Learn from It:Hannah Arendt and the Problem of Democratic Education[J].Teachers College Record,2010,112(2):556-575.
[5]WHITEHURST G J. Evidence-Based Education[EB/OL].(2019-04-25)[2020-11-28].https://www2.ed.gov/nclb/methods/whatworks/eb/evidencebased.pdf.