证据驱动的教育改革如何推动教育发展 *
2021-03-29罗伯特斯莱文RobertSlavin张志强AlanCheung庄腾腾
[美]罗伯特·斯莱文 ( Robert Slavin ) 张志强 ( Alan C.K. Cheung ) 庄腾腾
(1. 约翰斯·霍普金斯大学,巴尔的摩 21201;2. 香港中文大学,香港 999077;3. 北京师范大学,北京 100875)
证据驱动的教育改革(Bridgeland & Orszag,2013;Gueron & Rolston,2013;Slavin,2008,2013,2017,2019;Slavin & Cheung,2017b)特指教育工作者及政策制定者将关于有效性的证据作为标准,遴选各类教育方案、教育产品及教育实践。有效性的证据要基于严格的教育实验,其会持续较长时间(例如一个学期或更长时间),实验组学生将与使用传统方法的控制组学生比较成绩。理想情况下,学生、教师或学校会被随机分配到实验组或控制组(Bucks & McGee,2015;Gueron & Rolston,2013)。最低要求是需要实验组和控制组学生在成绩、人口统计学变量等前测中是匹配的。需要注意的是,该定义并不是为了简单地传播关于有效教育实践的一般性原则,因为这些信息通常不会对实践或结果产生多大影响(如,Hemsley Brown & Sharp,2003;Weiss et al.,2008),相反,该定义是指支持使用某些特定方案的改革,这些方案通过与控制组对比进行评估,结果发现是有效的和可复制的。
尽管证据驱动的改革会用到所有类型的研究方法,但是能够与常规实践相对比以确定创新方法效果的独特工具,正是实验或准实验研究。在教育实验中,学校、班级、教师或学生被随机分配到采用创新方法的实验组,或继续采用常规实践的控制组。准实验与实验具有相似性,但准实验没有采用随机分配,而是根据先前成绩和其他因素匹配学校、班级、教师或学生。在这两种情况下,分组的水平都很重要。在学校水平随机分配或匹配是最理想的,因为在学校内部进行随机分配或匹配时,往往会担心实验方案外溢的问题。例如,控制组教师可能会听说实验组采用的新方法,并开始在自己的课堂上使用。然而,在学校、班级、教师水平进行分组时,结果分析必须将数据的不同水平考虑在内,因此在学校水平分组的研究通常需要40 至50 个单位(学校或班级)。这里不会详细讨论具体方法,重要的是想表达,大多数实验和准实验由于使用分层数据而具有相当大的规模。
一、证据何以重要
为什么关于有效性的证据应成为选择教育产品和服务的主要标准?最重要的答案就是,按照验证性研究中的方式实施具备强有力证据基础的方案,很可能会给学生带来更好的成效。而且,将证据作为选定方案的基础,将会使教育进入到创新、评估和逐步改进的良性循环,就像医学、农业和技术领域的转型一样(Haskins,2014;Kolada,2013)。证据驱动改革的核心是一个简单的理念,这意味着要囊括四项基本行动(Slavin,2013):
1. 使用严格的实验方法评估创新方案,为每个科目和每个年级找出最有效的方案;
2. 使教育工作者和政策制定者了解行之有效的方案和实践;
3. 提供资源和激励措施,使学校领导能够实施行之有效的方案和实践;
4. 制定政策和制度,不断积累有关知识和有效实践。
这四项原则支撑着许多大规模、快速且持续发展领域的政策和实践。例如,在过去的一个世纪中,医学和公共卫生领域的惊人进步归功于循证医学,在这一领域,政府大力支持新药物、新技术、新设备和公共卫生政策的研究与开发,资助检验他们有效性的严格评估,并主动推广被证明有效的治疗方案和有关政策。结果是,中国和其他国家的人均预期寿命显著增长,疾病得以治愈,预防措施(例如天花疫苗)得以制度化。
在农业领域,类似的转变已然发生。在中国,稻米生产效率的提高(过去50 年来每公顷生产率翻了3 倍)改变了人们的生活。这些以及其他农业领域的进步,正是源于科学家开发和检验新种子、新肥料和新害虫防治方法,以及改良动物品种、兽医方法、饲料等。因为有效的方法已经过科学证实,所以它们被推广给农民,从而使得农业更加高效、更有利润,并解决了国民的吃饭问题。技术、工程和其他许多领域的进步都遵循相同的模式,即研究、开发、评估和推广。
直到最近,教育领域在证据驱动的实践或政策方面仍然进展缓慢。然而这并不是教育不能像医学、农业、技术和工程一样,开始以严格证据为基础建立其政策和实践的理由。有人可能会说教育与医学或农业不一样,因为一种药丸或一种新品种的牛很容易复制,而教育创新总要涉及许多人在不同情况下行为的动态改变。然而,这种复杂局面也会出现在医学和农业领域,如医师在开展新药研发以最大程度地适应人类生活方式或服药方式的变化,农民使用新的耕作或水资源管理方式来提高产量。教育有其自身的证据基础来显示有效方法(如补习和合作学习)的积极作用和可复制性,因此人们没有理由认为这些经研究证明的方法不会对教育成果产生深远影响。
证据驱动的改革正在转变世界上许多地方的教育研究和实践。近年来,中国研究者也开始强调使用严格的证据来评估各类教育方案和实践。本文将首先讨论中国的实证教育改革,随后讨论证据驱动的教育改革在其他国家的发展,最后讨论中西方研究者和决策者的合作将如何有利于鼓励证据驱动改革的地区教育发展。
二、中国教育的实证改革
过去三十年,教育实证研究一直是中国学术界的关键词。在中国知识基础设施工程(China National Knowledge Infrastructure,CNKI)中输入中文短语“教育实证研究”,会产生约5000 篇包含该短语的文章。毫无疑问,过去二十年,教育实证研究在中国学术界得到了极大发展。例如,从1990 到2002 年,每年只有少数的教育实证文章研究发表,其中1990 年仅有两份此类刊物,2002 年仅有24 篇文章。然而,自2003 年以来,实证研究发文数量急剧增加,这表明实证研究思想已逐渐扎根于中国教育研究。图1 说明了基于证据驱动的学术文章的逐年情况。
在中国,从义务教育到职业教育再到高等教育,面向不同教育层次的研究人员都在使用实证研究方法。实证取向研究的题材和主题也很广泛,包括学生满意度、教育公平、教育财政、教育支出以及思想政治教育等方面。
图1 基于证据驱动的学术文章的逐年情况
最近几年,除了出版物的数量激增之外,中国学者越来越重视与教育实证研究有关的各种问题讨论。例如,华东师范大学作为中国教育科学领域的领导性高等教育机构,自2015 年以来已连续举办教育实证研究论坛。其中仅2019 年第五届论坛便召集了全国众多学者并邀请国际知名专家参会。共有16 所中国大学参与并共同组织了多场平行论坛,每个论坛侧重于将实证思想和方法应用于教育研究的一个特定方面,例如田野研究、案例研究、文本分析、视频分析等。许多亚领域正在采用实证方法,以使其研究结果更具有说服力和稳健性。
再如,南京师范大学教育科学学院与全球领先的高等教育机构(例如美国的约翰斯·霍普金斯大学和香港中文大学)联合组建了全球“卓越实证研究概述”(Best-Evidence-in-Brief)网络,旨在定期向中国和全球一线教育者传播基于证据的研究发现。每两周,学校行政人员、老师乃至家长可以通过“卓越实证研究概述”网络的成员大学,获取全球最先进的证据驱动教育研究成果,用以改善自身教育实践、提升教育质量。南京师范大学教育科学学院是中国内地第一个实施该机制的教育科学研究单位,该机制作为研究与教学之间的桥梁,能使一线教育者了解世界范围内可改善学生学习效果的最佳教育实践(http://www.cnbeb.org.cn:81/en/about)。
南京师范大学等中国大学也积极组织证据驱动研究的国际会议和论坛,其目的在于增强中国学者运用证据驱动方法进行教育研究的意识。例如,在2019 年南京师范大学举办的“追求教育卓越的理念和行动”国际研讨会上,“循证”是出现最多的关键词。会议讨论的重点领域包括“国际循证研究的前沿”“循证教育研究的方法论发展”“中国循证教育研究与改革”“循证教育改革与发展”及“循证学校改进”等。
中国教育学会副会长、华东师范大学教育学部主任袁振国教授的观点代表了中国学者对证据驱动教育研究的重要性和本质的理解:实证研究是学科从思辨到科学的转折点;是学术深化的里程碑;是理论创新的支柱;是平息争论取得共识的唯一手段;是建立现代智库的可靠支撑(袁振国,2017)。
尽管实证研究的出版物迅速增多,但是许多中国学者仍然认为实证研究在中国教育学术界的研究成果中所占比例很小,而且许多人指出实证研究的发展速度不如非实证研究(谭翀,2017;王兴宇,2017)。王兴宇(2017)认为,实证研究除了要有坚实的理论基础外,还应该依靠收集的高质量数据和经过验证的统计方法来检验既定的教育假设,并论证教育投入和产出之间的因果关系和影响。另一方面,非实证的研究方法主要是基于个人认识对某教育主题的价值进行推理的理论性阐释,或对国外教育实践与政策的简单描述。还指出在五份《中国社会科学引文索引》(CSSCI)期刊的出版物中,即《高等教育研究》《清华大学教育研究》《中国高教研究》《北京大学教育评论》和《复旦教育论坛》,实证研究的文章仅占2012 至2016 年论文总数的20%(表1)。考虑到中国教育科学研究者的总产出,袁振国(2017)认为实证研究在所有出版物中所占比例低于10%。这些比例可能是准确的,在证据驱动研究占主导地位的美国和英国,可能也存在类似比例。因为证据驱动研究的花费很高,所以如果将硕士和博士论文包括在内,那么非量化研究的数量通常占比更大。但是,在美国和英国获得资助的研究中,严格的实验研究是最普遍的。
表1 2012 到2016 年五本CSSCI 期刊的发文情况
中国学术界已经采取的上述措施,以及对更多实证研究的呼吁,表明了当代中国教育研究者对下列议题的强烈兴趣:即理解全球证据驱动教育研究的发展、现状和实践,开展证据驱动研究的相关困难与可能的解决方案,以及中国自身如何在教育研究和改革中实施和应用证据驱动的理念。因此,2017 年元月,共有14 所大学和32 种CSSCI 期刊发布了“教育实证研究华东师范大学行动宣言”(以下简称《宣言》),内容涉及加强实证教育研究和促进研究范式的转变。《宣言》特别确定了未来几年为提高中国教育研究质量而应采取的十项措施,包括:
1. 加强教育实证研究课程建设与青年教师培训;
2. 提高教育实证研究论文的数量与质量;
3. 办好全国教育实证研究论坛;
4. 编译出版国际教育实证研究优秀成果;
5. 集辑出版我国教育实证研究优秀论文;
6. 改进教育研究成果评价标准;
7. 加大教育实证研究项目比重;
8. 设立“教育实证研究优秀成果奖”;
9. 发布中国教育实证研究年度报告;
10. 加大教育数据公布力度(华东师范大学等,2017)。
三、中国学界对教育实证研究的质疑
尽管许多中国学者开展教育实证研究的意识日益增强,但仍有人对其开展的可行性和影响政策的有效性持怀疑态度。以下总结了怀疑论者的一些观点。
一是关于“实证”的定义。一些学者认为,“实证”可以从狭义和广义两个角度来理解。例如,史静寰(2017)认为如果从广义上理解“实证”,即研究人员收集和观察相关数据以提出和验证假设,那么中国学术界一直以来都在从事“实证”研究。然而,如果从狭义的角度来解释“实证”,即使用程序化、操作化、量化方法得出某些教育和社会现象的结论,那么大多数中国的教育研究者并未从事实证研究。
关于“证据”的定义可能非常广泛,致使许多中国学者发表了文章,呼吁对基于证据的研究进行深度透视。例如,李均(2018)提醒到,实证研究不应落入“统计主义”窠臼。他指出,随着对开展实证研究愈发重视,有一种趋势将“实证”等同于数字和统计,他称之为“统计主义”。他认为,这种思路和方法“将教育研究过程简化为统计学的操作过程,而对难以量化的教育思想、价值和情感等采取排斥态度”。他将统计主义的特征概括为:“方法中心,问题边缘;数据中心,事实边缘;格式中心,思想边缘。”因此,他认为应该重新思考经验研究和实证研究的内涵。
王卫华(2019)回应了这一观点,他认为实证研究通常无法处理包括教育在内各领域中与价值相关的问题。他认为,价值关注人类的未来,特别是人们面对利益冲突应该做出的选择,而现有实证研究则倾向于关注当前现实,而忽略了人类的主观性和想象力。因此他认为,教育思辨研究应作为教育实证研究的前提,同时可以整合实证研究的发现。
同样,潘洪建(2018)认为有必要区分与实证研究或循证研究的近似概念。他认为,基于证据的研究不应等同于定量研究,尽管他承认量化是大规模基于证据的研究的基础。他认为,严格的定性方法可以验证某些假设,也可以使研究人员获得真实的证据,并有助于解决教育问题。他特别强调了产生新理论的扎根法和民族志研究的价值。因此,他认为,由于教育问题的复杂性和多维性,不应将教育研究降维至实证研究或定量研究。
二是收集真实证据的方法。其他一些学者对在教育环境中收集“真实”证据的可行性表示怀疑(刘选,2017;阳泽等,2019)。例如,阳泽等(2019)认为,尽管研究共同体理解开展实证研究(例如实验或准实验)的正常程序,但现实的教育环境可能并不总是允许严格执行这些程序,因为存在一些条件限制。他们列举了数据收集过程中经常遇到的一些困难,例如对高质量数据的访问受限、收集纵向数据的成本、收集数据的程序和标准不清晰,以及对研究人员的培训不足导致的数据收集质量较低。这些作者专门强调了从事数据收集的个人研究者面临的困境,并指出了其对数据分析和研究结论的负面影响。
类似地,刘选(2017)指出,由于实证研究通常认为任何概念只有在简化为个体经历的经验内容时才有意义,而教育本身涉及很多难以简化的复杂问题与抽象概念,因此,他对实证研究方法(例如使用量表)的可信性和有效性表示怀疑,即是否能有效地把握某些教育概念(如道德和幸福)的本质。按照刘选的观点,教育科学中的许多重要概念,例如教育目的、伦理和价值观,都难以量化和观察。因此,他坚信经验对于建立一套教育研究范式的重要性。
四、美国证据驱动的教育改革
美国的教育研究状况与中国有很多相似之处。教育研究长期以来使用多种方法了解教育政策、实践和成果。这些方法包括量化研究,例如实验、相关研究和调查,还包括质性设计,例如系统的观察、调查和访谈以及混合方法研究。像中国一样,在西方国家,所有这些类型的研究今天仍在全面推行。
然而,最近二十年的重大变化是,政府的政策高度关注通过教育研究工具来评估学校课程实践。这类研究不仅寻求智慧,而且致力于获得有效性的证据,从而直接让教育者和决策者了解一项方案或政策可能对学生成就的影响。这类研究的问题类似于:与常规实践相比,一项特定的教育技术方案对学生生物成绩有何影响;一项特定的学生分组策略对读写成绩有何影响;教授教师在数学课堂使用特定形式的合作学习会对学生学习有何影响?
对于这类问题,需要使用定量方法加以回答,因为这些都是“多少”的问题。理想情况下,研究会随机分配有关学校,教师或学生按照实验的程序,或留在传统上受教的对照组中。如果不可能进行随机分配,则可以在“准实验”开始时匹配学校、教师或学生。此类研究通常使用混合方法,包括观察或民族志,以增加对研究的理解,但主要重点是在学习或其他结果方面对一组与另一组研究对象进行定量比较。
政策对实验研究有利,原因是能为重要教育问题提供实际解决方案的研究受到政治上的支持。政策制定者更希望提高学生成就,而不是填满教育期刊的版面。各国对教育研究的资助普遍不足,然而有一类研究的发展进步使得对教育研究的资助达到了历史性水平,这就是能够为特定、可复制方法的有效性提供可靠证据的研究。如前所述,这类实验所采用的方法主要源于医学领域,由于坚持对新药和新程序进行严格评估,医学领域取得了非凡的进步。
近年来,美国的一项重大政策举措为基于证据的教育改革创造了新的可能性。《让每位学生都成功法案》于2015 年12 月成为美国一项重要的联邦教育法。其中明确提出了支撑教育方案有效性的三级证据水平,分别是有力的、中等的和有希望的。基于下列水平的证据,能够证明在统计学意义上显著地提高了学生成绩或其他相关成就,具体定义如下:
1. 有力的证据:来自至少一项精心设计和实施的实验研究;
2. 中等的证据:来自至少一项精心设计和实施的准实验研究;
3. 有希望的证据:来自至少一项精心设计和实施的、并对选择偏倚进行统计控制的相关研究。
这些证据标准不是强制性的,但是如果想要产生影响,就必须得到广泛支持。本文的目的是讨论中国可以采取哪些措施来逐步增加证据在教育政策和实践中的作用,以期大规模地提高学校效能和学生成就。
五、证据驱动的教育改革的基本路径
(一)为每个学科和年级找到最佳方案
证据驱动的教育改革最重要的要求,可能就是要有大量的、具备有效证据的、可复制的方案和实践。例如,假设某政府希望提高幼儿的阅读成绩。阅读专家可能会被要求设计并初步评估针对5 至6 岁学生的各类阅读教学方法。然后,可以用随机实验评估其中最有希望的方法。例如,可以确定50 所学校参加实验。25 所学校被随机分配(例如通过掷硬币)为使用新方案,或者继续常规做法。学生在新方案开始之前参加前测,然后在学年结束时进行后测。研究人员收集前测和后测成绩,并对其进行统计分析,以发现哪个组学到更多。如果使用新方案的学生得分显著高于使用常规做法的控制组,那么新方案将被认为有效,尤其是在其他地方反复进行类似实验、并且取得成功的情况下。
这种将使用新方案的学校与使用传统方法的学校进行比较的设计,可以应用于任何学科或年级。无论该科目是高中科学、中学数学、小学英语还是其他任何科目,相同的基本评估方法都可以使用。若干年后,政府领导人将会看到哪些方案比传统方案效果更好,并且可以促进这些成功方法的推广。美国和英国的有关政策已经为许多方案的开发和评估投入大量资金。下文将回顾这些由政府发起的举措。
面向创新的投资基金(Investing in Innovation)与教育与创新研究基金(Education and Innovation Research)。在有效干预方案的大规模研发方面,一项重大进展是美国的面向创新的投资基金项目,该项目于2009 年创立,通过“分层资助”策略,面向从学前到高中的各级教育水平,资助有效干预方案的开发、评估和大规模推广。已经具备很强有效性证据的方案能够获得用于大规模推广的资助;拥有初步证据的方案可以获得较少资助,用以进一步检验成效;想法不错但未经检验的方案可以得到较少资助,用以开发完善方案。截止2016 年,即该基金运营的最后一年,面向创新的投资基金总共资助了171 个项目,旨在为各种方案做随机评估。面向创新的投资基金现已被教育与创新研究基金取代,新基金依然使用了分层证据结构。
教育科学研究院(Institute for Education Sciences)。自2002 年以来,教育科学研究院就一直在支持美国可扩展项目的开发和严格评估,并在此过程中建立了一个国家性的评估专家库,刚刚提到的面向创新的投资基金和教育科学研究院的项目也要基于这类评估专家库加以推进。当然,教育科学研究院的项目还依托一种分层结构对研发进行资助。
教育资助基金会(Education Endowment Foundation)(英格兰)。这是英格兰模仿面向创新的投资基金的一项重要尝试,现任政府将大量资金划拨给一家私人基金会,委托其在中小学阶段评估有前景的方案。教育资助基金会已经资助了很多针对各类方案的第三方评估,其中大多数是随机性评估。
(二)让教育工作者和政策制定者了解得到证实的方案与实践
仅仅知道哪些教育方案在每个学科和年级行之有效还是不够的。这些信息必须与教育工作者、教育领导者和政策制定者共享,而且要让所有人都容易获取这些信息。这就要求值得信赖的政府或非政府(例如大学)专家来解释教育研究评估的技术报告,清楚地描述方案及其证据基础,并保持这些信息是最新的。
“什么有效”信息交流中心(What Works Clearinghouse)。除非对哪些特定方案具备明确的有效性证据达成一致,否则教育政策就无法支持证据驱动的实践。在美国,教育科学研究院一项最重要的举措就是创建了“什么有效”信息交流中心(www.whatworks.org),其目的就是为诸多领域评审关于实践方案的研究。该中心目前已有关于阅读、数学、科学、高中毕业和其他领域的研究报告,并为若干主题提供了易读的《实践指南》。
最佳证据百科全书(Best-Evidence Encyclopedia)。最佳证据百科全书是由我们在约翰斯·霍普金斯大学的团队创建并定期更新的免费网站(www.bestevidence.org)。它主要包含对特定领域方案有效性研究的全面性学术评论。例如,它有针对小学和中学阅读、阅读困难学生的阅读、小学和中学数学、小学和中学科学,以及幼儿园课程的评述。
《让每位学生都成功法案》的证据(Evidence for ESSA)。《让每位学生都成功法案》的证据是我们约翰斯·霍普金斯大学团队创办的另一个免费网站(www.evidenceforessa.org),但与最佳证据百科全书不同,它主要面向一线教育者而非学者,并且符合《让每位学生都成功法案》的证据标准。因此,我们创建最佳证据百科全书的小组开发了一个新网站,专门致力于向教育领导者传达关于个体方案的信息,这些方案可能符合,也可能不符合《让每位学生都成功法案》对有力的、中等的或有希望的有效性证据的定义。该网站已经完成针对阅读、数学、社会情感学习、出勤的干预方案的全面评述(包括从幼儿园到12 年级)。大约有100 个阅读和数学干预方案达到“有力的”、“中等的”或“有希望的”标准,其中属于“有力的”这一级别的最多。它已经找到满足《让每位学生都成功法案》标准的24 个社会情感学习干预方案和8 个出勤干预方案。截至2020 年1 月,该网站已拥有超过十万名用户,并以每周新增800 名用户的速度成长。
卓越实证研究概述(BEiB)与博客。卓越实证研究概述(https://beibindex.wordpress.com)始于约翰斯·霍普金斯大学与英格兰约克大学之间的合作,每两周会向美国和英国数以万计的订阅用户免费发送。它会向对证据驱动的改革感兴趣的研究者、教育者和决策者推送关于最新研究、政策和其他新闻的简报。最近,南京师范大学创办了面向中国内地的中文版卓越实证研究概述(https://blog.educaixa.com/es/evidencias-educaixa1),而香港中文大学也针对海外华人创建了中文版(https://cuspbeb.com/en/)。这两个版本主要聚焦中国或其他华人地区开展的研究,虽然其也会翻译一些可能适用于华人社会的美国版或英国版的文章。类似地,美国版和英国版也会发布一些来自中文版的文章。除了卓越实证研究概述,罗伯特·斯莱文教授每周都会就与证据驱动的改革、方法和政策相关的各类主题撰写博客(https://robertslavinsblog.wordpress.com/)。该博客美国版和英国版的卓越实证研究概述都设有索引,能让读者方便地从之前发布的所有内容中检索文章。
(三)提供资源和激励措施使学校领导实施证据支持的方案与实践
仅仅了解哪个教育项目效果最佳不足以使教育领导者对之进行接受和使用。教育创新通常具有初期成本(用于材料、硬件、软件和专业开发),但教育研究者希望教育领导者能够以鼓励性的态度对待教育创新。因此,政府必须致力于向愿意尝试新项目的学校领导提供资源和激励措施。
在美国,《让每位学生都成功法案》为学校实施有证据支持的方案提供了财政支持和鼓励。这项法案主要针对成绩欠佳的学校,但是这场关于证据的讨论已使几个州同意,如果学校能够获得所在州的资助,而不仅是联邦拨款,那么学校会更愿意使用证据驱动的方案。这种政策才刚开始发生作用,因此尚难估计鼓励和帮助选择证据支持的方案是否会产生更大的影响。然而,以前的激励方案,例如上世纪八十年代的《全国推广网络》,九十年代的《综合性学校改革》,以及从2010 年生效至2018 年的面向创新的投资基金,都已经证明了政府鼓励和适度资助能促使数以千计的学校采用证据支持的、或有希望的干预方案。2018 年,英国政府几乎就要推行一项计划,旨在提供大量资金来帮助学校采用证据支持的方案。然而该计划在最后被取消了,但是有关理念将来可能会再次出现。
(四)创设政策和机制以持续积累有关知识和有效实践
大规模地实施证据驱动的实践当然是可以实现的。中国是最适合这一战略的,因为中国是一个大国,而且大多数公民都讲同一种语言。如果中国研究人员开发并成功验证了一种新的写作、生物或几何教学方法,那么它们可以被推广到数十万所学校。然而,国家和地方政策将需要支持这一从开发、试点、评估到推广的完整体系。
通过评估已有的方案,可能会很快达成一些进展,如果评估显示某些方案有潜力,就可以推广这些有效的方案。然而,为了迅速建立开展这项工作的能力,中国政府将需要在创新、评估,以及推广过程的各个环节建立专业队伍。例如,将需要许多高水平专业人员研发创新方案,或者将国外方案进行本土化调试,需要更多专业评估人员来评估新方案,需要更多人能够不断汇总有效方案的证据,让教育者能轻松获得并理解有关信息,需要许多人能够使用最先进的、且文化上适切的方法来培训教师实施有效的方案。
对解决教育根本问题新方法的追寻是永无止境的。即使研究已经证实了一些方法是非常有效的,依然会有效果更好的新探索不断涌现。而且,环境总是随着时间的推移而变化,因此研究和发展也需要对这些变化做出反应。再者,不同的教学方式适用于不同类型的学校,例如城镇学校和乡村学校。教育研究不应被看作是为所有学校寻找唯一的最优方法,而是作为一个不断创新与评估的过程,逐步积累关于有效实践与政策的知识。
此外,教育研究的目的不应该仅仅是提高考试分数或其他可量化的成果。创新和评估需要纳入对教学过程、师生态度、现实困难和实用解决办法的研究。随着时间的推移,致力于改善教学策略、材料和技术的研究应该帮助研究者和教育者更好地理解学习是如何发生的、如何支持和维持变革。
如果中国政府决定通过有证据支持的方案提高学校效能,那么可以确定一些试点地区来检验有关政策和实践,学习如何让这些理念在中国情境中发挥作用。我们完全有理由相信证据驱动的改革在中国可以成功,但是中国实现这一目标的道路不一定会和美国、英国或其他国家完全相同。
中国已然建立了非常成功的教育体系,并取得了显著成绩,正如以PISA 为代表的国际测评所报告的那样。然而,中国也有自身需要面对的难题,例如如何更好地将素质教育、素养培育纳入当前更侧重应试的教育体制中,如何为学生减负以便兼顾学业发展与全人发展。证据是非常重要的,因为它可以让政府和学校知道哪些改革措施能够更有效地实现教育改革的总体目标。随着教育在经济安全中变得愈发重要,每个国家都需要考虑如何建设一个能够为未来做好准备的教育体系。证据始终是医学、农业、技术和其他领域在全世界范围内取得长足进步的关键。为什么它不能成为推动教育进步的关键呢?