APP下载

循证:欧盟教育实证研究新趋向*

2017-02-24

关键词:循证证据评估

俞 可 陈 丹 赵 帅

(1.上海师范大学教育部国际教育研究基地,上海 200234;2.多特蒙德理工大学学校发展研究院,德国多特蒙德 44227;3.上海视觉艺术学院,上海 201620)



循证:欧盟教育实证研究新趋向*

俞 可1陈 丹2赵 帅3

(1.上海师范大学教育部国际教育研究基地,上海 200234;2.多特蒙德理工大学学校发展研究院,德国多特蒙德 44227;3.上海视觉艺术学院,上海 201620)

欧盟以及各成员国将研究焦点转向教育政策制定与教育教学实践之间的关系,转向的动能来自证据。循证遂应运而生,并因国际大规模教育评估勃兴而备受期待。国际大规模教育评估促使欧盟各国架构教育监测体系,它由三个层面组成:学校外部评估;学校内部评估;学生学业成就评估。而欧盟2007年展开的研究项目“改进校长工作,提高学生学业成就”可提供一个示例。该项目的最大收益非三方共赢莫属,即通过循证,使教育研究、教育政策与教育教学实践之间的互动与共赢得以实现。以循证为标志的欧盟教育实证研究新趋向能引发三点启示:证据共享,即形成一个教育学术界与教育实践界以及教育行政界的证据共享机制;体系共建,旨在生成新的循证知识、循证方法与循证理念,进而提升教育证据的生产力、教育政策的执行力与教学实践的创新力;价值共赢,意味着循证所孕育的生命力,既体现在欧盟教育版图上的欧洲价值共赢,更彰显于欧盟维度下的教育价值再造。

循证;证据;教育实证研究;教育监测;欧盟

欧盟与各成员国以及经合组织将研究焦点逐渐转向教育政策制定与教育教学实践之间的关系,该转向的动能来自证据(evidence)。有感于如火如荼的循证医学,教育政策制定与教育教学实践应立足于证据,这就是“循证”(evidence-base),意为遵循证据。所谓的证据,可以是观点、例证、迹象,通常经由严谨的实证研究获取,以确证事件或事物及其效果的真实性。作为发达国家最密集区域,欧盟掀起的循证转向浪潮所产生的冲击力难以比拟,所给予的启示亦可圈可点。

一、作为实证创新的循证

(一)循证的勃兴

近十年来,欧盟委员会(European Commission)先后致力于推进“以知识为基础的教育与培训政策”(Knowledge-based Policy and Practice in Education and Training)(European Commission, 2007)和“以掌握证据为基础的欧洲教育政策制定”(The Evidence Informed Policymaking in Education in Europe)(Gough et al., 2011)。2007年,在德国担任欧盟理事会(Council of the European Union)轮值主席之际,德意志国际教育研究院(German Institute for International Educational Research)承担了一场大型会议“教育与培训行动的知识”(Knowledge for Action in Education and Training),欧盟11国参加,以“证据”为主题(Rickinson, 2007)。经济合作与发展组织(OECD)在2002-2006年间召开四次研讨会,其成果呈现为教育研究与创新中心(Centre for Educational Research and Innovation)展开的一个名为“教育研究的推介”(Brokering Educational Research)的项目和出版的一本题为《教育证据:研究与政策的链接》(Evidence in Education: Linking Research and Policy)的文集(Burns & Schuller, 2007)。在此基础之上,欧盟委员会于2009年又发起一个名为“循证式政策与实践”(Evidence-based Policy and Practice)的项目(Gough et al., 2011),并以此为契机,启动多个项目,通过提供政策分析工具,增强教育研究、教育政策与教育教学实践之间的互动(European Commission, 2003)。

循证遂成为教育政策与教学实践的焦点,亦被欧盟委员会视作优先事项之一,在欧盟政策文本如“教育与培训走向更多基于知识的政策与实践”(Towards more knowledge-based policy and practice in education and training)和“2010年之后教育与培训领域的欧洲合作战略框架”(Strategic framework for European cooperation in education and training beyond 2010)中均有体现(The Council of the European Union, 2009)。重点在于如何促进证据在政策制定与教育教学实践中的运用(the evidence-to-use process),并加强学术研究、政策制定与教育教学实践之间的联系。“欧洲教育的循证式政策与实践”项目(Evidence Informed Policy and Practice in Education in Europe,简称EIPPEE)遂应运而生,由欧盟委员会教育与文化专署(European Commission Directorate-General for Education and Culture)资助,作为欧盟“欧洲2020”战略(Europe 2020)的组成部分,旨在搭建一个多层级的国际网络,以促进证据生产者和证据应用者之间的互动,以及增进循证意识与提升循证能力。

EIPPEE项目分为两期,即2010年3月至2011年4月以及2011年3月至2013年8月。第一期主要对教育学术研究与教育政策制定之间的联系展开盘点,考察两者联系的范围、过程、频率以及性质,对象为全欧104个国家与地区的政府教育职能部门、14位个体和14个社团的269个实例。盘点结果显示,在32个目标中,30个得以实现;55%的实例采用“业务接入能力”(accessibility)机制,以确保并助力政策制定者更便捷(readily found)和更舒适(user-friendly)地获取学术研究所生产的证据;在67%的实例中,绝大多数证据,其产生与流通只是出于政策制定者的需求,来自学术界的需求则凤毛麟角。可见,双方隔膜已久且较深。第二期便针对此症状而展开。

第二期由欧洲23个国家的36个伙伴与欧洲之外4个国家的7家机构联袂实施,包括荷兰教育文化科学部、立陶宛教科部、塞浦路斯教育文化部、斯洛伐克的国家职业教育与培训督察院、比利时的安特卫普大学、意大利的佛罗伦萨大学、冰岛的冰岛大学、丹麦的奥胡斯大学、芬兰的于韦斯屈莱大学、葡萄牙的埃武拉大学、斯洛文尼亚的卢布尔雅那大学、法国的里昂高等师范学院、土耳其的萨班哲大学、德国的德意志国际教育研究院(DIPF)、英国的实效教育研究院(Institute for Effective Education)、希腊的雅典教育研究院(ATINER)、波兰的教育研究院(IBE)、瑞典的国家研究院(Skolverket)、奥地利的高等研究院(IHS)、瑞士的瑞士教育研究协调中心(SKBF)、德国的德国教育科学学会(DGfE)、欧洲学习改进研究会(EAPRIL)等欧洲各国政府教育职能部门、高校、研究机构与学术团体,呈现鲜明的泛欧性质,可视作欧洲一体化进程在循证式教育政策与教育实践的映射。此外,欧洲以外的机构也应邀参与,如新西兰教育部、加拿大的康考迪亚大学、新加坡的成人教育研究院(IAL)、日本的国家教育政策研究院(NIER)。伦敦大学教育学院负责统筹整个项目,并在该院设置项目执行中心(EPPI-Centre)。该项目由五大板块来支撑:项目规划与管理,尤其注重全欧洲合作;收集与分析证据,通过绘制一幅“地图”,形成分析框架;实施培训与工作坊,以增进循证意识与提升循证能力;召开年会,以探讨最新成果;开设网站,以打造交流合作平台(EPPI-Centre, 2017)。

(二)循证的国际比较热潮

经济合作与发展组织(OECD)旗帜鲜明地要求实证研究能够“证明哪些教育教学实践更优”(Nilsson, 2007, p.145)。由经合组织发起并实施的国际学生评估项目(Programme for International Student Assessment, PISA)无疑堪当表率。以PISA为代表的国际大规模教育评估(International Large Scale Assessment in Education)通过在全球范围定期对特定学段学生必备素养展开测试,敦促各个教育体系在跨文化比较的棱镜中自我审视,寻求全球定位,进而制定学生发展基准及其教育政策。由此,PISA在全球不仅掀起一股国际比较浪潮,并引发教育政策的实证转向,而且催生基于证据的教育决策与实践(Bieber et al., 2014)。

国际大规模教育评估的影响力呈现在三个方面:第一,通过学生科目精熟度(proficiency)测评,评估教育整体发展水平;第二,通过设定学生关键素养的国际基准(benchmark),可以比较两个或多个文化传统与制度架构迥异的教育体系;第三,通过对评估结果的元分析(meta-analysis),诊断教育体系现存的问题与不足,进而向政府和学校提供反思、干预和完善的线索(Bos et al., 2010)。媒体焦点停留于前两者,政府与学校则受惠于后者。国际大规模教育评估助推各教育体系完善教育改进政策,并优化教育质量保障举措,尤其是敦促建立各国教育监测(Education Monitoring)体系。

鉴于欧盟成员国在国际大规模教育评估的整体表现欠佳,危及欧盟的全球竞争力,故而,欧盟委员会主席容克(Jean-Claude Juncker)决定在任期内以前所未有的力度支持教育发展。欧盟遂通过出台系列政策,以改进教育质量和推动教育投资高效化,进而提升欧盟就业率、经济竞争力和社会凝聚力(European Commission/EACEA/Eurydice, 2015)。为此,欧盟须定期对各学段的教育质量展开全覆盖式监测,并建构及完善教育质量保障体系。2014年5月,欧盟各国教育部重申质量保障体系对学校教育教学及教育政策制定的重要作用(Council of the European Union, 2014)。德国则先行一步(Dedering, 2009)。身为教育政策的最高决策机构,德国各联邦州文教部部长联席会议(KMK)2006年8月1日出台了《教育监测全局战略》。该战略由四大支柱组成:以“国际学生评估项目”(PISA)、“国际中小学生数学与科学素养进展”项目(Trends in International Mathematics and Science Study,简称TIMSS)、“国际小学生阅读素养进展”项目(Progress in International Reading Literacy Study,简称PIRLS)以及“教与学国际调查”项目(Teaching and Learning International Survey,简称TALIS)为代表的国际大规模教育评估;小学、初中、高中水平考试的州际比较;基于教育标准的学校评估;两年一度的《国家教育发展报告》。小学、初中、高中水平考试的州际比较可谓国际大规模教育评估的翻版,即由国际比较转向国内比较,两者均为抽样测试;基于教育标准的学校评估则为普查。与作为宏观监测的《国家教育发展报告》相比,前三者为微观监测。德国各联邦州文教部部长联席会议视该战略为“新的领导哲学”的演绎,“由此为所有联邦州的循证式教育政策奠定共同基石”(KMK, 2016)。

由德国案例可以发现,完善教育改进政策并优化教育质量保障举措需要丰盈的数据来支撑,而这些数据通常有五大来源:①大规模评估,它以服务政府决策为主,因抽样误差太大而不适合单个学校的发展;②学习情况调查,它因具有效度而适合学校与教学发展,却由于没有采用诊断性测试而不适合个体学生的诊断;③教育督导,它常常在内部评估或自我评估前实施,颠倒次序更为有效;④数据服务行业,它经济实惠但缺乏针对性;⑤学校内部的数据自我采集,它最为有效但复杂程度高(Bos et al., 2003)。这些数据来源各有千秋。欧盟试图架构一个教育监测体系,既能涵盖五大来源,又能扬长避短。

二、作为循证支撑的监测体系

国际大规模教育评估催生了教育监测体系。纵览欧盟各国,其监测体系可分为三大层面:学校外部评估;学校内部评估;学生学业成就评估。根据评估结果,政府与学校修正并完善教学策略,以保障并提高教育质量。

(一)学校外部评估

在欧盟,外部评估早在21世纪初就已广泛运用于教育质量保障(Eurydice, 2004)。在2007年及2009年前后,法国与比利时德语区拓展其评估体系,将评估重点转移至对教师个体的评估;丹麦与瑞典分别于2003年和2006年明确将地方政府教育行政机构作为学校评估的第一责任人,而机构本身又接受国家教育行政机构的评估;意大利与匈牙利则采用综合评价方法。截止至2014年,欧洲共有26个国家的31个教育体系实施外部评估,但仍有7个教育体系缺席。

1. 学校外部评估权限。在地方分权制国家,测评范围与评价基准通常由国家来制定。譬如,在波兰与奥地利,虽然外部评价权在地方政府,但评价框架则由国家制定并强制使用。欧盟大多数教育体系(27个)的外部评估权隶属于国家,国家处于自上而下的教育质量保障体系中最顶级的“观察者”。在丹麦、立陶宛与冰岛等国,由国家、地方与城镇政府共同承担;在匈牙利、奥地利、波兰与土耳其等国,由地方与城镇政府承担;在斯洛伐克、英国与马其顿,则由国家或地方政府承担。

2. 学校外部评估框架。外部评价基于两大要素,即评价参数(指测评范围)与评价基准(指测评预期)。在欧洲,三分之二的学校外部评价拥有标准化框架,包含对每个评价参数的详细描述以及预设的标准值。比利时德语区在2009年出版的一份官方文件中,设定了“好学校”的标准与核心特征,以此来展开学校质量评估(European Commission/EACEA/Eurydice, 2015)。

3. 学校外部评估内容。在欧盟大部分教育体系中,学校外部评估对象不仅限于教与学,而是侧重于从教学管理到校长领导力(Harris & Herrington, 2006)的广泛的学校生活,且因“国”而异。法国的学校评价主要侧重于教职员工个体,而对学校外部评价没有特定的评价议案与具体评价过程;瑞典的外部评价实施者则对评价标准具有自主决定权,且立足于本国教育法规、学校管理条例与课程标准。

4. 学校外部评估方法。无论外部评估内容多寡,评估过程须经历六个阶段:评估频率、评估所处不同阶段分析、信息收集、信息分析、探访与形成报告。根据对评价对象所得结果的不同侧重点,结果分析采用的方法或为风险分析法或为侧面提升法。丹麦、爱尔兰、荷兰、瑞典、英国等5个教育体系使用风险分析法,即以未达标学校为重点。欧洲大部分教育体系则认为,应从表现甚佳的学校或科目中提炼普适性经验,以此作为改进整个教育体系的一条高效途径。

5. 学校外部评估人员。总体上,学校外部评估人员须具有一定年限的教育经验,或者具有教育行政管理岗位的任职经验。意大利与冰岛则更加注重外部评估人员的校外经历。他们考虑的出发点是,这样的外部评估人员在实施外部评估时能够更紧贴实际情况且不会墨守成规,使学校评估更为生动。总之,信息来源多元化、评估工具多样化、评估结果透明化已成为欧洲外部评估的显著特征(European Commission/EACEA/Eurydice, 2015)。

(二)学校内部评估

在2002-2014年期间,欧盟12个教育体系就将学校内部评价由推荐使用转为强制使用。如今,欧盟27个教育体系已建立以国家为主导的内部评价体系,只有保加利亚与法国既没有强制要求使用内部评价,也无相关推荐使用。欧盟鼓励各教育体系实施学校内部评估,通过各校自我评价,形成其独特的教育教学改进方法(EACEA/Eurydice, 2009)。学校内部评估人员可以是教师,亦可接纳其他利益相关者,如学生、家长、社区代表。有23个教育体系明确规定社区代表可以参与。虽无明文规定其评估人员组成,但在爱尔兰、冰岛、马耳他、芬兰、苏格兰、挪威等教育体系中,政府通常会向学校提出切实建议。

大部分强制实施内部评估的教育体系会每年展开一次综合评估。马其顿每两年一次,拉脱维亚每六年一次,比利时德语区、卢森堡、北爱尔兰每三年一次。爱沙尼亚必须在学校每个发展规划阶段(通常为三年)出具一份内部评估报告;威尔士虽然强制使用内部评估,但其频率依据政府视察教育的频率而变化;德国则由各个联邦州自主决定其评估频率;克罗地亚、立陶宛、匈牙利与瑞典并未明确规定内部评估频率。以上是内部评估为强制使用的国家。在内部评估为推荐使用的教育体系中,英格兰、塞浦路斯(小学)、卢森堡(初中与高中)与马耳他,其内部评估由教育督查方正式提议。塞浦路斯的教育督查方会向学校提议使用内部评估,并根据其结果提出学校改进计划;卢森堡教育质量发展机构会向学校建议使用内部评估,且形成未来三年发展计划;马耳他教育质量保证部门规定学校以三年为周期展开内部评估;英格兰要求学校出具基于学校自我评价的书面总结,作为学校改进计划的重要部分(European Commission/EACEA/Eurydice, 2015)。

(三)学生学业成就评估

鉴于教育体制与评估机制迥异,欧盟各国在学生学业成就评估方面各显神通。尽管如此,学生学业成就评估逐渐成为欧盟各国教育实证研究的重要部分,也同时监测各个教育体系的效能(OECD, 2005)。欧盟各国学生学业成就评估主要具有三项功能:为学生衡量自身学业发展水平提供指南;为教师获取教学反馈提供依据;为国家建立教育成就评估机制提供基石。最通用的评估方式为连续评估,即对学生学习行为连续观测,包括学生的课业活动、口头与书面测试成绩以及团队活动表现。这种评估方式可以作为形成性测试或总结性测试(Harlen, 2007)。

在欧盟几乎所有的教育体系中,形成性测试贯穿于一个学年始末,由任课教师完成,既评估学生的学习行为与社会行为,也评估教师的教学行为。在比利时德语区,这一测试由班级委员会负责实施;在葡萄牙,则由各任课教师及教务部门人员或学生监护人合作完成。而在欧盟另外一些教育体系中,形成性评估在入学第一年实施;对后续每一学年的学业成就进步,则实施总结性测试。总结性测试通常发生在学期末、学年末或学段结束时,其结果将决定学生未来学业方向。总结性测试也将家长会和学校年度报告纳入(Eurydice, 2009)。对学生学业评测内容及工具、连续评价的频率与学业进步衡量标准等,学校与教师的自由度与决定权颇高(Eurydice, 2008)。

三、循证范例与启示

(一)循证范例

至于如何以三级监测体系来开启循证式教育教学实践,则为循证的难点。欧盟委员会教育、视听教学及文化执行署(Education, Audiovisual and Culture Executive Agency,简称EACEA)2007年开展的研究项目“改进校长工作,提高学生学业成就”(Leadership Improvement for Student Achievement,简称LISA)可提供一个示例。

在2000年至2006年的三届PISA中,除芬兰作为特例外,欧洲各国表现普遍欠佳,而欧洲绝大部分中学校长对此浑然不知。研究表明,校长对学校发展和学生学业成就发挥着显著的影响作用(Marzano et al., 2005)。于是,学术界与实践界携手实施LISA项目。实践界一方由欧洲中小学校长联合会领衔,英国中小学校长联合会、挪威中小学校长联合会、荷兰中学教师工会、斯洛文尼亚全国中小学校长联合会、匈牙利欧洲中学校长联合会、意大利全国中小学校长联合会、德国北威州中小学校长联合会加盟,作为会员的校长直接参与;学术界一方由荷兰的特温特大学、塞浦路斯的塞浦路斯开放大学和德国的德意志国际教育研究院组成。

LISA的主要目标有7个方面:①探究学校领导力运行机制,尤其注重考查欧洲各国不同文化与政治背景;②开发具有欧洲特色的学校领导力的概念框架,以测量中学校长的领导效能;③设计和验证有效学校领导力的模型,挖掘学校领导特质与学生学习结果之间的关联性因素;④寻求提高教育教学质量的途径,重点在校长对学校文化建设的作用;⑤促进学校领导者和教育研究者开展合作;⑥收集欧洲中小学校长信息,提高社会对校长、教育系统和学校效能之间关联的理解力;⑦探究欧洲各国不同教育背景下的学校领导力的共性,以欧盟维度为参照系。

通过文献分析(Documentary Analyses),欧盟委员会EACEA课题组提炼了5种领导风格类型,即教学型领导(Instructional Style Leadership)、参与型领导(Participative Style Leadership)、员工发展型领导(Personnel Development Style Leadership)、企业家型领导(Entrepreneurial Style Leadership)和结构型领导(Structuring Style Leadership)。通过问卷调查(Questionnaires)和半结构访谈(Semi-structured Interviews),课题组对领导风格展开盘点。通过对国际大规模评估展开二次分析,即“领导力差异性——荷兰中学校长对学生学业成就影响的研究”“从校长领导力到学生成绩——基于2007年TIMSS数据的研究”“学校领导力与教师自我效能——基于TALIS数据的研究”,课题组检测校长领导力对学生学业成就的影响以及对教师自我效能的影响程度。

研究结果于2009年公布,主要结论如下:校长只是间接影响学生学习成绩,影响路径过于遥远,大部分还是通过教师来实现,所以,改进教师教学策略似乎比提高学校组织和管理效能更有效,但从教育改革和创新的效率及其普遍意义来讲,提高上百校长的教学领导力比提高成千上万教师的教学技能更有效果;校长领导风格没有固定模式,校长领导力是高度情境化的组合,所以,校长应通过专业发展,在顾及学校情境因素的前提下,把学校视作学习型组织,在实践过程中重构学校领导力;校长领导风格因文化差异而各具特色,难以生搬硬套,所以,国际比较研究要重视文化差异性(Visser, 2009)。

相比于研究结果,LISA项目的亮点更在于:通过循证,不仅促进学校教育教学的质量和效能的跃升,提高教师满意度,增强学生自信心,而且教育研究、教育政策与教育教学实践之间的互动得以实现。具体表现在:①教育研究者可以从产生的新知识、新方法和新工具中获取学术资源;②政策制定者可以获得学校层面的信息,便于制定学生发展基准和国家教育政策;③样本学校的领导者可以从扮演研究合作者的新角色中对学校领导与学校发展加以反思与改进(EACEA, 2007)。

(二)循证启示

在欧盟,政界与教育界对循证的热切呼唤由来已久。之所以对循证寄予厚望,是因为实证研究所获得的证据能够优化教育政策以及改进教育教学(Bromme et al., 2014)。2016年12月7日,欧盟委员会致函欧洲议会(European Parliament)、欧盟理事会、欧洲经济与社会委员会(European Economic and Social Committee)以及欧盟地方委员会(Committee of the Regions),提出“教育改进与现代化”(improiving and modernising education)方略,尤须“强化循证”(strengthening the evidence-base),譬如通过实施教育与培训的年度监测(Annual Education and training Moniter) (European Cominission, 2016)。上述欧盟教育监测体系之架构与运作所显示的,实为其改进教学实践并提升教育质量的路径,这条路径就是评估,以评估来获取改进教学策略并提升教育质量所需的证据。欧盟推出的系列项目,其的无非在于提高教育政策制定与教育教学实践的知觉力与执行力,且以教育实证研究为佐证。通过对项目的设计与管理,生成并分析证据,以打造一个“从教育证据到制定政策与教学实践”(from Education Evidence to Policy and Practice)的循证机制。“以掌握证据为基础的欧洲教育政策制定”业已成为欧盟及其各成员国在确定教育评估规则与确立教育监测体系之时所务必遵循的方针。

综上所述,循证不啻为欧盟教育实证研究的新趋向。这个新趋向给予了教育实证研究三点启示:证据共享;体系共建;价值共赢。

1. 证据共享。德意志教育领导学院(DAPF)创院院长汉斯-君特·罗尔夫(Hans-Günter Rolff)曾指出(Rolff, 2007):①内部评估优先于外部;②自我采集的数据比外部引进的数据更有效度;③外部引进的数据必不可少;④校长须创造性地与数据打交道。由欧盟学校外部评估尤其国际大规模教育评估观之,评估日益依赖于专业研究人员所提供的学术支撑。通常情况下,由于教师对日常教育教学实践的反馈与反思的可能性匮乏,因此他们很可能会断然否决所有与其现有经验相抵触的学术成果(Hargreaves & Stone-Johnson, 2009, pp.89-109)。EIPPEE第一期所实施的盘点显示,对证据的饥渴并非源自学校,而是来自政府,学校因实现教学策略改进并教育质量提升而成为最大获益者(EPPI-Centre, 2017)。显然,使学校成为循证的最大获益者,此乃循证的信条。故而,欧盟把循证的重心设定在促进证据在政策制定与教育教学实践中的运用(evidence-to-use)。另一方面,教育实证研究视教育评估为获取证据的重要途径,于学术生产与学术创新而言,它都愈发无可替代。经由循证,教育评估所获取的证据可为优化教育政策以及改进教育教学所用。由此,一个教育学术界与教育实践界以及教育行政界对证据的共享机制得以形成。而由证据共享所撬动的教育改革,其生成的效益可惠及欧盟及其各成员国的和谐、公正、增长、创新以及竞争力与就业率(European Commission, 2016)。

2. 体系共建。没有共建,何来共享?证据共享呼唤体系共建,体系共建亦为证据共享的必要前提。2016年11月8-9日,由丹麦的奥胡斯大学承办的EIPPEE项目年会以“欧洲:以研究促教育”(Advancing the use of research in education across Europe)为主题。年会聚焦于推进与支持教育循证路径(an evidence-informed approach in education),把研究所产生的知识运用到教育政策制定与学校教育实践中,并反馈给教育决策者和一线教师,以及教育决策者和一线教师如何参与构建一个循证的教育体系(EPPI-Centre, 2017)。教育实践界与教育行政界寄予教育学术界三点期望:展开高效度的研究;生成新的知识;提供可以改进教育政策与教育教学的证据(Prewitt et al., 2012)。教育学术界对体系共建的贡献不再显现为散兵游勇式,而是呈现出集约性与机构化。早在2007年,创立仅三年的欧洲教育研究学会(European Educational Research Association,简称EERA)便下设评估、评价、测验与测量专业委员会(Network Assessment, Evaluation, Testing and Measurement),既支持学科建设,亦服务教育改革(European Educational Research Association, 2017)。EIPPEE项目和LISA项目的结果均证实,校长与教师既是研究者又是被研究者,让校长与教师最大程度地投身于研究,即为以循证提升校长领导力与教师领导力。当然,循证成功与否,还依赖于证据分析能力与证据分析质量。这既呼唤教育学术界、教育实践界与教育行政界的协同创新,也期冀政府各相关职能部门的精诚合作,以共同探寻优质教育教学生发机制的核心要素(European Commission, 2016)。由此可见,体系共建旨在生成新的循证知识、循证方法与循证理念,进而提升教育证据的生产力、教育政策的执行力与教学实践的创新力。

3. 价值共赢。LISA项目评估报告坦言,该项目的最大收获非三方共赢莫属,即通过循证,教育研究、教育政策与教育教学实践之间的互动与共赢得以实现(EACEA, 2007)。如今,教育监测体系不再扮演“督查者”的角色,而是力争扮演“质量文化供给者”的角色。欧盟的学校教育质量文化须充分展现欧洲价值,即人文主义、科学精神、民主意识,以及被视为欧盟盟训的“多元一体”(United in Diversity)。文化、语言、民族、宗教信仰的多样性,一旦遭遇欧盟对人员自由流动这一基本原则的坚守,便把学校教育置于一系列挑战之中。欧盟各国在历届PISA中的表现欠佳即是明证。经由循证,可及时甄别问题,适时生成策略。譬如,芬兰、法国、德国、希腊、英国、以色列等六国以具有移民背景的教育实证研究为基础,实施跨文化教师培训课程研究,成效显著(European Commission, 2003)。在整合欧盟实施的各大教育项目基础上,2014年1月1日,欧盟推出“伊拉斯谟+”工程(Erasmus+),即欧盟教育、培训、青年和体育2014-2020计划(EU Programme for education,training,youth and sport 2014-2020),以三大行动为目标:提升个体学习的跨境流动性、深化有利于促进创新的伙伴关系、推进教育政策变革。流动性、伙伴化、变革力,这三重变奏无疑为欧盟实证研究的循证转向唱响灿烂的明天,亦为欧盟教育形塑欧洲公民注入蓬勃的活力。由此,循证所孕育的生命力,既体现在欧盟教育版图上的欧洲价值共赢,更彰显于欧盟维度下的教育价值再造。

鸣谢:欧洲教育研究学会评估、评价、测验与测量专业委员会理事长(Convenor of Network Assesment, Evaluation, Testing and Measurement by European Educational Research Association)博斯教授(Prof. Dr. Wilfried Bos),和欧洲中小学校长联合会名誉会长(Honorary President of European School Heads Association)米尔克教授(Prof. Dr. Burkhard Mielke)。

Bieber, T., Martens, K., Niemann, D. & Windzio, M. (2014). Grenzenlose Bildungspolitik? Empirische Evidenz für PISA als weltweites Leitbild für nationale Bildungsreformen. In Bromme R. & Prenzel M. (Hrsg.).VonderForschungzurevidenzbasiertenEntscheidung:DieDarstellungunddasöffentlicheVerständnisderempirischenBildungsforschung. Wiesbaden: Springer VS.

Bos, W.; Schwippert, K. (2003). The Use and Abuse of International Comparative Research on Student Achievement.EuropeanEducationalResearchJournal, 2(4).

Bos, W., Postlethwaite, T. N., Gebauer, M. M. (2010). Potenziale, Grenzen und Perspektiven internationaler Schulleistungsforschung. In Tippelt, R., Schmidt B.. HandbuchBildungsforschung. 3.durchgeseheneAuflage. Wiesbaden: VS.

Burns, T. & Schuller, T. (2007). The Evidence Agenda. In Centre for Educational Research and Innovation. (Ed.).EvidenceinEducation:LinkingResearchandPolicy. Paris: OECD.

Council of the European Union. (2014).CouncilConclusionsof20May2014onQualityAssuranceSupportingEducationandTraining. OJ C 183, 2014-06-14.

Dedering, K. (2009). Evidence Based Education Policy: Lip Service or Common Practice? Empirical Findings from Germany.EuropeanEducationalResearchJournal, 8(4), 484-496.

EACEA. (2007). Lifelong Learning Programme Transversal Programme. Derived from: http://ec.europa.eu/education/transversal-programme/doc/compendia/2007_en. pdf.

EACEA/Eurydice. (2009).NationalTestingofPupilsinEurope:Objectives,OrganisationandUseofResults. Brussels: EACEA/Eurydice.

EPPI-Centre. (2017). Derived from: http://www.eippee.eu/cms/Default.aspx?tabid=3179

European Commission. (2003).EuropeanUnion-supportedEducationalResearch1995-2003:BriefingPapersforPolicyMakers. Luxembourg: Office for Official Publications of the European Communities.

European Commission. (2007).TowardsmoreKnowledge-basedPolicyandPracticeinEducationandTraining(SEC [2007] 1098).

European Commission. (2013).Commission welcomes Council's green light for Erasmus+[2013-12-03]. Derived from: http://europa.eu/rapid/press-release_MEMO-13-1087_en.htm

European Commission. (2016).Communication from the Commission to the European Parliament, the Council, the European Economic and Social Committee and the Committee of the Regions [COM(2016) 941 final][2016-12-7]. Derived from: http://eur-lex.europa.eu/legal-content/EN/TXT/HTML/?uri=CELEX:52016DC0941&from=DE

European Commission/EACEA/Eurydice. (2015).AssuringQualityinEducation:PoliciesandApproachestoSchoolEvaluationinEurope. Brussels: Eurydice.

European Educational Research Association. (2017). Derived from: http://www.eera-ecer.de/

Eurydice. (2004).EvaluationofSchoolsProvidingCompulsoryEducationinEurope. Brussels: Eurydice.

Eurydice. (2008).LevelofAutonomyandResponsibilityofTeachersinEurope. Brussels: Eurydice.

Eurydice. (2009).NationalTestingofPupilsinEurope:Objectives,OrganisationandUseofResults. Brussels: Eurydice.

Gough, D., Tripney, J., Kenny, C., Buk-Berge, E. (2011).EvidenceInformedPolicymakinginEducationinEurope:EIPEEFinalProjectReport. London: Institute of Education at University College London.

Hargreaves, A., Stone-Johnson, C. (2009). Evidence-informed Change and the Practice of Teaching. In Bransford J., Stipek D. J., Vye N., Gomez L. M. & Lam D. (Ed.).TheRoleofResearchinEducationalImprovement. Cambridge: Harvard Education Press.

Harlen, W. ( 2007).AssessmentofLearning. London: SAGE.

Harris, D. N., Herrington, C. D. (2006). Accountability, Standards, and the Growing Achievement Gap: Lessons from the Past Half-Century.AmericanJournalofEducation, 112(2), 209-238.

Marzano, R. J., Waters, T., McNulty, B. A. (2005).SchoolLeadershipthatWorks:FromResearchtoResults. USA: ASCD & MCREL.

KMK. (2016).GesamtstrategiederKultusministerkonferenzzumBildungsmonitoring. Berlin: KMK.

OECD. (2005).FormativeAssessment-ImprovingLearninginSecondaryClassrooms. Paris: OECD.

Prewitt, K., Schwandt, T. A., & Straf, M. L. (Ed.) (2012).UsingScienceasEvidenceinPublicPolicy. Washington: National Academies Press.

Rolff, H.-G. (2007). Studien zu einer Thorie der Schulentwicklung. Weinheim: Beltz.

The Council of the European Union. (2009).CouncilConclusionsof12May2009onaStrategicFrameworkforEuropeanCooperationinEducationandTraining(‘ET2020’). Official Journal of the European Union, 2009-05-28.

Visser, S. S. (2009). LISA 2009:TheLeadershipCocktail:AHighlyContextualMix. Netherlands: 1∶1 Marketing Communicatie.

(责任编辑 童想文)

10.16382/j.cnki.1000-5560.2017.03.015

2014年度上海市教委科研创新项目“国际大规模教育评估的政策影响力”(14YS035)。

猜你喜欢

循证证据评估
第四代评估理论对我国学科评估的启示
《循证护理》稿约
循证护理在新生儿静脉采血中的应用
对于家庭暴力应当如何搜集证据
手上的证据
手上的证据
评估依据
循证医学的人文精神
“证据”:就在深深的水底下——《今生今世的证据》“读不懂”反思
立法后评估:且行且尽善