APP下载

我国NAEQ与PISA之比较研究与启示

2016-06-05詹春青

中国考试 2016年3期
关键词:报告测试质量

詹春青

我国NAEQ与PISA之比较研究与启示

詹春青

知识经济时代,随着世界各国间教育交流和竞争的加强以及对教育产出评估的关注,不少国家都开展国内和国际的基础教育质量测评。本文通过比较本国的国家教育质量评估项目(NAEQ)和国际学生评估项目(PISA)在项目创立、项目实施、项目结果报告与反馈的异同,得出PISA对我国NAEQ的启示,分别是树立促进学生终身发展、全面发展的价值取向、建立测评结果报告的公开反馈机制、建立对教育问题的快速反应机制以及逐步采用现代化的计算机测试方式,以期引起我国大规模教育测评与评价的反思。

NAEQ;PISA;比较;机制;公开

知识经济时代,世界各国都希望本国基础教育能切实增强学生的知识与技能,以提升国际竞争力,故特别重视教育质量,教育质量成为国际关注的热点。通过开展大规模的外部统一学业测试,是了解基础教育质量的重要途径。目前,许多国家都从国内和国际两个视野同时评估本国的基础教育质量,在开发本国的大规模学生学业测试的同时,引入国际性的大规模测试。如美国开发本土长期的、全国性的国家教育进步评价项目的同时也参加了国际学生评估项目(PISA)。在我国,上海也参加了PISA测试。上海于2006年提出申请,2007年开发测试工具,2008年进行试测,2009年正式测试。上海连续在PISA2009和PISA2012测试中夺冠,这一结果引起了国内外教育界及媒体的广泛关注。与此同时,我国于2007年也开发了本土的国家教育质量评估项目(National Assessment of Educational Quality,NAEQ),迄今为止已开展了8年。

可以说,NAEQ和PISA均为教育评价项目,NAEQ的开展与PISA在我国的引入时间上也基本同步。那么作为本土的NAEQ和国际性的PISA究竟有何异同,他们在建立义务教育质量评估体系、切实提高教育质量上有何作用?尤其是对于超越本国课程的PISA对NAEQ有何启示?本文将从项目创立、项目实施、项目结果报告与反馈三个方面作出比较,并得出PISA对NAEQ的启示。

1 项目创立

1.1 组织机构

PISA由经济合作与发展组织(简称OECD)参与国委员会、国际委员会、各国项目主管等机构共同完成[1]。参与国委员会负责确定指标、测量工具和报告结果。调查的设计和执行则由国际委员会负责,包括澳大利亚教育研究委员会(ACER)和荷兰国家教育测量学会(CITO)及其他一些成果。各国项目主管负责本国项目的执行、调查结果的分析和报告。

NEAQ由政府、高校、科研机构等协同完成。国家教育督导委员会办公室负责统筹规划、政策指导、基础教育质量监测中心(简称监测中心)负责日常的组织管理,相关高校、科研机构参与具体的研究、研发工作,地方各级督导部门和教育局配合完成监测数据的采集[2]。

值得一提的是,NEAQ监测中心是教育部依托北京师范大学成立的第三方专业评价机构,它没有独立法人地位,也不具有政府机构的行政功能[3]。因此,第三方专业评价机构在开展工作过程中,要保持自身的相对独立性和权威性,避免工作性质上完全成为行政机构的附属和工作内容上与行政机构趋同的局面,否则,很难保证第三方机构开展评估与监测的专业性和客观性,第三方机构的生存空间也难以得到保障。

1.2 测评目的

PISA是以证据为本的政策研究,以改进教育政策为测评目的。PISA将学生学习结果的数据与其他影响因素联系起来,用经过科学研究得到的数据,提高教育决策的客观性和科学性。可以说,PI⁃SA为各参与国提供了国际比较的视角,通过把本国测评的结果放在国际大背景下进行比较,了解本国的优势和不足,改进教育决策。

我国的基础教育一直都被贴以“应试教育”的标签,社会公众以升学率作为评价学校和学生的唯一标准,为纠正这种传统应试的做法,引导社会树立科学全面的教育质量观,同时为顺应课程改革的趋势和国际教育策略与评价的浪潮,我国也开发了本土的基础教育质量监测与评价项目。NAEQ正是基于这样的背景成立的,它旨在全面测评义务教育阶段学生学业质量、身心健康及变化情况,深入分析其影响因素,为转变教育管理方式和改进学校教育教学提供参考,推动义务教育质量和学生健康水平不断提升。

综上,PISA和NAEQ的测评目的有相似之处,即两者都是把握教育现状为教育决策提供参考,诊断问题为决策调整提供依据的;不同的是,前者注重国际比较,后者重在引导舆论为社会树立良好的教育价值导向。

1.3 测评技术与方法

PISA综合应用了统计测量技术。其抽样应用了按照概率与抽样元素的规模大小成比例的抽样法(简称PPS抽样方法),试题组卷采用了矩阵抽样方法。在试题分析和能力量表制定中应用了项目反应理论,在结果数据分析中采用了多层线性模型分析方法等国际上较前沿的数据分析方法[4]。

NAEQ通过加强国际交流与合作,如国家教育督导团办公室与法国教育部预测评估司共同主办教育监测与评估国际研讨会、邀请国际组织机构的知名专家短期讲学、开设研究生课程等方式,以PI⁃SA以及其他国际大型学生测评项目的经验为基础,同步跟进和吸收了国际相关标准化工具研制的测量技术,如采用了国际广泛使用的矩阵设计、锚题等值等技术。当然,NAEQ也对这些技术因地制宜,作出本土化改进。

2 项目实施

2.1 测评对象和内容

PISA通过阅读素养、数学素养和科学素养三个领域,系统测试接近完成义务教育的15岁学生在多大程度上掌握了参与未来知识社会所必须的基础知识和基本技能。NAEQ参照国家义务教育课程标准,监测义务教育阶段的四年级与八年级学生的全面发展状况,测试包括语文、数学、科学、体育、德育和艺术共六个学科领域。PISA和NAEQ的测评对象和内容如表1所示。

以PISA阅读素养测评为例,重点测评学生访问和检索、整合和解释、反思和评价等认知方面的能力,以及学生阅读参与度和学习策略。此外,还通过“电子阅读能力测评”(Electronic Reading Assess⁃ment,ERA)测评学生阅读电子媒体文本的能力。以NAEQ语文学科测评为例,重点测评语文基础、文本阅读、书面表达、识别与推论、整合与解释、评价与鉴赏、学习兴趣、学习信心和学习习惯。

PISA和NAEQ两者在测评学生学习态度、学习兴趣与学习信心方面如出一辙,但PISA对素养的定义是在不断发展的,与时俱进的。而且对学生进行电子阅读能力测评,以及测评学生基于计算机问题解决能力,这些方面都是NAEQ缺乏的。

2.2 测评内容与周期

PISA从2000年开始,每三年进行一次,每次从三个学科领域中选择一个作为主要评估领域,另外两个作为次要评估领域。前三次PISA测评的主要评估领域分别是阅读(2000年)、数学(2003年)、科学(2006年),2009年主要评估领域又回到阅读,2003年和2012年另外附加测试问题解决(Problem Solving)能力(如表2所示)。值得一提的是,2012年尝试用计算机的方式来测评问题解决能力。

NAEQ从2007年开始,截至2014年连续八年开展测评,基本上每年选择两个学科领域作为测评领域(2011年和2012年除外)。2007—2014年NAEQ的测评内容[5]如表3所示。自2015年开始,NAEQ每三年进行一次,每年测试两个学科领域。第一年度测试数学和体育,第二年度测试语文和艺术,第三年度测试科学和德育。

从测评内容来看,PISA和NAEQ有异曲同工之妙,两者都涵盖学科知识,也涉及能力、素养,还将测评成绩与外部环境进行关联分析。从测评周期来看,PISA和NAEQ都以三年作为一个周期,既可以保证持续性,也可以避免因频率过高,对学校造成负担。另外,由于测评项目的复杂性,其测评指标、工具、报告等都需要不断进行修订,这种周期性实施的方式,也给测评项目自身的完善留有充足的时间[6]。

表1 PISA和NAEQ的测评对象和内容

表2 PISA的测评内容与周期

表3 2007—2014年NAEQ的测评内容

2.3 测评样本

抽样在很大程度上决定了研究结果所适用的对象范围。可以说,科学、正确的样本保证了测评对象的有效性。PISA和NEAQ均采用按照概率与抽样元素的规模大小成比例的抽样法。

PISA抽样要求每个国家(地区)至少有150所学校、4 500名学生参加测试。以上海参加的PI⁃SA2012为例,样本为155所学校,6 374名学生参加测试。抽样分为学校抽样和学生抽样,上海严格按照PISA的抽样技术要求,在学校抽样中,学校类型包括初级中学、完全中学、实验性示范性高中、一般普通高中、重点中职、一般中职[7];区域分类包括中心城区和郊区;办学体制包括公办学校和民办学校。学生抽样中,基本覆盖七年级以上15岁在校生。

NEAQ采用分层不等概率方式分三个阶段抽取样本。首先是抽取全国总县数十分之一左右的县(市、区),每个省(区、市)不少于6个样本县(市、区);接着是在样本县(市、区)采用按规模成比例概率抽样方法抽取样本学校,每个样本县(市、区)抽取的小学不少于12所,初中不少于8所;最后在每所样本校随机抽取不少于30名学生。以NEAQ2015为例,全国31个省、自治区、直辖市和新疆生产建设兵团323个样本县(市、区)6 476所中小学的近20万名四、八年级学生参加了测试,近6 500名中小学校长、十万余名数学、体育及班主任教师接受了问卷调查[8]。

2.4 测评方式

PISA和NEAQ两者除了有学业测试外,均有调查问卷。PISA包括学生问卷、学校问卷和国家问卷,所收集的有关社会、文化、经济和教育因素的指标与学生的成就相联系,并从学习者、教学者、学校及教育体制四个层面进行分析。NAEQ包括学生、教师和校长问卷,用于调查影响学生学业水平的影响因素。PISA满足信息时代要求的,自2015年起,全面实行基于计算机的考试方式,及时反映最新的技术和教育成就。而NEAQ采用纸笔测试和现场测试。纸笔测试分为学科试卷和调查问卷。现场测试主要用于体育、科学、艺术等学科领域,通过学生的现场演示和项目参与,考查运动、操作、创作能力。

3 项目结果报告与反馈

3.1 测评结果的报告方法

PISA测评结果的报告方法有两种。一是量化分数,阅读、数学和科学三个领域的分数一般设OECD国家学生的平均分为500,标准差为100,各个国家以此为标准得出相对的分数。表4呈现了PISA2012上海学生平均成绩及排名。二是量表难度等级,即学生精熟度水平,难度等级越高代表精熟度水平越高,PISA三个学科的等级划分稍有不同,基本上从水平1到水平6共有六个等级。

表4 PISA2012上海学生评价成绩及排名

NAEQ对学生学业水平进行等级划分,划分为水平1到水平4共四个水平段,同时辅以具体描述。因难以从公共数据库获得NAEQ报告,故无法得知详细内容。

3.2 测评结果的反馈与政策调整

PISA在测试后的第二年公开发布国际报告。如《面向明日世界的学习:国际学生评估项目PI⁃SA2012报告》、《PISA2012技术报告》等。这些报告都是公开的,均可以在OECD的官方网站下载和相关权威媒体获得。

当PISA测评结果公布之后,各参与国都清楚地知道本国的结果以及与其他国家的对比情况。2001年PISA评估结果公布后,德国作为参与测试的国家,其学生在三个学科的测试分数都低于OECD的平均值,与芬兰、挪威、英国等欧洲其他国家相距甚远。该报告使得德国政府开始实施教育改革,制度一系列政策,如统一教育标准,设定最低要求;加强学前教育,提早入学年龄;增加教育投入,调整优先教育投资等[9]。

NAEQ测评结果反馈采取了“个别反馈、分级报告、互不交叉”的方式,国家级报告根据测评发现问题的归口,分期、分批向相关负责部门呈送政策咨询报告和简报,成为中央和教育部制定教育政策的重要参考[10]。如,2012年11月,监测中心向教育部呈报了关于《部分地区农村小学没有英语教师、不开英语课,学生英语学习质量地域差异悬殊》的报告。教育部督导办就该问题约谈了相关省份的负责人。同时,根据监测结果发现的各地学生英语学习条件、资源差异巨大,农村学生处于不利境地的状况,监测中心向教育部提出了“改革英语教学评价制度,降低中考英语所占的分值比例,确保教育公平”、“改革英语课程方案,减少义务教育阶段英语课程内容,降低学习难度”等建议。教育部予以高度重视,并在后续的中、高考制度改革充分考虑了这些问题和建议。

通过对比可发现,对于教育政策的调整,PISA参与国是自发的,自下而上的;而NAEQ参与省、县是被动的,自上而下的。但两者的共同之处都是基于科学的证据作出适切的教育决策改进与调整。

4 PISA对NAEQ的启示

NAEQ是结合国情而开发的具有本土特色的教育测评项目,NEAQ也在不断学习和吸收PISA的先进经验,取得了一定的成绩。PISA浓缩了国际上多个领域的集体智慧,具有先进的测评理念、严密的测评程序、科学的测评方法和精密的测评工具,是世界上著名的国际教育测评项目,对我国的基础教育质量测评无疑是重要的参考与借鉴。PISA对NAEQ的启示主要有以下四个方面:

4.1 树立促进学生终身发展、全面发展的价值取向

价值取向问题是一切问题的根本。国际上越来越多的教育评价项目不是甄别学习者成绩的优劣,而是尊重个体差异,帮助学生挖掘与提高各项能力,PISA主要测评学生多大程度上掌握和适应未来社会发展所需的终身学习能力。NAEQ的开展为的是改革我国现有的功利性、及时性、显性的价值取向,代之以促进学生终身发展、个性发展的价值取向。实际上,NAEQ对我国基础教育改革与发展具有直接的导向和引领作用,是基础教育发展的“风向标”。《国家中长期教育改革和发展规划纲要(2010—2020年)》指出,应该“把促进学生健康发展作为学校一切工作的出发点和落脚点”。为此,必须确实树立以“人的全面发展和适应社会发展需要”作为基础教育质量监测的根本价值取向,避免“唯分数论”[11]。

4.2 建立测评结果报告的公开反馈机制

PISA的测评结果报告是面向公众公开的,其官方网站以及权威媒体都有相关的报道和公告,参与测评的国家(地区)可以清楚地知道本国(地区)的测评结果以及在国际上的排名;该报告还可以供研究人员做研究之用。美国联邦政府教育部为了充分利用PISA测试的研究成果以促进美国的教育改革,教育部请OECD站在第三方的立场上,编撰可供美国学习的国际经验。为此,PISA专家专门为美国编撰了《优秀的表现者与有力的改革者:PISA给美国的教训》[12]。而NAEQ并非如此,监测中心的官方网站并没有任何测评结果报告。NAEQ是通过个别反馈、分级报告的形式向相关负责部门反馈政策咨询报告和简报。尽管截至2015年4月,监测中心累计提供了600余份省、县报告,但是这些报告仅呈送测评省、县教育行政部门,如此,作为参与测评的省、市(县)仅仅知道自己的测评结果以及在所有样本中的排位,无法和其他参与测评的具体单位进行横向比较。NAEQ既然已申明不是高利害考试,减弱甄别和选拔功能,那么这种不公开、不透明的保密行为无疑剥夺了公众的知情权和参与权,因此建立测评结果报告的公开反馈机制对提高监测中心的权威性与公信度有极大的作用,也只有如此,才能保障该项目的有生命力地持续发展下去。

4.3 建立对教育问题的快速反应机制

PISA测试结果在参加国(地区)的公众、媒体与政府中产生较大的影响,尤其是对于成绩排位较后或者下滑的国家(地区)来说,关键是要建立对教育问题的快速反应机制。如,俄罗斯在PISA2000中学生成绩处于中等偏下的位置。意识到教育质量的下滑以及教育问题的出现,俄罗斯快速制定并出台了一系列教育标准[13]。2001年12月,出台了《2010年前俄罗斯实现教育现代化的构想》,提出了保证基础教育质量的国家社会机制,负责检查和监督教材质量,同时提出了建立独立于教育行政部门的国家教育质量评估体系。次年,又相继出台了《普通基础教育国家教育标准(草案)》和《普通教育国家标准的联邦成分(草案)》等。鉴于此,对教育问题的快速反应机制同样适用于NAEQ。通过测评结果反馈的教育问题,有针对性地制定适切的教育政策,解决问题,以评促改,提高教育质量。

4.4 逐步采用现代化的计算机测试方式

PISA为适应信息时代发展的需求,自从2015年开始摒弃纸笔测试,全面采用计算机测试的方式进行测评。NAEQ2015采用的是纸笔测试和现场测试相结合的方式,而且应该在未来的几年也是沿用这种方式。从国际大型教育评价项目发展趋势来看,计算机测试将是未来教育质量测评的发展方向。NAEQ测试后的测试卷要严格由专人保密,并邮递寄回监测中心,这个过程耗费很多人力、物力和财力。通过计算机测评可以缩短整体测评时间,提高效率,同时还可以测评学生基于计算机的问题解决能力。当然,这对样本校在计算机配置、机房、数据提交与收集等计算机考试技术提出一定的要求。

综上所述,我们要客观地分析PISA和NAEQ的优势与不足,取PISA之精华,立足于我国本土实际,积极探索适合我国义务教育健康发展和不断跨越的大规模教育质量监测体系。

[1]辛涛,李峰,李凌艳.基础教育质量监测的国际比较[J].北京师范大学学报(社会科学版),2007(6):8.

[2]宋乃庆.我国义务教育质量监测的“四个创新”[EB/OL]http:// www.moe.gov.cn/jyb_xwfb/xw_fbh/moe_2069/xwfbh_2015n/xwfb_ 150415/150415_sfcl/201504/t20150415_187153.html,2015,7,5.

[3]梅松竹.美国NAEP与我国NAEQ之比较研究[J].天津师范大学学报(基础教育版),2013(14):60.

[4]陆璟.PISA2009上海实施报告[J].教育发展研究,2009(24):74.

[5]教育部门户网.我国义务教育质量监测进展情况[EB/OL].http:// www.moe.edu.cn/publicfiles/business/htmlfiles/moe/s8677/201504/ 185889.html,2015-7-5.

[6]李勇.基础教育质量监测的特点及实施建议[J].教育测量与评价,2014(11):18.

[7]陆璟.PISA测评的理论和实践[M].上海:华东师范大学出版社,2013,6.

[8]教育部基础教育质量监测中心门户网站.2015年国家义务教育质量监测测试顺利完成[EB/OL].http://www.eachina.org.cn/eac/ dcdt/ff8080814cf569e6014e43cf649e026b.htm,2015-7-1.

[9]孔祥娟.PISA对构建我国基础教育质量监测体系的启示[J].教育测量与评价(理论版),2009(7):35.

[10]董奇.基础教育质量监测体系 体现中国特色和创新[N].光明日报,2012-10-15.

[11]范涌峰,廖其发.基础教育质量监测:国际经验与本土路向[J].教育导刊,2013(4):40.

[12]张民选,等.专业视野中的PISA[J].教育研究,2011(6):9.

[13]李伟涛.基于PISA测试结果的教育政策调整分析[J].教育发展研究,2012(4):45.

Comparative Research between Chinese NAEQ and US PISA

ZHAN Chunqing

In the knowledge economy times,with the strengthening of education exchanges and competition between countries all over the world and the focus of education output assessment,many countries have carried out both domestic and international education quality evaluation in basic education.The paper introduces the National Assessment of Educational Quality(NAEQ)and the Programme for International Student Assessment(PISA),by Comparing similarities and differences between the two among the establishment,implementation and results report of projects,draws inspirations from PISA to NAEQ.It is first to set up the value for promoting students’lifelong and all-round development;secondly to establish the public feedback mechanism of the evaluation results;thirdly to set up a rapid response mechanism to the problems of education,lastly to gradually adopt modern computer test way,in order to cause reflection to large-scale education assessment and evaluation for our country.

NAEQ;PISA;Comparative Research;Education Assessment;Mechanism

G405

A

1005-8427(2016)03-0058-7

本文系国家教育体制改革领导小组研究项目“研提OECD组织PISA测试项目经验启示”的研究成果之一。

詹春青,女,广东省教育研究院基础教育研究室,助理研究员(广州 510035)

猜你喜欢

报告测试质量
“质量”知识巩固
质量守恒定律考什么
幽默大测试
做梦导致睡眠质量差吗
“摄问”测试
“摄问”测试
“摄问”测试
一图看懂十九大报告
报告
质量投诉超六成