等待PISA
2016-09-22林鹿珊
文_林鹿珊
等待PISA
文_林鹿珊
【编者按】
从2000年至今,国际学生能力评估计划(PISA)已顺利举行了6次测试,公布了5次测试结果。最新的PISA2015结果将在今年12月向公众揭晓。作为目前世界上最具影响力的国际学生学习评价项目之一,PISA的每轮测试结果都会为各个参与国及地区提供引发它们兴趣的宝贵数据。名列榜首的国家和地区自然会吸引各方前来探秘。
经济合作与发展组织和世界银行,长期联合其他组织机构一道致力维护和发展PISA,欲使其成为衡量有效教育的标尺之一。相关的政策制定者和人员也不断地思索着如何更富成效地运用PISA为我们揭示的一切。
国际学生能力评估计划(PISA)是一个由经济合作与发展组织(OECD)筹划的学习水平的测试计划,目前是世界上最具影响力的国际学生学习评价项目之一。每轮PISA评估结果出炉,各大新闻标题就会相继涌现出“最新PISA调查显示某国居于首位”“某国糟糕的学术水平”“某国学生得分低于国际平均分”等等。如果你读到一篇新闻报道讲的是和其他国家的学生相比,某一国家的学生在阅读、数学和科学上排名很高或表现很差,那么这篇报道多半是OECD发布的有关此次测评的结果。
自1997年始,OECD就开始筹建PISA项目。该项目要求OECD成员国在一个国际公认的框架下,依据学生获得的成绩,监控教育系统的成果,借以了解各国推动教育的状况,反映出该国学生在阅读素养、数学素养与科学素养上的能力。
PISA的评估对象为即将完成基础教育的十五岁学生,检测他们对于未来生活中可能面对的问题情境所具备的解题能力,并针对他们已习得的必备知识、技能和素养的程度进行多方面的评估。之所以选择十五岁这一年龄段的学生作为测试对象,原因在于这个年龄段的学生,大多正处于完成义务教育的阶段;因此,这一阶段的评估还可以及时与近十年的教育成果和资料比较。
值得注意的是,在PISA的各国报告中,学生的社会经济背景及性别差异也会作为重要的研究变项,这样不仅有助于学生的表现,还有益于研究教育机会均等的相关议题。同时,学生的表现差异、校际差异、以及其他社会文化资产指标等,都是重要的研究变项。这些变项之间的关联强度,也是论述的重要依据。
按照OECD的要求,每个国家须随机选出至少五千名学生为样本。在考试过程中,每个学生会做一套由选择题和作答题组成的试卷。在能力测试结束后,每个学生还需要填写个人背景的问卷,其中涉及学习习惯、动机、家庭。同时,校方也要填写一份问卷,描述学生的构成、经费来源等。
PISA每三年举行一次,第一次调查是在2000年,共有43国(地区)参与;第二次调查是在2003年,参与国家数为41国;第三次调查于2006年举行,共有57国(地区)参加;第四次调查于2009年举行,共有65国(地区)参与;第五次调查于2012年举行,共有67国(地区)参与;第六次调查于2015年举行,共有65个国家(地区)参与。2015年的测评结果将在2016年12月份公布。
PISA的评估内容一般涉及三个主要领域的素养程度,分别是数学素养、科学素养以及阅读素养。科学素养的内涵包括(1)解读科学数据及举证科学证据的能力:能以多样的表现方式分析及评估科学数据、主张和论点,并做出适当的结论;(2)评估及设计科学探究的能力:能描述、评估科学研究,并提出方法来回答科学问题;(3)解释科学现象的能力:能够充分运用所了解的科学概念和知识,对自然界发生的现象加以解释。
数学素养包含有四大概念:数量、空间与形状、改变与关系、不确定性。学生需要掌握的技能是数学语言的理解、建模、解题、假设执行。其中,题目的内容结合了全球变暖、温室效应、人口增长、海洋污染、酸雨、运动常识等话题,与学生们的生活化的课题都是可涵盖的范围。
阅读素养同样结合了生活中的各种情境。由于题材取自生活中广泛的文字信息,文本形式随即也相当多元,如散文、叙事、论述、广告、故事寓言、报告表单等等。评估的重点则在于对文本信息的获取、阐发、解释、反思,以及评价文本的内容、形式与特色。
每次的评估会从数学、科学及阅读三者中选定一个科目作为当年主题,着重评估。截至目前为止,PISA总共完成了五次针对不同主题的世界性调查: 2000年、2009年(以阅读素养为主轴);2003年、2012年(以数学素养为主轴);2006年(以科学素养为主轴)。因此,2015年的PISA评量的学科领域以科学素养为主,阅读素养与数学素养为辅。
在2015年的PISA中,所有科目(科学、阅读、数学、金融素养)首次推行机考测验。同时,也有部分国家和经济体选择笔试。本轮测试的一个关注点还在于解决合作式问题的能力,它关心的是学生在问题解决中与同伴的沟通对话。问题解决的四个阶段包括了探索与理解、表达与形成、计划与执行,以及监控与反思。此时,同学间的沟通对话则包含三个面向:建构与保持共同的理解、采取适当的行动来解决问题,以及建立和维护团队组织。
自项目实行以来,PISA对素养的评估与传统的学校考试内容及方式有着明显的不同。一般学校的测验会比较着重知识的记忆,而PISA的素养评估,则较注重理解、应用、与问题解决等能力。PISA的另外一个特色就是生活化和情境化。题目呈现的方式必定和日常生活有关,而且详细说明试题的情境,让学生在作答时将思考与情境相联系,考察学生进入社会必须具备的能力。
以PISA2006科学题“衣服”为例,题目源自1998年8月10日的《澳大利亚日报》。题目内容围绕“互动布料制造美丽时装”表明:一组英国科学家正在研制“智能”衣服,以帮助残疾儿童“说话”。这些儿童穿上由特殊电子布料连接上语言合成器所制成的背心,只要轻拍接触感应器式的材料,就能让人明白他们的意思。紧接着,题目内容详述了这种材料的构成和工作机理。
那么,该题的第一问就是:文章中所说的情况,哪一样可以在实验室里通过科学探究来测试?请就每项圈出“是”或者“否”。这种材料,是/否可以在实验室通过科学探究来测试?是/否可以用水清洗而不会损坏?是/否可以包裹物件而不会损坏?是/否可以揉成一团而不会损坏?是/否可以廉价大量生产?
本题要求学生识别并检验某种有关衣服的说法和相联系的变量。而“智能衣服”的议题属于“科学技术前沿”类别,也是一个表达残疾儿童需要的公共议题。
PISA会在每一次的结果报告中显示各国教育系统的比较指标,以及15岁学生在阅读、数学与科学素养上的连续性统计数据。数据分析会显示出:(1)各国学生教育水平的概况;(2)本次调查得到的技能水平与人口学、社会经济等教育变项的相关性;(3)调查的结果与趋势和生源、学校等背景变量的关联性。
PISA研究报告的受惠群体极广。教育研究者、教育政策制定者、教育工作者,以及家长和学生都可以从中挖掘参考价值。而一国(地区)的教育也是各个不同群体的努力所汇集成的结果。比如,从家庭着眼,家长的管教方式、对子女课业的关注与介入程度、家中经济资源的分配、家长对子女健康的重视程度等因素都会影响孩子的教育程度。从学校着眼,学校的经营理念、资金资源、师资招募、学校设备等也是影响因素。而所有因素的聚合就会进而影响一国(地区)的教育水平。
PISA项目试图为人们了解教育问题与现况提供一个稳定的参考点。参与PISA长期计划的国家能够获得并积累相当丰富的数据和资料。进一步分析与比较这些资料之后,参与国还可以准确地知道本国学生知识与技能的变化情形,了解不同的学生群体在数学素养、科学素养和阅读素养三方面上的发展情况。
这些调查结果可以为教育相关单位提供制定相关政策的参考和依据,因为一个人的未来竞争力乃至一个国家的未来竞争力都与阅读、数学、科学这三方面的能力息息相关。于是人们争先恐后地希望从这个测试结果中获得有助益的经验。
PISA项目从2000年启动起来,芬兰在前期测试结果中的连冠成绩令人瞩目。2010年,芬兰教育部和文化部国际流动与合作中心负责人帕斯·萨尔博格出版了《芬兰经验:世界能向芬兰学习什么》一书,试图向人们揭示芬兰教育的奥秘。
其后,上海蝉联两届(2009年和2012年)冠军的结果又引发全世界探究“上海的秘密”。今年5月17日在上海开幕的“公平与卓越:全球基础教育发展论坛”上,世界银行发布了一份最新报告,名为《上海是如何做的:排名世界第一的教育系统带来的启示及经验教训》。这份报告由任职于世界银行的梁晓燕博士团队与上海师范大学国际与比较教育研究院张民选教授团队在过去两年时间里合作完成。
长达181页的英文报告《上海是如何做的》记录并分析了上海基础教育领域的主要政策;提供了关于这些政策在学校执行情况的实证资料;探讨了这些政策及其执行如何影响学生学习成绩。其中,报告突出了“吸引优质教师人才,建立优质教师队伍”“为优质、公平教育融资”“平衡学校自主权和问责制”“构建有效的学生评价制度”“政策及其执行与学习效果挂钩”这五方面调查情况。报告的结尾还提出了供上海考虑的政策事项。
与此同时,也有超过80名学者联名致信PISA的总负责人安德鲁博士,基于测试体系本身的设计,表达PISA测试的结果会对世界范围内的教育系统带来不良影响。英国卫报于2014 年5月7日刊登了这封包含10项担忧的联名信。在信中,担忧的内容涉及PISA依赖的量化研究、测试周期等等。
然而,跨越国家(地区)之间的比较既不容易,也不完善。眼下,人们可以通过评估看到教育活动中哪些是可能实现的,这将有助于各国政府看到他国地区的教育体系,探寻新的教育机会;这将有助于这些政府发现自己所处的位置,制定有效的政策,或者通过相互合作,来共同提高学习成果。
目前,随着加入PISA的国家日益增多,国际学生评估项目的设计以及实施模式不得不为成功适应众多且多元化的国家不断改进,尤其是希望加入评估的中等收入国家和低收入国家。
为应对这些挑战,OECD和世界银行最近发布了一份报告,名为《中等收入国家参与PISA2000-2015评估的经验》。这份基于40多个PISA参与国情况的报告,为人们提供了有价值的经验与思考。构建出一个有力的基础理论依据。这不仅能够提升PISA的评估效能,使之与各国(地区)教育更有效地对接,也为世界银行和其他机构帮助各国参与这些测验,有效分析和使用数据提供了新思路。
该报告显示,虽然中等收入国家对加入PISA的需求不断增加,但它们面临着财政上和技术上的双重难题,比如翻译并使用评估试卷、分析学生的反馈。报告还表明这些国家的政治环境和文化背景也会影响评估是否能够进行或者如何进行。
为了使中等收入国家参与PISA评估的收获达到最大值,该报告建议OECD应该:(1)调整PISA的测试工具,用以更好地评价成绩两极之间的差异;(2)修改背景问卷,使之与低收入国家的背景与政策相关;(3)通过PISA参与度评价中等收入国家组织国际评估的能力;(4)通过与捐赠合作与能力培训应对参与国的财政和技术问题。
由以上行动构成的“PISA发展计划”已经开始实施,并计划于今年在七个发展中国家进行试验。“PISA发展计划”的成果将于2018年发布,到时将为参与国的政策制定者提供诊断教育系统缺陷的新证据。其中,“PISA发展计划”的相关国家会在与世界其他PISA参与国的对等交流中获益。增强的PISA评价工具将在2021的评估中用于所有国家。
故事《阿拉丁神灯》中,主人公阿拉丁发现了一盏神奇的灯。一摩擦神灯,灯神就会显身满足阿拉丁的一个愿望。等待三年一轮的PISA,如果人们希望灯神走出神灯,助力国际教育评估,我们应该像阿拉丁一样,明智地选择我们的愿望。