大规模有组织教育评价的运行机制分析
2022-06-01袁晶
摘 要:开展大规模有组织教育评价是促进教育发展、提高教育质量的重要途径,而我国目前相关的理论研究和实践案例相对较少。文章通过分析PISA的形成与发展、指标的更新与完善,分析PISA的运行机制,发现PISA具有从人力资本理论出发建立观测维度、基于现代化标准构建评价指标体系、呈现国际教育质量评价结果与参考标准等程序与步骤。我国可加强现有大规模教育评价研究平台与资源的整合、提升大规模教育评价的科学性和规范性、坚持中国特色的大规模教育评价价值理念、促进现代信息技术与大规模教育评价的紧密融合。
关键词:大规模 有组织 教育评价 运行机制 PISA
中共中央、国务院印发的《深化新时代教育评价改革总体方案》提出:“系统推进教育评价改革。坚持科学有效,改进结果评价,强化过程评价,探索增值评价,健全综合评价。”进入新时代,在推进教育高质量发展与建设高质量教育体系的背景下,提高教育评价的科学性、专业性、客观性尤为重要。在过去的半个世纪,国外关于大规模有组织的教育评价不断发展。以国际学生评估项目(PISA)为例,其开展20多年来,对参与国家和地区产生重要影响。PISA发起的原因主要是发达国家对基础教育质量的反思以及应对知识社会、信息社会和经济全球化带来新挑战的需要。[1]后来经过经济合作与发展组织(OECD)的大力支持与推动,PISA在世界范围内得到广泛的认同与支持,其为全球基础教育发展作出重要贡献,也可为我国开展大规模有组织教育评价提供借鉴。
一、大规模有组织教育评价要义
克隆巴赫在20世纪60年代提出:“评价是一个搜集和报告对课程研制有指导意义的信息的过程”。[2]我国学者认为,教育评价是依据社会的需要对教育活动的“社会价值”进行判断的活动。[3]从本质上来说,评价是一种价值判断的活动,是对客体满足主体需要程度的判断。教育评价是对教育活动满足社会与个体需要的程度做出判断的活动,是对教育活动现实的或潜在的价值做出判断,以期达到教育价值增值的过程。例如,评价教师的工作就是对教师是否对社会作出了贡献、做出多大贡献的一个价值判断,教师评价的目的是进一步促进教学和教育质量的提高,使教师的工作产生更大的价值。[4]在教育评价的各种界定中,美国学者格朗兰德在1971年提出的表述十分值得注意。格朗兰德认为,评价可以简单地用下列公式表述:评价=测量(量的记述)或非测量(质的记述)+价值判断。[5]即评价是在量(或质)的记述的基础上进行价值判断的活动。
相对于国家内某一区域或某一学校的教育评价而言,本文探讨的大规模有组织评价的覆盖范围更广、样本数量更大,是在官方组织或第三方机构的领导协调下开展的教育评价。自20世纪90年代开始,国际教育成就评价协会(IEA)、OECD等国际组织开始实施大规模有组织国际教育评价。国际组织开展的大规模教育评价往往致力于服务政府的教育决策、绩效问责,推动区域教育治理,创设“全球教育政策空间”。[6]随着国际大规模有组织教育评价的开展,也有部分学者对其持批评意见,认为其误导教育者将可测量的教育结果当成教育目的,以国际大规模教育评价结果为指挥棒所定义的“好教育”其实并非真正的好教育。[7]
二、PISA的发展历程
20世纪90年代以后,在全球开展大规模有组织教育评价受到越来越多发达国家的关注与研究。OECD、世界银行、联合国教科文组织等国际组织开始关注全球教育评价与基础教育的国别比较研究。
(一)产生与发展
PISA于1995年首次提出,OECD成员国希望能够通过大规模有组织的教育评价,及时掌握关于各國基础教育阶段学生在技能学习、日常表现、知识掌握等方面的可靠一手调查资料和数据。PISA应用信息化教育测量手段对相关国家和地区基础教育阶段学生的数学、阅读、科学的学习情况进行测评,采用调查问卷对学生学业情况组织大规模的评价,并以此为依据对参评国家的基础教育发展水平进行排名,得出相应的结论,进行国际比较。[8]OECD开展PISA主要是对基础教育阶段高年级学生的知识掌握和解决问题能力等方面进行系统评估,以此评价学生在阶段性学习之后各方面能力的提升情况。因此,PISA不只是对学生掌握阶段性知识程度的评估,还是综合学生多项学习能力的过程性评价。1997年底,OECD正式启动PISA,2000年在部分国家和地区进行了首轮测评,之后按照每三年一轮的频率在相关国家和地区开展测评。每轮测评的参评国家和地区从科学、阅读、数学三门学科中选择一门进行主要测评,另外两门作为次要测评。PISA在标准的制定、测评的方法、评估的理念等层面凸显出科学规范的价值内涵,在全球范围内得到广泛的认可。
2000年以来,PISA通过对不同国家和地区的学生在学习能力素养方面的表现和水平进行排名,呈现不同国家和地区的学生在科学、阅读、数学学科领域的学习发展水平。与此同时,OECD基于学生学习的背景情况,在与相关学生学业素养的指标之间构建统计模型,开展相关性分析。OECD还基于人力资本理论,通过分析教育投入与产出的相关性,判断国家和地区教育发展的总体水平及其在全球的竞争力,这种测评打破了传统的以理性思辨进行评价分析的方法,开创了以建立统计模型和开发监测指标为主要评价手段的实证主义评估。
(二)指标的更新与完善
教育评价工作是各国教育改革发展工作的重中之重,相关测评数据的分析可以支撑教育政策的制定、执行和完善。同时,指标体系的研发对于教育数据的监测至关重要,可通过量化的形式让决策者和研究者了解教育发展的现状。对于PISA而言,测评指标的更新和完善可为评估的科学性打下良好的基础,科学系统的评价指标体系可为教育部门和教育研究者研判教育发展状况、了解教育发展存在的问题和困境以及做出相应的决策提供支持与帮助。PISA1997年确定了采集成员国和地区学生数学、阅读、科学三个方面的指标数据。之后,PISA的价值内涵和目标也在变化,越来越关注评估教育与社会发展的关系以及学生适应现代社会发展所需能力,从而引领学生适应时代发展新变化带来的对于人的生活技能的新需求。例如,2015年增加对同伴协作解决问题能力的相关测试;2018年,为评估学生是否具有从不同视角看问题、理解跨文化背景下的不同思想并有效交流互动等方面的能力,增加了全球胜任力指标。近年来,PISA开始逐步关注学生微观层面能力的测评,如幸福感、对学校的归属感等。
三、PISA运行机制
面对新时代对人才培养的新要求和新挑战,加强对教育系统质量的实时、有效监控尤为重要[9],通过数据监测推动教育高质量发展受到各国教育关注。
基于舒尔茨的人力资本理论,OECD通过PISA对全球一些国家和地区的教育质量进行大规模评估,建构了评价标准和相关指标,为这些国家评估教育发展质量以及教育决策和政策制定提供支撑。
(一)从人力资本理论出发建立观测维度
有学者就OECD关于教育指标维度的建立进行了研究,认为OECD测评的理论基础是“人力资本理论”,也就是说其评估的逻辑起點在于将学生作为重要的人力资源。这种逻辑与价值观念关注教育对促进经济社会发展的贡献度。从教育与经济的关系来看,教育可以从三个方面促进经济增长。一是教育可以提高个体单位时间的劳动生产率,从而提升固有的人力资本,以此推动单位时间产出水平的快速增长。二是通过发展教育推动科技创新,以此推动经济发展的更新换代,通过教育研究促进生产技术的更新,同时带动知识的创新。三是教育可以促进文化知识的传递和传播,以此提升人们使用新产品的价值取向和不断增长的新需求,从而推动经济的快速增长。哈努谢克(Hanushe)等人运用PISA的相关数据,通过使用增长评估模型预测教育发展与经济增长之间的关系。[10]其研究表明,经济增长与教育质量的提升有明显正相关性。基于PISA结果可以发现,数学、科学等学科的指标测评对于经济发展有显著正相关性。
(二)基于现代化标准构建评价指标体系
PISA指标体系设计理念在于解决三个方面的问题:面对时代发展的新变局,年轻一代如何应对新的挑战与要求;在全球化背景下,年轻一代如何更加高效地沟通、理解与交流;面对知识爆炸和技术更新换代的加速,年轻一代是否具备终身学习和不断提升自我的能力和意识。通过预判学生面对未来社会发展所需应具备的核心素养,从而构建相应的指标体系,在此基础上通过运用现代测评工具和统计研究方法,对学生相关核心素养的达成度进行评估,进而发现影响学生核心素养养成的相关指标。PISA通过整体设计、科学论证、系统测评,严格控制测试的全过程误差,并提供数据支撑,从而达成评估目标,进而推动教育体制机制改革。
1. 指标体系构建的适切性
PISA在测评之前需要构建一套系统的评价指标体系,这套指标体系要充分考虑不同国家的经济、文化、教育发展水平的差异,具有更强的包容性和可推广性。世界各国在学制规定、学生入学年龄限制、教材编排等方面差异较大,PISA选取基础教育高年级阶段学生作为样本,运用科学的抽样方法,确保不同国家和地区采用统一的抽样标准。此外,PISA通常采用单参数项目反应理论(IRT)模型对采集的学生成绩进行分析,之后分别进行各个指标项的评分与计分,使用统一的评分标准对学生样本进行测评。这一整套规范化程序使PISA减少无效数据的采集,将测评结果误差降到最低。
2. 指标体系构建的导向性
PISA运行的关键步骤是把需要解决的教育问题通过指标进行量化,使其更易被观察和识别,以数据反映复杂教育现象。综合来看,PISA各项指标是依据学生、家长、学校等要素建立的。学生方面一般涉及个人基本信息、认知能力、学习动机、职业规划、自我效能感等;家长方面涉及学生家庭背景、家长对于学校教育的参与度、家校协同情况、家长对学生教育重视程度等;学校方面涵盖学校的基本办学条件、办学类型、教育资源丰富度、课程设置、班级管理等。例如,根据不同教育要素的具体类型,通过指标测试等方式进行数据采集,汇总研发出与学生相关的指标,如职业规划、学习兴趣、课堂参与度、内在动机、成就感、自我提升、社会认知、参与课外补习时间等指标,然后借助回归模型的建立,开展对各要素之间的相关性分析,综合评估各个国家和地区相关学龄段学生的表现。
3. 指标体系构建的规范性
在每轮测评研发指标之前,OECD会确定该年度测评重点,如数学素养、科学素养、阅读素养等,该素养的评估不仅涉及学科知识的掌握,还涉及学生掌握学习技能、推广应用知识的能力,以及逻辑推理、有效交流和解决各种复杂问题的能力。在此基础上,OECD设计每轮PISA测评的重点。例如,2009年PISA主要考查学生的阅读、科学、数学三方面核心素养,均强调学生对基本知识和相关技能的掌握程度。[11]
(三)呈现国际教育质量评价结果与参考标准
学界通常所讲的教育质量涉及日常教育实践活动的诸多要素,包括学校、教师、学生、课程设置、教学场所、教学手段、教育活动等。国际通用的教育质量界定标准有:一是教育的投人产出比,二是学生学业成绩,三是学习过程和结果。此外,随着参与PISA的国家和地区越来越多,PISA结果展现的学生在数学、科学、阅读等方面的素养达成度成为各国教育部门和研究机构衡量其教育发展水平和教育质量的重要参考依据。
四、启示
我国多个城市通过参加PISA在国际上崭露头角,基础教育得到国际社会的好评与认可。然而我国基础教育规模大、区域发展不均衡的问题依然存在。在建设高质量教育体系的背景下,开展大规模有组织的教育评价成为不可或缺的一环,以教育评价与数据监测推动教育质量提升,为教育体制机制改革和教育决策提供数据支撑与保障。PISA的发展历程和具体运行机制对我国开展相关教育评价和监测有以下启示。
(一)加强现有大规模教育评价研究平台与资源整合
我国重视教育质量监测与评估,已有多个基础教育质量评价监测平台。2006年教育部基础教育监测中心在上海市教育科学研究院揭牌。2007年教育部基础教育质量监测中心在北京师范大学揭牌。2012年中国基础教育质量监测协同创新中心成立。目前,国内大规模教育质量监测评估机构在评价目标、方法和理念上各有不同,这不利于更大规模有组织教育评价和协同评价的开展,可进一步整合有关平台和资源,使教育评价从松散型评价走向集约式发展。
(二)提升大规模教育评价的科学性和规范性
教育评价和测量以教育学、统计学、部分自然科学和实验科学为理论基础,涉及教育评价的目标、内容、方法、手段、数据统计分析、报告撰写等内容。分析PISA的运行机制可以看出,其整体测评包括要素设计、维度设定、指标研发、问卷调查、数据采集、统计分析等诸多科学规范环节。因此,我国开展大规模有组织教育评价也需要依托教育评价、教育统计、教育哲学等学科理论指导,开发符合国情和教育发展状况的指标体系。此外,加强理论支撑、坚持价值导向、设计科学维度、规范评价过程、深入分析结果也是提升大规模有组织教育评价效果和质量的核心要素。
(三)坚持中国特色的教育评价价值理念
各国际组织和国家开展教育评价和监测都有各自的价值诉求。教育评价是专业性和科学性较强的研究工作,在开展教育评价之前需要确立评价价值理念。我国开展教育评价须坚持中国特色社会主义道路,培养德智体美劳全面发展的社会主义建设者和接班人,不能照搬国际组织或发达国家开展大规模教育评价的价值理念,要根据中国教育发展的基本现状和人才培养的价值追求设计有中国特色的教育评价指标体系与监测机制。
(四)促进现代信息技术与大规模教育评价的紧密融合
随着信息通信技术和媒体移动终端的快速发展,越来越多的评价和监测活动开始依托现代信息技术。实现信息技术与测评活动的紧密融合已经成为当前大规模教育评价活动发展的趋势之一,也是促进大规模有组织教育评价更加高效和科学的保障。PISA依靠多种网络平台进行即时管理、开发专业化软件用于大规模抽样和数据采集分析、使用计算机进行各种测试和自动化评价报告生成等工作,这些环节大都以现代信息技术为重要支撑。现代信息技术可为我国开展大规模有组织的教育评价提供更多便利,支撑我国大规模有组织教育评价的发展。
参考文献:
[1]张民选,陆璟,占胜利,等. 专业视野中的PISA[J].教育研究,2011(6):3-10.
[2]CRONBACH L J. Course improvement through evaluation[M].Boston:Kluwer-Nijhoff,1983:101-135.
[3]陳玉琨,李如海.我国教育评价发展的世纪回顾与未来展望[J].华东师范大学学报(教育科学版),2000(1):6.
[4]陈玉琨.教育评价学[M].北京:人民教育出版社,2019:15.
[5]格朗兰德. 教育测量与评价[M].郑军,译.石家庄:河北教育出版社,1991:321-337.
[6]RUTKOWSKI L. Handbook of international large-scale assessment[M]. Taylor&Francis Group,2014: 32,58.
[7]Biesta G J J. Good education in an age of measurement:ethics,politics,democracy[M].Boulder:London Paradigm Publishers,2010:10.
[8]王蕾.基于大规模考试的教育质量评价[J].教育科学研究,2010(11):37.
[9]蒋德仁.国际学生评价(PISA)概说[M].杭州:浙江教育出版社,2012:1.
[10]HANUSHEK E A,WOESSMANN L. The knowledge capital of nations:education and the economics of growth[M]. Cambridge:MIT Press,2015:146.
[11]陆璟.PISA测评的理论和实践[M].上海:华东师范大学出版社,2013:13-15.
编辑 朱婷婷 校对 王亭亭
作者简介:袁晶,陕西科技大学教育学院讲师
基金项目:陕西省教育科学“十四五”规划2021年度青年项目“陕西教育高质量发展要素及指标体系研究”(编号:SGH21Q022)