APP下载

我国表现性评价研究20年:问题与反思

2021-02-10安富海管起燕

关键词:表现性研究者聚类

安富海,管起燕

(杭州师范大学 教师发展研究中心,浙江 杭州 311121)

表现性评价(Performance Assessment,又称为“表现性评定”,台湾地区学者大多将其译为“实作评量”)是在尽量合乎真实的情境中,运用评分规则对学生完成复杂任务的过程表现与结果做出判断的一种评价方式。[1]这种评价方式突破了以二元对错为标准的纸笔测验的弊端,更加关注学生学习过程中的多元化学习表现和差异化理解水平。在教学中正确运用表现性评价能够关注到学生思维的发展程度和内在的情感倾向,推动学生高阶思维发展,提升学生学习的自信心和内在动力。

自20世纪80年代,美国学者斯蒂金斯(Stiggins,R.)和威金斯(Wiggins,G.)提出并致力于表现性评价的理论研究与实践探索以来,其理论价值和实践意义受到政策制定者的关注和理论研究者的重视,理论研究成果不断丰富、实践探索范围不断扩大。20世纪90年代,我国学者开始介绍表现性评价的理念与方法。[2]随着第八次课程改革的实施和推进,表现性评价在我国基础教育理论研究者的倡导下,逐渐进入我国基础教育学生发展评价实践场域,对改进我国基础教育学生发展评价产生了重要影响。近年来,表现性评价在评价目标、评价内容、评价方式等方面,尤其是与学科结合的过程中遭遇到很多困难。本研究拟运用CiteSpace知识可视化软件分析我国表现性评价的已有研究成果,明晰发展现状,揭示研究内容及存在问题,以期能为改进表现性评价、促进学生全面发展提供参考。

一、研究设计

(一)数据来源

本研究以中国知网(CNKI)数据库为数据来源,以“表现性评价”“表现性评定”“实作评量”为主题词进行检索,检索时间为2021年7月,收集到1998—2021年期间相关文献(符合条件的最早文献出现在1998年)。在剔除重复文献、会议报告及与主题相关度不高文献后,最终得到有效文献1163篇,其中期刊947篇、硕博士学位论文216篇。

(二)研究工具

本研究采用CiteSpace软件5.8.R1版本绘制我国表现性评价研究的知识图谱。CiteSpace软件是陈超美教授于2004年开发的一款信息可视化软件工具,能够绘制出某个知识领域在特定时期发展变化的知识图谱。知识图谱以知识域为对象,能可视化地呈现某一知识领域的发展进程与结构,并显示出某一知识单元或知识群之间隐含的各种复杂关系。[3]本研究利用该软件绘制表现性评价研究文献的知识图谱,通过动态与静态、质性与量化的分析,科学揭示了表现性评价的研究内容、存在问题及发展趋势。

(三)数据处理

本研究将所筛选的1163篇有效文献按照Refworks格式保存为文本文件,利用CiteSpace自带的数据转换器对该文本进行数据转换,最后导入到CiteSpace5.8.R1中生成知识图谱。CiteSpace的参数设置为:时间段设置1998~2021,时间切片(Years Per Slice)设置1年,节点类型(Node Types)设置“关键词”(Keyword),裁剪方法设置“Pruning Merged Netword”,其余条件默认,最终生成我国表现性评价研究的知识图谱。

二、我国表现性评价研究的热点分析

关键词是论文核心词。本研究利用CiteSpace对表现性评价研究进行关键词共现分析,通过对相似关键词进行合并、剔除,最终得到知识图谱1,该图谱由696个节点、865个连线组成。其中,节点表示具体关键词,圆环表示关键词出现频次,圆环外侧的紫红色则表示该关键词的中心性程度。如图1所示,整个关键词共现网络连线较为密集且分支较多,但次级节点并不突出,在一定程度上可以说明我国关于表现性评价的研究还不够聚焦,研究深度亟待加强。

图1 表现性评价关键词共现的知识图谱

经过CiteSpace处理分析发现,关键词节点大小与该关键词出现的频次成正相关;关键词字体大小与该关键词的中心性成正相关。关键词节点的中心性≥0.10,说明该关键词较为重要。研究运用CiteSpace软件“Export”选项中的“Net WorkSummary Table”功能得出相关数据,并统计出频次高于5,中心性高于0.10的关键词,在剔除主题关键词后,得到高频词和高中心性关键词列表(表1)。通过系统梳理图1和表1中的关键词、频次和中心性,并结合二次文献分析可知,“核心素养”“发展性评价”“形成性评价”“任务设计”“表现性评定”等关键词体现了1998年以来我国表现性评价研究的热点问题。

表1 高频词和高中心性关键词列表(中心性≥0.10)

为深入了解我国表现性评价的研究热点及知识分布,本研究采用对数似自然率算法(Likelihood Rate,简称LLR)对关键词进行聚类分析,得到模块值Q=0.8562>0.3,平均轮廓值S=0.9878>0.7,说明该聚类划分出的社团结构显著,聚类结果令人信服。去除3个基本关键词聚类,并选取该类中LLR算子取值最高的关键词作为聚类标签,最终得到11个核心聚类(图2)。按照对数似自然率算法对聚类信息进行排序、整理,得到表现性评价关键词聚类信息表(表2)。结合图2、表2和二次文献梳理,将11个核心聚类进一步归纳为表现性评价的演进历程研究、表现性评价的概念研究、表现性评价的设计研究以及表现性评价在课堂教学中的应用研究四个方面。具体分析如下:

图2 表现性评价关键词聚类标签视图

表2 表现性评价关键词聚类信息表

(一)表现性评价的演进历程研究——3个聚类

我国表现性评价研究主要是伴随着第八次基础教育课程改革的进行和学生发展核心素养的提出而发展的。2001年教育部印发的《基础教育课程改革纲要》明确提出要“改变课程评价过分强调甄别与选拔的功能,发挥评价促进学生发展、教师提高和改进教学实践的功能”。表现性评价开始受到教育界的关注,许多理论研究者和实践工作者也开始呼吁用表现性评价评估学生发展状况。#9纸笔测验聚类下提取出的纸笔测验、科学探究能力、师生互动等特征词是学者们基于课程改革的理念和基础教育的实践问题对传统标准化测验方式的反思批判。有学者认为表现性评价是在人们普遍对传统的标准化测验不满的背景下提出的。[4]与注重死记硬背和快速得出结果的传统纸笔测验相比,表现性评价鼓励学生自主探究,更加关注学生学习成长的过程以及内在能力的提升。研究表明,在课堂教学中应用表现性评价,通过让学生自主探究并学会清楚表述探究的过程与结果,能够客观评价并促进学生的科学探究能力。[5]2014年教育部印发的《关于全面深化课程改革落实立德树人根本任务的意见》中明确提出“将组织研究提出各学段学生发展核心素养体系,明确学生应具备的适应终身发展和社会发展需要的必备品格和关键能力”。#3核心素养聚类下提取出的核心素养、深度学习、项目式学习和#7学生核心素养聚类下提取出的学生核心素养、科学探究、实践活动等特征词都体现了核心素养时代学者们对学生未来学习与生活所需的必备品格与关键能力的关注和探索。有学者在研究美国新罕布什尔州学生发展评价案例的基础上,指出表现性评价更适合检测高水平、复杂的思维能力,能很好地体现核心素养所描绘的学习结果,并能够促进这些能力的获得。[6]有学者从核心素养的视角出发,探究了表现性评价对培养学生学习力的价值。[7]有学者探讨了表现性评价与深度学习、项目式学习等理念与实践之间复杂关系,提出将表现性评价的目标、表现任务和评分规则融入初中数学课堂的深度学习中,能够促使学生深度学习的发生。[8]另外,有研究者证明,表现性评价的实施过程与结果体现着核心素养导向的质量观,并能在教学中引领学生核心素养的发展。[9]随着中共中央和国务院关于《深化新时代教育评价改革总体方案》的发布,表现性评价的理论研究不断走向深入,实践探索的范围也在不断扩大。

(二)表现性评价的概念研究——2个聚类

在基础教育评价改革中,与表现性评价同时涌现的还有发展性评价、档案袋评价、真实性评价等概念。虽然这些评价名称不同,却经常被默认有同样的含义与用法。#2教学评价聚类下提取出的形成性评价、发展性评价以及#5档案袋评价聚类下提取出的档案袋评价、过程性评价、真实性评价等特征词便体现出这一现象。通过进一步阅读这两个聚类下的子文献发现,许多研究者在研究和运用表现性评价问题时存在概念混淆的问题。人们对这些评价概念的混用,模糊了它们的本质与内涵,也无法准确把握它们在实践过程中的适用范围。为此,有学者从幼儿教育的角度出发,对表现性评价与其他相关评价概念进行了辨析,指出表现性评价与发展性评价在终极目的、功能取向以及对学生学习过程与结果的重视度上基本一致,但发展性评价注重多种评价方法的综合运用,表现性评价则更重视学生真实的行为表现。[10] 有学者辨析“表现”的含义,梳理了表现性评价与真实性评价之间的关系。[11]有学者对表现性评价与发展性评价、真实性评价、形成性评价、档案袋评价等相关概念的联系与区别进行了深入研究,揭示了表现性评价的具体可操作性、真实情境的可创设性、学习过程的价值性以及学生成长的记录性等特征。[2]

(三)表现性评价的设计研究——3个聚类

评价目标、表现性任务和评分规则是表现性评价的三个核心要素,其中表现性任务和评分规则的开发是表现性评价设计研究的主要内容。首先,#6逆向设计聚类下提取出的逆向设计、评价目标等特征词是表现性评价整体设计研究的重要内容。表现性评价遵循“目标—评价—教学”的逆向设计思路,其最大特征就是在学生学习之前确定学习的内容和评价的方法。这样的过程能够让学生明白努力的方向、当前所处的位置以及为达成目标需要付出的努力等。其次,#13表现性任务聚类下提取出的表现性任务、小学数学、数学教学等特征词是研究表现性任务设计研究的重要内容。表现性任务的设计是实施表现性评价的关键,必须遵循价值取向、表述简明和难度适当的原则。学科教学表现性任务的设计更要聚焦生活现实、注重思维交互性以及学生的个性发展。最后,#4评价标准聚类下的评价标准、评价量表等特征词是表现性评价评分规则设计研究的重要内容。提供给学生的表现性评价需要一个评价的标准,且应在评价开始之前制定出来。[12]这个用以判断结果和表现的评价标准就是表现性评价中的评分规则,它清晰地界定了达到某个特定标准的学生处于何种水平。一份优秀的评分规则应该具备详略得当的评价内容、清晰明确的评价指标、具体可操作的实用性以及较高的可信度。[13]虽然与表现性评价设计研究相关的文献几乎都强调了评价标准的完善和公正,但如何制定完善公正的评价标准、完善公正的评判依据从何而来、对评估者又有何特殊要求等重要内容涉及不多,研究不深入。

(四)表现性评价的应用研究——3个聚类

表现性评价关注学生学习过程,其应用研究主要涉及两个方面:一是应用于学科教学评价。#10写作教学聚类下提取出的写作教学、作文评价、写作能力等指标词是表现性评价应用于写作教学的重要体现。英语写作对中国学习者来说是一件较为困难的事,教师对英语写作的批改也缺乏具体指导。研究证明学生参与课堂活动的表现性评价,如小组讨论和同级评改能帮助学生解决写作过程中遇到的困难和问题,并有效地消除教师疑惑。[14]#11课堂教学聚类下提取出小学语文、初中数学等指标词是应用表现性评价培养学生口语交际能力,提升学生的学科素养,改善教学中出现的问题,实现以评促教的例证。二是应用于实验教学评价。实验教学强调学习方法、关注操作过程。#12实验教学聚类下提取出的实验教学、应用策略、实验考核等特征词是表现性评价应用于实验教学的重要体现。实验作为表现性任务的一种重要形式,是让学生独立制定、实施计划,并解释实验调查结果的过程。在物理[15]、生物、化学、地理等涉及实验教学的学科中应用表现性评价能够较为全面、真实地考察学生的手脑协作能力,较为准确地评判学生学习过程和学习结果。[16]

三、我国表现性评价研究存在的问题及趋势

(一)研究队伍方面: 组建复合型研究团队,加强合作研究

教育教学评价领域诸多问题的解决,需要加强理论研究者和一线教师的通力合作,这种团队不仅能改进和解决教育教学评价中的实践问题,而且能在改进和问题解决的基础上形成理论建构。[17]合作是研究领域创新与发展的巨大动力。本研究利用CiteSpace5.8.R1软件对表现性评价领域的作者发文量和研究机构进行共现分析发现,关于表现性评价的研究队伍存在以下几方面问题:一是该领域专业研究团队较少,学者之间学术交流不足。虽然近年来关于变现性评价的研究成果逐年增加,但持续研究该问题的学者较少,关于该问题的讨论、争鸣也明显不足,致使表现性评价的概念长期处在混用状态。二是理论研究者与一线教师合作研究的成果比较匮乏。二次文献阅读发现,大多数研究成果都是理论研究者自己设计并自己深入教学场域观察后形成的研究成果,一线教师介入研究的数量相对较少。许多理论研究者研究的问题不是来源教育教学实践的“真问题”,而是自己“想象的问题”。三是理论研究者关注的问题与一线教师的实践困惑不匹配。现状调查发现,理论研究者关注的表现性评价的问题和一线教师在教育教学评价实践中遭遇的表现性评价的问题不匹配。也就是说,一线教师关于表现性评价运用中存在的困惑得不到理论研究者的科学指导。如表现性评价、形成性评价、发展性评价之间的区别与联系是什么,每种评价方式在教育教学实践中如何操作等问题至今仍然困扰着一线教师。鉴于此,关于表现性评价的研究,需要加强团队合作研究。一是要加强高等学校专业研究队伍和地方教研队伍的合作。高校专业研究者和地方教研员合作能够更好地从理论上理清表现性评价的概念、主体、内容、方式、原则、运用范围及限度等问题。二是要加强理论研究者和一线教师的合作研究。高校专业研究者和地方教研员在深入教育教学一线了解教师关于表现性评价运用存在的困惑和问题的基础上,和一线教师一道探索改进和科学运用表现性评价的方法。只有组建理论与实践相融合的复合型研究团队才能在改进和解决表现性评价的实践问题的基础上建构适合本土学生发展实际的表现性评价理论。

(二)研究内容方面:加强表现性评价标准研究

表现性评价主要是通过观察学生在真实情景或模拟真实情景中完成实际任务过程中所表现的态度、情绪、情感、意志、知识、能力等来评价学生的发展状况。实质上是通过观察“所做的”来评价和判断“能做的”。[18](P.38)从已有的研究成果来看,学者们就表现性评价某一方面的研究较多,从整体建构表现性评价体系的研究成果相对较少。缺乏系统的研究,表现性评价进入学校教学实践时就会出现许多问题:其一,表现性任务与评价方式不匹配。调查发现,一些教师设计的学习任务属于表现性任务,但评价主要依赖于纸笔测验。虽然纸笔测验也能考量部分表现性学习成果,然而,如果过分依赖纸笔测验,就会出现“新瓶装旧酒”现象,表现性评价也就失去了其存在的价值;其二,表现性评价评分规则不清晰,致使老师无法正确运用表现性评价。文献研究发现,大多数理论研究者主要从理论层面论述了表现性评价的价值、内涵、原理、设计思路及注意事项等问题,对表现性评价的评分规则关注不够,研究不深入,致使一线教师在具体的教育教学中无法正确运用表现性评价。因此,在表现性评价的研究内容方面,应该加强表现性评价标准研究。一是要依据学习任务构建表现性评价标准。标准对行为具有很强的引导作用。标准的设定本质上是一种分析行为,需要不断反思和回答“什么是好的表现”。只有理论研究者与一线教师深入合作,不断基于教育教学实践追问该问题并将其分解成可以观测的学习行为,才能制定符合学生发展规律和表现性评价要求的评价标准。二是要引导教师科学运用评价标准。调查发现,许多教师虽然很认同表现性评价之于学生发展的重要价值,但对于如何在教育教学实践中正确运用表现性评价,显得非常困惑。因此,亟待合作研究团队深入教育教学一线根据学生学习过程中的具体表现,引导教师科学运用表现性评价标准。

(三)研究方法方面:重视质性研究方法在表现性评价研究中的运用

从表现性评价研究的演进历程来看,当前我国表现性评价研究正在逐渐从概念界定、内涵研讨、实践启示、优缺点辨析等理论研究向任务设计、模型构建、课堂应用等实证研究转化,注重标准化测量和数据的收集,强调研究的客观性和普适性,取得了许多有价值的研究成果。然而,从研究方法角度来看,我国表现性评价的研究存在“测量”过度,“判断”不足的问题。许多研究非常重视用标准化工具测量和收集学生的表现性数据,并借助信息技术使学生表现性数据的测量和收集显得更加“准确”。然而,测量只能测量到“能够测量”的表现。一篇高质量的论文、一个有价值的历史研究项目、一项拓展性科学研究课题等,不可能通过标准化测量准确判断学生在这些学习任务中的表现。事实上,学生的许多表现无法用标准化的工具准确测量。一定程度上可以说,标准化测量得到的学生表现的数据恰恰掩盖了学生表现中最主要的行为。表现性评价的特征决定了其实施过程更多地需要人工参与,当然也会更加耗费时间。犹如驾驶证考试中的“路考”,需要一个训练有素的考官坐在副驾驶位置上,通过很长时间的不断观察,反复考核才能判断其合格与否。由于表现性评价是一种更偏向质性的评价方法,因此,关于表现性评价的研究应该重视质性方法的运用。具体来说,可以从以下两方面入手:一是要通过讨论让研究者认识到质性研究之于表现性评价研究的重要性,并引导研究者正确运用质性方法研究表现性评价;二是要充分利用人工智能、大数据等可视化和自画像技术收集表现性评价的过程性材料;三是重视表现性评价研究中研究者的现场参与。总之,只有重视质性研究方法的运用,才能对表现性评价的问题做出更加准确、全面的判断。

猜你喜欢

表现性研究者聚类
浅谈音乐课堂中的表现性教学提升策略
中国当代表现性水墨人物画的特色与发展
基于K-means聚类的车-地无线通信场强研究
数感的表现性评价维度与评价任务的开发
用水痘病毒开发新型HIV疫苗
浅谈中国画的表现性
研究者称,经CRISPR技术编辑过的双胞胎已出生。科学将如何回应?
研究者调查数据统计
基于高斯混合聚类的阵列干涉SAR三维成像
年轻瘦人糖尿病增多