APP下载

美国本科教育学习有效评价量规的源起、特点及启发

2021-08-06高若彬

文教资料 2021年11期

高若彬

摘   要: 学生学习成果直接反映了高等教育的本质,美国高等教育质量评估历经发展逐渐向专业化迈进。由美国大学与学院联合会(AAC&U)牵头开发的本科教育学习有效评价量规在评估理念上凸显教师直接参与、坚持学生主体地位,在评估内容上关注广泛学习成果,在评估过程中强调严谨性与专业性,在评估结果上实现共享及有效利用。为我国本科教育的学习成果评估带来的启发有:坚持学生主体地位与教师直接参与、注重非认知成果的发展、促进评估的科学性与专业性、重视评估载体的价值作用及平衡使用形成性与终结性评估结果。

关键词: 美国本科教育   学生学习成果評估   评价量规

评估已经成为监控与保障高等教育质量的主要手段,学生的学习成果评估直接反映学生的学习状况,显现高等教育教学质量的本质。二十世纪八十年代学习成果评估在美国兴起,历经发展逐渐走向专业化。随着美国各个高校评估工作的不断推进,本科学生学习成果评估的手段和方法日渐多样化,由美国大学与学院联合会(AAC&U)牵头开发的本科教育学习有效评价量规(Valid Assessment of Learning in Undergraduate Education Rubrics,以下简称评价量规)因其与普通的标准化测试相比更能真实地反映本科学生学习成果,逐渐成为近十年美国本科学生学习成果评估的主要工具。本文将讨论评价量规的源起与发展,从评估理念、评估内容、评估过程和评估结果分析其特点,以为我国本科生学习成果评估提供些许启示。

一、源起与发展

美国高校学生学习成果评估已走过百余年,历史演进大致可以分为五个阶段:口试、论文等早期综合考核;标准化考试源起;通识教育和研究生教育评估;测试机构快速发展和大学内部学习评估改革;回应外部问责[1](112-121)。十九世纪末二十世纪初标准化测试兴起,标志着学生学习成果评估步入近代实证科学的轨道。作为一种直接性的评估范式,标准化测试可以直接测量学生的认知性学习成果,对测量特定领域和范围的知识具有较高的效度,因此一直在本科生学习成果评估中扮演着重要的角色。但大规模的标准化测试因局限性而受到质疑:大多测试结果只呈现学生的表现分数或量化的结果,没有涉及分数形成的过程;其次,标准化测试不适合考察一些重要且复杂的技能,如批判性和创造性思维、沟通协作能力、终身学习能力等,不能反映学习成果的复杂性。另外,一些标准化测试脱离了实际课程,使得教师参与度不高[2](59-70)。自二十世纪八十年代起,美国高等学校公信力逐渐下降,社会问责之声此起彼伏,迫于社会和公众压力,美国各州高校相继投身“评估运动”,学生学习成果评估在挑战中走向专业化,评估方式多样化。

2007年,美国大学与学院联合会(AAC&U)牵头开发了“本科教育学习有效评价项目”(Valid Assessment of Learning in Undergraduate Education,以下简称VALUE),旨在不依赖现有标准化测试和材料的情况下评估本科学生学习成果方面的表现。2009年,VALUE作为标准化测试这一主流教育评估范式的替代方案首次被推出。十余年间,美国许多高校和州际组织相继加入合作阵营,2011年AAC&U与州高等教育行政官员协会(SHEEO)开始寻求多州合作,2013年多州合作组织(MSC)正式开展评估工作;2014年明尼苏达州合作组织和五大湖学院联合会(GLCA)相继加入;2014年—2017年为VALUE的评分试点年、评分规范年和评分优化年,通过收集参与院校和机构的学生作业样本获取本科学生学习成果的相关数据作为评估标准和评估方法不断改进的依据;2017年AAC&U发布的VALUE全国性调查对这三年的评估结果做了广泛探讨[3]。

2017年,美国国家学习成果评估中心(NILOA)对全美大学学习成果评估展开了第三次大规模调查。调查结果显示,各院校倾向于更多地使用真实性的评估手段和方法。在大学层面平均使用4种评估方法,其中最常见的是国家学生调查(76%)、量规(71%)、课堂效果评估(64%)和顶点调查(61%)[4]。通过与前两次(2009年、2013年)大学层面选定使用的评估方法比较发现,各机构根据自身需求调整了评估方法,国家学生调查仍是最突出的机构级评估方法,但量规(rubrics)的使用继续增加。2019年AAC&U105周年年会上回顾了VALUE的十年发展,其中指出,截至2018年,VALUE评估标准已经被5900个组织和个人下载超过6.1万次,其中包括2188所高校与学院[5](116-128)。时至今日,评价量规已成为美国和国际上广泛引用和使用的校园评估形式。

二、评价量规的特点

量规的英文表达为”rubric”,源于古罗马时代的”rubrica”,意为木匠在切割木头时做标记用的“红土线”;中世纪时这个词在宗教的特殊日期有特殊含义,日历上圣人的日子、宴会日等神圣的日子都是由僧侣用红墨水手写的,称之为“红字日”,因此也有红字标题之意[6]。近年来,教育背景下“rubric”与教育评估联系在一起,并延续了上述两种定义的内在精神,如本文所探讨的评价量规(VALUE rubrics),不仅是一种评估工具和方法,更是教学和学习的行动指南,具有衡量功能和指导作用。评估理念、内容、过程和结果的利用具有如下特征:

1.评估理念:凸显教师直接参与,坚持学生主体地位。

AAC&U认为之前的学习成果评估存在障碍的根源在于教育者对学生学习期望问题讨论过少,没有制定一致的评估标准,只有通过共同讨论,不断修订和完善统一的评估标准,才能克服评估障碍[7](2-23)。2007年评价量规项目开发团队召集了来自各个高校和机构的教师专家和其他教育专业人员共同制定学习成果的评估标准——教师首先参与评估工具,即评估标准的制定。被评估的作业产品作为评估的载体,不再代表高等教育的“投入”,而是“产出”,可以看作评估的直接证据。这些作业产品不是学生随意的自我报告或机械的练习,而是经过教师专家的精心设计——教师又参与评估载体的设计。对这些作业产品进行评分的评分员亦是接受过培训的专业教师,最终的评分结果会反馈给教师作为改进教学的重要依据,教师参与了评估过程和评估结果使用的环节。

评价量规突出教师的直接参与不代表教师在学习成果评估的中心位置,促进所有本科学生的学习和发展是最终目的,以学生为主体是评价量规的核心理念。评价量规以“为了所有学生成功”为主题,在国家层面将所有本科生的学习定位在一个基本的期望框架内,以在全美范围内共享评估的直接证据。在学生进入课堂之前,评价量规的测量标准便已向学生公开,学生依据成果目标努力完成课堂中最积极、最出色的作业产品以供评分,但学习的过程从来都是一个不完美的过程,当学生提交一份“不完美”的作业后,他们在这个过程中了解自身的学习状况,并将其与目前或未来的学习联系起来,参照公开的测量标准和基础与教师和同龄人一起努力改進,评价量规的表现水平阐明了从学习的一阶期望(如记忆和描述)到学习的二阶期望(如综合和评价)过程中的进步和发展轨迹,能更好地了解学生的知识和技能的发展程度,注重学习成果的“增值”。这个增值可以看作个人发展的增值,也可以看作教育质量的增值。

2.评估内容:关注广泛学习成果。

学生学习成果从不同角度有不同的分类,如尤厄尔(Ewell Peter)认为学习成果的内容包括认知、技能和情感[8]。美国教育评价标准联合委员会(Joint Committee on Standards for Educational Evaluation)认为,“学生学习成果是对学生特定学习的期望,即学生在特定的学习、发展及表现等方面将会获得的各种结果,通常包括认知、技能、态度与价值观及个体行为”;AAC&U指出,二十一世纪的大学生应获得的基本学习成果包括:人类文化、物质和自然世界方面的知识、心智技能和实践技能、个人和社会责任、整合性学习能力[9]。学生学习成果是一个不断发展的概念,内容具有复杂性和多维度性,但都反映了学生在接受和参与特定的经历后,社会期望学生学到的和学生实际所学到的东西,其中被广泛接受的是将学生学习成果分为认知性成果与非认知性成果。

有学者在对国际上颇具影响力的学习成果评估工具进行机制分析时发现,绝大多数评估工具都指向认知性学习成果的评估,且关注认知性学习成果多是直接性评估,最典型的当属标准化测试[10](39-44)。评价量规的目标在于实现所有学生在工作、公民和生活中获得成功所需的关键技能,由此设定了16项基本学习成果的评估标准:公民参与、创造性思维、批判性思维、伦理推理、全球学习、信息素养、探究和分析、综合学习、文化知识和能力、终身学习、口头交流、问题解决能力、量化素养、阅读能力、团队协作和书面交流,其中每一项评估准则都涉及学习成果五到六个关键标准或维度[11]。此外,这16项学习成果与系统层面的要求具有连贯性和一致性,是以自由教育和美国承诺(LEAP)的基本学习成果(ELOs)为基础选择的,与学历资格框架(DQP)保持一致[12],并且与通识教育的三大主题即知识和实践技能、个人和社会责任、综合与应用学习相吻合,应用范围广泛[12]。评价量规将所有本科生的学习定位在一个基本的期望框架内,指向的不仅是口头和书面交流、跨文化知识和技能等基本知识和技能,还有二十一世纪公民必备的责任素养及批判性和创造性思维、量化素养等复杂技能,综合关注认知性和非认知性两方面成果。最主要的是各高校可根据自身情况将这些评估标准细化成每门学科甚至每门课程的语言,进行二次开发。

3.评估过程:强调严谨性与专业性。

运用测量等方法获取学生学习成果信息、强调评估过程和评估的持续性是二十一世纪美国学生学习成果评估的显著特征[9]。评价量规综合运用了定量和定性相结合的方法,在评估过程中十分严谨。涵盖三个要素,一是描述学生学习成果的评估标准,学生学习成果将根据这些标准进行评分,二是根据实际课程中教师设计的作业生成的代表学生学习成果的作业产品,三是被培训为评分员的教师使用专业判断、评估标准的维度和学生的表现水平对学习成果的评分。

评估标准的每一项学习成果都涉及五到六个关键标准或维度,每个维度均有四个评分等级。评分员评分时从左到右也就是从最高等级进行每一评分等级标准的阅读,根据学生的实际情况分别给予4、3、2、1分值,任何不符合最低参照的样本会被给予0分。其中每一个评分标准之间具有逻辑顺序却并非等距,这样的有序数据可以更好地用中介、频率分布和条形图描述。这也是评价量规评估数据的独特性,即由定性过程产生的评估数据,其输出可用于定量、统计说明。学生通过课程和辅修课程完成的实际工作是学生学习的最好体现[6]。与常规的标准化测试不同,评价量规从未脱离课程,而是从实际课程和教师那里直接获取证据评估学习,证明学生取得了特定的学习成果,开创了一个新的领域:将学生学习成绩的评估建立在学生实际工作基础上,这些工作是根据学生参加的任何机构的正式教学和课程中的作业产生的[6]。课程作业可以是论文、报告、小组合作项目或者社区工作等,这些成果并不等同于传统意义上依附于课本的机械练习,而是经过精心设计、呈现直接证据的作业,具有可测量性。评价量规项目实施的试点年就收到了参与合作院校提供的7000多份不同学科的作业以展示学生的学习成果,示范年收到了48所院校的8000多份作业样本,优化年在评估提交的作业样本外还关注了教师评分员的具体学科[3]。由于作为评分员的教师来自不同的学科,在评分之前这些教师将参加等量校准培训,以明确评分规范并探索学生真实作业中体现的评价标准维度,熟悉预评学习成果的内容,在评价过程中采用双重评分原则,评价者要对学生学习成果的质量评定达成高度一致。

4.评估结果:共享及有效利用评估结果。

对于本科生学习成果评估结果的使用,其他评价工具主要体现在两方面:形成性评估与终结性评估。形成性评估指向将评估结果作为后续持续改进的行动指南,各院校可根据评价结果对教育质量进行改进与完善。终结性评估指向为相关管理部门提供决策依据,为社会问责机制提供数据,更多的与一些权威机构相联系[10]。评价量规是唯一将形成性评估和终结性评估相结合的评价工具,评估的目的不是简单地收集大量数据,而是将评估数据作为可靠和可操作的评估证据,最后的评估结果会进行定量和定性的综合分析,将数据以一种可视化的结果反馈给各方,以供学生、教师、项目、机构、州和联盟使用。

评价量规带来的评价结果实现了收集数据—分析数据—共享数据—使用数据—反馈结果—制订计划的有效良性循环评估活动,这些评估数据结果为地方、州和联邦决策者的决策提供了相关信息,促使其有效地集中采取行动,真正提高了大学内部的教学和学习质量。评估结果对教师的教和学生的学习进行了科学有效的指引,大多数本科生学习成果评估工具并不公开或共享测量的基本标准和结果,而评价量规强调共同期望和学习维度的透明性,学生事先明晰评价量规的标准要求,并规划和规范自身的学习状况;教师在对学生的学习成果进行评价时更明确学生的学习状况,进行针对性的指导和帮助,最后双方根据可视化的评估分数对教与学进行提升。由此来看,评价量规既可以作为一个评价工具,又可以创造性地被看作一种教学工具,或者说学习与教学的行动指南。

三、相关的启发

1.坚持学生的主体地位和教师的直接参与。

学生学习应该成为高校一切教育教学活动的焦点,要形成以学习者为中心的培养和评估范式。清晰的学习成果能够帮助学生了解自身需要努力的方向,学生进入大学之后就应明确评估内容,从而有目的、有计划地规划大学生涯。学生在课程、专业等层面的学习成果的反馈主要来自教师在教学过程中的持续观察、收集和评价,教师在对学生学习成果进行评价时应十分熟悉评价标准和维度,以便给出客观公正的评价结果。但目前我国高等教育质量保障的共同弊端是将学生的学习成果评价从教学中剥离出来,缺少与教学的互动,也看不到教师在学生学习结果评价中的身影[13](62-73)。教师应是高校开展学生学习成果评估活动和实现评估目标最主要的力量,在评估工具的开发、评估实施的过程和评估结果的使用上应多听从教师的建議和反馈,使教师参与整个评估工作。

2.注重非认知性成果的发展。

二十一世纪教育体系的核心目标已从传授知识和技能转向培养有能力面对全球化社会要求和挑战的终身学习者。学生的非认知能力不仅仅反映了学习能力,还代表了重要的社会能力,这些能力对本科生成为一名合格且有竞争力的二十一世纪公民有着至关重要的影响。评价量规关注的评估内容涉及广泛,是近年来被各院校广泛使用的重要原因。我国本科教育对学生的知识、技能的评估相对来说较为成熟,但在传统学习成果评估中,学生的情感、态度和价值观是被忽视的。我国本科教育已经进入普及化阶段,学生学习成果评估概念上的差异并不会对评估实践的最终指向产生影响,但对学习成果的内部认识尤其是对非认知性成果的重视是高等质量教育提高的重要因素[14](27-37,114-115)。本科生学习成果评估应全面地关注学生在接受本科教育之后认知性水平与非认知性水平等方面的发展和变化,尤其是一些复杂技能及态度与价值观等方面的提升。

3.促进评估的科学性与专业性。

评价量规的评估理念、内容和过程凸显专业化与科学化,是一种提高高等教育质量的高影响力实践。目前我国高校学生学习成果评估存在评估工具标准化、本土化和多样化不够、评估方法过于依赖定量评估、大多院校评估难以维持等问题[13](62-73)。科学专业的评价标准和评估工具是促进学生学习的手段前提,我国高校可以先尝试引进国外比较先进的评估工具,吸取先进经验,最终回到具有中国特色的评估工具开发上。而后针对我国本科教育的特点,以共有的学习期望为出发点建立体现国家教育意志的评价标准,评价标准应满足不同类型和不同等级高校的个性化差异,可供不同层级的院校、不同专业乃至课堂的多次开发。评估工作推进时要重视专业评估人员的培养和定期培训,为学习成果的评估提供人才支撑。学生学习成果是经由一定过程得以发展的,是量变不断累积再到质变的过程,因此要着重强调评估过程及评估的持续性,重视学生的学习经历和学习成果质量,并且鼓励全员参与评估,使学生学习成果获得更广泛、深刻的关注。

4.重视评估载体的价值作用。

评估载体的设计与选择会影响整个评估过程。评价量规将经过精心设计的课程作业直接嵌入教学中,学生的学习成果通过作业交给教师,教师依据评估标准和作业质量做出判断,并向学生提供反馈,这样评估便更直接地与持续改进的学习联系起来,促进教师在评估中直接参与,使教与学紧密联系,直接反映学生的真正成就。课程作业作为评价量规的载体与其他方式相比,更能促进教师的参与度,将评估从管理工作转移至教学层面,增加评估结果应用于改进学习的机会,同时践行凸显教师直接参与、坚持学生主体地位的评估理念。课程作业在我国本科教育中是评价学生学习成果的重要参考,但存在作业教育价值尚未被充分认识、作业偏离课程、缺乏有效的反馈机制、作业抄袭现象普遍的问题 [15](71-76)。课程作业并不是教育教学的补充环节,而是不可或缺的一部分,对展示学生的能力具有重要性,是学生与老师之间的一种对话工具,是一种关键有效的评估载体。我国高校在对本科生学习成果进行评估时要重视课程作业的价值意蕴,评估载体的选择要注重与课程的相关性,不应脱离实际课程,注重规范化程度,最大限度地发挥教育价值。

5.平衡使用形成性与终结性评估结果。

本科生学习成果评估是实现高等教育质量提高的新视角。我国高等教育质量保障在用于改善提高的形成性信息和用于对比决策的终结性信息之间存在文化冲突[15](71-76)。其实是内部问责机制和外部问责机制之间张力的问题[16](21-24)。形成性评估通常是质性的,以评估实践为基础,有利于改善高校内部质量,提高教师的教和学生的学的质量;终结性评价通常是标准化的,以量化的指标回应外部的问责。对评估结果的使用如果偏颇过程会使得高等教育质量保障过于细小,对理解高校对学生、社会之作用的整体价值不大。但如果偏颇结果而不重视过程,只希望用简单、明了的数据检验本科生在校期间的成果,往往就会对评价对象本身关注得太少,模糊高校建设意义,以外部评估结果的表象取代高校内部发展的本质。我国高校评估本科生学习成果时要对形成性信息和终结性信息加以平衡。本科生学习成果评估既要回归学生学习或者人才培养本身,促进大学内部质量改善和提高,又要从长远谋划,为学生学习成果的外部监督提供直接证据,为日后评估工作开展赢得进一步支持,为教育部门和高校相关政策、计划的制订提供战略性依据,为各类专业认证的开展提供切实参考。

参考文献:

[1]黄海涛.美国高校“学生学习成果评估”的历史演进[J].外国教育研究,2013,40(07).

[2]Rhodes T L. VALUE: Valid Assessment of Learning in Undergraduate Education[J]. New Directions for Institutional Research, 2008, 2008(S1).

[3]Kathryne Drezek McConnell & Terrel L Rhodes. On Solid Ground, Value Report 2017[EB/OL].[2017-12-01]https://www.aacu.org/On Solid Ground VALUE.

[4]National Institute of Learning Outcomes Assessment. Assessment that Matters: Trending toward Practices that Document Authentic Student Learning[EB/OL].[2018].https://www.learningoutcomesassessment.org/wp-content/uploads/2019 /02/2018SurveyReport.pdf.

[5]李晓虹,朴雪涛.聚焦直接证据的美国本科学生学习成果评估——以美国大学联合会“VALUE项目”为例[J].外国教育研究,2019,46(09).

[6]Association of American Colleges & Universities: A Decade of VALUE[EB/OL].[2018].https://www.aacu.org/peerreview/2018/Fall.

[7]Ross Miller. Assessment Tools for Generation Education Outcomes[J]. Association of American Colleges and Universities, 2008.

[8]Ewell P T. Accreditation and Student Learning Outcomes: A Proposed Point of Departure[J]. CHEA Occasional Paper,2001.

[9]黄海涛. 学生学习成果评估: 美国高等教育质量研究[M].北京:教育科学出版社,2014.11.

[10]吕林海.国际视野下的本科生学习结果评估——对“评估什么”和“如何评估”的分析与思考[J].比较教育研究,2012,34(01).

[11]Association of American Colleges & Universities:VALUE Rubrics[EB/OL].[2009]. https://www.aacu.org/value-rubrics.

[12]Association of American Colleges & Universities:Degree Qualifications Profile[EB/OL].[2014]. https://www.aacu.org/sites/default/files/files/quality_collaboratives/DQP2.0-draft.pdf.

[13]王小青,王九民.中国大学生学业成就评估研究:二十年的回顾(1998—2017年)[J].苏州大学学报(教育科学版),2018,6(03).

[14]王兴宇.美国高校学生学习成果评估的价值转向[J].高教发展与评估,2019,35(05).

[15]王志霞,叶信治.美国大学作业的特点及其对我国大学改進作业的启示[J].比较教育研究,2015,37(06).

[16]夏欢欢,钟秉林.大学生学习结果评价:高等教育质量保障的新视角[J].中国高等教育,2018(12).

2020年湖南大学研究生思想政治工作研究课题“全日制硕士研究生导学关系调查研究”(课题编号:YSZS202001)。