TALIS 视频研究:课堂教学评价的新动向
2021-11-05朱福建
□朱福建
(杭州师范大学浙江省教育现代化研究与评价中心,浙江杭州 311121)
教育评价是教育工作的指挥棒,事关教育发展的方向。为克服“唯分数”“唯升学”等顽瘴痼疾,中共中央、国务院于2020年10月印发了《深化新时代教育评价改革总体方案》,提出要“改进结果评价、强化过程评价、探索增值评价、健全综合评价,充分利用信息技术,提高教育评价的科学性、专业性、客观性”。课堂教学评价是教育评价体系的重要一环,实施什么样的课堂教学评价体现了我们提倡什么样的课堂教学理念[1]。传统的课堂教学评价多以半结构化或非结构化的课堂现场观察、学生问卷调查或教师自陈式问卷调查等方式为主,存在较为严重的经验主义、理论偏离等倾向[2]和重宏观轻具体、重结论轻过程、重功利轻价值等问题[3]。
近年来,随着信息技术的发展,人们开始通过视频的方式来观察和评价课堂,比较有代表性的是国际教育成就评估协会(简称IEA)在“国际数学和科学趋势研究”(简称TIMSS)项目中实施的课堂视频研究和澳大利亚墨尔本大学国际课堂研究中心主持的“学习者视角的研究”(简称LPS)[4]。课堂教学视频研究为人们从多个角度测定和描述不同国家或地区的课堂教学特征及类型提供了路径。但已有的相关研究,都还存在评价框架偏主观、观测内容不聚焦、课堂教学视频数量少、缺乏系统的纵向设计等不足,难以在更大范围内更科学精准地对不同国家或地区的教师课堂教学进行比较和评价[5]。为弥补这些不足,经济合作与发展组织(简称OECD)于2016年在“教师教学国际调查”(简称TALIS)基础上,启动了TALIS 视频研究项目(后改为全球教学洞察项目)。该项目历时4 年,于2020 年底基本完成并发布了题为《全球教学洞察:一项教学视频研究》的报告。本文将对该项目的实施背景、主要特征、项目研究的意义与局限性进行全面介绍,并在此基础上阐述该项目研究对我国课堂教学评价改革的启示。
一、TALIS视频研究的实施背景
2000年以来,OECD通过实施国际学生评估项目(简称PISA)和TALIS项目,直接或间接收集学生核心素养与关键能力、教师专业发展与教学实践、学校领导与管理等方面的数据,为世界各国的教育改革与发展提供了宝贵的、可以相互比较的信息、经验和见解。但随着项目的实施,OECD 项目官员和各地参与者也越来越意识到,这些国际大型教育测评只是从表面上了解了高质量的教学是什么样的,以及哪些实践对学生的学习成绩有所影响,人们对于什么是有效的教学仍然知之甚少[6]。这是因为,PISA 虽然可以对学生的素养和能力进行测试,却难以对教师和决策者施行;而TALIS调查虽能反映教师和管理者的个人主观感受,但难以对宏观政策、学校质量和教师课堂实践等做出客观评量[7]。大量研究表明,教师课堂教学是影响学生成绩的最主要的因素之一,没有对课堂实践的深入理解,有效教学的内涵只能是狭义的[8]79。在这样的背景下,OECD尝试采用创新性的教育研究方式,对不同国家和地区教师的课堂教学过程进行直接观察和描述,力图在不断接近教学真相的过程中,打开教室的“黑箱”。
2016 年,OECD 委托由美国教育考试中心、美国兰德公司和德国国际教育学研究所组成的国际专家研究小组制订研究计划,并成功说服德国、墨西哥、智利、哥伦比亚、日本、英国英格兰、西班牙马德里和中国上海8个国家或地区参与该项研究。项目确定了“通过视频研究,了解不同国家教师的课堂样态,分析教师在课堂上的教学行为及其相互关系,找寻与学生的认知和非认知结果最密切相关的教学方法”的研究目标[9]。其基本的研究模式是,在每个国家选取85 位数学教师参加视频录像,大家都以“一元二次方程”为教学内容,每人授课2课时,所有教学活动都按共同技术标准录制,然后使用预先制定的课堂观察工具对每位教师的教学行为进行编码。为了从教师、学生等群体获得更多的信息,项目还采集了教师教材、教案、作业等相关教学资料,安排了视频录制前后的师生问卷调查和学生学习结果的前测与后测。
二、TALIS视频研究的主要特征
虽然TALIS 视频研究是OECD 发起的一项试点研究,但其项目理念和研究设计还是有很多的亮点,具体表现在以下四个方面。
(一)基于建构主义理论开发课堂观察工具
TALIS 视频研究项目没有事先制定课堂观察工具,而是充分发挥各参与国的主动性,先让每个国家提供本地关于“好课”的综述并逐步将其细化成课堂观察的指标,然后分2国一组、4国一组、整个大组三个阶段组织讨论,汇总、合并和删减指标,通过共同协商确定课堂观察的基本框架。在此基础上,通过对100个教学视频进行试点研究,对相关内容进行进一步提炼和完善,最终形成一个包含五个领域课堂观察框架(详见表1)[6]。为了对教师的教学行为进行更深层次的描述,TALIS视频研究项目又将每个领域细分为不同的模块和指标[9]。其中,模块属于高判断项目,指的是更复杂的活动,如处理干扰、鼓励学生承担风险、做出明确的数学总结和归纳、培养多视角/方法推理能力,以及启发学生思维。指标属于低判断项目,指的是更容易观察的活动,如花在完成任务上的时间、参与和讨论的机会、学习目标的明确性和技术的使用等。每个模块和指标都从发生频率和质量两个层面进行分级评价,以便研究者能够更精细地呈现所观察到的教学情况。
表1 TALIS 视频研究评分领域、模块和指标
(二)聚焦可比性选择课堂观察内容
作为一项国际比较研究,可比性是其重要的特征,也是其价值所在。每个国家的教师授课的内容、方式都不同,如何选择课堂观察内容就成为一个关键的问题。在这一方面,TALIS 视频研究项目受TMISS 项目的启发,首先将视角聚焦于教学内容相对一致的初中数学领域。然后,让每个参与国提供一份本地初中数学的课程图(Curricula Map),内容涉及教学主题、起始年级、课时数、难易程度、是否必修以及主题前后相关的知识等。通过对各国初中数学教学内容的对比分析,TALIS视频研究项目最终在统计、勾股定理、函数、方程四个共同模块中,选取一元二次方程这一单一的课程单元作为课堂观察的内容。之所以这样选择,是因为该单元不涉及特定民族文化、教学方法具有多样性、课时相对较短、授课年级相似(8~10 年级)且事先没有相关知识。此外,由于TALIS 视频研究项目重点关注的是教师的教学行为,而非教学内容,所以将课堂观察内容缩小到单一主题可以为了解教学过程和学生学习之间的关系提供更清晰的证据[9]。
(三)采用准实验研究法控制无关变量
TALIS 视频研究项目采用准实验研究法来探索教师教学行为和学生认知和非认知结果的关系。在研究设计上,它注重通过多种方式纵向收集教与学的信息,并注重对各种相关影响变量的控制(如图1)[8]83。在信息收集方面,TALIS视频研究项目不仅将师生课堂上的表现录下来,而且收集教案、视觉教具、讲义和课堂作业等相关材料,并通过课前和课后的测试来衡量学生的学习收获,通过课前和课后的问卷调查来了解教学的背景信息。在变量控制方面,TALIS 视频研究项目关注了教育系统、学校、教师和学生多个层面的变量。其中,教师层面的变量有教师的教育背景、教学经历、教学信念和动机、对学校环境和所选班级的看法等,学生层面的变量有学生的家庭背景、学习时间、对课堂活动的感知和参与、对学习数学的信心等。与此同时,TALIS视频研究项目还力图将其与TALIS 项目和PISA 项目建立联系,以便进行更加全面的比较分析。
图1 TALIS视频研究项目的纵向设计及流程
(四)以证据为依据实施课堂评估
为确保跨国研究项目的可比性,TALIS视频研究项目在课堂观察内容选择、信息收集规范和评价程序等方面都做出了标准化的界定,确保以系统和一致的方式记录各国教师的教学实践,减少操作误差。特别是在课堂评价阶段,TALIS 视频研究项目充分注重证据的作用,强调评分者在对教学视频进行评分时,要反复观看视频,努力寻找相关证据,并在课堂实录或评分表上做出标记。为确保信息收集的全面性,TALIS视频研究项目采用教学切片的形式进行评分。在对指标进行打分时,要求将整个视频切分成若干个8 分钟的教学片段进行评分;在对模块进行打分时,要求将整个视频切分成若干个16分钟的教学片段进行评分。与此同时,TALIS视频研究项目还对课堂观察框架中的每个指标和模块的内涵、具体案例、特殊情况及证据来源进行清晰界定,并对评分者进行严格的培训和考核,只有通过相应的考试才能获得评分的资格。
三、TALIS视频研究的意义及其局限性
毫无疑问,开展TALIS视频研究这样的大型跨国比较研究是非常有意义的。同时,由于其属于一项试点研究,虽然借鉴了TIMSS视频研究的经验并有意识地克服其研究的不足,但在实施过程中还或多或少存在一些不足。
(一)TALIS视频研究的意义
相比于TALIS 项目以问卷形式了解教师“说”了什么,TALIS视频研究更关注教师在真实的教学情境中“做”了什么。正如安娜·庞斯(Anna Pons)所说,OECD 通过PISA、TALIS 等项目询问了教师和学生在课堂上发生了什么,评估了学生的学习成绩和教师的知识,并收集了有关教师可支配的资源及其在组织课程方面自主权的信息,但这并不能为我们提供有关教学的外观以及它如何影响学生成绩的完整描述[9]。TALIS视频研究能在某种程度上打开课堂这个“黑箱”,让我们得以窥探各国教师的真实课堂状态,从而更好地了解本国的教学文化并与其他国家的教学文化进行比较,更好地了解那些普遍受欢迎的教学方法的实施过程,更好地理解教学实践和学生结果之间的关系,更好地理解背景因素(教师教育、学生构成、学校类型、教师协作和专业发展、评估和反馈实践等)对课堂教学过程和学生学习产生的影响,以及更好地理解TALIS 和PISA 等国际调查结果的有效性和政策相关性。
同时,TALIS视频研究的意义还在于其能够促进人们对课堂观察方法及有效课堂的深层次认识,并为各国政策制定者、研究人员和一线教师提供相互学习、研究和借鉴的平台。对政策制定者而言,视频研究可以让他们更深入地思考如何支持教师的教学;对研究人员而言,视频研究可以为他们提供新的方法来捕捉不同国家背景下的教学样态,并找到新的证据来审视替代教学措施的有效性和可靠性;对于一线教师而言,视频研究可以让他们了解其他国家同行的教学方式,并根据证据和经合组织全球视频库中的特色视频讨论教学方法。
(二)TALIS视频研究的局限性
当然,TALIS 视频研究也有其局限性,这种局限性主要表现在以下三个方面。
一是信息的全面性问题。尽管TALIS 视频研究强调纵向收集课前、课中和课后师生的各种信息,但是视频毕竟替代不了现场观察,它会遗漏现场观察的很多信息,比如师生近距离的表现、学生内隐性认知以及师生常态化的关系等。此外,由于技术和设备的原因,各国在课堂录制的时候也会产生一些问题,比如声音模糊、板书不清等。
二是评分的客观性。虽然TALIS 视频研究注重证据在评分中的作用,通过严格的培训和考核保障评分者一致性信度,但从课堂观察的框架来看,其中不乏主观判断的指标,部分的评分者由于其文化背景、经验及理解的差异,必然会造成评分不一致的现象。
三是价值的趋同性。TALIS 视频研究课堂观察框架的开发,虽然采取了建构主义的视角,注重利益相关群体的参与,但该项目最终还是由OECD主导的,其本质上渗透的是西方国家的课堂价值观,体现的还是OECD参与全球教育治理的野心和抱负。
四、TALIS视频研究对我国课堂教学评价的启示
当前,国内现有课堂教学评价的问题:要么直接以学生成绩作为评判的指标,违背了以评促改的初衷;要么通过学生评教问卷来进行,尽管关注到了学生的主体地位,但难以揭示真实的课堂教学状态;要么基于教师、学者自身经验和主观判断设计观察工具,缺乏理论支撑和实证检验,可靠性和有效性值得商榷[10]。而TALIS 视频研究恰恰克服了以上的问题,无论从评价的理念上,还是方法技术上,都能给我们提供参考借鉴。
(一)充分认识课堂教学评价的多维性
教学本质上是意蕴丰富的智慧实践,界定一堂“好课”的标准或教师教学技能的高低,不能仅凭学生的最终成绩或某几个人的主观感受来确定,而需要有更为开阔的视野。TALIS视频研究给我们最大的启发是,需要充分认识课堂教学的复杂性和多维性,要基于建构主义理论和扎根理论的方法,从多个角度梳理课堂评价指标并权衡其重要性。尤其要关注那些不会对学生成绩产生直接影响,但会对学生的学习兴趣、内驱力和自我效能感产生影响的“边缘性”维度(如师生对话质量、支持学生学习的课堂氛围等)[11]。如此,课堂教学评价才能做到有“魂”、有“根”。
(二)不断提升课堂教学评价的科学性
课堂教学评价是一项专业性很强的工作。当前,一线学校课堂教学的评价者多为区域教研员、学校校长或教研组长等管理人员,缺乏系统的理论指导,实施过程的科学性不足,难以保证信度和效度[12]。而TALIS 视频研究由美国教育考试中心、美国兰德公司和德国国际教育学研究所三家专业的教育评价机构主持,在评价指标的建构上充分关注到“国际通用话语”,在评价过程上采用了严谨的纵向研究设计方法,在评价结果的确定及报告的撰写上充分注重证据的支撑,这些技术手段和方法的运用,在一定程度上保证这项大型跨国评价研究的科学性。因此,我们对于课堂教学评价改革的过程,有必要积极推行这种纵向研究设计和循证评价的理念,要全面考虑各种影响评价结果的因素并加以控制,要处处体现用证据说话的理念,提高评价的准确性、针对性和说服力。
(三)增强课堂教学评价的国际视野
TALIS视频研究给我们的第三点启示是:要进一步开阔视野,积极参与国际课堂教学评价研究项目,通过国际比较的方法确定我们的课堂教学水平在国际上的坐标,并积极学习他国好的经验和做法。此外,在课堂教学评价的方法和技术上,也不能囿于本国已有的工具或TALIS视频这一个项目。事实上,国际上比较有影响力的课堂观察或评价模型有很多,例如美国学者罗伯特·皮安塔(Robert Pianta)和布里奇特·哈姆雷(Bridget Hamre)研制的课堂互动评估系统述评(简称CLASS);英国夏洛特·丹尼尔森(Charlotte Danielson)及其团队开发的教学框架(简称FfT);英国、美国等22 个国家和地区联合开发的国际教师观察与反馈系统(ISTOF)[12]。对这些评估工具的学习和借鉴,有助于增强课堂教学评价的国际视野,进一步提升评价的科学性。□◢