美国田纳西州教师评估模型TIGER的评介与启示
2024-06-07朱成武小鹏熊佳
朱成 武小鹏 熊佳
【作者简介】朱成,硕士研究生,研究方向为数学教育、教育测量与评价;武小鹏(通讯作者),教授,研究方向为教育测量与评价、数学课程与教学、课堂教学评价;熊佳,硕士研究生,研究方向为数学教育。
【基金项目】2022年度江苏省高校哲学社会科学研究一般项目“数学核心素养的测评研究”(2022SJYB0166)
【摘 要】教师评估是促进教师专业发展和提高学校教育质量的有效手段。美国田纳西州教师教学成长的有效性和结果模型(TIGER)是在增值评价的基础上,结合标准化评价而开发的,从学生成绩、学生进步和课堂观察等三个方面对教师进行评估。评估的目的是通过整合具有高可靠性和有效性的定量和质性评价方法来促进教师的成长。这种教师评估模式反映了美国教师评价的新趋势,对我国新时代教师评价的目的、方法、主体和体系有重要的参考价值。
【关键词】教师评价;TIGER;增值评价;质性评价
一、引言
2020年10月,中共中央、国务院印发《深化新时代教育评价改革总体方案》,明确提出要完善立德树人体制机制,扭转不科学的教育评价导向,坚决克服唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾[1],为教师教学评价改革指明了方向。为构建符合新时代教育发展需求的教育评价体系,教师评价改革需要立足于国内实际,还要有国际视野,借鉴和学习国际上优秀的教师评价经验。
美国田纳西州在发展增值评价技术的过程中,也注意到了教师专业发展的问题,于2010年开发了教师教学成长有效性与结果模型(TIGER),将量化评价与质性评价进行有机结合。TIGER有完备的评价标准、专业的评估人员和多样化的课堂观察模式,关注评价过程,注重结果运用,克服唯分数论的弊端,有效地促进了教师的专业发展。TIGER发展至今已初具规模,是田纳西州最成功的教师评估模型之一。
本文深入研究田纳西州教师评估模型TIGER的评估内容、评估流程、评估者培训,对其实施成效进行剖析,以期为我国建立质性与量化相结合、基于课堂观察的教师评估体系提供参考和借鉴。
二、TIGER评估系统
TIGER既是形成性的又是终结性的,是一种教师评价的成长模式。教师的成长和决策都直接建立在这个过程中,评估过程不是为了评判教师的优劣,而是为了促进成长。[2]评估教师的目的是为所有学生提供优质的教学,并促进教师自己的专业成长。因此,TIGER有一套特定的评估标准用以指导教师和观察(评估)者,以及记录证据。评估标准规定了有效教学、有效教师规划策略、课堂环境和教师专业水平的关键指标。TIGER是夏洛特·丹尼尔森(Charlotte Danielson)教学框架的变体[3],该框架自1996年首次推出以来就被广泛使用和研究,是当前许多教师评估模型的基础。评估者根据这一框架,就课堂上有待改进的地方或课堂上较为优秀的地方提供反馈。
(一)TIGER评估内容
评估者从教学设计与计划、教学环境、教学过程、专业化水平等4个方面对教师进行评估。其中,前3项是课堂观察的3个一级指标,教学设计与计划包含3个二级指标,教学环境包含4个二级指标,教学过程包含12个二级指标(见表1)。
评估者基于课堂的观察对教师的表现水平从1分到5分进行评定:1分为显著低于预期,2分为低于预期,3分为满足预期,4分为高于预期,5分为远高于预期。
(二)评估流程
TIGER的评估理念反对“一刀切”,坚持以差异化的方式进行评估,因此它的评估过程是形成性的,也是总结性的,根据教师成长所处阶段进行分层评估[4]。评估人员根据教师所处的阶段(新手、熟练、专业)开展对应阶段的评估。3个阶段都有对应的评估目标:第一阶段的评估目的是“辅导”,旨在帮助新手教师达到能提供高质量教学的程度,如图1所示;第二和第三阶段的评估目的是“成长”,如图2所示,不同的是成长的对象,第二阶段是帮助教师自我提升获得专业成长,第三阶段是教师能帮助其他教師。
教师所处的阶段由田纳西州教育部(TNDOE)进行评定,教师必须满足并保持各个阶段的目标才能进入下一个阶段的评估,并最终成为一名被TNDOE承认的专业教师。评估中,50%的定量部分由35%的增值数据和15%的成绩数据组成,分别由TNDOE批准的田纳西州教育评估系统(TVAAS)和田纳西州教育委员会规定的测试数据提供,50%的定性部分根据课堂观察得来,在学年的年底进行综合评定,做出针对教师个体的总结性决定(如留任、晋升、不续聘等)及针对教师整体的计算效能评定。
(三)评估者培训
TIGER的评估执行者可以是达到第三阶段的教师、教研员、教学主管,也可以是校长或助理校长。所有的评估人员必须参加两天的面对面的评估人员可靠性培训,且在培训后需要进行认证。申请认证之前,必须提供有关如何实施TIGER的计划设想,计划应包括介绍TIGER评估系统,划分学校中教师所属评估阶段,指定研究员协助评估过程等。正式的认证有两种途径:一是评估准确率与专家的评估结果相比达到90%,则可直接通过认证,成为正式评估者;二是评估准确率与专家的评估结果相比达到70%,则需通过国家卓越教学研究所(NIET)[5]的在线认证考试。两种途径获得的认证有效期限均为一年。
三、TIGER质性与量化结合后的成效分析
(一)评价体系实施效果
1.学生获得了更好的学业成长
学生成绩的变化直观反映了教学质量,田纳西州规定使用学生学业成绩的增值来评估教师教学的有效性,使用TVAAS将教师的影响与学生家庭背景等非教育因素的产出分离开,衡量学校或教师的“净效应”[6]。田纳西州在2012年的教育报告中指出,使用TIGER评估模型的教师取得高增值得分的比例更高,达到了59%[7]。研究人员调查了区域内230名使用TIGER评估模型的教师和2839名使用其他评估模型的教师,把各个模型评估得分与学业增值得分进行分析,发现TIGER模型的得分与学业增值得分之间的相关性高于其他模型得分与学业增值得分之间的相关性[8]。各方面数据表明,TIGER模型在提升教学质量和提高学生学业成绩上更加出色。
2.评估受到教师的广泛认可
早期的评估实践者认为教师评估的价值是能够解雇效率低下的教师,保留教学优秀的教师[9]。这种功利性的评估观点扭曲了教师评估的真正目的,实施过程中给教师带来了无形的压力。田纳西州教育部认为有效的教师评估系统应该为教师提供有关其教学实践质量的有意义的信息,促进教师专业能力长期发展[10]。在一项面向TIGER使用群体的调查中,60%的教师认为在评估的过程中感受到的是帮助,得到的反馈意见集中于教学改进,评估教师优劣的情况较少。2015—2017年,教师对该评估系统的支持率从77%提高到81%,每年的支持率都高于州内其他评估系统。不同层次的教师对该评估系统的认可度也十分一致的高,调查表明TIGER的支持率随着教师工龄增长而有所提升[11]。
3.区域合作与反馈效率提升
合作与反馈是教师专业发展、评估系统不断完善的重要环节。校长等领导层在评估系统中扮演着评估者和管理者的角色,协调着区域内的评估开展工作。78%的教师认为学校领导层能够持续、认真地解决教师专业发展中遇到的问题,对反馈信息具有较高的接收效率。教师之间的合作交流是一种良性的工作关系,能反应评估系统对教师的联结程度以及教师对评估系统的认可度,有90%的教师表示自己会根据评估系统提出的问题[12],邀请同事对自己的课堂实践进行观察并反馈,并且对这种合作关系表达了积极的态度。
(二)成效原因分析
1.均衡量化与质性,教师与学生共同成长
学生学业的成长是教师优秀教学能力最好的证明。2015—2017年,TIGER进行了改革,调整了评估中量化数据与质性数据的占比,学生成绩的量化数据占比由原先的50%降低为40%,教师的质性评价数据占比提升至60%。但过度重视课堂观察的质性评价,使得部分教师在评估时更关注表演性,即有意地加入一些对学生无用但对评估有利的教学行为,以提高课堂观察评分。该次改革导致了学生学业总体下降,因此,田纳西州对TIGER做出调整,自2018年后,评估一直保持质性与量化各占一半[13]。教师评价的终极目的是促进师生共同成长,因此教师评价制度应以促进师生成长为导向,分清教师评价的直接主体和目标主体,质性评价部分使用科学的评估指标,为课堂教学、教师发展提供引导,量化部分基于增值评估技术将学生学业成长进行数据呈现,两种取向的有机结合使得教师与学生共同成长[14]。
2.广泛收集表现证据,保证结果公平性
证据的收集是辨别教师教学表现和进行有效评估的重要依据。评估人员通过巡查或短期课堂访问来记录课堂的日常活动,并为教师提供形成性评估数据。基于课堂实际情况,一节课难以将评估中的19项指标要求的课堂表现证据尽数展示,因此教师可以使用教学材料作为一些特定指标的表现证据,如课程计划、样本作业和評估、与家长和监护人沟通的例子、专业发展计划等。在最终成绩上,评估负责人或管理人员综合考虑所有观察数据、演练数据和教学材料,给予总结性得分。与单纯的通过课堂观察得出平均分数相比,对整体教学进行总结性的评估能让评估者对教师做出更细致、准确的评分。教师不再需要为课堂观察期间的一个失误而担忧,可以真正地投入到教学提升中去。
3.投资专业平台,提升评估过程连贯性
田纳西州采取了一系列措施,如建立专业学习社区,选定员工发展日,鼓励同行观察和辅导等,旨在构建教师专业合作平台,形成规模性的评估合作。措施实施后,研究人员会开展相关调查来检验这些措施的有效性,例如在一项名为“教学伙伴”的计划中,研究数据表明高技能教师与低技能教师进行匹配学习,可以有效提升低技能教师的工作能力,在数值上,学生的成绩提高了0.12个标准差[15]。教师专业的发展与评估系统的改进,还必须采取针对性的措施,保障评估的连贯性,使反馈第一时间传达至被评估者手中,提高被评估者对评估结果的反应能力[16]。学校的领导层在这一环节发挥了至关重要的作用,TIGER评估系统针对评估中的领导与管理人员制订了严格的标准,不允许营利性组织、机构参与,保证信息反馈的专业性与公平性,避免因错误的评估信息解读造成反馈失误。此外,TIGER申请了可观的财政资金,为领导层解决反馈问题提供了支持,能够通过培养教师教学能力、提供明确的指导和创建有效教学的组织结构来提升教学团队水平[17]。
四、TIGER对我国教师评估的启示
TIGER是由美国具有较强学术背景的团队开发的,开发过程科学严谨,评估理念先进,是一种科学公正的评估方法,能够较为真实地反映和评估教师的教学水平,提高教师的教学能力,对我国教师评价具有借鉴价值。
1.明确阶段性评估目的,以师生成长为导向
教师的专业发展是持续上升且分阶段的过程,每个阶段都需要量变的积累,即具备了所处时期特点的发展条件才可能产生新的质变。[18]当前我国教师专业发展评估存在“重结果、轻评估”的现象[19],过于强调教学中的“输出”功能,倾向于对教师的教学表现进行判断,缺乏对教师专业发展的反馈调节功能。TIGER是为教师专业成长而设计的,兼顾教育行政管理者、政策制定者的利益诉求,系统权衡教师主体与利益相关者的利益,重视评估对教师专业能力的导向、鉴定、诊断功能,关注教师课堂专业表现的证据,基于课堂专业表现的证据对师资进行改进、调控,而不仅仅是对表现做出判断。TIGER划分了教师专业发展的三个阶段,锚定高质量教学目标,推动教师队伍建设,为评估者提供精准的评估范围,从而能够更有针对性地协助教师制订专业成长计划,改善教学。此外,TIGER厘清了不同类型教师的阶段性发展目标,明确了评估者的评估重点和教师的工作方向:辅导新手教师,保证教学质量;巩固熟练教师,促进专业成长;发展专业教师,助力协同发展。TIGER还建立了良好的评估流程,让优秀的被评估者有机会成为未来的评估者,让评估和教学进入良性循环,不断改善和提升。[20]
2.嚴格培训机制,构建评价主体多边互动
我国中小学实行的教师评价模式中,多以学生成绩情况或教师能力水平考试为评估手段,多以资质较优的教师、管理者等为评估者,不统一评估手段,且未经专业培训的评估者产生的评估结果很难被高效利用,不利于教师评估的可持续发展。[21]TIGER提供了完善的评估体系,采用科学的评价指标,多领域、多角度对教师的课堂教学进行观察。在评估者的选取和培训上,TIGER严格遵循筛选原则和培训手册的要求,审查评估者的专业背景并考虑评估者参与评估的意愿,这在一定程度上保证了评估者的专业性和能动性,避免了一些形式主义的发生。在评估准确性上,TIGER确保每个经过认证的评估人员都能理解、掌握评价指标的各维度,保证稳定的评估准确度,为参与评估的各方(校长、教师、工会等)提供可信服、可使用、可推广的反馈,避免因评估的不专业造成评估资源的浪费。[22]专业的评估人员以科学的评价指标、评价标准、评价流程、评价理念等作为依托,评价结果便具备了可研究性、可传达性,教育从业者可更高效、更积极地从反馈信息中获得持续的反思。我国在对评估者的选拔和培训上,可以适当增加投入,规范、统一教师评估体系,提供教师评估的专业平台,构建良好的教师评估生态。有良好的培训机制作为基础,评估者可以更全面地把握评价目的、评价标准以及观察重点等,这有利于评价人员与教师的互动、沟通、协商,建立良好的多边互动机制,从而能将规范、准确的信息传达给教育决策者,促进教师评估高效发展。
3.丰富评价方法,质性与量化相结合
教师评估要引导教师上好每一节课,关爱每一个学生,建立教学述评制度。我国的教师评估多数关注学生成绩的衡量,或是关注教师的绩效考核,这是一种片面的教育绩效观,唯分数论和量化主义倾向严重。
学生是教育的承受者,教师的教学成果、专业成长也体现在学生身上。从学生是教育的客体这一角度看,教师的评估需要量化的手段来测量教育质量的高低。但需要注意的是,学生同时也是学习的主体。教育过程中进行的精神生产,要促进学生在德、智、体、美、劳等方面的发展,教师在课堂上的教学则属于精神生产的过程。教师在教学中调动学生的主观能动性和培养学生的思维等行为,通过学业成绩或者绩效等量化手段无法体现,因此教师评估中的质性评价也十分重要。
TIGER拥有一套成熟的课堂观察标准,评估者根据课堂观察与教师提供的材料,从教学设计与计划、教学环境、教学过程等方面对教师进行评估,保障了教师评估的质性部分。在量化部分,TIGER以事实数据为基础,借助统计学方法,使用田纳西州增值模型分析学生的成绩数据,有效反映了教师效能。TIGER兼顾了教师课堂教学情况和学生学业成长,把握质性与量化的统一,准确、公平地对教师教学进行评价,同时也调动了教师和学生的积极性。
参考文献:
[1]中共中央、国务院印发《深化新时代教育评价改革总体方案》的通知[EB/OL].(2020-10-13)[2023-12-25]. http://www.moe.gov.cn/jyb_xxgk/moe_1777/moe_1778/202010/
t20201013_494381.html.
[2]武小鹏,武小霞,张怡. 教师教学评估系统的构架与机制[J]. 比较教育研究,2019(8):59-67.
[3]Charlotte Danielson enhances framework for teaching with new evaluation instrument[EB/OL].[2023-12-25]. http://www.danielsongroup.org/.
[4]TIGER:A formative model for teacher evaluation[EB/OL].(2015-10-12)[2023-12-25]. http://tigermodel.net/about/.
[5]BARNETT J H,RINTHAPOL N,HUDGENS T. TAP research summary:examining the evidence and impact of TAP:the system for teacher and student advancement[R]. [S.l.]:National Institute for Excellence in Teaching,2014.
[6]MCCAFFREY D F,LOCKWOOD J R,KORETZ D M,et al. Evaluating value-added models for teacher accountability[M].[S.l.]:RAND Corporation,2003.
[7]Tennessee Department of Education. Teacher evaluation in Tennessee:a report on year 1 implementation[EB/OL].(2015-11-15)[2023-12-25]. https://www2.ed.gov/programs/ racetothetop/communities/tle2-year-1-evaluation-report.pdf.
[8]MORRIS N R. The Tennessee educator acceleration model and the teacher instructional growth for effectiveness and results model on measures of teacher effectiveness:a comparative study[D]. Johnson City:East Tennessee State University,2017.
[9]PAPAY J. Refocusing the debate:assessing the purposes and tools of teacher evaluation[J]. Harvard Educational Review,2012(1):123-141.
[10]KRAFT M A,GILMOUR A F. Can principals promote teacher development as evaluators?A case study of principalsviews and experiences[J]. Educational Administration Quarterly,2016(5):1-43.
[11]GAVIN E I,MAGEE D. Evaluating for improvement:perceptions of Tennessees teacher instructional growth for effectiveness and results(TIGER)observation model[D]. Nashville City:Vanderbilt University,2019.
[12]Tennessee Comptroller of the Treasury. Charter schools:funding Tennessees authorizers and schools[EB/OL].(2014-11-01)[2024-03-22]. https://digitalcommons.memphis.edu/govpubs-tn-comptroller-office-research-education-accountability/97/.
[13]FINCH M A. Tennessee to the top:one states pursuit to win race to the top[J]. Educational Policy,2017(4):481-517.
[14]HILL H C,GROSSMAN P. Learning from teacher observations:challenges and opportunities posed by new teacher evaluation systems[J]. Harvard Educational Review,2013(2):371-384.
[15]PAPAY J P,TAYLOR E S,TYLER J H,et al. Learning job skills from colleagues at work:evidence from a field experiment using teacher performance data[J]. American Economic Journal:Economic Policy,2020(1):359-388.
[16]MURPHY J,TORRE D. Creating productive cultures in schools:for students,teachers,and parents[M].[S.l.]:Corwin Press,2014.
[17]MCPARTLAND J M. Organizing schools for improvement:lessons from Chicago[J]. Contemporary Sociology,2011(1):16-17.
[18]邵志豪,解庆福. 学术型教师:新时代教师发展的思考、定位与实践:以东北师范大学附属中学为例[J].东北师大学报(哲学社会科学版),2019(4):128-133.
[19]何閱雄,李茂森,高鸾. 教师发展视域下的教师评价机制的思考与实践[J].高等工程教育研究,2016(1):107-112.
[20]赵岚,邱阳骄. 教师分类评价的价值意蕴、行动逻辑与实践进路[J].中国考试,2021(10):1-11.
[21]张辉蓉,刘燚,丁丁.中小学教师评价改革进展调查与未来路向[J]. 湖南师范大学教育科学学报,2023(2):82-92.
[22]吴军其,赵梦琦,周思慧,等. 高校教师培训有效性评价指标体系建构[J].现代教育管理,2020(11):66-72.
(责任编辑:潘安)