国际中文教师测评素养研究初探*1
2023-01-19宋丽君中央民族大学国际教育学院
袁 萍 宋丽君 中央民族大学国际教育学院
张海威*2 北京大学对外汉语教育学院
提 要 测评素养是教师教学能力和教师专业发展的重要组成部分。本文围绕“是什么”“研究什么”“如何研究”探讨了国际中文教师测评素养。首先,本文界定了国际中文教师测评素养的内涵及其核心构成要素;其次,本文从基础理论研究、标准构建、调查研究、提升途径等角度提出了国际中文教师测评素养相关研究议题;最后,本文从定量和定性研究的角度,探讨了可用于国际中文教师测评素养的常见研究方法。
一、引言
2020年,《深化新时代教育评价改革总体方案》出台,提出学校、教师、学生、用人等评价改革思路。作为新时代教育中的重要主体,教师需参与到教育诸多方面的评价,需要具备良好的测评素养。Stiggins(1991)首次提出“assessment literacy”这一术语。国内学者使用过如测评素养、评价素养、评估素养、测试素养等来指称这一概念。本文使用“测评素养”1,认为其不单指能力或认知上的评估,更侧重人们在测评领域较高层次方面的素养(吕生禄,2019)。
测评素养是教师教育和测试研究领域共同关注的议题。在教育领域,测评素养是教师教学能力和教师专业发展的重要组成部分,是优秀外语教师的必备能力(Popham,2009;康静,2019;甘凌、蒋昌盛,2020)。测评素养也是测试领域关注的热点话题,如测试学术会议有专门的测评素养专题研讨,《语言测试》(Language Testing)有专刊探讨语言测评素养(范劲松,2017)。
目前,国内外普通教育学和外语教学领域围绕教师测评素养的研究成果颇丰,国际中文教育领域对教师测评素养的研究则刚刚起步。在深化教育评价改革、国际中文教育大变局(郭晶、吴应辉,2021;王春辉,2021)、《国际中文教育中文水平等级标准》发布的大背景下,国际中文教育对中文教师的测评素养提出了更高要求,如线上测评、低龄和高级中文学习者的水平评估。在开展相关研究之前,学界应厘清几个基本问题:一是“是什么”,即国际中文教师测评素养的内涵及具体构成要素是什么;二是“研究什么”,即国际中文教师测评素养有哪些研究议题;三是“如何研究”,即使用何种方法和测量工具研究国际中文教师测评素养。本文从上述三个方面对国际中文教师测评素养研究进行初步探讨。
二、国际中文教师测评素养的内涵
(一)教师测评素养的概念界定
教师测评素养概念界定大致可分两类。第一类只强调教师的测评知识和技能,认为教师测评素养是教师进行评价时应具备的知识和能力(Stiggins,1991;Boyles,2005;Inbar-Lourie,2008;廖善平,2016)。随着教育评价的进一步发展,特别是形成性评价的兴起,学界开始关注评价的促学作用(Black、Wiliam,1998),对教师测评素养的理解也不断深化。第二类除了注重教师应具备的知识和技能基础以外,还强调测评的功能和用途,尤其重视对学生学习和发展的促进(Webb,2002;周文叶、周淑琪,2013;李玉升,2016)。
语言教师测评素养这一概念源自普通教育学领域的测评素养(林敦来、武尊民,2014)。外语教学领域对测评素养的定义基本未超出普通教育学领域的界定,不过学者们大都认为不同学科教师测评素养的目标、要求和发展过程有所不同。语言教学与其他学科教学有所不同,因此语言教师与其他学科教师的测评素养不完全一样,需要具备语言学科特有的测评素养(甘凌、蒋昌盛,2020)。结合国内外普通教育学及外语教学领域的相关研究,我们将国际中文教师的测评素养定义为:中文教师在开展中文教学测评时所应具备的测评知识和能力,包括为了促进学生中文学习的测评设计、开发、实施、应用和反馈等。
(二)国际中文教师测评素养的构成要素
1.已有教师测评素养构成研究
教师测评素养构成要素框架是目前国内外研究的重要议题。学界对教师测评素养构成要素的认识经历了从浅到深、从单维到多维、从客观到主客观相结合的过程。目前,对教师测评素养构成要素的分类不完全一致,对具体要素内涵的解读也不同,可归为“单要素”“双要素”“三要素”“四要素”等四类(见表1)。
表1 教师测评素养的构成要素
“单要素”框架强调教师在测评过程中应具备的测评技能。以美国教师联盟(AFT)、美国国家教育测量委员会和美国全国教育协会1990年提出的“教师的学生教育评价能力标准”为代表。该标准提出教师测评应当具备七种技能,如选择、开发测评方法。在外语教学领域,Boyles(2005)认为外语教师测评素养应强调外语教师具备的一系列测评能力,如运用评价手段、解释和分析评价结果。
“双要素”框架包括测评技能和测评知识。测评知识既包括测评基本概念,也包括教学知识。Brookhart(2011)提出了教师测评素养“十一条原则”,指出了教师测评时所需的相关知识和技能。Malone(2013)认为,语言教育工作者应熟知课堂实践中测试的定义及其应用,有足够的测评背景知识和训练,能开发、选择、使用测试并合理解释测评结果,同时结合具体情境进行适当调整。
“三要素”框架包括测评技能、测评知识和测评原则。测评原则主要指测试使用的合理性和公平性、测试伦理、测试的影响力等,强调测评环境及其影响,体现了测试领域的社会转向。Davies(2008)和Giraldo(2018)提出了测评素养所包括的测试知识、技能和原则体系。Inbar-Lourie(2008)构建的语言教师测评素养框架包括测评目的、测评内容和测评方法。其中测评目的主要包括测试的背景、标准、伦理、影响等,即测评原则;测评内容主要包括测评知识和语言领域知识;测评方法主要指促进学习的测评方法,包括命题及试题分析方法、测评规划设计等,即测评技能。部分国内学者也持有类似看法。如林敦来(2019)提出了“原则、知识和技能”三位一体的语言教师评价素养理论框架;俞婷、宫学玲(2020)认为,语言测评素养指语言测评活动利益相关群体所应掌握的知识、技能和原则。
“四要素”框架包括测评知识、测评技能、测评原则和测评信念。测评信念主要指教师对测评的认识与态度,该要素由中国学者提出。如邓巧珍和曾小珊(2020)、李亮和王蔷(2020)提出的英语教师评价素养框架,包括评价观念、评价知识、评价技能和评价伦理四个维度;潘鸣威(2020)的语言教师测评素养模型包括测评知识、测评能力、测评原理、测评接受度,其中测评接受度指教师对测评的情感和态度,即测评信念。与“三要素”框架相比,测评信念的提出关注到了教师的情意层面,但测评信念是否可以作为测评素养的构成要素仍待商榷。测评技能、测评知识和测评原则属于客观层面,测评技能是程序性的、实践性的,测评知识是陈述性的、描述性的,测评原则是指导性的、理论性的。而测评信念属于主观层面,涉及教师对测评的主观认知,与“三要素”不在一个层面上。
2.国际中文教师测评素养的构成
参考已有的对教师测评素养构成要素的划分,以及国际中文教育教学与研究实际,本文采用“三要素”框架,认为测评知识、测评技能和测评原则是国际中文教师测评素养的三个核心构成要素。未将测评信念纳入国际中文教师测评素养核心构成要素的原因如下:一,从literacy 的本义来看,主要指能力和知识,而非主观信念或态度;二,测评信念是隐性的,很难直接观察和测量,而评价知识和技能多是显性的,可通过评价行为表现出来(Jiang、Hill,2018,转引自李亮、王蔷,2020)。
教学测评涉及诸多不同利益相关者,包括政府部门工作人员、专职教师、教学管理人员、研究人员、专门测评人员、学生等,不同利益相关人员应具备的测评素养不尽相同(Brindley,2001;Taylor,2013;范劲松,2017)。在国际中文教育测评中,与教师群体密切相关的人员主要有专职教师、教学管理人员和专门测试人员。三类人员均需具备一定的中文测评素养,但在不同要素上要求具备的内容有所不同。参考Taylor(2013)的模型,本文构建了国际中文教学专职教师、教学管理人员、专门测试人员的测评素养模型(见图1)。
图1 中文专职教师、教学管理人员、专门测试人员的测评素养模型
图1中的测评素养模型构建了中文专职教师、教学管理人员、专门测试人员三类群体的测评素养,涵盖10 个维度、5 个等级(数值0—4)。在维度方面,测评知识范畴包括中文教学内容知识(即教什么)、中文课堂教学知识(即如何教)、教育测量知识、语言测试知识四个维度;测评技能范畴包括测试选择与实施、测试试题编制、测试结果分析与解读、测试结果反馈与应用四个维度;测评原则范畴包括测试伦理、测试职业化两个维度。在等级方面,数值大小代表了测评素养水平的高低,“0”代表该维度素养水平最低,“4”代表素养水平最高。
三类群体在各维度上的等级不同。具体而言,中文专职教师在中文教学内容知识与中文课堂教学知识两个维度上的等级最高,数值为“4”,在测试职业化维度上的等级较低,数值为“2”;教学管理人员在测试结果反馈与应用维度上等级较高,数值为“3”,在其他维度上的等级较低,数值为“1”或“2”;专门测试人员在各个维度的等级都属最高,数值为“4”。三类群体所承担工作的差异,决定了各自测评素养的高低。具体来看,专职教师主要负责“教”,需要具有过硬的中文教学能力,同时需要具备较好的中文测试相关技能,实施过程性评价和终结性评价,做到“考教结合、以考促教”;教学管理人员主要负责“管”,需要具备较好的基于测试结果的决策能力,如确定申请入学所需语言水平、评定各类奖学金等;专门测试人员主要负责“测”,其工作的专业化决定了该群体需要在各个维度均具备较高的素养,该群体代表了国际中文教育领域最高层级的测评素养,对测量理论和实践的发展以及大规模标准化测试的开发具有决定性影响。
需要说明的是,图1中的测评素养模型主要用来说明三个群体在应当具备的测评素养方面的大致差异,而非实际素养的不同。总的来看,国际中文教育领域专门测试人员需具备的测评素养最高,既包括中文教学相关知识和测评知识,还包括测评的设计、开发和实施,以及考虑评价测试对社会、国家的影响,其参与的测试类型主要为大规模、标准化的水平测试。专职中文教师需具备较高的测评知识和技能,特别是中文教学相关知识、试题编制与施测等,其参与的测试类型主要为课堂测试,如分班测试、成绩测试等。中文教学管理人员需具备较高的测试结果反馈与应用技能,即依据测试结果招生、制定管理决策等。
三、国际中文教师测评素养的研究议题
相较国内外普通教育学领域和外语教学领域,国际中文教师测评素养研究相对滞后,相关研究较少。Zhang 和Soh(2016)、张丽妹和符传丰(2018)分别调查了新加坡中小学华语教师的语言评估知识情况和评估素养培训需求;Koh 等(2018)聚焦测评任务设计,考察了中文教师测评素养的发展;廖建玲(2021)探讨了中文教师评价素养的内容框架和培养阶段;赵琪凤(2021)调查了来华留学预科汉语考试命题员的命题素养。目前,国际中文教师测评素养在理论层面与实践层面可研究的议题大致包括四个方面。
(一)开展国际中文教师测评素养基础理论研究
虽然目前对教师测评素养构成的研究已有很多,但与具体学科结合的教师测评素养构成研究并不多,需要全面分析和界定各学科教师测评素养的概念和内容维度(吕生禄,2019)。开展国际中文教师测评素养基础理论研究,是测评素养提升和发展的基础性工作。学界需继续探索国际中文教师测评素养的要素,进一步明确各个构成要素的具体内涵和相关关系,构建契合国际中文教学测评对象和测评环境的理论框架。
(二)构建国际中文教师测评素养标准
很多国家的教师专业标准已将教师测评素养作为其中的重要内容之一。标准构建可为国际中文教师测评素养提升、发展和评估提供依据。测评素养是国际中文教师能力和素质的重要组成部分(李泉,2012;崔希亮,2016;李泉、关蕾,2019;贾昊等,2021)。《国际中文教师专业能力标准》在专业实践之“学习评估与反馈”部分提出,国际中文教师应了解评估基本知识,掌握多元评估方式,能对学习者进行多元、有效的评估,并给出了初、中、高三个等级的相应描述。目前,学界还没有专门的国际中文教师测评素养标准,且《国际中文教师专业能力标准》中的相关分级描述较为简单,未涵盖教师测评素养的各具体维度。从研究角度来看,测评素养并非“非有即无”,而是一个循序渐进、具有一定层级性的连续体(金艳,2018)。学界需在理论研究基础上,进一步探索国际中文教师测评素养评价具体指标与等级,针对不同类型、不同层次的中文教师和不同利益相关者制定相应的测评素养标准(张露露,2018)。
(三)开展国际中文教师测评素养调查研究
发展外语教师的评价素养需要开展相关调查研究(金艳,2018)。在外语教育领域,江进林(2019)、黄锐和李旭殷(2020)分别调查了国内高校英语教师测评素养现状和影响因素,并提出了针对性建议。一些研究还调查了外语测试课程和外语教师测试培训需求,并提出了相关发展策略(彭康洲,2014;甘凌、蒋昌盛,2020)。同样地,培养和提升中文教师测评素养需开展国际中文教师测评素养调查研究,以提供具有针对性的建议。尚待开展的调研议题包括中文教师测评素养现状、对测评素养培训或课程的需求、测评素养的动态发展、测评素养的影响因素等。调查对象可包括国际中文教育领域不同的利益相关者,既可对各利益相关群体进行调查,也可对不同利益相关者开展对比研究。
(四)开展国际中文教师测评素养提升途径研究
提升和发展教师测评素养已成国内学界共识(吕生禄,2019)。已有教师测评素养提升建议或发展策略主要有如下角度:第一,针对教育所涉不同主体,提出各主体所应承担的具体工作;第二,针对不同教师群体提出具体的培养目标和提升建议;第三,基于测评素养构成要素,从不同维度提出提升建议,如评价知识、评价技能提升途径等;第四,探索提升教师测评素养的具体方法,如测评培训课程、教学经验、教学实践、实训课程、案例分析如何提升教师测评素养(江新、郝丽霞,2010;叶军,2018;朱勇,2019;甘凌、蒋昌盛,2020;李泉,2021)。国际中文教师测评素养提升可以此为借鉴,从上述各个角度进行探讨。
四、国际中文教师测评素养的实证研究方法
同语言教师其他领域的研究方法相似(张海威、刘玉屏,2019),测评素养研究主要包括定量和定性两种研究范式。
在定量研究中,问卷调查是使用最广的一种方法。开发设计科学的测量工具,是开展国际中文教师测评素养调查研究的基础性工作。目前,国内外学者已开发了一系列教师测评素养调查问卷。如国外Plake 等(1993)的“教师测评素养问卷 ”(Teacher Assessment Literacy Questionnaire),Mertler(2003)的“课堂测评素养列表”(Classroom Assessment Literacy Inventory),Mertler 和Campbell(2005)的“测评素养列表”(Assessment Literacy Inventory)等。国内影响较大的有郑东辉(2009)的“中小学教师评价素养调查问卷”,赵雪晶(2014)的“中学教师教学评价素养调研问卷”,林敦来(2016)的“中学英语教师评价素养自我评价量表”,郑东辉和叶盛楠(2016)的“中小学教师课堂评价知识问卷”等。肖杨田和何琼(2021)对比分析了多个英语国家语言教师测评素养量表,可为开发国际中文教师测评素养量表提供参考。
在定性研究中,访谈法是常用方法之一。已有研究大多将访谈法与问卷调查结合,通常在问卷调查基础上,针对发现的问题,以访谈形式开展深入研究(Jeong,2013;江进林,2019)。已有研究采用的质性方法还包括叙事研究法、文本分析法。如基于叙事研究方法,Kleinsasser(2005)探索了教师开设研究生外语测试课程的历程和心得,黄恩谋和杨满珍(2019)调查了大学英语教师测评素养的动态发展过程;基于文本分析法,柳笛(2017)对比分析不同地区和不同领域教师专业标准中的测评素养,耿峰和于书林(2021)探讨了教师如何实施课堂评价活动及其存在的问题。
五、结语
测评素养研究应贯穿于教与学的始终,蕴含于教师专业发展全过程(肖杨田、潘鸣威,2020)。作为国际中文教学的重要环节,测评对中文教学有重要影响,国际中文教师测评素养的提升有助于实现“以评促教、以评促学”。本文尝试对国际中文教师测评素养研究进行探讨,初步构拟了国际中文教师测评素养的内涵和构成要素,梳理了国际中文教师测评素养的研究议题及研究方法。在国际中文教育领域,关于教师测评素养的理论探讨和实证研究还有待进一步开展,以促进国际中文教育评估的科学化和标准化发展。
附注
1 在引用国内相关文献时,仍遵从原文使用术语。