教师资格考试面试考官培训优化策略<br/>——基于面试数据的实证研究

教师资格考试面试考官培训优化策略
——基于面试数据的实证研究

2023-11-02纪丽丽

中国轻工教育 2023年5期

纪丽丽

(天津市教育招生考试院,天津 300387)

《中国教育现代化2035》聚焦教育发展的突出问题和薄弱环节,明确提出高素质、专业化、创新型教师队伍是加快教育现代化的关键,提出要“构建教育质量评估监测机制,建立更加科学公正的考试评价制度”[1]。面试考官的培训水平对面试结果具有决定性影响,其中,考官培训是提升面试效果的重要环节。以天津为例,教师资格考试中的考官培训仍是个薄弱环节,在一定程度上会影响考试的公平性和有效性。本文对现有培训策略进行了分析,提出了优化考官培训的策略,从而提升面试考试的公平性和有效性。

一、研究背景

1.教师资格考试面试现状

教师资格考试是我国教师资格制度改革的关键环节,2022年,该考试已在全国广泛开展[2]。该考试分为笔试和面试两个部分,考生只有笔试成绩合格后,才能参加面试。面试是教师资格考试的重要组成部分,旨在考查考生将理论知识和实践技能相结合的能力,对考生的职业认知、心理素质、形象仪态、语言表达、思维品质等教师基本素养以及教学设计、教学实施、教学评价等教学基本技能进行全面评估。

面试主要采取结构化面试和情景模拟等方式,包括抽题、备课、回答规定问题、试讲、答辩、评分等环节[3]。回答特定问题属于结构化面试的范畴。与非结构化面试相比,结构化面试具有明确性和客观性的优势。在结构化面试中,面试问题和面试答案是确定的,需要面试考官对评分要素有精确的掌握,并依据评分标准给出客观分数[4],而考生的试讲和答辩部分则属于非结构化面试。在非结构化面试中,考官的提问和追问没有固定模式和标准答案,这就对面试考官提出了更高的要求,需要他们具备相应的学科知识、教学和课堂管理经验,以及敏锐的观察力和准确的判断力[5]。面试考官在这个考察过程中扮演着关键角色,是评分环节的主要执行者。面试考官组由高校考官和中小学一线教师组成,考官组长一般由高校考官担任,在测评环节对评分进行统一把控。与笔试不同,面试评分过程主要依赖于考官的观察和判断,这就使得考官对测评标准的理解和测评系统的运用成为至关重要的问题。因此,考官培训的内容、方式、时长等因素会直接影响到考官评分的有效性、一致性和公正性。

2.面试考官培训现状

天津市教师资格考试面试考官培训采取上岗统一培训和考前培训相结合的模式。面试考官候选人由考区根据相关工作规定和要求进行推荐。被推荐的考官需要参加由天津市统一组织的新考官培训。

新考官首先需进行统一的线下培训,培训师资由具有资质的相关考官专家组成。专家组成员主要来自高校相关领域的资深教授,培训过程分为集中培训和分学段培训两个阶段,涵盖了教师资格考试制度和相关政策、测评系统操作和评分标准等内容。通过考官专家的现场示范、现场演练和现场讲解,新考官可以对整个教师资格考试制度和相关政策有深入的理解,并对面试测评系统操作和评分标准有直观的了解。

完成统一培训的考官将被纳入天津市教师资格面试考官库。面试报名结束后,根据面试科目和考官人数选择考官,并为考官进行考前二次培训。二次培训主要由考点完成,考点根据具体的面试科目情况,自行安排时间和地点对考官进行考前培训。培训内容主要包括面试测评系统的使用、考点相关考务规定和考试流程。

自2016年天津市成为教师资格考试改革试点以来,考生数量不断增加,由开始的几千人增长到几万人,面试考官需求量也日益增大。同时,为满足考生需求,根据教育部相关规定,天津市也陆续开设了新的面试学科,对新增学科的考官需求也在增大。截至2023年上半年,天津市面试考官数量由2016年的几百人增加到了7000余人,基本满足了面试考官的需求。

二、面试考官培训存在的问题及原因分析

唐纳德·柯克帕特里克于20世纪50年代在其博士论文中首次对培训效果的评估进行了初步探讨,并在其随后发表的文章中继续深化,最终形成了被广泛引用的Kirkpatrick模型。Kirkpatrick模型的逻辑基础是有效的考官培训必须确保学员对项目和课程的满意度,使他们能够运用培训中所学的知识和技能,改进工作中的不合理行为,进而提高工作效率。模型包括四个主要层次：反应层(培训内容、培训授课和管理维度)、学习层(知识和技能维度)、行为层(实践和测试、追踪和管理维度)以及结果层。与Kirkpatrick模型相呼应的是,斯塔弗尔比姆提出的CIPP评估模型从不同的角度对培训进行了分析。该模型强调对培训效果的评估不仅要关注最终成果,还需全面考虑情景评估、输入评估和过程评估[6]。

综合Kirkpatrick模型和CIPP模型的分析框架,可以发现天津市面试考官培训中存在的问题。

首先,当前的线下培训模式受时间和地点限制较大。当前的考官培训模式采取的是分区培训,需要由考区申请,市级考试机构统一派出高校考官专家进行为期半天的培训。尽管这种线下培训的互动性强,但因为受到时间和地点的约束,加之一些考区的培训能力有限,无法统一新考官的培训时间。而且,过长的培训时间可能会影响考官的日常工作,而过短的培训时间又难以保证培训质量。

其次,目前的培训内容和方式相对单一。面试测评系统的操作和各个学段的评分标准由市级考试机构委托高校考官专家统一设定。这种模式虽然保证了培训内容的统一,但主要依赖于专家的系统演练和讲解,缺少了考官之间的提问、讨论、交流和反馈等互动环节。

再次,当前的培训模式没有针对新考官和老考官的不同需求设定不同的培训内容。新考官培训的首要任务是掌握评分标准和测评系统的使用,而现有的培训模式只提供了统一的一次培训,虽然涉及评分系统和测评系统的讲解,但由于培训时长限制,很难深入具体地讲解评析案例。同时由于缺少上机实践环节,新考官对于测评系统的使用也仅限于理论范畴。对于已经接受过培训的老考官,则需要在掌握评分标准和测评系统使用的基础上,进一步了解考官组长的职责,加强对面试考场的整体把握,仅在考前进行考务培训显然无法满足需求。

最后,现有的培训模式缺乏针对性,特别是没有对不同学科进行差别培训。现有模式只提供了分学段的培训,这对一些特殊学科显然是不适用的,如特殊教育学科。其考核内容和方式与其他学科存在显著差异,该学科除了要考核教师的通用能力,还需要考核教师应具备的与特殊教育相关的知识和技能。然而,现有的培训模式并未充分考虑到这种特殊性,这可能会影响特殊教育学科面试考官评判的准确性。

三、面试考官培训优化策略

效度涉及培训结果的准确性与真实性,是衡量培训成果是否符合预期目标的重要指标。如果培训效度高,说明培训效果良好;反之,则表示培训效果欠佳。提高培训效度的关键在于优化培训内容。首先,要确保培训内容的正确性和代表性,以符合培训目标的实际需求;其次,要强化培训内容与培训目标之间的紧密联系,以保证培训内容的关联效度。在此基础上,对考官进行面试评分的统计分析,不仅有助于了解考官培训的即时效果,还可以进一步测算培训的预测效度。双重效度的结合确保了培训不仅在当下有效,而且具有对未来工作表现的预测价值。对于培训内容效度的评估,可以采用多元化的方法,例如邀请专家进行现场评测,或通过培训后的考试分析考官的得分情况[7]116。为了解决当前存在的问题,提升考官培训的效度,本研究提出了以下优化改进策略。

1.整合线上培训和线下培训

提倡将线下培训与线上培训相结合,为新晋考官提供全方位的培训机会。线上培训主要通过天津市教师资格考试考官管理系统进行,可以在不受时间和地点限制的情况下,更加高效和便捷地进行。培训内容主要包括常规培训、上机演练、模拟评分和理论考试等。其中,常规培训聚焦于对教师资格考试的国家法规以及相关测评标准的熟悉和理解,旨在使考官全面把握教师资格考试和面试的总体要求;上机演练则针对面试测评系统的操作进行,考官在完成线下培训后,进行线上模拟操作,以便熟练掌握测评系统的使用,防止实际操作中出现误差;模拟评分模块允许考官对模拟考生进行打分,通过与专家评分对比,对打分误差进行分析统计,引导新考官进一步掌握面试评分标准,误差较大的考官将接受进一步的模拟打分培训,直到误差控制在可接受范围内;理论考试部分是对前面几个部分内容的理论检验,只有通过该部分的考核,考官才能够正式上岗。

此外,在进行线上培训的同时,还要保证线下培训的时间。直观性和互动性是线下培训模式不可替代的优势。线下培训能够更好地聚焦问题,以问题为导向进行针对性讨论。教育技术与教学设计理论专家戴维·梅里尔指出,“当学习者在现实世界的问题情境中掌握知识与技能时,才能促进教学”[8]124。线下培训可以通过一个案例分析、一个具体演示或者一组数据进行讲解和讨论,让参与培训的考官一边学习思考,一边进行问题讨论,进而发现解决问题的方法。

2.结合常态化培训与考前强化培训

考虑到教师资格考试面试每年两次的频率以及考试之间较长的时间间隔,我们提出了常态化培训与考前强化培训相结合的培训模式。上岗前的单次培训往往无法满足考官准确掌握评分要求和相关评分标准的需求。因此,常态化的日常培训成为必要环节。这种培训形式的内容可以根据实际面试的情况变化进行灵活调整,例如面试科目的增减或调整、测评标准的改动、新出现的问题等。同时,为了确保考官在面试前能够准确掌握各项要求,考前强化培训也是必需的。这种培训模式既包括通过考官管理系统进行的线上培训,也包括考点在考前组织的线下培训,如集中上机操作演练和面对面讲解等。

3.融合专家指导与考务规范培训

目前,天津市的考官培训主要依赖于专家的指导,专家培训和专家经验判断是整个对官培训过程中不可或缺的部分,在整个培训以及对考官培训的评估中都起着举足轻重的作用。北美人力资源专家和培训大师鲍勃·派克曾经提出七个非常实用的培训学习法则,其中第一条就是“讲师法则”[8]5。考官专家组由高校资深教授组成,其在相关领域有丰硕的研究成果,在教育教学方面有一线教学和作为面试考官的丰富实践经验。在考官培训过程中,专家的专业知识和丰富的实践经验是考官培训的重要基础。然而,针对考务规范方面的培训仍显不足,诸如考场用语规范、不合格考生评语的书写等常成为争议焦点。针对这一问题,在现有专家指导的培训体系中,应加强对考官考务规范的培训。这种培训应以考点考务管理工作人员为主导,在日常培训和考前强化培训中融入考务规范内容,并采用线上线下两种方式进行。考务规范培训的主要内容应包括考官信息管理、考官请假流程、考官签到规定以及考场规则等,由各考区和考点的相关考务管理人员进行指导和管理。这也是Kirkpatrick模型中所提到的从反应层和行为层的管理维度提高面试考官培训效果的措施。

4.进行学科专项培训

当前,天津市考官培训采取的是集中培训加分学段培训的方式,主要分为学前、小学和中学三个学段。这种方式不受学科限制、不受学科考官人数限制,集中解决考官培训过程中的共性问题,关注共性的需求。但是从另一个方面来看,一体化的学段培训难以进行针对性的学科评分标准讲解。因此,不同学科的考官可能会对同一评分标准有不同的理解和掌握,导致不同学科间评分存在差异。为了解决这一问题,在考官培训中,需要将考官的学科特性纳入考虑,实施学科专项培训。学科专项培训需要更为精细的时间和内容安排,可以由各学科的专家制定特定于其学科的培训内容和评分关注点,从而确保评分的公正性和一致性。同时,仍需保留综合性的培训环节,以确保考官具备广泛的教育理念和普适的评审能力。

5.增加培训前能力测验和培训后跟踪测验

培训前要适当加入心理测验等相关内容,有助于确定培训内容和培训方式。比如通过人格测验中的大五人格测验,以测试考官的亲和力和情绪稳定性[7]196。同时可以对参训考官进行职业兴趣测验,统计分析参训考官对于面试考官工作的配合度和积极性,了解考官参加面试工作的动机,比如是为了提升个人能力、增加工作经验,还是为了职称评审,这些动机都可能影响考官的参与度和专注度,从而影响评分的客观性和公平性。培训后要及时进行标准化知识类测验,利用客观题和主观题相结合的方式,对考官培训效果进行评估。也可采用问卷调查的形式,了解考官对于培训效果的反馈和存在的问题,并对培训内容和方式进行进一步评估,再根据评估结果进行优化。

四、实证研究

1.数据来源

本文主要依据2021年全年和2022年上半年天津市教师资格考试的考生面试数据进行分析,该考试每次持续两天,每天进行四场面试。需要注意的是,2022年的数据来自实施面试考官培训优化策略后的考试。本文首先进行了数据清洗,删除了缺失值和异常值,以确保数据的质量和准确性。然后,从这三次考试的数据中各随机抽取了一千条面试数据,形成了一个充足且具有代表性的样本。接下来,使用Kruskal-Wallis H检验来比较这两年中面试的成绩分布是否存在显著差异。这将有助于理解面试考官培训优化策略是否对考试成绩有显著影响。

2.研究假设

原假设(H0)：四场面试的成绩中位数相等,即考官每场面试评分标准一致。

备择假设(H1)：四场面试的成绩中位数不全相等,至少有两场的中位数存在显著差异,即考官在四场面试中至少有两场面试评分标准不一致。

3.研究方法

由于本文使用的数据并未通过Shapiro-Wilk正态性检验,即数据并不符合正态分布,因此选择采用不依赖于特定数据分布的非参数检验方法——Kruskal-Wallis H检验。该检验方法适用性广泛,对数据的要求相对较低,适用于处理非正态分布的数据。

烟台市将全力实施国土绿化提升三年攻坚行动，推动生态环境持续改善。全市按照《国土绿化提升三年攻坚行动实施方案》，持续加大国土绿化工程实施力度，统筹抓好森林生态修复与保护、退耕还果还林、森林生态廊道建设、森林质量精准提升、城乡绿化美化五大工程。其中，实施森林生态修复与保护工程，对现有荒山、荒滩进行规模造林，通过三年努力，彻底消灭荒山、荒滩；结合全域治水三年攻坚行动，在大中型水库流域营造水源涵养林，增强水系防洪能力和景观效果；对火烧和采伐迹地以及海防林内被侵占林地实施精准造林，恢复生态功能。

本文将运用Kruskal-Wallis H检验来研究每场面试成绩的中位数是否存在显著差异。这将有助于更深入地理解面试考官评分的一致性和公平性,并进一步探索如何通过改善考官培训提升考官评分的有效性。以下是Kruskal-Wallis H检验的基本步骤。

(1)对所有数据进行排序

将所有样本中的数据值混合在一起,并从最小到最大进行排序。对排序后的数据进行排名,最小的数据排名为1,以此类推。如果有并列的数据(即有两个或更多的数据具有相同的值),则取它们的中间排名。

(2)计算每个样本的排名和

对每个样本中的数据的排名进行求和。

(3)计算检验统计量H

首先,计算每个样本的平方和,然后根据以下公式计算H值：

其中,n是所有样本的数据总数,ni是第i个样本的数据数,Ri是第i个样本的排名和。

(4)计算自由度和p值

Kruskal-Wallis H检验的自由度等于组数减1。使用H值和自由度,在卡方分布表中查找相应的p值。

(5)判断假设

如果p值小于预设的显著性水平(通常为0.05),拒绝零假设,即认为各组的中位数存在显著差异。

Kruskal-Wallis H检验只能显示是否至少有一组样本的中位数与其他组不同,但无法显示哪个组不同。本文在进行Kruskal-Wallis H检验后,进一步进行了Dunn’s Test[9]多重比较。Dunn’s Test作为一种非参数方法,用于两两比较不同组的差异,以确定哪些组的中位数存在显著差异。为了控制第一类错误的累积,在Dunn’s Test后使用Bonferroni校正[10]进行了p值的校正,更准确地识别出那些具有显著差异的组别。

4.实证结果

根据表1可知,本研究针对两年(2021年和2022年)中三个学段(学前、小学和中学)各自的四场面试成绩进行了假设检验。考虑到不同学段在两年时间内的数据差异,分别进行了Kruskal-Wallis H检验,并计算了相应的p值。

表1 不同学段考试成绩的假设检验p值

在学前学段,2021年的p值为0.003,小于显著性水平0.05,这表明四场面试的成绩中位数存在显著差异。然而,在2022年的考试中,p值最小为0.571,大于显著性水平0.05,表明四场面试的成绩中位数没有显著差异。

在小学学段,2021年的p值为0.00001,小于显著性水平0.05,表示四场面试的成绩中位数有显著差异。然而,2022年的p值为0.640,大于显著性水平0.05,这意味着四场面试的成绩中位数没有显著差异。

在中学学段,2021年的p值为0.007,小于显著性水平0.05,表示四场面试的成绩中位数有显著差异。然而,2022年的p值为1.340,大于显著性水平0.05,这意味着四场面试的成绩中位数没有显著差异。

本文通过对2021年天津市教师资格考试面试考官评分数据的Dunn’s Test分析,结果如表2所示,得出以下结论：第一组和第二组之间由于p值大于显著性水平0.1,则接受原假设,认为第一组和第二组的面试成绩中位数没有显著性差异;同理,第三组和第四组的面试成绩中位数没有显著性差异。第一组与第三、四组之间由于p值均小于显著性水平0.05,则拒绝原假设,认为第一组和第三、四组的面试成绩中位数有显著性差异;同理,第二组和第三、四组的面试成绩中位数也有显著性差异。这反映出2021年考官们对不同组别的评分标准有所不同。

表2 2021年天津市教师资格面试考官评分数据Dunn’s Test比较结果

本文通过对2022年天津市教师资格面试考官评分数据的Dunn’s Test分析(如表3所示),得出以下结论：四组数据之间的面试成绩中位数并没有显著差异。这反映出2022年考官们对不同组别的评分标准相对一致。

表3 2022年天津市教师资格面试考官评分数据Dunn’s Test比较结果

基于以上的假设检验结果,可以得出如下结论：2021年至少有两场面试的评分标准存在不一致的情况。然而,在部分采用了本研究提出的系列优化策略后,2022年各场面试的评分标准已经趋于一致。这表明所提出的改进策略对于提高面试考官培训的有效性、提升评分标准的一致性产生了积极影响。

五、结论

本研究旨在提升天津市教师资格考试面试考官培训的有效性。当前的面试考官培训仍然存在受培训内容、时间和方式等影响的培训效度问题。为了提升考官培训的有效性,需要转变思想观念,以培训有效性为核心,关注培训质量的全面提升,并建立起相应的考核评价机制。此外,考试院需以实践为导向,构建面试考官培训新体系,从而更好地满足教师资格考试的需求。面试考官培训质量的高低直接影响着面试考官队伍建设的质量,进而影响着教师资格考试的水平。因此,优化面试考官培训是提升教师资格考试质量的关键环节。面试考官培训策略的优化,是一个长期的过程,优化策略的具体实施方法也需要更加细化,因此需要在更长时间内进行探索和改进。同时,在未来的研究中,还需继续深入探索更多有效的策略和方法,以进一步提升面试考官培训的质量和效果。