中学教师教学质量评价研究及应用

2020-09-08肖燃

考试研究 2020年4期

唐兴肖燃

一、引言

教师绩效评价是教师绩效管理的一个重要环节，是指学校在一定时期内，根据绩效管理的需要，针对教师承担的工作，运用科学的方法，对教师工作结果和工作表现进行的评价，并根据评价结果做出各种人事管理决定，如教师的薪酬、职务职称调整等[1]。教师绩效既包括与工作目标相关的结果，也包括教师工作的过程和行为，其中教育教学结果尤其是学生成绩相对客观、可量化，在绩效评价过程中受到的关注较多。教师绩效评价关乎教师利益和学校师资队伍建设，直接影响教师工作行为变化与学校教学质量。

目前我国中学教师绩效评价普遍存在不够科学、客观的问题，导致中学教师对绩效评价满意度不高，影响了工作积极性，在一定程度上影响了中学教育教学工作质量的提升。由于各科难度和区分度不同，各个学科的分数分布不相同，分数不在同一个量尺上，所以需要寻找同一个量尺，以便比较。近年来中学陆续进行教育均衡、中高考改革等一系列教育教学改革，原有的教师教学质量评价方法亟需适应新的改革趋势进行改进完善。本研究基于学校管理实际需求，解决当前教学质量评价中使用学生成绩计算教学增值时存在的典型问题，有效应对区域均衡、中高考改革等教育教学改革实际情况，使教学质量评价体系更具科学性、公平性；探索出相对自动化的评价途径，使学校实践操作更简便易行。

二、基于标准分数和分数校准的教学质量评价方法

本方法评价对象为具有考试成绩科目的教师，并且适用于采取以年级为评价单元的管理模式，即在同一个年级内对各学科教师进行评价。要计算教学增值，首先需要收集两次考试成绩，以一学年为评价周期为例，要保证第一次考试成绩代表该学年起点成绩，第二次考试成绩代表该学年终点成绩，尽量保证两次考试内容充分体现该阶段教学和学习内容，并且在试题难度、结构等方面尽可能等质，评分标准尽可能一致。

（一）所有科目参加考试的人数相同时统计处理方法

在同一个年级内部，所有学生均参加各个学科的考试，使用标准分数统一分数量尺。

1. 如果各个科目为全年级考生参加考试，考试人数相同，并且其分布近似正态分布，通过将分数标准化为 Z 分数，即用[（原始分-平均值）/标准差]。标准化后各科各次考试分数平均值均为0，标准差均为1，处在同一个量尺上。在这个量尺上，语文第一次考试的1 分和第二次考试的1 分是等价的，语文的1 分和数学的1 分是等价的。

2. 记标准化后某科起点成绩为Z科1，终点成绩为Z科2， Z科1和Z科2是可比较的，计算每名考生第二次成绩减第一次成绩的增值，即P科=Z科2-Z科1。由于各科目的分数可比较，所以语文成绩的增值P语和数学成绩的增值P数也是可比较的。

3. 以班级为单位，计算P科的平均值，得到班级平均增值。

4. 根据教师所教班级，计算教师所教所有班级的平均增值，得到教师教学增值。

（二）不同科目考试人数不同时统计处理方法

文理分科和高考改革的情况下，除语文、数学、英语外，其他科目的考生人数不同，目前全国已有14 个省（直辖市）进入了高考改革阶段，本研究以高考改革后的情况进行研究。高考改革后，语文、数学、英语三个科目为全年级学生参加考试，考试人数相同，其教学质量分数计算方法使用标准分数即可，但物理、化学、生物、历史、地理、政治为选考科目，考生选择任意三科，每科考生人数不同、考生组成不同，并具有对应的教学班级。如选考物理的450 人，选考政治的100 人，如果选考科目仍然使用标准分，相当于认为将不同考生群体的能力分布变为相同，即450 人的 “物理” 能力分布和 100 人的 “地理” 能力分布相同，这显然不合理，故需要对选考科目分数进行校准，从而实现各学科分数可比较。目前大量研究关注选考科目分数调整的问题，本文基于科学性和实践操作易行的原则，根据温忠麟提出的分数校准方法[2]，使用语文、数学、英语对选考的六科进行分数校准，然后计算教师教学质量分数。

1. 将各学科的分数标准化为Z 分数，即用[（原始分-平均值）/标准差]，标准化后各科各次考试分数平均值均为0，标准差均为1，处在同一个量尺上，在这个量尺上，语文、数学、英语第一次考试中的1 分和第二次考试的1 分是等价的，语文、数学、英语三科分数也是等价的。标准化后的分数记为Z科（为作区分，后文中选考科目记为Zk科）。

但由于选考科目考生群体不同，考生能力分布不同，所以标准化后其分数和语文、数学、英语是不等价的，需要校准到同一个量尺上。校准的方法是基于选考科目与语文、数学、英语三科（合称 “基础科”）之间的相关性，根据选考科目分数统计校准的弱假设[3]，可以使用基础科建立一个选考科目的分布，该分布和基础科整体分布一致，即建立[基础科→选考科目基础分]的连接，然后通过选考科目考生群体在此分布中的平均值和标准差对选考科目分数进行校准，即建立[选考科目基础分→选考科目分数]的连接，使选考科目分数与基础科三科可比较，从而选考科目各科分数也可比较。

2. 要将选考科目与语文、数学、英语联系起来，需要建立一个桥梁，称为基于基础科的选考科目基础分 Xk科（基础）。将 Zk科作为因变量，Z语、Z数、Z英为自变量，使用多元线性回归得到回归系数，作为基础科三科成绩合成选考科目基础分Xk科（基础）的权重W1、W2、W3。公式如下：

Xk科（基础）=W1×Z语+W2×Z数+W3×Z英

其中 Xk科（基础）为该选考科目基础分，Z语、Z数、Z英为语文、数学和英语的 Z 分数，W1、W2、W3为权重，不同的k 科不同。对于所有的考生都可以计算其Xk科（基础），该分数是用于调整 k 科分数的基础。 Xk科与Z语、Z数、Z英的多重相关系数等于Zk科和Xk科（基础）的皮尔逊相关系数，所以Xk科（基础）可以作为Zk科和Z语、Z数、Z英转换桥梁。

3. 将选考科目基础分Xk科（基础）重新标准化为Z 分数，即：

{Zk科（基础）=[Xk科（基础）-平均值] /标准差}。

4. 计算选考了k 科的考生群体第3 步中Zk科（基础）的平均值和标准差，记为：Mk科考生（基础）和 Sk科考生（基础）。

5. 通过使用语文、数学、英语建立的桥梁Zk科（基础），需要将选考科目分数校准到基于基础分的量尺上。

①该公式中的1 和2 指第一次考试成绩和第二次考试成绩。将k 科标准分的平均值校准到

R是Zk科与Z语、Z数、Z英的多重相关系数（即 k 科与基础科整体的关系），也是Zk科和Zk科（基础）的皮尔逊相关系数（Zk科与其基础分之间的关系），通过此公式将k 科标准分的平均值和基础分的平均值建立连接。

②将k 科标准分的标准差校准到

k 科考生的基础分方差为 Sk科考生（基础），Zk科的默认方差为1，通过使用Zk科与其基础分之间的关系R 对二者的方差做了一个加权平均，通过此公式将k科标准分的标准差和基础分的标准差建立连接。

③使用第①步计算出的Zk科，和上面计算出的校准平均值（基础）和标准差（基础）计算校准分数，计算公式如下：

6. 语文、数学、英语使用第1 步的Z 分数计算每个考生的增值，用第二次考试的Z 分数减去第一次考试的 Z 分数，即 P科=Z科2-Z科1；选考六科使用第 5步的校准分数计算每个考生的增值，使用第二次考试的校准分数减去第一次考试的校准分数，即Pk科=①该公式中的1 和2 指第一次考试成绩和第二次考试成绩。。

7. 以教学班级为单位（语文、数学、英语为行政班级），计算 P科（或 Pk科）的平均值，得到教学班级平均增值。

8. 根据教师所教班级，计算教师所教所有班级的平均增值，得到教师教学增值。

三、评价方法应用

为了验证该方法的适用性，使用某中学的实际数据进行理论假设验证，并计算结果，将其结果与该学校整体教师绩效评价体系其他维度指标结果进行对比，探讨该方案的实用性。

（一）前期调研

通过结构化访谈，对该学校教师绩效评价的困境和难点进行调研，访谈的结果显示，该学校主要问题在于使用学生原始成绩和排名计算的教师教学质量通过加权后，在整个教师绩效评价体系中起到了决定性作用，这是由于使用原始成绩和排名没有经过分数处理，与其他维度如学生评价教师、教师互评等的量尺尺度差异较大，如全校教师教学质量分数极差为5，标准差为1，而学生评价教师的分数极差为1，标准差为0.1，二者在教师绩效评价体系中的权重相当，教师教学质量分数则起决定性作用，使其他维度无法发挥有效作用。并且使用原始成绩和排名计算教学增值本身也存在科学性问题。针对该学校的情况，使用第二部分的统计处理方法计算教师教学增值，作为教师教学质量维度。该中学初中年级所有学生均参加各个科目的考试，适用于标准分数的评价方法，使用初二年级的数据进行验证和计算结果；高一和高二年级将参加高考改革后的高考，即不进行文理分科，而是从六科等级性考试科目中选择三科，适用于校准分数的评价方法，使用高二年级的数据进行验证和计算结果。

（二）数据验证

使用标准分数计算教学增值需要满足分数分布符合正态分布，使用初中某年级五个科目的两次考试成绩，各科各次成绩的分布基本符合正态分布，可以使用标准分数进行计算。

使用校准分数计算教学增值，语文、数学和英语三门基础科的分布需要满足正态分布，选考科目与基础科的多重相关系数要在0.3-0.9 之间。为了验证该学校是否适合使用校准分数的评价方法，使用以往多次文理分科的数据验证物理、化学、生物、政治、历史和地理六科与三门基础科的相关是否稳定，结果显示：六科与三科基础科的两两相关基本稳定，六科与基础科的多重相关稳定，物理与基础科相关为0.7，化学为 0.6-0.7，生物为 0.6-0.7，历史为 0.4-0.7，地理为0.4-0.5，政治为0.6-0.7。然后使用高中某年级选课走班后的数据验证也基本符合这种趋势，说明该学校分数特征符合校准分数的弱假设，可以使用该评价方法。

（三）评价结果

使用第二部分的数据处理方法，计算出该中学初中某年级和高中某年级所有教师的教学增值分数。通过由学校管理层和年级部主任参加的座谈会讨论验证，两个年级的教学增值分数结果和主观预期基本一致。该中学初中某年级教学增值分数极差（最大值与最小值的差）为0.4，标准差为0.1，高中某年级教学增值分数极差为0.8，标准差为0.2，将其与教师绩效评价的其他维度如学生评价、教师互评、管理层评价等维度对比，量尺相当，可以进行比较，这样可以充分发挥每一个维度的作用，体现该评价体系多元评价的初衷。将教学增值作为教学质量分数应用到整个教师绩效评价体系中，还需要根据教师绩效总分和各维度权重对教学增值分数进行调整。

四、讨论

本研究从解决目前教师绩效评价的难点和关键点的角度，提出了使用标准分数和校准分数计算教师教学增值作为基于学生成绩的教学质量评价方法，该方法具有理论支撑，同时也能够符合应用的实际和需求，为我国目前教学质量量化评价提供了一条可行途径。需要特别指出的是，教师绩效评价不能仅关注于以学生成绩为主的教学结果，还应该关注教学过程和教师的思想情感等多个方面，建立多元的评价体系，克服 “唯分数” 的评价观。评价过程中过分强调结果产出并不能反映教师的实际投入和真实绩效，甚至产生短期行为[4]。在访谈的过程中，该中学原有的教学质量评价的影响权重比较大，确实导致教师在教学中过度关注学生成绩的行为。也有研究指出，教师的工作量、工作质量、外显工作成果和工作资历等均对教师分配的公平感有影响，教师对自身工作绩效的认知是综合性的[5]，所以学校不能仅使用一种指标来确定教师的绩效，如果某一种指标不合理的权重或计算方法导致其占绝对优势也会产生消极的作用。改进中小学教师评价应从教师发展的角度出发，建立多维度的教师绩效评价体系，包括教师、学生、管理层甚至家长等多元评价主体应参与其中。有调查显示，在义务教育学校里，绩效考核的指标设置、指标权重等问题均存在一定分歧，考核办法得不到绝大部分教师认可与肯定[6]，所以尤其要让教师在绩效评价中发挥主体作用，加强绩效评价培训，增强评价程序的透明度，从而使教师绩效评价对教师形成良好的激励机制，在促进教师专业发展上发挥作用，提升教师满意度，从而提升学校教育教学水平。