学生评教的元评价研究

2017-05-18蓝欣韩娣

职业技术教育 2017年5期

蓝欣?韩娣

摘要当前学生评教被广泛应用且被赋予重要地位。以X大学的学生评教为个案展开元评价研究，其学生评教中存在学生遵循的标准与学校设计的指标体系脱节，学生评教组织实施与结果反馈无法让学生感到评教的意义等问题。改进评教工作，建议以教学满意度调查代替现有的大面积学生评教工作，鼓励教师自觉运用“自我评价”的方法评价与改进教学，同时要科学运用评价技术，慎重对待评价结果。

关键词学生评教；元评价；教学满意度；自我评价

中图分类号 G712 文献标识码 A 文章编号 1008-3219（2017）05-0057-05

很多学校将学生评教结果作为教师评价的重要指标，学生评教被赋予重要地位并被广泛使用，因此有必要对其进行科学评价，即学生评教的元评价研究。所谓元评价就是对评价的评价，也叫再评价，是指“按照一定的标准，运用可行的科学方法，对教育评价方案、教育评价结果和获得结果的过程进行分析，从而对教育评价做出价值判断，也就是对教育评价的科学性、有效性和现实性等进行的评价”[1]。由于X大学一直重视学生评教工作，将其作为教学质量保障的重要措施之一，学生评教模式也具有一定的代表性，所以我们对X大学的学生评教进行了细致的调查与分析。

一、X大学学生评教模式与内容、研究工具与信息采集

（一）评教模式与评教内容

评教模式。学生评教时间点：每学期进入期末复习阶段开始，期末考试前结束；学生评教范围：每个学期、每个学生对每个任课教师进行评教，即每个学生参与的对其每个任课教师的全员评价；评教方式：学生登录教学管理信息系统进行网上评教；结果反馈方法：学生评教结果在每学期初面向被评价教师个人及教学单位相关负责人员反馈，教师通过教务管理系统查询评教结果及学生的评价意见。评教结果的使用：学生评教结果作为教师教学质量评价的重要依据。对教师教学质量评价结果排序前30%的教师且学年评价分数在85分以上者，定为A级教师，给予表扬与鼓励。后10%的教师，在职称评审、评优等方面可能有不利影响。

评教的指标体系。X大学的评教指标体系从教学管理的内容与过程出发，将评教指标分为课堂教学管理、教师个人素养、师生关系及教学内容、教学环节、教学方法六个子项目，20个问题。其中课堂教学管理（课堂纪律、学生出勤与时间控制）、教学内容设计（教学目标、重点难点、进程设计等）与教学方法、手段（理论联系实际、教学设备運用等）各4个问题，关于教师素养（教态、着装、语言表达、人格魅力等）和教学环节（备课、教材选用与作业批改、辅导答疑）各3个问题，关于师生关系（师生互动与信息反馈、尊重学生）2个问题。

评教问卷采用李克特量表，每个问题有五个选项：很满意、较满意、一般、不太满意、很不满意，分别赋值为5分、4分、3分、2分、1分。学生对同一教师在20个问题上的评分之和即为该生对该教师的评价分数，介于20～100分之间。而授课班级所有学生的评教分数的算术平均数就是该班学生对该教师该门课程的评教结果。

（二）研究工具与信息采集

本研究的主要研究工具是问卷《学生评教问题调查》和X大学教务管理中的学生评教信息。X大学学生评教系统是其教务管理系统的子系统。根据研究需要，笔者获得有关部门特别授权，可以调取其中任意班级学生的评教信息。

《学生评教问题调查》为自编问卷。它是基于初期对学生、任课教师的访谈及本研究的基本假设编制而成的。主要包括四部分内容：被调查者的属性（如年级、专业类别、性别等基本特征）、学生对评教工作的主观感受与主观认识（9个问题）、学生评教的客观行为（2015-2016学年第一学期学生评教的实际情况，3个问题）和学生信仰的“好教师”特征。

抽样与信息采集。本研究以X大学所有本科在校生为调查对象。按照下述步骤抽取样本并采集信息：第一步，通过学生评教信息系统调取2015-2016学年第1学期的评教信息作为学生评教质量分析的基础数据。以教师授课班级为单位，按照年级、专业类型进行分层整群抽样，共涉及4个年级、8个学院、42个自然班、19个授课班级（部分课程为几个自然班的合班课，称之为授课班级）。第二步，在所抽取的班级中进行问卷调查。问卷调查自2016年3月中旬开始，历时近一个月。问卷调查选择学生能够安心作答的时间和场所，当场填写、当场回收，较好地保证了问卷调查的回收率与有效率。调查共发放问卷1550份，回收问卷1504份，剔除无效问卷137份，共获得有效问卷1367份，有效回收率为88.2%。样本的人口学变量统计如表1所示。

问卷含一对检验收集数据信效度的配对问题，其相关系数为R=-0.699**，达到中等相关，说明所收集数据质量基本良好。

二、学生评教质量分析

（一）学生评教结果的总体分布

本次调查共涉及19个授课班级的76门次课程，评教的最高值为98.05分，最低值为74.11分，总平均值为92.88分。舍去2个离群值74.11分和81.44（74.11的标准分Z74.11=-4.48，81.44的标准分Z81.44=-3.25，均在3个标准差之外，故可作为离群值舍去），得到74门次课程学生评教结果的总平均值为93.28分，标准差为3.36分，标准误为0.39分，其总体分布如图1所示。74门次课程中有64门次（占85%）课程的评分高于90分，低于90分的只有10门次，全距为16.61分。

以授课班级为单位，统计同一班级学生对不同教师评价最高分与最低分之差（DR）（该指标粗略地反映了同一班级学生对不同任课教师评价的差异情况），DRmin=0.98，DRmax=12.2，其分布情况如表2所示。19个授课班级中有10个班级的最高评分与最低评分之差小于5分，大于10分的仅有2个授课班级，很多教师的学生评分只有1～2分之差。因此，以如此微弱之差异评价教师教学水平的高低是值得商榷的。

表2 各授课班级学生评教差异情况

R 0-5分 5-10分 10分以上合计

授课班级数 10 7 2 19

注：这里以同一授课班级所有课程评教结果的最大值-最小值作为全距R，表示学生评教的差异。

（二）學生评教的信度分析

以同一班学生对同一组任课教师教学评分的一致性程度，即评分者信度评价学生评教的信度，它反映了学生对教师教学水平做出评价时所遵循价值观念与操作规则的一致性程度，是反映学生评教质量的基本指标。

以所调查学生班级在2015-2016学年第一学期的评教结果为基础数据，借助SPSS统计软件，计算学生评教的肯德尔和谐系数W。结果显示，所调查的22个授课班级中，最小值W=0.586，最大值W=0.895，其中有5个班的Kendall W系数>0.8，14个班的Kendall W系数介于0.7～0.8之间，只有一个班低于0.6，因此总体上学生评教的评分者信度尚好。

（三）学生评教效度分析

以评教问卷所欲测量的与实际所测量到的信息的一致性作为学生评教的内容效度。本研究不是对效度系数的直接计算，而是对学生评教操作过程的规范性、有效性来反映这一质量指标。学生评教时所遵循的评价标准、价值取向、规范操作是高效度评价的基本保证，反之就会影响效度。

根据问卷调查之前的学生、教师访谈了解的信息，将学生评教主要的不规范行为归纳为“请同学代为评教”“随便地应付差事”“凭感觉而非指标打分”三类。《学生评教问题调查》设置三个是非选择题，了解学生在问卷调查前刚刚结束的评教活动（即2015-2016学年第一学期）中上述问题的发生率。

从总体情况看，有4.95%的学生是“请同学帮忙”完成的；20.4%的学生“随便地应付差事”；71.8%的学生是“凭感觉而非指标打分”的。以授课班级为单位的统计显示：有8个班“请同学帮忙”的比例超过5%，最高达到12%；“随便应付差事”的比例有10个班超过20%，最高达到52%，只有一个班低于5%；“凭感觉而非指标打分”的情况最为严重，最低43.9%，最高90%。

凭感觉而非指标给教师评分使得学校所要评价的与实际所测量的内容之间不一致，一定比例的学生请人帮忙、应付差事的做法加大了学生评教的误差。因此，X大学的学生评教信度虽良好，但效度不高。

三、学生评教情况的问卷调查结果分析

《学生评教问题调查》除了上述学生评教行为调查，反映了评教效度问题外，还对学生的主观感受主观认识、学生信仰的“好教师”特征进行了调查，结果分析如下：

（一）关于学生主观感受与主观认识

关于学生评教的必要性：969名（71.2%）学生对学生评教的必要性持肯定态度，极为明显地高于持否定态度的203人（14.9%，卡方=582.104**）。关于参与评教工作的意愿：820名（60.5%）学生表示愿意或比较愿意参加评教工作，极为明显地高于不愿意或不太愿意的314人（23.2%，卡方=295.571**）。关于学生对自身评教行为的评价：问卷要求学生对自己的评教是否“总是客观公正、认真负责”进行自评，结果1073名（79%）学生做出了“总是”或“基本是”的肯定回答，极为显著地高于127人“完全不是”或“基本不是”的否定回答（卡方= 909.561**）。关于评教实际效果：1357名回答了此问题的学生中有502人（37.0%）认为评教没有对教师教学产生积极影响，实际效果不明显，极为显著地高于持肯定态度的367人（27.0%，卡方=271.58**），多达488人（36%）的回答是不置可否。关于评教结果泄露的担心：有589人（43.6%）顾虑教师看到评教结果而影响成绩，所以多数情况都是评高分。这或许就是评教结果普遍偏高，评分结果差异小的原因。

可见，学生总体上是肯定评教的意义的，也有意愿参加评教工作，而且认为自己的评价是客观、公正、理性的。但对评教的实际功能发挥是否定态度，也有相当比例的学生因担心评教结果影响成绩，而尽量不给老师打低分。当然，其余没有表达“有必要”的28.8%、没有表示愿意参加的39.5%、没有肯定自己评教是“客观、公正”的21%的学生也是不容忽视的客观存在，如果他们以负面的评教行为对待评教工作，势必对学生评教的信度与效度产生重大影响。

（二）学生信仰的“好教师”特征分析

《学生评教问题调查》中根据学生评教指标体系所涉及的六个维度归纳了9个优秀教师的重要特征，要求学生从中选择自己满意的好教师应具备的最重要特征（限选5个），并由“第一重要”到“第五重要”排序。被列为“第一重要”的赋值5分，依次递减，“第五重要”的赋值1分，未被列出的赋值0分。1331人赋值结果统计如表3所示。

排位最高的是“实践经验丰富，技能水平高，确能给予学生指导与帮助”，其次是“讲课充满激情，富有活力”，第三是“工作态度认真负责、细心严谨”。相反排位最后的“举止端庄，为人师表”，第八“严格教学管理，课堂驾驭能力强”，第七“学识渊博，学术水平高”。

表3 学生满意的教师特征调查

N 和

x4.6实践经验丰富，技能水平高，确能给予学生指导与帮助 1331 3364

x4.3讲课充满激情，富有活力 1331 3110

x4.1工作态度认真负责、细心严谨 1331 2768

x4.8尊重学生，与学生平等沟通 1330 2567

x4.9教学方法得当，语言表达能力强 1330 2411

x4.2耐心教导学生，对学生负责 1331 2357

x4.5学识渊博，学术水平高 1331 1835

x4.4严格教学管理，课堂驾驭能力强 1331 763

x4.7举止端庄，为人师表 1331 758

从这一统计结果我们可以看到：

一是学生更看重教师的实践经验或技能水平的高低，而对教师的学术水平高低反而不是很重视。这一结果与X大学的重视实践技能培养，“动手动脑全面发展（从“动手动脑全面发展”的提法看，“动手”先于“动脑”，实践重于理论，是该校一种教育理念与教育价值的反映。）”的校園文化相一致，也反映了现实社会中工具理性对大学生价值追求的影响。

二是与严格的课堂控制相比较，学生更喜欢能以其内在的教学魅力吸引学生的教师。“讲课充满激情，富有活力”被学生列在第二位，而“严格教学管理，课堂驾驭能力强”却被排在倒数第二位，反映出学生喜欢有激情、有活力，真正具有感召力的教学，而过于“严格教学管理”反而容易引起学生的逆反，特别是经常花费大量时间点名签到，而教学平平的教师很可能引起学生的反感。这反映了学生厌恶被约束、希望得到尊重、理解与信任的情感需求。

三是与举止端庄的外在形象相比，对待工作认真负责、严谨求实的职业精神更能赢得学生的尊敬。“工作态度认真负责、细心严谨”被排到第三重要特征，而“举止端庄，为人师表”被排到倒数第一的位置，说明认真对待每个学生的疑问，认真评判每个学生的作业并给予清晰的标注、点评或鼓励，在学生看来弥足珍贵，应该得到教师的重视。

四、X大学学生评教工作存在的问题与对策建议

（一）存在问题分析

1.学生实际遵循的评教标准与学校设计的指标体系脱节

一方面，79%的学生认为自己总是“客观、公正、理性”地进行评价，另一方面学生评教的不规范行为又较为普遍地存在。应如何解读这样的信息呢？

课题组在部分学生班级进行访谈，学生较为集中地反映了如下意见：第一，因对某些评价指标的意思不很明确或不很理解，不得不根据感觉而非指标评价；第二，部分学生认为以相同的指标评价不同风格教师、不同类型课程是不合理的，不应该局限于指标体系；第三，评价指标过于繁琐，按照指标逐条评价的意义不大。所以学生认为虽然是根据自己的感觉而非指标进行评价的，但并非没有依据的随意评价，其结果反映了自己对教师教学的意见，所以是客观公正的。

可见，学生评教通常是依据其“总体感觉”打分，反映的是学生对教师教学活动的感知效果与他们的期望对比而形成的感觉状态，即学生的教学满意度。而学校所要评价的是教师的课堂教学管理、个人素养、师生关系及教学内容、教学环节、教学方法等。两者虽有一定的相关性，但从内涵到外延，两者之间的差异是明显的。

2.学生评教组织实施、结果反馈存在的问题影响了学生评教行为

关于学生对评教的主观感受与主观认识、学生的评教行为的调查，分学科、性别的统计检验均未发现显著差异，只在分年级的方差分析中发现极为显著的差异，即学生对评教工作的态度与做法随着年级的升高而出现显著变化，呈现出随着年级升高，学生的重视程度下降，不规范的评价行为增加的现象，评教质量不高。认为评教很有必要或较有必要的学生比例由一年级的81%（265人）下降到四年级的64.5%（136人），而持否定态度的学生比例则由7.6%（25人）上升到22.3%（47人）。认为评教“非常有效或比较有效地”促进了教师教学水平提高的学生比例，由一年级的66%下降到四年级26.3%，而否定的意见则由一年级的11.7%增加到四年级时的40.6%。学生对评教有效性的评价在年级间存在极为显著的差异（Pearson 卡方=92.832**）。学生“愿意或比较愿意”参与评教的比例由一年级的74.1%下降到四年级的43.7%，而“不愿意或比较不愿意”的比例则由一年级时的11.4%增加到四年级时的37.2%。学生参与评教工作的积极性在年级间存在极为显著差异（Pearson 卡方=71.471**）。学生“随便应付”、“根据自己的感觉而非指标打分”的不规范评教行为也随着年级的升高而愈发严重，如表4所示。究其原因，是因为每学期一次的评教工作无法使其成为师生间信息交流的有效渠道，滞后的评教结果反馈模式无法令学生感受到评教的意义，学生作为评价者却觉得“与己无关”，这无疑影响了评教的质量。

3.学校与学生对教师教学要求存在差异，影响评教效度

从评教问卷的分析中，可以看到学校对教师的课堂讲授、课堂组织与管理等课堂上的教育教学行为，对备课、作业批改、辅导答疑、教材选用等教学环节均有明确要求。学校组织评教活动的目的之一就是规范教师的这些教学行为，进而达到提高教学质量的效果。

而学生根据自身的“感觉”给教师的评价，实际上是学生感知到的、教师课堂教学行为满足其学习需求的程度。与学校对教师的要求不完全一致。两者之间虽然相关，但出发点不同。学校的评价指标主要是教学管理视角下对教师教学行为与教学态度的要求，而学生评教则是“消费者”视角下教师教学行为能够满足其需要的主观感受。教师如果仅仅拘泥于学校对教师教学的规范要求，忽视学生的客观需求，就很难获得学生的好评。例如，很多学生就喜欢板书而不使用PPT课件的数学老师、物理老师，与学校要求“灵活使用多媒体设备”的规定不一致。

（二）改进学生评教工作的对策建议

第一，以教学满意度调查替代现有的大面积学生评教工作。评价本身是一个价值判断过程，但科学评价是具有共同价值选择的评价者，以客观信息和科学方法为基础，对被评价者某一属性所做出的判断。因学生对教师“课堂教学质量”的价值选择不同，通常采用的学生给老师打分的“评教”充其量不过是学生对教师课堂教学满意程度的民意调查，并非真正意义上的教学评价。因此，学生给教师教学打分应侧重于是否喜欢老师的教学，是否从中有所收获，是否因教师的教学而喜欢上相关专业内容或方法，而非对教师具体教学内容、教学方法等专业性评价。这种对学生的民意调查同样能够反映教师的教学质量，因为学生普遍不喜欢的课程不可能是教学质量高的课程。无论教师水平多高，不能得到他的服务对象——学生的满意就不能说是成功的。

第二，学校要采取措施，鼓励教师自觉地运用“自我评价”的方法评价、改进与完善教学活动。自我评价是人们对自己的能力、状态和发展趋势的评价，具有自我发展、自我实现、自我完善等重要功能[2]。现在的评教无论是被评价的教师，还是参与评价的学生都是被动的参与者，影响了评教功能的发挥。教师在教学活动中经常性地倾听学生意见，随时地了解学生需要，自己对自己教学的优劣、长短进行反思与强化，无疑对于改进教学方法、提高教学效果具有重要意义。每学期一次的学生评教由于其滞后性使得教师失去了调整、改进的机会，学生失去了获得更满意教学的机会。只有教师自觉地运用自我评价的方法才能真正达到促进教与学共同提高的目的，让教师与学生都能在评价中受益。

第三，要科学地运用评价技术，慎重地对待评价结果，避免简单地按照分数排队的做法。任何形式的评教活动其目的都是帮助教师发现问题，改进教学，而非打分、排队。本末倒置简单地以分数高低评价教师的教学不仅无法实现评价目的，还可能给教师带来过大压力，导致不敢管学生、一味迎合学生的现象。对于学生满意度低、确实存在问题的教师，应充分发挥基层教学组织、教学督导部门的督导作用，通过深入课堂听课，帮助教师找到问题及其解决的办法。只有这样才能真正发挥评价的功能。

参考文献

[1]王汉澜.教育评价学[M].河南：河南大学出版社，1995：422.

[2]何云峰，胡建.自我评价的多维哲学思考（笔谈）——自我评价的功能和作用[J]. 湖南师范大学社会科学学报，2007（5）：16-20.