高校学生评教制度及其效果探讨
2015-10-15周天芸姜禹杉
周天芸+姜禹杉
摘要:课程教学是高校人才培养的主要方式,课程教学水平和质量将会影响到大学生的专业能力,由此大多数高校建立学生评教制度,以反映和跟踪课程的教学质量,但很多高校在学生评教过程中出现一些异化现象。本文基于S大学的课程教学评价数据,应用统计方法检验影响高校课程评教的结果特征及其影响因素,深入分析学生评教异化现象的表象与原因,从而客观准确地评价高校的学生评教制度及其效果。
关键词:教学评价;学生评教; 影响因素随着中国高等教育改革的不断推进,高等教育的教学环境也发生重大变化,由这些方面引起的教育变革对高校的课程教学提出更高的要求。教学评估是根据一定的教学目标和标准,对教师的教学工作所进行的系统检测,并评定其价值及优缺点,以求改进和提升教学质量的过程。教学评估既是教学过程的重要组成部分,也是有效教学与成功教学的基础。
高校的学生评教是教学评估的固有部分,经历了从非制度化到制度化的过程。与教师同行评价、专家评价、管理者评价等相比较,学生评教更能反映课堂教学质量,且操作方便,因此在高等学校普遍实施。但是,学生评教制度的不完善及其实施过程的不科学,都可能导致高校学生评教的目的错位、内容失真、方法片面、结果主观等等问题,从而使得高校的学生评教流于形式。
有关学生评教的作用和效果问题,高校管理者、学者和高校教师一直存在着不同的看法,这种观点分歧不但限制学生评教的应用,也制约学生评教发挥改善课堂教学质量的作用。经过多年的实践,对于高校学生评教的制度设计与实施能否促进高校的课程教学,高校需要进行认真的探讨和更深入的研究,这对于发挥学生评教的作用具有重要理论意义和现实价值。
一、教学评价及其研究意义
教学评价是依据教学目标对教学过程及结果进行价值判断,并为教学决策服务的活动,教学评价是研究教师的“教”和学生的“学”的价值的过程。教学评价一般包括对教学过程中教学内容、教学方法手段、教学环境、教学管理诸因素的评价,是对教师教学工作的评价。
学者对学生评教的效度历来存在不同观点。以马夏( MarshH W.)[1]等为代表的观点认为学生评教是有效的,指出学生评教无效或存在较大偏差的结论是由研究方法缺陷引起,这些研究方法或存在缺陷,或所依据的理论不健全,或对各种偏差概念缺乏好的操作性定义,如相关分析中暗含因果推论、使用不适当的分析单元,忽视学生评价和潜在偏差的多变量性质,不适当的实验操作,不适当的操作定义等。研究变量的选择可能影响学生评教的结果,但并不一定会削弱学生评教的效力;相反,某些变量可能支持学生评教的结构效度。这些学者选择与学生评教的区分效度紧密相联的一些关键变量,如教师对学生的成绩宽大等是否影响学生评教等,发现学生评教无效和存在偏差是由实验研究的不足所导致的。
反对的观点则认为学生评教存在偏差,学生评教与有效教学的其它指标的相关性很小,学生评教只能解释学习成就15%左右的变化,由于其它与学生学习无关因素的出现,导致学生评教存在较大的偏差。为保证学生评教的公正性,学生评教的结果需做统计上的调整。格林瓦尔德(Greenwald A.G.)[2]等人是这种观点的代表人物,他们的研究揭示了学生评教所处的困境。根据统计分析相关的研究表明,1971年至1980年期间的研究多数认为学生评教无效和存在偏差;1981年至1985年的研究则多数认为学生评教有效;1986年至1995年的十年,认为学生评教有效与学生评教无效或存在偏差的研究各占一半。同时,研究发现教师给学生的评分是影响学生评教的重要因素,教师评分的松紧对学生评教有中等或中等以上的影响,学生学习成绩与其对教学质量的评价之间存在相关,其它无关变量也会影响学生的评教结果。这表明学生评教的科学性、可行性和有效性并没有得到确认,因此认为学生评教无效和存在偏差的观点也相当普遍。
同样,国内的学者、高校教师和高校管理部门同样对学生评教的效度持不同观点。现有文献大多肯定学生评教的作用,理由包括:第一,大学生具有一定的认识能力和判断是非的能力,绝大多数学生是公正客观的,能够对教师的课堂教学作负责任的评价;第二,学生评教参与的人数较多,从统计学意义上看,评价结果具有较高的可靠性;第三,许多高校开展课堂教学质量评估的实践证明,学生评估结果是客观可信的。实证研究表明,学生评教的信度值达0.82,说明学生评教结果具有一定的稳定性和可靠性。[3][4][5][6]
但也有学者对学生评教的价值和客观公正性提出质疑。有些研究认为,学生评教的结果并不一定合理,其原因是:第一,教学内容具有学术性,学生难以客观评判,因此评教结果不够准确。第二,学生评教会给师生关系带来负面影响,教师会降低对学生的要求,或任意更改教学大纲以迁就学生。有研究发现,人情因素严重影响学生评教的结果。多数学生以自己能否听懂来衡量教师的教学水平,当教学内容有一定难度,导致学生理解费力时,就认为教师的授课水平差;相反,如果教师降低授课难度,不论讲授的内容是否与课程有关,学生都可能认为教师的授课水平高。由此,学生的评教可能出现以偏概全的结论。[7][8][9][10][11][12]
虽然在教育研究的层面,对于高校学生的评教并未达成一致的观点,但在实践方面,中国大多数高校都有通过学生评教促进教学质量提升的制度设计和安排。学生评教的效果可能受到制度设计与制度实施中的一些因素影响,因此,本文结合S大学的学生评教数据,检验和讨论高校学生评教数据中反映的问题,以探讨高校学生评教的效果及其影响因素。
二、课程教学评价的指标设计
学生评教制度的设计依赖于评教指标及其体系,课堂教学质量评定指标应该具有客观、全面以及便于理解等特点。首先,应该建立在课堂教学客观规律基础上,体现学科教学的特点,体现教学的统一,减小主观因素对评价结果的影响;其次,结构上能够体现课堂教学的整体性,并力求做到评价项目、内容具体明确。因此,评价教学质量的指标体系通常包括三个方面,即教学内容、教学方法和教学效果。[13][14]
S大学全校开设五大类课程,并由学校对每位授课教师进行评教。教学评估指标分为一级指标和二级指标。一级指标涵盖课程质量评估各个方面的内容,其中涉及教学组织和实施内容的占50%,包括专业知识的讲授,教学内容的前沿性等,涉及教师责任心的占20%,教学互动、教师活力等反映教师个人教学风格的占30%;二级指标在一级指标的基础上规范和细化内容,使质量评估体系内容更加充实,条理性更强,具体评教指标见表1。
课程评教采取百分制,总分为100,对于各项指标,学生根据内容给予授课教师不同的评分。为了保证评分的准确性,在计算教学评分时会去掉最高的5%和最低的5%,通过计算中间的90%的学生评教分数,得出每位授课教师的评教得分。
S大学多年来坚持实施学生评教制度,经过多年的实践,改进和完善了评教的指标体系和评教实施方法,在教务系统中增加了评教的项目,要求选读课程的学生在系统中完成评教,具体实施方法是期末学生查询课程成绩时,学生必须完成评教,然后查询成绩。虽然这种制度安排使学生评教参评率得以保证,但由于和成绩查询绑定,部分学生比较反感,而且评分容易受到情绪、考试成绩预期等因素的影响。
理论上,S大学的学生评教指标具有一定的科学性和合理性,但在具体实施过程中,学生评教的效果如何,本文将从实证的角度进行探讨。
三、 S大学课程学生评教的数据分析
本文采用S大学2012年的本科授课课程的评教数据,探讨高校学生评教的结果和作用。S大学的本科课程包括公共必修课216门、公共选修课336门、专业必修课739门、专业选修课671门和实验课程204门,2012年参加学生评教的五类课程共计2166门。由于课程性质、参评人数等的不同,评教结果也有所不同,2166门参评课程的得分均值、中位数、众数等指标存在明显差异,具体见表2。
根据统计结果,S大学的公共必修类有216门课程参评,得分的均值为91.9分,平均与课学生数为227人,平均参评率为97.87%;公共必修类课程得分用方差衡量的波动性为5.17;其峰度为1.41,表明超额峰度为0;其偏度为-1.25,为左偏。总体上公共必修类课程得分趋进于正态分布。
公共选修类有336门课程参评,平均得分91.73分,平均与课学生数为130人,平均参评率为97.48%,用方差衡量的波动性为5.64;其峰度为5.99,表明超额峰度为3;其偏度为-1.78,为左偏,总体上公选类课程得分不服从正态分布。
专业必修类有739门课程参评,平均得分91.49分,平均与课学生数为88人,平均参评率为97.39%,方差衡量的波动性为8.99;其峰度为6.1401,表明超额峰度为3.14;其偏度为-1.85,为左偏,总体上专业必修类课程得分不服从正态分布。
专业选修类有671门课程参评,平均得分为90.9分,平均与课学生数为63人,平均参评率为98.26%,用方差衡量的波动性为10.50;其峰度为4.44,表明超额峰度为1.4;其偏度为-1.65,为左偏,总体上专选类课程得分不服从正态分布。
实验类有204门课程参评,平均得分为91.5分,平均与课学生数为127人,平均参评率为98.60%,用方差衡量的波动性为7.8437;其峰度为6.4039,表明超额峰度为3.4;其偏度为-2.09,为左偏,总体上实验类课程得分不服从正态分布。
根据课程评教结果的统计分析,可以发现,S大学的五类课程得分仅呈现细微差异,公共必修类课程和公共选修类课程的均分略高,专业选修课的均分最低。同时,公共必修类课程和公共选修类课程得分的波动性最小,实验课次之,专业必修课和专业选修课得分的波动性较大,公共必修类和公共选修类的参评课程和参评学生都高于专业必修类课程、专业选修类课程。
通过评教分数的统计描述可以发现两方面的问题。第一,评教分数过高,五类课程的平均分均在90以上,波动范围在90.89-91.92之间,无法体现教学质量的差别;第二,五类课程的评教得分均呈左偏厚尾分布,均不服从正态分布,表明评教得分落在低分区域的比落在高分区域的多,这与大部分数据的正态分布特征存在有差异。
四、影响教学评价因素的实证检验
由于五类课程的得分差异很小,统计数据很难发现评教中存在的问题,因此本文对评教数据做进一步的处理,试图发现影响高校教师教学评分的影响因素。由于五类课程的评教得分都呈现左偏厚尾,不服从正态分布,表明评教数据难以满足OLS估计的基本假设,因此本文尝试采用GLS回归的估计方法。
由于S大学的评教指标主要评价教师的教学态度、教学方法、教学内容等,因此本文结合教师的个人特质、学生参与评教等方面设计多元回归模型。根据相关研究文献,本文设计以下实证模型:
Score=β0+β1title+β2sex+β2zb+β3zx+β4gb+β5gx+β6sy+β7people+β8scale
其中score表示评教得分;title代表教师的职称,0代表助教、讲师和高级讲师,1表示副教授,2表示教授;sex代表教师性别,0表示女性教师,1表示男性教师; zb、zx、gb、gx、sy分别表示课程类型中的专必、专选、公必、公选和实验课程,本文采取虚拟变量的计量方式; people代表课程学生人数;scale代表课程参评率。评教得分为实证模型中的因变量;自变量包括课程性质(5类课程性质,用虚拟变量),教师性别,教师职称(是否高级职称),课程学生人数,课程参评率等。
首先,对全部评教数据进行怀特检验,结果在1%置信水平下显著,由怀特检验结果可知评教数据存在显著异方差现象。因此,本文的实证模型采用加权最小二乘法(WLS)进行估计,并得到表3的结果。
表3总体数据的估计结果
Coef(系数).P值title(职称)0.40370.000**sex(性别)-0.58790.000**zb(专必)-2.46110.000**zx(专选)0.02280.923gb(公必)0.75320.000**gx(公选)-0.33450.012*people(课程学生数)-0.00140.000**scale(课程参评率)-3.39930.000**cons95.62060.000**注:**表示在1%置信水平下显著,*表示在5%置信水平下显著。
根据估计的实证结果,本文发现:
(1)教师职称对教师评教得分影响显著,教师职称越高,评教得分越高,教师职称每高一级,评教得分则提高0.4分。这一结果一定程度反映教师职称越高,其教学质量越得到学生的认可,评教得分与教师的科研能力及对课堂的控制能力正相关,反映中、低职称的教师对大课堂的掌控能力相对较弱。
(2)课程类型中只有专业选修课不显著影响评教得分,专业必修、公共必修、公共选修、实验四类课程对评教得分的影响显著。学生评教打分不仅是教师的教学质量,还包括学生对课程设置的意见和学生自己的学业期望是否与教师及课程冲突等综合性的因素。从本文数据分析结果可以发现,专选课程得分最低,波动性最大,同时也最不显著。这是由于其他类课程中教师和课程的选择具有固定性和强制性,因此学生对课程设置的意见较小,对课程期望较弱,因此给分普遍较高,从而导致了评教得分过高且影响显著的结果。而专选类课程多是学生根据自己的兴趣爱好自主选择的,具有较强的主观期望和学习目的,当学生的课程设置和自己的学业期望相冲突时,会给较低的分数,且打分波动性变大,造成专选课程对教师评教得分影响不显著。
(3)课程学生人数显著影响评教得分。课程的学生人数越少,教师评分越高,学生人数减少一人,评教得分将提高0.0014分。这可能是由于学生人数多的班级授课,教师在多样化课堂教学活动、批改作业和师生互动上存在较大困难,因而导致授课教师难以顾及每个学生的需求,课堂效果不好;而对于学生人数少的班级,教师可以根据每个学生的学习基础、学习能力给予个别指导和调整教学的难易程度,课堂效果较好,从而评教得分较高。
(4)性别对教师评教得分影响显著,女性教师比男性教师的评教得分多0.5879。这是由于男性教师和女性教师在表达方式和教学风格等方面存在差别。男性教师更注重信息量的输入与授课的权威性,从而容易带有说教性质;而女性教师的课堂互动性相对较强,比较注重交流和沟通,因此,学生偏好女性教师的授课方式,从而给女性教师更高的得分。
(5)课程参评率对评教得分影响显著。课程参评率上升1%,教师评教得分下降3.3993%。这一结论说明此次评教数据可能存在偏差,由于个别学生放弃评教而对评教结果产生影响,因此评教指标体系仍需改进。
五、 结论与反思
基于S大学评教数据的统计分析,本文认为学生评教的客观性总体上比较欠缺。首先,学生评教具有一定的局限性。学生社会阅历较少,知识层面也较浅,对评教的看法和理解难免片面,导致评教结果容易失之客观。其次,学生评教具有主观性。由于评教通常采用匿名方式,学生在评教时容易受情绪影响,特别是评教时间安排不合理时,评教结果更容易失之偏颇。最后,学生评教具有偏差性。由于难以准确把握评教标准,学生评教分数高低差别很大,得分高低无法反映授课质量的差异,如90分的教师不一定比89分的教师的教学质量更高。微小的误差从统计学的角度是合理的、允许存在的,但对于评教结果的排序和质量等级的确定,却有着不同的意义。
在学生评教结果的使用方面,也可能存在一些消极影响。由于一些教师对学生的要求高或者评分严格,就可能使部分学生耿耿于怀,在测评时对教师的评价较差,评教得分较低,不可避免地会影响教师的教学热情。
总之,要发挥高校学生评教的作用,需注重制度安排和制度实施过程,制定相应的措施,以确保其作用的发挥。
第一,确立学生评教的目的。实施学生评教制度是为改善教学,提高教学质量,因此学生评教不应根据教师的为人和表象进行评价,而应根据教师的教学水平进行评教。学生评教应有利于加强师生沟通,促进师生和学校的共同发展,并引导教师正确对待评教。
第二,建立科学、合理和规范的学生评教指标体系。构建评价体系时,要科学地设计调查问卷,充分听取教师乃至学生的意见和建议,针对不同学科或不同专业的特点,提出客观、科学、系统、有效的评教指标体系。
第三,加强对学生的评教指导,建立健全学生评教的制度规范。学生参与评教和认真评教是评教成功的关键,帮助学生提高认识,树立客观、公正的态度,引导学生正确认识教学活动规律,认识专业或学科特点,认识教师年龄、性别和性格等方面的差异,理解教师多样化的教学风格,尽可能减少学生因个人主观好恶来评价教师,减少评教的随意性。
第四,科学地分析和使用评教结果。运用科学的方法统计并分析评教结果,避免简单、粗糙地使用评教结果。要考虑学科、专业特点,注意教师个人特质,区分学生差异。教学管理部门不能简单地排出教学优劣结果,以评教结果作为判断教师教学水平的唯一依据,而是应该仔细分析评教结果,结合评教得分的排序和变化,帮助教师分析教学的不足,并提出改进办法,以达到教学评价的目的。
综上,高校学生评教作为一种制度安排,具有提高教学质量的作用,但在其实施过程中容易出现一些问题,可能导致高校的学生评教无法发挥其积极的作用。因此,建立和实施学生评教制度,必须综合考虑和科学安排,并合理运用评教结果,才能切实发挥学生评教的作用,推进高校教育教学质量的提升。
参考文献:
[1]Marsh H. W.,Roche L. Making studentsevaluations of teaching effectiveness effective[J].American Psychologist,1997,52(11):1187-1197.
[2]Greenwald A.G. Validity concerns and usefulness of student ratings of instruction[J].American Psychologist,1997,52(11):1182-1186.
[3]刘杭玲.高校学生评教的有效性及保障措施研究[J].教学研究,2011(6):95-127.
[4]胡鹏,何冬兰.分工体系的深化及学生评教的转型发展[J].江苏高教,2011(5):88-90.
[5]付八军,冯晓玲.大学生评教客观度的调查研究[J].大学教育科学,2011(1):35-40.
[6]吴培群,陈小红.大学生评教的统计分析及其改革途径探讨——基于北京一所高校学生评教分数的统计分析[J].高教探索,2010(3):78-91.
[7]毛洪涛,敬丽敏,曾双宝.我国高校全员评教制度的困境与对策[J].中国大学教学,2010(3):64-67.
[8]黄桂.分数膨胀与等级膨胀评教系统双重失效原因探析——基于某部属重点高校大学生评教的视角[J].高教探索,2011(6):95-127.
[9]艾文国,王桂伟,关玉晶.高校学生评教系统改进研究[J].中国大学教学,2012(12):76-79.
[10]廖明,姜峰,郭燕锋.大学生对教学质量的主观偏好与学生评教体系的完善[J].中国高等教育,2012(18):49-50.
[11]周继良,汤其成.高等学校学生评教行为偏差研究——基于南京仙林大学城若干大学的分析[J].大学教育科学,2012(2):30-34.
[12]董泽芳,申晓辉.高校“学生评教”的困境反思与价值重构[J].教育科学,2013(2):47-51.
[13]周婷婷.国外部分高校学生评教指标体系分析[J].中国大学教学,2012(2):89-94.
[14]朱军,范慧慧.研究型大学学生评教指标体系建构中的若干关注点——基于复旦大学问卷调查的分析[J].中国大学教学,2012(8):69-72.