高校师生互评“分数膨胀”的博弈分析
2014-05-25时广军
时广军
(中山大学 教育学院,广东 广州510275)
1 “分数膨胀”概述
1.1 “分数膨胀”现象
分数膨胀指的是“在一个较长的时期,学生的学业成就并未提高,但其得分却明显上升的现象”[1],同时,教师的绩效评分也随着上升。美国的高等教育质量一直领先于世界,但在20世纪60年代,美国较早出现了“分数膨胀”现象。当时,得分过低的学生会被应征入伍参加越南战争,教师出于仁慈考虑提升学生成绩,并渐渐导致分数普遍提高。在1969年,美国杜克大学超过25%的学生拿到的成绩是C,而在2003年,得C 的总数不到10%。另外,哈佛、哥伦比亚等高校学生50%以上得分都是A,拿D 和F 的学生合计不到2%[2]。可见,“分数膨胀”在当今美国教育中变得越来越突出。
我国教学评价始于20世纪80年代,但“分数膨胀”也很明显。据一大学的抽样调查显示,2007—2009学年六个学期内,评教平均得分均在80 以上,某教师的学生评价为87 分,但在该校参评的732 门课中,其排名仅为585[3]。学生得分与教师得分偏高,偏离实际情况。可见,随着我国高等教育的大众化,更多的人获得了深造的机会,但教学质量是否能够带来预期的人力资本投资效益,这是一个值得思考的问题。
1.2 “分数膨胀”与评价活动
“分数膨胀”是评价过程中扭曲的利益驱动造成的,不同的利益需求会产生不同的评价行为。因此,对评价行为的解释是剖析分数膨胀现象的关键。教师与学生是教学的两大主要力量,他们参与评价活动有着重要的价值。
(1)评价的权力。我国《教育法》规定,教师享有“指导学生的学习和发展,评定学生的品行和学习成绩”的权力。教师主要的职责是传授知识与技能,这就决定着其应当具备对学生所掌握学习内容的考核权,进而为调节教学行为提供依据;对学生来说,随着“教学民主化”思潮的普及,肯定学生在校园内的地位变得越来越明显。法律赋予学生维护自身合法利益的权力,特别是随着教育“市场化”程度的加深,在支付学费购买教育资源后,学生作为消费者有权提出改进教学质量的意见。
(2)评价的价值。教师是教学活动的一线参与者,与课程、教学设施、教育计划等都有着密切的联系,同时也是与学生接触最直接的群体,因而给学生的评价往往更实际些;而学生评教可以起到规范、诊断、约束作用[4],增加学生的评价比重,可以促使评价主体的多元化,反映教育最大消费者的意见,进而发现更多的问题,最终为自我提高和教育质量的改进提供依据。
(3)评价的能力。教师是传道、授业、解惑的育人岗位,教员进入该岗位会进行相应的培训与考核,因此他们有着成熟的评价能力;对于学生的评教能力,虽然具有一定的争议,但总体上大多学者都认为学生能够进行评教活动。Marsh & Ro che 等认为在控制好相关变量的情况下,学生能够有效地评价教师的教学[5];Berant 等调查表明学生评教分数与上级评价、同事评价之间有着较强的相关度,学生评教有着较好的外部效度[6]。总之,大部分高校学生已满18 周岁,有着完全行为能力,在接受一定的指导之后是可以进行评教活动的。
2 “分数膨胀”的博弈分析
2.1 博弈论的概述
博弈论是一种“游戏理论”,最经典的就是“囚徒困境”。它是由匈牙利数学家约翰·冯·纽曼提出来的,指在一定的行为规则下,各参与人依靠所掌握的信息,基于对手可能采取的行动,进而选择自己的行动,以实现利益最大化的一种行为相互作用理论。博弈的过程是一种预测与选择相加的过程,通过推测调节行为以实现利益均衡,该过程包括三个因素:参与人、策略组合和博弈所得。博弈现象的出现应具备三个假设:一是有两类参与主体,且各自都有完全的行为自主权;二是“理性经济人”,追求利益的最大化;三是能够预测行为收益,能够进行策略组合之间收益的衡量。另外,博弈可以划分为不同的类型:根据信息结构,可分为完全信息博弈和不完全信息博弈;根据过程,可分为静态博弈和动态博弈[7]。本文主要考虑双方博弈一次的完全信息静态博弈。
2.2 “分数膨胀”的博弈运作机制
(1)参与人。在高校“分数膨胀”现象中,该博弈涉及两个参与主体,即教师与学生。且双方都为理性人,追求自身利益的最大化,并基于此来调节与选择自身的评价行为。另外,教师与学生有着完全自由的行为能力,能够很据自己的价值判断与喜好进行行为,进而为博弈过程的产生提供基础。
(2)策略组合。评分的博弈过程中,在利益方面,教师与学生均有两个策略:妥协和不妥协。妥协是指教师或学生放低评价标准,带给对方较高的收益;不妥协是指教师或学生严格执行标准或遵从某种看法,不轻易给对方好处。基于此,在评分方面,教师与学生也有两个策略:客观和主观。客观是指教师或学生基于实际真实情况给对方打分,主观是指教师或学生随意给对方打分,忽视实际情况。两种对立的策略为双方的博弈提供了基础。
(3)博弈所得。假设学生知道评教得分会影响到教师的相关人事变动,对教师发展有着重要的影响。同时教师也知道课程成绩对学生很重要,与其评奖学金、深造、就业等有很大的关系。因此,在彼此利益相互依附的情况下,会得到一个博弈矩阵。假设教师与学生在彼此妥协时的收益为P,如果一方妥协而另一方不妥协,那么妥协的一方会因为对方的不妥协而损失利益D,不妥协的一方会因为带给对方损失,担心报复等而产生心理压力成本C[8](如表1所示)。
表1 师生利益的博弈矩阵
在这个博弈中,双方采取妥协与不妥协的策略,其中左侧为教师的收益,右侧为学生的收益。一般来说D <C,因为只有心理压力成本高于实际损失时,参与主体才会采取不妥协的行为。简单来说,假设学生因不妥协给老师造成损失,此时他担心老师报复,心理预期老师会给其造成损失是30,实际老师造成的损失为20,低于其心理底线,这时他就会考虑不妥协。但是,参与者是理性人,会尽量追求自我利益的最大化,都不愿损失自己的利益而成就别人利益最大化,为避免潜在的危险因素,参与者会形成一种默契,选择(P,P)的策略,即双方都妥协。这种均衡虽然是教师与学生利益获取的最佳组合,但却是最不应该出现的结果,因为它掩盖了实际情况。
妥协与不妥协策略造成了参与主体利益的变化。利益驱动行为,因此,参与主体在评分行为上将出现客观与主观的两种倾向。假设主观情况下,教师与学生的打分为A,如果一方主观而另一方客观,那么主观的一方会因为对方的客观而损失分值为B。由表2可知,为了获得较高的评价分数,教师与学生的最佳策略也是(A,A)。主观评分的扩大化将渐渐导致“分数膨胀”现象的产生。
表2 师生评分的博弈矩阵
2.3 评分博弈的原因
博弈论基于利益依附的角度,阐述了行为主体相互作用的运作过程。“分数膨胀”正是教师与学生在心理上博弈而产生的结果。因此,剖析师生之间博弈的原因是认识“分数膨胀”现象的有效方法。
(1)“评价”的价值定位不合理。参与主体之间的行为博弈是源于利益的分配,而利益的分配之所以受到如此重视,是因为“评价”的价值定位偏离。教学评价的初始目的是为教育质量的改进提供决策信息,发挥诊断、激励、改进和约束等功能。因此教学评价更应该是一种发展性的评价体系,帮助教学发现过程中出现的问题,刺激教师的专业发展,促使学校优化管理体制。但现实生活中,“评价”与教师的人事决策密切联系,往往单纯地成为高校的一种结果性考察工具。学校会根据学生评教的分数计算排名,以此来判断教师的教学绩效。之后更是将其与教师的奖金、晋升、工资等挂钩。这无疑给教师们带来了很大的心理压力,特别是那些保障较少的年轻教师。这也必然影响到教师日后教学的自主性,教师可能会为了迎合学生而降低教学标准,造成教学质量下降,远远偏离了“评价”的初始价值定位。
(2)信息交流不对称。博弈论注重的是行为之间的相互作用,而这种动态关系取决于一行为主体对另一行为主体所发信号的读取。之后参与的双方才能进行利益的平衡与策略组合的选取。“分数膨胀”的产生是因为“评学”与“评教”的主体教师和学生对彼此的理解错误而造成的。教师认为学生可能想要的只是一纸文凭,要求低、作业简单、管理松等是学生所期望的,只要满足他们的这些期望就可以获得较高的“回报”;另一方面,学生认为评教影响到教师的切身利益,打低分可能导致“报复”,或者为了表达不满,刻意打低分以指望能损害到教师的前途。师生之间错误的解读造成了信息交流的不对称,双发均从主观臆想出发采取评价行为,导致彼此所获评分都很高。但是从本质上来说,双方的实际收益很少。教师降低教学标准必然会减少学生的所学,学生盲目给高分也不利于教师的诊断与提高。最后,错误的评价信息还会阻碍教育体系的整体改进。
(3)“评价”机制本身的失效。教学评价是一套复杂的系统,涵盖了多种不易控制的变量。在相同的条件背景下,评价能够产生可用于比较的指标,但是评价的过程中会受到班级规模、课程性质、学生兴趣、管理体制等影响,这就要求我们的评价机制应当有针对性、差异性。而目前我国的评价一般是由教务处主导,各级单位按统一指标进行,这必然造成评价结果的区分效度较差。比如受个人兴趣的影响,学生对选修课的评分往往高于必修课,但这并不能表示必修课教师的教学质量比选修课的教师要差。既然评价机制不能有效地反映实际绩效,那么师生在博弈的过程中,也没有必要破坏合作关系,进行妥协轻易地获得较高评分似乎更为实际。比如教师不管怎么努力,学生并不看重仍按照兴趣来打分,那么教师就会降低课程标准,学生以为老师降低标准是给自己的一种信号,寻求评价时的妥协。这样双方便陷入了交流信息失真的漩涡,并渐渐衍生为师生间的博弈行为。
3 相关建议
(1)促使发展性评价与终结性评价相结合。教学评价的根本目的是为了改进教育,以提高人才培养的质量。因此,重视发展性评价就显得尤为重要。通过对教学过程的诊断,有针对性地发现问题,进而为学校和师生的发展提供方向。发展性评价是一种过程改进式的动态评价理念,强调的是时间序列上的提高,而不是最终的结果和状态。比如某班平均成绩为良,而A 生成绩为不及格,此时发展性评价就应该诊断A 生不及格的原因,判断整个教学过程哪些需要改进,而不是仅仅证明A 生不及格这一事实。但是,目前在我国完全忽视终结性评价也是不现实的。随着竞争的加剧,优胜劣汰是无法避免的。因此,也需要一定的结果性指标来进行筛选和排序,以保证稀缺资源的合理配置,同时也可以让被评价者了解自己的情况,强化奋斗的动机。由上可知,发展性评价与终结性评价不是绝对对立的,而是一种相辅相成的关系。我们需要终结性评价的静态指标来认识被评对象的过去,也需要发展性评价的动态视角来诊断问题,促使未来改进。只有这样,才能减少评价中的博弈心理,减缓“分数膨胀”现象。
(2)正确认识教师资本与学生资本。评分过程中博弈心理的产生是因为师生双方认为自己具有值得博弈的资本。只要自己牢牢把握住这种资本,就可以在博弈中获得发言权。师生博弈的资本可以分为:文化资本和社会资本[9]。文化资本是指师生自身所拥有的用来影响对方行为的知识储备、教学智慧、心理素质等财富。文化资本高,参与主体认为自己的主动权越大,参与博弈的信心也越大。比如教授认为自己的知识水平比讲师要高,学生评价时不会给自己低于讲师的分数;同理,一个学生认为自己上课表现积极,因此自己的得分不应该低于不积极的学生。社会资本是指师生认为自身所拥有的借助外力以影响对方行为的因素,比如学校评教系统、学生奖学金等。假设对于学生评价成绩倒数10%的教师,学校会扣除其年终奖,那么学生就会认为自己可以借助行政的力量影响老师。同样,假设学生为了评定奖学金对成绩有要求,教师也会视自己的给分权为博弈的资本。教师资本与学生资本不应该是对抗的,师生之间可以通过交流沟通的方式,明确彼此的真实想法与需求,正确对待自身的资本,配合评价工作而不是用来进行博弈。
(3)打造灵活多层次的评价体系。评价体系本身的不合理为博弈行为的产生提供了契机。而目前我国教学评价体系的最大问题是区分效度差,不能很好地控制影响变量,造成评价针对性不强。对此,可以将评价指标分为校级、院级、自选三个层次。校级指标是所有课程评估的必选指标,是共性方面,如课程整体印象;院级指标是各院系自行设定的核心指标,符合本学院的特色;自选指标是教师结合课程特点设计或选择的指标。通过这种方式,各级单位或个人能更有针对性地发现问题,尽可能地控制影响变量,从而在得到共性结果的同时也满足各级需求。另外为了降低成本,节省物力人力,可以设定专门的评价指标委员会,尽可能设计出涵盖较全面的指标体系,实施中由各级单位或个人进行选择或修订。在追求灵活性的同时也要保证效率。当评价体系本身越来越科学,更能反映真实情况的时候,留给博弈行为的空间也就越来越小,进而减缓“分数膨胀”现象的发生。
(4)健全评价的监督保障机制。行为的发生不仅取决于行为主体双方的意愿,也会受到外在因素的干扰。在评分博弈的过程中,如果有明确的监督保障制度来约束,就可能避免博弈行为的泛滥,抑制“分数膨胀”的发生或恶化;如果缺乏相应的约束,则可能会导致评价行为偏离原始目标。为此,一方面可以强化反馈机制,为那些得了负面评分的对象提供辩解和质疑的机会。只有这样,参与主体才能更加客观有效地评分,即使后期觉得自己受到“报复”,也可提起申述,进行改正。另一方面,也可以限定评价权,比如要求学生评教的分数要符合正态分布,进而使学生加以认真比较与衡量,保障评教权的有效性。只有强化相应的监督保障机制,才能在博弈行为发生时加以约束,增加行为主体的心理压力,使其不敢随意地给分,进而也使得评分更为可靠。
[1]李丽丽,李江霞.美国高校分数膨胀现象述析[J].黑龙江高教研究,2007(4):38-40.
[2]佚名.美国大学的“分数膨胀”[EB/OL].http://edu.gmw.cn/2012-02/04/content_3494513.htm.
[3]黄桂.分数膨胀与等级膨胀:评教系统双重失效原因探析[J].高教探索,2011(6):95-103.
[4]王婉萍.“学生评教”作用及其局限性研究[J].黑龙江高教研究,2005(2):71-73.
[5]Marsh,H.W.& Roche,L.A.Making Students.Evaluations of Teaching Effectiveness Effective :The Critical Issues of Validity,Bias,and Utility[J].American Psychologist,1997(52).
[6]Berant,Viozto C.Ratings of university teacher instrcution:hou much do student and course characteristic really matter[J].Assessment and Evaluation in Higher Education,2005(30).
[7]高迎平,沈志诚.基于博弈论的企业绩效考核评价模型研究[J].河北工业大学学报:社科版,2009(2):23-26.
[8]余萍.高校学生评教有效性的经济博弈分析[J].重庆交通大学学报:社科版,2012(6):42-44.
[9]杜志宏.博弈论视野下的和谐师生关系构建[J].浙江师范大学学报:社会科学版,2011(2):107-112.