同伴效应研究中问题回顾
2020-02-06施鹏飞
施鹏飞
[提要] 同伴效应作为影响教育产出的一个重要因素,近年来被国内外经济学、社会学以及教育学高度关注。但是,由于同伴效应本身所具有的特性给同伴效应的识别增加了很多难度,近些年来随机试验以及自然试验的兴起给因果关系的识别带来曙光。本文从同伴效应的概念出发,介绍同伴效应估计的一般模型——均值线性模型。指出同伴效应估计过程中出现的三个主要障碍,分别是自选择、反向因果和机械关联性。回顾目前兴起的利用随机试验和自然试验识别同伴效应,从而展望新的研究方向和未来的新进展。
关键词:同伴效应;随机试验;自然实验;自选择:反向因果;机械关联性
中图分类号:F01 文献标识码:A
收录日期:2019年10月7日
一、引言
劳动经济学非常共同关注一个问题:究竟是哪些因素在影响学生的教育生产过程,从而决定其教育获得以及教育成就。总的来说影响教育的各种因素可以分为以下几类:一是学生个人的特征,如学生本身具有的能力特征影响了教育成就;二是来自家庭的影响,父母的教育程度在一定程度上影响了孩子的认知水平;三是所在学校的资源、师资、管理文化等方面的作用,学校教育存在异质性特点。以上三点影响教育的因素具有很强的稳定性,在短时间内改变比较有难度。影响教育生产第四类因素是学生的同伴这是较易于改变的,通过不同成绩水平的学生在各班级的重新配置,从而可能扭转学生教育获得的不利局面。
同伴效应是从同伴个体间交互过程中产生的一种溢出效应,这种影响可以来自于不同家庭背景之间的融合,也可以是同伴之间行为的互相影响。例如,如果一个同伴成绩相对突出,其他同学可以直接向他学习,还可通过影响教师的教学行为影响其他同学,包括同伴之间的竞争行为都是同伴效应。总的来说,同伴效应限制在一個群内,群内个体之间相互影响。这些研究的群体范围广泛,包括在高等教育,班级、年级以及学校内的同伴效应的研究主要在初等和中等教育,大学宿舍间的同伴效应。
二、同伴效应的估计模型
同伴效应估计过程中的最常见模型是线性均值模型,学生的结果变量是学生的背景特征(包括一些人口学特征)、同伴的背景特征、同伴平均结果的线形函数。这种模型具有简化分析的优势,方程一方面考虑到了同伴当前结果的内生效应,也考虑同伴背景特征的外生影响。这个模型是一个同质化的模型,也就是所有的学生背景和能力分布水平上同伴效应的大小固定不变。因为模型的简化,带来了估计的极大便利,均值线性模型也在实践中得到广泛应用。伴随着同伴效应的同质化和依照结果变量和背景变量均值线性变化的假设,线性均值模型在实证研究中也面临着两个主要问题。Hoxby(2000b)和Hoxby、Weingarth(2005)指出,一方面,从这个一般化模型出发,同伴结果和背景特征对群内个体的平均影响是固定不变的,因此不同个体在各个群体之间重新配置,影响的只是个体水平上和单个群体水平上结果的变化,不会影响所有群体总的结果。从福利角度出发,不同成绩和学习能力的学生在班级之间的配置不会影响总的社会福利水平。从福利水平角度,特别是想提高社会总体福利水平角度出发,这个同质化的模型可能不是太具吸引力。另一方面,从经验证据角度,研究者已经发现这种同伴效应事实上并不是依照均值线性变化的。一些文献存在这样的结论:最有能力的学生受益于有更多的高能力学生,而能力最差的学生实际上是会受到高能力学生的加入和低能力学生移除的负向刺激。Hoxby和Weingarth(2005)以及Burke and Sass(2008)利用中学测试成绩作为结果变量,都发现了这种互补性因素的存在。在大学教育中,Sacerdote(2001)发现了一些证据,高能力学生互相受益超过平均受益或低能力学生的收益。考虑到同伴效应的均值线性模型的不足,同伴效应的异质性分析在近些年来受到广泛关注。Hoxby和Weingarth(2005)在研究三到八年级学生的同伴效应。根据学生过去的成绩,将学生分为十个百分位,用学生先前成绩的百分位和落在每十个百分位上的同伴进行交互,共获得100个交互项。研究发现处于分位数最底端的学生的成绩受处于分位数15%的学生的成绩的影响,处于最高分位的学生的成绩受同样处于高分位的学生的成绩的影响,处于中间分位的学生的成绩受到同伴效应的影响则相对较小。Ding和Lehrer(2007)利用中国江苏的数据,采用分位数回归分析,发现与低能力的学生相比,高能力的学生从较高成就且方差较小的同伴中获益更多。对异质性同伴效应的研究,打破了传统线性均值模型认为学生个体在不同班级的重新分配,都无法增加总的学生成就水平,也无法增加总的社会福利水平。
三、同伴效应估计过程存在的一些问题
同伴之间具有的关联,可能是由于其他因素导致了相似的结果,即使是缺乏真正的同伴效应,在同伴效应的估计过程中存在着三个主要经验研究的挑战:自选择问题、反射问题和机械关联性。
(一)自选择问题。人们通常会选择自己所在的社区、学区、班级同学和室友。因此会出现重点中学学生升学率明显高于其他一般学校,表面上看好像是优秀的班级同学提高了整体学习水平,但实质上可能是成绩好的学生一种主动选择在一起。这种选择性偏误实质上是一种遗漏变量问题,关键问题是这种选择机制有时候是很难完全掌控的,在同伴效应的均值线性模型中,用同伴的平均能力(行为或者结果)估计自身能力,不可避免的受到选择性偏误的影响,因为同伴的能力和自身的能力可能共同收到学校声誉的影响,同伴效应的估计很难控制这些混杂因素,这给估计真正的同伴效应的大小带来了很多不便。
(二)反向因果问题。这种反向因果问题也称为反射问题,在同伴效应的均值线性模型中,如果自变量和因变量都是结果变量,这个结果变量在时间上可能会同时产生,也就会产生通常所说的联立方程组问题。在实证过程中可能出现的一般情况是,在估计同伴效应时,将个体学生成绩作为因变量,将同伴的平均成绩作为自变量。但这个时候就会出现问题,单个个体的学生成绩同时也会影响其他同伴的学习成绩,因此就很难估计同伴效应的净影响。