服务产品市场中的“外貌歧视”问题
——来自滴滴出行平台的自然田野实验证据
2018-06-09余熙郭玲
余 熙 郭 玲
(1.福建师范大学,福建福州,350007;2.福建农林大学,福建福州,350002)
一、引言
爱默生说:“如果两眼生来为着注视,美就是她存在的原因”,这种诗意化的表达陈述着一个毋庸置疑的事实:人与生俱来就存在对美的向往。尽管美是个体性的主观感受并难以被度量,然而不同人乃至不同文化群体所给出美的偏好序列往往具有相当大的一致性。因此,那些外表富有吸引力的个体往往拥有着比别人更多的机会。Hemermesh and Biddle的研究发现,外表富有吸引力的人可以获得“美丽溢价”(Beauty Premium),即他们的收入高于外表一般的人,相反外表差的人的收入水平要低于外表一般的人,即“丑陋罚金”(Ugly Penalty),这反映出劳动力市场存在着“外貌歧视”(Appearance Discrimination)的现象。外貌不仅与短期收入有关,而且还影响着长期的收入水平。Frieze 等对毕业10年的MBA学生观察发现,外表富有吸引力者的收入要高于缺乏吸引力的。Biddle and Hamermesh 将研究对象转向具有5到15年工作经验的律师群体也得出相似的结论。Jaeger的研究首次将考察的时间跨度扩展到整个职业生涯,他的成果表明具有漂亮外表的人在其职业生涯中可以获得更高的社会经济地位。在这类实证研究中对外表的度量主要有三种:长相、身高、体重。中国学术界对外貌经济效应的研究基本上延续了国外的研究路径。高文书利用12个城市的调查数据,探讨了外表特征和收入之间的关系,证实了我国劳动力市场存在的“身高溢价”问题。江求川和张克中利用中国健康和营养调查数据库(CHNS)中的城镇居民收入和体检数据,研究身高和体重对收入的影响,其研究结果也同样证实了我国劳动力市场存在着“外貌歧视”问题。
本文利用滴滴出行平台进行田野实验,试图为服务产品市场中的外貌歧视问题寻找经验证据,并从结构上分析外貌偏好的差异。此外,本研究还将通过采用货币补偿的方式对“美丽溢价”进行观测。文章的贡献主要有四个方面:第一,现有文献针对外貌歧视的研究主要集中在要素市场,而忽视了在消费过程中的外貌歧视问题。本文试图为服务产品市场存在的外貌歧视现象提供经验证据。第二,针对中国的“外貌歧视”问题,现有的文献主要采用的是身材指标来度量外貌,而本文将长相和身材作为外貌的两个重要维度,研究它们对顺风车司机行为选择的影响并对它们影响效应的差异进行比较分析。第三,通过利用滴滴出行平台的感谢金设置,对“美貌溢价”进行观测。第四,近年来越来越多的田野实验研究发表在排名世界前五位经济学杂志上,然而中国权威经济学期刊中采用这一方法的文献非常匮乏。本文采用田野实验的研究方法,是对此类文献的一个补充。
二、田野实验定义、方法
从亚当斯密的经验主义到约翰穆勒的实证主义,从瓦尔拉斯将数学分析方法引入经济学到纳什对博弈论做出开创性研究,过去的两百多年时间里,实证经济学取得了快速的发展。然而实证研究中的理论假设和数学推导往往排斥了人类行为或经济关系中的非理性和不确定因素,而且经验检验又具有被动性和不可重复性的缺点。由弗农·史密斯开创的实验经济学继承了自然科学的实证主义传统,在一定程度上弥补了传统经济学实证方法的缺陷。这是因为经济学实验不仅具有可重复性和主动性,而且实验经济学用“行为人”替代“理性人”,从而规避了实证研究中因高度抽象造成的与现实世界不一致问题。
同其他研究方法一样,实验经济学分析方法并非完美。实际上实验发展经济学在快速发展的过程中也伴随着许多的怀疑与批评。主流经济学家普遍认为人们所感兴趣的经济现象并不容易在实验室中进行研究,而且实验方法中有限的决策空间、受试者的经验缺乏以及实验者的监控等因素,会使实验结论偏离自然状态下发生的实际市场行为。但随着本世纪初以来田野实验方法的兴起,上述问题得到了极大的改善。
田野实验(field experiments)又称随机控 制 实 验(randomized controlled experiments)。Harrison and List为了将田野实验和实验室实验(laboratory experiments)、 社 会 实 验(social experiments)区分开来,从六个因素对田野实验作出了界定:被实验者样本的性质、被实验者带入实验中的信息的性质、实验中商品的性质、实验任务或交易规则的性质、风险的性质、实验环境的性质。田野实验指的是在具体的情境中,通过利用实验的操作技巧(如随机化被试、控制相关变量),来评估干预事件的处理效应(treatment effect)或者说变量之间的因果效应。田野实验和实验室实验有着重要的差异,实验室实验是以学生作为对象,并基于一个抽象的实验框架和一套强加的规则进行实验,因此实验室里的结论难以外推到真实的世界中。田野实验的受实验者是来自真实经济世界中的行为人,而且他们是被放在真实的处境中进行选择而不是模拟的实验室环境。社会实验在很多特征上与田野实验相似,诸如它所研究的主体是真实世界中人的行为,它也是考察一个自然事件所产生的效应。但社会试验的研究方法是通过将个人、家庭、企业或其他单位随机分配到处理组或对照组来研究政策干预的影响效应,缺乏人为的实验控制,因此在检验干预的效果时往往会存在潜在的内生性问题。可见田野实验较好地调和了内部效度和外部效度之间的矛盾。
Harrison and List进一步将田野实验分为伪田野实验(artefactual field experiments)、框架田野实验(framed field experiments)以及自然田野实验(natural field experiments)。伪田野实验使用非学生群体作为被试,其他方面与实验室实验相同,即有一个抽象的实验框架和一套强加的规则构成;框架田野实验采用实际的商品、任务或信息,其他方面与伪田野实验相同;自然田野实验采取一个令受试者不觉得自己身在实验之中的真实环境,其他方面与框架田野实验相同。本文采用的分析方法属于自然田野实验。
田野实验的基本思路遵循穆勒的差异法,其基本操作方法是从一个总体中随机选取被试样本,然后随机将被试对象分为控制组与处理组,在控制其他因素不变的情况下,仅针对处理组进行实验处理,并根据随后两组被试的数据比较,得出最后的因果效应。
由于,田野实验可以较好地控制内生性问题,如今田野实验方法已经被广泛地运用到经济学多个领域的研究中,其中所所涵盖的主题不仅涉及微观层面的行为经济学、中观层面的劳动经济学,还涉足公共经济学和发展经济学等宏观经济领域。
三、实验设计
(一)实验工具:滴滴出行顺风车平台
我们选择的实验工具是滴滴出行的“顺风车”平台。其基本规则是:顺风车司机根据出行者信息决定是否愿意接单。出行者发布需求信息包括:起点、终点、出发时间、坐车人数、是否拼座、感谢金。除此之外,顺风车司机还可以观测到出行者的昵称、头像、性别、自我介绍、历史出行次数以及顺风车司机给予的评价。
采用滴滴出行的顺风车进行自然实验,具有以下几点优势:
1.随机性
通过滴滴出行平台发布需求信息,意味着周边所有的顺风车司机都是潜在的样本。他们是否愿意接单显然外生于研究者的意愿,因此保证了样本的随机性特征。
2.易于控制潜在的内生性
顺风车司机并不是在复杂的社会情境(social context)中进行选择,因为滴滴出行软件已经将顺风车司机最为关切的信息用文字和图片的形式表达出来,这样顺风车司机只是根据这些信息做出决策。与复杂的社会情景截然不同的是文字和图片信息容易进行人为的设定,从而我们可以对“其他因素”进行控制,规避了潜在的内生性问题。
3.行为的真实性
通过滴滴出行软件进行实验,实验的参与人员是现实世界中的顺风车司机,而不是招募来的志愿者群体,从而规避了样本的非代表性(non-representative sample)问题。同时,对于这些参与人员而言,他们认为自己是面向实际情境做出选择,而不是面向诱导价值(induced valuation),也就是说他们并没有意识到自己是被设置在一个实验的处境之中,因此保证了行为的自然状态。
4.行为的独立性
顺风车司机通过滴滴出行平台是无法观测到其他司机的行为决策的,因此在他做出是否载客判断的时候是独立进行的,从而避免了实验者行为的交互影响。
5.成本低
实施田野实验一个重要的障碍在于高昂的成本。成本高昂的原因主要是信息双向传递和识别成本很高,而滴滴出行平台是通过文字和图片信息形式传递影响顺风车司机行为的因素,而且单次实验过程时间跨度短,从而大大降低了实验成本。
6.实验的可重复性
滴滴出行软件普及率很高,因此研究人员可以很轻松地重复本实验。
(二)如何设定颜值
顺风车司机在做出是否载客的决定的时候无法观测到乘客真实的颜值状况,而只能根据乘客在滴滴出行平台上提供的信息加以判断。顺风车司机主要会根据乘客头像信息来进行判断。乘客头像可以从两个角度长相和身材来反映颜值状况。
(三)如何判定坐顺风车的难易程度
这里有两个准则用来判定坐顺风车的难易程度:一个是时间准则,另一个是货币准则。时间准则指的是在控制了其他因素之后,观察不同颜值水平的女性成功被接单所耗时间的长短,耗时短者,认为相对容易。货币准则指的是控制了其他因素之后,观察不同颜值水平的女性付出的货币代价上的差异,货币代价低的则意味着容易。由于滴滴出行有“感谢金”的规则,使得我们在控制了其他因素之后设置差异化的货币代价变得可能。
(四)需要控制的因素
路线、顺路距离、时间、年龄、职业、 出行人数都可能对顺风车司机的行为产生影响。例如,较为繁忙的路线、较长的顺路距离、车流量多的时点坐到顺风车的概率较大。出行人数较多时意味着更高的金额,乘坐顺风车的机率会得到提升。此外,顺风车司机可能对乘客的职业和年龄有着特定的偏好,而同意拼车的乘客也会更受顺风车司机的青睐。因此,在实验的过程中需要对路线、路程距离、出发时间、年龄、职业和是否拼车等信息进行人为的设定,从而控制这些影响因素。我们认为历史出行次数和昵称对司机的选择行为影响不大,因此不需对它们进行控制。最后还需要注意避免评价和美丑设定矛盾的情形。因此,应将具有正面颜值评价的滴滴用户分配到“美女组”。
(五)样本的收集与剔除
发布需求信息,一旦顺风车司机选择接单,无论选择“美女”还是“丑女”,我们就捕获了一个样本。然而需要对这些样本进行必要的剔除。首先,需要剔除的是自动接单的样本。这里假定如果从发布信息到接单的时间不足一分钟,顺风车司机接单行为就不是经过“深思熟虑”后做出的选择,这样的选择外生于颜值。其次,需要剔除同一司机重复出现的样本。由于可能存在部分司机热衷于顺风车业务,导致抽中他的概率增高,从而会使样本总体的代表性下降。
(六)采样时间和地点
为了获得富有代表性的样本,本研究在采样过程中尽量让时间分布变得均匀,在抽样地点的选择上则注重典型性特征。具体而言,抽样的时间涵盖了工作日和节假日,并在一天当中选择多个分散的时点进行采样。抽样地点(即出发地)主要选择车辆较为密集的一些区域,例如居民住宅密集区、写字楼密集区、高校周边、购物中心和交通枢纽中心。
(七)实验方案
为了分析顺风车服务消费中是否存在“外貌歧视”,本研究开展四个实验:
实验一:美女头像组和丑女头像组的对照实验;
实验二:苗条身材组和肥胖身材组的对照试验;
实验三:美女头像组和苗条身材组的对照试验;
实验四:没有感谢金的美女头像组和逐渐增长的感谢金的丑女头像组的对照实验。在每一种感谢金的设置上均实验十次,来观测两组被接单频次的变化。
(八)实验方法
实验过程中采用配对(Matching)实验方法,也就是在每次实验中,从一对实验组中选取一名“美女”和一名“丑女”同时发布相同的需求信息(即控制了除颜值之外的其他因素),来观测谁先被接单。
四、实验结果
(一)样本量
实验过程中一共收集到了255个样本,其中实验一的样本量为90个,实验二、实验三和实验四的样本量分别为53个、62个和50个。在前三个实验中,福州地区的所采集到的样本分别是37个、34个、50个,剩余部分的样本来自中国的其他城市。实验四的50个样本均来自于福州地区。需要说明的是在收集到的样本中,女性司机的占比极低,为了简要起见后面的分析过程中我们不对司机性别的差异进行区分。
(二)实验结果及检验
1.实验一结果及检验
在实验一收集到的90个样本中,美女头像获得优先接单的有69个样本,占比为76.7%,剩余的21个样本为丑女头像获得优先接单,占比为23.5%。但有可能这种差异是由于抽样误差造成的,为此需要对其进行假设检验。这里我们将原假设设立为:美女头像和丑女头像对乘坐顺风车的概率并没有实质性影响。而T检验值为4.4,对应的概率值为0.00001,因此我们就拒绝了原假设,认为美女头像相对与丑女头像更容易坐到顺风车。
为了对实验结果的信度进行检测,我们把样本区分成福州地区和非福州地区。福州地区37个样本中有29个优先选择了美女头像,占比为78.38%,非福州地区的53个样本中优先选择美女头像的有40个样本,占比为75.47%。对原假设“地域差异并不影响长相偏好”进行T检验,得到的检验值为0.317。可见福州地区和非福州地区对长相的偏好差异不大,从而可以证明美女头像更容易打到顺风车这一结果的稳健性。
2.实验二结果及检验
实验二是关于好身材和差身材的对照实验,在收集到的53个样本中,优选选择好身材的样本有37个,差身材有16个,占比分别为69.8%、30.2%。T统计量为4.4拒绝了“身材对乘坐顺风车的概念没有实质性影响”的原假设,而得出这样的结论:好身材要比差的身材更容易坐到顺风车。
若对福州地区和非福州地区进行区分,会发现34个福州地区的样本中优先选择好身材为24个,概率为70.6%,非福州地区的19个样本有13为优先选择好身材的样本,占比为68.4%。和试验一的结果相似,会发现地区差异并不会对身材偏好产生影响。
实验二中有19个样本为B级及以上车型,在这些顺风车司机中有15个选择的好身材,占比为78.9%,相对应的34辆A级车有22辆车主选择了好身材,比重为64.7%。从数值上可以看出开中高档车的顺风车司机对好身材偏好也会略强于低端车。然而,可能因为样本容量不够大,对两组均值比较检验的T检验值为1.07,尚不能有效地拒绝原假设。
3.对实验一、二结果的合并分析及检验
收入的差异是否会对长相偏好产生影响呢?为了回答这个问题,我们做了一个假设,认为B级及以上车型的车主的收入要高于A级车的车主。但由于在实验一和实验二中各自收集到的B级及以上车型的样本数量都较小,所以为了扩大样本量,这里对实验一、实验二的结果进行合并分析。将长相好和身材苗条的样本合并到美女组,将长相差和身材肥胖的合并到丑女组。合并后共有143个样本,A级车样本有112个,这其中有80个优先选择了美女,占71.4%,B级及以上级别的车样本有31个,优先选择美女的样本26个,比率为83.9%。对原假设“收入高低并不影响长相偏好”进行检验,得到的T值为1.40,对应的概率为8.19%。说明在10%的置信度下,收入高的人对美女的偏好也要强烈于收入低的人。
为了检验年龄的差异是否会对颜值偏好产生影响呢?同样由于上世纪80年代之前出生的顺风车司机样本量太少,也采用与上面相同的方法,对实验一和实验二的结果进行合并,合并之后共获得样本量101个,其中顺风车司机为80后、90后的样本量共有82个,优先选择美女的有68个,50后、60后和70后顺风车司机的样本量共有19个,优先选择美女的有10个。从统计数据上可以看到,前一个群体中有82.9%会优先选择美女,而后一个群体仅为52.6%。对原假设“不同年龄的颜值偏好相同”进行T检验,得到的T值为2.93,相应的概率为0.2%。可见:不同年龄群体的颜值偏好存在差异,80、90后的顺风车司机对于美女的偏好要明显的高于80年代前出生的顺风车司机。
4.实验三结果及检验
正如前面所说的长相和身材是颜值两个重要的维度,为此实验三的目的在于检验顺风车司机对这两个维度究竟何者更加的敏感。在这个实验中,一共收集到62个样本,优先选择长相好的样本量为44个样本,选择身材好的样本为18个,二者的占比分别为71.0%、29.0%。对原假设“顺风车司机对颜值的两个维度长相和身材具有同等的敏感程度”进行检验,得到的T统计量为5.1,拒绝了原假设。从统计分析的结果来看,可以明显地发现相较于好身材,顺风车司机对长相好的偏好更加明显。
5.实验四结果分析
实验四是将增设了感谢金的丑女头像组与没有增设感谢金的美女头像组进行对照。感谢金从1元逐渐增加到5元,每种感谢金均实验十次。实验中发现,随着感谢金的增加,丑女头像组被接单的频率是逐渐增加的。当感谢金为1元时,10次实验中美女头像组被优先接单7次,丑女头像仅3次。而当感谢金增设到三元时,实验的结果就出现了逆转,丑女头像组在10次实验中被优先选择了7次。如果感谢金进一步增加到5元,丑女头像组被优先接单的次数进一步增加到了8次。由于抽样误差的存在,感谢金的逐渐变化中,相邻两组之间的趋势不易做出判断。因此,我们这里就针对感谢金的两端进行检验,原假设为“感谢金的增加并不会引起丑女组被接单的概率提升”,T检验值为2.47,相应的概率为1.2%,拒绝了原假设。因此结论是:丑女可以用货币进行补偿,从而提高搭乘顺风车的概率。同时这一结论也验证了“丑陋罚金”的存在。
五、经济解释
价格理论认为价格是对稀缺性的反映,也就是凡是稀缺之物必定有价,而价格的高低又取决于稀缺程度。瓦尔拉斯从“有用性”和“有限性”对稀缺性做出了定义,有用无限或者有限无用都无法构成稀缺性。美貌作为一种先天的禀赋,并不是人人都具备,因此它天然存在着有限性的特征。美貌的有用性通常是通过其“正的外部性”表现出来的。所以,美貌也同许多商品一样,具有稀缺性的特征,自然有价。当然,需要注意到美貌本身难以进行单独的交易,但是它却可以附着在商品或是服务上面,使得商品或服务的用值得以提升(如果表现出负外部性时则是降低)。
作为顺风车司机,他所提供的服务获得的报酬不仅仅是货币意义上的,同行之人的美丽所释放出来的外部性也是对他服务的一个心理补偿。这就意味着在同等货币收入的情形下,搭载美女就会给司机带来一份额外的“收入”。这种额外的收入可以表现为“臆想的愉悦”,实际上在一些行程中顺风车司机和乘客之间并没有太多的交流,然而美女乘客的相伴足以通过司机的臆想机制让他获得心理上的愉悦。额外收入的第二个源泉来自于炫耀效应,对于男性而言,同美女成为朋友可以间接证明自身的魅力及能力。第三个来源是来自美女的光环效应,人们常常会把美貌作为其他能力的间接衡量,例如修养、影响力和交际能力,因此同美女成为朋友,有可能会提升自己未来的预期收入。这里需要说明的是后面两个额外的收入是潜在的,它的实现需要有一连串的条件,然而这种潜在的收入(或者说想象中的收入)也会影响着人的行为。到这里,我们实际上解释了为什么顺风车更加愿意搭载美女。
那究竟是什么原因让收入高的顺风车司机对美丽的偏好强于收入低的呢?前面谈到作为顺风车司机提供服务有两种收入,一种表现成货币收入,另一种是心理收入。这两种收入在两个顺风车司机群体中的相对效用是不同的。在边际效用递减规律的作用下,货币收入相对于收入高的群体而言,它的边际效用更低。因此对于高收入的顺风车司机群体而言,他提供顺风车服务的重要的目的是来自于心理收入,因此他们对于美女搭乘的期待就要高于低收入的顺风车司机。
年龄的差异是造成美貌偏好差异的重要原因。年轻人相较于中年人而言,搭载美女所获得的心理收入是被放大的。因为对他们而言,遇上爱情是他们相对于中年人多出来的一个潜在的收入。而且炫耀效应、光环效应在中年人身上发挥的作用就远不如年轻人来得明显。
作为颜值的两个重要的维度长相和身材,它们对于顺风车提供者提供的边际效用也不相同。稀缺性是决定边际效用高低的根本因素。相较于好身材,好长相更加稀缺。这是因为长相主要是由先天的基因决定的,后天难以改变,即使可以通过整形等现代医学的方式加以改变,但这种改变意味着要付出较大的代价并承担比较高的风险。而身材,大多数人均可通过后天的锻炼饮食进行调整。因此,对于顺风车司机而言,与好长相的美女同行要比与好身材的美女同行要获得更高的心理收入。
不同的收入之间是可以互相替代的,当心理收入下降是可以通过货币加以补偿。这实际意味着,非货币性的收入可以转化成货币性的收入。所以,我们看到在足够货币的补偿之下,顺风车司机的选择就会发生逆转。从原先没有感谢金的条件下,顺风车司机优先选择了美女,到给了一定感谢金的条件下,顺风车司机优先选择了丑女。并且,在实验中我们也看到了,随着丑女组感谢金的增加,丑女组被优先选择的概率也获得了提升,这恰恰是供给定律作用的结果。
[1] 陈玉梅,陈雪梅.实验经济学的新突破:实地实验方法[J].经济学动态,2012,(6):117-122.
[2] 高文书.健康人力资本投资、身高与工资报酬:对12城市住户调查数据的实证研究[J].中国人口科学,2009,(3):76-112.
[3] 何浩然,陈叶烽.禀赋获得方式影响被试行为是否存在性别差异:来自自然现场实验的证据[J].世界经济,2012,(4):102-117.
[4] 何浩然.公共政策的效果能否被准确预测?来自中国塑料袋使用限制政策的自然实验证据[J].经济学(季刊),2012,11(4):1305-1322.
[5] 江求川,张克中.中国劳动力市场中的“美貌经济学”:身材重要吗 [J].经济学(季刊),2013,12(3):983-1006.
[6] 罗俊,汪丁丁,叶航,陈叶烽.走向真实世界的实验经济学:田野实验研究综述[J].经济学(季刊),2015,14(3):853-884.