经济学研究因果关系实证方法论上的新突破
2022-03-17王忠玉
王忠玉
2021年 10 月 11日,瑞典皇家科学院宣布,将今年诺贝尔经济学奖颁给卡德(D. Card)、安格里斯特(J. D. Angrist)和因本斯(G. W. Imbens),以表彰卡德对“劳动经济学实证方面的贡献”,同时表彰安格里斯特和因本斯对“因果关系分析的方法论贡献”。在此之前,1989年诺贝尔经济学奖获得者哈维尔莫(T. Haavelmo)、2000年诺贝尔经济学奖获得者赫克曼(J. Heckman)的工作均和因果研究紧密相关。
卡德1983年获美国普林斯顿大学博士学位,后成为加州大学伯克利分校经济学教授、美国国家经济研究局劳动研究项目主任。与他人合著有《神话与测量:最低工资的新经济学》(1995)、《劳动经济学手册》(1999)、《寻求卓越经济:英国经济改革的经济效应》(2004)。
安格里斯特1989年获普林斯顿大学博士学位,现为麻省理工学院福特经济学教授、美国艺术与科学院院士、计量经济学会会员,与他人合著《基本无害的计量经济学:实证研究者指南》和《精通计量:从原因到结果的探寻之旅》(均有中译本)。
因本斯1991年获美国普罗维登斯布朗大学博士学位,现为斯坦福大学应用计量经济学教授、经济学教授,主要研究计量经济学中的因果推断方法。他是计量经济学会会员、美国艺术与科学院院士。
在人类社会发展的数千年中,因果问题一直深受哲学家关注,他们提出了许多很有影响力的深刻思想;而在现代科学发展过程中,科学家进一步在实践中探索因果推断,试图揭示事物之间的因果联系。计量经济学作为研究经济问题的工具性方法,自1920年代建立至今已有100年,在推进经济实证研究方法方面发挥着关键性作用。比如,在1960年代和1970年代,经济学实证研究者的主要任务是试图解释诸如收入或GDP增长的推动因素,由此产生了一系列经济增长理论和模型。目前,经济学越来越趋向于实证研究或经验研究。进入1990年代,包括三位得奖者的实证研究者最关注的问题,是关于因果效应的估计以及评估政策的分析,而不局限于获得经济变量的一般性计量模型。
通常,在经济实证分析和研究中,人们所得到的经济数据基本上是“观察数据”,而不是“试验数据”。经济学家利用观察性数据进行因果推断研究是一项富有挑战性的任务。在许多学科中,随机对照试验(randomized controlled trials)被认为是实现这一目标的黄金标准。可是,在社会科学中,由于受到财力、伦理或实践方面的制约,许多重要问题都无法通过随机对照实验进行研究。一方面,鉴于利用观察数据进行硏究,研究者无法依据自己的目的来干预实验,无法做受控实验,也不能做随机分配处理(在医学研究中又称干预)。另一方面,利用观察数据研究因果关系或因果效应涉及两个有挑战性的问题:一个是混杂因素或内生性,也就是忽略某些同时影响处理和结果的背景因素,导致研究因果关系出现偏差和决策错误;另一个是选择性偏差或缺失数据,即观察数据不能代表研究者所关注的总体情况。
过去30年间,在微观经济学中运用自然实验研究因果推断的工作呈现爆炸式增长。“自然实验”是指不受研究者控制的、自然地发生,或宏观政策对研究变量有类似于随机化试验影响的事件。利用自然实验进行因果推理的想法,最早可追溯到1944年计量经济学家哈维尔莫的《计量经济学的概率方法》。而美国社会学家坎贝尔(D. T. Campbell)的论文《改革作为实验》(1969)是最早提出采用准实验方法(quasiexperimental approach)的研究。坎贝尔和范德堡大学心理学教授西斯尔韦特(D. L. Thistlewaite)合作《回归不连续分析:事后实验的替代方法》(1960),研究并开发出一种重要的实证方法——回归不连续性设计,以此从自然实验中估计因果效应。
进入1990年代,卡德及其合作者使用一些自然试验分析劳动经济学中的一系列重要因果问题。自然试验在劳动经济学中的成功运用,促使工具变量、双重差分法(又称倍差法,DID)等方法为研究因果关系或因果效应提供了一种普遍的研究范式。
在劳动经济学中存在几个著名的世纪难题:①移民会对当地居民的就业和收入产生什么影响?②设定最低工资标准,会不会造成更多人的失业?③教育的投入对收入有什么影响?在1990年代初发表的一系列论文中,卡德对上述三个难题进行了深入严谨又透明的分析研究,他借助于新颖的、先验的、更可信的方式来解决这些问题,获得了崭新的、更可靠的答案。卡德这些最初的研究工作对进一步激发和推动劳动力市场如何运作的重新分析和理论研究,显然起到了关键性作用,也是最重要的贡献。
最低工资对就业的影响
最低工资可能是减少低收入者贫困的重要政策工具。经济学家长期以来一直研究最低工资对就业的影响。但是,有约束力的最低工资会增加工资成本,从而可能会减少就业。因此,低工资的工人最终是否会从最低工资中受益,其实并不清楚。教科书式的竞争模型表明,如果实施更高的最低工资以至提高到高于均衡水平,就业将大幅下降。
在1990年代之前,關于最低工资影响的证据倾向于与教科书模型一致。但识别最低工资的因果效应是具有挑战性的,特别是在时间序列背景下。最低工资的实施或改变通常是有原因的,其根本原因可能与就业前景的变化有关。例如,当商业周期处于衰退期,就表现为就业率下降和工资增长降低,特别是对低收入者而言。在收入分配的底部,比较低的工资增长反过来可能会要求提高最低工资,以便于保护贫困劳动者。如果政策制定者根据这些要求采取行动,就会出现就业下降导致最低工资上涨的情况,而不是相反。
在1992年,《工业和劳动关系评论》专门刊发一期“新的最低工资研究”的研讨会研究成果。这些论文报告了利用美国各州内部随时间变化数据所得到的分析结果,以便于估计最低工资对就业的影响。与使用时间序列数据的研究相反,这些研究可以灵活地控制常见的时间趋势。这些论文中的研究成果在一定程度上与以前类似问题的研究结果不一致。其中有两篇论文是卡德的,还有其他研究者如卡茨(L. Katz)和克鲁格(A.B. Krueger)的论文。
在论文《最低工资会减少就业吗?加利福尼亚州1987—1989年的案例研究》中,卡德将1988年把最低工资提高27%的加州的工資和就业的演变,和一组最低工资政策没有改变的比较州的相应情况演变进行比较。从1987年到1989年,加州青少年的工资相对于比较州而言多增长10%,尽管有所增加,但没有证据表明青少年就业率下降。事实上,和比较州相比,加州的就业人口比增加了4%。这个双重差分法估计似乎是由劳动力参与率的上升推动的。
卡德的另一篇论文《利用地区工资差异来测量联邦最低工资的影响》,利用这样的事实,即国家最低工资的变化对各州有不同的影响,这取决于每个州的初始工资分配。例如,1990年美国联邦最低工资的提高可能会影响到南方一些州50%以上的青少年,而在新英格兰一些州,这一比例仅为5%。卡德研究发现,在受影响的青少年比例较高的州,工资增长幅度更大,但青少年就业与人口的比率没有变化。
卡茨和克鲁格的论文《最低工资对快餐业的影响》利用了这样一个事实,即企业将受到最低工资变化的不同影响,这取决于过去低于新最低工资的劳动力比例。调查1990年和1991年美国联邦最低工资上涨前后得克萨斯州的快餐店,他们的报告结果与卡德的一致:受影响比较大的企业的起薪增加了,这些企业的就业率也增加了。实际上,利用面板数据进行研究存在一个挥之不去的担忧,即不清楚为什么一些州提高了最低工资,而另一些州则没有。也许实施更严格的最低工资政策的州已暴露在负面劳动力市场冲击之下,或者反之亦然。在理想情况下,人们希望保持就业前景不变,只改变最低工资的变化幅度。为了实现这一点,卡德和克鲁格进一步深入研究,在《最低工资和就业:新泽西州和宾夕法尼亚州的快餐行业的案例研究》(1994)中利用双重差分法研究了新泽西州最低工资的提升对就业的影响。在 1992 年 2 月,新泽西州将最低工资标准从 4.25美元/时提升至 5.05美元/时,而邻近的宾夕法尼亚州并没有提高最低工资标准。他们在时间上和空间上没有交互作用假设下,调查了上述两个州的 410家快餐店在最低工资调整前后的就业情况,去除了混杂性,从而推断出因果关系。
不久之后,卡德和克鲁格合著的《神话与测量:最低工资的新经济学》(1995)还包含了新的分析,例如最低工资对公司价值的影响、以前的时间序列和面板数据证据的稳健性,还有关于最低工资的国际证据以及作者1992年和1994年论文的更新和扩展。这本书在2016年再次出版,以纪念其出版20周年,由此可见它具有广泛而深远的影响力。
移民对劳动力市场的影响
在许多国家,移民是一个激烈争论的政治问题。令人担忧的是,大量移民流入导致的劳动力供应冲击,可能会通过下降的工资和就业前景阻碍当地工人的劳动力市场机会。然而,这种担忧受到许多因素的影响。首先,当地工人的产出取决于他们的劳务能否替代或补充新移民的劳务。其次,预计劳动力供给侧的变化会引起劳动力需求侧的变化,因此,预计公司将进入移民流入较多的地区,并投资于更适合移民工人特征的技术。第三,移民流入导致对商品和服务的需求发生变化,这可能会影响当地工人的劳动力市场前景。
移民如何影响居住在某个地区的当地工人,尤其是低技能居民,这个问题并不清楚。凭经验回答这个问题具有挑战性,因为很难说如果没有移民流入,一个地区会发生什么。问题是,移民可能会转向日益增长的劳动力市场,即使没有移民,不断增长市场,当地人的经济结果也与其他市场不同。早期对于回答这个问题的尝试,大多使用汇总到当地水平的美国大都市区移民数量的变化来估计生产函数的参数。总体上结果是:对当地人的影响很小,而对移民本身的影响很大。
卡德的两项研究成果重振了移民对劳动力市场影响的研究。这两项研究都涉及移民向蓬勃发展的当地劳动力市场迁移的混乱影响。
其中卡德的《马列尔偷渡事件对迈阿密劳动力市场的影响》(1990)利用了美国历史上一个独特事件,即所谓马列尔偷渡事件。1980年5月至9月,大约125 000人离开古巴,其中50%永久定居在迈阿密。这是迄今历史上最大的一次非军事渡海行动,历史上称之为马列尔偷渡事件。仅仅几个月,迈阿密的劳动力就惊人地增长了7%。卡德将马列尔偷渡事件前后的迈阿密劳动力市场的工资和就业情况,和4个比较城市的就业情况进行比较。在适当选择比较城市的情况下,马列尔偷渡事件提供了一个典型的自然实验。尽管大量新移民和非技术移民涌入迈阿密,卡德的1990年论文表明,没有证据表明,技能较低的非古巴工人的工资率和失业率受到影响。卡德对工资和失业为何没有对移民事件做出反应提出两种解释:第一,有证据表明,由于马列尔偷渡事件,当地人和以前的移民到迈阿密的人数减少了;第二,由于过去移民的历史,迈阿密劳动力市场的产业结构能够吸收大量非技术移民流入。人们还讨论了马列尔偷渡事件的结果是否适用于其他事件。正如卡德指出的那样,迈阿密有接收古巴移民的历史,这一事实可能影响了结果。总的来说,移民的区位选择具有相当大的历史依赖性。因此,大多数古巴移民前往迈阿密而不是其他地方是有充分理由的。
另一篇是奥尔顿吉(J. G. Altonji)和卡德的论文《移民对低技能本土劳动力市场产出的影响》(1991),为移民经济学文献留下了两大遗产:首先,它设定了最常用的概念框架(本质上是需求侧模型,其中将移民建模为劳动力供给冲击),用于分析移民增加的影响;其次,作者所运用的估计移民影响的方法在文献中反复应用。卡德进一步完善了这种“转移份额”方法,他使用了每个族裔群体先前的定居模式来预测城市和职业群体的总体移民流入。通常,这种生成工具的转移份额方法在应用微观经济学研究中十分常见,并且该方法已在移民经济学中反复应用。
正是由于卡德发起的研究和后来的探索,使人们对政策影响劳动力市场结果的潜力、移民对工资和就业差异的影响,以及企业在塑造收入不平等方面所扮演的角色有了更好的理解。
实际上,卡德的贡献远不止这些,例如,他还研究与劳动力市场计划和失业保险有关的重要工作,以及工会和工资谈判如何影响工资不平等问题。他的研究工作不仅是实证的,而且在许多情况下,他能够将实证研究与解释性框架或显式理论相结合。
除此之外,卡德对教育投资的影响领域也做出了非常有意义而影响深远的研究,比如卡德和克鲁格在1990年代初合著两篇论文《学校质量重要吗?教育回报和美国公立学校的特点》和《学校质量和黑人白人相对收入:直接评估》,研究了学校质量对劳动力市场结果的重要性。两份报纸都使用了学校质量的外生变异,这些变异来自于学校资源的大量投资时期(1930年代至1950年代),尤其是在美国南部。与以前的许多文献相比,卡德和克鲁格分析了学校质量如何影响劳动力市场的结果,而不是依据考试成绩进行研究。这是一项重大的创新,因为学校质量可能会比考试分数狭隘地衡量个人在劳动力市场上取得成功的能力影响更多。他们还打破了现有文献的模式,清晰地阐述了他们的理论研究设计。
最初利用自然实验进行实证研究的热潮,从概念上提出了崭新的非常重要的问题。例如,对受教育回报的工具变量估计通常大于相应的普通最小二乘法估计。为了使这些研究发现具备理论基础,研究者自然地转向如下框架:即总体中当受教育回报是异质性的框架(异质性本质上是指研究对象的差异或差别,既可以是个体层面上的,称之为个体异质性,又可以是总体层面上的,称之为总体异质性。在社会科学研究中,异质性无处不在);在此设置背景下,估计中所用的变异来源起到了非常重要的作用。
安格里斯特的论文《终身收入和越战时期的征兵彩票:来自社会保障行政记录的证据》(1990)研究了参加越战经历对后来收入的影响。很明显,这是内生性的问题。据他考察,国防部征兵是通过给适龄男性抽一个征兵号码(draft lottery)来决定,其中要设定某个上限,当号码小于上限时,这个人在征兵范围之内。这里,他定义征兵号是否小于这个上限为征兵资格,当征兵资格为1时,这个人更有可能当兵参加越战,而这个数字是随机抽的,所以征兵资格是一个合适的良好工具变量,无疑这是利用自然实验的例子。
安格里斯特的研究也指出关注异质性的重要性。他利用越戰时期通过抽签来估计服兵役对日后收入的影响。在1970年代初,征兵资格是由出生日期的随机抽签决定的。因此,征兵资格作为在越战中服役的工具,在大多数情况下,响应可能是异质性的。当处理效果因人而异,人们做出选择时很可能会出现对(自然)实验的不完全依从性。个人在越战期间自愿参军的事实就是一个不完全遵从的例子,因为这些人无论是否符合征兵条件,都报名参加了服役。相反,一些有资格入伍的人却因健康原因或仍处于上学阶段而被豁免。一般来说,对准实验性和实验性变异的不完全遵从是无处不在的。
处理异质性和不完全依从性的结合,进一步向因果分析提出了问题。在安格里斯特和因本斯的研究工作之前,研究者探讨允许识别总体或受处理总体中的平均处理效果的条件。一般的研究发现是,这些条件往往是严格的。另一种方法是对这些效应进行约束。不幸的是,这种约束往往过于宽泛,没有实际的参考价值。
如上所述,利用观察数据研究因果关系会涉及内生性问题。为了解决经济实证分析中的内生性问题,经济学家莱特(P. G.Wright)1928年的著作《对动植物油征收的关税》首次提出工具变量,用于处理内生性对因果推断带来的不利影响。工具变量需要满足三个条件:①工具变量对关注的结果没有直接作用,只能通过研究的处理对结果产生影响;②工具变量与未观测到的混杂因素相互独立;③工具变量和研究的处理有一定的相关性。
安格里斯特和因本斯的论文《局部平均处理效果的识别和估计》(1994)提出一种不同的方式来解决涉及异质性、不依从的难题。具体来说,他们退一步问道:如果不对不能直接观察的研究对象的行为施加额外限制,那么可以从随机或自然实验中能学到什么,不能学到什么?他们在论文中提出一种新的实证方法学框架,这是建立在美国统计学家奈曼(J. Neyman)在随机实验背景下提出的潜在结果框架(1923)和美国统计学家鲁宾(D. B. Rubin)的论文《在随机和非随机研究中估计处理因果效应》(1974)在观察性数据背景下提出的潜在结果框架之上。这种框架的核心是分配机制,即决定哪些单位接受哪些处理的过程,从而决定哪些潜在结果得以实现并可以被观察到,哪些潜在结果被遗漏。
与奈曼假定的随机分配和鲁宾将分配与倾向性分数联系起来不同的是,安格里斯特和因本斯将分配与工具的存在联系起来。这样,新方法将经济学中发明的工具变量框架与统计学中发展的潜在因果推理结果框架合并在一起。这里工具变量可以是物理随机化的结果,如随机对照试验,这个方法适用于准实验和实验工作的一般框架。他们将这种因果效应称为局部平均处理效应(local average treatment effect, LATE),并且证明了,即使存在异质性和不完全依从性,工具变量也可以在最小假设情况以及实证上合理的假设情况下识别因果处理效应。所识别的效果是依从者之间的平均因果效应,即由于工具的价值而改变行为的总体子集的因果效应。实际上,安格里斯特和因本斯提出的基本框架,广泛应用于运用现有因果推理方法比如回归不连续设计、双重差分法、综合控制方法等时,能够识别处理效果的条件。当前,LATE框架不仅广泛地应用于经济学和其他社会科学领域,而且在流行病学和医学等学科中的应用也越来越多。
三位获奖者的研究工作为基于设计的方法奠定了坚实基础,基于设计的方法主要采用准实验法,但也采用实验法和变异法来估计关注的因果效应。总之,获奖者的成果与方法对解决经济和社会政策具有重大意义的因果问题来说,取得了能力上巨大的提高,同时必将为进一步推动更好认识和回答社会科学问题奠定了坚实的实证方法论,极大改变了过去30年来实证研究的方式,也极大地造福了社会。
关键词:基于设计方法 自然实验 工具变量 因果效应 ■
3302501908291