自选择、非农就业城乡转换及工资差距
2015-06-26韩军辉
韩军辉,李 锦
(太原理工大学经济管理学院,太原030024)
自选择、非农就业城乡转换及工资差距
韩军辉,李 锦
(太原理工大学经济管理学院,太原030024)
基于2008年中国家庭收入调查(CHIP)数据,利用内生转换模型分析了农民工进城务工与本地务工的影响因素及其工资差距。结果表明:健康、婚姻、性别、受教育年限、年龄、城市亲友数量以及人均耕地面积等因素对于农民工就业区域选择具有显著影响。农民工就业决策中的自我选择对其收入有显著影响,并且进城务工与本地务工存在不同的工资决定机制。在控制自选择偏误后,进城务工比本地务工能获得更多工资,但其处理效应较小。由于个体异质性,本地务工的农民工表现出较强的获取收入能力,而进城务工则体现出负向自选择。
农民工;工资差距;内生转换回归;自选择;异质性
一、引言及文献综述
20世纪90年代以来,随着工业化和城市化进程的推进,大量农村劳动力涌向城市形成了规模空前的民工潮。与此同时,我们也应看到,伴随近年来产业转移以及国家鼓励政策的实施,农村非农经济和农民工创业热潮正在兴起。国家统计局数据显示,2010年在本地务工的农民工数量约为8888万人。此后,本地务工人数以年3.71%的平均增长率增至2013年的10284万人,远大于外出农民工2.01%的年平均增长率。从理论上讲,由于长期固化的二元经济结构,城乡劳动力市场存在不同的工资决定机制。对于农民工而言,是选择本地务工还是进城务工?与本地务工相比,进城务工是否获得更多收益?显然,研究该问题对于合理引导劳动力流动进而实现区域人力资源优化配置具有重要意义。
本研究讨论的核心议题为进城务工与本地务工两者之间的工资差距。为探究该问题,首先需要考虑的是自选择,即农民工就业选择行为不是随机的,而是根据个体禀赋在效应最大化的框架下做出留守或进城决策。Chiswick(1978)[1]等学者发现,与非迁移人口相比,迁移人口有着更加“陡峭”的年龄收入曲线。从自选择角度来看,迁移人口可能具备更强的能力和上进心,这会直接提高迁移人口的收入。因此,忽略自选择偏误可能导致过高估计结果。异质性是需要考虑的第二个重要影响因素。现实中,农民工在可观测和不可观测特征方面并非同质,比如新生代农民工有着更高的文化水平,而第一代农民工更加能够吃苦耐劳。在目前文献中,关于自选择与异质性的研究密不可分。比如,在考虑可观测和不可观测异质性基础上,Borjas(1987)较早地考察了迁移决策的内生性对劳动力市场表现的影响;[2]邢春冰(2010)发现永久移民的自我正选择效应非常明显,临时移民的选择效应可忽略不计,[3]但该文献只是对可观测异质性进行了分析。在充分考虑不可观测异质性后,Wu(2010)的研究表明中国农村外出劳动力相对于本地非农就业劳动力属于反向选择。[4]
在考虑自选择以及异质性的基础上,如何估算迁移劳动力与留守劳动力两者之间的工资差距?少数文献对此进行了研究。借鉴DFL分析框架,邢春冰(2010)通过构建永久移民和临时性移民的反事实收入,说明了自选择对城乡收入分配的影响。[3]宁光杰(2012)分别利用处理效应模型和Heckman两步法发现农村外出劳动力存在负向选择,留守劳动力的反事实收入明显高于外出劳动力的现实收入。[5]
与本地务工相比,外出进城务工是否获得更多收益?结合研究文献,本文将在考虑自选择、异质性基础上通过构建内生转换模型对该问题进行研究。具体来讲,主要包括以下内容:第一,分析农民工选择进城就业或留守本地务工的影响因素。第二,探究进城务工与本地务工的工资决定机制。第三,在考虑自选择和异质性(包括不可观测特征)的基础上比较进城务工与留守本地务工的工资差距,并提出政策建议。
二、数据说明
本文所用数据来自2008年中国家庭收入调查(CHIP)。本轮调查包含农村住户、城乡流动人口和城镇住户三个子样本。2008年CHIP中的城镇和农村调查由国家统计局执行,而城乡流动人口的调查则是由北京师范大学以及澳大利亚国立大学的学者联合组成的课题组共同完成,并得到国家统计局和德国劳动研究所的支持。CHIP调查数据包含家庭成员的年龄、性别、受教育年限、工作经验、婚姻状况、就业状态以及家庭相关特征等丰富的信息。文中所用数据涉及城乡流动人口和农村住户两个子样本。城乡流动人口样本包括在东部(上海、广州、东莞、深圳、杭州、宁波、南京、无锡)、中部(合肥、蚌埠、武汉、郑州、洛阳)和西部(重庆、成都)等15城市务工经商的农民工。我们将该部分农民工称之为进城或迁移农民工。而将农村住户子样本中(在本县内农村)从事非农劳动的农民工看作留守农民工。之所以如此处理,主要是可以确定该部分留守农民工所在的区域和省份,以便于整理数据。此外,还有大量在外省参与非农就业的,但无法确定其所在的地区和省份。总之,本文从2008 年CHIP数据中甄选出从农村进城的迁移农民工样本和在本县区域内从事非农劳动的留守农民工样本作为研究对象。为论述方便,后文中的留守农民工特指在本县内农村从事非农劳动的农民工。
表1 变量定义和描述性统计
按照多数文献思路,本文所用数据不包括年龄小于16岁和大于60岁的样本。此外,删除了相关变量的缺失值。主要变量见表1。这里需要指出的是,由于本文要分析农民工进城决策,因此需要将已经实际进城农民工的部分信息还原到农村。值得庆幸的是,家庭是否有学龄前儿童、耕地面积以及在城市生活的亲戚朋友数量等信息为进城农民工和留守农民工所共有。本文将利用以上变量作为农民工进城或留守决策的重要识别变量。
从表1可知,进城农民工月收入高于留守农民工月收入。与留守农民工相比,进城农民工的平均年龄要小11岁左右,而且受教育年限更长。其次,进城农民工的健康状况略微优于留守农民工。大约90%的留守农民工已经结婚,远大于进城农民工62%的已婚率。但留守农民工有着更多的工作经验以及较低的学龄前儿童拥有率,这可能主要是由留守农民工的年龄特征所决定。无论是进城还是留守,男性劳动参与率均高于女性。将近20%的进城农民工和留守农民工进行自我经营,由于在中国家庭收入调查中报告的自我经营收入为净收入,所以本文将其跟工资性收入做同样处理。此外,表1显示进城农民工有着更多的城市亲友和较少的耕地。
三、计量模型及结果
(一)计量模型
假设农民工根据自身禀赋和家庭特征进行就业地点的选择,即进城还是留守。如果进城,则按照城市劳动力市场工资决定机制获得收入,而留守农民工则对应本地技能价格挣得收入。这里采用Maddala and Nelson(1975)提出的内生转换模型进行实证分析。[6]
首先考虑农民工就业地点的选择模型:
其中:变量Z包括影响农民工收入的部分变量(健康状况、婚姻状态、性别、受教育年限)和年龄、城市亲友数量、人均耕地面积和学龄前儿童等个体特征变量。ηi为不可观测的随机扰动项。I=1表示迁移进城务工,I=0表示留守在本县农村从事非农劳动。公式(1)的取值决定了农民工就业地点,或者说是农民工在城乡之间选择就业的转换器。
其次建立收入决定方程。
就业地点的选择决定了农民工不同的工资方程进而会直接影响收入。假设农民工在本地和城市面临不同的技能价格或回报率,因此具有不同的工资方程:
下标u表示城市,下标r表示农村。公式(2)表示选择进城务工的农民工收入方程,公式(3)表示留守农民工的收入方程。方程中的yi代表月收入对数。Xi代表自变量向量,包括健康状况、婚姻状态、性别、受教育年限、地区虚拟变量、工作类型、工作经验以及平方项。εi为随机误差项。
对于某一特定农民工,我们无法同时观测到yui和yri。此时如果运用最小二乘法(OLS),则会由于 εi与 ηi的相关性而得出有偏估计。Lee (1978)、Maddala(1983)等学者进一步假设存在一个向量均值为0、方差为σ的正态分布,其协方差矩阵具有如下形式:[7~8]
σ2η表示就业地点选择方程中的随机误差项的方差,这里假设σ2η=1。σ2u、σ2r分别表示公式(2)和公式(3)中随机误差项的方差。σuη、σrη分别表示εui、εri和ηi之间的协方差。假设εi与ηi之间存在一定相关性,在考虑样本选择性条件下,公式(2)和公式(3)中随机误差项的期望值具有如下形式:
其中:f(.)表示标准正态分布密度函数,F(.)表示相应的正态分布函数。如果 σuη和σrη的估计值在统计意义上显著,那么就说明农民工就业地点选择决策与其收入相关或者说自我选择的因素不可忽视。按照 Lokshin and Sajaia(2004)的思路,上面的(1)~(3)式可以使用完全信息极大似然法(FIML)进行估计。[9]FIML的优势在于可以同时对选择方程和收入方程进行估计,并改进了运算效率。在以上假设下,(1)~(3)式的对数似然函数可以写成:
公式(6)中的φji=
ρu表示ηi与εui之间的相关系数,ρr表示ηi与εri之间的相关系数。
(二)条件期望、处理效应分析
通过以上内生转换模型,可以估算农民工的实际收入期望值和反事实收入期望值,进一步用来分析进城务工和本地务工两者之间的工资差距。具体来说有以下四种收入期望:
公式(7)表示进城就业农民工的实际收入期望值,为方便起见,这里用A表示;公式(8)表示一种反事实状态,即假设进城农民工留守在本地农村务工的收入期望值,用B表示;公式(9)表示留守农民工的实际收入期望值,用C表示;公式(10)表示另一种反事实状态,即假设留守农民工进城务工的收入期望值,用D表示。以上四种收入期望能够使得进城农民工和留守农民工在城乡之间顺利转换。更进一步,根据Heckman et al.(2001)的思路,[10]这里可以将TT=A -B表示为克服自我选择偏误后的处理效应,或者说是对于进城农民工来说,自己进城务工能够比在本地务工多获得的收入;同理,将TU=DC表示为留守农民工的反事实收入与留守农民工实际收入的差异,或者说是假设留守农民工进城务工能够比自身在本地务工多获得的收入。而将BHu=A-D和BHr=C-B看作是由于农民工异质性导致的工资效应,即在同样的工资决定机制中,由于可观测特征和不可观测特征异质性引起的收入差异。
(三)计量结果
运用Stata 12.0软件对内生转换模型方程进行估计。假设农民工进城决策取决于自我选择,而并非随机分配。因此,在估算农民工进城就业的收入效应时应该考虑由于自我选择导致的内生性。表2的估计结果证明了这一点。结 果 显 示,ρu= -0.1767,ρr= -0.1221,并且均在0.05统计水平上显著,这说明农民工就业中的自我选择对其月工资收入有显著影响。最后一行中的LR检验表明就业选择方程和收入决定方程之间具有较好的联立性。这一结果同时表明,如果直接利用虚拟变量方法估计进城收入效应将会得出有偏结果。
表2中第4列为就业地点的选择方程。报告显示,健康状况越好,越有可能进城务工。未婚者比已婚者更有可能进城务工。性别回归系数为正,意味着男性外出务工的可能性大于女性。随着年龄的增加,农民工进城就业的可能性在降低。受教育年限回归系数为正,且在0.05水平上显著,这说明文化水平越高,越有可能进城务工。此外,人均耕地面积越多,越不可能进城务工。城市亲友数量对进城务工具有正向影响,且在0.01水平上高度显著。虚拟变量学龄前儿童的回归系数为负,但不显著。这一结果需要进一步研究。从表2第2列留守农民工收入方程看出,身体健康状态对留守农民工月收入对数的影响为正,但不显著。而该变量在进城农民工收入方程中的回归系数为0.05,并且在0.01水平上高度显著。相对于未婚者,已婚者身份对留守农民工收入的影响不显著,但在第3列进城农民工收入方程中的回归系数显著。这说明婚姻能够对进城农民工产生溢酬效应。报告进一步显示,留守农民工中存在更大的性别收入差距。此外,教育回报率在两个方程中分别在0.05和0.01水平上显著,而且进城务工劳动者的回报率稍微高于留守农民工。工作经验对留守农民工收入的影响要大于进城就业的农民工。工作类型变量的回归结果表明,无论是进城还是留守农村,自我经营将会对其增加收入有促进作用。从总体上看,进城农民工收入方程和留守农民工收入方程的回归系数明显不同,这说明两种收入决定机制存在差异,单纯地使用最小二乘法或处理效应模型难以对工资方程进行准确估计。
表2 内生转换模型估计结果
根据公式(7)~(10),表3报告了四种情况下的收入期望以及处理效应和异质效应。从横向来看,该表反映了克服自我选择偏误后的处理效应。从纵向来看,该表反映了异质性对获取收入的影响。报告显示,进城农民工的收入期望值(A)为7.499574;反事实分析表明,如果进城农民工在本地农村务工,其收入期望值(B)为6.430428;而实际留守农民工的收入期望值(C) 为6.786159;另一种反事实状态,即假设留守农民工进城务工的收入期望值(D)为7.686196。通过简单比较,似乎得出进城务工比留守农村可多获得收入0.713415(A-C)。因为没有考虑其他因素尤其是不可观测异质性对工资收入的影响,其实这一结论是有偏的。表3最后1行给出了在考虑异质性情况下的工资收入差异。其中,BHu=-0.186622(A-D)表示实际进城务工与留守农民工反事实工资之间的差异,或者说是假设留守农民工进城将会获得比实际进城农民工更多的收入。而在反事实状态(B)情况下,BHr=-0.355731(B-C)表明实际进城的农民工如果留守在农村务工将会获得比实际留守农民工更少的收入。这说明由于某些不可观测特征,在本地务工的农民工无论其选择迁移或留守均能获得较高收入。从表1的描述性统计可以看出,留守农民工多为第一代农民工,其平均年龄为41岁左右。与进城农民工相比,留守农民工虽然文化程度较低,但有着更为丰富的工作经验,且自我经营者相对较多。更为重要的是第一代农民工有着吃苦耐劳的精神,这或许是影响留守农民工收入的重要因素。
表3 条件期望、处理效应分析
在控制自我选择因素后,从最后1列结果可知,进城农民工的处理效应(1.069146)大于留守农民工的处理效应(0.900037)。这一结果表明,对于留守农民工和进城农民工而言,选择进城务工的确能获得比留守农村更高的工资。在克服异质性和自选择后,进城务工能够比本地务工多获得的工资为 0.169109(TT-TU或 BHu-BHt),远低于0.713415(A-C),这说明如果采用简单对比会对结果造成过高估计。需要注意的是,如果我们将迁移成本考虑在内,那么进城务工的收益可能会有所降低,这或许是近年来大量农民工返乡的重要原因。表3同时表明,假设实际进城农民工留守农村,其工资收入将低于实际留守在农村的农民工。这说明实际留守农民工存在正向自我选择;而进城就业的农民工则存在负向自选择,该结果与Wu(2010)和宁光杰(2012)得出的结论类似。[4~5]进城农民工之所以出现负向选择,我们认为主要是由于以下原因造成:一是在工作经验以及吃苦耐劳等方面,进城农民工(更接近新生代农民工)远不及留守农民工。二是由于城乡分割制度,进城农民工在城镇劳动力市场上处于不利地位,这也直接影响了收入水平。新生代农民工进城多是为了体验城市生活或寻求自身发展,这可能是年轻农民工进城务工的主要动机。
四、结论
本文利用 2008年中国家庭收入调查(CHIP)中的城乡流动人口和农村住户两个子样本分析进城务工与本地务工两者之间的工资差距。基于自我选择和异质性的假设,将农民工行为分为两个步骤:首先假设农民工做出就业地点选择决策,即进城务工还是留守在农村从事非农劳动;其次在做出就业选择决策后,农民工将面临城市和农村劳动力市场两种不同的收入决定机制。为此,运用内生转换模型进行实证分析并得出以下结论:
第一,健康状态越好,越有可能进城务工。相对于已婚女性,单身男性外出可能性更大。随着年龄的增加,外出务工的可能性逐渐降低。受教育年限越多,外出务工的概率越高。城市亲友数量对进城务工起到显著的拉动作用,而人均耕地面积对进城务工具有制约作用。
第二,内生转换模型具有较好的联立性,农民工就业过程中的自我选择对其收入有显著影响,并且进城务工与留守本地务工存在不同的工资决定机制。在城市劳动力市场中,教育回报率更高,而且存在较低的性别收入差距。健康、婚姻状况对进城务工收入有重要影响,而对留守农民工无统计意义上的显著作用。
第三,自我选择和异质性因素对农民工收入有重要影响。相对于留守农民工,进城农民工(更接近新生代农民工)表现出负向自选择,而留守农民工的就业选择表现为正向自选择。在克服异质性和自选择后,进城务工能够比本地务工获得更多工资,如果将迁移成本考虑在内,进城务工的收益可能会有所降低。
针对以上结论,提出以下政策建议。首先,进一步加强进城农民工尤其是青年农民工的职业培训,提高其参与城市劳动力市场的能力;同时应逐步废除城乡市场藩篱,为进城农民工提供更多市场机会以增加收入水平。其次,在健全社会保障制度基础上,进一步深化农村土地制度改革,促使有意愿、更有能力的农民进城。最后,加强农村地区的软环境建设,为吸引青年农民在本地创业营造良好经济社会环境。
[1]Chiswick Barry R.The Effect of Americanization on the Earnings of Foreign-Born Men[J].Journal of Political Economy,1978,86(5):897-921.
[2]Borjas G J.Self-selection and the Earnings of Immigrants[J].American Economic Review,1987,77(4):531-553.
[3]邢春冰.迁移、自选择与收入分配——来自中国城乡的证据[J].经济学(季刊),2010,(2): 633-659.
[4]Wu Zheren.Self-selection and Earnings of Migrants:Evidence from Rural China[J].Asian E-conomic Journal,2010,24(1):23—44.
[5]宁光杰.自选择与农村剩余劳动力非农就业的地区收入差异[J].经济研究,2012,增(2):42 -55.
[6]Maddala G S and Forest D Nelson.Switching Regression Models with Exogenous and Endogenous Switching[M].Proceeding of the American Statistical Association(Business and Economics Section),1975:423-426.
[7]Lee L.Unionism and Wage Rates:A Simultaneous Equations Model With Qualitative and Iimited Dependent Variables[J].International Economic Review,1978,19(2):415-433.
[8]Maddala G S.Limited-Dependent and Qualitative Variables in Econometrics[R].Cambridge: Cambridge University Press,1983:223-224.
[9] Lokshin M and Sajaia Z.Maximum Likelihood Estimation of Endogenous Switching Regression Models[J].Stata Journal,2004,4(3):282 -289.
[10]Heckman J,Tobias J,Vytlacil Edward.Four Parameters of Interest in the Evaluation of Social Programs[J].Southern EconomicJournal,2001,68(2):210-233.
责任编辑、校对:李品秀
Self-selection,Switch of Non-agricultural Employment between Urban-rural Areas and the Wage Differences
HAN Jun-hui,LI Jin
(School of Economics and Management,Taiyuan University of Science and Technology,Taiyuan 030024,China)
Based on the CHIP data in 2008,an endogenous switching model is developed to analyze the factors for migrant workers to work in urban areas and local areas,and the wage differences.The results indicate that variables such as health,marriage status,gender,education,age,number of relatives and friends in cities,and per capita arable land all significantly impact the regional choice of migrant workers to work.The study finds out that self-selection,as one of the employment decisions,has significant effects on the income of migrant workers.Meanwhile,the wage decision mechanisms are different for them to work in urban and local areas.By controlling the biased error of self-selection,migrant workers have higher income to work in urban areas than in the local areas,but the treatment effect is small.Due to the heterogeneity of individuals,migrant workers who work in local areas have stronger capabilities to get income,while negative self-selection can be found in migrant workers who work in urban ares.app:addword:migration.
Migrant Worker;Wage Difference;Endogenous Switching Regression;Self-Selection;Heterogeneity
F241
A
1674-4543(2015)04-0047-07
2015-03-12
国家社会科学基金青年项目“代际传递视角下城乡青年收入差距问题研究”(13CRK031)
韩军辉(1976-),男,河北石家庄人,太原理工大学经济管理学院副教授,博士,研究方向为农村人口经济;李 锦(1978-),女,辽宁盘锦人,太原理工大学经济管理学院讲师,博士,研究方向为区域经济。