基于分位数回归方法的教育对城乡代际收入流动的影响研究
2019-09-10宋静
摘 要:代际收入流动测度的是父代收入对子代收入的影响程度。本文基于CHIP2013数据,应用分位数回归方法,利用stata软件测度出不同分位数下教育对代际收入流动的影响,结果显示:在子代的条件收入分布给定的情况下,父代收入处于低分位点的代际收入相关性比处于高分位点的要高;引入受教育年限作为代理变量之后,代际收入流动的程度总体上降低了,而且相对于高分位点,低分位点上的教育回报率更高。收入代际传递的其中一个重要机制是来自教育,不同群体的代际相关性的差异也是来源于教育回报的异质性。
关键词:代际收入流动;分位数回归;stata统计软件
中图分类号:TP399 文献标识码:A 文章编号:2096-4706(2019)16-0121-03
Abstract:Intergenerational income mobility measures the influence of father’s income on offspring’s income. Based on CHIP2013 data,this paper uses quantile regression method and stata software to measure the impact of education on intergenerational income flow in different quantiles. The results show that the intergenerational income correlation of the father’s income at low points is higher than that at high points when the conditional income distribution of the offspring is given. After introducing the years of education as the proxy variable,the intergenerational income correlation of the father’s income at low points is higher than that at high points. The degree of income mobility has generally decreased,and the return on education at low loci is higher than that at high loci. An important mechanism of intergenerational transmission of income comes from education,and the difference of intergenerational correlation among different groups also comes from the heterogeneity of educational returns.
Keywords:intergenerational income flow;quantile regression;stata statistical software
0 引 言
研究代際收入流动已经是现代社会经济学领域的一个主流问题,表示子代的收入在多大的程度上受到上一辈的收入的影响。对于社会机会不平等或经济不公平等问题的研究,我们常用到代际收入弹性,弹性越大代表上一代的收入对下一代的收入影响越大。
现在人们普遍认为教育可以提高人们的收入水平,那么,对子代投入更多的教育资本是否更有助于其成为一个成功的人?研究代际收入流动问题时,我们在传统的回归方程中投入教育这个代理变量后,各回归系数有了明显下降,这表明教育对代际收入流动确实有抑制作用。然而运用传统的最小二乘估计容易忽略教育在代际收入传递中的异质性,于是本文运用分位数回归的方法,用回归结果给出不同分位数上的回归系数即代际收入弹性,借此深入分析代际收入流动性。
1 数据来源及处理
1.1 数据来源
本文使用的数据来自中国家庭收入调查CHIP2013,是已经发布的较新的中国家庭收入调查数据。CHIP2013将所有的样本分为城镇住户、农村住户和外来务工住户样本,我们在研究中国城乡居民的代际收入流动情况过程中只用到了城镇住户和农村住户样本。
1.2 数据处理
为了研究教育对代际收入流动情况的影响,我们利用stata统计软件对父代与子代的信息数据进行匹配,筛选出所有处于在就业状态、年龄在20~65周岁、收入大于0的父子代数据。由于个体的永久收入无法获取,我们使用2013年度的工资性收入总额作为永久收入的代替值。匹配好的数据仍需删除存在异常值或缺失值的个案,因为CHIP数据是难以进行插补和修正的。为了获取比较正确的回归结果,我们需要对样本数据做出一些要求。
(1)收入的选择:本文剔除了在校学生和退休人员等样本信息,因为在校学生基本上是没有收入的;而退休人员虽然也有收入,但是这部分收入已经和年龄、职业等因素无关,不在本文研究目的范畴之内。
(2)年龄的选择:一是子代年龄在调查时必须满足20岁以上,父代在65岁以下,因为年龄太高或太低都影响其获得收入的持久稳定性;二是父代与子代的年龄差大于15岁。
(3)子代的选择:子代存在多个子女情况下我们只选择年龄最大的子女作为样本,选择的依据是子代年龄越大意味着在其职业生涯中越处在持久稳定状态,其收入更能代表其永久收入。
(4)受教育程度的选择:衡量受教育程度的指标有受教育年限和所获得的最高学历。受教育年限是数值型变量,我们为了回归的便利,使用量化指标受教育年限作为代理变量,进入回归方程。
最后获得农村匹配数据675条,城镇匹配数据650条,对数据做一些简单的描述性统计后,所得的城乡居民受教育程度代际流动转换矩阵以及描述性统计特征分别如表1所示。
从表1中我们可以看出,在城乡居民的对数收入均值方面,城镇地区的收入水平明显高于农村地区。从受教育程度来看,无论城镇还是农村地区,子代所接受教育年数明显高于父代,均值均达到10年以上,已超过义务教育阶段的9年,同时城镇地区高于农村地区。从年龄均值看出城镇和农村地区的子代样本均处于职业生涯早期,父代样本均处于职业生涯晚期,说明在此年龄下我们对个体的收入衡量是处于低估的,因此其代际收入弹性可能是向下偏的,与后面回归结果中的系数偏低保持了一致性。
2 估计结果与分析
我们利用stata软件执行命令输出了最小二乘法和分位数回归方法下的结果,分别测度了有无受教育年限下模型的农村和城镇地区回归系数,分位数回归可以测度协变量潜在的微小变化对条件分布中不同分位数的影响,这里的分位点可以任取,但为了展示结果,只选取7个具有代表性的分位点,分别是0.05、0.10、0.25、0.50、0.75、0.90和0.95,输出结果如表2和表3所示。表中回归系数旁星号代表在多大程度的显著性水平下接受原假设,1星代表10%,2星代表5%,3星代表1%,无星代表回归系数不显著;同时最小二乘回归标准误差采用的是稳健标准误,而分位数回归采用的是bootstrap标准误。
由表2看出,第一部分我们首先采用的是Solon的回归方程。OLS回归系数即代际收入弹性为0.1913,相对于其他权威文献测度的代际收入弹性偏低,或许与收入测度偏低有关。分位数回归的输出结果中,除了0.95分位点上的回归系数不显著以外,其他分位点上的回归系数均显著。在所有分位点上的回归系数我们看出,系数虽没有随着父代收入的分位点的增加严格单调递减,但总体为下降趋势。也就是我们常提到的“马太效应”,即父代收入对子代收入的代际传递在低收入人群中体现更加突出。在0.95分位点上的回归系数之所以没有通过检验,是因为父代的收入水平达到一定高度时,子代的收入水平影响因素不再和父代收入有直接关联,或者与父代的社会影响力和子代自身的天赋能力等有密切关系,此处还可以做深一步的研究。
第二部分我们引入了受教育年限。引入代理变量之后,代际收入弹性较没有引入时要下降许多。受教育年限的回归系数就是所谓的教育回报率,代表的是每增加一年或者一个阶段教育所带来的的子代收入对数提高的百分比。系数随着分位点的增加而趋于下降,说明教育回报率在低收入人群中更加显著。受教育年限的系数在0.90和0.95分位点上不显著意味着父代收入达到一定高度时,子代可以直接通过父代的社会影响力获得机会获得收入,而不再受到教育投资这个变量的影响。受教育年限的回归系数均显著不等,在0.0047~0.0959之间变动,说明教育回报率存在异质性。
最后在表3中我们看到城镇居民回归输出结果与农村居民结构相似。城镇居民的所有回归系数在總体上都要低于农村居民,这说明农村父子的代际收入流动性低于城镇地区。
3 结 论
本文运用分位数回归方法在7个分位点上测度了教育对城乡居民代际收入流动性的影响,结果显示随着父代收入的增加,代际流动转移也增大。引入受教育年限这个代理变量后,在子代的收入条件分布已知时,教育对子代收入的影响是正向的,正向程度随着分位点的增加而增加,也说明父代低收入人群在对子女投入教育资本的同时,会使得子女未来有更大的可能会获得成功,其政策含义是教育对压缩收入分布有一个积极的正面影响,对低收入人群增加教育资助会有效降低社会关系的不平等。此次研究的一个有趣的发现是在子代条件收入高分位点时,父代收入不能显著地影响子代收入,这意味着教育并非是代际传递的唯一途径,还有多种效应会影响代际收入弹性。这种引起教育代际传递中断的因素,可能是个人的天赋能力、父辈的社会影响或者社会不可预测因素的推动,使得子代可以超越父代的收入传递,这种新的决定代际传递的因素或许是代际流动领域的一个新的研究方向。
参考文献:
[1] Solon G.Intergenerational Income Mobility in the United States [J].The American Economic Review,1992(3):393-408.
[2] Becker G S,Tomes N.An Equilibrium Theory of the Distribution of Income and Intergenerational Mobility [J].Journal of Political Economy,1979(6):1153-1189.
[3] 郭丛斌,闵维方.中国城镇居民教育与收入代际流动的关系研究 [J].教育研究,2007(5):3-14.
[4] 汪燕敏,金静.我国教育对代际收入流动的影响——来自分位数回归的经验证据 [J].福建江夏学院学报,2015,5(5):1-6.
[5] 亓寿伟,中国代际收入传递趋势及教育在传递中的作用[J]统计研究,2016,33(5):77-86.
[6] Atkinson A B.On Intergenerational Income Mobility in Britain [J].Journal of Post Keynesian Economics,1980(2):194-218.
[7] 刘志国,范亚静.教育与居民收入代际流动性的关系研究 [J].统计与决策,2014(22):101-105.
[8] 罗楚亮.城镇居民教育收益率及其分布特征 [J].经济研究,2007(6):119-130.
[9] 徐晓红.中国城乡居民收入差距代际传递变动趋势:2002-2012 [J].中国工业经济,2015(3):5-17.
作者简介:宋静(1995-),女,汉族,安徽六安人,2018级应用统计专业,硕士研究生,研究方向:收入分配。