低收入群体代际收入流动性变动趋势

2021-06-24徐晓红曹萍萍

统计与信息论坛 2021年6期

徐晓红,曹萍萍

(安徽大学 a.经济学院;b.创新发展战略研究院,安徽合肥 230601)

一、引言

改革开放以来,尽管中国经济总量快速增大,居民收入水平不断提高,但贫富差距也日益扩大,低收入群体并未能够共享经济发展的成果。而作为发展中国家,中国仍然存在着规模庞大的低收入群体。按照国家统计局中等收入群体的标准,中国有9.1亿低收入群体;若以月收入低于2 000元为标准,低收入群体约有7.1亿;月收入在1 000元以下的则有3.1亿人[1]。规模庞大的低收入群体制约了经济发展,也阻碍了收入差距的缩小。与持续扩大的收入差距相伴,中国代际收入流动性也出现了下降趋势[2],“寒门再难出贵子”的论调,折射出人们对低收入代际传递的担忧。低收入代际传递,意味着子代的收入在很大程度上由父代决定,难以通过自身的努力实现阶层向上的跃升,这会导致阶层固化,进而放大收入差距的“隧道效应”,对经济增长和社会稳定产生不利影响。在经济增速放缓叠加疫情冲击的背景下,低收入群体面临更大的社会风险,无疑是政策关注的重点。双循环新发展格局中,促进低收入人群向上流动以拉动内需,更是经济增长的内生动力。因此,提升低收入群体代际流动性,让低收入群体拥有更多机会实现收入和阶层的跃升,既是逐步实现共同富裕和全面建成小康社会的本质要求,也是促进经济高质量发展和维护社会稳定的重要举措,对于推动中国社会主义现代化强国建设具有重要现实意义。

如何准确测度代际收入流动性,一直以来都是学术界研究的核心问题。经济学家最早建立线性回归模型,通过代际收入弹性测度子代收入在多大程度上由父代决定。Becker等基于单年的收入数据,测得美国的代际收入弹性为0.2[3]。Solon认为,采用单年收入而非持久性收入,估计结果受到生命周期偏误和暂时性冲击的影响,其采用父辈收入的5年平均,估计出美国的代际收入弹性为0.4[4]。修正估计误差的方法如工具变量法、矩估计法等被广泛采用[5-6],但诸多用父代教育水平为工具变量的估计结果仍然受到内生性的挑战[7]。鉴于调查数据中难以获得持久性收入,经典的代际收入弹性方法由于采用对数—对数基本范式,排除了收入为零的样本且对收入较低样本的估计结果很不稳健,Dahl等提出了一种新的方法,被称之为代际位序相关性,通过计算子代和父代收入在各自群体收入分布中位置排序的相关性,来避免代际收入弹性测度中的问题[8]。Chetty等运用该方法的研究发现,美国20世纪70、80和90年代出生人群的代际收入流动性变化并不大,而不是之前一些文献所说的流动性下降[9]。代际位序相关性与代际收入弹性统称为相对流动性指标,测度的是平均意义上的流动性,并不能区分流动的方向,即:代际流动性上升,既可能是低收入群体向上流动的结果,也可能来自于高收入群体向下流动。Chetty等基于代际位序相关性构建的绝对流动性指标,则具有明确的经济含义,不仅能够预测低收入家庭子代未来社会经济地位,还使得国家间、地区间流动性具备了可比性[10]。

国内学者在王海港的开创性实证研究之后[11],对中国代际收入流动性进行估计,并尝试使用新方法和追踪数据解决计量偏误问题。方鸣和李芳芝等采用双样本工具变量法,测得城镇代际收入弹性分别为0.58和0.48[12-13];韩军辉等运用分位数回归法发现,农村居民收入两端的流动性较大[14]。受限于中国尚不完善的微观家庭数据库,采用传统方法测度的流动性仍存在一定程度的计量偏误[15]。因此,杨沫等运用代际位序相关性方法,对1991—2004年中国居民代际收入流动性进行了测度[16];王伟同等利用主观评价指标测度了中国城市层面的绝对代际流动性[17]。

综上所述,现有研究一般以城乡居民为研究对象,对低收入群体的关注不够。一些研究中涉及到对低收入人群的探讨,但大多采用基于双对数模型测度代际收入弹性,该方法由于没有包含零收入及收入较低的样本,低收入群体的代际收入流动性事实上未得到准确刻画。在个别基于代际位序相关性的研究中,研究者采用“家庭社会地位”主观指标测度了第25分位点人群的代际流动性,也未对低收入群体的代际收入流动状况进行分析。与上述研究不同,本文尝试采用代际位序相关性方法,测度低收入群体的代际收入流动性变动趋势、代际收入向上流动的比例,比较地区差异,并对影响代际收入向上流动的因素进行了探讨。

二、方法、模型与偏误比较

(一)传统方法及其偏误

传统的代际收入流动性测度一般基于如下经典Becker-Solon理论模型,通过代际收入弹性来衡量:

ln(y1i)=α+βln(y0i)+εi

(1)

式中,ln(y1i)为第i家庭子代永久收入对数,ln(y0i)为第i家庭父代永久收入对数,β为代际收入弹性,表示父母收入每增加1%子女收入相应增加的百分比。根据一般经验估计,β介于0和1之间。β越大,代际收入流动性越低;相反,β越小,说明子代收入受上一代收入的影响越小,而子女的勤奋和努力程度对其收入的影响可能更为显著,整个社会的机会不平等程度也就越低。模型(1)中方程两端的变量应为相应个体的持久收入对数,一方面,收入取对数会剔除零收入的样本;另一方面,从微观调查数据库中获得的收入普遍为截面数据,难以获得个体持久性收入数据,文献通常用单年收入数据或几年收入数据的平均值作为持久性收入的替代变量,这会引起测量误差,导致估计结果产生偏误。具体而言,传统代际收入弹性法主要存在以下三种偏误。

一是零收入及低收入偏误。基于双对数模型的代际收入弹性测度,不仅排除了所有收入为零的样本,还对收入较低的样本很敏感。Chetty等研究表明,当选择父代收入处于分布的10%～90%并排除子代收入为零的样本,代际收入弹性值为0.45,否则得到的估计值则在0.26～0.7之间[9]。

二是生命周期偏误。这一偏误在使用截面数据时难以避免,因为在搜集收入数据时,子代往往处于职业生涯早期,父代处于职业生涯晚期,根据莫迪利安尼的生命周期理论,收入随年龄呈倒U型变化。Haider等根据以下简单模型,讨论了在估计代际收入弹性过程中可能产生的生命周期偏误[18]。设:

y0ia=μay0i+νia

y1ia=λay1i+uia

其中,y0ia和y1ia分别表示父代与子代在年龄a的收入,μa、λa表示回归参数,在父子不同的年龄阶段取值不同,νia和uia为随机误差。则代际收入弹性的概率极限为:

三是暂时性收入偏误。暂时性收入偏误是指用单年收入作为永久收入的替代变量,代际收入弹性会被低估。因为单年收入会受到短期收入波动的冲击,所以包含短期波动的β估计值并非真实值β的一致估计。Solon计算了这种向下偏误的大小等于衰减因子,并提出使用父代T年的平均收入替代单年收入的方法来降低短期波动的方差,从而缩小偏误[4]。此时衰减因子为:

(二)代际位序相关性方法与偏误修正

Dahl等认为,子代收入、父代收入在其各自收入分布上排序之间的关系近似一条直线,因此可以用父子收入位序替代父子收入对数估计代际收入流动性[8],计算公式如下:

R1i=α+ρR0i+εit

(2)

其中,R1i为子代i在所有子代收入分布中的收入百分位序,R0i为子代i对应的父代在所有父代收入分布中的收入百分位序。通过将子代收入位序对父代收入位序回归,得到的回归系数ρ即为代际位序相关性。ρ值越小,代际收入流动性越高。

代际位序相关性修正上述偏误的机理是:第一,式(2)可以利用所有收入样本,不存在零收入及低收入偏误问题;第二,无论是较早年龄区间的收入,还是较晚年龄区间的收入,个体收入的位序一般不会发生明显变化,受生命周期偏误的影响更小;第三,若个体收入发生短期变动,其收入位序的波动幅度小于收入分布的波动幅度,因而代际位序相关性受暂时性偏误的影响小于代际收入弹性。

相对于传统的代际收入弹性法,代际位序相关性方法得到的估计值统计特性优良,误差更小。为了验证该方法的统计优势及其对代际收入弹性计量偏误的修正,本文利用1989—2015年中国健康与营养调查(CHNS)数据进行模拟分析。CHNS数据由北卡罗来纳大学人口研究中心、美国国家营养安全与食物安全研究所以及中国疾病与预防控制中心合作调查完成,历经1989年、1991年、1993年、1997年、2000年、2004年、2006年、2009年、2011年和2015年共十次调查,样本涉及辽宁、江苏、黑龙江、山东、湖南、湖北、河南、贵州、广西、北京、上海和重庆12个省份约4 400户居民。本文采用的收入是指个人年收入,各年收入均按2015年价格水平进行了调整。基于父亲在家庭收入和决策上占据的支配地位,父代的选择只考虑了父亲,对父亲信息与子女信息进行配对,并将父代与子代的年龄控制在20～65岁的劳动年龄区间,以减少使用单年收入造成的偏误。

首先,观察子代收入与父代收入之间的关系是否为线性。二者的相关关系可以直观地通过图1的联合分布图来反映。对比图1(a)、图1(b)可见,父子收入对数联合分布的斜率随收入增加而递增,反映出子代收入对数与父代收入对数之间并不满足线性关系,父子收入位序联合分布的斜率则基本保持不变,说明子代收入位序与父代收入位序之间更接近线性相关关系。

图1 子代收入与父代收入联合分布图

然后,采用代际位序相关性方法和代际收入弹性法对上述偏误进行模拟比较。表1比较了两种测度方法对于零收入、低收入样本的稳定性,共采用了四种处理零收入、低收入的办法,即删除零收入值、将零收入值替换为1、删除父代收入最低1%样本以及删除父代收入最低10%样本。从表1可见,在不同零收入、低收入样本条件下,代际收入弹性的变动范围在0.56～0.73之间,代际位序相关性估计值则稳定在0.6左右。显然,代际位序相关性方法受零收入、低收入样本的影响较弱,偏误更小,因此更适合用以测度零收入、低收入样本占比高的低收入群体的代际流动性。

表1 零收入、低收入偏误比较

表2是对生命周期偏误的比较。将子代年龄≥20岁及父代年龄≤65岁的样本设定为基准组,再通过改变子代和父代年龄的上下限,选取四个对照组,比较代际收入弹性和代际位序相关性的取值变动情况。表2上半部分的估计结果显示,以基准组为参考,将父代年龄的下限降低,代际收入弹性有所提高,从基准组的0.594提高至对照组2的0.637;将子代年龄的上限提高,则代际收入弹性逐渐下降,从基准组的0.594下降至对照组3的0.565,再下降至对照组4的0.379,说明利用子代职业早期的收入会导致代际收入弹性高估,而采用父代职业晚期的收入则会造成代际收入弹性的低估。从表2下半部分的结果看,除对照组4的估计值略有变动外,其余对照组的代际位序相关性与基准组基本一致,为0.59或0.60。这表明代际位序相关性方法对不同年龄的收入取值不敏感,与代际收入弹性法相比,生命周期偏误较小。

表2 生命周期偏误比较

为了比较两种方法暂时性收入偏误的大小,选取CHNS数据库中的多年追踪样本,以不同年数收入的平均值测算代际收入流动性,考察代际收入弹性和代际位序相关性的估计值。表3的估计结果显示,分别采用单年收入、收入的两年平均、三年平均和四年平均,代际收入弹性估计值的波动范围在0.47～0.63之间,代际位序相关性的变化范围则在0.50～0.61之间。可见,代际位序相关性方法受暂时性收入的影响更小,结果更稳健。

表3 暂时性收入偏误比较

三、低收入群体代际流动性测度及分析

(一)数据处理

本部分采用的数据与上文一致,为1989—2015年CHNS数据。关于低收入群体的划分,参照国家统计局的五等份分组法,将父代收入处于最低的两组作为低收入群体,即父代收入在其所属分布中40%及以下的样本。父代、子代的年龄均控制在20～65岁的劳动年龄区间,剔除仍然在上学的样本。样本的描述性统计见表4。表4中,子代收入相对于父代明显提高,各年度子代收入的均值和中位数都高于父代,但子代收入的中位数远远低于均值,说明子代样本中较低收入者占比很高,收入不平等程度高于父代。

表4 低收入样本描述性统计

(二)相对流动性变动趋势

运用代际位序相关性方法,利用式(2),对低收入群体代际收入流动性进行测度,为了进一步减少由于使用当期实际收入而产生的暂时性收入偏误,公式中控制了父代年龄及其平方项、子代年龄及其平方项,结果如表5所示。图2描绘了代际位序相关性的变动趋势,以便进行趋势分析。

图2 低收入群体代际位序相关性的变动趋势图

表5的估计结果显示,各年回归系数均显著为正,说明父代收入对子代收入有显著正向相关性。从趋势上看,代际位序相关性总体上呈下降趋势,从1989年的0.263下降到2015年的0.102,反映出低收入群体的代际收入流动性总体上是上升的,但经历了一个波动的过程。1989—2006年代际位序相关性呈U型,先从1991年的0.323下降至2000年的0.129,再逐渐上升到2006年的最高值0.385,即流动性先上升后下降;2006年后代际位序相关性大幅下降,代际收入流动性明显改善。

表5 1989—2015年低收入群体代际位序相关性

低收入群体这一代际流动性变动趋势与居民收入的基尼系数变动趋势基本一致,即代际间收入不平等与同代人之间的收入不平等变动趋势一致。根据国家统计局发布的数据,2003—2015年中国居民收入的基尼系数经历了先上升,再自2009年逐步回落的过程。对英国、美国、加拿大等诸多国家的经验研究表明,一个国家的收入不平等程度越高,代际收入流动性就越低,二者的这一反向变动关系被称之为“了不起的盖茨比曲线”[19]。斯蒂格利茨则将更大的收入不平等会带来更少的机会平等、更少的机会平等又导致更多的收入不平等的动态过程描述为“逆向动态”的“恶性循环”。中国低收入群体代际流动性提高,说明近年来进行的旨在缩小收入差距的收入分配制度改革,在一定程度上提高了低收入群体的代际流动性,减缓了低收入代际传递。

(三)绝对流动性变动趋势

上述代际位序相关性反映的是代际收入流动性大小,却不能判别低收入子代社会经济地位的改善程度。为了深入了解这一状况,本文利用代际位序相关性方法的统计优势,测算绝对流动性,分析低收入子代的期望收入位序。绝对流动性计算公式为:

(3)

表6 1989—2015年低收入群体绝对流动性

图3 低收入群体绝对流动性变动趋势图

根据计算结果,可以发现三方面的特征:第一,不同百分位低收入群体子代的绝对流动性均呈上升趋势,即子代期望收入位序上升。父代收入处于10、25和40百分位子代的期望收入位序,分别从1989年的36.492、41.570和46.647上升到2015年的41.272、44.568和47.864。尽管2004年各阶层期望收入位序都出现了下降,但2006年后均显著上升。随着子代社会经济地位改善,低收入群体的代际固化率也显著下降。第二,父代收入阶层越低,其子代期望收入位序相对上升越高,上升速度也越快。以2015年为例,10、25和40百分位子代的期望收入位序分别比父代高31.272、19.568和7.864。其中,10百分位阶层子代位序的上升速度最快,且在2004年后与其他百分位阶层的差距明显缩小,说明低收入群体代际流动性上升主要源于贫困群体子女收入位序的提高。近年来,中国扶贫工作取得显著成效,贫困发生率从2000年的49.8%下降到2017年的3.1%,在2020年实现现行标准下农村人口全面脱贫。精准扶贫政策为农村贫困家庭子女提供了更多的就业机会,从而推动贫困人群实现收入阶层的向上跃升。第三,越来越多的低收入家庭子女摆脱了贫困,但攀升至收入最高1/5阶层较难。1989年超过贫困线的概率为0.264,2015年提高到0.947,但进入最高1/5阶层的概率变化不大,基本维持在0.1左右。这表明,低收入群体子代向上流动的空间有限,存在着明显的“天花板效应”。

(四)代际收入流动性的地区差异

长期以来中国区域发展存在高度不平衡,而代际收入流动性与地区经济发展水平、教育水平以及社会文化等密切相关,因此分析地区差异有助于把握低收入群体代际流动性全貌。合并各年CHNS追踪样本,筛选出样本量较大的贵州、河南、江苏、辽宁等九个省份,分别代表西部、中部、东部和东北地区。利用代际位序相关性方法,表7报告了各省份低收入群体的代际收入流动状况。

表7 分地区低收入群体代际流动性

根据表7可以发现,分区域看,代际位序相关性从大到小顺序为东部、东北、中部和西部,即广西、贵州等西部地区流动性最大,分别为0.357和0.426;以江苏、山东为代表的东部地区流动性最小,分别为0.522和0.483。绝对流动性则相反,东部最高,西部最低。父代收入处于25百分位的子代期望收入位序,江苏为41.705,贵州为31.495。这说明,西部地区子代收入虽然超过父代,实现了向上流动,但流动距离并不远。贵州低收入家庭的子代仅有6.2%流入最高1/5阶层,仍然停留在低收入阶层的概率高达0.653。也就是说,经济相对落后地区的居民虽然代际流动性提高,但收入地位与经济发达地区居民相比仍有较大差距。

四、低收入群体代际向上流动的影响因素分析

究竟哪些因素制约了低收入群体代际向上流动?已有文献主要讨论了教育、职业、家庭财产等经济因素而非基因等先天禀赋,因为前者涉及政策设计。由于低收入家庭的财富往往较少,本文主要关注教育、职业的作用,鉴于地区间基础教育设施存在很大差异以及低收入家庭相对较差的居住环境,利用CHNS社区数据,将社区环境相关因素纳入分析框架。分别以低收入群体子代收入是否超过贫困线、是否升至最高1/5阶层、是否升至最高1/10阶层为被解释变量,向上流动赋值为1,否则赋值为0。影响因素主要考察三类:一是个体特征,包括子代受教育年限、职业等级、性别、婚姻等;二是家庭背景,包括父亲受教育年限、是否从事非农职业、是否农村户籍等;三是社区环境,包括社区是否有小学、是否有职高或技校、是否有开发区、外出劳动力占比等。利用面板Logit模型进行分析,为了避免时间趋势和地区差异的干扰,模型中控制了时间趋势变量和省份虚拟变量,估计结果如表8所示。

表8 面板logit模型的估计结果

从子代个体特征的估计结果看,受教育年限、职业等级的回归系数在三个模型中均显著为正,说明这两个因素有效促进了子代收入的向上流动。其中,受教育年限每增加1年,脱贫的概率增加14.6%(e0.136=1.146),职业每提升一个等级,脱贫概率上升28.7%。这表明,尽管教育、职业是低收入群体子代向上流动的重要路径,但职业的影响更大。一方面,低收入家庭由于资金约束和较低的投资意愿,普遍缺乏对子女的人力资本投资,使得子代整体教育水平偏低,造成教育促进子代脱贫的效果有限;另一方面,在中国工业化、市场化进程中,外出务工是农村居民摆脱父辈低收入影响,进而向上流动的主要通道,职业的代际传递性更强。从模型(1)到模型(3),受教育年限的回归系数逐步递增,职业等级的回归系数则递减,也就是说,收入向上流动的阶层越高,个人受教育年限发挥的作用就越大,而个人职业等级发挥的作用越小,说明在向最高收入阶层跃升的过程中,人力资本是关键因素。子代性别的估计值显示,男性进入更高收入阶层的概率更大,婚姻的系数则不显著。

从家庭背景因素看,父代的教育、职业对子代脱贫的作用显著,且职业的作用远远大于教育,父代从事非农职业,其子代收入超过贫困线的概率是父代从事农业职业的2.5倍。Becker等认为,父代的教育和职业在一定程度上可以决定子女的人力资本水平,进而影响子女的就业机会[3]。父代从事非农职业的家庭,能够为子女提供更多有关劳动力市场的就业经验,通过帮助子女改善就业、增加收入促进子代实现向上流动。农村户籍对代际向上流动有着负向影响,但可能是城镇户籍的样本太小,估计值并不显著。

在社区环境因素中,社区有职高或技校最有助于子代摆脱贫困。外出劳动力占比也对子代收入向上流动起着促进作用。职业教育通过更低的入学门槛、更低的教育成本和直接的就业通道,为低收入家庭子女提供更多就业及向上流动的机会[21]。同时,外出劳动力越多,越能扩大社区内部及外部的社会网络,为社区成员带来更多的就业信息,从而提高低收入家庭子女外出务工的概率,推动其向上流动。小学分布在模型中为负数,且对子代收入超过贫困线有显著负向作用,这与卢盛峰等研究结果一致,即农村小学布局过密对代际收入流动性存在抑制作用[22]。

比较三个模型的影响因素可以发现,个体受教育年限和职业等级、父代受教育年限和从事非农职业、社区有职高或技校和社区外出劳动力占比都对子代脱贫有显著促进作用,但子代若要跃升至更高收入阶层,发挥作用的因素则主要是个体受教育年限和职业。

五、结论与启示

本文运用代际位序相关性方法,修正多种计量偏误,利用1989—2015年CHNS数据,测度中国低收入群体代际收入流动性的变动趋势,并在此基础上通过计算绝对流动性,分析低收入群体子代的期望收入位序及其地区差异,最后利用面板Logit模型,对影响代际向上流动的因素进行了探讨。研究结论如下:第一,低收入群体的代际收入流动性在1991—2006年呈现先上升后下降的趋势,但在2006年后显著上升,其中底层贫困人群子代收入位序上升更快。这一变动趋势与中国居民收入的基尼系数变动趋势一致,说明中国收入分配制度改革、扶贫工作对提高低收入群体代际流动性起到了积极作用。第二,低收入群体代际流动性存在区域差异,西部最高,其次是中部、东北和东部地区。西部地区子代虽然相对于父代提高了收入位序,但与发达地区相比仍然差距较大。第三,尽管底层贫困人群、西部地区人群代际流动性更大,但其子女收入地位并没有发生实质性改变,上升空间有限,存在“天花板效应”。第四,子代与父代的受教育年限、职业等是影响代际向上流动的关键因素,子代向上流动的阶层越高,教育的作用越大。

根据上述实证研究结果,就提高低收入群体代际流动性的政策而言,政府应当加强对农村低收入家庭子女的教育投资,提高农村地区中小学师资水平和教学设施质量,确保低收入家庭子女具备摆脱贫困代际传递的人力资本。同时,要努力为低收入家庭子女提供更多非农就业机会,加强职业教育和就业技能培训,从而阻断低收入代际传递。