APP下载

家庭受教育水平与收入不平等关系研究
——基于CFPS2016数据分析

2020-03-27周燕芳刘小瑜

江西社会科学 2020年3期
关键词:人口数户主家庭收入

周燕芳 刘小瑜

教育一直以来都是人力资本中的重要因素。利用CFPS2016家庭和个人数据库,依据家庭平均受教育年限将所有家庭分为五个教育等级并进行人均纯收入显著性检验和收入不平等描述,基于收入决定方程Shapley值分解法测算家庭特征对收入不平等的贡献率,结果表明:收入不平等与家庭教育等级之间存在W型关系;城乡差异是导致收入不平等的最主要原因,且在平均受教育水平高的家庭更加突出;随着家庭教育等级的提高,家庭平均人口数越来越少,对收入不平等的贡献率越来越高,拥有家庭净资产的贡献率越来越低,户主健康状况的贡献率也较为突出;教育等级越高的家庭平均年龄越大,婚姻状况对其收入不平等的贡献越突出。因此,应推广高职教育,推动城镇化建设并鼓励教育人才投身农村,给予老弱家庭相应补贴,提高高等级人才幸福指数以缩小家庭收入不平等差距。

一、引言及文献回顾

教育作为重要的人力资本投入要素一直备受学者们关注,无论是其对经济增长的作用,还是对收入分配的影响都是研究的热点。早期的人力资本理论都认为教育是最重要的人力资本积累,对收入分配起着重要的作用。关于教育与收入不平等的关系主要归纳为以下四种:

第一种观点认为教育发展与收入不平等呈负相关关系,教育的发展可以有效减小收入不平等。如国外学者Becker &Chiswick利用美国、加拿大、墨西哥等国数据进行实证检验证明了教育水平的提高可以减少收入不平等。[1]Gregorio &Lee利用全球100多个国家的面板数据进行研究表明教育水平的提升和教育投资的均衡化可以显著改善收入不平等。[2]国内学者李明芳认为教育总体水平的提高可以降低基尼系数从而改善收入不平等。[3][4]卜振兴运用分位数回归模型和非结构化模型均证明了高等教育的发展可以减少收入不平等。[5][6]陈晨和仲伟周运用我国1979-2006年省级面板数据进行方差分解后认为不同级别的教育投入对缩小收入不平等的平均贡献率达到11.9%。[7]

第二种观点认为教育发展与收入不平等呈正相关关系,教育的发展会加剧收入不平等。如Stiglitz[8]运用筛选理论证明了教育会加大收入不平等。Harmon[9]、Fersterer &Winterenmer[10]、Martins &Pereira[11]都认为高收入群体拥有比低收入群体更高的教育收益率,教育扩展会导致个体间收入差距扩大。薛进军和高晓淳通过对我国住户调查数据的实证分析表明,教育水平的提高扩大了收入不平等的差距。[12]李祥云等运用21个省级面板数据构建误差修正模型发现公共教育支出无论从长期还是短期来看均加剧了收入不平等。[13]

第三种观点认为教育发展与收入不平等之间的关系是非线性的。Giustinelli利用意大利的数据发现,教育收益与收入的非线性关系类似于“正U型”的曲线。[14]我国很多学者认为教育发展与收入不平等之间呈“倒U型”关系,例如赖德胜[15]、周金燕和钟宇平[16]、王静和霍学喜[17]、习明明和张进铭[18]都证明了教育与收入不平等的“倒U型”关系。韩雪峰不仅证明了高等教育与收入不平等之间呈“倒U型”,而且认为我国已经跨越了“倒U型”的峰值,处于曲线的右侧,教育的发展会缩小收入不平等。[19]而白雪梅[20]、成谢军[21]、李祥云[22]等人却认为我国目前处于“倒U型”曲线的左侧。

第四种观点认为教育发展与收入不平等之间的关系是不确定的或者并不显著的。Morduch &Sicular以山东省邹平县农村调查数据为例研究发现,当以基尼系数和变异系数衡量收入差距时,教育扩大了收入差距,而以泰尔指数作为收入差距衡量指标时,则缩小了收入差距。[23]候玉娜和易全勇利用文献综述的方法基于不同的研究视角发现,经济视角上教育发展具有改善收入不平等差距的作用,社会学视角上教育发展无法改善收入不平等状况。[24]郑猛利用2014年云南省流动人口数据实证发现尽管教育扩张能够提升收入整体水平,但并不能有效改善收入不平等,最终将导致“均值高、方差大”的“二元分配格局”。[25]石大千和张哲诚从微观层面基于环境——努力二分法解构教育不平等,发现教育机会不平等显著扩大了收入差距,教育努力不平等显著缩小了收入差距,由于教育机会不平等和教育努力不平等的反向作用,总体教育不平等对收入差距的影响不再显著。[26]

综上可知,研究的方法、时期、指标和角度不同都会导致完全不同甚至相悖的结论。针对国内的研究来看,大多数学者选用的数据较早期,其次是分析方法大多采用回归分析的方法,分析时一方面很少从家庭特征的角度进行深入研究,另一方面大多从较早时期个人数据的角度来研究教育与收入的关系,而极少从家庭的角度来研究;再次鲜有学者将家庭教育水平进行等级划分后再进行分解和因素分析。本文选取CFPS2016数据,将所有家庭按平均受教育年限划分为不同的教育等级,对家庭教育等级与家庭收入不平等之间的关系进行检验,并进一步通过因素分解来探析不同教育等级家庭中导致收入不平等的各种家庭特征的贡献。本文研究特色主要体现在三个方面:一是以家庭为研究单位,并按家庭的受教育年限划分等级,分析各教育等级家庭收入不平等的变化,发现其变化与现有研究结论存在差异;二是利用shapley值法就不同教育等级家庭分解其家庭特征因素对家庭收入不平等的贡献程度;三是结合各家庭特征因素的变化及其贡献率发现不同教育等级家庭存在收入不平等的原因。

二、样本整理

CFPS2016数据来源于北京大学开放研究数据平台中的中国家庭追踪调查(CFPS),该项目是由北京大学中国社会科学调查中心设计并实施的一项全国性家庭跟踪调查计划,CFPS基线调查样本覆盖全国25个省市161个区县的649个村居样本,其中抽取1.5万个家户样本及其样本家户中的全部家庭成员,该调查以2010年为基线调查,其后每两年对调查对象进行一次追踪访问。目前最新的调查数据是CFPS2018年的调查结果,但是官网上2018年的家庭成员样本不完整,导致很多变量无法计算,故采用样本量最大,数据库最完整的2016年数据进行分析,2016年的调查数据中有14019户家庭样本,共计58179个家庭成员样本。

本文采用了CFPS2016数据中的家庭成员数据库和家庭经济数据库。利用stata统计分析软件进行数据整理和分析,根据家庭成员样本数据集中的个人出生年份计算出每位家庭成员的年龄,将每位家庭成员的个人最高学历转换为相应的受教育年限(文盲/半文盲为0年,小学为6年,初中为9年,高中/中专/技校为12年,大专为15年,大学本科为16年,硕士为19年,博士为22年),删除与家庭经济上不是一家人的样本以及非在家住基因成员①,计算家庭总人口数、家庭平均年龄和平均受教育年限,与家庭经济样本数据集合。为了更好地反应户主情况(最主要的家庭收入来源者),删除非最适合人员回答问卷的家庭。为了更真实地反应收入的变化情况,本文选择调整后可对比的各项收入进行研究,删除收入缺失值样本,删除各收入来源之和与全部家庭纯收入不相等的样本,删除家庭特征缺失样本,最后得到7629个家庭样本。

三、家庭教育等级与收入不平等关系

(一)不同教育等级家庭收入差异显著性检验

为了检验家庭受教育水平是否会显著影响家庭收入,将所有样本家庭依据家庭平均受教育年限划分为5级,即1级(6年以下,占23.1%)、2级(6—9年,占27.5%)、3级(9—12年,占24.8%)、4级(12—15年,占15.7%)、5级(15年以上,占8.9%)以便更准确地检验各级家庭之间的收入差异。

选取家庭人均纯收入作为检验变量以说明不同教育等级家庭之间的收入是否有显著差异,并运用Herve M.CACI编写的宏命令Kwallis2进行非参数检验,这个命令是一段专门针对从不同人群中抽取的独立样本进行两两比较和检验的程序,它提供了多组两两比较的秩和检验结果,既包含单因素分析和K-W检验的作用,又克服了不能满足参数检验数理条件的缺陷,对总体分布类型不做任何要求,不受总体参数的影响,可以应用于任何类型的资料。从表1的检验结果可以发现,所有组之间的P值都远小于0.05,即拒绝了没有显著差异的原假设,各教育等级家庭之间人均纯收入都存在着显著差异,说明教育是影响家庭收入不平等的重要因素。

表1 2016年我国不同教育等级家庭人均纯收入差异显著性检验结果

(二)不同教育等级家庭的收入不平等变化

目前,国际上通用的测量收入不平等的指标仍然是基尼系数。本文对5个不同教育等级家庭组分别计算家庭纯收入均值和家庭人均纯收入均值,并分别依据家庭纯收入和家庭人均纯收入计算基尼系数见表2,从表2的结果发现随着家庭教育等级的上升,家庭纯收入均值先上升后下降,3级家庭纯收入水平最高,而家庭人均纯收入则随着家庭受教育等级的提高不断上升。绘制家庭教育等级与收入不平等的关系图,如图1所示,可以发现家庭人均纯收入表现出来的收入不平等与家庭纯收入表现的收入不平等形状极为相似,都表现出“W”形的起伏变化,教育等级最低的1级家庭组和最高的5级家庭组均表现出较大的收入不平等,基尼系数均在0.5以上,其次是3级的家庭组收入不平等程度略低一点,2级和4级家庭组的收入不平等程度都较低。可见家庭教育等级与收入不平等之间并不是简单的线性关系,家庭教育等级高到一定水平以后,收入不平等又会增大。

表2 2016年我国不同教育等级家庭收入不平等情况

图1 不同教育等级家庭的收入差距变化

四、研究方法与变量描述

(一)基于收入决定方程的Shapley值分解法

Shapley值分解法的步骤是:(1)构建收入决定方程,找出影响家庭收入的显著变量。(2)对收入决定方程中通过检验的变量进行Shapley值分解,计算出各显著变量对家庭收入不平等的贡献率。Shapley值法有基于回归预测的分解(Fields,2003)[27]和基于拟合优度的分解(Wan,2004)[28],本文采用基于拟合优度的Shapley值分解方法,在包含该自变量的组合回归模型中测算R2,然后剔除该自变量以观察R2的变化,R2减少的程度与该变量的边际贡献成正比,R2减少越多,该自变量对因变量变异的贡献率越大。

设定自变量集合K={xj},假设θ是自变量的一组排列,而θ(j)表示变量在θ中的位置,因此在排列θ中,任一其他变量xj对于拟合优度的改变程度可用式(1)计算:

其中,MC(xj,θ)是变量xj在θ中的临界贡献,f[P(θ,xj)∪{xj}]表示xj取实际值时造成的收入差异,f[P(θ,xj)]表示xj取均值时造成的收入差异。

将Θ(K)作为K的所有组合排序,计算xj的Shapley值为:

(二)变量描述

表3 变量定义及其描述性统计

学者们研究收入不平等家庭特征时,通常会从家庭人力资本角度来考虑对收入的影响因素,而各项家庭特征往往与其收入状况息息相关,其中主要包括家庭的总人口数,平均年龄,主要收入者性别、身体健康状况及婚姻状态(用户主的性别、健康状况和婚姻状态代表),这些代表了一个家庭的劳动能力,另外家庭拥有的净资产、城乡分类和家庭所在地区也是导致家庭收入不平等非常重要的因素。[29][30]本文将户主的婚姻类型统一归为三类,未婚、在婚和其他(包含了同居、离婚和丧偶),设置两个虚拟变量mar1和mar2。由于数据中省份太多,本文将其统一按东部、中部和西部进行划分,设置两个虚拟变量region1和region2。因变量则选择可以更好地代表个体收入情况的家庭人均纯收入,并对其取对数以便更加平稳。对各变量进行描述结果见表3。

对所有的自变量按家庭教育等级统计其均值,结果见表4,可以发现,随着家庭教育等级的提高,户主健康状况越来越好,家庭在东部地区的比例越来越高。除1级家庭外,其余四个等级家庭组随着家庭教育等级的提升,家庭人口数均值越来越小,平均年龄越来越大,在婚比例越来越低,其他婚姻状况的比例越来越高。

表4 2016年我国不同教育等级家庭特征等自变量均值描述

五、方程的构建和分解结果分析

(一)收入决定方程的构建

根据明瑟收入方程,构建家庭人均纯收入的半对数收入决定方程为:

针对不同教育等级家庭将各变量代入方程计算参数,并做显著性检验,将年龄和年龄的平方作为组合变量。自变量与因变量的相关性越强,则对家庭人均纯收入差距的贡献就会越大,相反则越小。采用逐步回归法剔除掉表现不显著的变量,最终的收入决定方程结果见表5。对全部家庭进行逐步回归,发现家庭人均纯收入与所有变量均表现出显著的相关关系,但是当我们将其按照不同教育等级分类进行回归的时候,各自变量却表现出了差异:1级家庭组的家庭人均纯收入与家庭人口数呈负相关关系,与户主健康状况、家庭净资产、城乡分类及家庭所在地区呈正相关;2级家庭组的家庭人均纯收入与家庭人口数呈负相关,与家庭平均年龄、户主健康状况、家庭净资产、城乡分类及家庭所在地区呈正相关;3级家庭组的家庭人均纯收入与家庭人口数、户主婚姻状况呈负相关,与家庭平均年龄、户主健康状况、户主性别、家庭净资产、城乡分类及家庭所在地是否在东部地区呈正相关;4级家庭组的家庭人均纯收入与家庭人口数、户主婚姻状况呈负相关,与户主健康状况、家庭净资产、城乡分类及家庭所在地是否在东部地区呈正相关;5级家庭组的家庭人均纯收入与家庭人口数、家庭平均年龄、是否为其他婚姻状况和家庭所在地是否在中部地区呈负相关,与户主健康状态、家庭净资产、城乡分类呈正相关。

表5 收入决定方程逐步回归结果

(二)不同教育等级家庭收入决定方程的Shapley值分解结果与分析

根据表5显示的全部家庭及各教育等级家庭的显著影响因素,基于收入决定方程用Shapley值法分解全部家庭及各教育等级家庭中显著特征因素对收入不平等的贡献,结果见表6。

从表6可知,不进行分类时,所有特征因素对全部家庭人均纯收入不平等的共同贡献率为26.947%,其中城乡分类的贡献率最大为7.65%,说明我国城乡二元化非常明显,是影响收入不平等的重要因素。教育的贡献率其次,为6.684%,由此可见教育是造成家庭收入不平等的非常重要原因之一。户主的健康状况和家庭人口数对收入不平等的贡献率都在3%以上,家庭所在地区是否在东部地区的贡献率达到2.066%,家庭净资产的贡献率为1.879%,家庭平均年龄、户主性别、家庭所在地区是否在中部地区和户主婚姻状态的贡献率则较低,都在1%及以下。固定各家庭教育等级,对家庭按各教育等级分别进行分解后发现,前四级家庭组所有因素的共同贡献都大幅度下降了,可见教育水平越低的家庭,教育对其收入的影响越大。5级家庭组所有因素的共同贡献率高达37.375%,说明当家庭教育等级提升到一定程度时,家庭特征因素对收入不平等的贡献越来越大。

表6 基于收入决定方程的Shapley值法分解结果 单位:%

结合表4中各级家庭的特征表现和表6中各特征对收入不平等的贡献率,可以发现各教育等级家庭特征对收入不平等贡献率的变化特点是:城乡分类在各教育等级家庭中的贡献率都是最高的;从教育等级2开始,随着教育等级的提升,家庭人口数的贡献率越来越高;各教育等级家庭的户主健康状况越来越好,其贡献率也较为突出,尤其是5级家庭组的贡献率较高;东部地区家庭占比越来越高,家庭是否在东部地区对1-4级家庭均有较大的贡献率;家庭净资产对各教育等级家庭收入不平等的贡献率逐渐下降;地区差异在各教育等级家庭组中普遍存在且贡献率变化幅度不大。

1级家庭组中,教育水平最低,农村家庭占比最高,家庭净资产远低于社会平均水平,户主健康状况最差,家庭人口数较多,是否拥有一定的家庭净资产对家庭收入不平等贡献较高。2级家庭组依然大部分集中在农村,户主健康状况和家庭拥有净资产都有所提高,但是仍低于社会平均水平,家庭人口数最多,婚姻状况稳定,平均年龄最低,户主健康状况和家庭拥有净资产表现出较大的贡献率。3级家庭组相较前两级家庭来说,农村家庭所占比重下降,但是仍以农村家庭为主,户主健康状况进一步提升,家庭拥有净资产也大幅度增加,高于社会平均水平,家庭人口数均值略小了一些,平均年龄不高,除了户主健康状况和家庭拥有净资产表现出一定的贡献率外,家庭人口数表现出了较大的贡献率,婚姻状态开始产生一定的贡献。4级家庭组开始进入非义务教育阶段,大多接受了高等级教育,较多集中在城镇,户主健康状况较好,家庭拥有的净资产最高,除了户主健康状况和家庭拥有净资产依然产生较明显的贡献外,家庭人口数的贡献率较高,东部地区的贡献率较明显,是否在婚产生了较明显的贡献。5级家庭组中,受教育水平最高,基本集中了我国的教育精英和各类高等级教育人才,家庭人口数最少,平均年龄最高,户主健康状况最好,大多集中在东部地区,但是家庭拥有的净资产并不高,婚姻状况不好,在婚比例最低,其他婚姻状况的比例最高,除了家庭净资产这个特征因素以外,其他表现显著的家庭特征因素的贡献率都大幅度提高,家庭特征对这组家庭的收入不平等贡献最大。

综合以上表现,从外部来看,城乡二元化是导致收入不平等的最主要因素,地区差异始终存在并导致收入不平等。从各级家庭组的内部因素来看,1级家庭组教育等级低,主要集中在农村,且家庭人口多,拥有的资产少,户主健康水平低于社会平均健康水平,这些都是导致其家庭收入低的原因,在收入水平低的情况下凸显了家庭拥有资产的相对不均带来的影响,2级和3级家庭组主要集中在农村和城镇的年轻家庭中,这两类家庭收入水平较低,且收入不平等的一部分原因体现在孩子较多,孩子多会拉低家庭平均年龄和平均受教育水平,由于国家并没有针对孩子多的家庭进行补贴,所以孩子多的家庭会相应地拉低家庭人均纯收入,从而带来一定的收入不平等。4级和5级家庭组属于高等教育家庭,户主的健康状况对家庭的影响很大,尤其是对高学历家庭的影响最甚,说明在高学历家庭中户主作为主要经济来源的作用充分体现,且家庭婚姻状况是否稳定对这两组家庭产生了较明显的贡献,尤其在5级家庭组中,其婚姻稳定状态明显不如其他家庭,其他婚姻状态带来的影响也较显著。

六、结论与建议

本文基于CFPS2016数据将家庭按平均受教育年限分为5级,对家庭人均纯收入与家庭教育等级关系进行检验,然后结合家庭特征因素构建收入决定方程,并对家庭收入不平等进行shapley值分解,研究结果表明:

家庭教育等级与家庭收入差距之间呈W型关系,且两头高于中间,教育对家庭收入差距的作用是非线性的,整个社会的家庭平均受教育水平过低或者过高都有可能带来收入差距的加大。目前我国整个社会的家庭平均受教育年限低于9年,还处于初中义务教育阶段。这个等级的家庭人均纯收入基尼系数低于社会平均基尼系数。数据分析显示,随着家庭受教育水平的提高进入下一个等级后,可能会面临家庭收入差距的短期拉大。当整个社会的家庭平均受教育年限达到12-15年之间即高中到大专之间时,家庭收入差距最小。

城乡差异是影响家庭收入不平等的最主要因素,从教育等级2开始,随着家庭教育等级的提升,贡献率不断增加,地区差异在各级家庭组中较均匀地存在。受教育水平低的家庭集中在农村地区和中西部地区,结合我国教育资源分布现状,揭示出我国教育资源和人才主要集中在城市,农村教育资源匮乏,中西部地区教育资源相对落后。

从教育等级2开始,随着家庭教育等级的提高,家庭人口数越来越少,对收入不平等的贡献率提高,家庭拥有净资产的贡献率越来越低。随着我国进入老龄化社会,医疗条件的改善,老人寿命延长,生育政策放宽,家庭抚养比会增大,但是往往越穷的家庭反而生得越多。

对于平均受教育年限在15年以上的高级教育家庭来说,更多从事脑力劳动,精神压力较大,例如高校教师、科研院所的工作人员等,该类家庭平均年龄最大,人口最少,婚姻状况不稳定,这些家庭特征因素都是导致该类家庭收入不平等扩大的主要因素。

针对目前我国收入不平等的现状,结合本文的分析结论,给出以下几点建议:

第一,研究表明,平均教育水平处于高中至大专阶段最有利于收入差距的缩小,因此,大力普及高中教育、大专教育和高职教育应是我国教育未来的主要发展方向(本科以上高校则采用精英教育的方式,重点培养高级人才),可能是今后一段时期我国缩小收入差距的举措。高职教育作为我国未来专业技术人员的主要供应渠道应被大众普遍接受和推广。

第二,针对我国教育资源的分布不均、城乡差异大、地区差异大的现状,在加速城镇化的同时,应多渠道提高农村居民收入,着重提高农村教学水平和质量,增加农村教育经费投入,鼓励各类师资人才投身到农村教育中。

第三,家庭人口数带来的抚养压力是造成收入不平等的一个重要因素。在家庭抚养压力不断增大的同时,国家应给予儿童、老人更多的社会福利,对于收入特别低、孩子比较多、老人比较多的家庭,呼吁社会给予一定的帮助,政府给予相应的补贴。

第四,对于高等级教育人才和家庭应给予更多的精神关怀,创造更多的缓解精神压力的渠道,关注脑力劳动者的身体健康和家庭婚姻的稳定,提高幸福指数。另外从现有研究来看,高等教育家庭的孩子数量很少,但其往往经济能力充足,只是都忙于事业,国家应适当鼓励高等教育家庭多生育孩子,这有利于收入不平等的缩小和未来人口整体素质的提高。

注释:

①中国家庭追踪调查中将基因成员定义为所有家庭成员及其之后的新生血缘子女或是不超过10岁的领养子女。

猜你喜欢

人口数户主家庭收入
确定代表名额按户籍人口数还是常住人口数
“十三五”渔民家庭收入情况分析及对策研究
回来(外一首)
基于BP神经网络的吉林省GDP预测研究
恩格尔系数
恩格尔系数
恩格尔系数
2015年我国60岁以上老年人将达到2.16亿
汉唐户主资格的变迁*
张小飞落网记