谁进入了较高的收入阶层?*
2015-11-05
(安徽师范大学 经济管理学院,安徽 芜湖241003)
城乡收入差距、地区收入差距、行业收入差距和劳动收入占比下降是中国目前收入不平等的核心问题。各种因素作用的共同结果不仅是收入差距扩大,更严重后果是流动性下降和社会阶层固化。社会分层是社会性资源的不平等分配关系(Levine,1998)。“谁得到了什么?是怎样得到的?”是目前社会关注的核心问题。对于学术研究而言,重要的不是各收入阶层的收入是多少,而是决定各阶层的因素是什么,即什么能够决定进入高收入阶层。
收入阶层是指以收入为标准决定的阶层分类。国家统计局在调查统计我国居民收入情况时,使用了收入 “五等分法”或 “七等分法”。收入 “五等分法”即把全部家庭或人口分为最低收入,次低收入、中等收入、较高收入和最高收入五个分层组,每组各占家庭或人口总数的20%。很多研究以此为标准,如张德波 (2009)将最低和次低合并为低收入,较高和最高合并为高收入形成了三个收入阶层。黄潇 (2013)以个人收入中位数的 [75%,125%]进行分类,低于中位数的75%为低收入,高于中位数的125%为高收入。或者以中间20%和中间60%个体确定中等收入阶层,如 Winkelrid(2005)、洪兴建 (2010)和徐蔼婷、刘波、李金昌 (2012)。
等分法和中位数法存在明显的缺欠,不能准确地把个体分成独立聚集群,即社会阶层。按“聚集程度”划分收入阶层,不但阶层之间“层次清晰”,且阶层特征分明有助于研究收入阶层的决定因素。等分法和中位数法在本质上是按人数划分收入阶层,而不是按人群的属性或聚集程度划分。如分布1为典型的两阶层,但若按等分法则分成了低、中和高收入三个阶层。同样对于分布2,如果采用中位数[75%,125%]分类法,1140和1800仍属于中间收入阶层,这显然也不恰当。
Wang和Tusi(2000)开发的 W两极分化指数虽然能够克服等分法和中位数法的缺欠,但限制了阶层的个数,不能详细刻画集群的特征。而由Esteban和Ray(1994)提出ER型指数、Esteban,Grad & Ray (1999)及 Duclos,Esteban &Ray(2003)改进的EGR指数,虽然能够进行多极化分层,但其前提是正确的分组,要求选择最相关的分组标志以更好地体现组间的差异性和组内的同质性,如洪兴建等 (2007)、罗楚亮 (2010)。很多研究选择某些外生变量进行ER分组,比如性别、户籍、民族、不同地区等。如果外生变量选择有误,不能体现组间的差异性和组内的同质性,那么分组将面临困境。目前还没有检验这些外生分组变量的方法,已有研究具有明显的主观性。
张伊娜、周双海 (2013)应用基于模型的分层聚类方法 (Cluster)突破上述方法的局限。Cluster方法通过贝叶斯后验模型选择,依据组内差距最小,组间差距最大的原则,将收入进行聚类分组。本文使用中国人民大学的CGSS(2008)数据,先依据 Mclust方法划分收入阶层,然后通过Mlogit模型确定各阶层的阶层特征,回答谁能进入较高收入阶层的问题。
一、我国收入阶层不平等分析
(一)基于模型的聚类分析 (Mclust)方法
聚类分析通过收入数据将相似个体群聚起来成为一组或一个阶层,使其组内或阶层内个体尽可能相似,组间差异尽可能大,而不是事先人为地确定组的数量和组的划分形式。Mclust聚类模型为 (Fraley and Raftery,2002):
其中:f(y,θ)为分类模型公式,yi为收入,G为阶层的数量,τk是个体属于某个阶层的概率,øk为概率分布;设øk为正态分布,Σk为方差矩阵。不同阶层的方差矩阵Σk可以相等,也可以不相等,所以模型分为两种,等方差和变方差。模型(1)的阶层数量G及相关参数由贝叶斯信息 (BIC)准则确定。
其中:loglikf(y,θ)是模型 (1)的极大似然值,θ为参数,m为参数个数,n为样本容量。
应用Mclust方法进行收入阶层划分具有三个优势 (Vermunt and Magidson 2002):第一,聚类标准为使群内差别最小化,群间的差别最大化,比传聚类标准更客观;第二,聚类灵活,允许收入变量以多种简单或复杂的形式分布到聚类中,而不是传统的简单机械分类;第三,收入变量没有必要做缩放,比传统聚类信息更真实。
(二)收入阶层测量
本文数据来源于CGSS(中国综合社会调查)数据库 (2008)。按个人收入还是家庭收入划分收入阶层尚无统一标准,如黄潇 (2013)使用CGSS的个人收入以中位数划分阶层,周兴、张鹏 (2013)以家庭收入按等分法划分收入阶层。2008年CGSS数据同时提供了家庭收入和个人收入数据,本文选择家庭收入划分收入阶层。首先,农村阶层分化以家庭为基本单元 (杨华、欧阳静,2013);其次,当代单个婚姻单位形成的个体家庭成为主流,异居的亲子间保持着密切的联系 (王跃升,2013);最后,无论是农村还是城镇居民,子女成家买房都需要父母支持,家庭更能决定个人选择和生活质量。CGSS2008数据剔除家庭收入缺失的样本后,共有5615个观测值。
Fraley和Raftery(1999)编写了模型聚类方法的MCLUST软件包,运用该软件对CGSS2008年数据的家庭收入进行聚类将5615个样本分成四组,即四个阶层,聚类模型为变方差模型。如果按个人职业收入聚类,样本分为五个阶层,不但阶层个数多,而且最低和最高两组的占比很小,都低于3%。
表1 阶层测量及特征
由表1可以发现,阶层之间家庭收入差距巨大,相邻阶层之间达2倍以上。各阶层如何定义呢?从实际收入来观察,第一阶层,按每家3口计算,人均中位数收入 (高于平均值)为月收入为208.33元,如此收入水平即使在农村生活也比较艰难。参照国家统计局四川调查总队课题组(2008)的标准,依次称为贫困阶层、温饱阶层、小康阶层和富裕阶层。费舍尔 (Fisher)在对美国贫困线发展的研究中指出,美国普查局在1971-1975年以 “低收入”(low-income)来替代 “贫困” (poverty)。按美国标准,低收入是相对于中等收入而言,但是中国目前只是发展中国家,人均收入很低,将第一阶层定义为低收入阶层会掩盖他们生活的艰辛。
各阶层家庭的特征总结:整个样本的变异系数为1.811,远高于各阶层,温饱阶层变异系数最小,富裕阶层最大,说明家庭收入之间的差异主要为阶层差距;阶层等级越高,教育年限越长,父母及配偶的教育程度也越高;越富有的阶层,年龄越低;政治身份在不同阶层差异明显,层级越高中共党员越多;贫困阶层和富裕阶层每周劳动时间最少,温饱阶层劳动时间最长;国有企业员工占比与党政机关、事业单位从业者占比特征相同,小康阶层占比最高;阶层具人明显的地区特征,富裕阶层聚集于东部地区;贫困收入阶层的工作经验 (工龄)较少,而其他三个收入阶层之间差异不大;贫困和富裕收入阶层家庭住房面积较大,除和收入有关外,住房面积与居住地有关。
二、收入阶层影响因素的实证分析
(一)模型设定
个人及家庭特征是影响收入的重要因素,如房产、土地等物质资本 (固定资产),教育、培训等代表的人力资本水平,以父母及配偶教育等家庭遗传因素。但我们更关注这些因素变量对各收入阶层的形成有何影响?为此建立排序模型和多值选择模型估算各因素与个体成为某个阶层概率之间的关系。排序模型和多值选择模型有二种,Probit模型和Logit模型①Oder probit,Oder logit,Multinomail probit和Multinomail logit四种,分别简记为Oprobit,Ologit,Mprobit,Mlogit.。Mprobit模型虽然与Mlogit模型一样克服了线性概率模型的缺欠,但累积分布函数没有明确的表达式,相对而言MLogit模型更适用。Mlogit模型的设定形式如下 (其它模型类似):
其中:α表示常数项,β是待估计的参数向量,Xi是解释向量 (个人或家庭特征),μ是随机误差项,i=1,L,n,n为样本容量。Mlogit为被解释变量,当Mlogit=1时,表示个体为贫困收入阶层,当Mlogit=1,2,3,4时依次为贫困、温饱、小康和富裕收入阶层。
(二)模型估计
模型 (3)的解释向量包括受教育年限、年龄、工龄、每周工作时间、子女数量。向量还包括反应个人与家庭特征的虚拟变量,如性别、婚姻 (是否有伴侣)、政治身份 (是否中共党员)、户口、地区、工作企业所有制性质、工作单位类型、社会资本、社会关系等、配偶信息变量、父母信息变量。社会资本以14岁前是否居住在县城以上城市度量,是取值为1,否为0。以获得目前工作 (或之前的最后一份工作)托关系起是否决定性作用度量社会关系,是为1,否为0。配偶及父母信息包括教育、户口、工作单位性质和工作单位类型。当配偶的教育程度为高中以上(不含)时配偶教育变量为1,其它为0。部分变量的设定及描述统计见表2。
表2 部分虚拟变量设定及统计描述
为获得稳健的估计结果,在估计Ologit模型的同时也估计Oprobit模型。Mlogit模型由于以一种类型为对照组,分别建立多个模型,比排序模型能够提供更详细的信息,模型的解释能力
也更强,具有更高的R2。两种模型均使用异方差稳健 (HAC)标准误。
表3 收入阶层的影响因素实证分析
由于父母与子女存在代际传递现象,模型若包括全部个人和父母信息变量,则变量的多重共线性将相当严重,如户口、父亲户口的方差膨胀因子达到了6.86和6.7。所以模型中只控制了父母的部分信息变量,为节约篇幅只报告相应的约束检验结果。
(三)结果分析
1.影响收入阶层的因素。能够有助于进入更高收入阶层的因素包括小时工资、本人及配偶的教育、工作经验、党员身份、居住东部地区、大城市户口、年轻和社会资本。企业所有制的性质对收入阶层有影响,但国有企业、集体企业与民营企业相比没有优势。在控制了小时工资后,更长的劳动时间和加班都无助于进入更高的收入阶层,即总体上勤劳并不能致富。是否有异性伴侣、子女多少与属于哪个收入阶层没有明确的关系。社会资本变量显著,即14岁前居住在县城以上城市有助于进入更高的收入阶层,表明社会资源不但影响当代而且影响下代的收入阶层。
Mlogit模型进一步表明,党员有助于进入小康和高收入阶层,而对贫困进入温饱没影响。工作经验和地区只对贫困和温饱阶层有帮助,而无助于从温饱阶层进入高收入阶层。国企和集体工作变量显著,且参数符号为负,表明进入小康或高收入阶层与这些因素无关,意味着国企和集体身份是温饱的保证①这只是从工资观察的结果,如果考虑其它的实物收入或福利结论可能有变化。。机关和事业单位身份变量不显著 (结果省略),这表明他们的工资收入与企业相比并没有相对优势②单位类型分为机关、企业、事业、社会团体和无单位等五种类型。若省略相关变量模型的样本将增加到4000以上,此时个人单位类型变量将显著,但会产生遗漏偏误问题。。
2.教育与户口是决定收入阶层的最主要因素。在模型所涉及的变量中,教育是决定收入阶层的首要因素。教育年限变量的参数估计值虽然只有最高只有0.16,但教育年限的平均值9.33年,远高于其它参数更大的虚拟变量。以不同教育程度虚拟变量代替教育年限回归,以初中教育程度作为参照,只有技校没有优势,其它更高的学历都有助于进入更高的收入阶层③如果将教育年限和教育程度虚拟变量同时置于模型中,会产生严重的共线性。教育程度虚拟变量分为:没有接受过教育、小学、初中、职业高中、普通高中、中专、技校、成人专科、全日制专科、成人本科、全日制本科、研究生教育。。配偶教育也高度显著,有助于提高家庭的收入阶层。为比较配偶对家庭阶层收入的影响 (性别变量不显著),以性别为标准将样本分为两部分,分别建模回归表明 (结果省略),男女教育都同样重要,其它变量也类似。这不仅说明男女平等,更重要的是,在婚姻选择上有门当户对的可能。
影响收入阶层的另一核心因素是户籍制度。Mlogit模型进一步表明,直辖市户口与小康或富裕阶层有关,而省会城市户口与温饱和小康阶层相关,农村户口则与贫困相关。在控制了个人教育后,母亲户口同样显著影响收入阶层,而父亲户口不显著。这符合我国户口制度安排,在历史上个人户口由母亲户口决定。社会资本变量同样体现了户口的重要性,因为中国居民的居住地主要通过户籍决定。
3.社会关系与囚徒困境。根据排序模型,社会关系无助于进入高收入阶层,而且找工作托关系反而容易进入低收入阶层。Mlogit模型进一步表明,相对于温饱阶层托关系并不能保证进入小康和富裕阶层,即关系竞争主要发生在温饱阶层。既然托关系找工作是普遍现象,平均占比高达24%,却不能进入更高的收入阶层,但为何乐此不疲?最合理的解释是:托关系主要在阶层内部竞争,群体陷入囚徒困境,竞争的结果是徒增交易成本。
4.代际传递效应。不但社会资本变量体现出父母的社会资源 (居住地)影响子女的收入阶层,而且其它变量也同样证明代际传递效应的存在,如母亲户口。社会关系如果是父母建立的社会资源,那么收入阶层因此将存在传递效应。根据表3各模型的回归结果,父亲的单位类型显著,联合约束检验至少在0.05的水平上显著。
如果将父母的其它信息纳入模型,检验结果表明这些因素不显著。这是否意味着这些信息,如教育、企业所有制等不影响子女收入阶层呢?如果以母亲教育虚拟变量代替个人教育虚拟变量后,父亲教育程度影响收入阶层(17.66,0.039)④括号内数据分别为各虚拟变量的联合约束检验,chi2值和P,以下类似。。这意味着母亲的教育水平影响子女的教育,产生了间接的代际传递效应。在给定个人单位类型和户口的条件下,父亲的单位类型和母亲的户口仍然显著,说明父亲单位类型和母亲户口除通过个人的单位与户口产生作用外,还能提供额外的影响。类似能产生间接传递效应的因素还有母亲单位类型(11.24,0.047)、母亲企业所有制性 质 (16.62,0.005)、父 亲 户 口 (18.72,0.002)。父亲的教育没有间接传递效应,看来母亲的教育作用更重要。父母的党员身份也不具备直接或间接的传递效应。
黄潇 (2013)认为父母的教育被证明是相对有效的,而父亲工作状态、党员身份和工作单位性质的传递效应尚未得到实证支撑。而本文的实证分析表明,传递效应存在更多机制、代际锁定或阶层固化更严重。
5.婚姻与收入阶层。由于使用了家庭收入作为划分收入阶层的标尺,以婚姻为核心的家庭结构在性别结构上无明显差异。所以,无论是排序模型还是多值选择模型都不能区分婚姻的影响,婚姻变量在模型中不显著是必然的。婚姻可以改变一个人的收入阶层,如女性可以嫁给更富有的家庭,或嫁给成功人士可改变命运。把已婚女性的家庭收入与个人收入对比,如果差距随收入阶层上升而增大,说明女性的收入阶层由男性决定,而这是婚姻选择的结果。表4分阶层统计显示了部分这种关系,贫困阶层比小康阶层差距更大。由于贫困阶层主要从事体力劳动,所以温饱阶层女性的相对收入高于贫困阶层。为了控制婚后收入的影响,同时控制了年龄 (小于40岁),结果没有显著差异①以年龄控制婚后收入,原则上年龄应选择平均结婚时的年龄,但样本又太少。。除富裕阶层外,其它三个阶层女性在家庭的收入占比稳定在37%-38%。这说明,在这三个阶层内,在收入层面婚姻是一种门当户对的安排。
表4 已婚女性个人与家庭收入对比
三、基本结论与政策建议
(一)基本结论
较高小时工资、本人及配偶更好的教育、工作经验、党员身份、居住东部地区、大城市户口、年轻和社会资本都有助于进入更高的收入阶层。在这些因素中,教育与户口是决定收入阶层的最主要因素。更长的劳动时间和加班都无助于进入更高的收入阶层,没有证据表明是否有异性伴侣、子女多少与收入阶层有明确的关系。机关和事业单位身份变量不能显著影响收入阶层分布,他们的工资收入与企业相比并没有明显的相对优势。
托关系找工作无助于进入更高收入阶层。关系竞争主要发生在温饱阶层,托关系加剧了阶层内部竞争,使群体陷入了囚徒困境,强化了收入阶层的传递效应。模型实证表明,存在多种机制强化了收入阶层的传递效应,如14岁前的居住地、母亲户口、父亲的单位类型等直接影响子女的收入阶层;父母教育等间接影响了子女的收入阶层。在贫困阶层、温饱阶层和小康阶层内,在收入层面婚姻是一种门当户对的安排。
(二)政策建议
按Mclust聚类方法,温饱和小康阶层分别占42.94%和22.14%。从数据来观察,中等收入群体是一个尴尬的阶层,温饱阶层不合适,而小康阶层人数占比又太少,社会阶层分布远没有达到以中等收入阶层为主的合适结构。
研究结论具有明显的政策含义。第一、效率工资是增加收入促进收入流动性的核心因素,而加班几乎没有作用。所以应完善劳动法,严格执法,减少加班,将更多时间和资源用于增加人力资本积累。第二,促进教育机会平等,平等分配教育资源,减少低收入阶层代际延续。我国教育经费占GDP的比例已经达到了适当的比例。至2013年,中国财政性教育经费支出五年累计7.79万亿元,年均增长21.58%,并且在2012年GDP占比达到4% (世界基础线水平)。目前核心的问题是公共资源分配不均,教育资源仍按教育资源严重匮乏时期的方法配置。所以应停止划分重点学校,重点班级,平衡资源,取消与教育捆绑的户籍制度。第三、机关、事业和国有企业的收入应货币化,透明化,停止发放实物补贴和福利。按调查数据,这部分群体在进入小康阶层和高收入阶层上并没有优势。这可能和实物补贴及灰色收入无法统计有关,也可能众多普通公务员等实际收入确实不高。如不能增加收入透明度,众多公务员和事业单位人员可能极易成为中国目前日益扩大的贫富差距的替罪羊,加剧贫困阶层的仇富心理,把依靠知识和勤劳致富的中等收入阶层归入高收入阶层和强势群体一类。
[1] Gordon,M.Fisher.Development and History of the Poverty Thresholds[J].Social Security Bulletin,1992,55(4):3-14.
[2] Esteban J.and Ray D..On the Measurement of Polarization[J].Econometrica,1994,62,(4):819-851.
[3] Fraley,C.and A.E.Raftery,MCLUST:Software for Model-Based Cluster Analysis[J].Journal of Classification,1999,16:297-306.
[4] Fraley,C.and A.E.Raftery,Model-Based Clustering,Discriminant Analysis,and Density Estimation[J].Journal of American Statistical Association.2002,97:611-631.
[5] Wand Y Q,Tsui K Y.Polarization Orderings and New Classes of Polarization Indices[J].Journal of Public Economic Theory,2000,(3):349-363.
[6] Winkelried.Income Distribution and the Size of the Informal Sector[EB/OL].(2005-08-04)[2014-08-20].http:∥papers.ssrn.com/sol3/papers.cfm?abstract_id=777144.
[7] Levine.Social Class and Stratification[M].New York:Rowman & Littlefield Publishers,1998.
[8] 国家统计局四川调查总队课题组.四川城市不同收入阶层差异研究[J].西南金融,2008,(7):35-38.
[9] 洪兴建,李金昌.两极分化侧度方法述评与中国居民收入两 极分化[J].经 济研究,2007,(11):139-153.
[10] 洪兴建.居民收入分配失衡的测度方法研究[M].北京:经济科学出版社,2010.
[11] 黄潇.极化效应与橄榄型收入结构的达致[J].中国经济问题,2013,(4):24-37.
[12] 罗楚亮.居民收入分布的极化[J].中国人口科学,2010,(6):49-60.
[13] 王跃升.中国城乡家庭结构变动分析[J].中国社会科学,2013,(12):60-77.
[14] 徐蔼婷,刘波,李金昌.居民收入分配如何影响非正规经济规模——基于城镇中等收入阶层收入份额的考察[J].经济学家,2012,(4):29-36.
[15] 杨华,欧阳静.阶层分化、代际剥削与农村老年人自杀——对近年中部地区农村老年人自杀现象的分析[J].管理世界,2013,(5):47-63.
[16] 张德波.城镇居民基尼系数和各收入阶层的关系——基于云南省的实证研究[J].中国证券期货,2009,(12):62-63.
[17] 张伊娜,周双海.收入不平等的阶层测度[J].上海经济研究,2013,(5):54-62.
[18] 周兴,张鹏.代际间收入流动性及其对居民收入差距的影响[J].中国人口科学,2013,(5):50-59.