APP下载

西部地区居民收入差距及其解构
——基于CFPS项目数据的研究

2021-06-05马继青罗润东

西藏大学学报(社会科学版) 2021年1期
关键词:基尼系数广义组内

马继青 罗润东

(山东大学商学院 山东威海264209)

一、问题的提出及文献回顾

社会主义发展的最终目标是实现共同富裕,共同富裕离不开平衡发展,地区平衡和居民收入平衡都是平衡的重要意蕴。由于历史和地理的原因,西部地区的发展一直不平衡。我国自21世纪初期规划并实施了西部大开发战略。经过二十几年的发展,西部大开发已经进入加速发展阶段的关键时期①西部大开发总体规划为三个阶段:2001年到2010年为奠基阶段;2011年到2030年为加速发展阶段;2031年到2050年为现代化阶段。。根据国家统计局的数据和世界银行的标准,我国西部地区的人均GDP在2010年为25291元人民币,跨入了中等收入的初期阶段,在2019年达到53742元人民币,已经非常接近中等收入的中前期。发展经济学的相关理论认为,当经济增长使人均收入达到中等收入水平时,往往会伴随着较为严重的两级分化,如果不能及时改进,极有可能陷入中等收入陷阱。此外,目前虽然西部地区和全国其他地区一样,已经脱离了绝对贫困,但相对贫困还将长期存在。同样由于历史和地理的原因,西部地区的相对贫困更难治理。因此,上述两个层面都表明厘清下述问题是必要的:第一,当前我国西部地区收入差距的实际情况是怎样的?第二,这种差距的主要来源是什么?第三,何种成分促成了这种差距的变动?这些问题都涉及收入差距的测量和分解。

关于收入差距的测量,自1912年基尼的开创性研究以来[1],基尼系数已经成为度量收入差距的主要指标,但由于其属性使然,它应当在一些方面得到补充。首先,基尼系数仅仅是众多测量收入差距的指标之一,从稳健性考虑,最好同时采用多种不平等统计指标的组合[2]。其次,基尼系数仅对收入分布中部的收入变动敏感,因此,测量中最好还要包括对收入分布底端和顶端收入变动敏感的指标[3]。再次,诸如基尼系数、广义熵等都属于收入差距的绝对测量方法,而相对分布能够充分表达和分析分布差异[4],因此是绝对测量方法的必要补充。最后,由于相对熵的测量结果不受相对分布中波峰和波谷位置的影响[5],因此,在对收入差距相对分布的测量中更常使用相对极化的方法。

关于收入差距的分解,比较常用的两种方法是按人口子群的分解和按收入来源的分解。早期,有些学者探索了基尼系数的分解问题,发现分解项中存在不好解释的重叠部分[6]。随后,有些学者从组内和组间差异的角度定义了可加性的不平等测度,并推导出可加性分解的全部类别[7]。另有一些学者专注于研究基尼系数分解过程中产生的交叉项和一些新的分解方法[8-13]。此后,更有学者进一步证明了广义熵族指数的加和可分解性。按收入来源的分解可以追溯到一些学者对按要素构成划分的不平等和按收入阶层划分的不平等进行的研究[14-15]。还有一些研究者基于被广泛使用的奥扎卡和迪纳多分解方法[16-17],构建了一个两成分收入差距分解模型,并在此基础上分解了收入差距的变动趋势[18]。也有研究者从分布位置和形状变化的角度分解了收入和财富差距的来源,并探索了特定条件下协变量对数尺度相对效应向原始尺度绝对效应的转化问题[19]。在我国,大多数学者则利用上述收入差距分解工具箱中的一种或更多,从不同角度对我国的收入差距开展分解研究。比如他们中有些人按地区对收入差距进行分解[20-21],有些人从城乡角度对收入差距进行分解[22-26],有些人从行业角度对收入差距进行分解[27-29],还有一些人从收入分布的角度对收入差距进行分解[30-32],如此等等,不一而足。

总结上述分析结果,我们认为,在收入差距的测量方面,当涉及单一分布的概要测量与比较时,同时选择对分布不同部分的变化敏感的指标是值得考虑的;当涉及不同分布的比较时,相对分布方法也是单一分布概要测量与比较的有益补充。在收入差距的分解方面,按人口子群的分解可以揭示组内收入差距和组间收入差距的相对重要性①基尼系数的分解虽然存在交叉项,但并不妨碍组内与组间相对重要性的比较。,而分位数回归结合反事实的方法则把收入差距变动趋势解构为构成成分和条件成分,从而为收入差距的来源提供了重要信息。

综上所述,文章将重点开展以下几个方面的工作:首先,分组别统计中国家庭追踪调查项目②由北京大学中国社会科学调查中心(ISSS)开展的中国家庭追踪调查项目(以下简称CFPS),于2010年开展基线调查并界定基因成员,样本规模为16000户,覆盖全国25个省、市、自治区和直辖市,调查目标为样本中的所有家庭成员,调查内容涉及家庭关系与家庭动态、人口迁移、经济活动、教育成果、健康等诸多方面。由于其样本量大,覆盖面广,所以基本可以反映调查内容全国总体的情况。本文数据即来源于其中的西部地区样本。西部地区相关期的数据,并利用基尼系数、一组广义熵族指数和相对极化指数等相互补充的测量,对西部地区各期的收入差距及其变动趋势进行测度和比较;其次,利用教育、户籍、民族、性别和年龄等类别变量进行分组研究,得到各类别组内和组间成分对收入差距的相对贡献,并进一步对各类别组内成分进行分解,得到每一类别中各组别对收入差距的相对贡献;再次,利用分位数回归结合反事实的方法将西部地区收入差距的变动分解为构成成分和条件成分的贡献,从动态角度解构收入差距的变异;最后,根据前述分析得出结论并提出相应建议。

二、收入差距测度指标的选取及分解方法

根据前述分析,收入差距测量指标的选取主要应追求指标之间的互补性。为此,在单一分布概要测量方面,文章选取基尼系数和广义熵指数族中参数θ取值为-1、0、1和2的指数。之所以选取基尼系数,是因为基尼系数使用广泛,并且对收入分布中部的收入变动敏感。之所以选取广义熵指数族中指定参数值的四个指数,是因为:首先,广义熵族满足收入差距测度的公理性要求;其次,阿特金森指数族和变异系数等很多其他测量指标在一定条件下都可以转化为广义熵中相应的测量指标;再次,在广义熵指数族中,参数θ取值为-1时对收入分布底端收入的变动敏感,参数θ取值为0和1时对收入分布中部的收入变动敏感,而参数θ取值为2时对收入分布顶端的收入变动敏感。当涉及分布之间的比较时,一方面,文章利用不同的单一分布概要测量值进行比较,另一方面则使用极化指数来提供分布变动的补充信息。

由于基尼系数在分解过程中会产生交叉项,而广义熵族指数可以在人口子群中加和分解,因此,这两类指标的分解方法并不相同,现分别介绍如下:

基尼系数的分解公式为:

其中,G为基尼系数,vk为第k个组别人口占总体人口的比例,λk为第k个组别均值收入相对于总体均值收入的比例,Gk为第k个组别的基尼系数。相应地,vh为第h个组别人口占总体人口的比例,λh为第h个组别均值收入相对于总体均值收入的比例。⑴式中的第一项提供了各组组内不平等的加权平均值,可以由它求取组内不平等的贡献。⑴式中的第二项消除了所有组内的差异,只保留了组间差异造成的不平等,因此可以由它求取组间不平等的贡献。而⑴式中的第三项R就是通常所指的交叉项,一般认为它取决于不同组别重叠的频率和程度[33]。

假设总体被以某种属性划分为M和N两个组别,与此对应的广义熵指数族分解公式为:

其中m为M组别的人口数,为M组别收入的平均值;n为N组别的人口数,为N组别收入的平均值,(m+n)为总人口数,yˉ为总体收入的均值,是参数取值为θ时总体的广义熵,为同一环境下的组间广义熵、组内广义熵、M组别的广义熵和N组别的广义熵[34]。

此外,收入差距变动趋势的分解使用分位数回归结合反事实的方法。其分解公式为:

三、主要变量的描述性统计

为探索西部地区的收入差距及其构成,文章在收入差距的测度阶段将使用CFPS项目前四期的数据。为解构西部地区的收入差距及其变异的原因,文章在收入差距的分解部分将使用CFPS项目2012和2016两期的数据①下面我们将很快看到,西部地区的收入差距自2012年至2016年总体上呈上升态势。。无论在收入差距的测度还是分解部分,文章都将剔除年收入小于100元人民币的样本,并以2010年为基期进行分析。在分析中使用的分组变量主要包括年龄、性别、户籍、民族和教育等,使用的控制变量主要包括年龄平方、身体健康状况、智力水平和家庭婚姻状况等。表1呈现了主要变量的常用统计量值以及各组别收入的分布情况。

根据表1的数据,从总体收入看:第一,2016年的均值收入和中位数收入均略低于2012年的对应项,但t检验显示两者的差距并不显著;第二,无论哪一年,均值收入均高于中位数收入,说明两年均存在一定的收入差距。从年龄看,一方面,小于60岁的人口占比随时间推移在降低;另一方面,均值年龄和中位数年龄均有所增长,呈现了老龄化渐趋加重的特征。在其他类别变量上,除2016年本科及以上组别外,各类别组别收入同样呈现出均值收入大于中位数收入的现象,并且出现了另外一些特征:在均值收入方面,女性、非农业户口、汉族和教育等组别均呈现出日趋下降的现象;在中位数收入方面,性别、非农业户口、汉族和大专及以下组别也呈现了逐渐下降的特征。特别对非农业户口而言,双向变动明显拉大了均值收入和中位数收入的差值,从而表现为组别内部更趋增高的收入差距。另外,高等教育对缩小收入差距的作用也较为明显,特别是2016年本科及以上群体的均值收入竟然小于中位数收入,说明这类群体内部的收入差距得到了较大的改善。从各类别相应组别的占比来看,男性和女性的比例更趋接近,农业户口的占比在降低,汉族的人口份额有所提高,高中类及以上组别的人口比重在上升。这些特征都在各自的组别内反映了经济、社会发展的趋势。

表1 主要变量的描述性统计(收入单位:元)

四、收入差距的测度

根据文章第二部分收入差距测量指标的选取原则,以下将使用基尼系数、参数θ取值为-1、0、1和2的广义熵族指数以及中位相对极化、下部相对极化和上部相对极化等相互补充的指标对研究期内西部地区各年的收入差距进行测量,测量结果如表2所示。

表2 西部地区收入差距的测量及其变化趋势

表2的测量结果显示,除GE-1外,其他指数各期测量值均小于2010年的测量值,说明除低收入群体之间的收入差距有所上升外,其他群体的收入差距都表现为显著的下降。但如果只分析后三期的数据,发现除GE2外,其他测量指标的值均呈先增大后减小的趋势,且增大时很显著,减小时不显著,因此整体仍呈增大趋势;对GE2而言,其测量值逐年减小,但在后期这种减小的趋势也不显著。从各期的相对分布来看,2010与2016两期之间的LRP测量值高达0.884,这也表明2016年西部地区低收入群体的收入差距在扩大。图1和图2呈现了各期收入分布的洛伦兹曲线和广义洛伦兹曲线。

图1 洛伦兹曲线

图2 广义洛伦兹曲线

图1表明,从总体上看,2012年的洛伦兹曲线占优于2010年的洛伦兹曲线,2010年和2016年的洛伦兹曲线存在交叉,2012年和2016年的洛伦兹曲线也存在交叉。在交叉的情况下,仅根据洛伦兹曲线并不能对相应年份的收入差距状况做出明确比较。但图2所示的广义洛伦兹曲线却清晰地显示2012年和2016年的收入差距总体上要小于2010年的收入差距。此外,图2的信息也表明,2012年和2016年的广义洛伦兹曲线在第八十五百分位左右交叉,这表明相对2012年,2016年收入分布底部和中部的收入差距有所扩大,而收入分布顶部的收入差距则在缩小。

五、西部地区收入差距及其变动趋势解构

为探索不同时期收入差距的来源及其日益扩大的原因,以下将利用2012年和2016年的数据对西部地区的收入差距进行解构。

(一)组内和组间角度的分解

根据文章第二部分的分解方法,现将各测量指数从组内和组间的角度进行分解。分解结果如表3所示。

表3 西部地区收入差距的组内和组间贡献分解

根据表3,从总体上看,各分解结果均显示组内的收入差距远远超出组间的收入差距,这意味着恰恰是同一组别内部之间的差别造成了差距。比如教育变量,各个不同的教育阶段内都既有高收入者又有低收入者,不同的受教育水平并不是收入不均衡的主要来源,同一教育水平下的收入差异才是造成收入差距的主要原因。这其实揭示了诸如家庭地位、社会关系和运气等外生因素影响同一教育水平内部收入差异的事实。表3还提供了另外一些比较强的信息,比如,对2016年的民族和户籍变量而言,组内收入差距几乎构成了全部的收入差距,说明民族之间的差别和城乡户籍之间的差别不再是影响整体收入差距的因素,这理应是我国长期实行的多民族共同繁荣发展政策和城乡经济社会一体化政策的结果。

既然总体收入差距主要来源于组内成分,且每一类别均由不同的组别组成,那么继续分解各类别内部不同组别的贡献就比较有吸引力。分解结果如表4所示。

表4列示了组内成分按组别的分解结果。年龄分组的数据显示,无论哪年,对收入分布中上部收入变动敏感的指标的分解结果均显示收入差距主要集中在中青年群体中,但对收入分布底端收入变动敏感的GE-1的分解结果则显示,2016年中青年群体内的收入差距贡献比2012年减少了70.5%,低收入群体内的收入差距主要集中在老年人群体中。从性别变量分析,一方面,尽管2012年低收入群体的收入差距主要集中在女性当中,但这种状况在2016年发生了反转,中低收入群体中男性组别对收入差距的贡献更大;另一方面,高收入群体在性别上对收入差距的贡献差别仍在增大,已从2012年的39%增长为2016年的51.6%。户籍类别中的收入差距主要集中在农业户口,并且农业户口和非农业户口群体中的收入差距情况日趋接近。对民族变量而言,汉族内部的收入差距在总的组内收入差距中占据压倒性的比例,并且除GE1外,其他指数的分解结果均显示这个比例在中低收入组中正在提高,在高收入组中正在降低,而其他民族则相反。对于教育分组,从组别来看,无论哪年,低教育群体的收入差距都是教育变量组内差距最重要的来源,最低比例都高达51.6%,并且指数的分解结果基本都支持随受教育水平的提高各组别收入差距梯次减小的结论,这充分说明了对中低收入群体来说,教育对缩小收入差距有明显的正向作用。

表4 不同类别中各组别对组内收入差距的贡献分解

以上表3从组内和组间的角度分解了西部地区收入差距的来源,表4进一步按组别分解了组内收入差距,表5则结合表3和表4呈现了最终的分解结果。

表5 按类别组收入差距贡献分解

表5完整地呈现了收入差距按类别分组分解的结果。对年龄分组来说,除2016年的收入差距主要集中在低收入群体老年人中之外,其他指数的分解结果均显示中青年群体的组内差异是收入差距的主要来源。对性别分组而言,2012年低收入女性群体的收入差距更大,但在2016年出现了反转,其他收入差距均更多源于男性群体的收入差距。从户籍分组来看,虽然2016年中低收入农业户口群体的收入差距有所减小,但仍是总体收入差距的最大来源,同时非农业户口群体间的收入差距有所增加。在民族分组上,汉族组别的组内收入差距仍然是总收入差距的主要来源,且低中收入群体的组内收入差距有进一步扩大的倾向。教育分组的收入差距有以下三个特点:第一,总收入差距主要源于初中及以下类别;第二,除2012年的高收入群体外,中低收入群体的收入差距随教育程度的升高而梯次递减;第三,2016年初中及以下群体的收入差距有所降低,但其他组别的中低收入群体收入差距有所提高。

(二)构成成分和条件成分角度的分解

以上,我们分析并比较了西部地区2012年和2016年的收入差距来源,但这只能从静态的角度提供组内和组间相对重要性的信息,并不能给出引起收入差距变化的具体原因。鉴于分位数回归结合反事实的方法可以确定协变量构成和收入分类机制对收入差距影响的相对重要性,以下我们将利用这种方法进行分析。表6中呈现了这种方法的分解结果。

表6 基于模型将西部地区收入差距变异分解为构成成分和条件成分的贡献

表6列示的数据显示,利用模拟得到的边缘分布测度的收入差距,与表2根据实际数据测度的结果类似,都表现为2016年低收入群体的收入差距要高于2012年低收入群体的收入差距。两种反事实顺序解构结果的平均值表明,在构成成分上,所列指数无一显著;在条件成分上,除GE0不显著以外,其他结果都在1%或5%的显著性水平下显著,表明此时间段内收入差距的变化主要源于条件成分。此外,与GE-1对应的条件成分为正值,与其他指标对应的条件成分为负值,说明协变量条件分布上的变化增加了低收入段的收入差距,并缩小了中高收入段的收入差距。这些结论表明,各类别组别内的资源分类机制变化才是造成西部地区收入差距变化的主要原因。

六、结论及建议

以上我们首先基于CFPS项目自基期开始的前四期数据,选择基尼系数、广义熵族指数以及相对极化指数等相互补充的收入差距测量指标,对西部地区研究期内各期的收入差距进行了测量,然后从组内和组间的角度分解并比较了西部地区2012年和2016年的收入差距,最后利用分位数回归结合反事实的方法解构了西部地区收入差距变异的缘由。归纳起来,结论如下:第一,总体来看,2010年的收入差距最大,2012年至2016年期间我国西部地区的收入差距呈扩大态势。第二,2012年和2016年我国西部地区的收入差距主要来源于组内成分。各类别组别的分解结果显示:中青年群体间的收入差异是造成收入差距的主要原因,但2016年低收入群体间的收入差距主要表现为老年人之间的收入差距;除低收入群体中女性的收入差距出现反转外,其他群体的收入差距主要集中在男性群体中;相对于非农业户口,农业户口中的收入差距占比更高,但户籍间的差别越来越小;汉族群体中的收入差异是引起收入差距最为重要的因素,最低占比也达到了63.1%;从教育分组看,总体收入差距主要来源于初中及以下教育组别,并且各组别收入差距随教育水平的提高梯次递减。第三,西部地区2012和2016两期之间的收入差距变异主要源于由家庭地位、社会关系和运气等因素决定的收入分类机制。

既然各组别的收入差异对总体收入差距的贡献并不一致,并且逐期递增的收入差距主要源于不同类别各分组内的收入差异及其变化,那么有侧重地改善相关群体内的收入差距状况就很有必要。具体施策原则如下:第一,由于收入差距及其变化主要源于组内,所以要注重组内收入差距的缩小;第二,由于不同类别各分组收入差距对总体收入差距的重要程度不同,所以应针对占比高的组别精准施策;第三,根据最大最小准则,应重点立足于改善中低收入群体的收入差距;第四,虽然经济发展不是本文讨论的主题,但应时刻牢记发展才是硬道理,因为理论和实践都证明,在某些条件下平均收入的增加能在一定程度上抵消不平等的上升[36]。更具体一些,从年龄分组来看,低收入群体应注重老年人之间的收入差距,中等收入群体要注重中青年间的收入差距。对性别分组而言,应着重解决低中收入男性群体内的收入差距。在户籍分组中,应重点关注农业户口内低中收入群体的收入差距,同时警惕非农业户口群体间收入差距有所升高的现象。由于汉族群体内的收入差距占比更高,且在中低收入群体中有增加的趋势,所以也应引起注意。对于教育分组,鉴于收入差距主要集中在低教育程度组别中,且其随教育程度的升高梯次递减,所以在普及高中的基础上应继续扩大大专及以上群体的覆盖范围。至于其他更为具体的建议,篇幅所限,很难毕其功于一役,但这正是后续的研究方向。

猜你喜欢

基尼系数广义组内
The Last Lumberjacks
用心说题 提高效率 培养能力
一类特别的广义积分
任意半环上正则元的广义逆
基尼系数
基尼系数
六步教学,合作出数学的精彩
合作学习组内交流讨论时间的遵循原则
合作学习“组内交流讨论时间”注意问题
什么是基尼系数