引入高收入群体后我国居民收入差距研究
2024-05-15江欣妍钱梦媛耿薇陆美婷熊丹丹
江欣妍?钱梦媛?耿薇?陆美婷?熊丹丹
一、引言
21世纪以来,我国富裕阶层规模扩大,财富水平不断提升,高收入群体渐渐在社会中占据了重要地位(罗楚亮,2021)。与此同时,我国居民收入分配状况呈现出恶化趋势,衡量收入不平等程度的基尼系数持续攀升。国家统计局数据显示,2017年我国居民人均可支配收入的基尼系数为0.467,超过国际认知的0.4警戒线。尽管高收入群体的重要性被广泛认可,但学术界对其研究仍不足,高收入群体的定义、测量等基础性问题仍存在争议。为科学评估居民收入不平等,需要在住户数据外完善和补充高收入人群数据。对此,国际上已经采纳了多种方法,包括利用帕累托(Pareto)函数进行数据拟合、利用遗产税数据进行逆向推导等,并取得了丰硕成果(Li等,2020)。
在我国,由于没有建立遗产税制度、税务部门的纳税数据难以获取等原因,学者们对高收入群体的研究受到极大限制。目前,全球受到COVID-19病毒冲击的时代已经过去,这一公共卫生事件已经深刻改变了人类社会,包括居民收入差距。那么,引入高收入群体后居民收入差距到底有多大?公共卫生事件发生前后我国居民收入差距是否有所减小?对上述问题的回答至关重要。
对此,本文以近十年来的胡润富豪榜为主要数据来源,辅以福布斯榜单,构建我国高收入群体数据库(Top income database,简称TIC数据)。并以此为基础,与我国家庭追踪调查(CFPS)数据相拼接得到混合数据,从而分析我国2014—2020年基尼系數的变化情况,并探究公共卫生事件前后的变化趋势。相较于已有文献,本文有以下边际贡献。首先,现有文献中关于我国高收入群体的研究缺乏微观数据,所得结论存在局限性。本文构建的TIC数据库,为本领域的研究提供更为全面的数据基础;其次,本文运用统计学模型将两类数据拼接,基本绘制出我国居民收入的全景图;最后,比较分析公共卫生事件发生前后我国基尼系数的变化情况,为相关收入分配政策的制定和调整奠定现实基础。
本文第二部分是文献综述,对相关文献进行整理与分析;第三部分简要介绍住户数据与高收入群体数据;第四部分引入高收入群体后再次估算基尼系数,介绍研究方法以及数据拼接方法;第五部分是结论分析与政策建议。
二、文献综述
(一)高收入群体的相关研究
李实(2015)根据高收入人群的帕累托分布参数,对其收入进行估计,在此基础上得到新的基尼系数,研究结果发现高收入人群的收入样本偏差使收入差距被严重低估。荣慧娟等(2022)基于2013年和2018年住户数据和高收入群体数据库,发现在引入高收入群体数据前,我国居民收入呈现多极化特点,引入高收入群体数据后,收入极化程度明显提高。Matthias等(2023)利用德国统计局的信息发现,女性在高收入群体中的代表性严重不足;相较于低收入人群,高收入人群中高学历的人数更多。
(二)收入差距变化的相关研究
靳永爱和谢宇(2015)利用CFPS数据估算出2012年我国家庭净财产基尼系数为0.73。Piketty等(2019)研究了1978-2015年我国收入分配和财富积累状况,向上修正了官方不平等的估计,发现我国不平等程度不断加剧。李实(2020)研究发现2008年以后我国收入差距呈小幅度下降趋势,我国已经跨过了“倒U型”拐点。罗楚亮(2021)利用2013-2018年度住户调查数据研究发现,我国居民收入差距近十年来处于比较稳定的水平。
尽管上述研究意识到高收入群体的重要性,但由于数据所限并未深入展开研究,科学评估我国居民收入不平等仍任重而道远。
三、数据介绍
为探究公共卫生事件发生前后我国居民收入变化情况,本文选取2014、2016、2018、2020年高收入群体数据(TIC数据)以及住户数据(CFPS数据)进行研究。
(一)高收入人群数据
本文采用2014-2020年胡润富豪榜和福布斯富豪榜数据,辅以多年数据进行推理与插补,使处理过程更具说服力和延续性。值得注意的是,富豪榜给出的仅为富豪家族总资产,本文通过手动检索和数据抓取等形式确定富豪家族人数,将富豪家族总资产除以家族人口规模,得到家族人均资产。参照李实和罗楚亮(2011)的处理思路,按照5%的资产回报率将人均资产折算为人均收入,得到高收入群体样本数据。
表1详细描述了两榜高收入人群内部收入分布情况。统计结果显示,两榜富豪的收入普遍超过2000万元,而低于100万元的人数较为稀少。2014—2020年高收入人群的收入水平呈现上升趋势,年收入超过1亿元的人数逐年增加。
(二)住户数据
我国家庭追踪调查(CFPS)是一项全国性、大规模、多学科的固定样本追踪调查项目,旨在满足我国社会变迁、家庭结构等方面的深入研究需求。本文选择家庭人均年收入作为指标,去除空缺值和负值,得到我国居民收入的样本数据。由表2可知,2014-2020年我国居民的人均家庭收入不断上升,反映出我国经济持续发展,人民生活水平不断提高。
四、引入高收入群体后基尼系数的估算
(一)研究方法
TIC数据存在加权和未加权两种情形,加权数据更能代表我国高收入群体的相关特征。将两榜富豪数据加权后绘制对数收入的核密度曲线。以2018和2020年为例,由下图可知,富豪榜数据的核密度函数图呈现拖尾趋势,在某种意义上近似服从帕累托分布。
帕累托分布是一种用来描述不均衡分布的概率分布模型,在经济学中,常被用来解释财富分配的不均衡现象。本文运用帕累托模型将CFPS数据与TIC数据进行拼接并修正基尼系数。参考Clauset等(2009)与Jenkins(2017)提出的方法,利用软件得出2014-2020年各年财富拼接值,如表3所示。
(二)混合数据的建立
在建立模型的过程中,确定符合帕累托分布的样本较为关键。经过帕累托函数模拟,发现只有达到门槛值的数据能够真正满足帕累托分布。因此,小于门槛值的TIC数据不符合帕累托分布,存在低估现象。为确保数据的准确性,将TIC数据中小于门槛值的数据剔除。对于门槛值及以上的TIC数据,通过估算帕累托分布中的参数值,确定CFPS数据中服从同一分布的具体数值,即CFPS数据与TIC数据的拼接点。然而,TIC数据中处于CFPS数据的最大值与门槛值之间的数据并不符合帕累托分布。针对这一部分数据,本文选择以帕累托模型进行拟合,以完成数据的完美连接。整合后的数据共分为四段,涵盖了我国不同收入层次的收入分布特征,具体构成如表4所示。
(三)基于门槛值修正基尼系数
根据李实和罗楚亮(2011)的介绍,本文通过帕累托模型计算出引入高收入人群数据后的基尼系数,计算结果见表5。
由表5可知,混合数据的计算结果远远高于CFPS数据的计算结果,其反映出以往住户数据对高收入群体的代表性存在严重不足。纵观4年数据,CFPS数据2014-2020年逐年上升,基尼系数由0.521升至0.543,这表明随着我国经济发展,居民收入不断提升,内部收入差距有所增加。而基于TIC数据的计算值逐年降低,由0.802降至0.775,说明我国高收入群体间的收入差距较为悬殊,后续有所下降但仍保持较高水平。引入高收入人群数据后修正了我国居民收入基尼系数,计算结果逐年降低,体现了我国居民总体收入差距有所改善,并且存在继续减小的趋势。
重点研究2018-2020年,基尼系数CFPS数据增长0.009,反映出经过公共卫生事件后,我国中低收入人群内部收入不均程度有所加剧。而基尼系数TIC数据降低0.012,降幅为几年中最大,这体现了公共卫生事件对高收入人群冲击较大。将CFPS数据与TIC数据混合后的计算值减小0.001,表明公共卫生事件后我国居民总体收入差距仍有所减小,但增速有所减缓。
五、结论分析与政策建议
本文以TIC数据库中2014-2020年胡润百富榜和福布斯富豪榜富豪数据为基础,运用统计学模型将其与CFPS数据进行有效拼接,以修正基尼系数,得出以下主要结论:
首先,通过研究TIC数据,本文发现富豪之间同样存在较大收入差距。
其次,運用帕累托模型建立混合数据并修正基尼系数。结果显示,混合数据计算值高于CFPS数据计算值,体现了引入高收入样本的重要性。同时2014—2020年混合数据的基尼系数逐年下降,体现了我国居民总体收入差距不断减小。
最后,重点研究2018-2020年的数据,发现CFPS数据与混合数据计算值之间的差距越来越小,表明在经历公共卫生事件、应对挑战时,我国采取的经济和社会保障措施对于缩小收入差距起到了积极作用。
结合我国国情,本文提出以下政策建议:
首先,加强收入再分配。通过税收制度改革,适当提高高收入者的税收负担,增加对低收入群体的税收减免和福利补贴,实现收入的再分配。
其次,推动教育公平,为低收入群体提供公平的教育机会与教育资源。同时,加强职业教育和技能培训,提高劳动者的就业能力和竞争力。
最后,促进就业创业。加大对中小企业的支持力度,提供更多的就业机会。通过鼓励创新创业和发展新兴产业,减少就业压力和收入差距。
(作者单位:南京财经大学)
作者简介:江欣妍,2003年9月出生,女,汉族,江苏南京人,南京财经大学在读。研究方向:居民收入差距。
基金项目:2023年江苏省大学生创新创业训练计划项目“中国高收入群体数据库建设第IV期——疫情之后的再审视”(202310327004Z)。