APP下载

基于分位数分解的城乡收入差´研究

2017-01-09郭毅夫湖南文理学院经济管理学院湖南常德415000

统计与决策 2016年24期
关键词:收入水平禀赋位数

郭毅夫(湖南文理学院 经济管理学院,湖南 常德 415000)

基于分位数分解的城乡收入差´研究

郭毅夫
(湖南文理学院 经济管理学院,湖南 常德 415000)

文章基于中国家庭金融调查(CHFS)的调查数据,分别利用分位数回归和分布函数分解的方法,检验了城乡居民收入水平的主要影响因素,分解比较城乡收入差距中城乡居民禀赋特征构成差异和个体特征回报率差异的相对贡献。根据实证结果可以看到,受教育程度、职业性质等对城乡居民收入有显著影响,禀赋特征构成差异和个体特征回报率差异都扩大了城乡居民收入,其中城乡居民禀赋特征构成差异的影响更大。

城乡收入差距;分位数回归;反事实模拟;分位数分解

0 引言

近年来在我国居民的收入水平不断提高的同时,但收入差距持续扩大的问题也日益突出,城乡收入差距扩大的特征更加明显。严重的收入分配差距不仅会影响到社会的稳定和谐,而且可能对我国长期经济发展的质量带来负面影响。根据相关学者的研究,城乡间收入差距的扩大是中国总体收入分配差距扩大的主要原因(白莹、吴建瓴,2011;鲁玲,2010)。因此,深入探讨导致我国城乡收入差距扩大的关键因素,对于有效调控收入差距、促进经济社会和谐发展都具有重要的理论和实践意义。

在相关研究的基础上,本文根据抽样单元覆盖全国主要省份的中国家庭金融(China Household Finance Survey, CHFS)调查数据,首先构建分位数回归模型,讨论了影响城乡居民收入差距的个体禀赋特征及城乡回报率的区别;其次,按照反事实模拟的思路,在给定城市或农村居民个体特征的情况下,利用分位数回归方法测算不同系数对应的条件反应分布,比较分析了城乡居民禀赋特征构成区别和城乡二元结构下个体特征的回报率差异对城乡收入差距的作用,以期通过对我国城乡收入差距扩大原因的讨论,为改善我国收入分配状况提供参考。

1 数据、模型与方法

1.1 数据来源及描述

本文利用的是中国家庭金融调查与研究中心2013年发布的中国家庭金融调查(CHFS)的最新数据,该调查的抽样单元覆盖了全国除西藏、新疆、内蒙和港澳地区外的2585个市/县,调查样本具有广泛的代表性。在实证分析之前,本文对样本数据进行了整理,剔除了个别极端值以及缺失值较多的观测。从表1可以看到,样本中城乡家庭的人均收入的差距显著,城市家庭平均收入约为农村家庭平均收入的2.5倍。城乡家庭的特征也存在较大区别,比如城市家庭中户主为中共党员比重远高于农村家庭,受教育程度在高中及以上的城市居民约有46%,而农村居民仅有15%左右。

表1 样本中主要变量的描述与统计

图1((见下页)为样本家庭人均收入对数的核密度分布函数,为减少观测较少区域的估计方差以及观测较多区域的估计偏误,本文选择了自适应核密度函数估计方法,随着样本数据来改变函数估计的窗宽,即有其中hi=h×λi,λi为窗宽因子,h为整体固定窗宽,控制整体的平滑程度,窗宽设定为w=0.9sd×n-0.2,sd和n分别是人均收入对数的标准差和观察值数。从图1可以看到,全国家庭平均收入的分布还比较广,居民之间的收入差距还比较明显,并且左侧低收入人群的比重较高;而城市家庭人均收入分布密度函数位于农村家庭人均收入分布密度函数的右边,城市家庭人均收入高于农村,并且城市家庭人均收入的分布相对更加集中。

图1样本家庭人均收入对数的核密度函数

1.2 实证模型与方法

1.2.1 分位数回归估计

本文参考了LI(2004)和李红梅(2012)的相关研究,进一步细化了Mincer提出的收入方程,构建了如下收入函数模型:

由于OLS只能在均值水平上反映相关解释变量对居民收入的影响,不能体现在不同收入水平上相关解释变量的作用可能出现的变化,本文首先利用Koenker和Bassett提出的分位数回归在居民收入的整个分布上讨论影响收入水平的相关因素。给定解释变量Xi,Qp(lnyi|Xi)为第p个分位数点上的家庭收入,对应的条件分位数函数可以定义为:

Qp(lnyi|Xi)=Xi',其中Xi包含了户主受教育程度、工作经验等解释变量。

第p个分位数的系数估计定义为最小化拟合值和观测值加权距离和的数值,即最小化:

为计算估计值的标准差,本文采用了常用非参数统计方法Bootstrap方法(Davidson和MacKinnon,2006),在进行分布假设或增加新的样本信息的前提下,对样本的分布特性进行了统计推断。通过放回抽样从初始样本中抽取大小为n的自举样本,对每个自举样本计算系数估计值;重复抽样M次,即可产生M个系数估计值m(p),其标准差就可以用来估计系数标准差。

1.2.2 基于分布函数的城乡收入差距分解

为了充分刻画收入分布的特征,本文根据Machado和Mata(2005)、Melly(2005)和 Elena Martinez-Sanchis等(2012)提出的思路,将条件均值收入扩展为条件分位数收入,使用分位数回归对收入分布函数进行反事实模拟,对城乡家庭收入差异进行分解研究。

具体而言,对于家庭收入y,C1C2分别表示城乡家庭相关解释变量x,根据构建的实际边缘分布和反事实边缘分布,就可以得到相应的分位数估计,并且能够得到第p个分位数上城乡收入差距的两成分分解。以 f(ω(s))表示样本s中收入观测{ωi(s)}的边缘分布,f*(ω(s))表示生产样本中相应密度函数的估计。反事实密度函数可以表示 f*(ω(2);Z(1)),即假设农村居民自变量构成不变时,利用城市居民的要素回报率可能得到的收入分布。用q(·)表示收入分布的分位数,则城乡居民收入差异可以表示为:

第一部分反应了自变量构成的变化导致的整体收入差距的变化,第二个部分反映了系数上的变化所导致的整体收入差距的变化,第三个部分ε为残差项。

而为获得基于模型的和基于样本的边缘分布,本文从(0,1)中随机选取分位数值,从一个样本中抽取一行协变量数据,并将该行插入对应的分位数回归模型中,得到的反应变量则具有正确的边缘分布。具体而言,得到基于模型的边缘分布包含以下步骤:

(1)从均匀分布U[0 ,1]中生成随机数u;

(2)使用完整样本来估计第u个分位数回归;

(3)选取一个自举样本,并根据分位数回归模型估计得到预测值;

(4)根据所选取的各行协变量xt和分位数回归系数βu,计算相应的条件分位数;

(5)重复以上4步n次,将得到的值作为基于模型的y*t的边缘分布中抽取的一个随机样本。

估计基于模型的反事实分布包括以下步骤:

(1)根据前面随机抽取样本1的各行数据xt和估计的样本2处的分位数回归系数,计算条件分位数,以建立一个从反事实边缘分布y*()中抽取的样本;

(2)通过使用随机抽取的城市样本t=2的各行数据xt=2和估计的农村样本t=1处的分位数回归系数t=1,能够建立一个倒序的反事实边缘,以构建一个从反事实边缘分布y*(t=1;xt=2)中抽取的样本。此外,本文还借鉴Melly的分解思路(Melly方法),考虑到残差效应的影响,将中位数回归估计作为收入分布集中趋势的度量,将式(3)中的城乡收入差距分解成以下三个部分:

其中q(f*(ω(2);Z(2)))估计时分位数回归系数取值为β(0.5)为中位数回归估计的系数;第一部分代表残差效应,第二部分代表系数效应,第三部分代表自变量效应。

2 实证结果分析

2.1 城乡居民收入影响因素的分析

表2为自变量中心化后城乡居民收入的均值模型、中位数模型和0.1/0.9分位数模型的系数估计结果。从户主的人力资本特征来看,户主的受教育程度和工作经验对居民收入都有显著影响。与参照组小学及以下文化程度的居民相比,文化程度的提高,明显能增加居民收入,平均来看农村居民的教育回报率比城镇居民的更高,而大学及以上文化程度(edu3)对收入的作用最大,城乡居民对应的系数分别为0.757和1.154;比较不同分位数上受教育程度的影响,在收入水平较高的人群中(0.9分位数)只有大学及以上文化程度(edu3)的作用比较明显,而在低收入人群中(0.1分位数),受教育承程度对于收入状况的改善作用最为突出,比如高中文化程度在城乡居民收入方程的系数都分别达到了0.579和0.661。工作经验对于居民收入的影响比较复杂,平均来看工作经验对于农村居民的影响呈现倒U型(一次方和二次方系数符号分别为正和负),并且其影响强度很小,而工作经验对于城市居民为正U型,随着工作经验增加收入水平也会提高;比较不同分位数上工作经验的影响,在收入水平较高的人群中(0.9分位数),工作经验对城市和农村居民的影响都为正;在中位数模型中(0.5分位数),工作经验仅仅对城市居民的有影响;而在低收入人群中(0.1分位数),工作经验对城市居民没有显著影响,但对农村居民的影响呈现倒U型,可能随着工作经验增加年龄变大,多从事体力劳动的低收入农村居民的收入水平可能出现下降。

在其他解释变量中,党员身份的影响比较显著,平均来看党员身份对城市居民收入的影响要高于农村居民,其对应系数分别为0.403和0.280,而结合分位数估计的结果,可能在低收入人群中党员身份对城市居民的影响更大,在中高收入人群中,党员身份对城乡居民的影响相当。而总体来看民族因素对居民收入的影响并不显著,仅在中低收入人群中汉族身份对城市居民有一定影响。地区因素在城乡居民收入中的作用中比较明显,与参照组中西部地区居民收入相比,东部地区城乡居民收入水平更高,并且城市居民之间的地区差距大于农村居民,均值模型中对应的系数分别为0.516和0.313;从分位数模型的估计结果来看,在农村居民的低收入人群中地区差异并不显著,而在中高收入人群中城乡居民收入的地区差异都十分突出,在0.9分位数模型中农村居民和城市居民地区变量对应的系数分别为0.549和0.516。由于区位条件、经济基础以及政策倾斜等因素都存在差异,我国地区之间经济发展不平衡的问题比较突出,东部地区经济发展水平更高,也带来了东部地区居民收入水平明显高于中西部地区。

由于不同经济部门员工的收入决定机制不同,劳动力在不同所有制之间的流动性也较差,居民所在单位的所有制性质一直是影响其收入水平的重要原因。表2中,国有/集体和外资/合资变量对应的系数也都显著为正,并且单位性质对农村居民的影响要比城市居民更大,国有/集体和外资/合资的收入水平要显著高于参照组民营/私营企业的收入水平。在低收入人群中,国有/集体变量的作用更大,并且其对农村居民的影响远大于城市居民,对应系数分别为0.785和0.332;外资/合资变量类似的也在低收入人群中的影响最大,其对农村居民和城市居民的影响系数分别为1.611和1.199。

表2 均值模型、中位数模型和0.1/0.9分位数模型估计

2.2 城乡家庭收入差距的分解研究

通过上文的讨论可以看到,我国城乡居民的个体特征差异明显,并且这些特征变量在城市和农村的回报率也不相同。这里就利用上文介绍的分解方法,利用分位数回归模型估计居民收入的反事实分布,比较城乡居民禀赋差异和城乡二元结构下回报率差异在城乡收入差距中的作用。表3给出了不同分位数上城乡收入差距两个成分的分解结果(M-M方法),在分解过程中计算了200个分数估计来进行收入分布的反事实模拟,各个分解效应的标准差通过Bootstrap方法获得(Bootstrap次数为100)。从表3可以看到,城乡居民收入差距在整个收入分布上区别不大,低收入水平下城乡收入的差距略大;在中低收入水平中,城乡收入差距中来自禀赋构成和要素回报的影响基本一致,其中来自要素回报的影响略大,但是在高收入水平中来自禀赋构成的影响远大于要素回报;收入差距中要素回报率的影响为正意味着,如果农村居民的受教育程度、工作经验等特征不变,在要素回报率与城市居民相同的话,农村居民的收入水平将增加;而收入差距中禀赋构成的影响为正意味着,即使城乡要素回报率相同,城乡居民之间也会由于禀赋特征上区别而存在收入差距。

表3 基于MM方法的城乡收入差距分解

表4和图2是根据Melly方法测算的城乡收入差距分解结果,同样在分解过程中计算了200个分数估计来进行收入分布的反事实模拟,各个分解效应的标准差通过Bootstrap方法获得(Bootstrap次数为100)。可以看到,分解结果与M-M方法存在一定区别,但研究结论基本一致。考虑到残差效应以后,禀赋特征构成和要素回报率对低收入人群中的解释能力有所下降,但总体来看影响较小。也就是说可能在低收入人群中,造成城乡居民收入过大的其他不确定因素很多,而总体而言禀赋特征差异和要素回报率差异是造成城乡收入差距的主要原因。比较禀赋特征构成和要素回报率的影响,禀赋特征构成作用明显大于要素回报率作用。此外,为了讨论以上研究结论的稳健性,本文还调整了式(3)中三种效应的分解顺序、增加反事实模拟中分位数的选取个数,实证结果基本也与上述分解结论一致。

表4 基于Melly方法的城乡收入差距分解

图2基于Melly方法的城乡收入差距分解效应变化

3 研究结论

本文根据中国家庭金融调查的微观数据,实证检验了影响城乡居民收入水平的主要因素,并比较分析了禀赋特征构成区别和个体特征的回报率差异对城乡收入差距的作用。第一,根据城乡居民收入水平影响因素的分位数回归估计,结果表明受教育程度、工作性质等对收入水平作用显著,但在城乡二元结构下,城乡要素特征的回报率存在明显区别。第二,按照通过反事实模拟的思路,利用分位数回归方法测算不同系数对应的条件反应分布函数,分解比较禀赋差异和二元结构的作用大小,结果发现从自变量效应来看,城市和农村居民自身禀赋特征不同对城乡收入差距的影响显著,尤其在收入水平最高和最低的两类人群作用更加明显。由于农村居民在受教育程度等个体特征与城市居民存在较大距离,而这些特征又是影响收入水平的显著因素,这就必然导致了城乡居民之间的收入差距;从系数效应来看,城乡二元结构下城乡要素回报率差异也是影响城乡收入差距的重要原因,在整个收入分布上都表现出对城乡收入差距扩大的作用;考虑到残差效应以后,禀赋构成和要素回报率对低收入人群中的解释能力有所下降,但总体而言禀赋特征差异和要素回报率差异是造成城乡收入差距的主要原因,并且城乡收入差距受居民自身禀赋特征的影响更大。

[1]Martinez-Sanchis E,Mora J,Kandemir I.Counterfactual Distribu⁃tions of Wages via Quantile Regression With Endogeneity[J].Computa⁃tional Statistics and Data Analysis,2012(10).

[2]Démurger S,Li S,Yang J.Earnings Differentials Between the Public and Private Sectors in China:Exploring Changes for Urban Local Res⁃idents in the 2000s[J].China Economic Review,2012,23(1).

[3]白莹,吴建瓴.中国收入分配差距的城乡分解分析[J].经济体制改革,2011,(2).

[4]孙宁华,堵溢,洪永淼等.劳动力市场扭曲、效率差异与城乡收入差距[J].管理世界, 2009,(9).

[5]胡荣才,冯昶章.城乡居民收入差距的影响因素——基于省级面板数据的实证研究[J].中国软科学,2011,(2).

[6]王书华,杨有振.城乡居民家庭金融资产配置与收入差距的动态影响机制——基于状态空间系统的估计[J].上海财经大学学报(哲学社会科学版),2015,17(2).

[7]程莉,刘志文.地区经济差距对城乡收入差距的影响机理与实证分析——以统筹城乡综合配套改革试验区重庆市为例[J].中国人口·资源与环境,2013,23(9).

[8]刘长庚,田龙鹏,陈彬等.农村金融排斥与城乡收入差距——基于我国省级面板数据模型的实证研究[J].经济理论与经济管理,2013, (10).

[9]孙敬水,黄秋虹.中国城乡居民收入差距主要影响因素及其贡献率研究——基于全国31个省份6 937份家庭户问卷调查数据分析[J].经济理论与经济管理,2013,(6).

[10]谭飞燕,李孟刚,吴伟等.基于微观调查数据的城乡家庭收入差距分解[J].统计与决策,2015,(8).

[11]李红梅.我国城乡居民收入差距的反事实因素分解[J].数学的实践与认识,2012,42(10).

[12]杨娟,Sylvie Démurger,李实等.中国城镇不同所有制企业职工收入差距的变化趋势[J].经济学(季刊),2012,11(1).

(责任编辑/浩 天)

F224.9

A

1002-6487(2016)24-0092-04

国家社会科学基金资助项目(14BJY159);教育部博士点基金资助项目(20130161110044);湖南省哲学社会科学基金资助项目(13JD09);湖南省重点建设学科建设项目(湘教发[2011]76号);广东省科技厅项目(2012B070200014)

郭毅夫(1976—),男,湖南益阳人,博士,副教授,研究方向:企业创新。

猜你喜欢

收入水平禀赋位数
讲故事的禀赋——梅卓长、短篇小说合论
五次完全幂的少位数三进制展开
连续自然数及其乘积的位数分析
要素禀赋论的局限:个体与企业家才能缺位
禀赋的概念、内涵及其与体质的关系
收入水平、学历层次对餐饮方式的影响
法学院哪家最强
全面发展与提高消费力
初始商业文化禀赋如何影响地区经济发展
决定医生收入水平首先是市场因素