中国城镇家庭消费不平等分布测度研究
2013-09-07谢邦昌么海亮
谢邦昌,么海亮
(1.中央财经大学统计学院,北京 100081;2.台湾辅仁大学统计资讯学系,台北 24205)
一、引 言
长期以来,国内外学者对经济不平等问题的研究主要集中在收入分配领域,Blundell等(2008)[1]认为,经济不平等可以通过收入与消费等多个角度进行反映,通常来说,人们的福利水平主要来自于商品与服务的购买与闲暇,收入在对居民福利不平等的测度方面存在一定局限,仅从收入不平等一个角度来看既不能完全反映福利或效用或幸福程度的不平等,也不能完全反映经济不平等,消费是比收入度量经济福利更合适的指标[2],消费能够更直接地反映居民的生活水平。在一定时间内,收入要比消费更易波动,由于消费者能够通过借贷和储蓄等来应付这些波动,用收入的不平等程度来衡量居民生活水平的不平等,可能要比实际不平等程度高一些。因此,如果社会福利依赖于个人或者家庭的福利分配情况,用消费不平等程度衡量个人和家庭的生活水平分配的不平等情况更合理。再结合我国的现实情况,20世纪90年代以来,在我国社会经济迅速发展的同时,其经济不平等问题也日益加剧,在这种背景下,研究我国城镇家庭消费不平等问题,对于进一步理解我国经济不平等与福利不平等具有重要意义。
近年来,国外有关消费不平等问题研究的文献逐渐增多,而国内关于消费不平等测度问题的研究十分匮乏,这主要是由于关于家庭消费的微观数据很难获取。我国消费不平等问题的研究主要从两方面进行,一方面是对消费不平等进行测度与分解,研究消费不平等的程度与变化,这方面的文献主要有戴平生和林文芳(2012)[3]采用《中国统计年鉴2010》的数据,对2009年我国城乡居民食品消费数据进行结构性分析,研究发现,城镇居民在外餐饮、肉禽及制品、水产品类支出份额的增加,对食品消费不平等产生消极的边际影响;曲兆鹏和赵忠(2008)[4]采用CHIP1988年、1995年和2002年三年的微观数据,对我国农村家庭的收入与消费基尼系数进行了测度,结果发现,我国农村的消费不平等要低于收入不平等。另一方面是研究消费不平等产生的原因,这方面的文献主要有林毅夫和陈斌开(2009)[5]采用1978~2004年中国27省的时间序列样本,研究了我国城乡消费差距,研究发现,市场化和经济开放等经济转型因素以及政府干预导致城乡消费差距扩大。
从目前已有的文献来看,首先,目前我国消费不平等的研究领域主要集中在农村内部以及城乡之间的消费不平等,而针对我国城镇家庭消费不平等的讨论较少;其次,目前关于我国消费不平等的测度研究主要通过不平等指数进行测度,不平等指数主要用来反映家庭消费不平等的程度,提供的信息量有限,无法清晰地反映出家庭消费分布的结构和规律;如果我们能够准确合理地估计出家庭消费的分布情况,就能够更加充分地掌握关于家庭消费不平等的详细信息,因此,家庭的消费分布及变化趋势是深入分析消费不平等问题的关键。从统计学的角度来看,家庭的消费分布是指不同消费水平与相对应人口比重之间的统计规律或函数形式,分布分析法(distribution analysis)可以应用于不平等问题的测度与比较。近年来,国内一些学者在研究收入不平等问题中采用了分布分析法,例如纪宏和陈云(2009)[6]采用了核密度估计方法,龙莹(2012)[7]等采用了相对密度函数与相对分布函数,但目前国内关于家庭消费不平等分布的研究仍非常少见。
针对上述文献的不足,本文采用1995年、2002年“中国家庭收入调查”数据,以及2008年与2009年“中国城镇居民经济状况与心态调查”数据,研究我国城镇家庭消费不平等的分布与趋势。与以往研究相比,本文的贡献体现在三个方面:首先,本文以我国城镇家庭为研究对象,采用国际上广泛应用的集中度指标测度法,比较了家庭消费与收入的基尼系数、泰尔指数与阿特金森指数;其次,本文针对我国城镇家庭消费数据长尾且右偏的特点,首次采用非参数核密度估计中的适应性核密度估计方法对我国城镇家庭消费进行分布测度,反映家庭消费不平等的变化趋势;第三,本文通过对比不同年份城镇家庭消费的相对密度函数与相对分布函数,这样可以反映不同时期家庭消费不平等的变化情况,并对不同消费水平家庭所占比重的变化情况进行分析,这拓展了已有的我国消费不平等的研究。本文结构如下:第二节介绍了本文的数据样本和分析变量,第三节为实证分析,第四节为结论、建议与展望。
二、数据样本和分析变量
本文采用的数据主要来自两部分,第一部分来自1995年与2002年“中国家庭收入调查”(China Household Income Project,CHIP),第二部分来自国家统计局在2008年与2009年北京奥尔多投资咨询中心与国家统计局合作进行的“中国城镇居民经济状况与心态调查”项目。四年的数据前后跨度为14年,可以对我国城镇家庭的消费状况进行多期比较,四年的调查数据均提供有关住户收入、消费及住户特征的详细信息。
“中国家庭收入项目调查”(CHIP)数据是中国社会科学院经济研究所收入分配课题组于1995年、2002年进行的全国调查中的中国农村和城市居民家庭收入分配调查得到的①有关CHIP调查数据的详细描述可参考Eichen and Zhang(1993)和Li et al.(2008)。值得注意的是,CHIP没有涵盖中国全部的省份,并且每一期调查覆盖的省份并不完全相同。。该调查项目收集了详细的中国城镇与农村的家庭与个人信息,包括家庭收入与支出、人口学特征以及工作与就业情况。1995年城镇家庭调查的省份包括北京、山西、辽宁、江苏、安徽、河南、湖北、广东、四川、云南、甘肃这11个省(市、自治区)的城镇,调查了6931户城镇家庭的21696位居民;2002年城镇家庭调查涵盖了1995年调查的全部地区,在此基础上增加了重庆,调查了6835个城镇家庭的20632户居民,这构成了本文1995年与2002年城镇家庭消费的分析样本。
“中国城镇居民经济状况与心态调查”是由国家统计局在2009年7-8月与北京奥尔多中心合作完成的,该调查访问了北京、辽宁、河北、山西、山东、河南、江西、江苏、广东、海南、四川、甘肃这12个省级行政区的41个市(区、县)①包括北京、沈阳、大连、鞍山、瓦房店、辽中、石家庄、唐山、廊坊、承德、太原、阳泉、汾阳、济南、青岛、烟台、威海、泰安、利津、郑州、濮阳、焦作、三门峡、南阳、襄城、南昌、景德镇、信丰、南京、南通、扬州、常熟、珠海、顺德、海口、三亚、成都、德阳、攀枝花、兰州、天水等。的5056名城镇居民家庭的户主,详细调查了他们的家庭经济金融、住户特征与家庭收支状况。随后,该项目根据国家统计局2007年1月起执行的《城镇住户调查方案》中“城镇居民家庭消费支出调查”的消费项目,通过对所调查家庭住户的追踪访问,取得了5056个城镇家庭中的4008户家庭(11476位居民)2008年家庭各项消费的数据,并取得了5056个家庭(14295位居民)2009年的家庭各项消费的数据,这构成了本文2008年与2009年分析的样本。
由于“中国家庭收入项目调查调查”与“中国城镇居民经济状况与心态调查”均是以家庭作为消费单位的进行数据收集的,以家庭为测度单位的缺陷是没有考虑家庭规模的差异,因此本文对消费不平等的测度均采用人均消费;同时,由于我国地区间价格水平差异很大,因而收入和消费额的实际购买力存在较大的地区差异,这通常会导致高估不平等水平,为了控制这种影响,实现各期城镇家庭消费状况的比较,我们以2009年中国各城镇物价水平为基础,采用Brandt等(2006)[8]根据国家统计局所公布的数据计算的全国各省的城镇消费价格指数,调整1995年、2002年与2008年的我国城镇家庭消费支出。
三、实证分析
(一)描述性统计分析
一般来说,家庭消费主要取决于家庭的收入水平,这里我们给出了家庭人均收入②这里的家庭总收入包括:工资和奖金收入、家庭经营性收入、资本性收入与各种转移支付收入。的各项描述性统计结果,可以对家庭人均收入与消费的不平等状况进行比较,1995年、2002年、2008年与2009四年调整后的城镇家庭人均收入与消费情况如下。
表1 中国城镇家庭人均收入与消费情况(按2009年物价水平计算)
从表1对我国城镇家庭人均消费与收入的统计分析来看,1995年、2002年、2008年与2009年四年我国城镇家庭人均收入与消费均呈现明显的递增趋势,并且各年的家庭收入均高于家庭消费;四个调查年份的城镇家庭人均收入与消费的偏度值与峰度值均大于0,表明城镇家庭人均收入与消费分布均呈现出明显拖尾的右偏分布形态。
(二)不平等指数测度
这里我们采用国内外学者研究不平等问题最为流行的集中测度法,计算出我国城镇家庭的基尼系数、泰尔指数、阿特金森指数,不平等指数计算结果见下表:
表2 不平等指数测度
以上表中基尼系数为例,1995年、2002年、2008年与2009年四个调查年份中,我国城镇家庭人均收入的基尼系数分别为0.2798、0.3132、0.3404和0.3239;人均消费的基尼系数分别为0.3079、0.3114、0.3619和0.3520;除了2002年人均收入与消费不平等程度基本相等外,1995年、2008年和2009年三个调查年份人均消费的各项不平等指数均高于人均收入,表明我国城镇家庭的消费不平等问题较收入不平等相比更为严重;其次,2002年城镇家庭消费的基尼系数与1995年相比增加了约0.0334,而2009年消费基尼系数与2002年相比又增加了约0.0388,表明我国城镇家庭消费不平等呈现扩大的趋势,泰尔指数与阿特金森指数也反映出同样的规律。
(三)方法设计
1.适应性核密度估计。非参数核密度估计方法是在不清楚数据基本分布的条件下来估计未知的密度函数,这种方法对数据分布不附加任何假定,直接从数据本身发现数据分布的特征。核密度估计方法最早由Rosenblatt(1955)提出,给定样本中核密度估计性能的好坏,主要取决于核函数与带宽的选择是否适当。常见的核函数有Boxcar核、Epanechikov核、Tricube核和Gaussian核等。在核密度估计中带宽的选择非常重要,常见的带宽选择方法主要有插入带宽(Plug-in band-width)法和交叉验证(Cross-Validation)法。其中,插入带宽法主要基于核密度估计精度的测量—均方误差分析中得来的;交叉验证法由Rudemo(1982)和Bowman(1984)提出,该方法直接由数据“自动”选择带宽,这两种方法都是由直方图(histogram)法的分析角度解释与演化的,而理想中的带宽选择应该与样本数据点的分散集中程度联系起来。核密度方法的一个推广是适应性核(Adaptive kernel),它对于每个点x使用不同的带宽h(x),我们还可以对每个数据点使用不同的带宽h(xi),这使得核密度估计更加灵活,更加适用于长尾(long-tailed)密度函数的估计。随着样本数据而变化的带宽在估计时更加灵活,能够减小样本观测值较少区域所估计的方差,并且可以减小样本观测值较多区域所估计的偏差(bias)。适应性核密度估计法对低密度区域的观测值采用一个更宽的核来适应样本数据的稀疏性(sparseness),即带宽的宽度与观测值的密度成反方向变化。适应性核密度估计的表达式为:
上式中,xi为数据点,ωi为数据点xi的权重,K为核函数,hi为带宽。λi为局部带宽因子(local bandwidth factors),其表达式为:
2.相对分布法。相对分布法最早由Handcock等(1998)[10]引入不平等问题研究中,用来比较两组样本观测值的分布情况,两组人口分布称为参照组和对比组,通过对两组样本观测值分布的对比来研究分布位置和形状的变化,简单地说,相对分布得到的是落入参照组每个分位点上的对比组人口的比例。因此,该方法可以界定和识别两组人口之间围绕家庭消费分布所发生的变化。令Y0代表参照组家庭消费的连续变量,F0是Y0的累计分布函数(CDF),f0是Y0的概率密度函数(PDF);类似的,对比组的家庭消费、累计分布函数和概率密度函数分布用Y、F和f来表示。Y对Y0的相对分布被定义为随机变量R,表示为R=F0(Y),该变量时通过Y在Y0的分位排序上取值得到的。相对分布密度g(r)定义为,在参照组分布第r分位数上估计的对比组与参照组家庭密度函数的比率,计算公式为
(四)适应性核密度估计分析
我们应用R软件模拟出四个调查年度城镇家庭人均收入与人均消费的适应性核密度估计图,如下图所示:
图1 城镇家庭人均收入与消费的适应性核密度估计
由1995年、2002年、2008年和2009年我国城镇家庭人均收入与消费的适应性核密度估计图可以看出,随着时间推移,我国城镇家庭人均收入与消费密度函数形式发生了明显变化,总体来看,我国城镇家庭收入与消费有以下共同特征:随着时间推移,家庭收入与消费的整体分布逐渐向右侧平移,该趋势反映出城镇家庭人均收入与消费水平均呈不断增加的趋势;家庭人均收入与消费均呈右偏分布,随着时间变化,分布右侧尾部不断延长且厚度逐渐增加,表明高收入与高消费水平的城镇家庭比例均有所提高;随着时间变化,家庭人均收入与消费分布的左侧尾部厚度有一定下降,表明低收入与低消费水平的城镇家庭比重呈逐渐下降的趋势;家庭人均收入与消费分布曲线逐渐变得平坦,表明我国城镇家庭收入差距与消费差距不断扩大,城镇家庭之间消费不平等程度加剧。
(五)相对分布法分析
为了对我国城镇家庭消费的分布进行完整的对比,下面我们应用R软件拟合城镇家庭消费的相对分布的累计分布曲线(CDF)和概率密度曲线(PDF)。图2是以1995年家庭人均消费为参照组,以2002年为对比组的我国城镇家庭人均消费的相对分布的CDF和PDF曲线;图3是以2002年家庭人均消费为参照组,以2009年为对比组的我国城镇家庭人均消费的相对分布的CDF和PDF曲线。假如两个分布相同,相对分布的CDF是45度线,相对分布的PDF将全部在[0,1]区间变化。对于分布的CDF与PDF曲线,下横轴代表参照组百分比,上横轴代表家庭人均消费额,纵轴代表对比组百分比。
图2 2002年与1995年家庭人均消费对比的相对分布CDF(左)与PDF(右)
从图2的CDF曲线可以看出,以2009年价格水平为基准,2002年与1995年家庭消费对比的相对分布CDF曲线在45度线下方,说明2002年与1995年相比,我国城镇家庭消费不平等程度加剧;从图2的PDF曲线可以看出,当分布曲线在参照组百分比在[0,0.7]的区间,即对应图1中1995年消费核密度高于2002年的区间时,相对密度在[0.6,1]区间内呈现波动变化;当分布曲线在参照组百分比在[0.7,1]的区间,即对应图1中1995年消费核密度低于2002年的区间时,相对密度大于1,这表明与1995年相比,2002年我国人均消费小于6000元的城镇家庭比重降低,而人均消费大于6000元的城镇家庭比重呈现上升趋势;从图2中相对密度的趋势来看,消费水平越低的家庭,其所占比重下降越快,这是反应随着社会经济的发展,我国城镇家庭普遍的生活水平得到提高,其中有一个例外是人均消费额大于2000元且小于3200元的城镇家庭比重下降最快,下降幅度超过了人均消费低于2000元的家庭,主要原因可能在于1995年以后,我国工资制度逐渐由原来的固定工资制调整为效益工资制,这一时期城镇居民的失业与下岗的人数开始增加,对于人均消费额大于2000元且小于3200元的这部分城镇家庭群体,其中的一部分由于受到失业的影响,消费水平降低到2000元以下,而另一部分家庭收入水平得到提高,逐步过渡到下一个消费水平区间;参照组百分比在0.75左右时,所对应的家庭人均消费额为10000元左右,从相对密度变化可以看出,人均消费额高于10000元的城镇家庭人口比重迅速增加,高消费群体的消费水平增加的速度高于中低消费群体。
从图3的CDF曲线可以看出,2009年与2002年家庭消费对比的相对分布CDF曲线在45度线下方,与图2的CDF曲线相比,图3的CDF曲线与45度线之间的面积明显增大,说明2009年与2002年相比,我国城镇家庭消费不平等程度进一步加剧,且该阶段家庭消费不平等的增长比上一个阶段明显加快;从图3的PDF曲线可以看出,累计约73%的分布曲线大约在[0.1,1]区间内变化,且呈现出平稳的递增趋势,后面约27%的分布曲线部分大于1,呈现出明显的递增趋势;以2009年价格水平为基准,结合上横坐标所对应的人均消费额可以看出,人均消费额小于7000元的城镇家庭比重有所降低,且消费额越低,家庭比重下降越大,且总体下降趋势较为平稳;人均消费大于7000元的家庭比重有所提高,且家庭人均消费额越大,家庭比重的增加速度就越快,尤其是人均消费大于10000元的家庭比重上升尤为显著;通过对1995~2002年与2009~2002年两个时期PDF纵坐标对比组百分比值的比较,可以看出,前一阶段与后一阶段相比,高消费水平家庭群体比重增幅十分显著,进一步拉开与中低消费水平家庭的差距。这种现象产生可能解释为:随着我国经济改革的逐步推进,我国城镇家庭人均收入差距日益增大,收入差距过大会使国民财富中的绝大部分集中于少数高收入者手中,收入水平高的家庭在住房、交通、医疗保健等各项消费的增加幅度均高于中低收入水平家庭,并且高收入家庭比中低收入家庭更容易获得较高的消费信贷,从而导致我国城镇家庭消费差距呈现进一步扩大趋势。
图3 2009年与2002年家庭人均消费对比的相对分布CDF(左)与PDF(右)
四、结论、建议与展望
以1995年、2002年“中国家庭收入调查数据”与2008年、2009年北京奥尔多投资咨询中心与国家统计局合作进行的“中国城镇居民经济状况与心态调查”调查的城镇家庭为例,本文对我国城镇家庭的消费不平等的情况进行了分布测度与趋势分析,得出的主要结论如下:
第一,根据不平等指数的测度情况,1995年、2008年和2009年三个调查年份人均消费的各项不平等指数均高于人均收入,表明我国城镇家庭的消费不平等问题较收入不平等相比更为严重;其次,1995~2002年和2002~2009年家庭人均消费各项不平等指数的增加,表明我国城镇家庭消费不平等呈现扩大的趋势。第二,根据适应性核密度估计方法拟合的消费分布情况,从总体来看,我国城镇家庭消费不平等与收入不平等的变化情况相一致。随着时间变化,家庭人均消费的整体分布逐渐向右侧平移,说明城镇家庭消费水平均不断增加;家庭人均消费呈右偏分布,右侧尾部不断延长且逐渐加厚,左侧尾部不断变薄,反映出高消费水平的城镇家庭比重逐渐升高,低消费水平的城镇家庭比重逐渐下降;家庭人均消费分布曲线逐渐变得平坦。表明随着我国经济的发展,城镇家庭消费差距逐渐扩大。第三,由相对分布非参数核密度估计分析可以看出,1995~2002年我国城镇呈现低消费水平家庭比重逐渐降低,中高消费水平家庭比重不断增加;2002~2009年这一阶段家庭消费不平等增加趋势大于1995~2002年的阶段,且这一阶段高消费水平家庭的比例显著递增。从总体来看,我国城镇家庭消费不平等呈现出逐渐加剧的趋势。
城镇家庭消费不平等反映了我国城镇家庭福利不平等程度十分严重,这种不平等状况会影响我国的社会稳定,并对我国的经济发展产生制约,为了确保中国经济的平稳发展与城镇居民福利水平的不断提高,本文提出以下改善城镇家庭消费不平等现状的政策建议:首先,政府应该适度干预市场,通过公共政策对我国城镇家庭的收入分配进行调节,防止收入不平等的进一步加剧;其次,尽快完善社会主义市场经济体制,健全包括失业救济、养老、医疗等在内的社会保障制度,解除城镇家庭当期消费的后顾之忧,尤其是提高中低收入层次家庭的消费信心,缩小不同收入群体的消费差距;最后,建立健全消费信贷制,扩大消费信贷规模,促进我国消费信贷市场的发展,提高城镇家庭的当期消费水平。
本文重点研究了我国城镇家庭消费分布的变化趋势,对我国城镇家庭消费不平等产生机制的深入探讨是我们下一步研究的方向。
[1]BLUNDELL R,PISTAFERRI L,PRESTON I.Consumption Inequality and Partial Insurance[J].American Economic Review,2008,98(5):1887-1921.
[2]MCGREGOR P,BAROOAH V K.Is Low Spending or Low Income a Better Indicator of Whether or Not a Household Is Poor:Some Results From the 1985 Family Expenditure Survey[J].Journal of Social Policy,1992,21(1):53-69.
[3]戴平生,林文芳.拓展基尼系数及其居民消费应用研究[J].统计研究,2012(6):18-26.
[4]曲兆鹏,赵忠.老龄化对我国农村消费和收入不平等的影响[J].经济研究,2008(12):85-149.
[5]林毅夫,陈斌开.重工业优先发展战略与城乡消费不平等——来自中国的证据[J].浙江社会科学,2009(4):10-15.
[6]纪宏,陈云.我国中等收入者比重及其变动的测度研究[J].经济学动态,2009(6):11-16.
[7]龙莹.极化背景下中等收入群体规模变动的统计研究[M].北京:经济科学出版社,2012:53-97.
[8]BRAND L,HOLZ C.Spatial Price Differences in China:Estimates and Implications[J].Economic Development and Cultural Change,2006,55(1):43-86.
[9]PAGAN A,ULLAH A.Nonparametric Econometrics[M].Cambridge:Cambridge University Press,1999:49-56.
[10]HANDCOCK M,MORRIS M.Relative Distribution Methods[J].Sociological Methodology,1998,28(1):53-97.