对测量不平等的泰尔指数和基尼系数比较
2014-04-23刘续棵
刘续棵
摘 要:测量收入不平等以及研究贫困问题主要采用的两种方法就是利用基尼系数和泰尔指数。基尼系数的计算本身存在三种最为常用的区别,而泰尔指数在组内组间分解上更优于基尼系数,但是由于其计算收入转移上的敏感性,使得其与基尼系数相比更可能高估不平等。通过对比这两种计算方法,可以对不同的微观数据采用不同的方法。
关键词:基尼系数;泰尔系数;收入不平等
中图分类号:F0 文献标志码:A 文章编号:1673-291X(2014)07-0012-03
一、基尼系数的测量
就衡量收入不平等而言,我们最为常用的方式就是使用基尼系数进行衡量。从1921年基尼系数(Gini,1921)第一次出现到现在已经有八十年的历史(Xu,Kuan,2004),对基尼系数的研究和分析已经形成一套很成熟的方法和并积累了大量相关的文献。在对基尼系数论述的的文献历史中,Anand (1983)和Chakravarty (1990)对包括基尼系数在内的不平等测量方法进行了全面的调查,Lambert (1989),以及Atkinson and Bourguignon (2000)也对利用基尼系数衡量收入不平等以及贫困问题提供了全面的参考文献。对于基尼系数的发展历程及文献综述回顾可以参见Kuan Xu(2004),其根据以往的文献对基尼系数的产生和发展进行了一次全面的梳理,同时对基尼系数的解释,社会福利效应以及收入分解都做了详细的介绍。在Kuan Xu(2004)的文章中,基尼系数定义为用来衡量收入、消费以及财产分配差异的指标。对基尼系数的测量主要有三种方法:几何法、协方差法以及矩阵法。
(一)几何法
对于几何法而言,主要是根据洛伦兹曲线来对基尼系数进行几何描述,其初始公式为:
A:是洛伦兹曲线与完全平等曲线(45度线)之间的区域面积
B:是洛伦兹曲线以下的区域面积
以人口的累积百分比由低到高作为横坐标,由收入的累计百分比由低到高作为纵坐标。Sen (1973)把基尼系数的公式定义为:
n代表人口数,μy代表平均收入,yi 代表第i个人的收入。
(二)协方差法
协方差法相对于几何法,计算更为简单。在收入离散分配的前提下。Anand (1983)得出基尼系数的计算公式为:
则基尼系数可以等价为:
n代表人口数,μy代表平均收入,yi代表第i个人的收入。
这种方法的优势在于通过使用统计软件中自带的协方差程序,计算过程可以大大简化。
(三)矩阵法
矩阵法是由Pyatt (1976)以及Silber (1989)为了进行收入分解而设计的方法。在Gini (1912),Kendall以及Stuart (1958)的著作《高级统计学原理》中,采用了“相对平均差异”这样一个概念:
则基尼系数(Kendal and Stuart,1963)定义为:G= (7)
根据G=,|yi-yj |=2max(0,yi-yj )(Pyatt (1976))
上述的表达式也可以写成:
假设总人口可以被划分为k组,第i组占有总人口中pi份额的人口,则“平均期望收益”可以表示为:
Silber (1989)提出了另外一种计算基尼系数的方法。经过Sen(1973),Donaldson 与Weymark(1980)对基尼系数计算的研究,Gini系数最初计算公式为公式(3)
根据(i-1)代表低于个人i收入的人数占总人数的比重,(n-i)代表高于个人i收入的人数占总人数的比重(Berrebi,Z.M.;Silber,1985)。
公式(12)中,y是升序排列;如果y是降序排列,则,令i+j=n+1,得公式(12)。
衡量不平等原理的基尼系数的定义可以表示为:
其中Sj表示收入排名第j的个人他所拥有的收入占总收入的比重,(Si=)。公式(12)被证明(Xu,Kuan,2004)也可以转化为:
以矩阵的形式可以表示为:
二、泰尔系数的测量
从历史上看,作为衡量不平等的方法,泰尔系数相对基尼系数来说,从提出到应用到的时间相对较短。Henri Theil认为泰尔系数就是把作为事前概率的人口比例转化为事后概率的收入比例,从间接信息当中获取有用内容的方法。(Henri Theil,1967)。而Amartya Sen (1997)则认为泰尔系数还只是一个无法控制的公式。泰尔系数提供了一种测量组间收入分布与人口分布之间差异的方法。
假设1,人口只有富人和穷人两部分构成时,泰尔系数可以表示为:
wrich表示富人收入占总收入的比重,wpoor表示穷人收入人占总收入的比重。
从上式中我们可以得出的结果是:泰尔系数核心是:通过对各组收入与人口的份额的比值求对数,再进行加权求和,来比较收入在人口中的分配结构。它的一个非常重要的特性就是:泰尔系数对于收入从穷人向富人转移时非常敏感。Pedro Concei??o和 Pedro Ferreira(2000)以最富的人的收入占总收入的比重作为横坐标,以泰尔系数以及各种线性测量不平等系数为纵坐标,并确立了两个分界点,以最富有的人的收入占总收入的实际比重为第一个分界点,以人口比重与收入比重相等时的收入比重作为第二个分界点,论证了,在第一个分界点右边,随着收入从穷人转移到富人,泰尔系数的曲线会变得越来越陡峭,而线性的方法对这种改变会却不是很敏感,同样在第一个分界点左边,随着收入从富人转移到穷人(最富的人的收入占总收入的比重的下降)线性对不平等的测量法以及泰尔系数都会呈现下降的趋势,而泰尔系数会下降得更快。当最富的人的收入占总收入的比重下降到与富人占总人口的比重相同之时,所有测量不平等的方法(包括泰尔系数)都归为0。当在第二个分界点的左边时,这也就等同于穷人的收入比重超过了富人的收入比重(假设收入只被分为两部分,穷人和富人),这时不平等又开始增加(Pedro Concei??o和 Pedro Ferreira,2000)。
假设2,当一个以家庭为单位的人口总体可以被划分为若干相互完全独立的小组时,对泰尔系数的统计计算可以由两部分构成,一部分是组间的泰尔系数(Tg),另一部分是组内的泰尔系数(Tg):
wi代表第i个组中的收入占总收入的比重。pi代表第i组中人口占总人口的比重。
nj表示第i组中第j个家庭人口占总人口的比重,yj表示第i组中第j个家庭收入占总收入的比重。
Theil系数可分解的特性可以帮助我们对组间的收入分配弹性进行分析。有两种不平等会对总体不平等产生效应:
(1)纯分配效应:组内个体的不平等对总体不平等产生的影响。用ΔwΔT表示。
(2)组份额效应:这是由于各组的权重(wi)反映到了总体的不平等中,用Δw表示。
则每组对总体对不平等的贡献由ΔT*Δw来表示。Shorrocks(1980)提出只有‘entrop based的家庭构成的总体才可以将不平等分解成为组内和组间来进行解释。endprint
摘 要:测量收入不平等以及研究贫困问题主要采用的两种方法就是利用基尼系数和泰尔指数。基尼系数的计算本身存在三种最为常用的区别,而泰尔指数在组内组间分解上更优于基尼系数,但是由于其计算收入转移上的敏感性,使得其与基尼系数相比更可能高估不平等。通过对比这两种计算方法,可以对不同的微观数据采用不同的方法。
关键词:基尼系数;泰尔系数;收入不平等
中图分类号:F0 文献标志码:A 文章编号:1673-291X(2014)07-0012-03
一、基尼系数的测量
就衡量收入不平等而言,我们最为常用的方式就是使用基尼系数进行衡量。从1921年基尼系数(Gini,1921)第一次出现到现在已经有八十年的历史(Xu,Kuan,2004),对基尼系数的研究和分析已经形成一套很成熟的方法和并积累了大量相关的文献。在对基尼系数论述的的文献历史中,Anand (1983)和Chakravarty (1990)对包括基尼系数在内的不平等测量方法进行了全面的调查,Lambert (1989),以及Atkinson and Bourguignon (2000)也对利用基尼系数衡量收入不平等以及贫困问题提供了全面的参考文献。对于基尼系数的发展历程及文献综述回顾可以参见Kuan Xu(2004),其根据以往的文献对基尼系数的产生和发展进行了一次全面的梳理,同时对基尼系数的解释,社会福利效应以及收入分解都做了详细的介绍。在Kuan Xu(2004)的文章中,基尼系数定义为用来衡量收入、消费以及财产分配差异的指标。对基尼系数的测量主要有三种方法:几何法、协方差法以及矩阵法。
(一)几何法
对于几何法而言,主要是根据洛伦兹曲线来对基尼系数进行几何描述,其初始公式为:
A:是洛伦兹曲线与完全平等曲线(45度线)之间的区域面积
B:是洛伦兹曲线以下的区域面积
以人口的累积百分比由低到高作为横坐标,由收入的累计百分比由低到高作为纵坐标。Sen (1973)把基尼系数的公式定义为:
n代表人口数,μy代表平均收入,yi 代表第i个人的收入。
(二)协方差法
协方差法相对于几何法,计算更为简单。在收入离散分配的前提下。Anand (1983)得出基尼系数的计算公式为:
则基尼系数可以等价为:
n代表人口数,μy代表平均收入,yi代表第i个人的收入。
这种方法的优势在于通过使用统计软件中自带的协方差程序,计算过程可以大大简化。
(三)矩阵法
矩阵法是由Pyatt (1976)以及Silber (1989)为了进行收入分解而设计的方法。在Gini (1912),Kendall以及Stuart (1958)的著作《高级统计学原理》中,采用了“相对平均差异”这样一个概念:
则基尼系数(Kendal and Stuart,1963)定义为:G= (7)
根据G=,|yi-yj |=2max(0,yi-yj )(Pyatt (1976))
上述的表达式也可以写成:
假设总人口可以被划分为k组,第i组占有总人口中pi份额的人口,则“平均期望收益”可以表示为:
Silber (1989)提出了另外一种计算基尼系数的方法。经过Sen(1973),Donaldson 与Weymark(1980)对基尼系数计算的研究,Gini系数最初计算公式为公式(3)
根据(i-1)代表低于个人i收入的人数占总人数的比重,(n-i)代表高于个人i收入的人数占总人数的比重(Berrebi,Z.M.;Silber,1985)。
公式(12)中,y是升序排列;如果y是降序排列,则,令i+j=n+1,得公式(12)。
衡量不平等原理的基尼系数的定义可以表示为:
其中Sj表示收入排名第j的个人他所拥有的收入占总收入的比重,(Si=)。公式(12)被证明(Xu,Kuan,2004)也可以转化为:
以矩阵的形式可以表示为:
二、泰尔系数的测量
从历史上看,作为衡量不平等的方法,泰尔系数相对基尼系数来说,从提出到应用到的时间相对较短。Henri Theil认为泰尔系数就是把作为事前概率的人口比例转化为事后概率的收入比例,从间接信息当中获取有用内容的方法。(Henri Theil,1967)。而Amartya Sen (1997)则认为泰尔系数还只是一个无法控制的公式。泰尔系数提供了一种测量组间收入分布与人口分布之间差异的方法。
假设1,人口只有富人和穷人两部分构成时,泰尔系数可以表示为:
wrich表示富人收入占总收入的比重,wpoor表示穷人收入人占总收入的比重。
从上式中我们可以得出的结果是:泰尔系数核心是:通过对各组收入与人口的份额的比值求对数,再进行加权求和,来比较收入在人口中的分配结构。它的一个非常重要的特性就是:泰尔系数对于收入从穷人向富人转移时非常敏感。Pedro Concei??o和 Pedro Ferreira(2000)以最富的人的收入占总收入的比重作为横坐标,以泰尔系数以及各种线性测量不平等系数为纵坐标,并确立了两个分界点,以最富有的人的收入占总收入的实际比重为第一个分界点,以人口比重与收入比重相等时的收入比重作为第二个分界点,论证了,在第一个分界点右边,随着收入从穷人转移到富人,泰尔系数的曲线会变得越来越陡峭,而线性的方法对这种改变会却不是很敏感,同样在第一个分界点左边,随着收入从富人转移到穷人(最富的人的收入占总收入的比重的下降)线性对不平等的测量法以及泰尔系数都会呈现下降的趋势,而泰尔系数会下降得更快。当最富的人的收入占总收入的比重下降到与富人占总人口的比重相同之时,所有测量不平等的方法(包括泰尔系数)都归为0。当在第二个分界点的左边时,这也就等同于穷人的收入比重超过了富人的收入比重(假设收入只被分为两部分,穷人和富人),这时不平等又开始增加(Pedro Concei??o和 Pedro Ferreira,2000)。
假设2,当一个以家庭为单位的人口总体可以被划分为若干相互完全独立的小组时,对泰尔系数的统计计算可以由两部分构成,一部分是组间的泰尔系数(Tg),另一部分是组内的泰尔系数(Tg):
wi代表第i个组中的收入占总收入的比重。pi代表第i组中人口占总人口的比重。
nj表示第i组中第j个家庭人口占总人口的比重,yj表示第i组中第j个家庭收入占总收入的比重。
Theil系数可分解的特性可以帮助我们对组间的收入分配弹性进行分析。有两种不平等会对总体不平等产生效应:
(1)纯分配效应:组内个体的不平等对总体不平等产生的影响。用ΔwΔT表示。
(2)组份额效应:这是由于各组的权重(wi)反映到了总体的不平等中,用Δw表示。
则每组对总体对不平等的贡献由ΔT*Δw来表示。Shorrocks(1980)提出只有‘entrop based的家庭构成的总体才可以将不平等分解成为组内和组间来进行解释。endprint
摘 要:测量收入不平等以及研究贫困问题主要采用的两种方法就是利用基尼系数和泰尔指数。基尼系数的计算本身存在三种最为常用的区别,而泰尔指数在组内组间分解上更优于基尼系数,但是由于其计算收入转移上的敏感性,使得其与基尼系数相比更可能高估不平等。通过对比这两种计算方法,可以对不同的微观数据采用不同的方法。
关键词:基尼系数;泰尔系数;收入不平等
中图分类号:F0 文献标志码:A 文章编号:1673-291X(2014)07-0012-03
一、基尼系数的测量
就衡量收入不平等而言,我们最为常用的方式就是使用基尼系数进行衡量。从1921年基尼系数(Gini,1921)第一次出现到现在已经有八十年的历史(Xu,Kuan,2004),对基尼系数的研究和分析已经形成一套很成熟的方法和并积累了大量相关的文献。在对基尼系数论述的的文献历史中,Anand (1983)和Chakravarty (1990)对包括基尼系数在内的不平等测量方法进行了全面的调查,Lambert (1989),以及Atkinson and Bourguignon (2000)也对利用基尼系数衡量收入不平等以及贫困问题提供了全面的参考文献。对于基尼系数的发展历程及文献综述回顾可以参见Kuan Xu(2004),其根据以往的文献对基尼系数的产生和发展进行了一次全面的梳理,同时对基尼系数的解释,社会福利效应以及收入分解都做了详细的介绍。在Kuan Xu(2004)的文章中,基尼系数定义为用来衡量收入、消费以及财产分配差异的指标。对基尼系数的测量主要有三种方法:几何法、协方差法以及矩阵法。
(一)几何法
对于几何法而言,主要是根据洛伦兹曲线来对基尼系数进行几何描述,其初始公式为:
A:是洛伦兹曲线与完全平等曲线(45度线)之间的区域面积
B:是洛伦兹曲线以下的区域面积
以人口的累积百分比由低到高作为横坐标,由收入的累计百分比由低到高作为纵坐标。Sen (1973)把基尼系数的公式定义为:
n代表人口数,μy代表平均收入,yi 代表第i个人的收入。
(二)协方差法
协方差法相对于几何法,计算更为简单。在收入离散分配的前提下。Anand (1983)得出基尼系数的计算公式为:
则基尼系数可以等价为:
n代表人口数,μy代表平均收入,yi代表第i个人的收入。
这种方法的优势在于通过使用统计软件中自带的协方差程序,计算过程可以大大简化。
(三)矩阵法
矩阵法是由Pyatt (1976)以及Silber (1989)为了进行收入分解而设计的方法。在Gini (1912),Kendall以及Stuart (1958)的著作《高级统计学原理》中,采用了“相对平均差异”这样一个概念:
则基尼系数(Kendal and Stuart,1963)定义为:G= (7)
根据G=,|yi-yj |=2max(0,yi-yj )(Pyatt (1976))
上述的表达式也可以写成:
假设总人口可以被划分为k组,第i组占有总人口中pi份额的人口,则“平均期望收益”可以表示为:
Silber (1989)提出了另外一种计算基尼系数的方法。经过Sen(1973),Donaldson 与Weymark(1980)对基尼系数计算的研究,Gini系数最初计算公式为公式(3)
根据(i-1)代表低于个人i收入的人数占总人数的比重,(n-i)代表高于个人i收入的人数占总人数的比重(Berrebi,Z.M.;Silber,1985)。
公式(12)中,y是升序排列;如果y是降序排列,则,令i+j=n+1,得公式(12)。
衡量不平等原理的基尼系数的定义可以表示为:
其中Sj表示收入排名第j的个人他所拥有的收入占总收入的比重,(Si=)。公式(12)被证明(Xu,Kuan,2004)也可以转化为:
以矩阵的形式可以表示为:
二、泰尔系数的测量
从历史上看,作为衡量不平等的方法,泰尔系数相对基尼系数来说,从提出到应用到的时间相对较短。Henri Theil认为泰尔系数就是把作为事前概率的人口比例转化为事后概率的收入比例,从间接信息当中获取有用内容的方法。(Henri Theil,1967)。而Amartya Sen (1997)则认为泰尔系数还只是一个无法控制的公式。泰尔系数提供了一种测量组间收入分布与人口分布之间差异的方法。
假设1,人口只有富人和穷人两部分构成时,泰尔系数可以表示为:
wrich表示富人收入占总收入的比重,wpoor表示穷人收入人占总收入的比重。
从上式中我们可以得出的结果是:泰尔系数核心是:通过对各组收入与人口的份额的比值求对数,再进行加权求和,来比较收入在人口中的分配结构。它的一个非常重要的特性就是:泰尔系数对于收入从穷人向富人转移时非常敏感。Pedro Concei??o和 Pedro Ferreira(2000)以最富的人的收入占总收入的比重作为横坐标,以泰尔系数以及各种线性测量不平等系数为纵坐标,并确立了两个分界点,以最富有的人的收入占总收入的实际比重为第一个分界点,以人口比重与收入比重相等时的收入比重作为第二个分界点,论证了,在第一个分界点右边,随着收入从穷人转移到富人,泰尔系数的曲线会变得越来越陡峭,而线性的方法对这种改变会却不是很敏感,同样在第一个分界点左边,随着收入从富人转移到穷人(最富的人的收入占总收入的比重的下降)线性对不平等的测量法以及泰尔系数都会呈现下降的趋势,而泰尔系数会下降得更快。当最富的人的收入占总收入的比重下降到与富人占总人口的比重相同之时,所有测量不平等的方法(包括泰尔系数)都归为0。当在第二个分界点的左边时,这也就等同于穷人的收入比重超过了富人的收入比重(假设收入只被分为两部分,穷人和富人),这时不平等又开始增加(Pedro Concei??o和 Pedro Ferreira,2000)。
假设2,当一个以家庭为单位的人口总体可以被划分为若干相互完全独立的小组时,对泰尔系数的统计计算可以由两部分构成,一部分是组间的泰尔系数(Tg),另一部分是组内的泰尔系数(Tg):
wi代表第i个组中的收入占总收入的比重。pi代表第i组中人口占总人口的比重。
nj表示第i组中第j个家庭人口占总人口的比重,yj表示第i组中第j个家庭收入占总收入的比重。
Theil系数可分解的特性可以帮助我们对组间的收入分配弹性进行分析。有两种不平等会对总体不平等产生效应:
(1)纯分配效应:组内个体的不平等对总体不平等产生的影响。用ΔwΔT表示。
(2)组份额效应:这是由于各组的权重(wi)反映到了总体的不平等中,用Δw表示。
则每组对总体对不平等的贡献由ΔT*Δw来表示。Shorrocks(1980)提出只有‘entrop based的家庭构成的总体才可以将不平等分解成为组内和组间来进行解释。endprint