基于主成分分析法的中国人类公平发展指数构建
2015-09-30吴艳华
吴艳华
(长春广播电视大学,吉林 长春 130061)
联合国开发署出版的《人类发展报告》中人类发展指数的构建指标简单且易于计算,被广泛接受和应用。但依据该报告的论述,中国人类发展存在严重的不均衡发展问题,报告中的人类发展指数的构建方法不能全面地反应中国人类发展的现状。为了弥补报告中人类发展指数中未能涵盖的收入公平正义而不能全面反映中国人类发展水平的欠缺,揭示中国人类发展不和谐的现象,以收入差距为基础,将收入差距与收入指数相结合,再将其嵌入人类发展指数中,得到涵盖收入公平正义的公平人类发展指数(EHDI)。在计算EHDI的过程中,采用主成分分析,动态确定各分项指标权重,以展示分项指标对人类发展水平影响的变化情况。
一、基于公平正义理论指标体系构建方法
人类发展报告中的人类发展指数(HDI)由人类健康指数、人类教育指数和人类收入指数三个维度构成,对三项分项指标求其几何平均数,其公式是:
其中,N1是预期寿命指数,N2是教育指数,N3是GDP指数。各分项指数的无量纲化计算方法如下:
其中,是区域j关于第i个维度的实际值,是变量i的最小设定值,是变量i的最大设定值。
人类发展指数中是介于大于0小于1的数值,一国或地区人类发展指数数值越大,代表该国或地区的人类发展水平越高,反映一国或地区人类经济、教育和健康综合发展水平。不同国家或地区在不同时期人类发展指数的排名演变,能够反映出不同国家或地区人类发展历程的进步。
二、基于主成分分析法的中国人类公平发展指数构建设想
基于以上研究,我们认为收入差距是影响中国人类发展的重要因素,收入差距不仅仅对中国人类发展的经济发展指标(收入指数)产生影响,同时也对中国人类发展的教育指标及健康指标有着重要影响。因此,中国人类发展中的收入指数仅仅使用人均GDP指标衡量,不足以反应中国人类发展地域、城乡等多种收入差距问题。因此,我们有必要将收入差距纳入反映中国人类发展的指标体系中,改进中国人类发展指标体系。
如何将收入差距因素注入人类发展指数以确定新的评价标准,需要解决的问题如下:一是代表收入差距变量的选择问题;二是如何确定新指标的方法问题,即如何与既有的人类发展指数构架协调。第一问题选取国际上公认的衡量收入差距的指标基尼系数。第二问题基尼系数的计算本身就属于无量纲化的过程。但是因为基尼系数等于1表示没有收入差距绝对公平,基尼系数等于0是绝对不公平是不存在的,因此我们有必要设置基尼系数的阈值,有人类发展指数的其它指标保持一致。通过查阅世界银行相关数据,从1967年到2011年235个国家的数据看,最大基尼系数值是1994年巴西的0.61,最小值为1992年斯洛伐克共和国基尼系数为0.19,我国确定基尼系数的最大阈值为0.7,最小阈值为0.1。由于基尼系数的含义是在全部居民收入中,用于进行不平均分配的那部分收入占总收入的百分比,因此,我们用1-gini表示公平指数的最小阈值设为0.3,最大阈值设为0.9。
三、主成分分析法中国人类公平发展指数的构建
1、主成分分析方法介绍
主成分分析是对多维数据进行有效降维的方法。它的主要思想是使用一定方法将众多具有相关性的指标重新组合成互不相关的更少个数的综合指标来替换原来指标。主成分分析法就是解决少数综合指标的提取,使其能够最大程度地反映原变量所代表的信息,也能使这些新指标之间具有显著不相关性。
设E1表示原变量的第一个线性组合所形成的主成分指标,即E1=b11x1+b21x2+…+bp1xp,用主成分的方差度量所提取的信息量,若其方差Var(E1)越大,表示第一主成分包含的信息量越多。在所有主成分中第一主成分E1所包含的信息量最大,所以选取的E1应该是X1,X2,…,XP的所有线性组合中其方差是最大的一个。当第一主成分不能够完全代表原p个指标的所有信息,就应该考虑选取该线性组合的第二主成分指标E2,依此可以构造出的E1、E2、……、Em为原变量指标X1、X2……XP第一、第二、第三……、第m个主成分。
因此,主成分分析法主要完成以下两点任务:
(1)确定各个主成分Ei(i=1,2,…,m)的表达式系数。
(2)计算主成分载荷,其主要反映主成分Ei与原变量Xj之间的相关程度:
主成分分析的具体步骤如下:首先计算协方差矩阵;求特征值及相应的正交化单位特征向量;选择主成分;计算主成分载荷;计算主成分得分。
2、数据来源及处理
2010年中国30省HDI、健康指数、教育指数、收入指数均来自2012年中国人类发展报告。2010中国大陆30省得基尼系数引自国家社科基金资助项目“收入差距扩大的诱因、影响和控制对策研究”(12BJY033)成果《中国区域基尼系数的测算及其非参数模型研究》由于数据的缺乏,不包括西藏自治区的数据。人类发展报告中的人类发展指数已经消除了各分项指标人类健康指数、人类教育指数在量纲上的差异。因此,本文直接使用人类健康指数、人类教育指数分项指标而不用其原始数据。
用各省的基尼系数求出公平系数,其公式为:
通过查阅世界银行相关数据,公平指数的最小阈值设为0.3,最大阈值设为0.9。将公平指数参照计算人类发展指数分项指数的方法,进行标准化处理,其公式为:
以此方法,我们可以分别计算出各省标准化后的公平系数SFC,通过主成分分析法将人类发展收入指数(GNI指数)和公平指数合成为公平收入指数FIC。
最后我们基于主成分分析法,对各省的公平收入指数、健康指数、教育指数做主成分分析,分析基于公平基础上的中国人类发展状况。
3、模型数据处理及检验
由于中国人类发展指数各项分项指数在计算过程中已经进行了标准化处理,因此在量纲上就不存在差异,在此使用相关系数矩阵并没有明显优势。而且,如果采用相关系数矩阵的主成分分析,原始指标间的相对离散程度就有可能夸大或低估,夸大或低估原始指标的差异程度对最终人类发展水平差异程度的贡献率。相反,当变量的测度存在量级差异时,不宜采用协方差矩阵的主成分分析,变量方差的相对大小将会影响主成分线性表达中的权重。我们要使用的主成分分析的各项指标采用标准化方法已经消除了量纲的差异,因此,应该采用协方差矩阵。
我们使用HDI的分项健康指数、教育指数以及我们计算出的公平收入指数的协方差矩阵作为主成分分析的输入。采用该方法,不仅可以获得数据标准化的好处,即消除量纲和数量级上的差异,还可以保留各个指标在离散程度上的特性,避免低估或夸大指标差异性对各地区人类发展差异的贡献。
4、结果分析
通过使用SPSS16,运用主成分分析法,可以得到中国各省份公平收入指数,如表1,将中国省际公平收入指数与中国人类发展教育指数、中国人类发展健康指数运用主成分分析的方法可得中国省际公平发展指数,如表2
表1 中国省际公平收入指数分布
如表2,中国省际公平发展指数处于平均水平以上的省市有:北京市、广东省、辽宁省、内蒙古、湖北省、山西省、重庆市、湖南省、海南省、新疆、江西省、广西壮族自治区。中国省际公平发展指数处于平均水平以下的省市包括:天津市、江苏省、山东省、黑龙江省、河北省、河南省、四川省、安徽省、云南省、吉林省、陕西省、宁夏、青海省、甘肃省、贵州省。值得关注的是人类发展指数比较靠前的北京、上海、浙江省、广东省的中国省际公平发展指数的排名仍然靠前。
表2 中国省际公平发展指数
为了更清晰地看到融入公平理念后的各省的公平发展指数与原人类发展指数排名的变化,我们可以计算出各省中国人类发展指数与中国公平发展指数排名差值,以此考察各省在融入公平发展理念后的实际发展状况。当两者的差值为负数时表示该省人类发展指数排名领先于 公平发展指数;当两者的差值为正数时表示该省人类发展指数排名落后于公平发展指数;当两者的差值为零时表示人类发展指数排名与公平发展指数的排名相等。人类发展指数排名落后于公平发展指数排名的省市包括:浙江省、广东省、福建省、山西省、重庆市、湖南省、海南省、河南省、新疆维吾尔自治区、四川省、江西省、安徽省、广西壮族自治区、云南省、贵州省。人类发展指数排名领先于公平发展指数排名的省市包括:北京市、上海市、天津市、江苏省、辽宁省、内蒙古自治区、山东省、吉林省、黑龙江省、湖北省、陕西省、河北省、宁夏回族自治区、青海省、甘肃省。由此可以看出,绝大多数中国南部省份(除上海、江苏省外)的公平发展指数均领先于人类发展指数,而中国北部省份的公平发展指数均落后于人类发展指数。
结语
涵盖收入公平正义的新人类发展指数(EHDI)弥补了人类发展指数未涵盖收入公平正义而不能全面反映人类发展水平的欠缺。通过公平发展指数与原人类发展指数进行比较,绝大多数中国南部省份(除上海、江苏省外)的公平发展指数均领先于人类发展指数,而中国北部省份的公平发展指数均落后于人类发展指数。说明中国北部省份在大力发展经济的同时,应该对收入的公平问题加以关注,最终实现科学协调发展。
[1]汪毅霖,蒋北.植入生态文明指标的省际间人类发展比较研究——基于主成分分析和自由发展的视角[J].山西财经大学学报,2009(10).
[2]徐家林.“人文发展”的维度及其评价[D].上海:复旦大学,2006.
[3]杨永恒,胡鞍钢,张宁.基于主成分分析法的人类发展指数替代技术[J].经济研究,2005(7).
[4]朱成全,李立男.人类发展指数的拓展研究[J].中共南京市委党校学报2009(2).