APP下载

全国30个省市地区经济发展的聚类分析

2013-04-29姚雪龙

决策与信息·中旬刊 2013年8期
关键词:省市贡献率自治区

姚雪龙

本文针对2007年全国30个省市自治区(除河南省外)国民经济核算的22项指标进行统计分析,并对全国30个省市自治区(除河南省外)进行聚类分析。

在进行聚类分析之前首先针对22项经济指标进行主成分分析,分析结果得到前六个主成分对方差的累计贡献率达到了0.9102,因此,前六个主成分能够很好地概括这组数据,然后计算每个主成分相应的得分值,并将这六个得分值作为每个省市新的变量,最后采用类平均法进行聚类分析。最终将30个省市自治区划分为5类,然后对河南省进行判别归类,在判别归类过程中通过回判检验发现只有湖北省发生了错判,其他29个省市自治区均判别正确,说明本文中所采用的方法是合理有效的。

说明

本文中所采用的22项国民经济核算指标包括:

由于上述的22个经济指标存在量纲和数量级上的差异,因此在进行统计分析之前,对22项指标进行了标准化处理。

主成分分析后前六个主成分对方差的累积贡献率已经达到0.9102,而且从第七个主成分开始,之后的每个主成分对方差的贡献率小于0.02,故可以忽略不计。本文对每个主成分所能代表的含义给出了分析,根据每个主成分表达式给出了每个主成分主要是由哪些变量主导的。

由于本文是依据每个省的整体发展情况进行分析的,因此聚类的结果时针对每个省的综合发展情况,而不是针对每个省的重点城市的经济发展情况。

1.主成分分析

下表给出了相关系数矩阵的特征值、上下特征值之差、各主成分对方差的贡献率以及累积贡献率。

由上表可以看出,第一主成分对方差的贡献率为47.77%;第二主成分对方差的贡献率15.40%;第三主成分对方差的贡献率为10.35%;第四主成分对方差的贡献率为8.84%;第五主成分对方差的贡献率为5.07%;第六主成分对方差的贡献率为3.60%。前六个主成分的累积贡献率已经达到了91.02%,因此,对第六个主成分以后的主成分可以忽略不计,用前六个主成分就可以很好地概括这组数据。

由上表可得前六个主成分的表达式为:

第一主成分中的系数,比较大都在0.3附近;第二主成分中,具有较大的正系数;第三主成分中,具有较大的正系数;第四主成分中具有较大的正系数;第五主成分中的系数最大 为0.75远远超过了其他指标的影响;第六主成分中的系数最大为0.7远远超过了其他指标的影响。

因此,第一主成分可以看成是由GDP,第二产业生产总值,工业生产总值,建筑业,第三产业生产总值,最终消费,居民消费,政府消费,净出口所主导的反映经济发展水平的综合指标,故第一主成分可以称为货币因子;第二主成分可以看成是由第二产业指数,工业指数所主导的反映经济发展水平的综合指标,故第二主成分可以称为工业因子;第三主成分可以看成是由人均GDP,GDP指数所主导的来反映经济发展水平的综合指标,故第三主成分可以称为GDP因子;第四主成分可以看成是由消费率所主导的来反映经济发展水平的综合指标,故将第四主成分称为消费因子;第五主成分可以看成是由第三产业指数所主导的来反映经济发展水平的综合指标,故第五主成分可以看成是第三产业因子;第六主成分可以看成是建筑业指数所主导的来反映经济发展水平的综合指标,故第六主成分可以称为建筑因子。

2.聚类分析

第一,将六个主成分的得分值作为新的六个变量对30个省市自治区(河南省除外)进行聚类分析。

30个省市自治区的六个新的变量

第二,采用类平均法进行聚类分析

对六个新的变量再次进行标准化变换,样品间距离定义为欧式距离,系统聚类法采用类平均法。

第三,谱系聚类图

第四,分类结果

上述分类结果显示北京,上海,广东并没有分为一类,而且江苏,浙江等一线城市与其他的二类城市归为一类,这与人们传统上的认识有较大差别,但这并不能说明本文所采用的方法和数据存在问题,本文对各省市的经济发展状况采取了22项指标进行综合考察,而且就每个省整体来看,虽然一些城市发展较好,但是也存在发展较差的城市,所以,就一个省的整体发展情况来看,本文中所得到的分类结果是合理的,同时这也体现出本文研究的价值所在。

(作者单位:河南大学)

猜你喜欢

省市贡献率自治区
一种通用的装备体系贡献率评估框架
走进神奇的汉特-曼西自治区
关于装备体系贡献率研究的几点思考
省市大报头版头条
省市大报头版头条
其他省市怎么做?
关于召开第18届24省(市、自治区)4市铸造学术会议的(第一轮)通知
省市大报头版头条
В первой половине 2016 года вклад потребления в рост китайской экономики достиг 73,4 процента
11家自治区级重点实验室获批