全国各地区的小康和现代化指数的聚类分析
2017-08-12郭云飞肖雅林红飞
郭云飞 肖雅 林红飞
摘要:本文根据我国31个省市自治区的全面建设小康社会指标体系,利用聚类分析法计算各地级市在综合指数、社会结构、经济与技术发展、人口素质、生活质量、法制与治安等子系统上的进行分类。利用聚类分析法对这些地级市进行聚类分析。第一类有三个城市,有北京、上海、天津;第二类有6个省市,有江苏、山东、辽宁、浙江、广东、福建;第三类有22个城市,有甘肃、江西、贵州、青海、安徽、广西、河南等22个城市。最后根据各类区域全面建设小康社会的特点,提出相应的政策建议。
关键词:综合指数 社会结构 经济与技术发展 人口素质 生活质量 法制与治安 聚类分析
一、引言
利用全国31个省市自治区各类小康和现代化指数的数据,对地区进行聚类分析。该份数据中包括六类指数,分别是综合指数、社会结构指数、经济与技术发展指数、人口素质指数、生活质量指数、法制与法治指数。其中,社会结构指数是由第三产业从业人员比重等五项指标组成,反映了社会化、城市化、非农化、外向型经济和智力投资等方面;经济与科技是实现小康和现代化的经济基础和知识创新新手段,经济与技术发展指数是由人均GDP等七项指标组成,反映了综合经济的投入产出、就业率、知识创新投入和发明创造能力等方面:文化科技素質是对实现目标起决定作用的,人口素质指数是由人口自然增长率、专业技术人员等六项指标组成;生活质量指数由恩格尔系数等六项指标组成,反应了生活现代化和电气化等方面;法制与治安是现代化建设的稳定机制,法制与治安指数是由刑事案件、治安案件、律师数和交通事故死亡率四项指标组成,是个逆向指标。
二、原始数据
X1代表综合指数;X2代表社会结构指数;X3代表经济与技术发展指数;X4代表人口素质指数;X5代表生活质量指数;X6代表法制与法治指数:
三、聚类分析思想
分析时对样品即个体以某种相似性为度量标准进行分类的种计量方法。常用的方法是,一是用相似系数,将性质比较相似的个体分为一个类,不太相似的个体分为不同的类;另一个是将每一个样本看成是空间的一个点,距离近的点分为一个类,距离较远的点分为不同的类。
系统聚类是聚类分析中应用最广泛的一种方法。它的基本思想是:首先是将每一个样品(或指标)各自看成一类,根据样品(或指标)间的距离,将距离最近的合并为一类,然后考虑合并后的类与其他类之间的距离,再进行合并;重复这过程,直至将所有的样品合并为类,最后分类结束,得出相应的分类图表。
本文采用系统聚类法,样品之间的距离使用的是欧式距离,计算类间的距离采用的是类间链接法,得出分类结果。
利用spss层析聚类的Q型聚类对31个省市自治区进行分析。其中,个体距离采用平方欧式距离,类间距离采用组间平均链锁距离,由于数据不存在数量级上的差异,因此无须进行标准化处理。生成的聚类分析树状图如下。
四、分析结果
第一类有三个城市,有北京、上海、天津,其综合指数、社会结构指数、经济与技术发展指数、人口发展指数、人口素质指数、生活质量指数均名列三类之首,法制治安指数最低,各项指数都是最优的;第二类有6个省市,有江苏、山东、辽宁、浙江、广东、福建,其六个指数均位于第二,各项指数均处于中游水平;第三类有22个城市,有甘肃、江西、贵州、青海、安徽、广西、河南等22个城市,其法制和治安指数最高,其余各项指数均最低,各项指数均处于下游。