基于spss数据分析的陕西省各地区城市建设与发展状况研究
2019-10-08陈智波尹红
陈智波 尹红
摘 要: 为了研究陕西省各地区城市的建设与发展状况,本文以陕西省的11个主要城市为研究对象,选取2015年度各个地区城市的年底城市总人口数、地方财政收入、城市用水普及率、城市燃气普及率、住宅面积等15个因素作为评价指标,从陕西省统计年鉴中提取出各个城市的相关数据。采用聚类分析法(系统聚类分析、k-均值聚类分析)和主成分分析法两种多元统计学方法,运用spss软件进行分析,最后对陕西省主要地区的城市建设和发展状况进行综合评价。
关键词: 城市发展;SPSS统计软件;聚类分析;主成分分析
【Abstract】: In order to study the construction and development of regional cities in Shaanxi Province, this paper takes 11 major cities in Shaanxi Province as the research object. Fifteen factors such as total urban population, local financial revenue, urban water use penetration rate, urban gas penetration rate and residential area at the end of 2015 are selected as evaluation indexes, and each city is extracted from the statistical yearbook of Shaanxi Province. Relevant data. Cluster analysis (system cluster analysis, K-means cluster analysis) and principal component analysis are used to analyze the situation of urban construction and development in Shaanxi Province. Finally, the comprehensive evaluation of urban construction and development in the main areas of Shaanxi Province is carried out.
【Key words】: Urban development; SPSS statistical software; Cluster analysis; Principal component analysis
0 引言
城市建设是城市管理的重要组成部分。城市建设以规划为依据,通过建设工程对城市人居环境进行改造,对城市系统内各物质设施进行建设,城市建设的内容包括城市系统内各个物质设施的实物形态,是为管理城市创造良好条件的基础性、阶段性工作,是过程性和周期性比较明显的一种特殊经济工作[1]。对于省内的各个城市来说,如何掌握它们
现阶段的发展情况,并对之后发展做出规划,服务城市经济社会发展,真正为市民创造良好的人居环境是非常重要的。本文运用聚类分析和主成分分析法,借助spss软件进行数据分析[2],根据结果对陕西省各地区城市建设与发展状况做出分析与评价。
1 聚类分析
聚类分析是建立一种分析方法,将一批样本和变量,按照他们在性质上的亲疏、相似程度进行分类的一种多元统计分析方法。聚类分析的内容十分丰富,按其聚类的方法可以分为:系统聚类法、动态聚类法、最优化聚类法、模糊聚类法、图论聚类法和聚类预报法[3]。
另外,按照分类对象不同可以分为R型聚类和 Q型聚类,R型是对变量进行聚类,Q型是对样本进行聚类。
4 数据分析
4.1 聚类分析
利用SPSS软件首先对数据进行系统聚类分析,分析过程及结果如下[9]。
通过表2个案处理摘要表,我们可以看出,在整个聚类过程中,所选取的11个城市均参与了聚类分析过程,没有遗失或未参与的样本。这充分说明此次聚类分析已经对11个样本的各项指标进行了相似聚类,因而可以进行下一步分析。
通过表3样本聚类表,我们可以看出当11个样本分别分成2个聚类和3个聚类时的样本聚类情况。
结合表3样本归类表和图1聚类树形图,当将样本聚为3类时,我们可以得出表4的聚类结果。
接下来我们再使用K-均值聚类方法对样本进行分析:
a. 由于聚類中心中不存在变动或者仅有小幅变动,因此实现了收敛。任何中心的最大绝对坐标变动为0.000。当前迭代为2。初始中心之间的最小距离为6775.821。
根据K-均值聚类最终得到的表6聚类成员表我们可以看出11个样本被聚为3类第一类为西安,第二类为榆林、渭南、咸阳、汉中、延安、宝鸡、安康,第三类为铜川、商洛、杨凌,由此可见两种聚类方法得到的结果是一致的。
4.2 主成分分析
由于选取的各个指标的单位不相同,因此在进行主成分分析前需要将所有的数据进行标准化处理,经过标准化处理后的数据如表7所示。
由表8总方差解释表可知特征根λ1=9.667,特征根λ2=2.367,前两个主成分的累积方差贡献率达到了80.229%,即涵盖了大部分信息,这表明前两个主成分能够代表最初的15个指标来分析陕西省各地区的城市发展与建设情况,故提取两个主成分即可[10],分别记为z1,z2。
在运用主成分分析方法对陕西省各地区的城市建设与发展时,我们最后选取了两个主成分因子即2个主要指标代表了15个指标进行分析,表11综合得分与排名表给出了各城市的综合得分与排名,其中综合得分为正值的,说明城市建设与发展高于平均水平,反之,综合得分为负值的,说明其城市建设与发展低于平均水平。排名一列我们可以看出11个城市在综合两个主成分因子下的排名,由大到小一次为:西安、咸阳、榆林、渭南、宝鸡、汉中、安康、延安、商洛、铜川、杨凌。
5 结论
在进行对陕西省各地区的城市建设与发展状况进行分析时我们采用了聚类分析和主成分分析的方法,综合聚类分析和主成分分析的结果,我们可以得到下表12综合得分与聚类状况表。
从表中我们可以看出在陕西省的城市中,西安市作为陕西省的省会城市,无论在哪个方面都处于龙头地位,其城市建设与发展远远高于同地区的其他城市,不仅在综合得分上处于第一位,同时与其他城市相比自为一类。
咸阳市居于第二位,近几年来陕西省政府在咸阳市成立西咸新区,加大对咸阳市的建设和发展投入,使得咸阳市成为西安国际化大都市的核心组成部分,成为西部高端化和先进的制造业基地,其余6个城市与咸阳建设发展状况较为接近。
商洛、铜川、杨凌同为一类,这说明其城市建设与发展状况与上面的八个城市相比还是很有差距的,这就要求政府在以后的发展中加大对基础城市建设的投资,努力提高各方面的水平。
参考文献
[1]宁越敏, 唐礼智. 城市竞争力的概念和指标体系[J]. 现代城市研究, 2001, 10(3).
[2]赵楠, 王昕, 李英娜, 等. 利用 spss 软件分析校园霸凌事件的发生规律以及预防[J]. 软件, 2018, 39(1): 159-164.
[3]陈磊磊.不同距离测度的K-Means 文本聚类研究[J]. 软件, 2015, 36(1): 56-61.
[4]田明光, 翟旭, 江颖洁, 等. 基于K均值聚类及高斯过程回归集成的铅酸电池荷电状态预测[J]. 软件, 2018, 39(1): 132-137.
[5]何晓群. 多元统计分析[M]. 北京: 中国人民大学出版社, 2015.
[6]张文宇, 王秀秀, 任露, 等. 改进的主成分聚类分析法在教育信息化中的应用[J]. 软件, 2015, 36(7): 10-16.
[7]高惠璇編著, 《应用多元统计分析》北京大学出版社, 2005. 1.
[8]陕西省统计局. 陕西省统计年鉴[Z]. 北京: 中国统计出版社.
[9]吴荣强, 李晋宏. 基于聚类分析的铝电解槽阳极压降的分类[J]. 软件, 2018, 39(3): 166-169.
[10]唐功爽. 基于spss的主成分分析于因子分析的辨析[J]. 统计教育, 2007(2).
[11]张士杰. 基于主成分分析的阜阳市城市竞争力评价[J]. 安徽广播电视大学学报, 2011, (4).