APP下载

山西省各地区城市建设与发展状况研究

2021-02-16朱薇姗

科技创新与生产力 2021年12期
关键词:晋中山西省聚类

朱薇姗,张 笑

(河北经贸大学,河北 石家庄 050061)

1 研究背景

城市的高质量发展可以改善人民的生产、生活状况,创造优良的宜居环境。2019年山西省人民政府办公厅印发了 《山西省城市品质提升行动方案(2019—2022年)》,旨在推进山西省城市高质量发展[1]。要了解山西省各地区城市建设与发展现状,需从多方面进行综合评价。

关于城市发展的文献研究视角主要包括两方面:一是度量城市建设与发展的指标方面,宁越敏和唐礼智[2]探讨了城市竞争力的概念并设计了影响城市竞争力的十大指标体系;徐秋云[3]构建了济宁市城市竞争力的六大指标体系,并利用主成分分析对济宁市的城市发展进行了综合评分与评价。二是研究方法方面,张士杰[4]利用主成分分析,对阜阳市城市竞争力进行定量分析,得出阜阳市目前发展存在的问题并提出相应建议;陈智波和尹红[5]利用聚类分析和主成分分析,对陕西省地级市的城市发展进行了综合评价并提出相应建议。由文献分析可知,关于城市建设与发展的研究不少,但关于山西省城市建设与发展的研究少之又少,且大多只以山西省某一个市为例。因此,以山西省的11个主要城市为研究对象,通过主成分分析和聚类分析研究山西省各地区的城市建设与发展很有意义。

2 数据来源

本次报告的指标主要通过参考其他文献选取,最终选取的10个指标如下[5]。

x1常住人口数 (万人)、x2一般预算收入 (亿元)、x3住宅面积 (万m2)、x4卫生机构数 (个)、x5高速公路 (km)、x6中学个数 (个)、x7地区生产总值 (亿元)、x8农林牧渔业总产值 (亿元)、x9工业企业单位个数 (个)、x10国内旅游人数 (万人次)。本文所有数据均来自 《山西统计年鉴2019》[6],为山西省11个市2018年的城市发展主要指标。

3 理论阐述

3.1 主成分分析

主成分分析的基本思想是多个变量之间往往存在一定程度的相关性,可以通过线性变换将原始指标转换成少数几个相互独立且能反映原始数据绝大多数信息的变量,转换后的变量称为主成分。基本模型为

式中:F1,F2,…,Fn为提取的n个主成分;bpn为特征向量;N1,N2,…,Np为经过标准化处理后的数据;λ1,λ2,…,λn为特征根。

3.2 聚类分析

聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。简单来说就是分析如何对样品或变量进行量化分类,根据不同的分类对象,可以分为Q型聚类和R型聚类,Q型聚类是对样本进行分类处理,R型聚类是对变量进行分类处理[7]。

聚类分析依据的基本原则:直接比较样本中各事物的性质,将性质相近的归为一类,将性质差别比较大的分在不同类。也就是说,同类事物之间性质差异小,类与类事物之间性质相差较大。

系统聚类的基本思想:将距离相近的样本或变量先聚成类,距离相远的后聚成类,一直进行下去,直到每个样本或变量都聚到合适的类中。

本文主要采用系统聚类法,基本模型如下。

将每个单元看成一类,则单元i与单元j之间的欧几里得距离为

将距离最近的两个单元归为一类,然后通过离差平方和法进行两个族群间距离的计算,即

4 实证分析

4.1 主成分分析

由于各指标存在差异,因此在进行主成分分析之前先对数据进行标准化处理,然后用标准化后的数据进行主成分分析。

进行主成分分析之前,先进行KMO检验和Bartlett's球形度检验,检验结果见表1。可以看出,KMO检验值为0.649(>0.6),且标准化后的数据显著性为0(<0.05),因此判断其是适合做主成分分析的。

表1 KMO检验和Bartlett's球形度检验

公因子方差表 (见表2)给出了这次分析中从每个原始变量中提取的信息,从中可以看出除了高速公路 (km)信息损失程度略大外,主成分几乎包含了其余各变量至少90%的信息。

表2 公因子方差

从碎石图 (见图1)也可以看出,第一个主成分与第二个主成分,第二个主成分与第三个主成分特征值相差较大,其他特征值差值都较小,因此保留两个主成分就可以概括绝大部分信息。

图1 碎石图

解释的总方差见表3,从旋转后的平方和可以看出保留了两个主成分 (SPSS默认特征值大于1),第一个主成分的特征根λ1=4.193,解释了总变量的41.931%;第二个主成分的特征根λ2=4.124,解释了总变量的41.239%,前两个主成分的累计方差贡献率达到了83.170%,说明这两个公因子基本反映了原始变量的绝大部分信息,即这两个主成分可以代替最初选取的10个衡量山西省建设与发展基本情况的指标,分别记为F1,F2。

表3 解释的总方差

旋转后的成分矩阵表见表4,可以看出第一个主成分在 x1,x5,x6,x8,x9,x10上有较大的载荷,第二个主成分在x2,x3,x4和x7上有较大的载荷。

表4 旋转成分矩阵

表5为成分得分系数矩阵,可以得出两个主成分的表达式为

表5 成分得分系数矩阵

根据上面得到的主成分的线性方程,将标准化后的数据代入,得到综合得分与排名,见表6。

表6 综合得分与排名

在本次运用主成分分析方法对山西省各地区的城市建设与发展进行分析时,最后保留两个主成分因子。用这两个主成分因子来代替10个指标进行分析,将标准化后的数据代入所得主成分的线性方程中,得到各城市的综合得分与排名。综合得分为正值,说明该城市建设与发展高于平均水平,反之,综合得分为负值的说明该城市建设与发展低于平均水平。排名由大到小依次为太原、运城、晋中、临汾、吕梁、长治、大同、忻州、晋城、朔州、阳泉。

4.2 聚类分析

运用系统聚类分析方法,在聚类过程中,11个城市都参与了聚类,所以可以进行下一步分析。根据聚类的谱系图 (见图2)可以得出,若将样本聚为4类的话,可以得到最终聚类结果,见表7。

图2 谱系图

表7 聚类结果

综合主成分分析和聚类分析的结果,得到各市综合得分、排名与聚类情况,见第8页表8。

表8 综合得分、排名与聚类情况

5 结论

本文在对山西省各地区的城市建设与发展状况进行分析时,采用了主成分分析与聚类分析方法,根据表8各市综合得分、排名与聚类情况可以得到以下结论。

1)在调研的11个城市中,太原、运城、晋中、临汾和吕梁的综合得分是大于0的,说明这些城市的发展水平在平均发展水平之上,其他城市均低于平均发展水平,说明其城市建设与发展状况与前面的城市相比还有一定差距。

2)太原市作为山西省的省会城市,综合得分不出意外地排在了第一,与其他城市相比自成一类。运城综合得分排在第二,也自成一类,可以看出运城与综合得分第三的晋中综合得分相差较大,说明运城虽然发展比不上省会城市太原,但是相比其他城市还是拉开了一定差距。

3)晋中综合得分排在第三,晋中与省会相邻,所下辖的城市在多个方面都有着不错的发展。中心城区榆次区已经与太原中心城区相连,城市之间的交往也十分密切。晋中与临汾、吕梁、长治、大同、忻州和晋城归为一类,发展处于全省平均发展水平。朔州和阳泉的综合得分最低,归为一类。

猜你喜欢

晋中山西省聚类
晋中国家农高区无花果采摘正当时
山西省右玉县的生态建设及其启示
山西省秋收已完成93.44%
晋中市委统战部调研晋中国家农高区(山西农谷)
加快培育百亿企业 建好晋中国家农高区
山西省打开农产品供深通道
徐南平一行到晋中国家农高区调研
面向WSN的聚类头选举与维护协议的研究综述
山西省文联扎实开展“深入生活、扎根人民”主题活动
改进K均值聚类算法