APP下载

基于K-means聚类分析算法的浙江省各地级市经济实力现状比较研究及可视化

2018-12-03黄辉林孙利亚庄亮亮

关键词:浙江省聚类经济

黄辉林,孙利亚,庄亮亮

(温州大学数理与电子信息工程学院,浙江温州 325035)

1 问题背景及研究方法介绍

众所周知,国民经济指标对于宏观经济的分析调控有着重要的参考作用.实现国民经济的协调发展,不仅需要优化产业结构,还要求建立合理的地区经济结构.地区经济结构,是指国民经济中各地区之间的发展关系和综合状况.优化地区经济结构,就是要求生产要素在各个地区之间合理配置,使各个地区在全省国民经济整体活动中能够充分发挥各自的优势,并能相互补充,相互配合,共同协调一致地发展.改革开放以来,浙江省经济的发展速度和规模都取得了骄人成绩.作为经济大省,浙江省各地级市的经济发展水平存在显著差异,本文将对浙江省各地级市的经济发展不均衡现状进行研究和评价.

关于区域经济发展现状比较的研究,国内学者已有部分结果.吴世斌[1]基于《中国统计年鉴》(2008)的数据,采用主成分分析与聚类分析相结合的集成方法,对中国 30个省市的区域循环经济发展水平进行了研究,找出了各省市在循环经济发展中的优势与不足,从整体上分析了我国区域循环经济的发展状况,为国家调整循环经济发展战略提供了有效的参考依据.郁利燕[2]以17个沿海城市作为研究对象,并通过对这17个沿海城市循环经济发展水平进行主成分和聚类分析,得出了各城市的循环经济发展水平综合情况.黄炎磊[3]提出利用主成分分析和聚类分析的方法对广东省居民可支配收入进行评价分类,将 17个主要城市的可支配收入作为样本,利用主成分分析和聚类分析结果对其进行了综合评价.

本文拟选取2015年浙江省11个地级市的包括年末总人口、GDP、第一产业、第三产业与第二产业的产值比、人均生产总值、地方财政收入等 11个反映地方经济发展水平的国民经济主要指标,对温州市与浙江省其它 10个地级市的经济发展水平进行横向比较研究,拟建立 K-means聚类分析模型,将浙江省 11个地级市划分为发达地区、中等发达地区、欠发达地区三个层次,总结归纳各个类别的优势和不足,为各地方政府制定相关政策提供决策参考,争取实现资源的合理配置,缩小各地区经济发展水平的差异.

K-means法(又称快速聚类法),是由Mac Queen于1967年提出的,它将数据看成K维空间上的点,以距离作为度量个体“亲疏程度”的指标.一般地,K-means法易于产生指定类别数的聚类结果,而类数的确定离不开实践经验的积累.聚类分析算法的基本步骤如下[4-5]:

1)指定聚类数目K;

2)确定K个初始的聚类中心;

3)根据最近原则进行聚类:分别计算每个样本到各个聚类中心的距离,将对象分配到距离最近的聚类中心所代表的类中;

4)所有对象分配完成后,重新计算K个聚类的中心;

5)与前一次计算得到的K个聚类中心比较,如果聚类中心发生变化,转3,否则转6;

6)重复上述过程,当质心不发生变化时停止并输出聚类结果.

一般地,针对连续属性数据,我们使用误差平方和SSE作为度量聚类质量的目标函数,对于两种不同的聚类结果,选择误差平方和较小的作为分类结果.记Ei表示第i类样本集合,ei表示第i类样本中心,连续属性的SSE计算公式为:

2 基于K-means类算法的浙江省11个地级市经济发展现状分析

2.1 数据选取

通过查询浙江省2016年统计年鉴①浙江省统计局.2016年浙江省统计年鉴[M].2016.,我们选取了反映浙江省国民经济发展现状的11个主要指标,具体指标符号及数值分别见表1和表2.

表1 各个指标符号对应表Table 1 Corresponding Table for All Indicators

表2 2015年浙江11个地级市各经济指标数值表Table 2 Numerical Table of Economic Indicators for 11 Prefecture-level Cities of Zhejiang in 2015

2.2 浙江省11个地级市经济结构分析的K-means聚类模型实证分析

根据经验,我们利用R语言中的K-means将表2中的数据分成三类,其中三类的类中心坐标和样本分布情况如表3所示,经过计算,发现组间离差平方和与总的离差平方和之比为92.2%,这说明K-means聚类分析解释效果很好,也说明各类之间差异显著.

表3 三类的类中心坐标和样本分布情况表Table 3 Class-center Coordinate III and Sample Distribution Sheet

从图1可以看到各个类的成员分布情况,结合表3发现每一类的样本占总样本的百分比分别为18.18%,45.45%和36.36%.再结合表3中的各类中心坐标结果,将各类样本分布及各类的特点归纳如下:

第一类为经济发达地区:杭州、宁波.特点是其经济发展水平高,特别地,其地区 GDP总量、社会消费品零售总额、全社会固定资产投资以及城乡居民年末存款余额发展水平遥遥领先.

第二类为中等发达地区:嘉兴、绍兴、温州、金华和台州.特点是经济发展水平各个指标在浙江省处于中等发展水平,但是其地区GDP产值均值只有3 911.610亿元,不及第一类经济发达地区平均值9 026.910亿元的二分之一.除了城乡居民人均可支配收入比、第一产业(亿元)、第三产业和第二产业产值比以及人口指标外,其它各项经济指标几乎均在第一类地区的二分之一左右徘徊.

第三类为经济欠发达地区:湖州、舟山、衢州和丽水市.特点是其经济发展水平相对落后,和第一层次、第二层次相比,各个指标的发展规模较为落后,与前两个层次的差距突出.特别地区 GDP(X2:亿元)、年末就业人数(X3:万人)、社会消费品零售总额(X4:亿元)、地方财政收入(X7:亿元)、城乡居民年末存款余额(X8:亿元)等指标在数值上几乎只有中等发达地区平均值的三分之一,其出口总额(X6:亿美元)只有中等发展水平地区均值的五分之一.

从图2可以看到各个类之间聚类变量的差异性,其中差别比较显著的变量为:GDP(X2)、社会消费品零售总额(X4)、全社会固定资产投资(X5)、城乡居民年末存款余额(X8).

图1 聚类成员分布图Fig 1 Distribution Diagram of Cluster

图2 各类聚类变量均值的变化折线图Fig 2 Variation Line Chart for the Mean Value of Cluster Variables

图3 给出了浙江省11个地级市经济发展现状的聚类分析结果可视化绘图,该图也清晰地呈现了各类样本的分布情况,颜色由深到浅分别代表经济发达区域、中等发达地区和欠发达地区.

为了验证上述 K-means聚类分析结果的合理性,对表2中的数据进行了K-medoids聚类分析,经比较发现对表2中的数据进行K-medoids聚类分析可以获得与 K-means聚类分析同样的分类结果,这也从方法论上证明了上述分类结果的科学性和可靠性.

3 结论和建议

发展浙江省各地区经济,优化浙江省地区经济结构具有十分重要的经济意义和战略意义.其主要意义在于以下几个方面:

图3 聚类结果可视化Fig 3 Visualization of Clustering Results

1)浙江省各地区经济可持续性协调发展是浙江省全省经济发展的重要条件之一.只有充分发挥各地区的特点和优势,充分利用各地区的人力资源、自然资源以及物质技术条件,加速各地区的经济发展,才能促进整个浙江省总体经济的良好发展.

2)各地区经济的可持续发展可使各地区能更好地相互学习先进的发展理念和经验,相互取长补短,和谐发展,从而发挥浙江省整个经济体的整体优势.

3)各地区经济的协调发展是浙江省消灭贫困,使浙江省全省人民的生活达到全面小康水平,最终实现浙江省共同富裕的必不可少的条件.

4)加快浙江省欠发达地区的经济发展,对于保持整个浙江省的社会安定,巩固浙江省前期经济发展的有效成果具有特别重要的意义.

鉴于此,我们提出发展浙江省各地区经济的相关建议:

1)作为浙江省经济实力最强的区域,杭州和宁波应该继续加强经济发展和各产业发展的动力基础,实现经济的飞速发展,为浙江省的全面良性发展树立起标杆和旗帜.

2)嘉兴、绍兴、温州、金华和台州,作为浙江省经济发展的后续发展生力军,其经济发展和产业发展的动力基础颇为雄厚,民营经济发展尤其活跃,这也极大地促进了这些区域产业经济的迅速发展.为实现这些地区产业经济的可持续性健康快速发展,该类地区应加强区域开放程度,注重引进外资,加快产业发展.同时应扩大内需,刺激消费,加大科技投入,借助资源优势,优化产业经济发展的动力基础和外部发展环境.

3)湖州、舟山、衢州和丽水市.这类地区的对外开放程度最低,产业经济发展的动力基础也较为薄弱,社会消费基础较差,但内部资源环境基础较强,政府应进一步加大对该类地区经济的财政支持力度,通过给予资金和政策支持,提高整个浙江省循环经济产业带的现代化水平.

4)加强区域间合作.各市的区域发展各有特点,应加强沟通,互通有无,实现优势互补.区域间合作会产生全省范围的协同效应,从而提高全省整体的经济发展水平.数据分析结果反映了区域经济发展的不平衡性,建议加大区域性优惠政策的空间转移力度,倾斜公共投资,以改善落后地区的基础设施现状,引导和促进浙江省相关产业向西南山区转移,把东部、中部地区和山区发展成为浙江省的产业协作配套基地,完善和创新浙江省东部、中部区域和山区的合作机制,使浙江省经济平衡、协调发展.

猜你喜欢

浙江省聚类经济
“林下经济”助农增收
《初心》
增加就业, 这些“经济”要关注
浙江省第一测绘院
基于K-means聚类的车-地无线通信场强研究
2018年浙江省高中数学竞赛
2017年浙江省高中数学竞赛
民营经济大有可为
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现