基于因子分析与聚类分析的城镇化水平评价研究
2016-09-10程秋宜
【摘要】城镇化代表着经济发展、生活形态、国民意识的重大转变,其影响着经济、人口、社会、环境等多个方面。本文中,以江西省城镇化现状为基础,从经济发展、人口增长、环境发展三个方面出发,选取十四项评价指标构建城镇化综合质量评价体系。采用因子分析对十一个地级市城镇化水平进行衡量和排名,采用基于SOM神经网络的聚类分析研究江西省城镇化区域性差异。结果表明,各地级市城镇化水平差异显著,在全省范围内发展不平衡。
【关键词】城镇化 因子分析 SOM 聚类分析
自从1997年世界金融危机后,我国为保持经济快速发展提出了“扩大内需”口号,尤其是2008年世界金融危机和欧洲债务危机之后,“积极稳妥地推进城镇化”作为一种扩大内需的重要方法,已经被纳入了“十一五计划”并成为了一项基本战略。此后的十二五规划建议,根据大城市的发展情况,将中小城市作为中心,逐步形成影响力大的城市群对大中小城市和小城镇协调发展具有促进作用的局面[1]。
城镇化是一种过程,这是所有具有城市类景观特色和城市类运行模式的地区壮大的过程,包括城市,也包括未设市的城镇,并涉及经济、环境、人口、教育、社会等方面。因此,应根据科学性、系统性、可操作性、代表性的原则,建成综合指标体系,对城镇发展水平进行综合评价。
一、江西省城镇化近况
江西省地处长江中下游,是中部地区典型的农业大省,在历经了早期“昌九工业走廊”、“环鄱阳湖生态经济圈”、“振兴革命老区经济”等一系列建设后,江西省的城乡一体化进程已经得到了快速发展。近年来,江西明确了以“昌九”为核心的赣北城镇圈和以赣州为核心的赣南城镇圈这一发展规划,进而促进参与长江中游城市群的建设[2]。1949年新中国成立以后,江西省共经历城镇化开始、冲击停滞、稳步发展和快速发展等四个阶段。本文由因子分析和聚类分析两种方法,可以选取适当的指标,建立符合全面且系统化原则的、并能够对江西省城镇化水平进行全面评估的测度方法,对江西城镇化水平在未来的进一步战略性发展提出相应对策。
二、指标体系
纵观国内已有的对城镇化质量的研究成果,涂永强采取了十二个指标对山东省十七个地级市构建评价体系,通过因子分析和K-Means聚类分析评价了城镇化水平[3]。吴耀、牛俊蜻和郝晋伟运用因子分析模型,比较了陕西省与其他省份城镇化综合水平,并对陕西省内10个地级市进行了横向比较[4]。郝华勇从七个方面构建了区域城镇化质量评价体系,分析研究我国省域城镇化质量差异[5]。
为了科学、准确的描述江西省城镇化水平,本文从经济发展、人口增长、环境发展三个方面设计如下指标体系来对城镇化综合发展水平进行评价。
人口增长:包括城镇人口占总人口比重(x1)和卫生机构数(x2)这两方面。经济发展:包括人均国内生产总值(简称人均GDP,下同)(x3),第三产业生产值占国内生产总值比重(简称第三产业生产值占比,下同)(x4),第三产业就业比重(x5),第二产业生产值占国内生产总值比重(简称第二产业生产值占比,下同)(x6),城镇居民人均可支配收入(x7),第一产业劳动生产率(x8),城乡居民人均存款余额(x9),实际利用外资(x10)这八项。环境发展:人均绿化面积(x11),万人拥有公交车辆(x12),人均城市道路面积(x13),城市用水普及率(x14)。本文数据来源于江西省统计年鉴。
三、江西省城镇化差异评价
(一)因子分析模型
用互相独立的综合指标表达原有的绝大部分信息就是因子分析的核心。经过相关性分析提取因子后,进行Kaiser标准化的正交旋转,我们可以得到旋转后的因子载荷矩阵,旋转后的载荷矩阵可以更好的代表各变量对主成分的贡献。
如表1所示,基于累计贡献率大于80%、特征根值大于1的原则,提取因子F1,F2,F3,F4。
1.因子命名解释。我们共有14个评价指标,现在确定了四个主成分,我们可以对他们进行命名解释。
第一个主成分中,x1、x2、x3、x6、x7和x8有较高的载荷,可以认为第一个主成分反映了城镇经济发展和和人口发展的水平。
第二个主成分中,x10、x12、x4和x9的载荷较高。这反映了城镇居民生活水平的提升。
城镇化进程中,居民环境的重要程度主要靠第三个主成分中的x11、x13和x5这三个评价指标来进行评判。
x14是第四个主成分主要解释的内容。公共基础设施的改善和进步是市民拥有一个良好的生活环境的前提和保障。
2.计算因子得分。根据因子分析的结果,计算江西省各地级市的各主因子得分函数。
F1=0.159x1-0.222x2+0.162x3-0.078x4+0.054x5+0.215x6+0.124x7 +0.172x8+0.093x9-0.102x10-0.002x11+0.015x12+0.051x13-0.008 x14 (4)
F2=-0.003x1+0.118x2+0.066x3+0.165x4+0.042x5-0.146x6+ 0.102x7-0.055x8+0.221x9+0.331x10+0.215x11-0.071x12-0.119x13 -0.008x14 (5)
F3=0.036x1-0.051x2+0.106x3+0.032x4-0.237x5-0.047x6+ 0.077x7-0.123x8+0.042x9+0.091x10+0.486x11-0.121x12+0.376x13 -0.003x14 (6)
F4=0.145x1+0.111x2+0.007x3+0.294x4-0.124x5-0.027x6+ 0.066x7+0.016x8-0.167x9-0.072x10-0.279x11-0.087x12+0.185x13 +0.614x14 (7)
(二)综合评价
为了综合评价江西省十一个地级市的城镇化水平,在确定了综合因子的个数与具体解释后,我们对每个因子确定采用旋转方差贡献率作为权重:
F=0.35122F1+0.26529F2+0.15635F3+0.12392F4。
计算出综合评价值,如图1所示。
四、基于自组织特征映射神经网络的聚类分析
(一)SOM神经网络基本原理
芬兰学者KOHONENT于1981年提出了自组织特征映射(称为SOM)神经网络[6]。作为一个自我学习的分类方法,SOM可以很好的弥补传统聚类方法对数据结构有严格要求(比如无相关性等)这一缺点,能够利用自身强大的自组织性、自适应性和稳健性处理复杂的非线性分类问题。
关于SOM的应用,国内已经有了一些例子。杨黎刚和苏宏业等人运用SOM模型对电信公司客户人群进行分类,利用SOM算法不用事前确定聚类数目的优势,从17个行为属性出发,将9820个客户样本聚为4大类,分析了这四个聚集客户群的特征及差异[7]。杨柳、白钊等人使用SOM模型对我国2012年177个机场进行了有效的空间聚类和分类评估,得到了与一般分类方法相比更科学合理的结果[8]。徐志超、梁艳春、时小虎对上市公司进行了SOM聚类分析,数值模拟表明,该模型对于上市公司的聚类结果令人满意[9]。朱光、朱学芳选取图书馆用户个性化服务内容需求的评价指标,对2012年发放得到的有284份有效问卷得到的各项需求度进行聚类分析,实证效果较好[10]。本文此处利用SOM模型对江西省各地级市的城镇化水平进行聚类,以得到有效的实证结果。
(二)SOM神经网络数学模型
SOM神经网络通过网络的自训练,在每一次的迭代过程中不仅调整获胜神经元的权值,也会调整其邻域中的神经元。通过不断的输入样本,找到获胜神经元,同时调整邻域神经元这一迭代过程,实现输出结果。
1.SOM神经网络的训练结果。本文要对十一座城市关于十四项城镇化评价指标进行分类,将其分为3类:高水平的城镇化、中等水平的城镇化、较差水平的城镇化。根据SOM神经网络的训练规则,输入层为14个神经元,输出层为3个神经元。该模型的参数,我们定义学习速率为0.01,训练次数为1000,其余的参数是默认值。利用MATLAB工具箱中的SOM函数来训练自组织特征神经网络,分类的结果如图2所示。
五、因子分析与聚类分析的综合结果
(一)分类结果
结合前面进行的因子分析,我们对每类城市分别计算四个综合因子的均值。
B类城市各项综合指标的平均值总体来说是最高的,A类次之,C类最低。因此,我们可以得到结果,南昌市、景德镇市、萍乡市、新余市是城镇化高水平类城市,九江市、赣州市、上饶市、吉安市是城镇化中等水平类城市,而鹰潭市、宜春市、抚州市是城镇化较差水平类的城市。
(二)产生差异的原因
根据以上的因子分析与聚类分析两种分析的综合结果,可以看到江西省各地级市的城镇化水平是存在较大差异的。位于赣中西部的新余市综合评估居于全省之首。近年来,江西省委、省政府确定新余市为全省统筹城乡经济社会发展一体化的试点市,新余市的城镇化水平在全省范围内比较领先。南昌市紧跟在新余市之后,综合得分排名全省第二,与新余市的综合得分差距不大。南昌市是江西省省会,紧邻鄱阳湖,依靠着省会城市的优势,南昌市的城镇化水平近年来得到了快速提高。新余市、南昌市萍乡市与景德镇市都属于江西省的发达城市,根据其特有的经济条件和自然条件,这四座城市在江西省城镇化的进程中占据了不可忽视的地位。
九江市是省域副中心城市,在政治、经济、文化、科技和教育的地位上仅次于南昌。由于其著名的“鱼米之乡”称号,九江市的商业贸易也非常发达,同时文化教育方面居于全省之首,良好的教育基础以及经济发展为九江有力的推动了城镇化发展。赣州市属于赣南地区的中心城市,是江西省面积最大、人口最多的城市,但由于重点发展工业,会带来一些污染以及生活环境上的影响,因此城镇化进程相对于高水平类城市要落后一些。吉安市在上述分析结果中,归于中等水平城市类,相较于九江市,吉安市没有足够的人口优势及产业优势,尤其是第二、三产业,在人文教育的资源方面也并不突出,但由于吉安市辖井冈山市,因此在旅游资源方面有一定的优势,可以部分带动城镇化进程。
鹰潭市、宜春市、抚州市这类城市由于没有特色的产业拉动城镇化,地理位置并不突出,因此城镇化水平属于全省较落后的情况。
六、结论与讨论
(一)主要结论
基于主成分分析法的因子分析较好的拟合了江西省城镇化的总体水平,并根据SOM神经网络的聚类分析对江西省各地级市的城镇化水平进行了分类评价,得出江西省各地级市的城镇化水平有很大的不同。深究其中,我们发现江西省的北部与西部城镇化发展较好,而赣东南区域的城镇化水平较低。整个江西省城镇化水平呈现出发展不平衡、差异较大等问题。
(二)对策与建议
对于以上问题,我们提出几点建议。
1.发挥中心城市的聚集作用。根据过去的经验,规模大、发展好的城市能够有显著的聚集效应。即一旦一个城市成为了大规模城市,就业增多、经济迅速发展、公共设施完善后,会带动周边城市或者小城镇产生相同的正向发展影响,其城镇化水平也会相应的辐射到周边地区。因此,应该大力发展好以南昌市、九江市为中心的赣北地区的综合水平,通过昌九对周边地区的影响力将城镇化区域扩大,力争把整个赣北地区全面带动起来。
2.均衡发展城市的各方面。新余市虽然不是省会城市,但它的城镇化水平居于全省之首,最主要的原因就是因为新余市近年来注重城镇化各个方面的水平全面提高,包括政府大量投资、创造大量就业机会、吸引本地农民工直接进程就业等。相比而言,赣州市虽然占据毗邻广东省的地理优势,但是由于其产业过于单一化,所以城镇化水平在全省范围内大大低于平均水平。全面推进城镇化主要是指应该从经济、人文、科教、公共设施等方面进行同步完善,把各方面做到齐头并进,以此更高效率的提高城镇化水平。
3.发挥自己的长处和有利条件。各个地方的经济发展、人口分布、交通、资源储备都有差异,发展城镇的条件和优势不一样,但可以根据自己特殊情况入手,依据其特有的资源、优势来确定发展方向和规模。赣州市可以大力发展脐橙产业,引进外来技术提高第一产业的劳动生产率,进而提升第二、三产业,提供更多的工作机会。抚州市可以利用其优良的教育资源,吸引优秀的人才来到当地就业,同时大力发展相关的人文旅游行业,推动经济发展,扩张建设城镇化。
4.拉动第二、三产业。由于现代化工业技术水平的完善,第一产业的劳动效率逐渐增加,第二、三产业的蓬勃发展能够吸引大量的就业人口和劳动力,同时刺激城镇人口的消费,拉动内需,积极促进农村人口向城镇进行转移,缓解农村的人口环境压力。例如,抚州市、宜春市等低水平城市应该着重发展第二、三产业,抚州市由于绿化出众,可以通过刺激内需和吸收外地人群的消费来增强城镇的辐射影响力,开发新型旅游方式,大力宣传旅游线路,利用自身特色吸引更多的外地游客。
参考文献
[1]李强,陈宇琳,刘精明.中国城镇化“推进模式”研究[J].中国社会科学,2012,07:82-100,204-205.
[2]刘治彦.江西城镇化发展思路与对策[J].江西社会科学,2014,(1):62-66.
[3]涂永强.基于因子分析和聚类分析的山东省城镇化水平的测度[J].知识经济,2012,(7):83-93.
[4]吴耀,牛俊蜻,郝晋伟.区域城镇化综合发展水平评价研究——以陕西省为例[J].西北大学学报,自然科学版,2009,39(6):1042-1047.
[5]郝华勇.基于主成分分析的我国省城城镇化质量差异研究[J].中共青岛市委党校青岛行政学院学报,2011,5:27-30.
[6]KOHONEN.T.The self-organizing map[J].Proceeding of IEEE.1990,78(9):1464-1480.
[7]杨黎刚,苏宏业,张英等.基于SOM聚类的数据挖掘方法及其应用研究[J].计算机工程与科学,2007,08:133-136.
[8]杨柳,白钊,张婷.基于SOM的我国民用机场分类研究[J].交通运输工程与信息学报,2015,01:80-84.
[9]徐志超,梁艳春,时小虎.基于SOM网络的股票聚类分析方法[J].计算机工程与设计,2008,29(9):2426-2428.
[10]朱光,朱学芳.基于SOM的图书馆用户个性化数字信息服务需求分类研究[J].情报科学,2013,02:88-91.
作者简介:程秋宜(1992-),女,汉族,江西九江人,硕士研究生,研究方向:金融工程与风险管理。