基于因子聚类分析的地区综合发展水平评价研究
2014-03-22杜相,张韵,杨丹
杜 相,张 韵,杨 丹
(1.江西省政府投资项目评审中心,南昌 330046;2.青岛黄海学院,山东 青岛 266427;3.湘音文化艺术中心,长沙 410600)
基于因子聚类分析的地区综合发展水平评价研究
杜 相1,张 韵2,杨 丹3
(1.江西省政府投资项目评审中心,南昌 330046;2.青岛黄海学院,山东 青岛 266427;3.湘音文化艺术中心,长沙 410600)
文章依据区域发展理论,选择影响区域发展水平的主要因素,建立指标体系,对2012年全国31个省(市、自治区)的综合发展水平指标进行因子分析和聚类分析,依据因子得分和聚类结果,总结出城市发展水平的主要差异,并有针对性的提出城市综合发展策略,促进全国各地区持续、均衡发展。
区域综合发展水平;因子分析;聚类分析;评价研究
经济全球化的今天,城市间的竞争已难以支撑国家与国家之间的竞争,城市群成为带动中国区域经济发展的重要动力。我国实施的城市群发展战略无疑是要借助城市间互补优势提升城市整体发展水平。党的十八大报告提出了生态文明建设和美丽中国概念,表明了中国新型城市化发展的决心,就是要建设生态城市、优化城市空间布局。由此,对各地区综合发展水平进行比较分析、综合评价,从而有针对性地提出不同城市和区域的综合发展战略,无论是对各省份自身的发展,还是对周边地区的进步,都具有十分重要的意义,也可以为政府部门进行区域经济的宏观调控提供理论依据和参考。
一、地区发展水平及评价研究
近年来,有部分学者通过采用不同方法,选取不同指标对我国的城市发展水平进行了研究。但就目前文献来看,大多数研究集中在对城市化水平及城市发展潜力的评价方面,关于地区综合发展水平的评价研究则较少。杨上广、陈宗洵采用主成分分析方法(PCA),研究了全国35个中心城市的发展梯度及差异,总结出全国中心城市发展水平的空间地域分布规律,并提出了一些区域经济持续发展的建议;[1]黄康胜运用因子分析等方法,对中部的六大城市群现有经济发展现状进行了分析,结果表明武汉、长沙、郑州三市处于城市发展的第一梯度城市,其次为洛阳、南昌、合肥;[2]狄栋红选取了我国计划单列城市和省会城市的客运量、货运量、地方财政预算内收入、地方财政预算内支出、固定资产投资总额等17项指标,进行城市化进程分析,利用因子分析选取了几个有代表性的变量,然后赋予其权重对这些城市进行了综合排名。[3]由上述研究发现,因子分析方法在城市综合发展水平研究方面有很高的应用价值,并且研究结果的科学性也值得肯定。本文依据2012年的统计数据,同时使用因子分析和聚类分析方法,对我国31个地区综合发展水平进行量化评价,以期找出各地区的优势和不足。
二、评价模型构建
(一)模型原理
本文构建因子聚类分析模型,对我国31个地区的综合发展水平进行量化评价。模型首先通过因子分析法对评价指标进行有效降维,提炼出三个具有代表性的公共因子,并对各地区依据综合发展水平得分进行排名,然后以此三个因子作为聚类分析的输入,对地区按照发展水平进行分类,辨别各地区发展优劣势,提高分析精度,并比较两种方法所得结论与实际情况的符合程度,验证模型的科学性。
1.因子分析法
因子分析是处理多变量数据的一种有效的统计分析方法,其基本思想是通过较少彼此间互不相关的综合变量来尽可能地反映原来变量的信息,从而建立起最简洁、最基本的概念系统,揭示出事物之间最本质的联系。[4]
(1)因子分析模型
X=(X1,X2,…,Xp)是可观测随机向量,均值向量E(X)=0,协方差阵cov(X)=∑,且协方差阵∑与相关矩阵R相等(只要将变量标准化即可实现)。F=(F1,F2,…,Fm)(m<p)是不可测的向量,其均值向量E(F)=0,D(F)=Im,即F1,F2,…,Fm不相关且方差均为1。e=(ε1,ε2,…,εp)与F相互独立,且E(e)=0,e的协方差阵∑是对角阵,各分量e之间是相互独立的。cov(F,e)=0,即F和e是不相关的模型,称为因子分析模型,见公式(1)。
(2)因子方差贡献
(3)因子旋转
因子旋转是对因子进行线性组合,以期望找出实际意义更为明显的公共因子。因子旋转的目的要让每一个因子的因子载荷aij都要么尽可能接近0,要么尽可能大于0。[5]
(4)因子得分
计算因子得分则需要建立以下以公共因子为因变量,原始数据为自变量的回归方程,如(2)式:
2.聚类分析法
(二)评价指标体系构建
评价研究的关键是指标的选取和处理,如何构建科学、系统、全面的评价指标体系,是地区发展水平综合评价研究中首要解决的问题。地区综合发展水平评价指标体系,是度量一个地区综合发展程度的工具。为了使评价结果全面、准确、客观的反映现实,在选取评价指标时,需遵循系统性、典型性、独立性、有效性、可比性、可操作性、导向性以及动态性这八条原则。影响综合发展水平的因素有很多,为了科学合理地进行评价,在遵循上述原则的基础上,选取23项指标构建地区综合发展水平的评价体系,23项指标分别为:第一产业生产总值、第二产业生产总值、第三产业生产总值、地区生产总值、地区财政收入、地区财政支出、地区人口数、居民消费支出、就业人员平均工资、就业人数、邮电业务总量、社会消费品零售总额、人民储蓄存款、学校数、诊疗人次数、客运量、城镇基本医疗保险基金累计结余、货运量、电视节目综合人口覆盖率、广播节目综合人口覆盖率、全社会固定资产投资、电力消费量、城市建成区面积。
(三)样本选择与数据采集
本文研究对象为我国北京、天津、河北、山西、内蒙古、辽宁、吉林、黑龙江、上海、江苏、浙江、安徽、福建、江西、山东、河南、湖北、湖南、广东、广西、海南、重庆、四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆31个省(市、自治区),依据上述23项指标建立评价指标体系Xij。各指标数据来源于2012年《中国统计年鉴》,这样就构成了31个样本,23个变量的初始矩阵,如(4)式。
三、实证分析
(一)基于因子分析的地区综合发展水平评价
1.数据的无量纲化处理
对31个样本进行因子分析,首先需要对评价指标的原始数据进行无量纲化处理,以消除指标之间量纲的不一致和数量级的差异大等现象,依据下式对原始数据进行无量纲化处理(见表1),由于篇幅所限故只展示部分数据。
表1 指标数据预处理(部分)
(5)式中:Xij为第i个样本第j项评价指标的原始数据,Xjmax为样本第j项评价指标原始数据的最大值,Xjmin为样本第j项评价指标原始数据的最小值,Yij为第i个样本第j项评价指标的指标效用值。
2.因子方差分析
在对数据进行无量纲化处理的基础上,利用SPSS软件对31个样本的综合发展水平进行综合评价,因子方差分析结果表明:前3个因子变量的特征值均大于1,并且经过最大方差旋转后它们的方差贡献率分别为:44.004%、34.639%、 12.796%,累积方差贡献率达到了91.438%,说明前3个因子变量综合蕴含了原始数据23个评价指标所能表达的足够信息,因此选取3个公共因子。
3.因子定义
通过各因子旋转成分矩阵可以看出,具有较高载荷的因子变量很有规律地分布在若干关键评价指标上,说明它们之间有着明确的结构关系,意义清楚。据此,对因子变量进行命名和解释。
第1个因子变量包括:第二产业生产总值、第三产业生产总值、地区生产总值、地区财政收入、地区财政支出、居民消费支出、就业人员平均工资、就业人数、邮电业务总量、社会消费品零售总额、人民储蓄存款、诊疗人次数、客运量、城镇基本医疗保险基金累计结余、城市建成区面积。主要反映经济发展与社会保障方面情况,因此命名为经济发展与社会保障因子。
表2 城市综合发展水平得分排序表
第2个因子变量包括:第一产业生产总值、地区人口数、学校数、货运量、全社会固定资产投资、电力消费量,主要反映社会公共基础事业发展情况,因此命名为社会公共基础事业因子。
第3个因子变量包括:电视节目综合人口覆盖率、广播节目综合人口覆盖率。显然,可以命名为文化建设因子。
4.计算因子得分
依据因子得分系数矩阵,根据输出的因子得分系数,得到因子得分函数如(6)式。
5.综合发展水平的量化评价
由因子得分函数计算31个样本的因子得分。在综合发展水平的因子分析基础上,对31个样本进行综合评价。以选定的3个因子变量的方差贡献率作为权数,得到公式(7)。
计算31个样本综合发展水平得分,结果如表2所示。依据各个样本的发展水平综合得分及排序,将31个样本分为4个等级,如表3所示。
6.结果分析
从上述综合因子F的得分情况可以看出,各省综合发展水平存在明显差异。从分类情况可以看出广东、江苏、山东三省的综合发展水平较高,通常认为的北京、上海等大城市尽管经济发展水平较高,但是综合发展水平并不是最高,分类属于良好等级。
从单个公共因子得分来看,第一因子为经济发展与社会保障因子,广东、江苏、浙江、北京、山东、上海6城市第一因子得分较高,这与现实也是相符的,上述城市的经济发展水平和社会保障水平均处于我国前列。而安徽、陕西、黑龙江、宁夏、江西、吉林则得分较低,这些省份的城市在加快城市经济发展步伐的同时,应该注意提升社会保障水平。
第二因子为社会公共基础事业因子,山东、河南、河北、江苏、四川、湖南得分较高,表示这几个城市公共基础事业发展较好,尤其是山东、河南两个人口大省,教育发展一直位于中国前列。海南、宁夏、上海、天津、青海、西藏、北京几个地方的城市得分较低,需要注意的是,人口较少是此类城市得分低的一项原因,但是城市的公共事业发展中所存在的问题也不容忽视,尤其是城市交通和绿化。
第三因子为文化建设因子,天津、北京、上海、江苏、辽宁、河北、浙江得分较高,说明这些地方的城市文化建设较好。广东、青海、甘肃、西藏、贵州这几个地方的城市由于受自身经济、历史等因素影响,文化建设水平不高,需要加大文化基础设施覆盖率,大力发展经济的同时提升文化内涵。
(二)基于聚类分析的城市综合发展水平评价
在上述因子分析的基础上,将因子分析产生的新变量(因子得分)作为聚类分析的输入,即采用欧氏距离度量城市之间的相近程度,用Ward法对31个地区进行聚类。据此,31个地区可分为四类(见表4)。
从表4可以看出聚类分析能够较为准确地对城市按照综合发展水平进行排名和分类,分类结果与现实相符,而因子分析综合得分结果和聚类分析的结果也能够基本保持一致,说明因子分析和聚类分析的结果能互相印证,分析结论可信。
四、结语
本文通过因子分析和聚类分析发现,东部及沿海地区等经济较为发达的省份,城市基础设施、文化建设等水平较高,而中西部等经济落后的省份城市发展则相对落后。造成差异的原因是多方面的,有自然条件和历史原因的影响,但是更多的是改革开放以来,我国推行的梯度式非均衡的地区发展战略造成的。从聚类分析结果很容易看出,各省综合发展水平的差异主要是经济发展不均衡的结果。
表3 城市综合发展水平分类
表4 聚类结果表
针对城市发展水平的差距,我国政府应在保证国家宏观调控的前提下,依托新型城镇化战略的实施,继续贯彻落实西部开发和中部崛起战略,缩小区域性发展不平衡。依托市场主体,在政府适当引导情况下,充分发挥西部地区的环境、资源优势,优先开发公共设施和人才培养,要夯实发展基石。然后在制度上通过户籍改革,健全社保体系,完善收入分配机制等,努力增加国家预算内资金对中西部等经济欠发达地区城市建设、发展的投资比重,同时也要加大中央财政资金转移支付力度,加快这些地区经济发展,缩小与发达地区发展水平的差距,但是在强调西部发展的同时,也要进一步发展沿海城市经济,只有沿海城市发展了,才能进一步增强国家的经济实力,利用发展起来的沿海城市经济,支持和带动中西部城市的经济发展,从而实现国家的整体跨越式发展。
[1]杨上广,陈宗洵.全国中心城市发展水平研究[J].福建地理,2001(3):13-17.
[2]黄康胜.中部区域城市群综合发展水平比较研究[J].荆楚理工学院学报,2011(4):58-61.
[3]狄栋红.我国城市之间的发展水平差异研究[J].商品与质量,2012(5):45.
[4]阿孜古丽·阿不都拉.基于因子分析法—新疆城镇居民小康水平综合评价[J].经济研究导刊,2011(6):132-133.
[5]张浩.基于因子分析法和聚类分析法的副省级城市宜居情况聚类评价[J].电脑编程技巧与维护,2011(18):42-43.
[6]董梅生,张佳佳.基于因子分析与聚类分析的城市设施水平综合评价[J].安徽工业大学学报,2012(7):16-19.
(编辑:张薛梅 徐永生)
EvaluationResearchintoRegionalComprehensiveDevelopmentLevelBased onFactorAnalysisandClusterAnalysis
DU xiang1,ZHANG Yun2,YANG Dan3
(1.Government Investment Project Evaluation Center of Jiangxi Province,Nanchang 330046,China;2.Qingdao Huanghai University,Qingdao 266427,China;3.Xiang Yin Culture and Arts Center,Changsha 410600,China)
According to the regional development theory,this paper selects some main factors affecting regional development level to establish an index system.The indexes of comprehensive development level of 31 provinces in 2012 are studied through factor analysis and cluster analysis.On the basis of the factor scores and clustering results,the paper summarizes the main differences in the level of urban development,and puts forward some strategies of urban comprehensive development,so as to promote the sustainable and balanced development all over the country.
regional comprehensive development level;factor analysis;cluster analysis;evaluation research
F 272.5
A
1671-4806(2014)05-0046-06
2014-05-15
杜相(1989—),男,山东青岛人,硕士,研究方向为管理科学与工程、新型城镇化与城市发展;张韵(1990—),女,山东青岛人,研究方向为审计统计、纪检监察;杨丹(1988—),女,湖南长沙人,研究方向为音乐理论与实践教学。