APP下载

重庆市各区县综合发展水平差异分析
——基于SPSS主成分分析法和聚类分析法

2017-04-13汤弟伟

关键词:万州区区县重庆

常 胜,秦 浪,汤弟伟

(湖北民族学院生物科学与技术学院,湖北恩施445000)

重庆市各区县综合发展水平差异分析
——基于SPSS主成分分析法和聚类分析法

常 胜,秦 浪,汤弟伟

(湖北民族学院生物科学与技术学院,湖北恩施445000)

重庆作为我国中西部唯一直辖市,在西部大开发战略和长江经济带建设的推动下,整体发展正在迈入一个全新阶段.但是,重庆的城乡区域差距和城乡二元结构依然存在.研究发现,其辖区内各区县发展并不协调,贫富差距仍然较大.基于SPSS统计分析软件,运用主成分分析法和聚类分析法分析了重庆各区县综合发展水平差异情况,为决策者更好的制定各区县的发展规划提供参考和依据.

重庆;SPSS统计分析;主成分分析;聚类分析;综合评价;区域发展差异

近年来,重庆以其良好的发展态势、发展速度以及发展成果吸引了国内外的密切关注,作为一个山地城市,为何发展如此之好,各地前来学习经验的络绎不绝.国家发展战略的支持,高速增长的资本投入,丰富的自然资源,辉煌的巴渝文化以及优越的地理位置都成为重庆发展的法宝.但重庆毕竟是一个山城,城市发展空间受到了地理条件的限制,特别是辖区内的部分区和几乎全部县都处在大山中,与城区的发展相当不平衡.因此,对重庆各区县发展水平的差异情况做一个科学评价是有必要的,它能够帮助决策者制定更好的决策和战略,有利于今后的长期发展.通过主成分分析法和聚类分析法的分析解释,能够得到重庆各区县现阶段的发展水平状况,以及其在整个区域发展中的位置,进而帮助决策者充分认识到自身的优势和不足以及今后将要着重发展的方向.当前正是“十三五”开局的热身期,对重庆各区县发展差异的综合评价既是一次阶段性总结,也为更好的发展“十三五”打下基础.

1 研究方法

本文首先通过主成分分析法,利用SPSS统计分析软件对指标体系中的原始数据进行初步分析,确定主成分和成分得分比重,最后通过计算得到各区县的得分情况并进行排名分析.然后再对数据进行Q型聚类分析,按照各区县的关联程度对区县进行分类,并与主成分分析的结果进行比较得出最终的分析结果.

1.1 主成分分析法

1.1.1 方法原理概述.影响一个地区发展的因素有很多,涉及到政治、经济、文化、历史、资源、区位等,因此在做处理分析时会用到很多指标变量,数据庞大,分析复杂,且各变量间往往存在一定的相关性,数据反映的信息经常会有重叠,因此人们希望能够找到用少数彼此互不相关的综合变量来尽可能多的反映原来变量信息,以达到数据简化的目的[1-2].

因子分析就是用少数几个因子来描述多指标变量之间的联系,用少数几个因子来反映原始数据的大部分信息的统计学分析方法.主成分分析(Principal Component Analysis,PCA)是因子分析的一种类型,它通过坐标变换,将原有的多个指标变量,使用线性运算转换为另外一组不相关的变量.选取前面几个方差最大的主成分,达到分析较少指标变量个数的目的,同时又能用较少的变量反映原有变量的绝大部分信息[1],而且主成分分析法应该用相当的广泛[3-7].

1.1.2 评价指标体系构建.依据指标选取的科学性和系统性原则,本文从经济、文化、生活、基础建设等方面选取了18个指标(见表1)进行主成分因子分析,并根据分析结果进行进一步计算与解释,得出综合排名情况.其分析数据全部来源于重庆市统计局《重庆统计年鉴2014》[8].

1.2 聚类分析法

聚类分析的实质是能够将一批样本数据按照它们在性质上的关联程度且在没有先验知识的情况下自动进行分类.可以说聚类分析是一种探索性的分析,在分类之前,不必事先给出一定的分类标准,聚类分析能够从样本数据出发,自动对数据进行分类[9-11].

(1)专创型师资的多渠道培训。①充分利用现有的KAB、SYB、创新创业教育联盟及其他机构等开展的创新创业培训;②国内开展创业教育较早的学校已形成了相对成熟的创新创业教育体系,如清华大学、南开大学,政府可以选取一些典型高校设立固定的国家级培训基地,为其他院校的教师提供创业教育进修学习的机会;③利用政策支持的出境进修和学院本身已经形成的与国外高校的合作关系推进教师访问学习。这些“走出去”的培训方式对学院现有市场营销师资队伍而言,因经费限制等关系覆盖面相对较小。因此,“请进来”的培训方式,能更具有针对本校教师需求情况展开,类似“行健讲坛”系列,邀请知名的创业教育专家、风险投资人等开展系列培训。

本文采用系统聚类分析中的Q型聚类分析,聚类方法采用组间联接,据此将38个区县分为两大类.分析数据采用表1的各项指标数据.

图1 重庆市区位图Fig.1 Location map in chongqing

表1 区域综合发展评价指标体系Tab.1 The evaluation index system table

表2 研究区域Tab.2 The study area

2 研究区域

本文选取重庆辖区内的所有区县为主要研究对象.重庆现行有38个区县(见表2).重庆位于我国内陆西南部,地处武陵山、大巴山、四川盆地的交界处,区内多山地丘陵,其中山地占76%,有“山城”之称.重庆与陕西、四川、云南、贵州、湖南、湖北六省毗邻,是承接东西部的重要省市,地理位置十分突出;“黄金水道”长江穿境而过,航运发达;国土面积8.24万km2.到2014年底,重庆市常住人口2991.40万人,城镇化率59.6%.辖区内少数名族众多,主要分布在秀山等4个民族自治县,发展较为落后.

3 数据结果分析

3.1 主成分分析的数据处理结果

通过SPSS分析软件,对38个区县的18个指标因子进行分析后得出了影响重庆市各地区发展的几个主要成分的特征值、贡献率和累计贡献率以及其它分析结果.

3.1.1 公因子的提取及选择.经过旋转平方后得到的累计方差贡献率达到了87.760%,即反映了原有信息的87.760%,按80%的标准来看,说明因子的提取效果很好,因此我们可以暂时选取这4个主成分作为影响重庆市各区县发展的主要因素,解释的总方差表见表3.

表3 解释的总方差Tab.3 Explain the total variance

碎石图特征值的大小代表了主成分的方差贡献率大小和重要性程度.从碎石图可以看出,从第4个因子开始后面的曲线开始变得平缓,最后接近一条直线,据此可以初步确定抽取前4个因子作为主要因子,碎石图见图2.

通过SPSS对以上数据的处理分析,可以初步确定选取前4个因子作为影响重庆市各区县发展的主要因子,对4个因子的进一步处理分析能够最终得出合理的结论.

3.1.2 主成分因子重命名.经过SPSS继续分析后得到旋转成分矩阵表,旋转成分矩阵表记录了经过旋转后的每个变量在4个主成分上的载荷矩阵.旋转之后的因子载荷矩阵中各变量根据负荷量的大小进行了排序,这样更容易得出原始指标是接近哪个主成分变量,也便于对主成分进行命名和解释[1].下面根据旋转后的成分矩阵表,对因子进行归类重命名以及进一步分析,旋转成分矩阵表见表4.

主因子F1与人均地区生产总值、城镇非私营单位就业人员年平均工资、卫生技术人员、城市化率、城镇居民可支配收入、公共财政预算收入、社会消费品零售总额、地区生产总值、卫生机构床位数、房屋建筑竣工面积10个指标具有较大的相关性.其方差贡献率最大为40.079%,反映的是综合经济发展状况,可以定义为综合经济因子.

图2 碎石图Fig.2 Gravel figure

表4 旋转成分矩阵Tab.4 Rotating component matrices

表5 成分得分系数矩阵Tab.5 Component score coefficient matrix

主因子F2与普通中学在校学生数、总人口、普通中学专任教师人数3个指标变量有较大相关性,其方差贡献率为21.418%,反映的是科教文化水平,定义为科教文化水平因子.

主因子F3与工业总产值、进出口总值、商品房销售面积、全社会固定资产投资四个指标变量具有较大相关性,其方差贡献率为19.201%,与经济发展活力有关,可定义为经济活力因子.

主因子F4与规模以上工业能源消费总量有较强的相关性,其方差贡献率为7.063%,反映的是工业发展潜力,代表一个地区工业发展状况,可定义为工业发展因子.

3.2 主成分得分结果分析

3.2.1 主成分得分及区县排名情况.根据成分得分系数矩阵表(见表5)中每个指标的得分可以得出最终的主因子得分方程.通过得分方程计算的得分可以对主因子进行进一步的分析解释.由表5可以列出4个主成分因子的得分方程:

式中的X1,X2,…,X18为通过SPSS标准化处理后的数据.通过计算得到4个主成分的得分及各区县单因子排名情况见表6.

3.2.2 各区县单因子得分分析.从单项排名可以看出,各个区县所具有的优势因子各不相同,从综合经济因子来看,排名前三为渝中区、江北区、九龙坡区,基本分布在主城区及其周围,与社会发展常理相一致,城市具有优越的区位条件和区位优势.同时,主成分一的方差贡献率最大为40.079%,最能够反映真实情况,即在各单项排名中最具说服力.科教文化因子排名与经济因子排名出入较大,排名前三为万州区、开县、云阳县.由于科教文化因子与总人口数有很大关系,而这三个地区的总人口都超过了130万,优势明显.经济活力因子排名除渝中区外与综合经济因子排名相似,而渝中区由于地处市中心,经济发展已达到峰值并于趋于饱和,因此在当前发展模式下,经济发展难以出现根本性变化,所以经济活力排名低.从工业发展因子排名看,排名靠前的并不在主城区,而是分布在主城区周围的区县,随着城区内地价的逐步提高,工业成本加大,同时为贯彻落实可持续发展和科学发展的政策,经济发展要求与环境相协调,特别是对城市环境的要求进一步提高,所以工业布局向城区外迁移[12].

表6 主成分指标得分及区县排名情况Tab.6 Principal component index scores and rankings in counties

3.2.3 各区县综合得分分析.每一个主成分从不同的角度反映了影响重庆各区县发展的情况,但仅通过单个因素的比较,难以作出一个综合的评判,数据复杂,且同一个地方的每个主成分因子排名各有不同,所以需要对各因子做加权求综合得分,再进行比较.这里将每个主成分的特征值在总特征值中所占的比重作为权重数计算综合得分[13].

4个主成分经过旋转平方后的特征值分别为7.214、3.855、3.456、1.271以此得到4个因子的权数分别为0.457、0.244、0.219、0.080,从而得到综合得分公式:F=0.457F1+0.244F2+0.219F3+0.080F4.通过公式计算得到重庆各区县的综合得分及排名情况见表6.

从综合得分情况来看,可以得出两个差异特点:从区位上看,西部发展优于东部;从行政区划上看,区的发展优于县的发展.从得分排名可以看出,排名靠前的分别是万州区、渝北区、渝中区、九龙坡区、沙坪坝区等位于主城区内或者城区周围的地区(万州区除外),这些地区的综合竞争力最强,是最具有发展势头的地区.从区位图上可以看出,这些地区基本上全部位于西部地区,以长寿区、涪陵区、武隆县为界,界限以东发展较为落后.在所有的区县中,综合得分大于0的有17个地区,其中只有一个县,开县位列其中,说明重庆的区县发展并不协调,区县发展差异显著,区的发展要比县的发展好很多.

在综合排名里,万州区排名第一,有点出乎意料,但细细分析万州区自身所拥有的发展条件和发展情况来看,能够排名这么好也在情理之中.

万州区地理区位独特,为渝东北、鄂西南、陕南的重要物资集散地,与湖北恩施一道成为承接中西部的“节点性”城市,东有武汉城市圈的辐射带动,西有重庆市的直接影响,交通便利,是拥有机场、铁路、高速公路、深水港码头、高速铁路的一个交通枢纽城市.万州辖区面积大,在所有区县中排名第7,人口170多万排名第一,劳动力资源丰富;城市建设规模在重庆各区县中除主城区外为最大,至2014年底,城市建成区面积62.5km2,城镇化率61.11%,高出重庆市1.51个百分点.2014年,万州区实现地区生产总值771.22亿元,增长11.1%,比全国、重庆市分别高3.7和0.2个百分点[13].

3.3 基于聚类分析法的结果分析

在上述因子分析的基础上,将各指标数据变量再进行聚类分析,可以将各区县分为两类.

表7 群聚成员表Tab.7 Cluster member list table

聚类分析结果如表8所示.从表8中可以看出聚类分析能够较准确的对区域发展水平进行科学分类,分类结果与实际相一致,当然前提要选取适当的聚类分析方法和科学参数,因为聚类分析使用的方法与参数不同,往往会得出不同的分类结论.同时可以看出,聚类分析结果和主成分分析的综合得分排名能够基本保持一致,两种分析可以相互印证,说明分析有效,可信度较高.

图4 使用平均联接的树状图Fig.4 Use the tree of the average connection

4 总结

本文通过运用主成分分析法和聚类分析法,利用SPSS统计分析软件,对重庆各区县的综合发展情况进行了一系列的分析评价,发现重庆虽然整体发展呈现良好态势,发展势头迅猛,但其内部各区县发展差异大,东西部发展矛盾比较突出.以重庆市主城区为中心向外延伸,发展差距逐渐拉大,且发展倾向于区的发展而忽视对大多数县发展的重视,导致多数县的发展远落后于区的发展,特别是一些东部边远地区的县,如城口县、巫溪县、酉阳县等,经分析看,它们在各方面发展都比较落后.本次分析,万州区作为一个新亮点出现,值得去思考,给其它各区县的发展做了一个“榜样”[15].

表8 各区县综合发展水平分类Tab.8 Comprehensive development level in each district and county of classification

本文分析也有不足之处,例如万州区的人口占绝对优势,而科教文化因子由于与最开始选取的总人口因子,在校学生人数因子和专任教师人数因子有很大相关性,所以万州区在科教文化因子占的优势很大,排名第1,此为在最开始选取指标因子时考虑不周.另外,影响一个地区发展的因素还有很多,本文只从其中的一部分选取指标,虽然具有代表性,但也不够全面,也没有做前后的对比分析,不能够反映地区的动态变化.在以后的分析中,需着力把握动态发展,因为一个地区的发展是不断变化的,需要时时跟踪研究,更有利于决策者的决策,同时在研究方法上也要不断创新,不断探索更好更科学的分析方法.

[1] 尹海伟,孔繁花.城市与区域规划空间分析实验教程[M].南京:东南大学出版社,2014:178-193.

[2] 崔功豪,魏清泉,刘科伟.区域分析与区域规划[M].北京:高等教育出版社,2006.

[3] 赵高长,覃飞.基于主成分分析的高校排课算法研究[J].长春大学学报,2015,25(2):45-51.

[4] 徐小华,全晓松,张子锋.基于PCA和PSO-SVM在葡萄酒分类中的应用研究[J].云南民族大学学报(自然科学版),2014,23(4):456-459.

[5] 刘宇琴.基于聚类与主成分分析的重庆库区经济发展研究[J].重庆工商大学学报(自然科学版),2015,32(6):11-16.

[6] 刘天彪,柯洪捷,曹雪薇,等.基于主成分分析和Q型聚类分析的2011赛季中国足球超级联赛各队的技战术综合分析[J].河北科技师范学院学报,2016,30(1):35-42.

[7] 贾万敬,何建敏.主成分分析和因子分析在评价区域经济发展水平中的应用[J].现代管理科学,2007,(9):19-21.

[8] 重庆市统计局,国家统计局重庆调查总队.重庆统计年鉴(2014)[M].重庆:中国统计出版社,2014.

[9] 李新蕊.主成分分析、因子分析、聚类分析的比较与应用[J].山东教育学院学报,2007(6):23-26.

[10] 刘凤艳.基于聚类分析的证券业客户分层实证研究[J].赤峰学院学报(自然科学版),2016,32(8):99-101.

[11] 崔功豪,魏清泉,刘科伟.区域分析与区域规划[M].北京:高等教育出版社,2006.

[12] 任占峰,李豫新.新疆区域可持续发展水平分析与评价[J].科技进步与对策,2011,28(14):126-129.

[13] 唐功爽.基于spss的主成分分析与因子分析的辨析[J].统计教育,2007(2):12-14.

[14] 于丽英,郭洪晶.长江三角洲地区城市综合竞争力的评价研究[J].上海大学学报,2011,18(1):79-90.

[15] 杜相,张韵,杨丹.基于因子分析的地区综合发展水平评价研究[J].无锡商业职业技术学院学报,2014,14(5):46-51.

责任编辑:高 山

Analysis of Disparity of Comprehensive Development Level in Each District and County of Chongqing Municipality——Based on SPSS Principal Component Analysis(PCA)and Cluster Analysis

CHANG Sheng,QIN Nang,TANG Diwei
(School of Biological Science and Technology,Hubei University for Nationalities,Enshi 445000,China)

As the only municipality directly under the central government in the central and western regions of China,Chongqing,driven by the western development strategy and the construction of the Yangtze River economic belt,is entering a new stage in its overall development.However,the gap between urban and rural areas and the urban-rural dual structure still exist.The study found that the development of districts and counties within its jurisdiction is inharmonious and the gap between the rich and poor is still large.Based on SPSS statistical analysis software,this paper analyzes the differences between the comprehensive development level in each district and county of Chongqing by using principal component analysis (PCA)and clustering analysis,which can provide reference and basis for policymakers to better plan for the development of the districts and counties.

Chongqing;SPSS statistical analysis;principal component analysis;clustering analysis;comprehensive evaluation;regional development difference

C811;F222

A

1008-8423(2017)01-0114-07

10.13501/j.cnki.42-1569/n.2017.03.026

2016-12-27.

国家自然科学基金项目(71663017);湖北省新兴(战略)支持产业人才计划项目.

常胜(1979-),男,博士,副教授,主要从事土地评价与管理的研究.

猜你喜欢

万州区区县重庆
重庆客APP
创新发展的万州区第一人民医院·万州区天津医院
重庆人为什么爱吃花
前进中的重庆市万州区中医院
视觉重庆
在这里看重庆
区县电视台如何做好重大赛事报道
北京:上游水质不合格 下游区县将收补偿金
天津市2013上半年各区县节能目标完成情况
立足区县抓创建 着力创新促提高