基于聚类分析法的我国省域经济区划探讨
2022-01-21李思睿
李思睿
(新南威尔士大学商学院,澳大利亚 悉尼 2052)
0 引言与文献综述
我国既是一个人口大国、国土面积大国,又是一个各地自然资源、地理环境、经济发展水平差异较大的大国.因此,只有科学合理地做好经济区划,才能因地制宜、精准施策,更好地进行宏观经济调控,促进各地协调发展、可持续发展,实现共同富裕[1].
经济区划的方法基本有2种:传统分类法和数值分类法.传统分类法主要是根据地理位置、经济发展水平及有关专业知识,以定性为主,结果较为笼统.而数值分类法主要是运用多元统计中的聚类分析进行定量区划,从而弥补前者的不足.
传统分类法成果很多,具有代表性的有:
(1)1956年,毛泽东主席在“论十大关系”中提出沿海和内地的区域划分.此法在“一五”至“五五”期间基本被采用.
(2)20世纪60年代中期至20世纪70年代中期,根据国际形势的需要把我国经济区域分成为一线、二线、三线.
(3)1985年,著名经济学家刘再兴[2]把全国分成8大综合经济区:东北、华北、华东、黄河中下游、长江中下游、东南沿海、西南区、西北区.
(4)1986年,著名区域经济学家陈栋生把全国分成6大经济区:东北、黄河流域、长江流域、南方、新疆、西藏.这一项从横向经济联合角度分析的重大提议被张子珍收录在文献[3]中.
(5)张毓峰等[2]列表给出了经济区划的演进,并提出沿海、内陆与沿边3大区域划分的新方案.
(6)东部、中部、西部传统三分法,这是一个得到专家共识,官方确认,具有深远影响的分类法.此法最早出现在官方文件中,是1985年《中共中央关于制定国民经济和社会发展第7个五年计划的建议》中,提出“要正确处理中国东部、中部、西部三个经济带的关系”,但正式形成是在1987年两会以后,此时西部又增加了广西、内蒙古,致使东部为11个、中部为8个、西部为12个省(市、区),此法至今已沿用20多年.如振兴东北、中部崛起、西部大开发等战略构想的提出与实施,对我国经济发展起到了较大促进作用.但20多年来,各地经济均有不同程度的发展变化,根据与时俱进原则,为适应新时期发展需要,应当根据实际情况做适当调整.
用聚类分析进行区划大多从本世纪开始.根据事物的远近亲疏把事物分类的数学方法称聚类分析,如果是单指标事物则根据指标大小即可分类,对多指标事物,则只有借助聚类分析才能完成精准分类,而经济区划是典型的多指标问题,从而为聚类分析提供了广阔的应用空间[5].
对文献进行梳理发现,有关经济区划的研究主要集中于以下几个方面:
在对经济区划的特征和发展历程研究方面,袁杰[6]将中国经济区域分7类,重点强调了区域再划分的必要性.刘本盛[7]对中国经济区划的演变历程进行了梳理,发现经济区划存在方法和面积不够合理等问题,进而提出了以行政区代替经济区的方法.杨开忠等[8]在对国家经济区划转型特征进行研究的基础上,提出要建立全国统一的经济区划体系,要解决最小空间信息源和规范化动态管理等问题.
还有一些学者运用计量经济学方法进行区划方面的分类,麦勇[9]以省域视角进行分析,将中国经济区域分为3个经济区,强调我国以省为单位的经济区域分类,仍然具有明显的东部、中部、西部的带状区域分布特征,加快中部崛起势在必行.赵晶等[10]运用双聚类算法,将中国区域分5类,重点强调了双聚类法的作用与优势.刘东良等[11]基于多元分析方法,将我国经济区划分为6大经济区,提出经济区划的经济、社会、综合效益、远景性4条一般原则和5条具体原则.杨贺等[12]基于断裂点模型和空间分割原理,科学划定了我国一级经济区的范围界限.
这些成果为我国的经济区划提供了新思路,从方法到结果来看较为丰富.但有以下2处值得商榷:(1)所选经济指标过多,致使众多次要指标平分了主要指标的权重,削弱了主要指标的作用,如袁杰[6]用了72个指标,赵晶等[10]用了17个指标;(2)所选资料年代过短,如袁杰[6]仅用2005年,麦勇[9]仅用2003年,刘良东等[11]仅用1998年,均为1年的指标数值,从而使数据代表性降低,可能影响最终结果.
1 研究思路与方法
笔者试图也用聚类分析[11]方法进行探讨.为避免前面4文的不足,在指标的选取和统计数据的收集上有所改进.
经请专家指导,决定选取如下5个经济指标:(1)人均GDP;(2)人均财政收入;(3)人均可支配收入;(4)固定资产投资;(5)社会消费品零售总额.其中,指标(1)、(2)、(5)均为2010—2019年10年的年平均,指标(3)为2013—2020年8年的年平均,指标(4)为2010—2017年8年的年平均,所有数据均来自国家统计局数据库(表1).
表1 各省(市、区)经济指标数值Tab.1 Economic indicator data of each province(city)
把31个省(市、区)看成样品,用系统聚类法进行样品聚类(Q型,用原始数据上机计算),结果见聚类图(图1).
图1 聚类图Fig.1 Cluster map
2 研究结果
由图1可以直观、形象地看出各省(市、区)经济状况相似程度的高低,线条越短(低)经济状况越相似,越长(高)经济状况则差异较大.如高度相同,说明水平一致.为此不妨把31个省(市、区)分成3个经济区,在图中用虚线隔开,分别记为I类、II类、III类.
通过图1和指标数值,至少可得出3个结果:
2.1 II类、III类线条均短,且高度整齐一致,说明这2类内部各省(市、区)经济状况相似度高,且水平一致.但I类不同,除天津与福建,北京与上海线条短且长度一致,其他省线条均高低不齐,表明天津与福建、北京与上海经济状况相似程度高且水平一致,但其他省则差距较大,特别是山东.就类之间的相似性来看,II、III类相似程度高,而I类与II、III类差异较大.
2.2 由表1指标数据可以看出,I类区8个省(市、区)5个指标数值多处于前列,其中,人均GDP和人均可支配收入均占前8;人均财政收入占前6;社会消费品零售额占前4.而III类区13个省(市、区)指标数值位置多数较靠后,人均GDP占倒数第1至倒数第9;人均财政收入占倒数第1至倒数第2;固定资产投资额占倒数第1至倒数第4;人均可支配收入和社会消费品零售额均占倒数第1至倒数第6.而II类区指标数值则大多处于两者中间.不妨把I、II、III这3类区经济状况分别称为发达、较好、一般.
2.3 把此结果和传统三分法相比较(表2),结果为东部与I类区、中部与II类区、西部与III类区相同者分别为8、4、8合计20个,占总数近2/3.不同者仅为11个,归类情况见表3.这也不难理解,经过20多年,各地的经济有不同程度的发展变化,原来同类现在有可能不同类.况且这次是定量分析,结果有可能更准确.东部区与I类区相比,由原来的11个变成8个,辽宁、河北变成II类区、海南变成III类区.现有I类区8个省市均是经济发达,上述3省明显不达标准.但随着振兴东北、河北雄安新区的开发以及海南经济特区的建设,若干年后这3省很有可能回归到I类区.原来中部的黑龙江、吉林、山西、江西4省由于经济发展较为缓慢,现归为III类区.而原属西部的陕西、四川、重庆、内蒙古则经济发展较好,又归为II类.不难预测,现在的区划若干年后还会有新变化.实质上,区划既要有相对稳定性又要有动态可变性.
表2 传统三分法和聚类分析法比较Tab.2 Comparison of traditional three-section method and cluster analysis method
表3 2种分析法不相同的11个省市区归类Tab.3 Differences of classification 11 provinces and cities between two analysis methods
3 讨论
3.1 我国区划到底分几类为好,方法不同会得出不同的分类数.早期有若干学者主张分6、10、8类等,近期又有学者主张分7、3、5类等.笔者则主张分3类为宜,一方面便于与传统三分法相衔接,另一方面也与人们思维习惯相吻合.
3.2 关于区划的名称,建议能否将传统三分法中的东部、中部和西部分别改为I类、II类和III类,因为经济区划不是行政区划,将来中、西部也可能出现经济强省(市、区),应弱化地理位置,这样才有利于各地平等竞争.
3.3 能否请国家指定专门机构负责实施经济区划,请经济学家、数学家研究确定区划经济指标和数学模型,统一标准,与五年计划同步,在检查上一个五年计划完成情况时,同步进行经济区划,作为考核各省(市、区)领导政绩的重要依据,以此激励各省(市、区)努力拼搏、力争上游的积极性.
3.4 指标3、4的年代与指标1、2、5不一致,原因是数据库中数据不全.
3.5 如按聚类要求,本应分为如下3类:北京、上海为一类(称为:A类),II类和III类合并为一类(称为:C类),其余6省市为一类(称为B类).但为了与传统的三分法更好地衔接与比较,笔者把A和B合并称为I类,把C类拆分为现在的II类和III类.
3.6 笔者所用5个统计指标是请专家指导后确定.今后也可尝试从众多指标中用主成分分析找出若干主成分及其高载荷指标,从而完成聚类.这样也可能结果更科学、准确,也可以用模糊数学中的模糊聚类进行经济区划的尝试.