基于因子分析的31个省市经济发展水平研究
2014-04-01胡华瑞
王 波,胡华瑞
(1.湖北科技学院,湖北 咸宁 437100;2.通城县教育中心,湖北 通城 437400)
引言
多元统计分析是本世纪初在数理统计的基础上逐渐发展起来的一门应用数学学科,是一种综合分析方法,它能够在多个对象和多个指标互相关联的情况下分析出它们的统计规律。计算机的出现和发展,使多元统计分析方法在实际工作中的应用有了更为现实的意义,从而多元统计分析的应用范围日益广泛,近年来在工业、农业、生物、医学、经济、商业、教育等领域也受到了广泛的应用,并且在实践当中越来越发挥着重要的作用,在理论和方法上也得到了更为迅速的发展。
一、数据收集与整理
地区的经济发展水平是衡量一个国家经济发展的重要标志。按照设置指标体系的全面、系统及可操作性的原则,本文选取了中国统计局公布的2012年全国31个省、市、自治区的有关经济发展方面12项指标来评价各地区的经济发展状况;反映地区经济发展规模的指标:地区生产总值X1、进出口X2、工业总产值X3、建筑业总产值X4;反映宏观方面投资、财政方面的指标:全社会固定投资总额X5、财政收入X6、财政支出X7;反映人民生活、增长水平的指标:人均可支配收入X8、人均消费支出X9、人口自然增长率X10;反映居民消费方面的指标:居民消费价格指数X11、商口零售价格指数X12。
二、数据分析
1.因子分析
(1)因子分析的适应性检验
KMO值为0.767,根据统计学的标准,当KMO大于0.6时,就可以认为适合做因子分析;Bartlett球度检验给出的统计量为580.492,且其对应的相伴概率为0.000小于显著水平0.05,因此拒绝Bartlett球度检验的零假设,认为适合进行因子分析。
(2)主成分的提取
本文采用特征值准则与因子累计方差贡献率相结合的方法来确定提取主成分的个数, 由于其中一个因子与其他的因子差距较大同时笔者认为它表示了一个重要的部分,所以我选取了特征值大于或等于0.8的主成分作为初始因子, 同时满足方差累计贡献率达到90%以上,得出第一个因子的贡献率为60.777,直到第四个累计方差贡献率才达到为93.593%>90%对解释原有变量的贡献率很高,所以本文提取四个主因子。
(3)综合因子得分
本文采用公式F=∑Fiεi进行计算, 其中Fi代表各个主成分的得分,由SPSS软件计算所得,以Fi表示第i个主成分得分,i代表各主成分的权重,以旋转后各主成分的方差贡献率/ 累计贡献率替代。
为了全面考虑经济发展的综合实力,可以对每个公因子的得分进行加权求和,就可以得到经济综合实力的因子得分,按照加权平均关系式:
F=(F1×42.512%+F2×24.493%+F3×16.719%+F4×9.869)/93.593%
计算出综合得分。其中,因子得分为负值表示该地区此因子表现低于全国平均水平;因子得分为正值,表示该地区此因子表现高于全国平均水平。
从综合排名来看,本文分析的结果显示为江苏占全国第一,从四个主因子来看,江苏首先就在总量因子上面占了大头,可以想像他各方各面都是发展良好的,其次他的人口增长因子处于中间水平,人口多了反而会抑制其经济的增长,所以认为江苏拿下第一还是比较实至名归的。从笔者分析的数据来看,前12名是正数也就是说在全国平均经济情况之上,就算发展情况良好了,依次是江苏、北京、上海、广东、浙江、四川、辽宁、河南、山东、陕西、甘肃、青海,综合得分较低的有重庆、广西、海南、贵州。由于本文用的是2012年的数据,而且选用的数据不是那么的完善,所以看得出跟平时生活中感觉到的地区经济水平不尽相同。但可以看出国家西部大开发还是挺有成效的,陕西,甘肃,青海都在全国平均经济水平以上。
2.聚类分析
由于用SPSS做出来的聚类图不是那么美观,所以选择用SAS 聚类。
从聚类分析的输出来看,所有的城市可以分为三类或五类或七类,由于三类与五类难以分析,所以把31个省、市、自治区分为了7个类别,具体为:
第一类:北京、上海
第二类:浙江
第三类:天津、福建、广西、重庆、贵州、河北、安徽、湖北、辽宁、山西、黑龙江、吉林、江西、陕西、云南、内蒙古
第四类:海南、西藏、宁夏、甘肃、新疆、青海
第五类:河南、四川
第六类:江苏、山东
第七类:广东
从上述的分类结果来看:北京、上海在国民心中毋庸置疑为一类,由于这两个城市是国家重点扶持的两个经济发展大区,而且两个城市的因子综合得分也分别排为第二与第三;浙江、广东单独为一类,可见两个沿海省份在经济发展上都是很迅速的,再看两个省份的经济发展得分,两个省份紧挨着,分别占了第四与第五,据笔者所感两个省份之所以不在一类是由于其两者地理差异大,文化程度差异较大,风俗环境差异也大,所以造成二者不在同一类;仔细观察第三类,就会发现这些省市是波及全国的大中小城市,看因子综合得分也会发现在中高低层都有数例,经济发展都是稳稳当当,算得上是中国经济发展不可或缺的省市,所以说这些省市为一类笔者认为是稳当的;再看第四类,西部省份加上唯一的一个沿海省份海南,海南这几年的经济发展速度应该是起来了,但是相比广东这种工作热点省份来说这种主打旅游的城市还是没有多少人气,所以海南主打旅游应该跟国家大力扶持的西部城市发展也差不多不相上下;而河南、四川这两个城市两个分为一类笔者认为这两个省份都是起到一个枢纽的作用,河南号称,东与江苏、山东、安徽相邻,南连湖北,西接陕西,北与山西、河北结合,是中原经济区的主体,而四川更是有成都这个老牌城市,同时被又称为“西部综合交通枢纽”、“西部经济发展高地”,所以两个省份刚好组成一类;江苏、山东分为一类应该也是由于沿海地区的经济发展势头猛而导致的,山东有第一港口,而江苏与上海在一起,同时又与浙江很近,所以这两个省份分为一类有道理可言。
三、结论
本文是采用12项指标,结合因子分析、聚类分析的方法来评价2012年我国31个省市的经济发展情况,分析情况与实际情况基本一致。从数据分析的结果可以看出北京、上海、广州、浙江还是全国发展比较好的地区,但是由于国家政策的协调,我国各个地区的经济增长速度都在逐步的上升。同时需要指出的是,通过分析,我们解到了国家对于西部的开发动作也不是没有任何的起效的,中西部地区资源丰富,是个尚待开发的战略地区,也是中国潜在的大市场。
参考文献:
[1]于秀林.多元统计分析[M].北京:中国统计出版社,1999.
[2]何晓群.多元统计分析(第二版)[M].北京:中国人民大学出版社,2008.
[3]朱建平.应用多元统计分析[M].北京:科学出版社,2006.