APP下载

基于因子和聚类分析的河北省11个市经济发展研究

2020-07-09

环渤海经济瞭望 2020年5期
关键词:河北省矩阵变量

随着京津冀一体化进程的不断推进,以及2022年冬奥会将在河北省张家口举办,河北省的经济发展状况成为了中央政府和河北省地方政府重要关注的方面,河北省丰富的旅游资源和自然资源,构成其经济发展的主要来源。作为京津冀协同发展的一员,良好的经济状况可以带动其他两个城市的发展。为了满足北京作为国家首都的经济需求,中央十分关注河北省的发展,加大对河北省经济的扶持力度,河北省自身也不断挖掘自身的优势及潜力使得其整体综合经济实力显著提升。故本文采用因子分析和聚类分析,对河北省2016年11个市的经济指标进行了研究和分析,并在研究结果的基础之上提出相关的经济建议。

一、模型介绍

(一)因子分析法

1.原理及方法

因子分析法,根据众多变量的内部关系,通过减少变量的数目,得出较少的并且不相关的综合因子,表示原始变量[1]。

其模型表达式:

从以上模型表达中可知,该模型有有p个原始变量,m个提取因子,当m<p时。其矩阵表达形式:X=AF+aε

F是公共因子;A为矩阵;ε被称作特殊因子,用于解释无法被提取的因子,即残差[2]。

2.因子分析步骤

(1)确定待分析的原有若干个变量是否适合做因子分析

(2)构造因子变量

(3)利用旋转方法使因子变量更具有可解释性

(4)计算因子得分

(二)系统聚类

1.系统聚类的基本原理

聚类分析也被称为群集分析,根据指标或者样品的各自特征聚为不同类(簇),将特征相似的指标或样本分为一类(簇),同一类(簇)内部的样本具有高的相似度,不同类(簇)之间的样本具有较高的差异性[3]。

2.系统聚类的基本思想

将n个样品或变量看成不同的n类,然后将距离接近(针对样品聚类)或者性质接近(针对变量聚类)的两类合并为一类,再从着n-1类中找到最接近的两个类合并,以此类推,直到所有的样品或变量被合为一类[4]。

图1 相关系数矩阵

二、实证分析

(一)经济发展评价指标的选取

根据指标体系选取所遵循的基本原则,本文选取的指标体系主要有以下特征:

① 反映河北地区经济发展水平及规模的指标;② 衡量河北地区总体人民生活水平及个体人民生活水平的指标;③ 反映河北地区经济效率的生产力因素以及该地区的经济效率、零售额等;④ 反映河北地区经济增长的指标;⑤ 反映河北地区医疗状况的指标;⑥ 反映河北地区产业结构水平的指标;

基于上述原则,本文选取指标有:X1:人口;X2:地区生产总值GDP;X3:社会消费品零售总额(亿元);X4:固定资产投资(亿元);X5:第三产业产值(亿元);X6:人均可支配收入(万元);X7:卫生机构数量;X8:进出口总额(亿元)

本文选择河北省的11个市为样本城市,分别是石家庄、唐山、邯郸、保定、沧州、邢台、廊坊、承德、张家口、衡水、秦皇岛。所有的数据均来源于河北省统计局。

(二)实证分析

1.KMO和Bartlett检验

通过SPSS软件对现有数据进行处理,第一步,通过对指标的相关系数进行的检验(如图1),发现所选取的8个指标之间具有一定的相关关系,可以采用主成分分析。其次,对所选取指标进行KMO和Bartlett检验,以便进一步说明所选取的数据适合采用因子分析,图2为KMO检验和Bartlett的检验结果,可知KMO为0.570,Bartlett检验中Sig值为0.000,表示本文选取的样本数据服从正态分布,可进一步的分析。

2.主成分提取

图3和图4为样本的特征值及累计方差率和碎石图,可知在8个样本特征值中,前两个因子符合大于1条件,并且两个因子的累计方差贡献率为85.868%,故本文选取前两个因子即可较好地解释和代替原始变量,同时具有较好的实际意义。

图2 KMO和Bartlett检验

图3 特征值及累计方差率

图4 碎石图

3.公因子载荷情况分析

图5为旋转成分矩阵,可知提取出的第一个主成分主要反应人口、地区生产总值、社会消费品零售总额、第三产业产值、进出口总额、固定资产投资额的情况,具体反映了综合的经济水平,因此将该主成分因子命名为“综合经济水平因子”。第二个主成分因子主要反映人均可支配收入、卫生机构数量的情况,具体反应了居民生活水平质量。因此可以将其命名为“居民生活水平因子”。

图5 旋转成分矩阵

4.公因子表达式

由图6的成分得分系数矩阵,可得各因子的表达式为:

F1=0.79×X1+0.966×X2+0.995×X3+0.968×X4+0.967×X5+0.265×X6+0.17×X7+0.877×X8,

F2=0.554×X1-0.182×X2+0.32×X3-0.91×X4-0.229×X5-0.700×X6+0.463×X7-0.838×X8

图6 成分得分系数矩阵

由上两个单因子的因子得分表达式,得出综合因子的得分值,代表各个市的综合经济实力,同时对F1,F2,F综合分别进行排序(见表1)。

表1 综合经济水平因子的得分情况以及排名

表1具体的分析结果为:

①在 F1(综合经济水平因子的得分以及排名)上,石家庄的得分高于其他市,作为河北省的省会,有着优质的先天政治和公共设施条件,优先吸引投资,其经济发展打下了良好基础,因此经济发展水平会优于其他市。②在 F2(居民生活水平因子的得分以及排名)上,明显看到邯郸和保定的得分较高。F2主要反映人均可支配收入、卫生机构情况,这说明这两个区域的人民生活水平要优于其他地方。③由 F 综合(各地区的综合实力水平得分以及排名)指标可知,河北省11个市级地区之间的差异十分的明显,区域发展不平衡,石家庄及唐山市的经济发展程度明显优于其他市的经济发展水平,并且数据之间具有较大的差异。其次邯郸人民生活水平明显优于其他市。

5.聚类分析

在上文分析的基础之上,对已选取的指标和其权重进行聚类分析,得到树状图,如图7所示。

图7 树状图

三、结论与建议

(一)结论

通过对河北省11个市级地区的数据指标的因子分析及聚类分析,结合各个地区经济发展区域的不同,找出各个地区经济发展差异较大的原因,旨在促进各个地区协同发展,缩小地区发展差异、促进河北省高效的发展提出了相关建议。

通过因子分析的最终得分排名以及聚类分析图,可以将河北省11个地区分为三类:

(1)石家庄、唐山。

(2)廊坊、秦皇岛。

(3)张家口、邯郸、保定、沧州、邢台、承德、衡水。

(二)建议

1.石家庄和唐山市的综合经济实力排在前两位,可以看到石家庄不仅是河北省的省会城市,同时也是河北省的经济中心,拉动着河北省的经济实力,对河北省整体经济发展具有很强的影响力。唐山市具有很强的地理优势,地处华北地区与东北地区的重要地带,拥有与国际通航的唐山港,同时,具有较高的先天性资源禀赋,使得唐山市的经济生产总值位于河北省前列,为河北省的经济发展做出着重大贡献。作为河北省综合经济实力最强的两个城市,除了发展其自身之外,还需带动其他市,以发挥各自优势,促进河北省各市,特别是欠发达的地区的协调发展,共同发展。

2.河北省的综合经济实力取得了明显的进步,但对于河北省内部,有着经济和社会发展的差异性,一直是阻碍河北省综合发展的重要问题。落后地区需要给与更多的关注,如给与更多的资金支持、税收优惠等政策扶持,利用政策优势吸引人才流入,为地区发展做出贡献。以便更好的地区间的经济和社会发展,促进河北省的长治久安。

3.应该加强张家口、邯郸、保定、沧州、邢台、承德、衡水的经济发展和居民生活水平、加强基础设施建设;加快推进社会事业的发展等。其次应该大力发展张家口地区的经济,作为举办奥运会的城市,应该具备一定的经济能力,在2022年更好的展现我国风采。

猜你喜欢

河北省矩阵变量
2020年河北省对外经济
中国进出口银行河北省分行
国家开发银行河北省分行
河北省
寻求不变量解决折叠问题
抓住不变量解题
初等行变换与初等列变换并用求逆矩阵
矩阵
矩阵
矩阵