APP下载

基于主成分-聚类分析的山东省经济状况研究

2021-09-13赵璇

中国集体经济 2021年25期
关键词:主成分分析

赵璇

摘要:文章着重研究山东省十七个市的经济发展状况,为更好的了解山东省的经济发展状况,对山东省各市的某些经济指标进行分析。首先选取某些山东省经济指标进行主成分分析,最终得到综合得分。其次对主成分分析得到的样本得分进行聚类分析,将十七个地级市按经济发展程度分为了四类。研究结果表明,影响山东省经济发展的主要指标有地区生产总值、第一产业总值及各市城镇登记失业率。经济发展较好的地区有青岛市、烟台市、潍坊市及济南市,这些城市要继续拉动本市的经济增长,增加就业岗位,降低失业率,在发展中保障和改善民生。

关键词:主成分分析;K-means聚类算法;SPSS统计

一、引言

随着十九大的胜利召开,我国综合国力显著提高,经济建设取得重大成就。山东省作为经济强省,在地区生产总值、第一二三产业总值、就业问题、能源消耗等方面均有明显改善。因此分析山东省的经济状况,提出合理的建议观点引起了众多研究者的兴趣。王俊芳从生态文明的视角分析山东省农业循环经济发展的制约因素,并给出合理的建议。吴蔚然对潍坊市高新区进行分析,发现声光电子产业的快速发展有利于促进新旧动能转换,动力装备产业已进入成熟期发展缓慢,并提出了合理建议。

还有些研究者通过建立数学模型对山东省的经济状况做了详细分析,例如苗晓颖等基于因子分析研究山东省棉花种植的影响因素,结果发现成本因素对种植面积的影响最敏感。王昕鸿等基于因子分析和SWOT分析构建山东省经济活力评价体系,并对青岛市的未来发展提出建议。王树娟基于VECM 模型对山东省农村金融、农业科技与农村经济增长之间的关系进行了实证研究,结果表明农户存款率与经济增长呈负相关,农户贷款率与经济增长呈正相关。

基于上述文献,本文建立的模型是主成分-聚类模型,主要思想是利用SPSS先将数据进行降维,提取主成分;然后对提取的主成分得分情况进行聚类分析,对山东省各市的经济发展规模进行分类,进而分析其结果及提出管理启示。

二、模型建立

本文以山东省17个市作为研究对象,选取了2018年与山东省经济状况相关的16个指标数据,包括地区生产总值、各市年底就业人数、各市固定资产投资增长速度等,数据来源于《山东统计年鉴2019》。

(一)数据预处理

由于选取指标的量纲及数量级不同,为了避免一些数据较大指标会削弱数据较小指标的影响,所以在对数据进行主成分分析和聚类之前,先对原始数据进行标准化处理,使数据服从正态分布。

得到解释的总方差如表1。

表1中“合计”指的是各成分的特征值,“方差%”指的是各成分方差的贡献率,“累计%”指的是各成分方差的累计贡献率。从该表中可以看出,第一主成分的特征值是8.957,贡献率为55.980%,这说明第一主成分能反映原始样本数据55.980% 的信息量。一般来说,累计贡献率达到80% 即可提取主成分,但本文为了使数据更精确,决定提取累計贡献率达到85% 以上的成分。从表中我们可以看出前四个成分的累计贡献率是89.215%,这说明前四个主成分能反映原始样本数据89.215% 的信息量。

进一步得到其综合得分及排名,如表2所示。

通过主因子分析,青岛市的得分最高。从全省来看,青岛市地区生产总值、各市按行业分城镇单位就业人员平均工资等多项指标均位于全省第一。烟台市和潍坊市近几年发展迅速,在2016年最新中国城市分级中,均被评为“二线城市”,地区生产总值、第一二三生产总值等多项指标均高于全省平均值,这说明居民生活水平较高,人们总体比较富有。

山东省作为一个人口大省,诸多城市经济状况较好,但也存在很多问题,区域之间发展不平衡,枣庄市、莱芜市经济发展水平相对落后,在选取的多项指标中均低于全省平均值,且离平均值的差距较大。

(三)K-means聚类分析

利用上一小节的得分情况进行K-means聚类分析,得到的最终聚类中心表及聚类成员表如表3及表4所示。

由表3及表4得出以下结论:在第一类中,Fi1所占的比例大于其他的类,这说明该地区的第一主成分要优于其他地区,这些地区应归于第一类,即青岛市,青岛市是山东省经济发展最好的城市,从主成分得分情况可以看出,青岛市的第一主成分领先于其他各市;第二类中,Fi4所占的比例大于其他的类,这说明该地区的第四主成分要优于其他地区,这些地区应归于第二类,即德州市、威海市、泰安市、日照市及莱芜市;第三个类中,Fi3的比例大于其他的类,这说明该地区的第三主成分要优于其他地区,这些地区应归于第三类,即济宁市、临沂市、菏泽市、淄博市、聊城市、东营市、滨州市及枣庄市;第四类中,Fi1的比例大于其他的类,这说明该地区的第一主成分要优于第二类及第三类,但次于第一类,这些地区应归于第四类,即烟台市、潍坊市及济南市。在相同类中,各城市的经济发展状况差距较小;在不同类中,各城市的经济发展状况差距较大。

三、结语

本文选取了《山东省统计年鉴-2019》的统计数据,以山东省十七个市的经济发展状况为研究对象,对某些经济指标进行主成分-聚类分析,其结论如下:

第一,通过对山东省经济发展指标进行主成分分析发现,在这四个主成分中,对山东省各市经济发展影响权重比较大的指标是地区生产总值、第一产业总值、各市城镇登记失业率。

和各市万元GDP能耗。地区生产总值反映了山东省各市的经济总量情况,第一生产总值反映了山东省各市的农业经济情况,各市城镇登记失业率反映了各市的就业状况,各市万元GDP能耗反映了各市每创造一万元消耗的能源情况。

第二,通过对因子分析的样本得分进行聚类分析发现。第一类发展情况最好的城市是青岛市,第二类发展情况较好的是烟台市、潍坊市及济南市,第三类是德州市、威海市、泰安市、日照市及莱芜市,第四类是济宁市、临沂市、菏泽市、淄博市、聊城市、东营市、滨州市及枣庄市。

综合以上两个任务可以看出,青岛市在各指标数据中都具有明显的优势,这说明青岛市的发展水平在全省来看非常高。同时,各市之间的差距也非常明显,这就意味着在今后的发展中,那些发展水平比较高的城市要继续拉动本市的经济增长,在发展中保障和改善民生。而那些经济发展不太好的城市要着重拉动第一、二、三产业持续增长,提高居民的消费水平,刺激居民的消费欲望,改善居民的就业现状,提高最低工资标准,提高创新能力。

参考文献:

[1]王俊芳.生态文明视角下山东省农业循环经济发展现状及对策[J].乡村科技,2020(13):40-42.

[2]吴蔚然.山东省潍坊市高新区区域经济发展现状分析[J].中国经贸导刊(理论版),2018(14):43-46.

[3]苗晓颖,胡继连.山东棉花种植面积变动及影响因素分析——基于14变量的因子回归分析[J].当代经济,2020(09):85-89.

[4]王昕鸿,陈雅君.基于因子分析的城市经济活力评价——以山东省为例[J].商讯,2020(26):3-4.

[5]王树娟.农村金融发展、农业科技进步与农村经济增长——以山东省为例[J].当代经济,2019(10):112-117.

(作者单位:曲阜师范大学)

猜你喜欢

主成分分析
Categorizing Compiler Error Messages with Principal Component Analysis
关于AI上市公司发展水平评价
大学生创业自我效能感结构研究
塔里木河流域水资源承载力变化及其驱动力分析
我国上市商业银行信贷资产证券化效应实证研究
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
农村劳动力转移影响因素与转移数量的动态关系研究