APP下载

聚类分析之类内分类

2018-01-27李春林屈驳韵

科教导刊·电子版 2017年35期
关键词:产业竞争力聚类分析

李春林+屈驳韵

摘 要 本文以《应用多元统计分析》中我国制造业产业竞争力因子分析的的数据为例,结合实际问题的数据处理和分析,在聚类分析的应用过程中给出了类内分类的思想,并运用此技巧得到了切合实际的分类结果和类别特征。

关键词 产业竞争力 聚类分析 类内分类

中图分类号:G252 文献标识码:A

以《应用多元统计分析》(李春林、陈旭红编著)中第4章4.3中我国制造业产业竞争力的因子分析为例,具体数据如下表。

在因子分析的基础上,使用系统聚类分析方法,以科技因子得分﹑效率因子得分﹑固定资产因子得分﹑产值因子得分为分析变量,用“平方Euclidean距离”度量观测间的相似性,聚类方法选择“组间联接”法,对我国制造業各个行业进行聚类分析,结合树状图(图1)分析,将各行业聚为4类的结果如表2所示。

由表3可以看出,第1类以效率因子、第2类以产值因子、第3类以固定资产因子突出为各自特征,而第4类包含22个行业,且从各因子的极大、极小值,发现类内差异巨大,有必要对第4类进行再分类。以“分类变量=4”筛选观测,进行类内分类,得到第4类的再分类树状图(图2),由图2将第4类再聚为4类的结果如表4所示。

由表5可以得出,类别4-1以科技因子突出为特征,类别4-2以产值因子突出为特征(因此可以与类别2合并),而类别4-3与4-4的主要区别在科技因子与固定资产因子。由此可以看出,在进行聚类分析时,应根据问题和数据分析的不同,灵活运用相关分析方法,得出切合实际的结论。endprint

猜你喜欢

产业竞争力聚类分析
基于产品层次差异的中美产业竞争力比较研究
长江经济带产业竞争力现状分析
新兴产业成长中需求拉动作用的实证检验