APP下载

基于SPSS的31个地区的聚类分析

2019-12-12刘雪敏

现代营销·经营版 2020年1期
关键词:相似性聚类分析

摘 要:近年来,随着我国经济的发展,各个地区的经济发展水平也出现了较大的差异,我们抽取具有代表性的31个地区,基于SPSS对他们从人均食品支出、人均衣着支出、人均住房支出、人均家庭设备及服务支出、人均交通和通信支出、人均文教娱乐用品及服务支出、人均医疗保健支出和其他商品及服务支出八个方面进行聚类分析,分析所属同一类的地区所具有的相似性,为经济良好发展提供有效的建议。

关键词:SPSS;聚类分析;相似性

一、数据来源及分析

(一)数据来源

X1人均食品支出(元/人)X5人均交通和通信支出(元/人)

X2人均衣着支出(元/人)X6人均文教娱乐用品及服务支出(元/人)

X3人均住房支出(元/人)X7人均医疗保健支出(元/人)

X4 人均家庭设备及服务支出(元/人)X8 其他商品及服务支出(元/人)

图表 1

注:上图截取了31个地区一部分数据 数据来源:中国统计年鉴

(二)数据分析

以上选择的8个指标都很好的从衣、食、住、行四个方面反映了31个地区的人均消费水平,在一定程度了反映了不同地区的发展水平情况,通过运用欧式距离,将它们之间距离最近的两类合并为新类,然后计算新类与当前各类之间的距离,直至类的个数等于1时,画出聚类图,决定类的个数和最终分类数。

二、SPSS的聚类分析结果

(一)分类数的确定

圖表2聚合系数随分类数变化曲线

将SPSS输出的聚合系数值导入EXCEL中,做出聚合系数随分类数变化曲线,由图表2看出分类数3到5类是最合适的,但由于分类数过多不利于分析,所以我们选择分为3类对31个地区进行统计分析。

将数据导入SPSS软件,在“分析”菜单中选择“分类”,选择其中的系统聚类分析,将X1到X8八个变量选入变量框中,标注个案中选择地区,再点击右侧“方法”,聚类方法选择组内连接,区间测量采取平方Euclidean距离,并将其采用Z分数标准化,最后,单机确定按钮,SPSS则输出图表3。图表3是对每一个阶段不同聚类结果的反映,其中第四列为聚合系数,其值越大,代表其相似性越大,聚合损失量则会越少。

(二)具体分类情况

如上图所示是树状聚类图,由上面分析可知将其分为三类,易得分为北京、浙江、上海、其他地区,三类情况。

结束语:

将上海分为第一类,北京、浙江分为第二类,其他分为第三类,根据经验易得第一类为最发达地区,拥有各种机遇,主要发展高新技术产业;第二类为较发达地区,其经济上也有很大的突破,其应主要发展制造业,不断升级改进;第三类为经济欠发达地区,应该借用各地区的优势,积极发展自己特色的产业,提升经济实力。

参考文献:

[1]吕卫平,张晓梅.基于SPSS的聚类分析应用[J].福建电脑,2013(09):20-23.

[2]薛薇.统计分析与 SPSS 的应用 [M].北京:中国人民大学出版社,2011.

作者简介:刘雪敏(1998-),女,汉族,河北省张家口市人,本科,河北大学经济学院。研究方向:经济统计学。

猜你喜欢

相似性聚类分析
12个毫无违和感的奇妙动物组合
基于隐喻相似性研究[血]的惯用句
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究
潜析结构 把握性质