APP下载

基于SPSS研究分析我国居民人均消费结构

2019-01-23包美玲

软件 2018年12期
关键词:衣着消费结构方差

包美玲,尹 红



基于SPSS研究分析我国居民人均消费结构

包美玲,尹 红

(昆明理工大学 机电学院,云南 昆明 650000)

研究消费结构是衡量居民生活水平的一种重要途径,本文以我国31个省份的消费支出为样本进行统计分析,采用了三种不同的统计方法进行研究消费结构的变动,为其成因对合理引导消费、促进经济的发展都有重要的意义。

消费支出;聚类分析;因子分析;相关分析

0 引言

消费结构是客观的存在,消费结构的分类则是人们主观的产物。人们可以根据实际需求对消费结构进行不同的分类。从其定义来讲,居民消费结构是指在一定社会经济条件下居民各项消费支出在消费总支出所占的比重,它不但能反映居民消费的具体内容,更能反映居民消费需求地满足情况。随着国家经济实力的提高,人们的生活水平也得到了显着提高,消费质量和结构的不断优化,相对于过去而言,居民对衣食住的消费需求已经从过去的追求数量转变到质量,居民食品消费支出的比重不断下降,但是在医疗、文化、教育和服务的消费支出比重不断增长[3]。本文就是在此基础之上,利用多元统计的相关知识和借助SPSS统计软件对2015年分地区居民消费支出数据进行研究分析,找出问题的主要影响因素,以及各个因素之间的相关程度。

1 数据来源与相关的统计学方法

本文主要应用多元统计学中的相关理论对数据作探索性和预测性分析。根据指标选取的客观性、全面性、可比性、简洁性和可操作性的原则,为了科学、客观、准确地衡量家庭支出能力,研究我国各地区城镇居民家庭平均全年消费支出,本文选取《中国统计年鉴2016》中“2015年分地区人均消费支出”的数据资料[2]。数据资料中的指标有食品、衣着、居住、家庭设备用品、医疗保健、交通与通讯、教育文化娱乐服务、其它商品和服务。采用的统计方法主要是聚类分析、因子分析和相关分析。

2 各地区居民人均消费支出的多元统计分析

本文从居民消费支出的相关性角度出发研究问题。对全国31个地区的2015年的原始数据,我们首先进行了加权平均计算其均值,并对得到的数据,做简单的探索性数据分析。对数据使用了因子分析的方法来降维,并直接从相关系数阵出发做因子分析;各不同地区的居民消费支出特征的归类用了类平均法,即“K水准逐步形成聚类法”;最后我们还进行了相关性检验,进一步了解方法数据与原始数据的相关性程度。设置变量1:食品(元);2:衣着(元);3:居住(元);4:家庭设备用品(元);5:医疗保健(元);6:交通与通讯(元)7:教育文化娱乐服务(元);8:其它商品和服务(元)。

首先,我们收集得到的数据(如图1所示)。

图1 原始数据

2.1 利用“K均值”聚类方法对居民人均消费支出进行聚类分析

我们先对得到的均值数据进行聚类分析,利用SPSS软件进行“K水准逐步形成聚类法”后聚类的结果如图2所示。

图2 聚类分析结果

根据聚类分析结果我们将各地区城镇居民的消费支出分为三大类:

(1)高消费支出类:北京、上海;

(2)中等消费支出类:天津、江苏、福建、辽宁、内蒙古、浙江、广东;

(3)低消费支出类:其它省市。

2.2 因子分析

运用SPSS软件对原始数据进行标准化处理后,利用标准化后的数据,采用方差最大正交旋转来做因子分析,设置抽取方差为0.5。

图3 KMO和Bartlett的检验

如上图3所示,程序运行结果得到KMO抽样适应性测度值:Kaiser-Meyer-Olkin=0.895,大于0.6,一般认为此值越大[1],做因子分析的效果越好。

图4 解释的总方差

根据图4的解释的总方差结果,可以看出,前2个因子的累计方差贡献比率为91.912%,高于85%,这说明提取2个公因子是比较合适的,它们可以很好地反映8个指标所能表达的足够的信息。根据上表结果,第一个因子解释的方差为6.788,计算得到其占全部信息的84.849%(全部信息即指相关阵的特征值总和,在此为8。因此旋转后第一个因子的方差贡献率为:6.788/8=0.84849。2的方差贡献率计算与此类似)。第二个因子解释的方差为0.565,占全部信息的7.064%。这2个因子累计解释的方差为6.795,占全部信息的84.944%,这说明它们就是我们所要寻找的两个因子[4]。

对因子进行旋转,旋转的目的是通过改变坐标轴的位置,重新分配各个因子所解释的方差比例,使其载荷系数更接近于1或0,能够更好的解释和命名变量。旋转后的因子不改变模型对数据的拟合程度,也不改变各个变量的公因子方差,使因子结构变得更加简单。

图5 旋转后成分矩阵

由图5的旋转后的因子载荷矩阵可以看出,公共因子1在指标1,3,4,5,6,8上载荷值都很大,分别为食品、居住、生活用品及服务、交通和通信、教育文化娱乐服务、其它商品及服务,因此可定义为基本生活消费因子;2在指标2、7上载荷值大,代表了衣着和医疗保健,可定义为衣着保健消费因子。综合可以看出,消费支出的多少主要取决于第一个公因子[5]。

图6 成分得分系数矩阵

因子得分函数模型及各地区因子的分值根据SPSS程序运行结果(如图6),得到标准因子得分函数模型为[6]:

1= 0.6031–0.3882+0.3413+0.0894+ 0.2435+0.1076–0.3797+0.1418

2 =–0.4791+0.6212–0.1723+0.1094– 0.0585+0.096+0.6117+0.0598

将各个地区具体的经过标准化后的原始指标值代入得分函数模型[7],可以计算得到各地区的因子得分值。因子得分值的大小显示了各地区城镇居民在该因子所代表的各项指标上的消费水平高低,小于0表明其处于平均水平之下[8]。

然后再以各公因子的方差贡献率作为权数计算各地区的综合测评得分,计算得到综合测评得分表达式如下:Z=(84.8491+7.0642)/91.913 (= 1,2,…, 31)。其中,为各个地区的各公因子得分值[9]。然后通过比较各地区综合得分的高低,可排序出2015年我国31个地区居民消费性支出水平的高低。具体结果如图7所示。

总体上来说,基本消费因子1主要反映的是各地区的综合性消费支出水平,其中各地区的排名和综合主成分的结果基本相似,高消费支出省市主要有上海、北京、广东、浙江和福建,这五个省市的消费支出水平明显高于全国其它地区,并且这五个省市之间的差距也是比较大的;衣着保健因子2反映了各地区以衣着消费支出的差异,其中位居前列的省份是黑龙江、吉林、内蒙古,总体看北方省市居多,而居于后几名的省份如广西、广东、海南等地,大多数分布于南方,分析其南北差异的原因很有可能是因为气候所致,而受收入、地区发展等经济因素的影响并不是很明显。由于衣着消费在总消费支出中所占的比重较小,所以衣着保健因子反映的情况对整体综合性消费支出的影响并不大[10]。

图7 各地区因子得分和综合测评得分

3 居民消费的相关分析

相关分析是对变量相关性的分析,这里所说的相关性即是表示两个因素之间的相互关系的大小,如果两个因素之间的相关性很小或没有相关性,则相关系数小或为0。如果两个因素之间的相关性大则相关系数大。相关系数在1与–1之间,小于0的为负相关,等于0的没有相关性,大于0的为正相关[11]。

下面利用皮尔逊相关系数验证概率P值来判断两变量之间的相关程度。相关系数Pearson Corre­lation越大表示相关程度越高。Sig就是P值越接近0就表示拟合的越好,就是相关程度越高。后面是皮尔逊相关的简单分类标准为我们分析的依据:0.8-1.0极强相关0.6-0.8强相关0.4-0.6中等程度相关0.2-0.4弱相关0.0-0.2极弱相关或无相关。

分析继续使用上文的原始数据,简单的数据预处理后,经SPSS软件运行后输出结果如下:

由此表可以看出检验概率P值接近于0,小于显著性水平a=0.05,则认为两成绩显著相关,食品与衣着的相关系数Pearson Correlation是0.604,有上述的皮尔逊判别标准可知这两个变量之间强相关。同上表所述可知食品与其他商品及服务的相关系数为0.868,有上述的皮尔逊判别标准可知这两个变量之间极强相关。

图8 食品与衣着相关系数

图9 食品与其他用品及服务相关系数

图10 食品与教育文化娱乐相关系数

图11 食品与居住相关系数

图12 食品与生活用品及服务相关系数

图13 食品与医疗保健相关系数

图14 食品与交通通信相关系数

同理,食品与教育文化娱乐的相关系数是0.776,食品与居住的相关系数是0.864,食品与生活用品及其服务的相关系数为0.816,食品与交通和通讯检验概率P值也接近于0,都小于显著性水平a=0.05,食品与医疗保健的相关系数是0.582,食品与交通和通讯的相关系数是0.879,故由上述的皮尔逊判别标准可知食品与医疗保健强相关,以上的两个变量之间极强相关,这两个变量较容易一起变动。

3 结论

各地区综合得分的排序与聚类所得结果基本上没有差异。这从一定程度上说明所作的分析是正确的和经得起检验的,这与各地区的实际经济情况也是相符合的。我国各地区城镇居民的消费结构差异很大,消费性支出水平发展很不平衡虽然我国居民的人均实际消费性支出的数量在增加,从一定程度上说明我国居民生活水平的提高,但各地区之间消费水平的差异很大,除了北京、上海、浙江等经济比较发达的地区的各因子得分排名均比较稳定,因而消费结构相对比较平衡外,很多地区的消费水平和消费结构都有待进一步提高。通过相关性分析可知,在我国居民消费支出中,如果食品消费支出过多,衣着、交通和通讯、医疗保健、家庭设备及服务、居住、其他商品及服务、文教娱乐用品及服务的支出就相对发生变化,食品支出与其他方面的支出存在显著地相关关系,其居住支出和消费支出随食品消费的变化而变化的趋势更为显著。

[1] 何晓群. 多元统计分析:第三版[M]. 中国人民出版社 2009.

[2] 国家统计局. 中国统计年鉴[M]. 中国统计出版社2016.

[3] 刘璇. 2016年我国各省居民生活质量分析研究[A]. 榆林学院学报2017.

[4] 刘昱清. 我国城镇居民消费支出结构和水平的因子分析[A]. 济宁学院学报 2014.

[5] 张立军, 任英华. 多元统计分析实验[M]. 中国人民出版社 2012.

[6] 林升梁. 中国消费者人性量表(CCHS)验证性因子分析—以福建大学生为例[J]. 福建师范大学学报, 2016.

[7] 蔡月祥. 中国农村居民家庭消费性支出的应用研究—基于因子分析[J]. 华东经济管理, 2014.

[8] 司圣音, 张应应. 稳健性因子分析在城镇居民家庭现金消费支出中的应用[J]. 数学的实践与认识, 2014.

[9] 陈海艇. 消费结构明显优化生活品质不断提升——“十二五”时期温州城乡居民生活消费支出分析[J]. 统计科学与实践, 2016.

[10] 王星. 非参数统计[M]. 中国人民大学出版社, 2005.

Analysis of Per Capita Consumption Structure of Chinese Residents Based on SPSS

BAO Mei-ling, YIN Hong

(Kunming University of Science and Technology Mechanic and Electronic, Yun Nan Kun Ming 650500)

Studying the consumption structure is an important way to measure the living standard of residents. This paper takes the consumption expenditure of 31 provinces in China as a sample for statistical analysis, and uses three different statistical methods to study the changes of consumption structure, and reasonably guide it. Consumption and the promotion of economic development have important implications.

Consumer spending; Cluster analysis; Factor analysis; Correlation analysis

TP391.41

A

10.3969/j.issn.1003-6970.2018.12.031

包美玲(1993-),女,昆明理工大学机电学院在读研究生,主要研究方向:生产及制造系统工程。

包美玲,尹红. 基于SPSS研究分析我国居民人均消费结构[J]. 软件,2018,39(12):136-140

猜你喜欢

衣着消费结构方差
方差怎么算
基于ELES模型的河北省城镇居民消费结构分析
概率与统计(2)——离散型随机变量的期望与方差
计算方差用哪个公式
方差生活秀
我国消费结构与产业结构互动机制的理论探讨
漫画集锦
杭州市首次开展旅游消费结构调查
中国城镇居民消费结构的渐进式转变
可爱淘