APP下载

基于因子分析的全国各省消费水平评价

2019-09-10侯淑静

中国商论 2019年6期
关键词:降维各省市消费水平

侯淑静

摘要:基于2 017年中国大陆31个省市自治区城镇居民消费支出情况,本文首先用因子分析的方法将8个消费指标降为3个公共因子;其次再用综合得分的方法讨论了排名前五名和排名后五名省市的城镇居民消费水平,并对相关结果作出简要的分析。

城镇居民消费水平通常用食品、衣着、居住、家庭设备及用品、交通通信、文教娱乐、医疗保健、其他用品及服务等变量来描述,这8个变量值的标准化分别用X,,X2,…,X8表示,这些指标之间存在一定的线性相关关系。为研究城镇居民的消费结构,需将相关性强的指标归并在一起,用一个新的因子代表,这实际上就是对指标降维,本文采用因子分析进行降维。

1 因子分析

本文希望通过2017年中国各省城镇居民消费支出情况了解各个省份城镇居民消费水平的一些基本情况。一般而言,衡量一个地区的消费水平可以从住房、交通通讯、娱乐、教育、医疗等方面来加以评价,因此本文选取了相关八个指标的一些数据进行分析,指标的选取参考了《中国统计年鉴》中指标的设置。首先对数据做相关分析,然后再对数据做因子分析,并对相关结果作一简要的分析。因子分析可以看成是主成分分析的推广,它通过研究原始变量的相关矩阵,利用降维的手段,把很多的具有错综复杂关系的变量归结为少数几个典型的综合因子的多元统计分析方法。这种方法是由查尔斯斯皮尔曼在1904年提出的,最初用于对学生考试成绩的研究。目前因子分析已经广泛地应用于心理学、医学、气象、经济学等各个领域。

因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因子。对于所研究的某一具体问题,原始变量可以分解成两部分之和的形式,一部分是少数几个不可观测的所谓公共因子的线性函数;另一部分是与公共因子无关的特殊因子。进行因子分析通常分为以下几个步骤:(l)根据所研究的问题选取合适的原始变量;(2)分析原始变量之间的相关关系。当大多数简单相关系数大干0.3时,可以考虑因子分析方法。为了消除各个变量之间不同量纲对数据分析的影响,通常需要对变量进行标准化处理,然后再求相关矩阵;(3)确定因子载荷、因子旋转,计算因子得分。(4)根据因子得分值进行进一步分析。

本文程序在SPSS 17中运行通过,所使用的数据来自2018年中国统计年鉴的部分地区城镇居民消费支出原始数据。

2 结果与讨论

首先对31个省市城镇居民消费支出计算相关系数矩阵,原始变量大部分两两之间的相关系数都大干0.5,有较强的相关性,进行因子分析是合适的。接下来对原始数据进行因子分析,用SPSS软件打开原始数据集,并依次点击分析一降维一因子分析,进入因子分析对话框,选取食品、衣着、居住、家庭设备及用品、交通通信、文教娱乐、医疗保健、其他用品及服务变量进入变量窗口。

点击因子分析对话框的抽取,进入抽取对话框,在方法选项框选择SPSS默认使用的主成分法提取因子,为了方便解释,往往要对初始因子进行旋转,点击因子分析对话框旋转按钮,进入旋转对话框,在方法框架中可以看到SPSS给出了许多种旋转的方法,本文选择对初始因子进行方差最大正交旋转,点击继续按钮继续,选中得分按钮,选中保存为变量和显示因子得分系数矩阵复选框,最后将程序运行,得到的解释总方差,旋转成分矩阵,成分得分系数矩阵,并把各因子得分存为向量。

旋转成分矩阵可以看出,公共因子F1在医疗保健、教育文化娱乐和生活用品及服务上载荷值很大,在一定程度上反映了城镇居民医疗保健、教育文化和生活用品及服务消费的公共因子,即在一定程度上反映了城镇居民精神方面以及服务方面的消费;公共因子F2由于在食品烟酒、居住、其他用品及服务和交通通信上载荷值很大,在一定程度上反映了城镇居民基本生活消费,即基本生活消费因子;公共因子F3仅在衣着上裁荷值很大,是反映城镇居民衣着消费的公共因子。由此可以看出,居民消费的主体由原来的基本生活消费向精神方面以及服务方面的消费转变。

由表4可知:F- -0.384X,- 0.296X.+O.194X,+ 0.043X4+ 0.065Xs+ 0.484X6+ 0.552X7+ 0.021X8 (1)F2 -0.64X.- 0.046X:+0.2X,+0.104X4 +0.169Xs -0.075X6 - 0.404X7 +0.177Xs(2)F3= - 0.021X1+0.882X2 - 0.224X3 +0.205X4 +0.053Xs - 0.32X6 +0.017X7+o.isixs(3) 最后,计算因子得分,将各省市的X1,X2,…,X依次代入式(l)、式(2)和式(3),可以计算出各省市的第一公共因子、第二公共因子和第三公共因子的得分,以各因子的方差贡献率占三个因子总方差贡献率的比重作为权重进行加权汇总.得出各省市的综合得分F,即:

F-(35.646 xF,+32.798 xF2+19.518 xF,)/87.961,根据各省市综合得分F由高到低排序,各省市的各因子得分,如表5所示。

结合各个省市在三个公共因子上的得分和综合得分,综合得分前五名的省市依次是北京、上海、天津、浙江和广东。其中,北京综合得分1.79分,上海综合得分1.65分,远高于其他城市,说明北京和上海的城镇居民消费总水平是我国目前最高的两个城市,并且远高于其他城市,而北京和上海的经济发展也是很发达的,综合得分最低的五个省市是山西、西藏、海南、江西、广西,这五个省市的城镇居民消费总水平较低,而这五个省市经济发展相对落后。综合来讲,东部沿海地区各省市的城镇居民消费水平高于西部城镇居民消费水平,这与实际情况也是相符的,东部沿海地区经济较发达,消费需求较高,而西部各省市经济欠发达,消费水平较低,所以我国各地区的消费水平发展不平衡,还有很大差異,还有很多地区城镇消费水平需要提高。因而,如何加快西部省市的发展和进步,是我国整体经济发展的重要课题。

猜你喜欢

降维各省市消费水平
中国各省市经济发展水平分析
中国各省市经济发展水平分析
应对2018年中考全国各省市67道作文题,高分素材,成就高分作文
微写作
导数在几何中的“降维”作用
我国31省城镇居民消费水平(2007)
几种降维算法的研究及应用
我国经济增长与国民消费的演进