因子分析在区域消费结构分析中的应用
2019-09-10陆丹妮
摘 要:为了探究全国城镇居民消费结构情况以及各省市的消费情况,本文基于2002年、2007年和2012年的城镇居民八类消费指数,应用因子分析方法提取隐性抽象因子,分析15年来居民消费结构变动及各省市的因子得分排名。研究发现,居民消费结构可分为一般生活型因子和气象因子,且各省市在两个公共因子上的得分有明显差异。分析并总结各省市消费结构的特点和原因。
关键词:因子分析;消费结构变动;因子得分;贫富差距
一、 分析背景
居民人均消费结构指人们在消费过程中消费的各种消费资料之间的比例关系,反映了居民的基本消费情况,可以衡量地区的经济发展状况。统计指标将消费支出划分成八大类(2013年后有所调整),分别是食品、衣着、居住、家庭设备用品及服务、医疗保健、交通和通讯、娱乐教育文化及其他消费支出,不同消费类别之间存在一定的相关性,且消费结构会随着经济发展而变化。
本文通过因子分析,深入研究消费结构内部关系,基于各省市的人均消费支出数据,提取变量的内在联系,将八大消费类型归为少数抽象因子,分析城镇居民的消费支出结构及政策经济发展下的变化。最后通过各省市的因子得分,分析不同省市居民的消费特点和当地经济发展之间的联系。
二、 因子分析的基本原理
因子分析运用了降维、简化数据的思想,利用对协方差矩阵(或相关系数矩阵)内部结构的研究,把较多的变量精炼成少数几个不可观测的隐变量,来解释多个原始变量之间的相关关系。因子分析方法可以有效探究不容易观测的潜在因素,可以通过一系列指标构成的评价指标体系,评估所研究的数据,这样可以使组内变量间的相关性较高,不同组间的相关性较低。
设置i个变量(X1,X2,…,X1),每个变量有n个样本(不同省市),i个变量经过因子分析之后,提炼出m个公共因子(F1,F2,…,Fm),由此可以建立因子分析模型。
用矩阵可以表示为:X=AF+ε0。其中aij在因子分析中的定义是因子载荷阵,即Xi与Fj的相关系数,代表了Xi对FJ的依赖程度,绝对值越高,密切程度越高。
因子分析的目标之一是对提取出来的抽象因子进行合理的解释,但直接由特征根和特征向量求得的因子载荷阵可能在多个公共因子上载荷都比较大,所以不利于突出主要矛盾和矛盾的主要方面。此时有必要进行因子旋转,可以利用正交旋转和斜交旋转进行因子旋转,这时每个变量只在一个公共因子上有较大载荷,在其他因子上载荷较小,效果更佳。后续分析利用最大方差旋转法进行因子旋转。
三、 数据处理与分析
(一)提取公共因子
利用SPSS对2002年、2007年及2012年的数据进行因子分析,剖析这三年城镇居民消费结构的抽象公共因子,得到旋转后的公共因子方差贡献率表(见下表)。
上表显示,三年的分析结果都提取了两个公共因子,而且这两个因子的累计贡献率均达到80%以上,说明这两个公共因子可以代表八类消费指数。另外图1是2002年的因子分析碎石图(其他两年类似),图中明显看到拐点出现在第二个特征根处,第三个特征根之后的点下降速度比较缓慢,进一步说明提取两个公共因子是合理有效的。
图2给出的是因子旋转后的成分矩阵图(因子载荷阵),经过旋转后的变量在不同的公共因子上载荷有明显的区别。
2002年的数据结果显示,第二公共因子在衣着(X2)上的载荷较大,第一公共因子在其他剩余消费指数上的载荷较大;2007年的结果显示,第一公共因子在医疗保健(X5)方面的载荷明显减小;直到2012年,第一公共因子在食品(X1)、居住(X3)、家庭设备用品及服务(X4)、交通和通讯(X6)、娱乐教育文化(X7)及其他消费支出(X8)的载荷较大,第二公共因子在衣着(X2)和医疗保健(X5)上的载荷较大。
由此我们可以发现第一公共因子占据人们的大部分支出,且第一公共因子上载荷较大的六个消费指数(X1,X3,X4,X6,X7,X8)之间有很强的相关性,可以归为一类,假定为一般生活型因子;而第二个公共因子上载荷较大的变量发生了一定的变化,目前趋势是X2和X5,这两个变量与气候有一定的关联,命名为气象因子。
经因子分析后将八大消费指数提炼为两大类,分析得到城镇居民的消费结构可由一般生活型因子和气象因子构成,且一般生活型因子的方差解释率更高,占消费支出的主要部分。从这三年的分析结果中也发现,各类消费支出的占比发生了一定变化,这与经济发展与社会进步存在着紧密的联系。
图3反应的是各变量在公共上的得分系数矩阵,以2007年为例,可以得到两个因子的得分表达式。
其他年份的也可以同理得到相應方程式,为了综合评价各变量的得分情况还可以将两个公共因子以各自的方差占比累计贡献率的比重作为权重来加权计算综合得分=(α1αZ1+α2αZ2),其中Z1和Z2分别为31个省市在公共因子上的得分,
α1,α2,α分别表示第一公共因子的方差百分比,第二公共因子的方差百分比及累积百分比。
(二)各因子得分比较
通过因子分析计算各省市的第一因子、第二因子的综合得分排名。综合得分前五位始终是上海、北京、广东、浙江、天津,这些地区是我国经济较发达区域,物价水平高,居民生活水平较高。综合排名靠后的城市主要是经济发展落后的地区,如黑龙江、西藏,这些地区资源稀缺、物价水平较低,消费支出也较低。
综合得分靠前的省市在第一因子(一般生活型因子)排名也比较靠前,上海一直稳居第一,这与当地的地理位置、经济发展有很大的关系。像上海、北京这样的一线城市物价、房价相对较高,广东、浙江、福建属于沿海地区,资源丰富、物价和房价相对也较高,同时教育、娱乐的消费支出增长迅速。排名靠后的省市在一般生活型因子上的消费支出水平处于全国低位,贫困人民较多,但是随着经济发展进步,消费支出有所增加。
第二因子与区域的地理位置和气候环境有较大联系。北京、天津、西藏、内蒙古等地区的气候比较寒冷,所以在衣着上的消费支出会比较大。海南、广东排名靠后,这些省市位于热带,气候比较暖和,对冬衣的需求较少,气候较适宜,所需要的医疗保健费用也相对较少。
四、 结论
总体看来,我国城镇居民的消费支出水平在不断提高,但是区域贫富差距依然存在,人们的一般型消费支出依然占据主要地位,另外满足精神需求的消费在逐渐增加。贫困地区的经济在国家政策的保护下稳步增长,居民的消费结构得到了一定的优化,但是与发达地区的差距依然明显。国家只有不断进步,发展经济、创新科技,才能让居民的生活更加美好。
参考文献:
[1]朱建平.应用多元统计分析[M].北京:科学出版社,2018.
[2]石美.因子分析在城镇居民消费结构变动分析中的应用[J].现代经济信息,2015(19):7-8.
[3]荣文静.主成分和因子分析在城镇消费支出中的应用比较[N].四川理工学院学报自然科学版,2010,1:122-124.
作者简介:陆丹妮,浙江农林大学,浙江杭州。