APP下载

基于主成分和聚类分析的省际城镇居民消费结构研究

2017-05-03刘婉琪

关键词:消费结构城镇居民消费

刘婉琪

(重庆工商大学数学与统计学院,重庆南岸400067)

基于主成分和聚类分析的省际城镇居民消费结构研究

刘婉琪

(重庆工商大学数学与统计学院,重庆南岸400067)

精准判识省际城镇居民消费结构发展现状及空间格局,对于我国扩大内需战略与区域协调发展有重要意义。结合2013年分地区城镇居民人均现金消费支出的数据,选取影响居民消费结构的八项指标,利用主成分分析法对各地区综合得分进行排名,通过聚类分析法研究省际城镇居民消费结构的区域差异性,结果表明我国31个省区市(不含港澳台)可分为五类,呈“金字塔”型布局。最后结合分析成果提出相应的对策建议。

城镇居民;消费结构;主成分分析;聚类分析

消费结构是国民经济增长的原动力之一,是我国经济发展路径由投资刺激向内需驱动转变的重要战略问题。“十二五”期间,我国经济得到了稳步增长,经济增长伴随着居民收入的增长,居民收入增加又促使居民消费水平的提升和消费结构的优化,这无疑是中国经济社会建设的巨大成就。然而,由于要素禀赋、区位特点和国家政策等方面的不平衡,使得我国各地区的经济发展水平存在着巨大差异。而这种差异在居民消费上表现为消费水平和消费结构的差异,经济发达地区在居民消费水平和消费结构方面明显优于落后地区。随着我国经济进入新常态,保证居民消费水平和消费结构的健康发展成为“十三五”规划中的重要内容。

城镇居民消费结构优化问题,一直以来受到广大学者的关注,运用的方法也多种多样,其中主成分分析与聚类分析法研究消费结构得到了广泛的应用。赵丽棉、黄基廷运用主成分分析法研究了全国各省城镇居民消费结构,得出各省城镇居民消费水平与其经济发达程度存在相关性,沿海地区与内地城镇居民消费结构有较大差异的结论[1];辛燕基于主成分分析的视角研究我国城镇居民消费结构,分析出城镇居民消费的特点[2];杨青运用主成分分析法探讨了四川省农村居民消费结构,并提出改善农村居民消费结构、提高农村居民消费水平的建议[3];刘惠敏在聚类分析法的基础上,通过计算分析不同时期我国城镇居民消费结构的灰色关联度得出消费结构的演变规律[4];许国琼基于聚类方法对我国各省城镇居民消费结构进行了研究,并结合各类消费结构的特点提出建议[5];王术分别从地区分布和消费结构动态变化两个方向对我国各省城镇居民消费结构进行了聚类分析[6];李博、刘韬运用灰色聚类分析法研究了贵州省行政区划的调整,并提出相应的对策方案[7]。

已有文献在区域差异、城乡差异的维度下探索居民消费结构的发展状况及演变趋势,并在指标体系和研究方法上为本文提供了牢固的逻辑基础。本文运用主成分和聚类分析相结合的方法对我国城镇居民消费结构进行综合评价,把握主要矛盾中矛盾的主要方面,明确各地区消费结构的特点和影响因素,以便提出能提升我国城镇居民消费水平和生活质量的建议。

一、城镇居民消费结构现状

消费结构能反映居民消费偏好、生活质量和地区整体经济的发展水平。探索城镇居民消费结构的现状,最重要的是要结合当今社会实际情况选取有效指标,分析结果能否反映实际情况取决于所选指标是否具有代表性和实际意义。本文根据对文献的分析研究,结合《中国统计年鉴2014》中“分地区城镇居民人均现金消费支出(2013年)”的数据,选取了反映居民消费结构的八项指标:食品(X1)、衣着(X2)、居住(X3)、家庭设备及用品(X4)、交通通信(X5)、文教娱乐(X6)、医疗保健(X7)、杂项商品与服务(X8)。为辨析我国城镇居民消费结构的区域、风俗、偏好等特点,将31个省区市按照东部、中部、西部和东北地区进行分区域处理,具体结果如表1所示。

表1 2013年全国城镇居民分区域人均现金消费支出(单位:元)

由表1可以看出,东部地区(包括北京、天津、上海、江苏等地)在这八项消费指标上的均值都超过全国平均水平,特别是在食品、交通通信和文教娱乐方面遥遥领先于中部、西部和东北地区;中部地区(包括山西、安徽、河南等地)在医疗保健方面低于全国平均水平,在杂项商品与服务方面的消费支出也较低;西部地区(包括内蒙古、重庆、四川、西藏等地)在这八项消费指标上的均值都略低于全国平均水平;东北地区(包括辽宁、吉林和黑龙江)在衣着和医疗保健方面的支出都高于东、中、西部地区的平均水平。通过比较各地区八项消费支出的最大值和最小值,可以看出我国31个省区市的消费水平还存在较大差异,两极分化现象严重。

二、研究方法

(一)主成分分析法(Principal Component Analysis)

主成分分析是一种分析、简化数据集的技术,具有减少数据集的维数,同时保持数据集对方差贡献最

大的特征,这是通过保留低阶主成分,忽略高阶主成分做到的[8]。主成分分析的基本数学模型表示为:

本文运用八个变量来研究居民消费结构,由于这八个变量之间存在一定的相关性,所以数据之间会有重叠的信息。为了能使用较少变量反映大量信息,并达到降维的目的,可以将八个相关变量进行线性组合,得到一组不相关的主成分Yj(j=1,2,3,…,8),新得到的主成分具有综合反映这八个指标的能力,且其变异性越大,表明它提供的关于这八个指标的信息就越多。通常情况下,Yj(j=1,2,3,…,8)的变异性用方差来表示。

主成分表达式中变量的系数即单位特征向量,其计算公式为:

(2)式中,aij为成分矩阵中第i行第j列的元素,λj为第j个主成分的特征值。

依据主成分分析原理,以特征值为权重,主成分的综合得分计算公式为:

(3)式中,λj(j=1,2,3,…,n)为各主成分对应的特征值,n为选取的有效主成分个数。

(二)聚类分析法(Cluster Analysis)

聚类分析是认定变量或者样本之间存在着不同程度上的相似性,并依据研究对象的个体特征,将那些相似程度较大的变量或者是样本聚为一类[9]。在统计模型中,自变量间的相关关系会影响模型的准确性和可解释性,运用聚类分析法来探索全国31个省区市城镇居民消费结构的地区差异性和相似性,可以很好地解决这个问题。

本文运用各地区城镇居民消费结构主成分的综合得分数据,结合欧氏距离作为相似性的度量标准,采用组间平均链锁距离法进行层次聚类分析。其中,欧式距离的计算公式为:

(4)式中,xi和yi分别表示样本x和y的第i个变量值。

三、实证分析

(一)主成分分析

利用SPSS软件对《中国统计年鉴2014》中“分地区城镇居民人均现金消费支出(2013年)”的数据进行处理,将相关输出结果进行整理,如表2至表5所示。

由表2可以看出,除了食品和衣着、医疗保健;衣着和居住、交通通信、文教娱乐;医疗保健和文教娱乐、交通通信、家庭设备及用品之间的相关系数未达到0.50,其余变量之间的相关系数都较大,且居住和交通通信;家庭设备及用品和文教娱乐;交通通信和文教娱乐之间达到0.85,说明这八个变量之间存在一定的相关关系,且都为正相关,适合使用主成分分析法进行降维。

表2 相关系数矩阵

由表3可以看出,Bartlett检验统计量的观测值为224.50,概率p值小于显著性水平0.05,且KMO检验系数为0.83,根据KMO度量标准可知,本文数据均来自多元正态总体,适用于主成分分析。

表3 KMO和Bartlett检验

表4 解释的总方差

由表4可以看出,前三个主成分的累积方差贡献率达到89.61%,各自对指标变异性的解释程度分别为68.78%、14.91%和5.91%,且前三个主成分的特征值分别为5.50、1.19和0.47。从第四个主成分开始,其特征值和方差贡献率的大小有所减少,综合八项指标信息的能力较低,所以选取前三个主成分进行分析比较合适。

表5 成分载荷和特征向量矩阵

表5中的a1、a2和a3列分别表示第一主成分、第二主成分和第三主成分对八个变量的载荷大小,即与八个指标之间的相关关系。由表5可以看出第一主成分和交通通信、文教娱乐、杂项商品与服务、家庭设备及用品之间的相关性较大,达到0.90以上,为高度正相关;第二主成分和衣着、医疗保健之间的相关性较大且为正相关,但和食品、居住、交通通信、文教娱乐、家庭设备及用品之间呈负相关关系;第三主成分和衣着、居住、医疗保健和家庭设备及用品之间的相关性较大,且和居住、交通通信和医疗保健之间呈负相关关系。根据公式(2)计算得到表5中的t1、t2和t3列,即八个变量对应的特征向量,得出所需主成分的表达式为:

结合SPSS输出的各主成分得分及(3)式,得到具体的主成分综合模型表达式为:

由此计算出各地区城镇居民消费结构的综合得分,并对其进行排序,如表6所示。

表6 各地区主成分得分及排名

第一主成分的表达式中八个变量的系数符号都为正数,且系数值都相差不大,该主成分可代表当地城镇居民的整体消费水平,命名为综合消费成分。生活在相对发达地区的城镇居民在这八项支出上的现金消费都较高时Y1的值较大,反之现金消费越小,则Y1的值越小。同时,综合消费成分也表明这八项指标对城镇居民消费结构都有一定的影响,只是相应的影响程度有差异,但都属于消费结构的重要组成部分。由表6可以看出,综合消费成分得分排名前五的地区是上海、北京、广东、浙江和天津,其中上海和北京得分高达2.50以上,超出其他地区得分较多,说明当地城镇居民现金消费水平较高,居民生活质量较高。而贵州和西藏两个地区的得分则排名靠后,说明当地城镇居民生活水平较我国其他地区有一定的差距,还有很大的提升空间。

第二主成分的表达式中八个变量的系数符号有正有负,系数为正的变量有衣着(X2)、医疗保健(X7)和杂项商品及服务(X8),城镇居民在这三个方面的现金消费支出较大时,Y2的值就较大,反之则较小。变量的系数绝对值大小表明相应变量对该主成分的影响程度大小,可以看出衣着和医疗保健支出对消费结构的影响程度较大。医疗保健的影响程度较大,显示出城镇居民对提升自身身体素质的意识较强,是全民健康发展的体现。家庭设备及用品的影响程度较小,说明随着当今社会的多样化发展,居民对家庭设备的需求正逐渐降低。结合表6看出该主成分得分和各地区地理差异有关,可命名为区域消费成分。区域消费成分得分排名靠前的地区是内蒙古、吉林、黑龙江和北京,其中,内蒙古和北京属于华北地区,吉林和黑龙江属于东北地区。当地城镇居民消费结构的变动受衣着的影响较大,正好符合华北和东北两大区域的气候特点,夏季气温高,冬季气候寒冷干燥,当地居民对衣着的需求程度较我国其他地区居民高出很多。

第三主成分的表达式中八个变量的系数符号也是有正有负,系数较大且为正的变量有食品(X1)、衣着(X2)和家庭设备及用品(X4)。消费结构随着各地区城镇居民的消费偏好而变化,主成分可命名为偏好消费成分。偏好消费成分得分排名前两名的地区是重庆和西藏,其中,重庆作为我国直辖市之一,经济发展迅速,结合当地居民生活观念和生活态度较前卫的特点,其对日常生活质量要求较高,主要体现在食品、衣着和家庭设备及用品消费方面,而西藏地区气候特点和地理环境的特殊性,造成当地城镇居民将更多的收入花费在满足基本的生活上面。

主成分综合得分排名前三的地区是北京、上海和浙江,这三个省市都属于我国经济较发达地区,说明居民消费结构和地区经济水平有密切关系。地区经济水平越高,城镇居民生活质量越高,现金消费支出也相应较高。

(二)聚类分析

利用SPSS软件对表6中各地区主成分综合得分数据进行处理,得到聚类分析树形图,如图1所示。依据图1,若选择分类数为5,可以得到如表7所示的分类结果。

根据图1与表7的结果,可以看出我国城镇居民消费结构的区域等级差异呈“金字塔”型。其中,东部发达地区处于金字塔的塔尖位置,而中西部欠发达地区处于金字塔的底部。

图1 各地区综合得分的聚类分析树形图

表72013 年我国城镇居民消费结构分类(不含港澳台地区)

在此次聚类分析中,北京、上海被归为第一类,这两个地区经济发达,属于我国的一线城市,当地城镇居民生活水平都较高;与第一类地区相比,第四类中青海、广西、贵州、西藏等地的经济发展水平则较低,当地城镇居民可支配收入较少,这些因素导致当地居民的消费观念和消费环境与其他地区的差异,因而其消费结构与第一类地区的差别较大。由此可见,经济发展水平和消费结构之间存在相关性,经济发展水平会影响居民的生活方式、消费观念和环境等,消费结构也会在一定程度上影响经济的发展趋势和产业的结构调整。第一类地区中的高消费、高质量生活必定会带动该区域中相关产业的发展。比如2013年上海的文教娱乐支出位居全国首位,这也促进了上海的教育业、文化业以及娱乐服务业的发展。

第一类地区的文教娱乐和医疗保健支出明显多于第四类地区,而第四类地区的基本生活支出(食品、衣着和居住支出)则占总消费支出的较大比重。这种现象产生的原因主要是第一类地区居民生活质量较高,当地城镇居民在满足了基本生活需求之后,愿意将消费热点转向更高的层次(如精神消费等)。

第一、二类地区的八项消费支出都高于其他地区,特别是北京、上海和广东,其居住消费支出较其他地区高出很多,北上广地区有优质的经济基础和产业基础,经济发展迅速,各领域资本投资活跃,就业机会多,成为全国各行业人才的聚集地。内蒙古自治区属于国家重点扶持地区,拥有丰富的自然资源,畜牧业发达,有众多的工业基地,这些产业发展带动了当地整体经济发展,城镇居民消费水平较高。第三、四类地区在八项消费领域的支出处于中等水平,经济水平还有很大的提升空间。第五类地区与前几类地区的各项支出额都相差甚远,与第一类地区相比,该类地区居民的消费结构和消费水平更是差距明显,这说明我国地区经济发展存在两极分化现象。

四、结论及启示

本文选取食品、衣着、居住、家庭设备及用品、交通通信、文教娱乐、医疗保健和杂项商品与服务八项综合反映消费结构的指标,运用主成分和聚类分析法对我国31个省级行政区(不含港澳台)城镇居民消费结构进行综合评价。共提取三个主成分,分别命名为综合消费成分、区域消费成分和偏好消费成分,并将31个省区市主成分综合得分进行排名和聚类分析,结果分为五类。得出的主要结论及启示如下。

(1)地区居民消费结构与当地经济发展状况高度相关。由综合消费成分看出,排名靠前的都是我国经济较发达地区,当地城镇居民收入较高。收入水平是制约居民消费的关键因素,结合当今国家经济形势,应适当调整收入分配结构,建立居民收入的持续增长机制。长期以来我国居民收入的增长慢于GDP的增长。我国经济进入新常态,经济增速放缓。在这样的背景下,只有合理调节收入的分配结构建立城镇居民收入的持续增长机制,才能继续优化我国居民的消费结构。同时,也应当进一步完善社会保障体系,鼓励保险行业的发展。“十二五”以来,我国城镇居民的收入水平有了明显的增长,然而,收入增长所带来的消费增长却不明显。高昂的医疗成本、不断攀升的房价、收入的不确定性都成了城镇居民消费增长的阻碍因素,克服这一系列障碍的有效措施是完善的社会保障体系和建立在社会保障体系基础上的商业保险体系。政府应进一步完善社会保障体系,同时还应当鼓励民间资本投资保险领域。

(2)不同地区城镇居民的消费偏好存在差异性。由偏好消费成分看出,发达地区的消费结构更偏向于非物质性消费和服务性消费,部分欠发达地区则更偏向于满足生活需要的基本消费。为了让我国各个地区消费结构呈现平衡发展趋势,政府应加强基础设施建设,降低居民的交通通信成本。交通通信服务既是居民的消费对象也是重要的生产资料。交通通信服务的水平制约着我国城镇居民的消费。政府应大力提升公路、铁路、航空的运营效率。同时,政府还应当适时地放宽民间资本进入通信行业的限制,促使我国的三大通信业务运营商降低服务费用,让通信服务多样化发展。

(3)各个地区经济发展存在两极分化现象。在聚类结果中,第一和第二类地区均分布在我国东部沿海地区,第三、第四和第五类地区大部分分布在我国中西部地区,表明我国东西部地区的居民消费结构存在明显的区域差异,西部地区的消费结构和消费水平明显劣于东部地区。长期以来,不同地区间产业结构的简单重复现象在我国普遍存在,各个地区的经济发展仍不平衡。国家应加强西部地区定向财政转移力度,鼓励沿海地区对口支援西部大开发,破解当前我国居民消费支出两极分化格局。不同地区政府之间应相互合作,实现各领域包容性增长,使社会和经济走可持续发展路线。东部地区应该积极主动地推进产业结构的转型升级,西部地区应该发挥后发优势努力缩小与东部地区的差异。地区差异的缩小对促进我国城镇居民消费结构的升级具有重要意义。

[1]赵丽棉,黄基廷.基于主成分分析法的中国城镇居民消费结构研究[J].广西科学,2012(2):121-124.

[2]辛燕.基于主成分分析视角的我国城镇居民消费结构[J].商业文化,2010(7):167-168.

[3]杨青.基于主成分分析法的四川省农村居民消费结构分析[J].现代商业,2015(23):105-106.

[4]刘惠敏.城镇居民消费结构演变的聚类分析与灰色预测[J].统计与决策,2009(3):93-95.

[5]许国琼.基于聚类方法的我国各省市城镇居民消费结构分析[J].科技风,2009(12):70-71.

[6]王术.基于聚类分析的城镇居民消费的时域差异分析[J].特区经济,2013(12):218-219.

[7]李博,刘韬.基于灰色聚类分析的贵州行政区划调整[J].重庆文理学院学报(社会科学版),2011,30(4):68-71.

[8]彭博,罗泽举.河南省各地区农业经济评价——基于聚类和主成分分析[J].重庆工商大学学报(自然科学版),2015,32 (4):91-96.

[9]刘林军,吴黎军.基于因子分析与聚类分析的新疆15个城市(地区)产业综合实力研究[J].重庆工商大学学报(自然科学版),2010,27(6):600-604.

责任编辑:吴强

Study on the Consumption Structure of Chinese Urban Residents Based on the Principal Component and Cluster Analysis

LIU Wanqi
(School of Mathematics and Statistics,Chongqing Technology and Business University,Nan’an Chongqing 400067,China)

Analysis of the development and spatial framework of the consumption structure of urban residents in the provinces is of great significance for the strategy of expanding domestic demand and coordinated development.This paper utilizes the data of consumption per urban residents at provincial level in 2013,selects 8 evaluation indexes of consumption structure,uses the principal component analysis to rank the composite score in different regions,discusses the regional difference of consumption structure of urban residents in China by cluster analysis and divides 31 provinces(except Hong Kong,Macao,Taiwan)into 5 categories with the layout of pyramid type and finally designs corresponding strategies based on the analysis results.

urban residents;consumption structure;principal component analysis;cluster analysis

F063.2

A

1673-8004(2017)02-0133-08

10.19493/j.cnki.issn1673-8004.2017.02.023

2016-05-11

重庆工商大学研究生创新型科研项目“三峡库区基础设施投资的减贫效应与益贫效应对策研究”(yjscxx2016-060-01);重庆工商大学研究生创新型科研项目“长江经济带雾霭污染的省域异质性与空间溢出效应研究”(yjscxx2016-060-11)。

刘婉琪(1993—),女,重庆九龙坡人,硕士研究生,主要从事宏观经济统计研究。

猜你喜欢

消费结构城镇居民消费
城镇居民住房分布对收入不平等的影响
基于ELES模型的河北省城镇居民消费结构分析
国内消费
新的一年,准备消费!
40年消费流变
天津城镇居民增收再上新台阶
新消费ABC
我国消费结构与产业结构互动机制的理论探讨
杭州市首次开展旅游消费结构调查
滇辽两省城镇居民体育锻炼行为的比较研究