APP下载

农村居民收入与消费关系实证研究

2009-03-19李乐夫

重庆大学学报(社会科学版) 2009年1期
关键词:消费结构聚类分析因子分析

刘 桓 李乐夫 吴 栋

摘要:文章以2004年中国农村居民消费结构作为研究对象,首先通过因子分析得出全国31个地区的在八项消费上的因子得分、排名,并与农民收入排名对比;再运用聚类分析将全国各地区分为四个层次,通过因子分析比较该四个层次与传统地理划分的东、中、西部在消费结构上的异同,在得到一些特点规律的基础上,提出加强配套设施建设与增加农民收入在部分地区应有所侧重等政策建议,以期在新农村建设过程中更有效地促进农民消费,提高农民生活水平。

关键词:消费结构;因子分析;聚类分析

中图分类号:0212,F126.1文献标志码:A文章编号:1008-5831(2009)01-0024-06

在十六届五中全会上审议通过的“十一五”规划中,建设社会主义新农村成为了今后五年中国经济社会发展的重中之重。建设新农村的重要目的之一就是要稳步提高农民生活水平,通过工业反哺农业和城市反哺农村进一步加大投入力度,实现城乡统筹发展的良性互动,而新农村的意义正如温铁军所言“使得农民在新农村就能享受城里的一切”。而消费作为反映农民享受改革开放物质成果的重要指标,已经被学界给予了极大的重视。与收入相比,消费总量、消费结构可以更直接地表征农民的生活现状。中国幅员辽阔,各地区农民在收入、文化传统以及气候等客观条件上都存在巨大差异,所以运用因子分析、聚类分析等实证手段系统研究农民消费问题非常必要。

从已有文献看,该种实证手段已经得到了广泛应用。柯健运用2002年数据研究了城市居民消费,孙艳玲则研究了农村居民的消费结构;葛虹、逢守艳与殷玲分别用2002年和2001年的数据对比研究了城镇居民消费结构和农村居民消费结构的差异。以上文章在数据选取上多数集中在2002年以前。在实证方法上,多数学者分别采取了因子分析、聚类分析的方法,也有学者综合两种方法,例如孙艳玲利用因子分析结果再进行聚类分析,而葛虹则利用聚类的结果对不同区域进行因子分析,殷玲则根据GDP排名进行分类,再采取因子分析。不难发现综合多种方法对全国多层次的分区研究是实证研究的发展趋势。

笔者应用《中国统计年鉴(2005)》中的2004年全国31个地区的农业消费结构的八项数据,即:食品、衣着、居住、家电设备及服务、医疗保健、交通和通讯、文教娱乐用品及服务和其他商品及服务,综合运用因子分析和聚类分析等统计方法,以及农民纯收入的地区排名进行比对分析。笔者应用SAS9.1软件做实证分析,关于因子分析与聚类分析的具体数理过程、统计意义与程序编写参见《统计分析方法——SAS实例精选》。

分析步骤如下:首先选取2004年全国截面数据对于上述八项消费做因子分析,在提取两因子的情况下,得到全国31个地区的打分,按照得分排名,对比2004年农村居民家庭纯收入排名,表明全国各地区消费结构情况。再利用八项消费结构数据,对于31个地区做聚类分析,将各地区分为四个层次。比较该四个层次地区与东、中、西部划分所涵盖地区的异同。最后,把四个层次的地区与东、西、中部的地区分别做消费结构的因子分析,均提取三个因子,可以得到七种不同的因子结果,与全国的因子结果一起进行对比,得出结论。

一、实证分析简要过程及结果

首先计算2004年各地区农村居民家庭平均每人生活消费支出的消费结构数据(表1),计算八项消费的相关系数阵与协方差阵(表2),可以发现各个数列间具有很强的相关性,相关系数最低的为0.5949,最高可达0.963 4。基本上都在0.8以上,满足因子分析的条件。

在因子分析的结果中,各个因子的特征值、贡献率与累计贡献率(表3)为因子一的特征值为6.844,方差贡献率为85.55%,因子二特征值为0.5905,方差贡献率为7.55%,此时累计贡献率为92.94%。按照常规,特征值大于0.6的因子都应选取,而在0.6以下则一般不必选择,但是为了更好地解释原有信息,特把贡献率为2.24%的因子三也选人分析,使得累计贡献率达到95.58%。通过方差最大化旋转后的因子载荷矩阵(表4),判断变化趋势相近的消费项目。其结果显示,代表80%以上信息的因子一主要包括:衣着、医疗、交通通讯与文教,而代表信息7%的因子二则主要涵盖了食品与其他商品和服务;住宅和家庭设备归入因子三中。计算各地区的因子得分,得分虽然没有绝对意义但是得分的相互对比将说明各个地区农民的消费结构的对比。因子一的前五名为:北京、浙江、上海、山西、天津。因子二的前五名为:福建、广东、山东、浙江、上海。因子三的前五名为:上海、广西、浙江、云南、重庆。

包括因子命名等综合结果如表5。

各地区因子得分与排名,以及纯收入排名如表6。

如前文所述,中国幅员辽阔,地区间的自然条件、文化传统差异巨大,为了进一步分析各地区农村居民在八项消费上所体现出的规律,分出哪些地区在消费上体现出相近的特征,选取表5中的31个地区因子得分作为指标,采用欧式距离离差平方和(ward)方法进行聚类分析。结果输出如图1。

根据树状图,可以把全国31个地区分为四个层次。传统上对于中国31个地区的分类经常以地理划分的东、中、西部为准,为了探讨这种源于地理位置的分析是否能够代表农民消费结构体现的区域特征,特以2005年12月国家统计局公布的《全国经济普查主要数据公布(第一号)》1的东、中、西部地区划分作为比较标准,结果如表7。

运用因子分析进一步比较聚类的四个层次与东、中、西部三个区域的消费结构的异同,特对以上四个地区涵盖的区域作为样本,分别做四次因子分析。再对东、中、西部三个区域分别进行因子分析,限于篇幅分析过程从略。将七个分析结果以及全国的结构分析结果比较,在选取因子时,为了更好的代表原有信息,故尽量选取三因子,使其方差贡献率均达到80%以上。结果如表8。

二、对于实证结果的分析

以上实证分析可以分为两个部分,表5与表6是以31个地区为分析对象的因子分析的结果;表7与表8代表了对比聚类分析和地理分区的因子分析结果。以下分别予以分析。

在表5“全国31个地区消费结构因子分析结果”中,因子一解释了原有数据的大部分信息,而根据表6“各地区消费结构因子得分与排名”,因子一排名前五位的地区基本与我们一般认为的发达地区相符。另外分析结果显现出:在收入最高和最低的几个地区,各因子上的排名差距很小,说明富裕地区的农村居民各项消费都远强于贫穷地区的居民,而中间层次的地区则在各个因子排名上有很大差距,说明其消费有所侧重,这与我们的一般经验也一致。

从因子一包涵的消费项目来说,食品没有在因子一中,其包含的医疗、交通通讯和文化教育与传统消费相比都是超出基本生存需求的消费开支。该项目并列出现在解释原有信息80%以上的因子一中,

充分说明了中国农村居民的生活品质有了很大提高,不再局限于对于食品、住宅等必需品的追求。同时也可以说明医疗、文化等消费需求因占总消费份额大,所以刚性强、需求旺盛。作为次消费因子的因子二主要包括了食品以及其他商品服务,其排名前列的省份也是农民收入较高的地区。而通过观察因子载荷阵,不难发现住宅和家电的载荷在三个因子上的分布比较平均,只是在因子三上略大,故归入其中。这也是解释信息不足3%的因子三的排名将广西、云南等中西部地区排入前五名的主要原因。综合各个地区的排名来看,浙江、上海、北京在各消费项目中的水平最高,江苏、福建、广东等地区虽然在一般观念上也是东部发达地区,但是其在因子一上的得分较低,而在因子二、三上的得分较高,陕西、甘肃、青海、宁夏等欠发达地区的排名仍然较低。

从地区间的相互比较不难看出各地农民消费差异仍然很大,农村经济发展不够平衡,其现状与构建和谐社会的政策主张依然存在一定差距。就单个地区的因子排名而言,有的地区在各因子上的排名差距较大,这一方面和因子三的解释能力不强有关,但就因子一、二上的排名,以及对比收入的排名,仍然可以说明很多地区因传统消费观念与配套设施不足等收入以外的原因,制约了农民在医疗、教育和交通通讯上的消费。如广东、福建两地,其农民纯收入排名分列第6、7位,而在医疗、文教等项目上的开支却分列第18和第27,可见农民将很大部分收入用于了食品,故因子二排名在前两名。类似情况也出现在海南、湖南、湖北等省份,可见在这些省份收入并非是影响消费的首要因素。而在新疆、西藏、山西等地,其消费排名却显著高于收入水平,对于此类地区促进农民消费的主要动力在于增加农民收入。以上的这种规律在聚类结果中也有较为明确的体现。

在聚类结果表7中,总的来看传统意义上的东部地区在层次一中,东北三省在层次二中,西部地区在层次三中,而“两湖”、“江苏”、“江西”在层次四中,基本符合实践经验。

结合表7“聚类结果与东、中、西部地区划分结果对比”以及表6中的各地的因子得分,层次一基本上和东部地区重合,因子一、二排名均在前列,说明这些地区农民生活水平较高,且发展比较均衡;层次三基本上和西部地区重合,其因子呈现的规律和层次一相反,因子一和因子二排名都比较低,而解释力度较差的因子三排名较高,说明其仍然属于欠发达地区。农民消费无论在食品上还是其他方面的水平均十分有限;相对而言,层次二涵盖了辽宁等三个东部省市、山西等四个中部省市和七个西部省市,呈现出比较复杂的分层,通过表6中的因子得分可以发现这些地区的特征是:因子一排名较高,而因子二、三排名较低,基本上属于发达地区,农民消费在一定程度上超出基本生存需求,但是总体水平仍然不高;层次四涵盖了东部和中部的部分地区,通过表6中可知其因子一的得分都较低,而在食品、住宅和家庭设备得分较高,说明这些地区的食品开支和其他地区相比占比重较大。同时这些地区基本是中、东部较为发达的地区,收入水平较高,如前文分析的广东等地一样,之所以食品开支很大可能和消费习惯有关,也可能是医疗、教育等配套设施不足制约了其在体现生活质量上的项目进行消费。所以层次四中的地区在消费上潜力最大,可以通过对于配套设施的投入促进农民在文教、医疗等方面的消费。

表8通过对于层次一至四。以及东、中、西部三各地区的因子分析为八项消费划分共同的因子,进一步证明了表7分析的结论。其中东部地区的因子分析结果和全国的结果类似,说明东部地区所占的信息比重大于西部和中部地区,也说明了地区发展的不均衡。在聚类结果中,由于层次一的数据在各个消费项目上都分配比较均衡齐整,所以无法把八项消费如其他分类一样划分为三个层次,只能根据载荷大致划分为两个层次,此时已经解释了原有的100%信息,故在比较时说服力较差。而层次四的最终因子分类结果和全国的结果非常相似,均是衣着、医疗、文教等在因子一中,可以初步说明层次四所存在诸如配套设施不足阻碍农民消费的问题在全国范围内的消费结构上也有所体现。

三、政策建议

在建设社会主义新农村的过程中,中央一再强调要因地制宜,杜绝形式主义,防止竖立标准、盲目攀比等情况的发生。从笔者的分析中可以充分显现出因地制宜的重要性。传统地理位置上的东、中、西部,不能完全代表农民消费结构的特征,而聚类结果又充分显示出了消费特征在不同地域上所体现出的多层次性和复杂性。所以根据不同区域的具体情况,具体分析问题,加大投入力度,细化政策条款,才能杜绝形式主义,减少资源盲目配置和浪费现象。

在加大投入过程中,增加配套设施建设与增加农民收入在不同地区应有所侧重,才能有效促进农民消费。在以往对于农民消费问题的研究中。无论是采用实证的方式做线性回归模型,还是仅从经济学的原理出发,都会得出影响消费最显著的因素是收入的结论。这种分析一般是基于全国的总量数据提出的,而根据前文的分析,在很多地区尤其是聚类结果层次四中的地区,收入并非是制约消费的首要因素,配套设施的建设与消费观念的改进才是促进农民消费的关键环节。而在新疆、西藏等层次二中的地区,农民收入水平较低。所以消费相对于收入的排名已经比较靠前,增加农民收入对于提高农民生活水平的作用更为显著。当然对于安徽、贵州等层次三中的地区,农民收入水平和消费水平都较低,则需要重点扶持,农民增收与基础设施建设应该双管齐下。

实证数据所体现的另一特点是地区间的农民消费差距大,农民生活水平提高不够平衡。从因子得分上看,北京在因子一上高居榜首,其得分虽然绝对意义不大,但是相对于其他地区的比较却非常说明问题,北京的得分是位居第二的浙江得分的二倍多,是位居第三的上海得分的近四倍。这固然与北京地区农民的消费传统有关,但是这种因子分析后所显现出的过大差距说明了中国农村发展的不均衡性非常显著,在建设社会主义新农村的过程中必须针对这种差距加大投入力度,采取以城带乡、以工哺农等多种手段,从根本上改变偏远落后地区,尤其是中西部不发达地区的贫困现状,否则地区间的发展不平衡会愈演愈烈,极大地制约中国的经济建设和社会发展。

(责任编辑傅旭东)

猜你喜欢

消费结构聚类分析因子分析
基于ELES模型的河北省城镇居民消费结构分析
我国消费结构与产业结构互动机制的理论探讨
杭州市首次开展旅游消费结构调查
中国城镇居民消费结构的渐进式转变