湘西州农村居民生活消费现金差异性的聚类分析
2015-02-13张明辉莫宏敏欧祖军
张明辉,莫宏敏,欧祖军
(吉首大学数学与统计学院,湖南 吉首 416000)
湘西州农村居民生活消费现金差异性的聚类分析
张明辉,莫宏敏,欧祖军
(吉首大学数学与统计学院,湖南 吉首 416000)
选取构成农村居民生活消费结构的8项统计指标,对湘西自治州的8个县(市)进行聚类分析,并采用系统聚类中不同的方法对结果进行比较,将湘西自治州的8个县(市)分为3类.根据聚类分析所得到的结果,分别详细探讨了各个类之间农村居民生活消费结构的差异性,为当地政府制定更加合理的政策以提高人民生活水平提供有效的参考依据.
湘西自治州;农村居民;消费结构;聚类分析
湘西自治州位于湘、鄂、黔、渝4省(市)交界处,是武陵山片区的一部分,境内山地面积占全州总面积的81%.其地理位置偏僻,交通相对闭塞,一直是湖南省经济发展的薄弱地区.多年来,湘西自治州主要的经济指标增长速度低于同期全国和全省平均发展水平,属于典型的经济欠发达地区,是湖南省唯一进入国家西部大开发范围的地区,也是湘西开发重点地区和扶贫攻坚主战场[1].2012年,湘西自治州农村人口占全州人口的62.4%[2],可见其城镇化水平偏低,因此,要带动湘西自治州经济的发展,发展农村经济显得尤为重要.笔者选取构成湘西自治州农村居民生活消费结构的8项统计指标,用聚类分析的方法对所辖8个县(市)进行分类,并进一步剖析8个县(市)的农村居民生活消费结构的差异性.
1 统计指标的选取与数据来源
按照中国统计局的统计口径,构成居民生活消费性支出的8个项目是食品、衣着、居住、家庭设备用品及服务、医疗保健、交通通信、文化教育娱乐用品及服务、其他商品及服务.而针对实际生活中湘西自治州农村居民的生活消费大多为现金消费,并且为了消除各地区在区域面积、人口等方面的先天差异,选取农村居民人均生活消费在上述8个项目的现金支出,来分析湘西自治州8个县(市)的农村居民生活消费结构.湘西自治州8个县(市)农村居民人均生活消费现金支出[2]如表1所示.
表1 2012年湘西自治州8个县(市)的农村居民人均生活消费现金支出 /元
2 聚类分析及数据处理
2.1 聚类分析
聚类分析是一种将数据所对应的研究对象进行分类的统计方法[3],其基本原理是在样本间定义一种距离,将距离较近的归为一类,使得同一类事物之间的相似性程度高,不同类事物之间的差异性较大.最常用的距离定义方式是欧氏距离:
其中dij是第i个样本与第j个样本之间的距离,xik是样本数据xi的第k个分量,即第i个样本的第k个指标取值,p为样本变量个数,n为样本个数.
根据聚类算法的不同,聚类分析又有系统聚类法、动态聚类法、模糊聚类法等.本研究采用系统聚类方法,其基本思路是:
(ⅰ)构造一个最佳的初始分类状态(将n个样本各自作为一类);
(ⅱ)计算类与类之间的距离,组成矩阵D=(dij)n×n;
(ⅲ)找到2个最近的类,将它们聚为一类,并计算这个新的类和其他类之间的距离;
(ⅳ)重复进行(ⅲ),每次减少1个类,直到所有的样本都合并为一类.
2.2 数据处理
在系统聚类过程中,大多数据往往是不能直接参与运算的,特别是当各变量的单位不同或测量值的范围相差很大时,这时需要将数据作中心化或标准化处理.
由于表1的数据相差比较大,因此先在R软件上将其进行标准化.标准化的结果见表2.
表2 2012年湘西自治州8个县(市)的农村居民人均生活消费现金支出标准化
为了对结果进行比较,减少偶然性,样本之间距离都定义为欧氏距离,类与类之间的距离分别采用4种不同的方式定义(最长距离法、离差平方和法、类平均法和重心法).在R软件上运行相关命令后得到4种聚类结果如图1所示.从图1可知,由4种不同方法所得到的结果将湘西自治州的8个县(市)分为3个类比较合适.
图1 4种不同距离的系谱图
但是,由表1容易发现保靖县和泸溪县的各项消费差距均比较大,永顺县和龙山县除了食品消费和衣着消费,其他各项消费差距也明显较大,采用重心法将它们聚为一类,这显然是不合理的;如果再取较小的阀值将它们划分为4类或者更多类,就显得没有意义了.而在采用离差平方和法、类平均法和最长距离法所得到的结果中各个类的消费结构都很相似,分类结果都一致,且结果较为合理,因此最终采用这3种方法所得到的结果,将湘西自治州的8个县(市)划分为3类:第1类为吉首市;第2类为凤凰、保靖和龙山县;第3类为泸溪、永顺、花垣和古丈县.
3 各个类之间农村居民生活消费结构的差异性
第1类只有吉首市.其消费结构特点是:在食品、衣着、家庭设备用品及服务、交通通信、文化教育娱乐用品及服务等项人均现金消费明显高于其他县,在医疗保健和居住的人均现金消费却低于绝大部分县.前者主要是因为吉首市是湘西自治州的政治、经济、文化中心,在很大程度上带动了周边农村经济的发展,提高了周边农村居民的生活水平,而后者说明了吉首市农村居民医疗负担相对轻松.
第2类有凤凰、保靖和龙山3个县.它们之间的各项消费差异性不大,其消费结构特点是:它们之间的各项消费差异性不大,在居住和医疗保健上的人均现金消费比其他县(市)都高,其他各个消费项均处于湘西自治州中等水平.说明这一类地区的农村居民比较重视居住环境,但是医疗负担相对较重.
第3类有泸溪、永顺、花垣和古丈4个县.它们的各项消费普遍处于全州的低水平,且存在一些差异,主要表现在:泸溪县衣着消费远低于其他县(市);永顺县的居住和医疗保健消费不到全州各县(市)的50%;花垣县的居住消费位居全州第二,但是其文化教育娱乐用品及服务人均消费却相当低,仅73.77元;古丈县的交通通信人均消费较高仅次于吉首市,但是其文化教育娱乐用品及服务人均消费却相当低,仅54.54元.这在一定程度反映了泸溪县和永顺县的农村居民生活比较节俭,永顺县的农村居民医疗负担相对较轻;花垣县的农村居民比较重视居住环境,但对教育不够重视;古丈县的农村居民对教育也不够重视,并且其交通设施也不够完善.
4 建议
湘西自治州的8个县(市)农村经济发展不平衡,呈现出中部经济在全州比较宽裕、西边区比东边区总体发展要好的势态,8个县(市)的消费结构存在着一定的差异,另一方面对比国家统计局的数据[4],可见全州各项消费指标远低于全国平均水平,为此笔者提出几点建议:
首先,各个县(市)都要加强农村经济建设,吉首市要充分发挥其作为湘西自治州的经济和政治中心的作用,强化其对周边县城的辐射作用;全州县(市)应该加强经济联系,各县(市)不仅要发挥自身优势,也要取长补短发展自身经济,逐步缩小各县(市)之间农村经济的差距.
其次,各县(市)应该优先完善自己的薄弱之处,如凤凰县、保靖县和龙山县须加强医疗设施建设,减轻这3个县的医疗负担,古丈县须加强交通设施的建设,花垣县和古丈县的农村居民须加大对教育的投资,因为教育是促进经济和社会发展的重要因素.
[1] 丁洁琼.湘西自治州山区聚落空间演变及规划调控研究[D].长沙:湖南师范大学,2014.
[2] 中国统计局.湘西统计年鉴[M].北京:中国统计出版社,2013.
[3] 薛 毅,陈立萍.统计建模与R软件[M].北京:清华大学出版社,2007.
[4] 中华人民共和国国家统计局.国家数据[EB/OL].[2014-07-20].http:∥data.stats.gov.cn/easyquery.htm?cn=C01&zb=A0A0G&sj=2012.
(责任编辑 向阳洁)
Cluster Analysis on the Difference of Living Consumption of the Rural Residents in Xiangxi Autonomous Prefecture
ZHANG Minghui,MO Hongmin,OU Zujun
(College of Mathematics and Statistics,Jishou University,Jishou 416000,Hunan China)
In this paper,eight statistical indexes of the living consumption structure are selected for the cluster analysis of the rural residents in the eight counties and cities of Xiangxi Autonomous Prefecture.The results are studied by different hierarchical clustering methods.The eight counties and cities of Xiangxi Autonomous Prefecture are divided into three categories,and the differences of living consumption structure of the rural residents among the three categories are respectively discussed according to the results of cluster analysis.This study provides effective reference for the local government to set more rational policies to further improve people's living standards.
Xiangxi Autonomous Prefecture;rural residents;consumption structure;cluster analysis
1007-2985(2015)04-0071-04
欧祖军(1979—),男,湖南宜章人,吉首大学数学与统计学院副教授,主要从事概率统计与试验设计研究;E-mail:ozj9325@mail.ccnu.edu.cn.
F127;O211
A
10.3969/j.issn.1007-2985.2015.04.017