因子分析的一个简单应用
2016-03-14陈望学李洋阔
陈望学 李洋阔
摘 要: 文中搜集了对我国31个省市2008年农村发展状况相关的10个变量(中国统计年鉴2008),利用因子分析,对31个省市农村发展的综合得分进行排序后,对这些结果分析并提出合理的建议。
关键词: 因子变量 因子解释 因子得分
1.因子变量的构建
因子分析[1]-[2]的原理是将原有多个变量综合成少数几个主要因子,以再现原始变量与因子之间的相关关系。在进行因子分析之前,首先是确定因子数目,目前常用的方法是碎石图检验准则。碎石图检验准则是根据因子被选取的顺序而做出特征值随因子个数变化的散点图,将这些散点连接近似成一条曲线,曲线开始变平的前一个点被定为提取的最大因子数。后面的散点就会类似于山脚下的碎石,可舍掉而不会丢失较多的信息。
2.因子解释
初步得到的因子的实际意义往往较难解释,因此往往采取因子正交旋转法使得各因子的意义变得明确。以下是通过因子正交旋转法得到的旋转后因子载荷矩阵的转置矩阵:
3.因子得分和分析
基于上表有如下分析:
(1)上海、北京和浙江的综合得分分别是2.5、1.77和1.66,位于排名的第一、二和三位,农村经济的发展在全国地区很好。尤其上海的农村发展这么快,重要的原因是上海推动“城乡发展一体化”,促进城乡发展一体化并加强落实“三倾斜一深化”,发挥新城和新市镇对城乡发展一体化的推动作用,逐步缩小城乡差距。走一条“以人为本、四化同步、生态文明、文化传承”的新型城镇化道路,以高质量的新型城镇化推动高水平的城乡发展一体化。并且城市支持农村的力度不断加大,郊区农村整体面貌明显改善,农民生活水平和质量不断提高,因此上海的农村发展最快。接下来是江苏和广东,但江苏与北京之间得分相差较大,存在明显的差距。除上海、浙江、北京外,其他地区的农村经济发展需要进一步加强,政府应该多制定些鼓励政策和加大对这些地区的投资[3]-[4]。
(2)综合排名比较差的是:西藏、贵州和青海地区,其中贵州和青海地区的农村发展水平差不多,但是西藏的农村发展平最差。其原因是西藏大部分地区尚处在加强必要的基础设施建设时期,经济社会发展仍然主要依靠国家投资拉动,许多县还不能跟上内地的一个乡镇,经济发展缓慢。其中青海地区、贵州地区农村发展缓慢的原因是:这两个地区的面积大部分是属于丘陵地带和山区,人多地少,特别是可利用耕地较少,难于利用的林地较多;交通闭塞,基础设施较为薄弱,基础设施建设难度大,因此该地区的农村发展较慢。
(3)第一公共因子F1代表人民的生活水平,上海、北京和浙江的农村的人民生活水平较高,得分分别是3.42、2.58和1.97。也就是说,在人民生活水平方面,上海的农村发展最好。但是贵州和西藏的得分很低,且与其他地区相差较大,说明该地区的农村人民生活水平较差,需要改善目前的状况。第二公共因子F2代表劳动力资源,其中山东、广东和四川得分比较高,也就是说,该三个地区的农业从业人员比较多,其中四川具有“水稻状元”之称,并且红苕、棉花产量、油料、甘蔗、水果种类、茶叶种类及产量、烟叶均走在全国前列,可以称得上农业多种生产的典型。山东省不但小麦、玉米产量大,而且花生、水果、蔬菜和水产品等种类多且品质高,拥有全国最多的绿色农产品。目前山东已经逐步向农业农业强省迈进,从事农业的人数普遍偏多,农业发展比较快。但是西藏地区和贵州地区在F2(从事农业的劳动力资源)得分比较低,西藏地区与其他地区差别比较大,因为西藏地区以畜牧业游牧为主,农业以旱地农业为主,并且人口稀少,所以从事农业生产的人数比较少。而贵州地区由于地理条件的限制,一直处于落后的状态,交通不是很发达,很多地方不能实行机械化,因此从事农业生产的人数比较少。
参考文献:
[1]范金城,梅长林.数据分析[M].中国人民大学出版社,2004.
[2]高惠璇.应用多元统计分析[M].北京大学出版社,2005.
[3]刘慧.我国农村发展地域差异类型划分[J].地理学与国土研究,2002(04).
[4]周沛.农村社会综合发展的十个问题[J].江苏社会科学,1999(04).
基金项目:吉首大学独立设置实验课程建设项目(JDDL2015001);吉首大学实验室开放基金项目(JDLF2015001);吉首大学校级教改项目(2014JSUJGB28)。
通讯作者:陈望学