基于面板数据的伊犁州直县(市)综合经济的因子分析
2015-01-02张茜,刘淼
张 茜,刘 淼
(伊犁师范学院数学与统计学院,新疆伊宁835000)
伊犁州直县(市)2013年经济发展保持平稳增长态势,对新疆的政策实践起到了重要的意义,但在经济运行中仍存在一些突出的问题.本文主要研究了伊犁州直10个县(市)包括伊宁市、奎屯市、伊宁县、霍城县、察布查尔锡伯自治县、巩留县、新源县、尼勒克县、昭苏县、特克斯县的综合经济情况,依据《伊犁哈萨克自治州2013年年鉴》《伊犁调查年鉴》等资料和相关统计公报收集了伊犁州直10个县(市)2013年综合经济数据,依据因子分析的原理对其进行实证分析,得出伊犁州直县(市)的经济运行状况,并对出现的问题提出相应的改进意见和建议.
1 因子分析
1.1 概念和意义
因子分析的本质在于通过研究诸多原始变量之间的内部关系,利用诸多变量之间存在的共同因子简化变量间的复杂关系,即将诸多变量均分解为公共因子和单一因子两部分,根据多元统计分析的原理,通过剔除公共因子,由较少的相互独立的因子变量来反映原始变量的信息,具体表示为
其中,p个原始变量分别为x1,x2,x3,…,xp,且均已被标准化,因子变量分别为F1,F2,F3,…,Fm(m<p),即X=AF+aijε,这里F是公共因子,A表示因子载荷矩阵,因子载荷aij表示原始变量xi在因子Fj上的负荷,原始变量不能被因子变量解释的部分记作特殊因子ε,即残差部分.
1.2 建立数学模型
首先,对原始变量之间的相关系数矩阵进行分析,找出少数几个可以影响所有原始变量的复合变量,并用其描述出诸多原始变量间的关系,这种R型因子分析所得变量间的关系可通过因子载荷矩阵实现.依据每个原始变量与公共因子相关性的大小,按相关性较高的变量属于同类、相关性较低的变量属不同类的原则进行完全分类,根据公共因子所包含变量的特点对因子进行解释命名.
对9个变量进行分析,X1为第一产业生产总值,X2为第二产业生产总值,X3为第三产业生产总值,X4为各县市民族人口数,X5为社会消费品零售总额,X6为社会固定资产总投资,X7为在岗职工工资总额,X8为建筑施工企业总产值,X9为地方财政收支情况.
运用spss17.0统计软件进行因子分析,从表1可知有9个指标的数据,故先进行9个指标数据的标准化处理,然后进行KMO检验和球形Bartlett检验,检验结果如表2所示,KMO统计量的值为0.641,Bartlett检验的卡方统计量值为136.089,由此可知表1各项指标数据是适合进行因子分析的.
表1 9个指标数据统计表
表2 标准化处理检验结果KMO and Bartlett’s Testa
1.2.1 提取公共因子
根据主成分分析方法的原理,如表3所示,前两个公共因子特征值的累计方差贡献率达到了88.334%,故只需对前两个主因子进行分析即可.
表3 总方差解释表
1.2.2 因子命名及得分
由于因子负荷的大小反映了某个指标对某个公共因子重要程度,故需要通过计算因子载荷矩阵确定公共因子与各个原始指标间的相关系数.根据因子载荷矩阵(表4)可以看出,公共因子与各变量间的差异不明显,所以要进一步进行旋转,选择方差最大化进行因子旋转,得到旋转后的因子载荷矩阵(表5).由表5,可将指标集分为两个主因子,第一主因子在地方财政收支情况、社会消费品零售总额、第三产业生产总值方面显著;第二因子在第一产业生产总值、各县市民族人口数方面显著.
表4 因子载荷矩阵
表5 旋转后的因子载何矩阵
表6 因子得分系数矩阵
根据表6得到因子分析模型和因子得分函数为
两个公共因子从各方面反映了各地区的经济状况,由于λ1=73.663,λ2=14.681,根据,即可得到各县市综合经济因子得分(表7).
表7 各地区综合经济公共因子得分及综合得分排序
2 聚类分析
聚类分析是研究“物以类聚”的一种多元统计分析方法,根据样本的多个观测指标,对事物进行分类.目前被广大学者广泛应用的是谱系聚类法,先将各变量各自分类,再将上述指标中最接近的聚为一类,以此类推,直至将所有子类聚为一类,进而得到了一个根据相似性强弱聚集在一起的一个谱系大类.
通常用来定义样本距离的方法有欧氏距离、绝对距离、Minkowski距离等,其中欧式距离最为常见.我们采用组间平均数类间法对表7作聚类分析得到谱系图(图1)
图1 谱系图
3 主要结论和相应对策
通过选取2013年伊犁哈萨克自治州综合经济的9个主要指标数据,分别根据因子分析方法和聚类分析的原理对所选数据进行了实证分析,得到了影响综合经济变动水平的两个主要因子,并结合聚类分析对变动水平因子进行聚类,得到如下结论.
伊犁州直10个县(市)中伊宁市、奎屯市的第一个公因子得分和综合得分排名都在第一位,而第二个公因子排名却靠后,说明这两个城市由于各民族人口数较少,不以农林渔业方面的发展为主;另外伊宁市、奎屯市又是伊犁州政治、经济、文化的中心,代表着伊犁州整体经济发展的风向标,在伊犁州发挥着不可替代的作用;伊宁县、霍城县、新源县是面积较大的农业大县,拥有得天独厚的生态资源,因此其第二个公共因子得分较高;察布查尔县、昭苏县、尼勒克县、巩留县、特克斯县离首府伊宁市较远,受交通资源等环境因素制约,经济发展相对落后.分类结果如表8所示.
表8 分类结果
由综合得分可以看出,各地区应充分利用自己的资源,如新源县应继续加大旅游业的发展,伊宁县应发展农牧业的资源优势等,继续推行西部大开发战略,缩小各地区的差异,从而推进伊犁州整体经济协调发展.
[1]张润楚.多元统计分析[M].北京:科学出版社,2006.
[2]伊犁州统计局.伊犁州统计年鉴(2013)[Z].2014.
[3]梅长林,周家良.实用统计方法[M].西安:西安交通大学,2005.
[4]刘淼,姜福成.基于面板数据的伊犁州直县市经济社会发展因子的实证分析研究[J].数学的实践与认识,2013(43):25-29.
[5]石宏景.基于因子和聚类分析的居民消费价格变动水平评价[J].西南农业大学学报,2012(10):23-27.
[6]吴栋,李乐夫,李阳子.近几年居民消费结构统计分析的研究综述——关于因子分析和聚类分析的应用[J].数理统计与管理,2012(26):776-781.
[7]汪磊,罗蓉,王志凌.因子聚类分析在西部中心城市经济发展评价中的应用[J].经济研究导刊,2011(10):152-154.
[8]王娜娜.基于面板数据的江苏城市经济社会发展水平评价[J].中国证券期货,2012(1):118-119.