考察我国各省市自治区社会发展综合状况
2016-04-20闫美玲
闫美玲
摘 要:近几年来,随着我国经济的快速发展,带动我国各省市自治区社会的发展也取得了瞩目的成就。为了考察我国各省市自治区社会发展的综合状况,本文选取了人均地区生产总值(元)X1、城镇居民可支配收入(元)X2、农村居民家庭人均纯收入(元)X3、在校学生数(人)X4、学校数(所)X5、卫生机构数(个)X6、固定资产投资总额(亿元)X7、每万人拥有公共交通车辆(标台)X8八个较为客观的指标,综合衡量一个地区的经济发展。本文分别通过使用SPSS中的主成分分析法和因子分析法研究相关问题。
通过主成分分析法及因子分析法得到的相关结果可知:北京、天津、上海及江苏等地区社会发展的综合状况排在全国前列。排在前列的省市自治区大多数都有着一定的经济发展积淀,长期的经济发展再加上相关政策的推广更加推动了该地区社会发展。因此,国家应加大对于偏远地区,经济不发达地区优惠政策的推广力度,使之更快的更好的发展,进而缩小我国贫富差距。
关键词:社会发展的综合状况;主成分分析法;因子分析法
一、引 言
本文的实验目的为考察我国各省市自治区社会发展综合状况,但统计的各项指标相关性较强,因此可以用SPSS软件中的主成分分析和因子分析进行分析实验,通过分析导出少数几个主分量,使他们尽可能多地保留原始变量的信息且彼此间不相关,从而来研究复杂的问题。通过分析我们可以了解到我国各省市自治区的发展状况:由各因子载荷/负荷矩阵的系数,我们可知实验得到的各主成分或公共因子分别反映我国省市自治区发展水平的哪一方面,从而可以了解到我国各省市自治区各方面的发展状况;再通过综合分析,可得到我国各省市自治区各方面的综合发展状况。
二、主成分分析实验
(一)主成分分析的基本思想
主成分分析是考察多个定量(数值)变量间相关性的一种多元统计方法。具体的说,它是通过导出少量几个主分量,使他们尽可能多的保留原始变量的信息,且彼此间不相关。它的一般数学模型有:利用n个样本的p项指标的信息区别这n个样本。因此,要从这p项指标中找出少数几个综合指标使他们尽可能地反映各项指标的信息,且彼此之间不相关。即:
(二)主成分分析的实验结果及分析
为了考察我国各省市自治区社会发展的综合状况,本文选取了人均地区生产总值(元)X1、城镇居民可支配收入(元)X2、农村居民家庭人均纯收入(元)X3、在校学生数(人)X4、学校数(所)X5、卫生机构数(个)X6、固定资产投资总额(亿元)X7、每万人拥有公共交通车辆(标台)X8八个指标进行实验分析。
利用SPSS进行主成分分析得到八个指标的相关矩阵,由矩阵可知,各变量之间存在着较强的相关关系,如果直接用于分析,可能会带来严重的共线性问题,因此有必要对变量进行主成分分析。计算解释总方差得出第一主成分的特征跟为4.064,它解释了总变异的50.796%;第二主成分的特征值为2.844,它解释了总变异的35.547%;根据主成分个数的确定原则,即特征跟大于1、累计方差贡献率达到80%~85%以上,确定这八个变量需要提取两个主成分。
计算主成分中因子载荷矩阵,依据第i个主成分的变量系数向量等于此表中的第i列除以第i个特征根的算术平方根得:
从上式可以看出,第一主成分主要由X3、X4、X5、X7确定的,他们在式中的系数大于其他的系数,故可以认为第一主成分说明文化投资建设。第二主成分主要由X1、X2、X6、X8确定,可以认为是经济发展程度。
经过综合评价分析可得主成分得分,经排序整理得出名次表,从结果给出的答案可以看出,北京、上海、江苏、浙江、广东、天津、山东等地综合排名位于前列。北京地区作为我国首都无论是文化投资建设还是经济发展程度都名于前列,并且经济发展程度位于全国首位。上海经济发展位于第二,文化投资建设也靠前。江苏和山东地区文化投资建设为全国首位。山东是我国孔孟文化的发源地。儒家文化浓厚。贵州、云南、西藏、甘肃等地排名靠后。这些地区无论是教育投资还是经济发展都落后全国平均水平。国家应该大力支持这些地区的教育事业,多给予这些地区一些政策优惠,多发掘各地的特色,例如西藏地区改善交通,以旅游业为主带动经济。多鼓励这些地区的小企业户,促进这些地区的经济发展,进而缩小我国贫富差距。
三、因子分析实验
(一)因子分析的基本思想
因子分析是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组变量间的相关性较低。因子分析的目的是寻求变量的基本结构,简化观测系统,减少变量维数,用少数的变量来解释复杂问题。
它的一般数学模型有:
设有n个向本,p个指标。X=(X1,X2,…,Xp)T为可观察的随机变量寻找公因子为f=f1,f2,…,fq,则模型:
为因子分析模型。
(二)因子分析的实验结果及分析
利用SPSS软件对我国31个省市自治区的八个指标进行因子分析。得到变量共同度矩阵,从中我们可以知道除了指标X8以外,X1到X7其他7个变量都能很好的被两个因子解释。这七个变量的因子共同度均在0.7以上。
由因子分析中旋转后的因子负荷矩阵可知旋转的因子系数已经很明显的向两级分化,有了很鲜明的经济意义,给予了变量指标更实际的意义。F1中系数绝对值大的主要有:X4(在校学生数)、X5(学校数)、X6(卫生机构数)、X7(固定资产投资总额)。这四项变量指标主要反映各地区的基础设施文化投资;F2中系数绝对值大的主要有:X1(人均地区生产总值)、X2(城镇居民可支配收入)、X3(农村居民家庭人均纯收入)、X8(每万人拥有公共交通车辆)。这四个变量指标主要反映各地区的经济发展程度。
经过综合评价分析可得到各因子的得分数,进行排名整理可得,此结果与主成分的结果存在一定的出入。以实际情况来考虑,北京上海等地的经济发展以及基础设施都是全国最靠前的,相对来说主成分分析的结果更接近现实。
总 结
首先由主成分分析法得到的主成分的得分及排序可知,北京、上海、江苏、浙江、广东、天津、山东等地综合排名位于前列。其原因在于这些地区的文化投资建设及经济发展程度都位于前列。贵州、云南、西藏、甘肃等地排名靠后,这些地区社会经济发展综合状况远远落后于全国平均水平。国家应该加大对这些地区的教育投入,多培养一些现代化的人才。并结合当地具体的实际情况,重点扶持当地具有特色的事业,改善文化、交通、生活水平。多鼓励这些地区的小企业户进行集体合作进行相关特色产品加工出售等方式,建成一条负有当地特色的一体化的产业链。
此外,运用因子分析法得到的结果与主成分的结果存在一定的出入。但以实际情况来考虑,北京上海等地的经济发展以及基础设施都是全国最靠前的,各方面发展及建设较为全面。因此,相对来说主成分分析的结果更接近现实。(作者单位:首都经济贸易大学信息学院)