典型相关分析在人口和经济特征系统关联分析中的应用
2017-01-03宋林强
宋林强
(成都理工大学管理科学学院,四川 成都 610000)
典型相关分析在人口和经济特征系统关联分析中的应用
宋林强
(成都理工大学管理科学学院,四川 成都 610000)
人口特征系统与经济特征系统的关联性研究是当前人口、经济研究的关键。本文通过运用典型相关分析,定量深刻刻画了两个系统之间的关联关系,发现居民消费价格指数与“人口组”的城镇人口比、人口自然增长率;GDP与城镇人口之间的典型相关关系,并揭示了其他特征要素的基本信息。有效的分析了人口和经济特征系统的关联关系。
典型相关分析;人口特征;经济特征;关联关系
1 前言
人口基本特征与经济的增长、经济产业的分布、产业聚集等各类经济要素特征都有相关性。但是对人口基本特征系统与经济要素特征系统的关联分析多处于定性分析。为了进能够进一步定量刻画人口特征变化对经济要素特征的影响程度,本文采用典型相关分析法来研究两个特征系统的关系。
2 典型相关分析的基本思想
统计分析中,用简单相关系数反映两个变量之间的线性相关关系,用复相关系数反映一个变量与多个变量之间的线性相关关系。1936年,Hotelling将线性相关性推广到两组变量的讨论中,提出了典型相关分析。它的基本思想是仿照主成分的把多变量与多变量之间的相关化为两个变量之间的做法。首先在每组变量中找出变量的线性组合,使其具有最大相关性,然后再在每组变量找出第二对线性组合,使其分别与第一对线性组合不相关,而第二对本身具有最大的相关性。如此下去,直到两组变量之间的相关性被提取完毕为止。有了这样线性组和的最大相关,这讨论两组变量间的相关,就转化为研究这些线性组合的最大相关。对于人口特征和经济要素特征,我们设其为两组随即向量,x(p维),y(q维),从中选取若干个有代表性的综合变量uk和vk,他们是原始变量的一个线性组合,即:
其中,a1k,a2k,Λ,apk;b1k,b2k,Λ,bqk是待定系数。对每一个aik、bik的要求是:
使得每一个uk和vk的算术平均数为0,标准差为1;
使得任意两个uk和两个vk之间彼此独立或者不相关,并且k1≠k2当的时候,uik和vik彼此独立或者不相关;
使得uk和vk的相关系数rk满足关系式:
1≥r1≥r2≥…≥rk≥0
将uk和vk称为典型变量,rk称为典型相关系数,那么r1对应的u1和v1反映的相关成分是最多的,故将其分别称为第一典型相关系数和第一典型变量,以此类推可以得到若干典型相关系数和典型变量,我们再通过典型冗余分析选择反映足够多信息的一对或几对典型变量,并进行显著性检验。
3 模型建立与结果验证
3.1 模型建立
结合前人的研究结论,以四川省人口经济数据作为研究对象。将体现四川省经济要素特征的五个主要方面作为研究的因变量组,简称“经济组”,即:四川省居民人均收入(元),记为:Y1;四川省不变价格GDP(亿元),记为:Y2;四川省第三产业比重(%),记为:Y3;四川省经济增速(%),记为:Y4;四川省居民消费价格指数,记为:Y5。
将体现四川省人口特征的6个主要方面研究的影响组,简称“人口组”,即:四川省人口总数(百万),记为:X1;四川省劳动人口数(百万),记为:X2;四川省城镇人口比重(%),记为X3;四川省老年人口比重(%),记为:X4;四川人口不均衡指数,记为:X5; 四川省人口自然增长率(%),记为:X6。(数据来源历年统计年检)
3.2 结果验证
通过KMO和Bartlett的检验得到“经济组”和“人口组”的组内相关性卡方统计量近似值为295.042,显著性Sig.值为0.000,表明原始变量组内部存在一定的相关性,适合进行典型相关分析。能够用“人口组”指标来解释“经济组”指标的变化。
调用统计科学软件SPSS的Canorr过程,得到人口组与经济组的典型相关分析结果。建立两对典型变量的典型相关模型为分别计算得到“人口组”和“经济组”与典型变量的典型结构图,如图1和图2。
图1 “人口组”与“经济组”第一对典型变量的典型结构图
图2 “人口组”与“经济组”第二对典型变量的典型结构图
从图中的系数来看:
第一典型变量,的典型相关系数为1.000,它们主要代表“经济组”的不变价GDP Y2与“人口组”的城镇人口比X3,其载荷分别为:0.995和1.511,这说明四川省的不变价GDP主要受到人口特征中的城镇人口比重的影响,其增长也主要依靠城镇人口比重的增加。
第二典型变量,的典型相关系数为0.940,它们主要代表“经济组”的居民消费价格指数与“人口组”的城镇人口比、人口自然增长率,其载荷分别为:3.297、1.119,这说明四川省的居民消费价格指数是受四川省城镇人口比重与人口自然增长率的共同作用的影响。
由此可见城镇人口比重对所有经济特征均有显著的影响。同时,四川省人口不均衡指数的载荷最高为3.297,说明四川省人口分布的不均衡对经济的影响最为严重。
最后计算分析经济组变量的典型冗余,得到表1。典型冗余分析能够很好地揭示典型变量的解释能力。从典型相关系数的平方来看,第一和第二典型相关变量的解释能力都比较强,分别有100%、88.36%的信息能够被影响组解释。同时,经济组变量被其配对典型变量解释的百分比也很高,累计达0.686。即说明四川省人口特征的变量对经济特征影响的典型相关变量有很强的解释能力。
表1 经济组典型冗余分析
4 结论
本文运用典型相关分析四川省人口特征系统与经济特征要素系统之间的关联性,并通过典型冗余分析选择反映足够多信息的一对或几对典型变量,并进行显著性检验,分析经济组被其配对典型变量解释的百分比,最后验证了通过得出的两个典型变量能否具有强的解释性。因此,运用典型相关分析能够有效深刻定量的刻画两个系统之间的关联性。
[1] 李洪心,高威.中国人口老龄化对消费结构影响的灰色关联分析[J].人口与发展,2008,14(16):71~72.
[2] 范君君,张良勇等.基于灰色关联分析的甘南州经济增长与人口特征分析[J].草业科学,2009,26(11):52~53.
[3] 高萌.中国经济“新常态”下的劳动力要素特征研究[D].吉林大学,2015.
[4] 李建民.中国的人口新常态与经济新常态[J].人口研究,2015,01:3-13.
[5] 段成荣,孙磊.流动劳动力的收入状况及影响因素研究——基于2005年全国1%人口抽样调查数据[J].中国青年研究,2011,01:54-61.
宋林强(1992.1-),男,成都理工大学,已获得大学本科学士学位,现在读硕士研究生学历。
G80-32
A
1671-1602(2016)22-0109-02