APP下载

影响人口增长率的回归分析

2017-12-15张琼枝陈望学周慧婷贺小芳

经济研究导刊 2017年36期
关键词:共线性回归方程方差

张琼枝,陈望学,周慧婷,贺小芳

(吉首大学数学与统计学院,湖南 吉首 416000)

影响人口增长率的回归分析

张琼枝,陈望学,周慧婷,贺小芳

(吉首大学数学与统计学院,湖南 吉首 416000)

我国人口基数庞大,人口问题是我国的长期问题之一,是关系我国社会经济发展的关键性因素。从经济、城镇化和医疗卫生三个方面出发,选取人均GDP、农村人口比重和卫生总费用对人口增长率做多元线性回归分析。得到结论:在其他因素不变的情况下,当农业人口比重每增加1%,人口自然增长率平均增加0.354%,卫生总费用每增加1亿元,人口自然增长率平均增加0.002%。

人口问题;人口增长率;多元线性回归

一、引言

人口的合理增长是影响国家发展的一个大问题,因此准确分析影响人口增长的因素是制定合理人口政策的关键。一个国家或地区人口数量的增加,是人口自然变动和机械变动综合作用的结果,但通常取决于自然增长率。影响人口增长的因素既有政策性因素如计划生育政策的实施,也有非政策性因素如经济因素、农业因素和医疗卫生因素等[1]。其中,经济因素对人口增长的作用主要表现在它决定了人口的增殖条件和生存条件,通过改变人口的出生率和死亡率来影响人口增长率;而农业因素对人口增长的作用主要表现在农业人口与人口增长呈正相关关系,由于农村生活条件、社会保障等问题使得农村养儿防老观念严重;医疗卫生因素则通过影响人口死亡率,进而影响人口增长率。因此,本文选取人均GDPX1、农业人口比重X2和卫生总费用X3作为解释变量,人口增长率Y作为被解释变量,通过收集2001—2015年各变量的原始数据[2]构建回归模型。

二、模型建立

(一)相关性分析

表1 相关系数

由表1可以看出,Y与X1、X2和X3有较强的相关性,说明用Y与自变量作多元线性回归是合适的。

(二)模型的建立与参数估计

为了准确计量各产业变动对经济增长的影响,本文引入以下回归模型:

其中,β0、β1和β2为回归系数,ε为随机干扰项。用SPSS软件对各变量的原始数据做线性回归分析,得到的结果(如下页表2所示)。

由表2可得回归方程为:

该回归方程表明,当农业人口比重增加1个单位时,人口增长率平均增加0.3540个单位。

表2 模型估计结果

(三)显著性检验

表3 模型汇总

1.拟合优度检验。由表3可得方程可决系数R2=0.970,修正可决系数2=0.961,二者均接近于1,说明模型对样本拟合得较好。

2.F 检验。针对原假设 H0:β1=β2=β3=0,F 统计量的值为116.602,其P值远小于给定的显著性水平α=0.05,故应拒绝原假设。即自变量X1、X2和X3联合起来对Y有显著的线性影响。

3.t检验。由表 2 可知,针对原假设 H0:βj=0(j=0,1,2,3),在给定显著性水平α=0.05时,X2的t统计量的P值远小于α,即X2对人口增长率影响显著。X1和X2则没有通过t检验,表明方程中可能存在多重共线性。

三、模型优化

(一)多重共线性的检验与修正

1.多重共线性的检验。从表2看到,X1、X2和X3的方差扩大因子 VIF很大,分别为VIF1=208.429,VIF2=51.197,VIF3=208.429,远远超过10,说明该回归方程存在严重的多重共线性。

2.多重共线性的修正。本文采用逐步回归法来解决多重共线性问题,最后修正严重多重共线性影响的回归结果(见表4和表5)。

表4 模型汇总

表5 模型估计结果

由表4可知,通过逐步回归法修正多重共线性后,方程的可决系数和修正可决系数仍接近于1,说明样本拟合的较好。F统计量的P值小于0.05,说明自变量X1、X2和X3联合起来对Y有显著的线性影响。且和的t统计量的P值也远小于0.05,即对人口增长率影响显著。根据表5可得回归方程为:

该回归方程表明,当其他自变量保持不变时,农业人口比重每增加1个单位,人口增长率平均增加0.292个单位;卫生总费用每增加1个单位,人口增长率平均增加0.001个单位。

(二)自相关的检验

在进行多重共线性修正之后,本文未考虑经济因素人均GDP对人口增长率的影响,而是将其纳入随机扰动中,这可能会导致误差项之间产生线性相关,因此需要对回归方程进行自相关检验。本文采用DW检验法[3]检验自相关,由表4可知,DW=2.413。针对样本容量n=15,显著性水平α=0.05且含有两个解释变量的方程,查DW统计表可知,dl=0.95,du=1.54,故du<DW<4-du。因此,该回归方程不存在自相关,而是否存在异方差还需要进一步验证。

(三)异方差的检验与修正

1.异方差的检验。由于上文多重共线性的修正略去了人均GDP对人口增长率的影响,而将该影响因素归入随机扰动项中可能会导致异方差,所以要对模型进行异方差检验。本文采用等级相关系数法[4]进行异方差检验,得到的结果(如 表6所示)。

表6 等级相关系数

由表6可知,X1、X2和X3的等级相关系数分别为X1=0.071,X2=-0.071和X3=0.071,其对应的P值均大于给定的显著性水平α=0.05,表明方程存在异方差。

2.异方差的修正。由于X1的等级相关最大,故通过选取X1构造权函数来修正异方差。利用SPSS软件进行分析,得到的结果(如表7所示)。

表7 模型汇总

表8 模型估计结果

从表7和表8可知,可决系数R2为0.970,F检验通过,解释变量X1和X3的t检验也显著,也符合经济意义,即模型拟合得好。

本文首先通过经济理论基础对人口自然增长率定性分析,选取了三个主要影响因素。建立总的回归方程后,对其进行多重共线性、自相关和异方差的诊断与修正,得到只含有X2和X3的最优回归模型。

Y=-15.996+0.354X2+0.002X3(4)

从(4)式可知,在其他因素不变的情况下,当农业人口比重X2每增加1%,人口自然增长率平均增加0.354%;卫生总费用X3每增加1亿元,人口自然增长率平均增加0.002%。

四、政策建议

第一,健全社会保障制度。现在稳定低生育率的关键在于农村,而农村的后顾之忧在于养老问题。因此,要在农村开办计划生育系列养老保险,为人口控制提供稳定的社会保障基础,如为独女户父母、两女绝育户父母、独男户父母办理养老保险等。

第二,加强医疗建设,提高医疗服务水平。提高我的医疗服务水平,在转变人们生育观的同时,保证健康出生的婴儿数、降低婴儿死亡率,增长人们的寿命。

第三,提高中国女性的社会地位和文化程度。通过提高女性文化水平,变被动地受国家计划生育政策的约束为主动地降低生育率。

[1] 郭昱.我国人口自然增长率影响因素的实证研究[J].经济师,2014,(5):77-79.

[2] 中华人民共和国统计局.中国统计年鉴[K].2016.

[3] 杨鑫,李通屏,魏立佳.总和生育率影响因素实证研究[J].西北人口,2007,(6):14.

[4] 徐嘉祺,刘雯.我国人口自然增长率的影响因素分析[J].魅力中国,2010,(1):241-242.

C921

A

1673-291X(2017)36-0178-03

2017-04-10

湖南省研究生科研创新项目(CX2016B616);湖南省大学生研究性学习和创新性实验项目(湘教通[2016]283号);吉首大学本科生校级科研项目(JDX16025)

张琼枝(1995-),女,湖南浏阳人,本科,从事经济统计研究;通讯作者:陈望学(1985-),男,甘肃陇南人,讲师,博士,从事经济统计与统计计算研究。

[责任编辑 李晓群]

猜你喜欢

共线性回归方程方差
概率与统计(2)——离散型随机变量的期望与方差
采用直线回归方程预测桑瘿蚊防治适期
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
银行不良贷款额影响因素分析
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
方差生活秀
揭秘平均数和方差的变化规律
方差越小越好?