APP下载

黑龙江省人口的统计回归预测模型

2012-09-25沙元霞

大庆师范学院学报 2012年3期
关键词:误差率人口数回归系数

沙元霞

(大庆师范学院 数学科学学院,黑龙江 大庆 163712)

0 引言

人口预测是指根据现有的人口状况测算未来某个时间的人口规模、水平和趋势。控制人口规模是城市规划和土地利用规划中的一个重要指标,不但会影响到未来的经济发展和社会动态的发展,而且还会影响到可持续发展的生态环境[1]。 建立数学模型对人口发展过程进行描述、分析和预测,并进而研究控制人口增长和老化的生育策略,以引起社会各方面的极大关注,是数学在社会发展中的重要应用领域[2]。

本文将黑龙江省2001年至2007年人口数据作为依据(来源于“黑龙江统计年鉴”数据),利用统计回归的方法进行建模,并对黑龙江人口进行分析和预测;最后对2012年至2016年黑龙江省的未来人口数和人口发展趋势进行了预测。

1 构建统计回归模型

表1数据来源于《黑龙江省统计年鉴——2007》,本文应用此数据构建统计回归模型。

表1 2001—2007年黑龙江省人口 (单位:万人)

1.1 散点图

为了研究这些数据中所蕴含的规律性,首先将数据用散点图的形式表现出来,把各个年份作为横坐标,将2001—2007年每年总人口数作为纵坐标,将这些数据点标在平面直角坐标图上,分析点的分布情况,如图1所示。

1.2 直观判断

在图1中可以看出,数据点得分布较有规律,既可看做分布在一条直线周围,又可看做分布在一条二次的抛物线附近。所以,为了使模型更加精确,我们将拟合出两条线,即构造两个回归模型,通过对比分析的方式,选取其中误差较小的回归模型。

图1 2001—2007年每年总人口数散点图

1.3 模型一

1)假设。假设变量x和y满足如下关系式:y=β0+β1x+ε,其中,β0和β1是未知常数;ε是随机误差,满足E(ε)=0,var(ε)=σ2。

3)检验。一般我们采用统计检验方法检验,如F检验,如果F和y有线性关系,则

在给定显著水平α下,上述F值应大于F分布表中的临界值Fα。进行检测有F=82.59849≥0.00000=F0.05(1,10),这表明x与y有十分显著的线性相关关系,这说明时间对人口总数有显著影响,回归系数效果显著。

1.4 模型二

1)假设。假设变量x和y满足如下二元关系式:y=β0+β1x+β2x2+ε,其中,β0,β1,β2为回归系数;ε是随机误差。

2)拟合回归参数。当所设回归模型是二次时,仍可以采用最小二乘法去计算,但考虑到计算量相对于一元模型来说非常大,故采用Matlab软件编程[2]求解。

程序如下:X=[1,1,1;1,2,4;1,3,9;1,4,16;1,5,25;1,6,36;1,7,49]

Y=[3811;3813;3815;3816.8;3820;3830.8;3848.8]

[b,bint,r,rint,stats]=regress(Y,X)

运行结果为:b=3818.3,;-6.6;1.5

bint=[3804.8,3831.8],[-14.3,1.2],[0.6,2.5]

stats=0.9638,53.2075,0.0013

3)将上述得到的回归系数带入所设模型中得:y=3818.3-6.6x+1.5x2+ε。

4)检验及分析

①模型所得相关系数的平方为0.9638,说明因变量y的96.38%可由此模型确定。

②模型的F检验值为53.2075,远超过F检验的临界值。

③p=0.0013远小于α=0.05。

④回归系数β1的置信区间包含零点,说明变量x的效果不显著,但考虑到β2的置信区间较好,所以保留一次项。

1.5 模型一与模型二比较

将以上两个模型的预测值与实际值进行比较,得2001—2007年的相对误差率,如下表所示:

表2 模型一与模型二比较

通过表中数据我们得到:二次回归模型平均相对误差率为0.05%,而一次线性回归模型的平均相对误差率为0.76%,说明这两种模型相比二次回归模型能做到更好、更准确的预测。

2 应用模型做人口预测

应用二次回归模型预测2012年至2016年黑龙江省的人口数目,如下表所示:

表3 2012—2016年黑龙江省人口的预测值 (单位:万人)

3 结束语

上述数据表明未来几年我省人口的增长有较稳定的状态,这一结果可为政府相关部门制定政策提供参考依据。同时可以看到,按此模型随着时间的增长,人口的增长率越来越大,说明我们的模型还存在改进的空间,可以将人口老龄化的比率等因素加进去,构造多元统计回归模型[3],以达到更好的结果。

[参考文献]

[1] 刘鑫,徐世英.基于组合预测模型的西藏人口分析[J].中央民族大学学报:自然科学版,2008(3):22-24.

[2] 杨松,曾永年,吴桂平,等.改进的最优组合人口预测模型及其应用[J].长江流域资源与环境,2008(3):14-17.

[3] 宋洪文.应用统计[M].北京:高等教育出版社,2003.

猜你喜欢

误差率人口数回归系数
确定代表名额按户籍人口数还是常住人口数
生化检验全程中质量控制管理方式及应用意义
降低评吸人员单料烟感官评分误差率探讨
多元线性回归的估值漂移及其判定方法
基于BP神经网络的吉林省GDP预测研究
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
无线传感器网络定位算法在环境监测中的应用研究
多元线性模型中回归系数矩阵的可估函数和协方差阵的同时Bayes估计及优良性
电工仪表测量中容易忽略的几个问题
2015年我国60岁以上老年人将达到2.16亿