APP下载

混合模型对人口结构预测的探究

2016-05-30张曼丽

科教导刊 2016年17期

张曼丽

摘 要 本文利用了广东省的人口普查数据,首先使用了混合模型将全国人口普查得到的总人口中的户籍人口和非户籍人口划分出来,然后分别对户籍人口和非户籍人口的结构进行预测,从而得到对未来十年人口金字塔的预测。分析的过程是使用的R统计软件,使用的主要的程序包有pyramid,mixtools,demography,forecast。

关键词 混合模型 户籍人口 人口结构预测 人口金字塔

本文是以广东省的人口数据为例进行探讨混合模型对人口结构的预测,数据是从广东省政府网站(http://www.gdstats. gov.cn/tjnj/2012/c4.htm)下载的,广东省人口主要由户籍和非户籍人口组成,这两类人口在数据的丰富程度,数据质量方面有着不同的特征,并且具有非常不同的发展趋势。但由于缺失户籍的各年龄层人口的分布数据,我们将基于混合模型对四普、五普和六普的数据当中的总人口进行户籍人口和非户籍人口的划分,然后分别对户籍人口和非户籍人口的结构进行预测,从而得到对未来2020年人口金字塔的预测。使用的R语言主要的程序包①②③④有mixtools,demography,forecast主要的函数normalmixEM(),fdm()。

首先使用了混合模型将全国人口普查得到的总人口中的户籍人口和非户籍人口划分出来,对于户籍人口2020年的预测:2020年的分年龄段的人口结构变化率是由于迁移率,死亡率和出生率引起的,将1到100分成20段,间隔5作为一个年龄段,只有在最前面的一个年龄段的时候有出生率的影响,计算的时候用公式 = (1 + + ),其中的是2020年的1岁到5岁这一年龄段人口密度,是2010年的1岁到5岁这一年龄段人口密度,是2010到2020这一阶段1岁到5岁的迁入率,是2010到2020这一阶段1岁到5岁的死亡率,是2010到2020这一阶段1岁到5岁的出生率。其它年龄段是没有出生率的影响的,其它的部分的通用计算表达式为: = (1 + ),其中的是2020年的年龄段人口密度,是2010年的年龄段人口密度,是2010到2020这一阶段的迁入率,是2010到2020这一阶段的死亡率。其中根据广东省的实际情况,将迁入分为两种情况,第一种情况是由于广东省经济结构的调整带来了知识型人才的迁入,当然也有很多劳动型年轻人的涌入,这类人偏年轻化。由于数据收集的限制,我们用Gamma(x,22,0.6)作为大部分迁移人口偏向年轻人时迁入率的分布;第二种情况是夫妻投靠入户或者积分制入户,这种情况的迁移人口偏向中年化,我们使用Gamma(x,29,0.6)作为迁移人口偏向中年人时迁入率的分布。这样根据迁入的不同我们将户籍人口的分析又分为偏年轻化的和偏中年化两种情况来考虑。最后展示人口金字塔的时候也是根据当迁入的情况分年轻和中年两种情况来展示的。

对于2020年非户籍人口年龄段的密度函数是根据混合正态模型得出的往年的拟合均值和拟合方差来估计的,具体分析如下:对于2020年的非户籍人口拟合均值计算如下: = + (),其中代表2020年的非户籍人口拟合均值,代表2010年的非户籍人口拟合均值,代表2000年的非户籍人口拟合均值;对于2020年的非户籍人口拟合方差的计算如下: = + ()其中代表2020年非户籍人口拟合的方差,代表2010年非户籍人口拟合的方差,代表2000年非户籍人口拟合的方差。得出2020年的非户籍人口拟合的均值和方差,再根据它符合正态分布就得出2020年非户籍人口按年龄分布的人口密度。最后将户籍和非户籍人口的分布情况按比例加和就可以得到最后的人口按年龄分布的情况。其中每个分部所占比例的变化也是由2000年至2010年间的变化来估计其在2010年至2020年的变化的。第一个分部所占的比例 = + (),其中是2010年时第一个分布所占的比例;是指2000年时第一个分布所占的比例;则第二个分部在2020年是所占的比例为。将户籍和非户籍人口的预测还有比例的预测都分析完毕以后就可以得到2020年按年龄分布的人口密度,计算公式为: 渲惺?020年按年龄分布的人口密度,是非户籍人口年龄分布的人口密度,是户籍人口按年龄分布的人口密度,是非户籍人口分布所占的比例,()是户籍人口分布所占的比例。将男性和女性都按照上述过程分析完毕以后画出人口金字塔,进而来说明人口的结构分布情况。

根据混合模型的分离结果分别得出男性户籍人口和非户籍人口未来十年按年龄段所占人口的比例,基于此就可以得到男性按年龄段分布的比例,按迁入人口偏向年轻或者偏向中年来划分的,对于女性也是按同样的方式来分析,将男性和女性的按年龄分布的情况分析完毕,利用R统计软件中的程序包pyramid中的函数pyramid(),就可以得到2020年的人口金字塔预测图示。按照迁移人口偏年轻化还是偏中年化两种情况来展示的,如图1所示,由图1(左边表示在迁移人口年轻化时的结果,右边表示在迁移人口中年化时的结果)可以看出,两种情况下金字塔的共同特点是,从1990年金字塔塔顶尖、塔底宽到以后的塔底逐渐变窄向,说明广东省人口结构向成年型转化的趋势逐渐明显,出生率下降,人口老龄化的趋势加强。从两个图的比较可以看出,当迁移人口偏中年化时,男性呈明显的双峰分布,这和高端科技人才的落户有很大的关系,而当迁移人口偏年轻化时,双峰分布相对来说比较弱,这与产业结构进一步调整有很大的关系。

混合模型在处理数据不太丰富的时候是一种非常实用而且准确的方法,它在处理人口结构方面是一种非常有用的方法。