基于PDE模型的中国人口结构预测研究
2014-02-28孟令国李超令胡广
孟令国 李超令 胡广
摘要 准确的人口结构预测是未来经济发展的重要依据。论文采用人口-发展-环境模型(PDE),以第六次全国人口普查数据为基础,设定生育率低中高三种不同方案进行推演,预测了我国2015-2050年人口结构变化走势。结果显示:若实行较低的生育率方案,即维持现行计划生育政策不变,到2050年我国人口结构将呈现非常严重老龄化状态;若实行中等生育率方案,即实施二胎计划生育政策,我国人口结构老龄化趋势将会得到明显改善,到2030年之后我国人口结构将逐渐年轻化,呈成年型人口结构;若实行较高的生育率方案,即实施较二胎政策更宽松的计划生育方案,我国人口结构将发生根本性改变,人口结构符合年轻化人口结构的特征,但将带来大量的新增人口。比较三种不同的预测结果,基于我国国情,认为实施二胎生育政策比较理想。
关键词人口结构;预测;生育率;死亡率
中图分类号F015文献标识码A文章编号1002-2104(2014)02-0132-10doi:10.3969/j.issn.1002-2104.2014.02.019
我国是全球性人口大国,人口问题是我国社会经济发展的关键问题之一。建国后,我国人口快速增长。1949年,我国总人口只有4.5亿,2010年第六次人口普查数据显示已经达到13.33亿。人口快速增长为我国经济发展提供了充足的劳动力,但随着人口年龄结构的变化和第一次人口红利消失,庞大的人口规模逐渐演变为人口负担。
第五次人口普查数据显示,我国14岁以下、15-29岁、30-44岁、45-59岁、60岁以上的人口比例分别为22.90%、25.36%、25.57%、15.70%、10.45%。第六次人口普查数据显示,我国14岁以下、15-29岁、30-44岁、45-59岁、60岁以上的人口比例分别为16.61%、24.63%、25.51%、19.93%、13.31%。与第五次人口普查相比,第六次人口普查结果显示0-14岁、15-29岁、30-44岁人口比例分别下降了6.29%、0.73%、0.06%;45-59岁、60岁以上人口比例分别上升了4.23%、2.86%。比较两次人口普查结果发现,我国人口年龄结构老龄化趋势加强。在人口老龄化社会到来之后,如何保持经济较快发展已经成为政府和学术界关注热点。无论是对我国经济现状的认识,还是对未来发展趋势的把握,准确的人口预测都是至关重要的。
1文献综述
国外学者对未来人口结构的研究较早,其研究方法主要是运用统计学、数学和人口学进行预测。1696年英国社会学家G.King教授使用简单数学模型对英国未来600年的人口结构变化进行了预测。1798年英国学者Malthus基于对英国人口近百年历史数据的分析,首先创造了人口预测模型—MALTHUS人口预测模型。1838年荷兰学者Verhau对于人口结构预测提出了人口阻滞增长模型—LOGIsTIC人口预测模型。澳大利亚学者Leslie研究了动物种群数量的变化规律,并运用这一规律研究人口结构,进而提出了LESLIE模型。1994年美国世界观察研究所所长Lester·R·Brown指出中国2030年的人口将达到16亿多。2004年6月,联合国经济及社会事务部人口司发表《2030年全球人口预测》,指出2030年中国人口达到历史峰值,届时人口总数将超过14.5亿。Cairns建立了带出生年效应的死亡率模型研究人口死亡率[1]。Hainaut 和Devolder为反映突发性事件,例如战争、疾病以及医疗显著改善对死亡率的影响,提出带死亡率的预测模型[2]。Menard[3]和 Wade[4]计算了加拿大和美国1981-2025年各年龄组年均死亡率改善因子。
国内学者对人口结构和人口趋势研究较晚。蒋辉分别采用罗吉斯蒂曲线和灰色模型对我国2015-2030年人口做了预测,其中,罗吉斯蒂曲线预测结果显示:我国总人口在2015年、2020年、2025年、2030年分别达到13.70亿、13.89亿、14.03亿、14.13亿;灰色模型预测结果显示:我国总人口在2015年、2020年、2025年、2030年分别达到13.48亿、13.60亿、13.68亿、13.73亿[5]。任强基于Leslie矩阵和ARMA模型对我国2010-2050年期间每五年总人口做了预测,预测结果显示我国总人口将在2020年达到历史最大值14.35亿,之后呈下降趋势[6]。易亮采用曲线拟合模型和灰色模型预测我国未来人口变化,其中,拟合模型预测我国总人口在2015年、2020年将达到14.79亿、17.73亿;灰色模型预测我国总人口在2015年、2020年将达到14.23亿、14.83亿[7]。解保华等对我国人口总量和年龄结构进行了预测,认为在现行计划生育政策不变的情况下,中国人口总量将在2024年前后达到峰值14.2亿[8]。张连增等采用广义线性模型对我国各年龄段人口死亡率进行了修正[9]。金露、夏万军基于ARMA 组合模型对我国人口总量预测,认为2014年我国人口将突破14亿,2015年我国人口总量将达到 14.68亿[10]。
孟令国等:基于PDE模型的中国人口结构预测研究中国人口·资源与环境2014年第2期国外学者较早地对人口结构以及人口结构趋势预测进行了研究,并且提出了较多的方法和模型,具有借鉴意义。国内学者则主要是借鉴国外的模型进行人口结构预测的研究。他们对我国总人口数量的研究居多,而对我国人口结构的研究相对较少。并且,他们对我国总人口数量研究结论的差异还很大,其中一部分研究结论认为我国总人口的峰值是13.73亿,而另一部分的研究结论则认为我国总人口的峰值为17.73亿,相差4亿。前辈学者研究的不一致性为本文的研究留下了空间,本文旨在采用最优模型对我国未来2015-2050年间的人口结构进行预测,以期对我国的人口预测理论做出贡献。
2预测模型2.1可供选择的模型
目前,用来进行人口预测的模型主要有:①线性回归模型。该模型认为人口数量是一系列自变量的变量,对历年人口数据进行回归检验得到各变量的系数,并构造出线性回归方程,以该方程预测未来人口变化。②联合国模型。该模型采用某一时期某国的城市-农村人口增长差异的平均权重,并假设城市-农村人口增长未来的差异,预测城市人口比例变化。在计算出城市人口比例权重后,再用该权重与该国总人口数量相乘即得到该国城市人口数量。③平均增长量法。该方法假定历年人口增加的绝对数量是相同的,某年的人口总量等于上一年的人口总量加上本年人口增加的人口数量。④指数平滑法。该方法认为人口增长趋势是过去人口增长本身发展趋势的结果;同时考虑到各期历史数据对人口增长的影响不同,给予近期历史数据较大权重、远期历史数据较小权重,并以此为依据预测人口总量的变化。⑤平均增长率法。该方法假定每年人口增长率是相同的,某年新增人口总量等于基期人口数量与增长率相乘的乘积,该方法的数学表达式为:Yt=A·(1+k)t,其中Yt指第t年的人口总量,A指基年人口数量,k指人口增长率,t指时间年。⑥灰色系统GM法。该方法是根据过去已知的或非确知的人口信息,建立一个从过去引申到将来的GM人口模型,进而预测人口在未来发展变化的趋势。灰色系统法包括一个变量的单阶微分方程,以矩阵为计算对象,以时间序列为顺序,建立被求变量数列预测模型。⑦人口-发展-环境分析模型(PDE)。人口增长数量由自然增长数量和机械增长数量组成。自然增长数量是出生新增人口减去死亡人口的余额,机械增长数量指外地净迁入的人口数量。人口总增长数量等于自然增长数量与机械增长数量之和。某时期总人口等于上期总人口加上本期人口增长。
2.2模型选择
上述关于人口结构预测的模型和方法中,平均增长量法、平均增长率法和指数平滑法虽然计算简单、方便、快捷,但由于影响人口增长的因素众多,其每年新增固定数量人口的假定是不现实的,因此,该模型预测结果的准确性受到众多质疑。线性回归法的前提是假设未来将沿着历史趋势不变,但考虑到目前我国学术界对放宽计划生育政策的呼声越来越大,历史趋势不变的假设受到质疑,因而该方法同样不适用于本文研究。联合国模型主要用于预测城市人口比例,不适于研究我国总人口结构变化趋势。灰色系统GM法虽然较前5个方法有了较大的改进,但是,关于灰色系统理论的争议也不少,争议主要集中在:关联系数取值是否具有代表性、累加生成与累减还原及参数估计的依据是否科学等。由于该方法舍弃了统计检验过程,其科学性受到质疑,因而该方法也不适合预测我国未来人口结构。
本文将采用人口-发展-环境分析模型(PDE)预测我国人口结构变化。该模型是对队列构成预测方法和多状态生命表的扩展,把人口按照年龄和性别、出生率和死亡率等组合成不同“状态”。多状态方法被广泛运用于研究17个IIASA国家的人口预测项目。在中国成为IIASA的成员国后,PDE模型被国内外学者广泛应用于中国人口预测研究。其计算公式通俗易懂,用该模型研究未来总人口和人口结构变化的空间很大,重点在于各参数的设置,包括各年龄段人口的死亡率、生育率、迁入人口数量在不同的环境条件下表达出不同的特征等。本文将采用人口-发展-环境分析模型(PDE),假设在多种状态下各年龄段不同的人口死亡率、生育率,预测我国未来总人口和人口结构的变化。
人口-发展-环境分析模型(PDE)认为,人口年龄结构是过去人口结构演变的结果,某一年t+1岁的人口等于上一年t岁人口数量减去该年该年龄死亡人口数量,该年新增人口等于该年出生人口与外地净迁入人口之和,其原理用图1表示如下:图1人口-发展-环境分析模型(PDE)
Fig.1PopulationDevelopmentEnvironment Analysis Model(PDE)
生命周期模型的数学表达式为:
Pt=Pt-1+Pbt-Pdt+Pit
=Pt-1·(1-dt)+Pi+Pbt
=Pt-1·(1-dt)+Pi
+(Pt-1·Rt-1+Ri·Pi)·Bt
=∑1104n=1Pn(t-1)·(1-dnt)
+∑504n=15(Pn(t-1)·Rn(t-1)·Rni·Pni)·Bnt(1)
其中Pt指第t年总人口数量,Pt-1指第t-1年人口数量,Pn(t-1)指第t-1年年龄为n的人口数量,Pbt指第t年出生的人口数量,Pdt指第t年的死亡人口数量,Pit指第t年净迁入人口数量,dt指死亡率,dnt指年龄为n的死亡率,Rt-1指t-1年女性占总人口比例,Rn(t-1)指t-1年年龄为n女性占总人口比例,Ri指净迁入人口中女性比例,Rni指净迁入人口中年龄为n女性占总人口比例,Bt指出生率,Bnt指年龄为n的妇女生育率。
3实证分析
采用人口-发展-环境分析模型(PDE)预测我国人口年龄结构变化,需要的数据包括基期数据和参数预测。
3.1基期数据
基期数据是模型运算的起点,选取精确的基期数据对模型预测结果的精准度有着重要的影响。本文选取2010年我国第六次人口普查数据作为基期数据,总人口按每5岁为一组,将0-79岁的人口分为16组,将80岁及以上的人口归为一组。
3.2参数预测
参数预测包括生育率、死亡率、性别比、净迁入率的预测。参数预测以2010年我国第六次人口普查得到的参数为基础,并进行合理调整,以此预测我国未来人口结构发展趋势。
3.2.1生育率
国家统计局和部分学者对第六次全国人口普查数据质量评估指出,出生人口登记存在漏报现象,故需要对生育率进行调整。王金营(2003)对全国各地区出生人口的漏报进行了估计,认为全国总体水平出生人口漏报率为2.93%,并且提出生育率调整方法[11]:
TFB=B41-Q=B41-∑314I=1WiQi(2)
其中TFB指调整后的生育率,B指调整前生育率,Q指全国总漏报率,Wi指各省市自治区漏报率的权重,Qi指各省市自治区漏报率。
根据生育率调整方法,以2010年第六次全国人口普查数据中生育率为基础,调整后的生育率见表1。
预测生育率是参数设定中最困难的部分,也是方案制定的关键环节,计划生育政策变更的可能性将对我国生育率产生至关重要的影响。本文假定我国未来2015-2050年计划生育政策将出现以下三种情况:维持现有的计划生育政策、适当放松的计划生育政策和宽松的计划生育政策。对应这三种政策设定不同生育率,从而制定低、中、高三个方案。
表1育龄妇女年龄组别生育率及总和生育率
Tab.1Fertility rates of women of childbearing age group and total fertility rate‰
年龄组(岁)
Age group(Years)415-19420-24425-29430-34435-39440-44445-494总生育率
Total fertility rate调整前生育率45.93469.47484.08445.84418.7147.5144.6841 181.10 调整后生育率46.11471.57486.62447.22419.2747.7444.8241 216.75数据来源:根据2010年第六次全国人口普查数据和公式(2)调整。
Age group(Years)415-19420-24425-29430-34435-39440-44445-494总生育率
Total fertility rate2020年前生育率46.11471.57486.62447.22419.2747.7444.8241 216.752020年后生育率411.464128.604136.77463.24424.19410.2046.6841 905.70数据来源:根据2010年第六次全国人口普查数据与公式(2)、(3)调整。
(1)低方案。低方案是假设在2050年之前,我国继续维持目前计划生育政策不变,假定整个区间的生育率与第六次人口普查生育率经调整后的数据相同。之所以制定低方案主要是因为低方案最接近近期的实际情况,该方案预测的人口结构可能是严重老龄化,对现行的计划生育政策起到警示作用,也可为未来研究计划生育政策变更提供参考。
(2)中方案。中方案是假定在未来我国将会对计划生育政策进行一些适度调整的情况下,设置一个合理的生育率,以此预测未来我国人口结构的变化。《中华人民共和国人口与计划生育法》第十八条规定“国家稳定现行生育政策,鼓励公民晚婚晚育,提倡一对夫妻生育一个子女;符合法律、法规规定条件的,可以要求安排生育第二个子女。具体办法由省、自治区、直辖市人民代表大会或者其常务委员会规定”。目前只有部分省市出台了第二胎生育政策的细则,要在全国范围内实施第二胎生育政策还需要一个较长的过程。目前,学术界和民众对放宽第二胎生育政策呼声较大,本文预计中期内第二胎生育政策在全国范围内实行是个大概率事件。因此中方案假设在2020年维持目前一对夫妻只生一个孩子的计划生育政策不变,2020年后全国范围内实现独生子女夫妻可生二胎的政策。中方案中采用的生育率分两个区间,2020年前生育率维持低生育方案中生育率不变;2020年后生育率是以第六次人口普查得到生育率经公式(2)调整的数据为基础,以二胎计划生育政策为依据,二胎化调整公式如下:
Bat=Bbt·It
=∑494n=15Bnbt·It
=Bnbt1·2+∑104i=2Bnbti(3)其中Bat指经二胎化调整后的生育率,Bbt指未经二胎化调整的生育率,It指调整指数,Bnbt指二胎化调整前年龄为n的妇女生育率,Bnbt1指二胎化前年龄为n且生一个孩子的妇女的生育率。经二胎化调整后的生育率数据如表2所示。
(3)高方案。高方案假定我国未来会实行宽松的计划生育政策,在2015年前能在全国范围内实行第二胎生育政策;在2020年前后由于人口老龄化问题更加突出,政府会实行较第二胎生育政策更宽松的政策。对于生育率的设定,高方案认为2015年前,生育率维持现有水平不变;2015-2020年,生育率等于实行第二胎政策的生育率;2020年后,生育率是以2015-2020年间的生育率为基础调整后的生育率,调整方案如下:
Bat=Bbt·It
=∑494n=15Bnbt·It
=Bnbt1·2.5+Bnbt2·1.25+∑104i=3Bnbti(4)
其中Bat指经二胎化调整后的生育率,Bbt指未经二胎化调整的生育率,It指调整因子,Bnbt指二胎化调整前年龄为n的妇女生育率,Bnbti指二胎化前年龄为n且生1个孩子的妇女的生育率,Bnbt2指二胎化前年龄为n且生2个孩子的妇女的生育率。经调整后,更宽松的生育率分三个时间区间:2015年前的生育方案、2015-2020年间的生育方案和2020年后的生育方案。具体如表3所示。
3.2.2死亡率
根据国家统计局公布的1987年、2000年和2010年的统计数据,我国的人口生存与死亡情况可以绘制成生存概率图(见图2)。
图2显示,我国各年龄段的人口死亡率随着时间推移逐渐下降,主要原因是我国过去30多年经济的发展和医表3高方案:育龄妇女年龄组别的生育率及总生育率
Tab.3High program: Fertility rates of women of childbearing age group and total fertility rate‰
年龄组(岁)
Age group(Years)415-19420-24425-29430-34435-39440-44445-494总生育率
Total fertility rate2015年前生育率46.11471.57486.62447.22419.2747.7444.8241 216.752015-2020年生育率411.464128.604136.77463.24424.19410.2046.6841 905.702020年后生育率413.764154.614164.67476.06428.91412.1047.9242 290.13数据来源:根据2010年第六次全国人口普查数据与公式(2)、(3)、(4)调整。
疗条件的改善。图2还显示两个特征,0-60岁年龄段的生存概率线呈“矩形化”特点,即生存概率线呈现平缓走势;60岁以上年龄段的生存概率线呈“扩张化”特点,即生存概率曲线呈陡峭走势。生存概率线不断向高龄集中,从侧面反映出我国人均寿命不断提高的事实。尽管各年龄人口死亡率都在下降,但不同年龄组别的人口死亡率改善程度存在差异和不稳定性。为了得到未来死亡率的准确数据,本文认为有必要采用预测模型对未来死亡率进行估计。
(1)模型选择。比较现在主流死亡率预测模型,理论比较成熟并且得到实际应用的模型有随机死亡模型,包括APC 模型、CairnsBlakeDowd 模型、LeeCarter 模型以及其扩展模型。
Lee和 Carter 提出一种预测未来死亡率变化的随机死亡率预测模型,此定义为模型 (1),即:
logM(n,t)=αn+βnkt
其中,M (n,t) 指年龄为n的人在第t年的死亡率,αn指因年龄变化对死亡率变化影响水平,βn指各年龄死亡率对数变化的趋势,kt指日历年对死亡率的影响。
Renshaw等认为死亡率除受模型(1)设定的变量影响外,还受出生年效应的影响,提出了出生年效应死亡率模型,此定义为模型(2),即:
logM(n,t)=αn+β(1)nkt+β(2)nλt-n
其中λtn指出生年对死亡率的影响变量。
Blake 、Dowd 提出用于预测较高年龄组的两因素随机死亡率模型,此定义为模型 (3),即:
logitQ(n,t)=k(1)t+k(2)t(n-n—)
凯恩斯在两因素死亡率模型中加入出生年效应,得到三个不同形式的扩展模型,此定义为模型 (4)、模型 (5) 和模型 (6),即:
logitQ(n,t)=k(1)t+k(2)t(n-n—)+λt-n
logitQ(n,t)=k(1)t+k(2)t(n-n—)+k(3)t[(n-n—)2-σ2x]+λt-n
logitQ(n,t)=k(1)t+k(2)t(n-n—)+λt-n(nc-n)
其中σ2x指样本方差,nc是模型设定的一个常数。
国际上使用以上6个模型进行死亡率预测时,都假定死亡人数服从泊松公布,即:
D(n,t)~Poisson[E(n,t)M(n,t)]
其中,D(n,t)指年龄为n在第t年死亡的人数,E(n,t)指年龄为n的人在第t年的风险系数。
然后用最大似然估计法模型的参数,模型(1)-(6)的对数似然函数都可表示为以下形式:
l(η;D,E)=∑4n,tD(n,t)log[E(n,t)M(m,t;η)]
-E(n,t)M(m,t;η)-log[D(n,t)!]
其中,η指待估计的参数向量。
最后使用以下牛顿迭代公式估计各参数值。
η^(i+1)=η^(i)-l[η(i)]/η42l[η(i)]/η2
其中η(i)指第i次迭代参数。
选取国家统计局公布的1990-2010年我国人口死亡率数据,将年龄上限设定为100岁,按贝叶斯信息准则进行选择,采用最大似然估计法,使用Eviews软件对以上6个模型参数进行估计,得到各模型的似然函数值、参数个数及BIC值如表4所示。
根据似然函数值、BIC值检验分析,模型(6)的拟合度
表4我国人口年龄组别的死亡率模型拟合结果
Tab.4The mortality model fitting results of Chinas
population age groups
模型
Model4(1)4(2)4(3)4(4)4(5)4(6)似然函数值4-3 0244-2 9884-3 3584-3 0434-3 0554-3 020参数个数41354269430410341174105BIC值413 4854-3 6794-3 4654-3 3954-3 4124-3 577
最好。因此本文将使用模型(6)预测我国未来2015-2050年的死亡率,预测结果如表5所示。
(2)性别比。长期以来,我国存在着重男轻女的封建思想。改革开放后,虽然这一观念得到一定程度的转变,但我国大部分地区仍然或多或少存在这一观念,导致我国历年来人口性别比一直处于100以上。《2011中国统计年鉴》显示,1995-2010年,我国男女性别比处于102.19-106.74之间波动。男女性别比大于100,即男性人数大于女性人数,因而出现部分男性找不到配偶的问题。由于本文研究的人口结构预测只涉及到出生人口,即出生人口等于育龄妇女数量与生育率乘积,因此,性别比大于100的比例对本文研究不会产生影响。
(3)迁入率。改革开放后虽然有部分外国人迁移至中国,也有部分国人到外国学习或工作,但是无论是迁入中国的外国人,还是迁移至国外的中国人,迁移总量相对我国将近14亿的总人口来说,都显得小之又小,对本文研究生产的影响也是微乎其微。因此,本文将人口迁移假定为零。
3.3实证检验
3.3.1人口总量分析
把上述三个方案的生育率数据和死亡率数据分别代入公式(1)推演,得到我国2011-2050年的总人口数量,具体如表6所示。
低生育方案推演结果显示,我国人口总量将在2023年达到人口高峰13.736亿,之后加速下降,在2050年将减少至12.057亿。中生育方案推演结果显示,我国人口总量将在2029年达到人口高峰13.736亿,之后缓慢下降,在2050年将减少至13.630亿。高生育方案推演结果显示,我国人口总量在2050年前一直处于缓慢上升之中,2050年将达到15.22亿(见图3)。
3.3.2人口结构分析
通过对低中高三个不同方案的推演,还可得出我国2015-2050年在不同方案下的人口结构。低生育方案的推演结果表明,2050年我国0-14岁的少年儿童比重将降
到10%以下,65岁以上老龄人比重将超过33%,人口结构呈严重老龄化。中生育方案推演结果显示,2015-2050年间,我国0-14岁的少年儿童比重保持在14%-15%之间波动,65岁以上老龄人比重将逐渐上升到29%左右,人口老龄化状况比较严重,但较低生育方案有了明显改善。高生育方案的推演结果也表明,2015-2050年间,我国0-14岁的少年儿童比重将由15.56%逐渐上升至18%的水平,65岁以上老龄人比重将逐渐上升到26%,人口结构较中生育方案又有了明显改善(见表7)。
通过分析2010年我国人口金字塔图的图形,可以发现,我国0-14岁的人口比重明显小于15-49岁的比重,人口结构开始呈“中”字形态,即“中间大,两头小”形态,说明我国人口结构日趋老龄化,也预示着我国第一次人口
年龄组(岁)
Age group(Years)415-19420-24425-29430-34435-39440-44445-494总生育率
Total fertility rate2015年前生育率46.11471.57486.62447.22419.2747.7444.8241 216.752015-2020年生育率411.464128.604136.77463.24424.19410.2046.6841 905.702020年后生育率413.764154.614164.67476.06428.91412.1047.9242 290.13数据来源:根据2010年第六次全国人口普查数据与公式(2)、(3)、(4)调整。
疗条件的改善。图2还显示两个特征,0-60岁年龄段的生存概率线呈“矩形化”特点,即生存概率线呈现平缓走势;60岁以上年龄段的生存概率线呈“扩张化”特点,即生存概率曲线呈陡峭走势。生存概率线不断向高龄集中,从侧面反映出我国人均寿命不断提高的事实。尽管各年龄人口死亡率都在下降,但不同年龄组别的人口死亡率改善程度存在差异和不稳定性。为了得到未来死亡率的准确数据,本文认为有必要采用预测模型对未来死亡率进行估计。
(1)模型选择。比较现在主流死亡率预测模型,理论比较成熟并且得到实际应用的模型有随机死亡模型,包括APC 模型、CairnsBlakeDowd 模型、LeeCarter 模型以及其扩展模型。
Lee和 Carter 提出一种预测未来死亡率变化的随机死亡率预测模型,此定义为模型 (1),即:
logM(n,t)=αn+βnkt
其中,M (n,t) 指年龄为n的人在第t年的死亡率,αn指因年龄变化对死亡率变化影响水平,βn指各年龄死亡率对数变化的趋势,kt指日历年对死亡率的影响。
Renshaw等认为死亡率除受模型(1)设定的变量影响外,还受出生年效应的影响,提出了出生年效应死亡率模型,此定义为模型(2),即:
logM(n,t)=αn+β(1)nkt+β(2)nλt-n
其中λtn指出生年对死亡率的影响变量。
Blake 、Dowd 提出用于预测较高年龄组的两因素随机死亡率模型,此定义为模型 (3),即:
logitQ(n,t)=k(1)t+k(2)t(n-n—)
凯恩斯在两因素死亡率模型中加入出生年效应,得到三个不同形式的扩展模型,此定义为模型 (4)、模型 (5) 和模型 (6),即:
logitQ(n,t)=k(1)t+k(2)t(n-n—)+λt-n
logitQ(n,t)=k(1)t+k(2)t(n-n—)+k(3)t[(n-n—)2-σ2x]+λt-n
logitQ(n,t)=k(1)t+k(2)t(n-n—)+λt-n(nc-n)
其中σ2x指样本方差,nc是模型设定的一个常数。
国际上使用以上6个模型进行死亡率预测时,都假定死亡人数服从泊松公布,即:
D(n,t)~Poisson[E(n,t)M(n,t)]
其中,D(n,t)指年龄为n在第t年死亡的人数,E(n,t)指年龄为n的人在第t年的风险系数。
然后用最大似然估计法模型的参数,模型(1)-(6)的对数似然函数都可表示为以下形式:
l(η;D,E)=∑4n,tD(n,t)log[E(n,t)M(m,t;η)]
-E(n,t)M(m,t;η)-log[D(n,t)!]
其中,η指待估计的参数向量。
最后使用以下牛顿迭代公式估计各参数值。
η^(i+1)=η^(i)-l[η(i)]/η42l[η(i)]/η2
其中η(i)指第i次迭代参数。
选取国家统计局公布的1990-2010年我国人口死亡率数据,将年龄上限设定为100岁,按贝叶斯信息准则进行选择,采用最大似然估计法,使用Eviews软件对以上6个模型参数进行估计,得到各模型的似然函数值、参数个数及BIC值如表4所示。
根据似然函数值、BIC值检验分析,模型(6)的拟合度
表4我国人口年龄组别的死亡率模型拟合结果
Tab.4The mortality model fitting results of Chinas
population age groups
模型
Model4(1)4(2)4(3)4(4)4(5)4(6)似然函数值4-3 0244-2 9884-3 3584-3 0434-3 0554-3 020参数个数41354269430410341174105BIC值413 4854-3 6794-3 4654-3 3954-3 4124-3 577
最好。因此本文将使用模型(6)预测我国未来2015-2050年的死亡率,预测结果如表5所示。
(2)性别比。长期以来,我国存在着重男轻女的封建思想。改革开放后,虽然这一观念得到一定程度的转变,但我国大部分地区仍然或多或少存在这一观念,导致我国历年来人口性别比一直处于100以上。《2011中国统计年鉴》显示,1995-2010年,我国男女性别比处于102.19-106.74之间波动。男女性别比大于100,即男性人数大于女性人数,因而出现部分男性找不到配偶的问题。由于本文研究的人口结构预测只涉及到出生人口,即出生人口等于育龄妇女数量与生育率乘积,因此,性别比大于100的比例对本文研究不会产生影响。
(3)迁入率。改革开放后虽然有部分外国人迁移至中国,也有部分国人到外国学习或工作,但是无论是迁入中国的外国人,还是迁移至国外的中国人,迁移总量相对我国将近14亿的总人口来说,都显得小之又小,对本文研究生产的影响也是微乎其微。因此,本文将人口迁移假定为零。
3.3实证检验
3.3.1人口总量分析
把上述三个方案的生育率数据和死亡率数据分别代入公式(1)推演,得到我国2011-2050年的总人口数量,具体如表6所示。
低生育方案推演结果显示,我国人口总量将在2023年达到人口高峰13.736亿,之后加速下降,在2050年将减少至12.057亿。中生育方案推演结果显示,我国人口总量将在2029年达到人口高峰13.736亿,之后缓慢下降,在2050年将减少至13.630亿。高生育方案推演结果显示,我国人口总量在2050年前一直处于缓慢上升之中,2050年将达到15.22亿(见图3)。
3.3.2人口结构分析
通过对低中高三个不同方案的推演,还可得出我国2015-2050年在不同方案下的人口结构。低生育方案的推演结果表明,2050年我国0-14岁的少年儿童比重将降
到10%以下,65岁以上老龄人比重将超过33%,人口结构呈严重老龄化。中生育方案推演结果显示,2015-2050年间,我国0-14岁的少年儿童比重保持在14%-15%之间波动,65岁以上老龄人比重将逐渐上升到29%左右,人口老龄化状况比较严重,但较低生育方案有了明显改善。高生育方案的推演结果也表明,2015-2050年间,我国0-14岁的少年儿童比重将由15.56%逐渐上升至18%的水平,65岁以上老龄人比重将逐渐上升到26%,人口结构较中生育方案又有了明显改善(见表7)。
通过分析2010年我国人口金字塔图的图形,可以发现,我国0-14岁的人口比重明显小于15-49岁的比重,人口结构开始呈“中”字形态,即“中间大,两头小”形态,说明我国人口结构日趋老龄化,也预示着我国第一次人口
年龄组(岁)
Age group(Years)415-19420-24425-29430-34435-39440-44445-494总生育率
Total fertility rate2015年前生育率46.11471.57486.62447.22419.2747.7444.8241 216.752015-2020年生育率411.464128.604136.77463.24424.19410.2046.6841 905.702020年后生育率413.764154.614164.67476.06428.91412.1047.9242 290.13数据来源:根据2010年第六次全国人口普查数据与公式(2)、(3)、(4)调整。
疗条件的改善。图2还显示两个特征,0-60岁年龄段的生存概率线呈“矩形化”特点,即生存概率线呈现平缓走势;60岁以上年龄段的生存概率线呈“扩张化”特点,即生存概率曲线呈陡峭走势。生存概率线不断向高龄集中,从侧面反映出我国人均寿命不断提高的事实。尽管各年龄人口死亡率都在下降,但不同年龄组别的人口死亡率改善程度存在差异和不稳定性。为了得到未来死亡率的准确数据,本文认为有必要采用预测模型对未来死亡率进行估计。
(1)模型选择。比较现在主流死亡率预测模型,理论比较成熟并且得到实际应用的模型有随机死亡模型,包括APC 模型、CairnsBlakeDowd 模型、LeeCarter 模型以及其扩展模型。
Lee和 Carter 提出一种预测未来死亡率变化的随机死亡率预测模型,此定义为模型 (1),即:
logM(n,t)=αn+βnkt
其中,M (n,t) 指年龄为n的人在第t年的死亡率,αn指因年龄变化对死亡率变化影响水平,βn指各年龄死亡率对数变化的趋势,kt指日历年对死亡率的影响。
Renshaw等认为死亡率除受模型(1)设定的变量影响外,还受出生年效应的影响,提出了出生年效应死亡率模型,此定义为模型(2),即:
logM(n,t)=αn+β(1)nkt+β(2)nλt-n
其中λtn指出生年对死亡率的影响变量。
Blake 、Dowd 提出用于预测较高年龄组的两因素随机死亡率模型,此定义为模型 (3),即:
logitQ(n,t)=k(1)t+k(2)t(n-n—)
凯恩斯在两因素死亡率模型中加入出生年效应,得到三个不同形式的扩展模型,此定义为模型 (4)、模型 (5) 和模型 (6),即:
logitQ(n,t)=k(1)t+k(2)t(n-n—)+λt-n
logitQ(n,t)=k(1)t+k(2)t(n-n—)+k(3)t[(n-n—)2-σ2x]+λt-n
logitQ(n,t)=k(1)t+k(2)t(n-n—)+λt-n(nc-n)
其中σ2x指样本方差,nc是模型设定的一个常数。
国际上使用以上6个模型进行死亡率预测时,都假定死亡人数服从泊松公布,即:
D(n,t)~Poisson[E(n,t)M(n,t)]
其中,D(n,t)指年龄为n在第t年死亡的人数,E(n,t)指年龄为n的人在第t年的风险系数。
然后用最大似然估计法模型的参数,模型(1)-(6)的对数似然函数都可表示为以下形式:
l(η;D,E)=∑4n,tD(n,t)log[E(n,t)M(m,t;η)]
-E(n,t)M(m,t;η)-log[D(n,t)!]
其中,η指待估计的参数向量。
最后使用以下牛顿迭代公式估计各参数值。
η^(i+1)=η^(i)-l[η(i)]/η42l[η(i)]/η2
其中η(i)指第i次迭代参数。
选取国家统计局公布的1990-2010年我国人口死亡率数据,将年龄上限设定为100岁,按贝叶斯信息准则进行选择,采用最大似然估计法,使用Eviews软件对以上6个模型参数进行估计,得到各模型的似然函数值、参数个数及BIC值如表4所示。
根据似然函数值、BIC值检验分析,模型(6)的拟合度
表4我国人口年龄组别的死亡率模型拟合结果
Tab.4The mortality model fitting results of Chinas
population age groups
模型
Model4(1)4(2)4(3)4(4)4(5)4(6)似然函数值4-3 0244-2 9884-3 3584-3 0434-3 0554-3 020参数个数41354269430410341174105BIC值413 4854-3 6794-3 4654-3 3954-3 4124-3 577
最好。因此本文将使用模型(6)预测我国未来2015-2050年的死亡率,预测结果如表5所示。
(2)性别比。长期以来,我国存在着重男轻女的封建思想。改革开放后,虽然这一观念得到一定程度的转变,但我国大部分地区仍然或多或少存在这一观念,导致我国历年来人口性别比一直处于100以上。《2011中国统计年鉴》显示,1995-2010年,我国男女性别比处于102.19-106.74之间波动。男女性别比大于100,即男性人数大于女性人数,因而出现部分男性找不到配偶的问题。由于本文研究的人口结构预测只涉及到出生人口,即出生人口等于育龄妇女数量与生育率乘积,因此,性别比大于100的比例对本文研究不会产生影响。
(3)迁入率。改革开放后虽然有部分外国人迁移至中国,也有部分国人到外国学习或工作,但是无论是迁入中国的外国人,还是迁移至国外的中国人,迁移总量相对我国将近14亿的总人口来说,都显得小之又小,对本文研究生产的影响也是微乎其微。因此,本文将人口迁移假定为零。
3.3实证检验
3.3.1人口总量分析
把上述三个方案的生育率数据和死亡率数据分别代入公式(1)推演,得到我国2011-2050年的总人口数量,具体如表6所示。
低生育方案推演结果显示,我国人口总量将在2023年达到人口高峰13.736亿,之后加速下降,在2050年将减少至12.057亿。中生育方案推演结果显示,我国人口总量将在2029年达到人口高峰13.736亿,之后缓慢下降,在2050年将减少至13.630亿。高生育方案推演结果显示,我国人口总量在2050年前一直处于缓慢上升之中,2050年将达到15.22亿(见图3)。
3.3.2人口结构分析
通过对低中高三个不同方案的推演,还可得出我国2015-2050年在不同方案下的人口结构。低生育方案的推演结果表明,2050年我国0-14岁的少年儿童比重将降
到10%以下,65岁以上老龄人比重将超过33%,人口结构呈严重老龄化。中生育方案推演结果显示,2015-2050年间,我国0-14岁的少年儿童比重保持在14%-15%之间波动,65岁以上老龄人比重将逐渐上升到29%左右,人口老龄化状况比较严重,但较低生育方案有了明显改善。高生育方案的推演结果也表明,2015-2050年间,我国0-14岁的少年儿童比重将由15.56%逐渐上升至18%的水平,65岁以上老龄人比重将逐渐上升到26%,人口结构较中生育方案又有了明显改善(见表7)。
通过分析2010年我国人口金字塔图的图形,可以发现,我国0-14岁的人口比重明显小于15-49岁的比重,人口结构开始呈“中”字形态,即“中间大,两头小”形态,说明我国人口结构日趋老龄化,也预示着我国第一次人口