基于leslie和logistic模型的人口数量研究
——以朝阳市为例
2022-01-14史纯阳尹鑫鑫郭诗雨钟茹心王保帅
史纯阳,尹鑫鑫,郭诗雨,钟茹心,王保帅
(辽宁科技学院 中美双百学院,辽宁 本溪 117004)
人口发展问题一直是人类社会最关心的问题之一。现在我们可以通过科学技术来推算出未来的人口基数,从而得知未来某个时期的人口数量及年龄结构。这样有助于了解一个国家未来的劳动力,有关政府可以做好劳动力的平均分配工作,最大化地分配好社会资源,从而制定更完善的社会福利、城市发展方案与城市建设的工作与规划,达到整个社会的一个良性循环〔1〕。总之,我们目前的工作都是围绕着人口数量展开的。我们只有精确地预测人口数量,各种工作才可以有效地发展与进步〔2〕。人口预测需要依据当前现有的人口情况条件下兼顾其他影响人口增长的因素,按照一套科学的方法,测算出未来一个时期内的人口规模、水平及其变化趋势〔3〕。文章利用leslie模型算出人口增长率并在logistic种群增长模型中引入适当形式的函数进行参数估计对地区人口进行分析和预测。人口的预测可以给社会的建设和发展提供重要的信息,预测结论能够指出未来社会主义经济建设中可能存在出现的问题,以此为基础来提供科学准确的人口统计资料支撑,帮助制订准确的政策〔4〕。
1 影响因素的确定
对朝阳市未来人口进行预测要考虑自然生长率、出生率、死亡率、年龄结构、男女比例等〔5〕。但我们通常根据生育率的高低来控制人口的增长率,生育率代表了一定时期出生活婴数与同期育龄妇女人数之比。生育率是导致人口增长的首要决定性因素,所以生育率的变化直接导致人口增长率的变化,二者呈正比关系。生育率受到诸多因素影响,其中年龄结构为其主要影响因素,不同年龄的受孕女性,她们的生育能力也不尽相同,人口增长率可以由朝阳市不同时间段各地区人口出生状态来确定,所以我们通过年龄结构确定人口增长率可以发现很多的实际问题。为化简模型,突出重点因素的影响权重,在预测中假设数据足够准确、不考虑不可抗性因素(如大规模迁入迁出问题、自然灾害问题等)。
2 模型的建立与求解
2.1 人口增长率的确定
文章需要根据每一个年龄段的群体进行多维度的年级和层次性划分,来构建一种与年龄密切相关的人口学模型。年龄结构不光直接反映了社会经济中人口总数在各个年龄区间的变动性分布情况,而且考虑到不同年龄区间人口的生育率、死亡率等不同情况,首先通过年龄结构确定人口增长率,由图1六普年龄金字塔可以得知男女人口比例得变化不大,年龄结构稳定。故在研究中仅考虑女性作为研究因素较为合理。
图1 六普年龄金字塔
(1)
设人口自然生长率为b,年出生人数为h1,年内死亡人数为h2,年平均人口数为则有:
(2)
将上述方法应用于朝阳市人口数量研究之中,取1990年至2020年的统计资料,得到原始数据。则有x(k)=Lkx(0),其中L为leslie矩阵,由上式我们就可以精确计算出并得到在tk时间内不同人口年龄段分组的居住人口总数、人口平均年龄增长率和各个不同年龄段分组的居住人口所有率占总体居住人口的百分比。人口自然增长率,指在一定时期内人口自然增加数(出生人数减死亡人数)与该时期内平均人数(或期中人数)之比。则根据公式(2)采取等距抽样的方法计算出朝阳市人口年平均增速,分别为:2.16、3.24、-0.93、0.12、-0.48、-0.58。由此可知,随着时间的迁移增长率上下跌幅,即人口达到环境容纳量后趋于稳定。
2.2 Leslie矩阵模型
利用非线性函数拟合人口与物种增长趋势的方法都可以用于对人口与物种增长的总体趋势进行预测,但预测不够精细。在正常社会条件或自然条件下,生育率与死亡率是与群体的年龄构成息息相关的。现将每个年龄组的人口根据其年龄和结构的差异等间距划分为n个年龄组(五年等距抽样)。并列出Leslie矩阵,我们即可对人口年龄分布进行迭代。无论一开始的人口分布向量如何,人口比例在迭代无数次之后总趋近于特征向量。而人口增长率趋近于特征值,说明特征值可以用于预测人口增长速度。由于每一个人口的平均出生率和死亡率之间都是有一定的相互关系,就可以准确地预测出多年以后,本时段的同组人数和下个阶段的死亡率将近似对应或形成一定的相互比率关系,并且这些阶段的各组死亡率在总体人口个数中所占比重将逐步趋于稳定,即根据人口的年份分布状况,通过人口增长率映射出变化比率。
2.3 logistic计算参数
将logistic回归用于二分类问题,logistic回归其实也是一个线性回归,只是它使用了一个海威萨德尔阶跃函数,对这个线性回归的结果进行了处理,将最终的结果转换成了0或者1。利用海威萨德尔阶跃函数可以将一个线性回归函数转换成一个二分类的函数,这样所要求的参数也是阶跃函数中的m参数。
由于人口不可能如s型曲线无限的增长,当人口达到环境容纳量后增长率就会下降,我们已经得知增长率的变化,将增长率r看成是人口x的减函数。根据logistic模型对1990-2020年中国人口总人数进行拟合,将上述方法应用于朝阳市人口数量研究之中,取1990-2020年的统计资料绘制出人口数据趋势图,如图2所示人口在达到一定数量时会趋于上下波动的稳定状态。
图2 人口数据趋势图
在计算参数时,文章采取了两种优化的算法(梯度上升和梯度下降),利用梯度上升来求极大值,利用梯度下降来求极小值。对于正态分布,在求解回归函数参数时,采用最小二进位乘法来处理损失函数的求解,保证损失函数的最小化,通过多次迭代使得差值趋于稳定(收敛)或者达到指定的误差范围内,同时采用极大似然估计方法,利用已知样本信息(分类的情况)的结果信息,来反推这些样本结果出现的模型参数值。假设时间t时刻的人口为:x(t),r(x)=r-sx(r,s>0)。当x很小时,r为固有增长率,s为带求系数,xm是当前环境可以容纳的最大人口容量。
(3)
(4)
(5)
2.4 计算结果分析
经过(3)、(4)、(5)计算对这个线性回归的结果进行处理,结果分析如下:
人口的实际总数计算x(t)已经具备了一个如下的计算规律:limt→+∞x(t)=xm,也就是说无论实际人口最初平均值总数x0如何,实际人口总数都以总数xm为人口计算的一个极限。
人口的变化率dt、dx在x=2xm时取到最高值,即当人口总量达到极限值的二分之一时,也就是人口的加速发育时期,经过这一点以后,增长的速率就会逐步地变小,最终可以达到零,为了更好地检验文章所构造模型的预测正确性与准确度,选择了预测的绝对误差值与实践中相比较。可以看出,模型预测的绝对误差小于±0.53个的命中率为93%,绝对误差小于2.46个的命中率为88%,最小相对误差趋近于0,在未来的10年内,朝阳市人口总数将趋于平稳,且增长率随年份的增长而逐渐变小。
图3 预测值实际值对比图
3 结论
(1)logistic的人口模型对于其他人口总体的增长率做出了一个相对简单化但又合乎常理的假设。实际上,对于一个人口总体的增长率我们甚至可以把它简单地看成也就是一个相当于人口总体数量的变化函数。其中预测的结果比较精确,能够有效地预测出一定的人口总数。
(2)由于leslie的人口预测模型具备了一个非常好的假设性条件,它认为假设人口在一个预测时间范围内,社会环境相对比较稳定、人口数量增长相对平稳,即人口的数量不会随之出现重大的周期性波动,所以短期内全国各地区人口的平均生育率和死亡率总体水平可以看作是一个常数。
(3)通过运用上述两类模型及预测图的变化率和稳定性对2021-2030年朝阳市的人口发展趋势进行预测,在2021-2026年人口数量会呈现出一定的上升趋势,2027-2031年会趋于不变。得出结论,在未来的10年内,朝阳市人口总数将趋于平稳,且增长率随年份的增长而逐渐变小。