南通市人口现状研究及发展趋势分析*
2022-07-20南京信息工程大学曹熠何永健郭垚灿
南京信息工程大学 曹熠,何永健,郭垚灿
一、引言
我国高度重视人口问题,人口数量始终是关键性问题之一,流动人口迁移活跃,人口年龄结构失衡,老龄化进程加快等问题亦逐渐浮现。人口预测可为社会经济发展战略的制定提供有力支撑;对人口迁移进行研究,可评估城市吸引力,合理引导人口流动[1];研究人口老龄化,则有利于城市调整优化人口结构,完善社会保障系统。
赵子铭[2]以1949-2017年中国人口总数为时间序列,采用ARIMA模型对人口总数进行了预测;杨柳等[3]根据1978-2018年河北省人口数据,采用Logistic模型预测了人口数量峰值。李天籽等[1]对2016年、2018年的腾讯位置大数据进行分析,采用社会网络分析法和QAP回归模型系统研究了中国人口流动的空间特征及其影响因素。王晗等[4]利用空间关联分析、地理探测器等方法,以东北地区为研究区,基于省、市、县三个不同尺度探索了2000-2010年该地区人口老龄化的时空特征及其影响因素。
综上所述,本文致力于从人口预测、人口流动和人口老龄化三个方面对南通市人口问题进行分析探究,首先分析历年来户籍人口和常住人口总数特征,分别对户籍人口采用ARIMA模型,常住人口采用Logistic回归模型进行预测;接着对流动人口来向和去向进行可视化,探索空间迁移状况和影响因素;最后基于乡镇尺度对老龄化的时空分布和空间聚集特征进行深入研究,以期为南通应对诸多人口问题提供参考。
二、数据来源和研究方法
(一)数据来源
本文人口数据来自南通市统计局“数据南通”、《南通统计年鉴》、2018年全国流动人口动态监测调查数据以及2000年第五次人口普查、2010年第六次人口普查数据;对于南通市乡镇合并或拆分导致的行政区划的改变,统一采用2015年南通市乡镇行政区划图,对改变区域进行人工调整,以确保不同年份具有可比性。
(二)研究方法
1.ARIMA模型
自回归积分滑动平均模型,简记为ARIMA模型,是拟合、预测时间序列数据的重要模型之一,ARIMA(p,d,q)模型中,AR指自回归,MA指移动平均,三个参数p、d、q分别表示自回归阶数、差分次数和移动平均阶数[2]。
若数据为非平稳时间序列,需要首先对其进行平稳化处理,将其差分d次,然后建立ARMA(p,q)模型。
2.Logistic回归模型
记t时刻的人口数为P(t),P0为t=0时的人口数。设G(p)·p表示人口数量为p时,单位时间研究范围内的人口增长量,即增长率。由于较多因素对人口增长起着阻滞作用,G(p)在一定时间内理论上是一个减函数,所以,
假设G(p)与人口数p呈线性相关,即G(p)=G0-μp,其中,G0表示人口数极小(为0)时的增长率。设研究区人口容量为Pmax,易知当人口达到Pmax时,增长率为0,故μ=G0/Pmax。最后利用变量分离法求解,令Pmax-P0/P0=a,G0=b,则t时刻的人口数,即Logistic回归模型可表示为
3.人口老龄化判断指标
老年人口系数即指老年人口数(65岁及以上)占总人口数的比例,本文选用其作为主要指标,衡量南通市老龄化程度及时空变迁情况。将人口年龄结构划分为5类(见表1)[5]。
表1 人口年龄结构划分
4.空间自相关分析
全局空间自相关对整体研究区中各个子区域的空间关联性(或差异性)进行衡量,用以判断是否存在集聚效应,采用全局莫兰指数(Global Moran's I)度量。局部空间自相关反映了各个子区域对全部空间自相关的贡献大小,同时能够揭示变量的局部集聚特征及小范围的不稳定性[5],采用局部莫兰指数(Local Moran's I)度量。
三、南通市人口预测
(一)户籍人口预测
1.ARIMA模型的建立与求解
由于1980年前人口统计数据并不连续,选取南通市1980至2020年户籍人口数据进行建模。利用Eviews软件建立ARIMA模型,观察人口时序图,其值并非在某一值上下波动,显然该序列为非平稳数据,需要对其进行差分处理。二阶差分后T统计量小于1%置信水平的标准值,说明不存在单位根,通过ADF检验,所以确定差分次数d=2。
观察经过二阶差分后序列的自相关和偏自相关图,发现均从第4位开始缩至置信区间,因而在4阶截尾,故自回归阶数p和移动平均阶数q均为4,由此可得预测模型为ARIMA(4,2,4)。
拟合结果显示,AR(4)、MA(4)的Prob.均小于0.05,故其系数均显著非零,从优选择该模型,同时所以残差序列为白噪声,不存在自相关,因此该模型是适合的模型。最终得到模型的最小二乘结果为
2.人口预测结果及分析
1980-2020年南通市户籍人口数据均为已知量,结果显示,静态预测序列值与人口序列实际值曲线拟合结果较好,可以利用该模型进行预测。
接着进行样本外(2021—2030年)动态预测,未来10年南通市户籍人口总数仍呈现下降趋势(见表2)。
表2 南通市户籍人口预测结果
(二)常住人口预测
分析南通市常住人口数据,2009年是其增速由负转正的第一年,此后以逐年降低的增速人口逐渐增加,而Logistic回归模型正适用于增长至最终平衡的过程,故选用2009至2020年南通市常住人口数据进行建模及人口预测。
1.Logistic模型的建立与求解
利用MATLAB软件中的cftool工具箱进行曲线拟合。2009年作为基始年,故t=0时的人口数P0=713.37万人。而2019、2020年实际人口数量则作为对照,以进一步进行验证。
在95%置信度下,取参数a=0.08591,b=3276,得t时刻的人口数为
同时可决系数R2=0.9892,均方根误差RMSE==1.652,结合拟合趋势图可知预测结果与实际数据曲线拟合较好。接着根据公式分别计算2019、2020年预测值,并与实际值进行对比,相对误差分别为0.038%和0.006%,均非常小,进一步验证了结果的准确性。
2.人口预测结果及分析
由上述模型预测南通市未来至2030年的常住人口数量,人口增长率逐年降低,且在2054年左右可以达到峰值774.6556万人(见表3)。
表3 南通市常住人口预测结果
四、南通市流动人口迁移状况研究
对2018年全国流动人口动态监测调查数据进行初步筛选,找到样本中2010年及以后流入(出)南通市的数据作为支撑,利用ArcGIS软件,考察2010年以来南通市流动人口空间迁移状况。
省内人口流动状况显示,南通市人口多向苏南地区流出,而多由苏北地区流入,且人口流出高于人口流入。苏南地区经济水平高、交通便利,加之较好的就业条件吸引了大量人口,且南京作为省会城市备受青睐,是南通市重要的省内人口流出去向。苏北地区较苏南地区、较南通市经济发展欠发达,故而被吸引流入南通地区。由此也可得出,江苏省经济发展不平衡、不充分,苏南地区经济远超苏北地区,城市集聚力更强。
省际人口流动状况(此次抽样不包含中国香港、中国澳门、中国台湾)显示,人口流出同样高于人口流入。
向北京、天津等华北地区流出的人口显然不及流向上海、江苏等华东地区的人口数,距离远近也是影响人口流动的重要原因。流向上海市的人口占样本总数的近30%,主要原因还是上海市经济社会发展水平高,为劳动人口及人才提供了良好的就业机会,同时随着长三角一体化战略的落地推进,距离最近的国际大都市—上海,自然成为南通人口流出的重要去向。除华东外,西部地区如新疆亦是南通人口流出的主要去向,该区域经济发展水平较南通低,但西部大开发战略的实施,一定程度上促进了南通人口流向该地区。
人口流入以周边省份如安徽、河南和山东为主,湖北省、四川省次之,西北、华南地区人口流入南通的比例较小。由于南通市经济规模不断扩大,加之空间距离接近,吸引了不少周边省份的人口流入,但南通交通体系存在一定问题,难以吸引距离较远的地区人口来通。
五、南通市人口老龄化时空分布研究
(一)人口老龄化时空格局演变
选取2000年五普和2010年六普南通市分乡镇人口数据,利用ArcGIS软件,计算各乡镇老年人口系数,并进行可视化处理,同时计算得到这10年间老年人口系数变化率分布图(见图1、图2)。
图1 2000年(左)、2010年(右)南通市人口老龄化空间分布格局
图2 2000至2010年南通市老年人口系数变化率分布图
(1)2000年南通市人口老龄化整体空间分布呈现中心城区老龄化程度较轻,其他区县态势严重的特征。全市除市区部分街道及启东小范围区域,近乎全部进入老年型Ⅱ期社会。老龄化最严重的地区分布在中部和东南区域,已进入老年型Ⅲ期,主要涉及如东县、通州市、海门区和启东市,海门区常乐镇老年人口系数值最高,为16.047%,与最小值相差12.476个百分点。
(2)2010年同样仅中心城区老龄化程度相对较轻。但整体老龄化程度进一步加深,接近半数地区进入超老龄化阶段,系数最大值出现在通州区骑岸镇,达到25.474%,与最小值相差19.731个百分点。十年间,部分乡镇老龄化程度急剧加深,如东县栟茶镇等一跃进入超老龄化阶段,启东市吕四港镇也由老年型Ⅰ期跨入Ⅲ期阶段。
(3)2000至 2010年,南通市老年型Ⅰ期未进入老龄化地区明显减少。全市老年人口系数平均变化率为38.76%,深化速率较快。其空间格局基本呈现圈层分布:中南区域部分城区变化率小于0,老龄化程度有所好转;内层区域变化率基本处于30%-50%;最外层区域老龄化程度深化极快,变化率达到50%以上。
(二)人口老龄化空间集聚特征
1.全局空间自相关分析
利用ArcGIS软件分别计算南通市2000、2010年老年人口系数的全局莫兰指数(见表4)。
表4 2000年、2010年南通市老年人口系数全局Moran’s I值
全局莫兰指数均大于0,且通过显著性检验,说明南通市各乡镇之间人口老龄化始终存在显著空间正相关,具有空间集聚和空间差异性特征。而2010年全局莫兰指数迅速增长,说明南通市人口老龄化的空间集聚态势持续深化,空间差异性愈加扩大。
2.局部空间自相关分析
在人口老龄化显著正相关的基础上,研究南通市相邻乡镇间的相关程度,进行局部空间自相关分析。
南通市人口老龄化局部空间分布特征以高-高集聚和低-低集聚为主。2000年,高-高集聚区集中在城市几何中心附近,主要涉及通州区刘桥镇等和如东县新店镇;低-低集聚区分布在崇川区和启东市启隆镇;高-低集聚乡镇较少,分布在崇川区陈桥街道和幸福街道;不存在低-高集聚区。2010年,高-高集聚区仍分布在几何中心附近,增加海门区余东镇;低-低集聚区明显范围有所扩大,启东市启隆镇转变为不显著;不存在高-低、低-高集聚区。
六、结语
本文对南通市人口分别进行了人口预测、流动人口迁移和人口老龄化时空分布研究,探寻南通人口发展现状,对未来人口发展趋势作出初步判断。
第一,建立了ARIMA(4,2,4)模型对南通市户籍人口总数进行预测,未来10年户籍人口总数仍呈现下降趋势,由2020年的756.06万人下降为2030年的719.6188万人。根据常住人口以逐年降低的增速增加的特点,选用Logistic回归模型对其进行预测,未来10年常住人口数量仍将增长,但增长率逐年降低,在2054年左右可以达到峰值774.6556万人。但未能考虑影响人口数量的具体因素,所以误差不可避免会存在。
第二,根据流动人口调查数据可视化分析南通市人口迁移状况,2018年人口流出总体高于人口流入,迁移原因大多是工作和经商,省内迁移主要以向苏南地区流出和苏北地区人口流入为主,反映了江苏省经济发展存在地域差异性,发展不平衡;省际迁移主要以向华东、西部地区流出和周边省份流入为主。然而该数据仅是全国范围内的随机抽样结果,数据量相对较少,仅能作为较低精度的参考,研究宏观特征。
第三,利用老年人口系数、空间自相关分析等方法对南通市人口老龄化时空格局及空间聚集状况进行研究,结论如下:(1)南通市2000-2020年经历了老年型Ⅱ期、Ⅲ期阶段,目前已成为超老龄化社会,老龄人口规模极大,深化速率极快。(2)中心城区老龄化程度较轻,如东县、通州市、海门区和启东市最严重。(3)2000年至2010年,老年人口系数变化率空间格局呈现圈层分布,中心城区老龄化有所好转,越向外深化速率越快。(4)南通市各乡镇之间人口老龄化具有空间集聚和空间差异性特征,且该态势持续深化扩大。(5)人口老龄化以高-高和低-低集聚为主,中心城区基本为低-低集聚区。