中国人口空间分布形态模拟与预测——基于“五普”和“六普”的分县尺度人口密度研究
2016-12-05曾永明
曾永明
(西南财经大学 中国西部经济研究中心,四川 成都 611130)
中国人口空间分布形态模拟与预测
——基于“五普”和“六普”的分县尺度人口密度研究
曾永明
(西南财经大学 中国西部经济研究中心,四川 成都 611130)
人口空间分布不平衡是一个普遍现象,但其“是否有分布和统计规律”的研究议题非常鲜见。通过中国第五次和第六次人口普查的分县尺度数据模拟出中国分县尺度人口密度的概率分布函数,并进行概率分布预测,分析了未来中国人口分布统计特征。主要结论有:模拟显示,中国分县尺度人口密度符合对数正态分布形态;以2000年分县尺度数据的前向(未来)预测检验和2010年数据的后向(过去)预测检验发现,“人均产出”和“地均产出”两个条件能很好地模拟未来人口密度的分布规律;以2010年分县尺度为基础预测了2020-2100年的中国人口密度概率分布特征和趋势,结果显示中国人口分布极化特征将持续加大,例如2050年,无人区(小于1人/平方公里)的县域比例将从当前的1.02%(29个)增加到4.49%(128个),超高密集区(大于30000人/平方公里)的区县比例将从0.11%(3个)增加到3.93%(112个)。
人口空间分布;人口密度;空间不均衡;模拟预测;对数正态分布;分县尺度
一、引言
人类经济社会不断发展的过程即是人地关系持续相互作用的过程。人地关系中,尽管两者的本质特征都是“运动和发展”,但相对来看,地处于相对静态,人处于相对动态,从这个角度来说,研究动态的人更加困难也更具意义,而人口(空间)分布研究是其重要方面[1]。作为人口过程的重要属性,人口分布是人口过程在空间上的表现形式。随着全球环境变化以及区域人口数量的扩增和结构的改变,关于人口分布方面的研究越来越引起学者和政府的重视,这对于人口管理、资源配置及政策制定都具有重要的现实意义[2]。因此,关于人口分布的研究成果非常丰富,这些成果涵盖了人口分布研究的几乎每个视角,包括人口分布研究的综述[3];人口分布的规律性研究,比如“胡焕庸线”(又名“瑷珲—腾冲线”)[4]、人口水平和垂直分布规律等[5];人口分布的影响因素和机制研究[6-7];人口分布的度量方式和应用研究,比如人口密度[8]、人口重心[9]、洛伦茨曲线和人口潜力[10]等;历史人口分布研究[11-12];城市人口分布研究[13];人口分布的预测研究[14];人口分布的空间分析技术研究[15],等等。纵观这些关于人口分布的研究,尽管考虑到与其有关的几乎所有视角,但依然有一个问题需要探索:人口分布本身的“分布函数与统计规律”问题。比如用人口密度衡量人口分布时,其人口密度本身的概率分布状态是否有一定的规律,比如是否符合正态分布、伽玛分布或威布尔分布等?另外,这种分布规律能否预测?如果能回答这些问题,那么将对人口分布研究补充一个重要的研究视角,对认识人口分布研究具有新的意义。梳理文献时,这类研究十分鲜见,本文就此为切入点展开研究。
众所周知,自然和社会现象中存在随机性和不确定性,但这些随机属性有一定统计规律,即符合一定的概率分布。比如人的身高或体重符合正态分布,降水概率一般服从伽玛分布[16],风速则更接近威布尔分布[17]。人口分布是经济社会基本属性之一,而许多经济社会要素同样存在一定的概率分布规律,其中较为熟知的是收入分布规律问题。陈建东等梳理了常用的收入分布函数,介绍了各类函数拟合居民实际收入分布的效果[18]。胡志军等研究表示广义贝塔分布Ⅱ型比较适合于农村、城镇居民的收入分布拟合[19]。
如此多的概率分布函数可以描述自然、社会现象,那么人口分布是否服从某种函数分布呢?中国人口密度的概率分布又符合哪种统计规律呢?鉴于此,有必要进行人口密度本身的密度函数模拟和分析。但是关于这个问题的研究着实鲜见,几乎无人问津。仅搜索到麦科姆(Malcolm)研究全球人口密度的概率分布时(划分成16个子区域,其中中国为单独一个子区域)发现用贝塔分布(β分布)拟合非常合适,并得到了比较理想的结果[20]。不过其研究有一点明显不足是其空间尺度为1°× 1°的相等空间单元*地球曲面上的1°× 1°的空间单元的面积平均约为1万平方公里。,这显然过于平均化,也就抹杀了行政边界的影响,不太符合现实情况。本文紧随其研究路径,以中国为例进行研究。结论是不是和麦科姆的研究一致(贝塔分布)暂且不论,不过本研究将以中国分县为单元的非等空间尺度的单元为基础进行分析,这应该更贴近现实,数据更准确。
二、中国分县尺度人口密度数据描述
1. 中国分县尺度人口空间分布基本格局
以第五次和第六次人口普查分县数据为基础,先对中国人口分布的基本格局进行简要分析,数据来自《中国人口普查分县资料》(2000年和2010年),为了空间分析的需要,将分县人口数据与行政区划关联*2000年和2010年中国行政区划在县级行政单元上有微观调整,最大的变化有这几个方面:一是行政名称的变化,比如县改市和区、市改区、地区改市等,但这不影响结果分析;二是新增或撤销部分行政单元,这部分调整不多,影响也不大;三是拆分和重新组合行政单元,这部分影响相对比较大,本文的处理是以2010年的行政单元及名称为基准,调整和增或删2000年的数据。。考虑到数据可获取性及研究本身的需要,研究未把我国台湾省及周边岛屿、香港、澳门特别行政区、南海诸岛等列入分析范围。需要强调的是,很多研究将城市的所有市辖区合并成为一个空间单元,但本研究认为,城市市辖区作为基本的县级行政单元,应该按照县级单位对待,更重要的是,市辖区的人口密度普遍较高,这是人口聚集的结果,也是人口分布的密度高峰区,是人口分布不平衡的反映,合并处理不能看出差异性,也会融化其之间的差异。基于此,本研究的分县是指区、县、县级市、自治县等县级行政单元,本文统计到总共2844个县级行政单元。
这里以2010年(2000年同理,这里不详述)中国分县尺度人口密度为例,如图1。中国人口分布非常不平衡性,东南和西北人口疏密悬殊的两部分的分界线十分明显。将数据利用分位数分级方式分为16个层级,绘以不同颜色加以区分,并同样采用“胡焕庸线”的地理分界方式(如图中的斜线),得到更为清晰的空间异质性关系。“胡焕庸线”东南和西北两边截然不同,中国整个人口密度最低的区域,几乎全部位于分界线的西北部,该区域内人口稍微比较高的范围位于兰州市、西宁市和银川市三个省会周边和河西走廊一带。对于东南部,尽管人口密度普遍较高,但差异依然明显。可以看到,有几个人口密度高峰区域,分别是:京津地区;河北省东南部、河南省东北部和山东省西南三地构成区;上海和苏南地区;珠三角地区;成渝地区;武汉和长沙地区等。其中人口密度最高的是上海虹口区(36210人/平方公里);最低是西藏的日土县(0.091人/平方公里);平均值为1116.9人/平方公里,标准差为3075.4;高于和低于平均值的县域个数分别为456个和2388个。
“胡焕庸线”始终是人口分布研究的重要议题,本文统计得到该线西北半壁和东南半壁的面积分别为574.39万和384万平方公里,占比分别是40.07%和59.93%。人口方面,2000年西北半壁和东南半壁的人口总数分别为5414.68万和124261.22万,占比分别是4.56%和95.44%;2010年两个半壁的人口分别为6068.75万和127212.33万,比例分别为4.77%和95.23%(见图2)。2000和2010年,两个半壁的人口分布与胡焕庸1935年的研究基本一致。
另外通过两次普查数据的叠加分析,得到如图3的人口密度变化图,统计显示密度增加的县域个数为1776个,平均增幅为21.4%;密度降低的县域个数是1068个,平均降幅为9.6%。其中人口密度增加表明人口增加,原因除了自然增长,更大可能是人口迁入。人口密度降低表明人口减少,这主要是人口迁出的结果。人口密度降低的区域普遍在东南半壁,其中华中大部分区域,特别是长江中下游和淮河流域一带出现了大范围的降低。
图2 中国2000年分县人口密度图数据来源:中国第六次人口普查。
图3 中国2000-2010年人口密度变化图数据来源:中国第五、六次人口普查。
2. 中国分县尺度人口密度频率分布
上面的数据只是表明中国人口分布非常不平衡,但这种不平衡性背后是否依然隐含有一定的规律值得探讨。这里从概率分布入手,绘制和观察人口密度频率分布图。先看2000年中国分县人口密度频率分布直方图(图4左),直观上看至少与常见的正态分布是不吻合的,但其基本规律是随着人口密度的上升,频率在不断下降,推测存在指数函数的变化特征,为此可以将人口密度对数化后再进行分析。将人口密度对数化后再绘制频率分布图,如图4右所示,此时有明显的正态分布趋势。将对数化的数据按正态分布函数拟合得到正态分布曲线,曲线的拟合结果比较符合之前的推测。再看2010年,按照同样的分析过程,绘制图5,发现呈相似的特征,说明用对数正态分布函数为基础进行分析是可行的。由此表明对数正态分布函数比较符合中国人口密度分布特征,本文将以该分布为基础进行模拟分析。
图4 2000年人口密度及其对数频率直方图与正态分布拟合数据来源:中国第五次人口普查。
图5 2010年人口密度及其对数频率直方图和正态分布拟合数据来源:中国第六次人口普查。
三、基于对数正态分布的人口密度概率分布函数拟合
1. 对数正态分布函数介绍
顾名思义,对数正态分布(Log normal distribution)指随机变量的对数符合正态分布。它和正态分布的关系是:如果X是正态分布的随机变量,则 exp(X) 为对数正态分布;同样,如果Y是对数正态分布,则ln(Y)为正态分布。
对于x>0,对数正态分布的概率密度函数为:
(1)
其中α为变量x的对数平均值,β为标准差。对数正态分布的期望μ和方差σ2分别为:
μ=E(X)=e(α+β2)/2, σ2=Var(X)=(eβ2-1)e2α+β2
(2)
同理,如果给定期望值与方差,也可以用这个关系求α和β:
(3)
确定公式(1)对数正态分布的概率密度函数重要的是估计参数α和β,估计这两个参数的方式可采用极大似然估计。
2. 全国模拟结果与分析
根据对数正态分布函数的特征,关键是要得到参数α和β。以2010年为例,依据式(1),将全国分县人口密度数据进行拟合,得到参数α为5.5161,β为1.8572,即可得到全国的人口密度对数正态分布函数:
(4)
图6 2010年对数正态分布函数拟合(人口密度<3000人/平方公里)
将函数(4)绘制成曲线图,得到图6(由于人口密度的巨大差异,且大部分县域的人口密度小于3000人/平方公里,这里将X轴的最大值控制在3000以下)。这应该能清楚地反映我国人口密度的对数正态分布拟合现状。2000年拟合结果同理,参数拟合结果见表1。
3. 分省拟合结果与分析
同理可以得到每个省的参数α和β估计结果,如表1。有了这两个参数就可以构建概率密度函数f(x)。前面已经说明了α和β的意义,即α为人口密度对数的均值,所以该值的大小就反映了每个省人口密度的大小;β为人口密度对数的方差,所以该值的大小就反映了人口密度的内部差异,越大越不均衡,越小越均衡,因此依据该值便可以判断每个省内部人口分布的不均衡性或差异性。
表1 全国和各省人口密度对数正态分布参数α和β估计结果
由于数据本身无法直观显示其函数的分布状态,为此可以绘制出每个省的对数正态分布拟合曲线,以观察各省的人口密度分布函数特征,但篇幅有限,这里仅举四个实例:东部选取江苏省、中部选取河南省、东北选取辽宁省、西部选取四川省,如图7所示。图7中显示每个省的拟合曲线趋势由于参数α和β的估计结果不同而不同,不过总体上全国31个省域的拟合曲线趋势主要有两类形状*判断形状的方式是:如果α和β为已知参数,以公式(1)对x求导,得到影响导数正负符号的因子(全部展开式比较复杂,这里不展开)为-(lnx-α+1),即仅与α有关,其判断规则如下:将省域所有县域的人口密度对数按照从小到大排列,并将排在首位的县域人口密度对数代入上式,如果结果小于0,则形如后面所指的第一类,如江苏省;如果结果大于0,则形如后面所指的第二类,如辽宁省。:形如江苏省、河南省和四川省*四川省看似形如第二类,按照上一脚注的判断方法,其实为第一类,只是由于坐标跨度相对较大,显示不出来而已,如果放大局部显示,是可以明显观察到的。的形状,f(x)值随着人口密度的增加先增加然后下降,此类形状表明人口分布相对来说更均衡;形如辽宁省的形状,f(x)值随着人口密度的增加直接下降,此类形状表明人口分布相对更不均衡。如此就可以根据表1的估计结果直接判断每个省的拟合曲线的大致走势,限于篇幅不再展示。
图7 东、中、东北、西部代表省份人口密度对数正态分布拟合结果
四、基于对数正态分布的人口密度概率分布函数预测
人口学方面的预测大多是围绕总量或趋势视角,比如人口总量、劳动力数量和老年人口比例等,在生育率相对较低且稳定的情况下,总量预测的现实指导意义相对有所下降。随着人口流动性加强、城市化加快和集中化加剧,人口密度的分布预测就显得越发重要。如果能预测到未来中国人口密度的分布规律,则进一步可以知道人口密度分布范围(譬如未来某年80%或90%的比例集中的人口密度范围),这对于掌握人口分布有更大的新意义。同时对于人口流动、迁移来讲,这种预测应该比单纯的人口趋势预测更有意义。
1. 条件分布预测模型
回到公式(1),要预测人口密度的分布函数,就要估计预测时点的α和β值,因此与其说预测人口密度的分布,不如说是预测α和β,所以问题的关键就回到了估计这两个参数上。那如何预测这两个参数呢?这里可以利用“条件对数正态分布”的概念进行解析,即决定α和β值的“条件”是什么。如果进一步理解,可以这样说,这两个参数决定了人口密度的分布,其中就包括人口分布的不平衡性,那么又是什么条件决定了这种不平衡性?
为了方便,这里用变量Z表示(向量)决定α和β的“条件”,可以记为α(Z)和β(Z)。现在的问题是变量Z如何确定?亨德逊(Henderson) 曾指出一些影响人口分布或密度不平衡性的主要变量,比如工资水平、通勤成本、技术水平、教育水平、就业率等[21]。不过正如麦科姆所说,这些变量难以进行长期的预测,最后其根据麻省理工学院的EPPA模型(Emissions Prediction & Policy Analysis Model)预测的两个关键指标来分析:人均GDP和可利用土地人口密度。本文遵循其基本观点,但稍作修改:人均GDP指标保留,这是基本的经济指标,是常用的指标,更重要的是长期预测相对比较丰富和容易;可利用土地人口密度替换为可利用土地的经济密度*由于不是所有土地都能适合人类居住,因此用可利用土地面积来分析比总面积更符合现实。本文可利用土地面积指农业用地和建设用地两个指标的总和;两者的数据都是2009年我国土地普查数据。同时,这里假定,在预测期间内区域可利用土地的面积总量是不变的。这种假定是比较符合现实的,因为在一定时间内,可利用土地面积确实不会发生显著的变化。(即单位可利用土地面积的生产总值产出),原因是α和β本身是决定人口密度分布的,而又用另外一个人口密度指标来决定α和β本身,有循环决定、互为相关的嫌疑。所以本文的两个指标是“人均GDP”和“可利用土地的经济密度”,可分别称为“人均产出”和“地均产出”。
综上,可以列出α(Z)和β(Z)的“条件”方程(取对数):
lnαi=c1+a1lnGDPpci+b1lnEDi+εα
(5)
lnβi=c2+a2lnGDPpci+b2lnEDi+εβ
(6)
其中GDPpc是指人均GDP,ED是可利用土地指经济密度(economic density on arable land area);c是常数,a和b是估计参数,ε是误差;i为31个省市自治区。
2. 模型预测前向(未来)检验
预测是对未来的判定,但做预测之前先做模型预测检验,以确保条件分布预测的可行性。鉴于本研究关注的是“五普”和“六普”的数据,本文的检验是以2000年的人口密度分布参数(见表1)来预测2010年的参数,并比较误差,这样就能检验人口分布能否有效预测。首先估计方程(5)和(6)并得到估计结果,如表2;其中数据来源于《中国统计年鉴》。表2显示,所有的系数都通过了5%以上的显著性检验。拟合优度也显示,α的拟合优度为0.7以上,比较高;β的拟合优度为0.2以上。严格来说,0.2的拟合优度用来做预测有一定的牵强性,对预测的精度有影响。不过需要指出的是,本文尝试用“条件预测模型”进行创新性地研究人口分布规律尚属鲜见,加之用“人均产出”和“地均产出”来解释和预测人口分布是因为这两个指标的权威或官方预测比较多见,即主要考虑人口数和GDP,能方便获取到可用数据。不可否认,理论上还可以找到“决定”α和β的其他潜在指标,但当前本文的主要工作不在于寻求这些潜在因素,而是抛砖引玉,在人口分布预测方法及实证上做一些创新性的研究,后续研究可以在此基础上进一步完善,以期达到更好效果。基于此,本文认为用人均GDP和经济密度两个条件在当前研究背景下能很好地“决定”α和β的值。
表2 2000年关于α和β的条件估计结果
注:**和***表示5%和1%的显著性概率。
得到两个参数的拟合方程后,即可进行预测检验。将2010年的人均GDP值和可利用土地经济密度代入表2的估计结果,计算出2010年的α和β预测值,并比较2010年α和β的实际值,得到预测误差,如表3。结果显示α和β两个参数的预测误差都较小,表明拟合方程用来预测中国分县人口密度分布是比较可靠的。当然,也可以进行分省预测分析,限于篇幅和本文的关注点是全国,在此就不作分析。
3. 模型预测后向(过去)检验
表3 2010年α和β的实际值与预测值比较检验
前向(未来)检验发现,对数正态分布函数用来预测未来中国分县尺度的人口密度分布应该是可行的,或者说可以直接采用2000年数据预测2020-2100年人口空间分布态势,但基于“就近原则”,采用2010年的数据来预测2020-2100年人口空间分布态势更为合理,因为数据有更新、可信度更高。不过,用2010年的数据进行预测的话,就无法进行前向(未来)检验,即无法检验其对未来预测的准确性,为此,这里改为后向(过去)检验,把预测方程用到过去发生的情况,即用2010年的数据和“条件方程”来检验2000年的人口分布态势。如果结果能较好地反映过去普查的结果(即误差较小),那即可同前向(未来)检验一样,获得有信心的认可度。为了增加可信度,这里增加1990年“四普”分县人口分布数据进行加试;不过鉴于数据的可获得性和行政单元的连续性,就不再分析之前的普查数据(其实“四普”、“五普”、“六普”的县域行政单元已有较大的变更,本文以“六普”时的行政单元为基础,调整、还原“四普”和“五普”时期对应的分县数据)。
为此,先拟合2010年α和β的估计方程,结果如表4(所有指标意义同表2,不再阐释)。
表4 2010年关于α和β的条件估计结果
注:*、**和***表示10%、5%和1%的显著性概率。
表5 1990年、2000年α和β的实际值与预测值比较检验
同理,得到两个参数的拟合方程后,即可进行后向预测检验。将“五普”、“四普”时对应的人均GDP值和可利用土地经济密度代入2010年的估计结果,计算出1990年、2000年的α和β预测值,并比较两次普查时α和β的实际值,得到预测误差,如表5。结果显示α和β两个参数的预测误差比前向(未来)检验时稍大,尤其是对于“四普”时的预测,其中β的误差为14.35%,这与其拟合优度0.25的偏低值有关,但作为创新性的探索,该误差并非离谱到完全不可以接受,应该说后向(过去)检验具有一定的可信度。当然,如前面所述,未来的后续研究可以在此基础上进一步完善,提高精度,以期达到更好效果。为此,本文以2010年数据和“条件方程”为基础进行预测。
4. 预测结果与分析
根据定义,GDPpc是GDP除以人口总量,即要预测GDP和人口总量;ED是GDP除以可利用土地面积,即要预测GDP和可利用土地面积。在假定可利用土地面积在预测期内是保持不变的情况下,实际上是预测GDP和人口总量两个指标,而这两个指标数据很多权威机构有着长期的预测,这比个人重新预测更能被接受,因此本文直接借鉴前人成果。其中人口总量指标采用联合国(2012年修订版*本文未采用最新版本的预测数据主要因为:一是作者比较了2012版和后续版本的数据,发现后续版本对中国人口预测与2012版对应年份基本上是逐步偏低的,可能未考虑2013年和2015年“单独二孩”和“全面二孩”的影响,因此2012版本其实可能更准确;二是本文搜寻到的经济数据为2012年汇丰银行的预测结果,为了对应,人口数据亦采用2012版预测结果为妥;三是时间间隔短,2012版与最新版本数据相差并不大,加之本文还需将其转化成人均水平,并且做对数处理,因此采用2012年数据对预测结果的影响甚微。)预测数据[22]。对于GDP数据,本文采用汇丰银行2012年全球研究报告的数据[23],其预测的中国年均GDP增长率分别为:2010-2020年为6.5%,2020-2030年为5.7%,2030-2040年为5.1%,2040-2050年为4.6%;由于仅预测到2050年,所以2050-2075年和2075-2100年采用EPPA预测数据[24],其预测中国经济增长率在2050-2075年为2.8%,2075-2100年为2%。综上,经相关计算并整理得到2020、2030、2040、2050、2075和2100年的相关数据如表6所示。
表6 中国2020-2100年相关数据预测
将表6数据代入表4的估计方程,得到α和β的拟合数据,如表7。结果显示,α预测值基本稳定,略微有所下降;β预测值则有显著增加。根据两个参数的意义可知,未来中国分县尺度的人口密度的均值不会有显著变化,但是它们之间的差异将会显著增加,即分布将会越来越不平衡。
表7 2020-2100的α和β预测值
本文的目的不仅是预测这两个参数而已,而是分析两个参数预测值的变化对人口密度分布函数有怎样的影响。将α和β值按年份代入对数正态分布函数公式(1),便可绘制出每个预测年份的概率密度曲线。由于数量级别相差太大,这里不给出完整的概率密度曲线(否则无法显示细节特征),而是给出三个分段的概率密度曲线作为示例,如图8(仅给出2020年、2050年、2075年和2100年预测曲线;2010年是已知数据,是为了比较)。
如图8a,人口密度在0-1人/平方公里范围内,各曲线的区别是显而易见的,2010年和2020年的曲线没有显示出来,原因是其数据量级过小无法观测到。2050、2075和2100年的概率密度曲线有明显的区别,即随着时间推移,低人口密度区范围在加大。看图8b,此时2020年的概率密度曲线位于最高点,2010年位于次席,2100年反而位于最下面,这与图8a相反,也就是说在100-2000人/平方公里这个中国核心人口密度分布范围内在未来将持续降低。再看图8c,与图8b几乎正好又反过来,先是2075年的密度曲线最高,约在18000人/平方公里处2100年密度曲线变为最高并一直持续下去。也就是说未来在10000-30000人/平方公里的高人口密度区会增加,人口集中性增强。这些结果意味着中国分县人口密度的什么趋势呢?综合图8a、b、c发现它们在图中的相对位置有交替的现象,不过基本规律是未来中国无人区(人口密度小于1人/平方公里)的区域增多、核心人口密度分布区(100-2000人/平方公里)在收缩的、高人口密度区在扩大(10000-30000人/平方公里),而仔细推敲,其实这点都表明中国人口在集中,聚集程度不断加大。
图8 中国人口密度对数正态分布函数预测的分段曲线
图8得出的是中国人口在集中、聚集程度将不断加大的定性结论;为了定量分析这个结论,将图8中曲线的部分数值特征表达出来,更有说服力,下面将结合具体累计概率进行分析,如表8。首先看人口密度小于1人/平方公里的无人区,2010年的情况是无人区县域单元占1.02%,到了2100年已经达到18.41%,即许多极低密度人口区将因人口持续迁出而变为无人区,因为当前我国许多区域确实不适宜人口分布,但依然有人口聚落,随着国家主体功能区的实施,人口有序迁移流动将持续进行,相信许多不适宜居住区的人口将迁出,这个预测结果与国家宏观政策是吻合的。同样小于10人/平方公里的超低密度区范围也在持续扩大。从人口密度小于100人/平方公里开始,直到小于800人/平方公里,未来都没有太大的变化,比如人口密度小于200人/平方公里的区域几乎保持在53%左右长期不变,与当前中国人口密度的均值约为140左右最为接近。到了人口密度1000人/平方公里以上的较高密度时,随着时间推移,累计概率开始持续下降,即表明近期人口密度集中在1000人/平方公里以下较多,2010年达到83%,而2000人/平方公里以下接近90%;到了远期,比如2050年1000人/平方公里的区域下降为73%,2100年下降为66%。再看最高的两个人口密度累计概率,都是在持续下降,2010年几乎所有区域人口密度不超过30000人/平方公里(该年仅为3个县域),而到了2100年,接近有15%的区域超过30000人/平方公里而成为超高密度区(拥挤区)。
表8 中国现状和未来人口密度分布累计概率(1) %
将表8稍作变换,首先把人口密度按大小分成六个区,即无人区(人口密度小于1人/平方公里)、稀疏分布区(人口密度在1-100人/平方公里之间)、核心分布区*核心分布区的含义是指中国县域的人口密度主要分布在这个范围内,2010年统计得到超过65%的县域人口密度集中于此,所以命名为核心分布区。(人口密度在100-2000人/平方公里之间)、中位集中区(人口密度在2000-10000人/平方公里之间)、高位集中区(人口密度在10000-30000人/平方公里之间)和超高密集区(人口密度大于30000人/平方公里),再做些融合和调整计算,统计得到表9,则一些特征更加明显。
表9 中国现状和未来人口密度分布累计概率(2) %
第一,无人区累计概率持续扩大,这一点前面已经分析,不再赘述。第二,稀疏分布区累计概率相对稳定,但占有比较大的比例,换句话说就是人口稀疏的地域大,反映出人口密集区集中了更多的人口。第三,核心分布区累计概率持续降低,表明密度分布于此范围的县域不断减少,言外之意是很多区域都“摇身”变成了更高级别的分区(当然最可能就是中位集中区,但不排除直接上升到高位集中区或超高密集区)。第四,中位集中区累计概率先上升,到2050年达到最大(11.52%),然后略微下降,不过基本稳定在10%左右。第五,高位集中区先下降(在2030年甚至降低到0.54%,下降的原因本文还无法给出解释,且将其归为个别的预测误差,不过不妨碍总体趋势),然后持续上升,在2100年累计概率达5.33%,而2010该值仅为1.75%。第六,超高密集区累计概率持续扩张,即类似当前上海市虹桥区、浦东新区,广州越秀区,深圳罗湖区等城区内某些最拥挤的闹市区在中国的比例将持续扩大,在2100年的累计概率达到14.86%,如果换算成个数大约为422个(假定保持全国县域个数2844个不变)。不妨简单做个假设,假设届时中国有422个类似的区域(不一定是行政单元,比如类似于香港“中环”区域),每个区域的面积为20平方公里(基本相当于当前我国一些最稠密人口城区的面积)、人口密度为40000人/平方公里,则可推算这些地区将承载我国约3.4亿人口,约占届时中国人口的1/3。如果2100年太遥远,那么再计算2050年累计概率也已经接近4%,也将大约有113个超高密集区,而在2010年仅有3个,比例仅为0.11%。这就不难解释为何稀疏分布区累计概率持续上升、核心分布区累计概率持续下降等特征的原因了。届时超高密集区将集中我国大量人口,类似东京或香港中央商务区等超高密度区将在中国城市持续出现。
五、基本结论与政策含义
梳理有关人口分布的研究发现,人口分布本身的“分布规律”研究视角几乎无人问津,本研究就以此为切入点,对中国分县尺度人口密度的概率分布规律进行模拟和预测。这个视角与之前的研究是完全不同的。在人口学预测方面,大多是围绕数量或结构,比如区域人口总量、老龄化率和人口红利等,而关于人口分布方面的预测比较鲜见。而在生育率相对较低且稳定的情况下,总量预测的现实指导意义相对有所下降。随着人口流动化加强、城市化加快和集中化加剧,人口密度的分布预测就显得很重要,因为中国新一轮的城镇化正在加速推进,而人口在大、中、小城市的分布历来不均衡,几乎都是集中于大城市,大城市的主城区即是人口密度高值区,偏远山区的县市则是人口密度的低值区。如果能对未来一段时间内这些区域的人口密度分布变化进行估计,对于人口流动、迁移和分布应该比单纯的人口总量趋势分布更有意义,本文就分析了这个越来越重要的问题,也预测了较为翔实的统计数据。
具体模拟结果发现,中国分县尺度的人口密度比较符合对数正态分布,在此模拟基础上,经2000年普查数据的前向(未来)预测检验和2010年普查数据的后向(过去)预测检验满意后,用2010年中国分县数据预测2020、2030、2040、2050、2075和2100年的中长期人口密度分布函数和统计规律,估算了翔实的未来中国分县尺度人口密度的概率分布统计数据。结果还显示,中国人口分布的不平衡性将会持续加大。比如到2050年,无人区(小于1人/平方公里)的县域比例将从1.02%(29个)增加到4.49%(128个),超高密集区(大于30000人/平方公里)的区县比例将从当前的0.11%(3个)增加到3.93%(112个)。这并非是本文预计的个例,王露等预测了2020年和2030年中国分县人口规模,其结论也是“人口聚集态势将更加明显”[14]。另外,本文预测两个极端,即无人区和超高密集区的范围都在扩大,表明人口分布的两极化越来越明显,人口将越来越向人口密集区集中,人口分布和流动存在显著的路径依赖性。这种路径依赖是现实的,要正视这种现实,所以我们可以根据以上数据做好前瞻的规划工作,因为既然趋势无法阻挡,应该提前把握,做好规划。比如根据本文预测,估计出了未来有多少无人区或超高密集区域,后续就该做好设想和评估,究竟哪些区域会成为这两类区域,更应该依据国家发展战略如主体功能区规划做好无人区的人口迁出工作,做好未来可能成为超高密集区的城市规划等工作。
人口集中化的趋势是必然的,所以我们政策的重点不是局限于控制北京、上海等人口的外来人口流入,而是如何选择地评估、规划、塑造新的有潜力的“北京”和“上海”。 事实上,全球经济发展和财富分布都不平衡:人口、生产和财富向城市、大城市和发达地带聚集和集中[25]。全球范围的证据表明,人的经济活动所包含的逻辑就是在流动中聚集,然后再流动、再聚集,直至人口、经济和财富在地理上集中到一个个面积奇小的地方去[26],这是人口理想的自然选择结果(理性地选择聚集经济及效益),只要边际聚集效应还在,除非有越不过去的屏障,就一定还会吸引更多的人口聚集。
以日本东京为例,早在30多年前就开始担忧其人口太密。有关政策在很长时间里围绕“东京疏散”的思路推进。可是直到今日,东京的人口聚集度依然在增加,“向东京聚集”的进程还是势不可挡。2015年日本总务省发布《人口移动报告》表明,2014年日本首都圈(东京都及周边三县)的净流入人口为109408人,比上年增长12884人,这是连续19年增加[27]。日本政府一直在努力减轻东京的人口压力,但很多政策都未取得明显的效果。同样,中国北京也在多年前担忧人口密度将过高,出台的政策也提出在2020年控制在1800万人以内,但该目标早在2010年之前就被突破,“六普”显示北京2010年常住人口达到1961.2万,而政策依然还是没有根本改变,新政策依然在强调“控制人口聚集”,然而并没有控制住,“向北京聚集”的事实持续升温。
鉴于此,本文的政策含义是:与其将大量资源放在如何应对未来北京越来越拥挤的问题上,不如转移部分资源,将有潜力的其他大的中心城市提前做好成为“类北京”超高密集区的准备,未雨绸缪,防范“北京病”在未来其他潜在的特大中心城市蔓延。比如类似于“疏解北京非首都功能”、“京津冀协同发展”便是政策转向的开始,本文对于“疏解北京非首都功能”的理解是“资源转移”,转到有潜力的“新增长极”上,这样对于人口再分布、缓解人口拥挤应该说是更为理想之策,本文的研究及隐含结论能很好地支撑该政策。
[1] 曾永明.高原高山区人口分布特征及影响机制研究——基于空间计量经济学视角[J].南方人口,2014(3):1-9.
[2] 杜本峰,张耀军. 高原山区人口分布特征及其主要影响因素——基于毕节地区的Panel Data计量模型分析[J].人口研究,2011(5): 90-100.
[3] 叶东安.我国人口分布的现状和特点——人口分布问题研究综述[J].人口研究,1988(5): 57-59.
[4] 胡焕庸.中国人口之分布——附统计表与密度图[J].地理学报,1935(2):33-74.
[5] 张善余. 人口垂直分布规律和中国山区人口合理再分布研究[M].上海:华东师范大学出版社,1996:8-26.
[6] YUE T X, WANG Y A, LIU J Y, et al. SMPD scenarios of spatial distribution of human population in China[J].Population and Environment, 2005,26(3):207-228.
[7] LV Chen, FAN Jie, SUN Wei.Population distribution and influencing factors based on ESDA[J]. Chinese Journal of Population, Resources and Environment,2012,10(3):47-53.
[8] 方瑜,欧阳志云,郑华,等. 中国人口分布的自然成因[J].应用生态学报,2012 (12):3488-3495.
[9] 李仪俊.我国人口重心及其移动轨迹[J].人口研究, 1983 (1): 28-32.
[10] 刘德钦,刘宇,薛新玉. 中国人口分布及空间相关分析[J].测绘科学,2004(7):76-79.
[11] MCEVEDY C, RICHARD J. Atlas of world population history[M]. New York: Penrmin Press. 1978:242.
[12] Durand J D. Historical estimates of world population: an evaluation[J]. Population and Development Review, 1977,3(3): 253-296.
[13] HENDERSON J V. Innovation and agglomeration: two parables suggested by city-size distributions: comment[J]. Japan and the World Economy,1995, 7(4):391-393.
[14] 王露,杨艳昭,封志明,等.基于分县尺度的2020-2030年中国未来人口分布[J].地理研究,2014(2): 310-322.
[15] 闫庆武.空间数据分析方法在人口数据空间化中的应用[M].南京:东南大学出版社,2011:23-24.
[16] GROISMAN P Y, KARL T R, EASTERLING D R, et al. Changes in the probability of heavy precipitation: important indicators of climatic change[J]. Climatic Change,1999, 42(1): 243-283.
[17] 龚伟俊,李为相,张广明.基于威布尔分布的风速概率分布参数估计方法[J].可再生能源,2011(6):20-23.
[18] 陈建东,罗涛,赵艾凤.收入分布函数在收入不平等研究领域的应用[J].统计研究,2013(9): 79-86.
[19] 胡志军,刘宗明,龚志民.中国总体收入基尼系数的估计:1985-2008[J].经济学(季刊),2011(4): 1423-1436.
[20] MALCOLM O A. Simulating the spatial distribution of population and emissions to 2100[J]. Environmental Resource Economic,2008,39:199-221.
[21] HENDERSON J V, Hyoung Gun Wang. Urbanization and city growth: the role of institutions[J]. Regional Science and Urban Economics,2007, 37(3):283-313.
[22] Population Division of the Department of Economic and Social Affairs of the United Nations Secretariat, United Nations. World population prospects: the 2012 revision[R/OL].[2014-12-14]. http://esa.un.org/unpd/wpp/index.htm.
[23] KAREN W.The world in 2050:from the top 30 to the top 100[EB/OL].[2012-01-11].http://www.hsbcnet.com/hsbc/research.
[24] SERGEY P, JOHN M R, HENRY D J,et al.The MIT emissions prediction and policy analysis (EPPA) model: version 4[EB/OL].[2014-12-19]. http://MIT.EDU/globalchange/
[25] The World Bank. World development report 2009: reshaping economic geography[M].Washington DC: Quebecor World Press,2009:56-62.
[26] 周其仁.经济密度甚于人口密度[EB/OL].(2012-03-16)[2015-12-14]. http://finance.ifeng.com/opinion/mssd/20120316/5762057.shtml.
[27] 凤凰网.日本人口因经济问题加快向东京等大城市集[EB/OL].(2015-01-07)[2015-12-14]. http://city.ifeng.com/a/20150207/417864_0.shtml.
[责任编辑 方 志]
Simulation and Projection on the Pattern of Chinese Population Spatial Distribution:Research with Population Density of County Level Based on the 5thand 6thPopulation Census of China
ZENG Yongming
(Research Center of West China’s Economic, Southwestern University of Finance and Economics, Chengdu 611130, China)
Population spatial distribution unevenness is an universal phenomenon, but the issue that wether the population distribution is in accordance with some statistic law is worth to be studied. This paper will simulate and project the probability distribution function of population density based on the county level data of the 5thand 6thChina Population Census, and then discuss the distribution characteristics of future population density in China. The main results show that 1) Chinese county level population density is in accordance with Log Normal Distribution; 2) output per capita and output per land can in a large extent fit the future probability distribution of population density in China based on the 5thand 6thChina Population Census data; 3) the gap of population distribution in China from the year 2020 to 2100 will be larger based on the projection with the 6thChina Population Census data; For instance, from 2010 to 2050, the ratio of Non-people Area countries (where density <1 per/km2) will increase from 1.02% (No.29) to 4.49% (No.128) and the ratio of Dense-people Area countries (where density >30000 per/km2) will increase from 0.11% (No.3) to3.93% (No.112).
population spatial distribution; population density; spatial unevenness; simulating projection; log normal distribution; county level
2016-01-13;
2016-05-21
江西省社会科学“十三五”(2016)规划项目(16SH11)。
曾永明,西南财经大学中国西部经济研究中心博士研究生。
C922
A
1000-4149(2016)06-0048-14
10.3969/j.issn.1000-4149.2016.06.005