中国青年女性的初次迁移:趋势与影响因素
2021-05-30刘金菊
刘金菊,陈 卫
(1.北京城市学院 公共管理学部,北京 100083;2.中国人民大学 人口与发展研究中心,北京 100872)
一、引言
迁移是影响一个国家或地区人口变化的三大要素之一。历史上多数国家的人口变化主要受死亡率和生育率变化的影响并由人口学家在人口转变理论框架下进行描述与解释。经典人口转变理论只涉及死亡和生育两大人口变化要素。美国著名地理学家泽林斯基首次将迁移转变纳入人口转变的理论框架,提出了与人口转变相对应的五阶段迁移转变理论。[1]但是几十年来迁移转变的实证研究很少。迄今为止对全球人口转变的研究基本上都是侧重死亡和生育的变化,这两方面的研究也构成了人口学研究的主体。20 世纪80 年代以后西方学者又提出了第二次人口转变理论,[2]将人口转变的视野延展到婚姻和家庭关系中,相应的实证研究也层出不穷。2006 年第三次人口转变理论又被提出,将视角又延伸到迁移,即在低生育率国家,人口迁入将改变一个国家的种族、文化、语言等社会经济结构。[3]实际上很多长期低生育率的国家人口保持增长的原因就是国际迁移。在世界上许多地区,随着人口转变的完成,迁移替代生育和死亡成为人口变化(人口增长和空间分布)的主导因素。[4]
中国的人口转变也经历了从以死亡率下降为主导到以生育率下降为主导,再到以人口迁移和流动为主导的变化过程。[5]中国的人口流动已经成为人类历史上在和平时期前所未有的、规模最大的人口迁移活动,正在超越生育和死亡成为主导中国人口态势的最主要的人口因素。[6]尽管如此,就全国而言,因为中国的国际迁移很少,无论是现在还是可以预见的将来,国际迁移主导中国人口发展态势是不可能的,主导中国未来人口变化的仍然是生育率。但是就中国的区域人口态势而言,人口迁移的主导作用已经存在很长时间。特别是大城市和东部沿海地区,正是大量的人口迁移使得这些地区在长期极低生育率条件下,人口一直在快速增长,而一些中西部地区即使在较高生育率条件下,因人口迁移而形成人口负增长。
尽管对迁移的研究方兴未艾,有关中国流动人口、农民工的研究文献浩如烟海,但是可以看出与死亡和生育研究相比,迁移研究有着十分不同的特征。最重要的差别是我们使用出生率、死亡率、总和生育率、平均预期寿命等指标描述人口转变过程,但是在研究人口迁移和流动时,类似的指标是缺失的。即使是迁移转变论的提出者在解释与人口转变相对应的五阶段迁移转变时,也没有提出测量迁移的任何指标。迁移转变论和人口转变论的话语体系似乎是不同的。与人口转变对等的迁移转变研究几乎不存在。这很可能与迁移事件的复杂性有关。相对于死亡和生育,迁移是最没有一致性、可比性的定义,最缺少简洁的测量指标和方法。测量迁移远比测量死亡和生育复杂。所以,当我们说“中国的人口流动已经成为人类历史上在和平时期前所未有的、规模最大的人口迁移活动”时,我们实际上并不知道中国人口流动迁移的水平到底是多少,与其他国家相比有多高。澳大利亚学者近年来一项对世界各国人口迁移强度的研究表明中国的迁移强度是较低的,[4][7]与我国巨大的流动人口规模形成鲜明的反差。他们的研究利用各国的人口普查数据或其他数据,通过各国国内所有导致居住地址变化的迁移计算总迁移强度,是在迁移测量指标和方法上的有益探索,但是与生育率、死亡率指标相比仍然不够简洁。本研究的目的是尝试构建与生育率、死亡率相对等的迁移率指标,以此为基础分析中国人口迁移的水平与趋势。
二、数据与方法
目前中国关于人口迁移流动的数据主要来自国家统计局的人口普查和原国家卫计委的流动人口监测调查。人口普查或小普查有按照户籍地和常住地区分的人口数据,按照外出时间划分的流动人口数据以及与5年前或1年前的常住地相比发生变化的人口数据。人口普查或小普查提供的按照户籍地和常住地区分的人口数据以及按照外出时间划分的流动人口数据是流动人口规模数据,是流动人口存量数据,而按照5 年前或1 年前的常住地相比发生变化的人口数据可以粗略地代表该时期人口流动发生数量。前者可以分析流动人口规模的变化趋势和结构特征,而后者可以在一定程度上测量迁移水平。原国家卫计委的流动人口监测调查只关注流动人口本身,即使收集了流动事件信息,因没有风险人口就无法测量计算迁移水平。
我们在考察生育率变化时也有两种数据来源。一种是人口普查,人口普查询问了育龄妇女在调查前一年是否生育以及一共生育过几个孩子。我们可以计算普查年份(普查前一年)的总和生育率。另一种数据来源是生育率调查,生育率调查往往收集育龄妇女或扩展到更年长妇女的详细怀孕生育史,记录她们每次怀孕、生育的时间和结果等。据此我们可以构建一定时期每年的总和生育率以及其他生育指标。实际上可以借鉴生育率调查的方法,对样本量足够大的能够代表总人口的群体进行迁移史调查,询问每个人每次迁移的时间、目的地等,据此也就可以构建每年的总和迁移率指标。
不过,在中国历次生育率调查中或多或少都涉及迁移的信息。1988年2‰生育节育调查询问了家庭中15岁及以上成员的最近一次跨省迁移信息,即最近一次迁移发生在哪一年及迁移到哪个省。梁在等利用该数据考察分析了1950-1988 年中国国内人口迁移的趋势和空间差异以及这些趋势和差异与中国的政治经济变化的关系。[8]可以说这是对中国国内人口迁移水平及趋势的很好的探索,但是他们通过计算样本中的迁移数量的年度变化来反映迁移水平的变化趋势,然后又通过回归分析控制了年龄后计算了各个年度的回归系数来反映迁移水平,并没有提供人口学意义上的迁移率。本研究将使用2017年生育率调查数据,使用调查中获得的初次迁移的时间信息,构建类似于一般生育率(出生人数比风险育龄妇女人口)指标的一般迁移率(迁移人数比风险女性人口)指标,以此考察分析1990年以来中国女性迁移的水平和趋势。
2017年生育率调查由原国家卫生计生委组织实施,覆盖全国31个省(区、市)和新疆生产建设兵团,涉及2 737个县(市、区)的6 078个乡(镇、街道),共12 500个村(居)级样本点。调查采用分层三阶段与规模成比例的概率抽样(PPS)方法,最终有效样本量为249 946名妇女。调查目标为2017年7月1 日零时居住中国大陆的15-60 岁中国籍女性人口,调查内容涵盖个人基本特征、生育行为、生育意愿、避孕方法及生育养育服务等。调查中询问了被调查者第一次离开户籍所在县(市、区)的年月。本研究利用这部分信息计算中国女性的一般迁移率(后面简称为迁移率)。迁移和生育一样,是可重复事件,如果能记录迁移史,即每次迁移的时间,就像2017年生育率调查中记录生育史一样,那么就能够计算严格意义上的总和迁移率。不过,由于只调查了15-60 岁的女性,而迁移可以发生在任何年龄,尤其是往过去推算时,女性年龄还会减少,因此无法计算全年龄的迁移率。鉴于此,为了在较长时期上反映迁移水平及趋势,我们把年龄限制在15-34 岁,这样就可以考察1990 年以来的变化趋势。在早期,15-34 岁迁移女性人口占了全部迁移女性人口的绝大多数,但是后来儿童和中老年迁移日益增加。2010年人口普查的流动人口数据中,15-34岁女性流动人口只占了全体女性人口的一半(51%)。虽然流动人口数量(存量)并不能代表当年人口流动事件发生数量(流量),但是它毫无疑问表明其他年龄的迁移流动占了很大比例。
初次迁移和初婚、初育类似,是生命周期中的重要初次事件。如果说初婚、初育对于中国女性几乎是必然会发生的事件,那么初次迁移并不一定会发生。然而近几十年来中国女性的初婚、初育年龄不断推迟,不少女性可能最终会放弃结婚生育;而与此相反的是中国人口的流动性不断增强,迁移的发生率不断上升,初次迁移和多次迁移越来越多地发生在不同年龄的人群中,因而像计算测量初婚率、初育率那样计算测量初次迁移率也在理论和现实上具有越来越重要的意义。本研究利用2017年生育率调查中获得的初次迁移时间信息估算迁移率,需要将女性个案数据转换为人年数据,因为人口学中的率指标分母都是人年数。同时,在做生存分析时,为了避免等比例假设不符的风险,可以使用基于人年数据的离散时间风险模型。[9]本研究分析迁移的影响因素时使用这一离散时间风险模型。本文中所有图表数据来源均为2017年生育率调查,后文中就不再一一注明。
三、迁移水平与趋势
人口普查数据显示,中国的流动人口在1990-2010 年间经历了迅速增长,流动人口规模扩大了10 倍,由1990 年的2 135 万增长到2010 年的2.21 亿。[5][10]流动人口规模膨胀不是因为流动人口生育率高(研究表明流动人口生育率反而更低),而是人口流动迁移发生率高。图1 显示了中国15-34 岁女性的初次迁移水平和趋势,可以看出从1990-2008 年呈现快速上升趋势,迁移率由1990 年的0.85‰上升到2008年的8.39‰,2008年以后出现波动,增势大大减缓。2016年的迁移率达到8.90‰。这表明2016年每千名15-34岁女性人口中将近9人发生了第一次迁移。尽管这是15-34岁女性的迁移率,但是它的变化趋势似乎可以支持我国流动人口规模的变化趋势,即2010年前的激增和以后的缓增。相比于其他年龄,15-34岁是迁移发生的高峰年龄,所以全年龄人口的迁移率应该会低于15-34岁人口的迁移率。
另外,图1 中还显示在人口普查年份迁移率出现高峰的现象,1990、2000 和2010 年都是如此,以2000年最为明显。也许类似于年龄堆积,迁移申报存在尾数逢0年份的堆积,而尾数逢0年份也恰巧是人口普查年份。或者人口普查年份的迁移申报记忆最深刻、最不容易忘记而导致在后来的调查中也发生类似的堆积。2016年的迁移率是最高的,又明显高于前面年份。也可能说明经过2008-2015年的波动徘徊后又出现上升。图中还显示在2008年、2012年也出现迁移堆积。2008年为奥运年,而2000年和2012年都为龙年。我们曾经在利用2017年生育调查数据计算分析生育率变化趋势时发现在这三个年份出现生育堆积,而在2003年和2015年这两个羊年出现生育低谷,反映了明显的生育生肖偏好以及重大事件(奥运)对生育率的影响。图1 中观察到的迁移率在奥运年和龙年的高峰与生育率在这些年份的高峰很相似,也许是巧合,也许迁移也受重大事件和生肖偏好的影响。这是一个值得进一步研究的有趣的问题。
图1 1990-2016年中国15-34岁女性初次迁移率(‰)
在中国女性初次迁移率长期上升的同时,平均初迁年龄也在不断上升(见图2)。1990 年15-34岁女性的平均初迁年龄为17.4 岁,2000年上升到20.9 岁,2010 年达到26.2 岁,2016 年达到31.2 岁,在这26 年时间里基本上每年上升0.5 岁。和生育推迟产生抑制生育率的“进度效应”类似,迁移年龄推迟也会产生降低迁移率的“进度效应”。所以2010 年以后平均初迁年龄上升更快,对于迁移率波动和缓增会产生一定抑制作用。平均初迁年龄的提升是女性在校时间延长、受教育年限提高的必然结果。[11]另外,我们也怀疑近年来生育政策调整在提升生育率的同时,也可能有助于提升平均初迁年龄。一些已经生育了一个孩子打算迁移的女性,可能因为生育二孩而推迟迁移。
图2 1990-2016年中国15-34岁女性的平均初迁年龄
迁移不仅具有年龄选择性,其他的人口、社会和经济特征也会影响迁移的发生。根据2017 年生育调查中获得的各种女性个人特征变量,我们进一步考察户籍、民族、婚姻状况、子女数、受教育程度、职业、收入等与女性迁移率的关系。图3 至图9 展示了不同特征女性的初次迁移率的变化趋势。
我国的国内迁移主要是从农村到城镇,农业户籍人口的迁移占全国迁移的绝大多数,因此图3 中显示的农业户籍女性的迁移率变化趋势与图1 中显示的全体15-34 岁女性的迁移率变化趋势非常一致。在我们的分析样本中,全国迁移女性中82.5%是农业户籍女性。图3还显示非农业户籍女性的迁移也在不断增长,只是增长趋势要明显低于农业户籍女性。近10 年来农业户籍的迁移率是非农业户籍迁移率的2倍以上。
图3 1990-2016年中国15-34岁女性分户籍迁移率(‰)
图4 显示少数民族的迁移率趋势与汉族迁移率类似并存在着差异由扩大到缩小的趋势。2010 年前两者的差异逐渐扩大,2010 年后迅速缩小,与人口普查数据中显示的2010-2015 年全国流动人口中少数民族的占比有所上升是一致的,而在2000-2010 年少数民族流动人口的占比没有变化,甚至有所下降。[5]
图4 1990-2016年中国15-34岁女性分民族迁移率(‰)
随着年轻女性不断推迟婚姻,未婚女性的迁移率持续增长(见图5)。根据1990 年以来历次人口普查和小普查数据计算,中国15-34 岁女性人口中未婚比例日益提高,2000 年及以前都在40%以下,之后超过40%,2010年达到49%,2015年为46%。与此相应,未婚女性的迁移率也不断增长,2005年超过10‰,2016年达到16‰。图5 还显示,已婚女性迁移率也出现不断增长趋势,但是与未婚女性迁移率的差异持续扩大。尽管如此,20 多年间年轻女性中婚后迁移率也增长了2-3 倍。需要指出的是因15-34 岁年龄限制,该口径计算的未婚和已婚女性迁移率未必能反映全年龄口径的未婚和已婚女性迁移率,因为35 岁及以上的女性绝大多数已婚,没有包括在内,会降低已婚女性迁移率。
图5 1990-2016年中国15-34岁女性分婚姻状况迁移率(‰)
有研究表明个人及家庭因素(婚姻状况和孩子)对女性迁移的作用要大于男性。[12]与不同婚姻状况女性迁移率相对应,有无子女对女性迁移自然也产生重要影响。图6 显示出子女越多的女性迁移率越低的趋势。2000年前因整体的迁移率较低,有无子女的女性的迁移率差别很小,2000 年以后差别不断扩大。2000-2005 年已有3 个及以上孩子的女性迁移率明显低于其他女性,而子女数为0、1 和2 的女性迁移率没有差别。2005 年以后差异迅速扩大,3 个及以上子女的女性始终是迁移率最低的且出现平稳下降。2008 年后育有1 个孩子和2个孩子的女性迁移率出现明显下降,而没有孩子的女性迁移率在波动中继续上升,但是上升趋势也明显减缓。
图6 1990-2016年中国15-34岁女性分子女数迁移率(‰)
我国流动人口的人力资本禀赋持续提升,表现为流动人口的平均受教育年限不断提高。[5]有研究显示2000年以来,农村女性受教育程度显著提高,不少受教育程度较高的女性加入流动行列。[11]这一趋势也从图7 中得到反映。一个明显的特征是2000 年以后不同受教育程度的5 条曲线出现明显分野,迁移率继续上升的一组和迁移率趋于平稳的一组。这两组分别代表了较高受教育程度和较低受教育程度女性的迁移率。较高受教育程度组包括初中、高中和大专及以上,而较低受教育程度组包括不识字和小学。受教育程度为不识字的女性始终是迁移率最低的群体。小学受教育程度女性在20世纪90年代曾经是迁移率较高的群体,而2000年以来成为除了不识字群体外迁移率最低的群体。图7显示2010年以来,小学和不识字女性的迁移率已经趋同。与此相反的是,2000 年以来初中、高中及大专及以上女性的迁移率持续增长。高中女性在20世纪90年代后期成为迁移率最高的群体,并一直保持最高的迁移率至今。值得关注的是,大专及以上女性在20 世纪90 年代是除了不识字女性外迁移率最低的群体,而近10 年来一跃成为除了高中女性外迁移率最高的群体。较高教育程度群体迁移率的更快上升导致女性流动人口整体受教育程度的提高,对女性发展具有积极影响。有研究表明教育对女性迁移的影响也大于男性,因为它有助于女性摆脱赋予女性家庭角色的社会规范,有助于增强性别平等,而且流动女性的教育回报要大于流动男性。[13]
图7 1990-2016年中国15-34岁女性分受教育程度迁移率(‰)
我国流动人口外出的主要目的是务工经商并获得更好的经济收入。历次人口普查数据中显示的人口流动原因始终以务工经商占主导地位。[5]有研究表明改革开放以来,以婚姻嫁娶为主的女性流动逐渐让位于务工经商的流动,2000年以来的变化尤为显著。[11]图8 显示年轻女性中从事工业和商业服务业的迁移率始终高于其他职业并且在不断上升,上升幅度明显高于其他职业的迁移率。另外,2000 年以来专业技术人员和办事及有关人员的迁移率也有明显的增长。不同职业迁移率的变化也会带来收入结构的改变(见图9)。
图8 1990-2016年中国15-34岁女性分职业迁移率(‰)
图9 显示较高收入群体的迁移率始终较高而且有更快的上升趋势。图中的7 条曲线,以2-3 万元年收入为分界线,更高的收入具有更高的迁移率,而更低的收入群体始终迁移率较低(收入分组时,每组不包含上限值)。图中还可以观察到最高收入(5 万元及以上)群体的迁移率近10 年来有明显下降,3-4 万元和4-5 万元群体的迁移率在持续增长;同时0.5-1万元和1-2万元的迁移率在2016年有大幅度上升。这些变化是否与近年来的经济形势变化和经济结构调整有关,值得进一步探讨。
图9 1990-2016年中国15-34岁女性分收入迁移率(‰)
20 世纪90 年代以来我国的国内迁移绝大多数去往东部地区,2010 年人口普查数据显示东部地区的流动人口占比接近60%。[5]图10 分地区的迁移率也说明了这一点。与中部地区相比,东部地区迁移率不仅一直更高,而且差异持续扩大。东部地区的迁移率基本上是中部地区的2-3 倍。同时,西部地区的迁移率不仅高于中部地区,而且差异也在扩大。西部地区迁移率基本上是中部地区的1-2 倍。东西部地区迁移率也存在较大差异,但是差异基本上没有扩大,说明西部地区的迁移率也在持续增长。
图10 1990-2016年中国15-34岁女性分区域迁移率(‰)
四、迁移的影响因素
上一部分描述了中国15-34岁女性初次迁移的社会经济特征,但是一些特征之间是存在较高相关性的。为了考察上述因素的独立作用,本部分进行回归分析。使用方法为离散时间Logit模型,这一方法可以避免比例风险的假定。[9]将以妇女个人记录的数据转换为人年记录的数据。我们建立了两个回归模型,一个是考察各人年上是否发生迁移的影响因素(见表1),另一个是迁移是否跨省的影响因素(见表2)。因变量分别是各个人年上是否发生了初次迁移以及发生的初次迁移是否跨省迁移。两个模型的自变量是相同的,基本上就是前文所述的那些社会经济变量。具体说,年龄是连续变量,以年龄和年龄平方纳入模型,因为年龄与迁移率不是线性关系。民族是分类变量,以汉族虚拟变量纳入模型。户籍是分类变量,以农业户籍虚拟变量纳入模型。婚姻状况为分类变量,以已婚虚拟变量纳入模型。子女数为连续变量纳入模型。受教育程度为分类变量,以不识字为参照类,因此以其他四类的虚拟变量纳入模型。职业是分类变量,以农民为参照类,因此以其他六类的虚拟变量纳入模型。收入原本是连续变量,因其偏态分布,故转换为分类变量,以2 万元以下为参照类,以其他四类的虚拟变量纳入模型。区域是分类变量,分为东部、中部和西部,以中部为参照类,以东部和西部虚拟变量纳入模型。另外,我们放入了年代变量,以20世纪90年代为参照类,考察2000年和2010年以来的迁移发生可能性。
表1 1990-2016年中国15-34岁女性初次迁移影响因素回归模型
表1展示了1990年以来15-34岁女性初次迁移发生的影响因素。年代变量的结果与图1是一致的,2000 年以来迁移的发生比是90 年代的2.5 倍。尽管图1 表明2010 年以来迁移率有缓增趋势,但是回归模型结果表明迁移的发生比仍然有明显增加(是90 年代的3.2 倍,也是2000-2009 年的1.3倍)。迁移的年龄选择性体现在年龄的回归系数上。年龄和年龄平方都在统计上显著,表明迁移率随着年龄先上升,然后下降。图3 中显示的迁移率的户籍差异在回归模型中得到进一步证实,农业户籍女性的迁移发生比是非农业户籍女性的近3 倍。汉族的回归系数是正值,但是不显著,表明汉族和少数民族的初次迁移发生率没有显著差异,与图4 的结果相符。女性已婚和有子女都显著降低其迁移率。已婚女性迁移发生比要低于未婚女性20%以上,而子女数每增加一个,迁移发生比将下降近8%。女性受教育程度的影响基本上呈现出一种正向关系,即受教育程度越高,迁移率越高(大专及以上略有下降),高中是最高的,与图7 的结果一致。职业与迁移率的关系表明,除了单位负责人,从事其他非农职业的可能性显著较高,特别是务工经商的发生比率都在3 以上。迁移的经济效果也很明显,收入越高的群体具有越高的迁移率,迁移自然是为了获得较好的工作机会和更高的经济收入。最后,迁移的区域差异性很显著,东部地区最高,东部和西部地区都显著高于中部地区。实际上一节中的描述性分析和这里的回归分析与我们对迁移率水平变化及社会经济差异的预期是基本一致的。
表2 展示了1990 年以来15-34 岁女性初次迁移是否跨省迁移的影响因素。纳入模型的自变量与上一个模型是相同的,结果显示都有显著的关系。近20 年来迁移率大幅度增长表现为跨省迁移的大幅度增长。2010 年以来跨省迁移的发生比是20 世纪90 年代的近3 倍,也是2000-2009 年的1.6倍。与年龄的关系虽然也是非线性的、显著的,但是影响较弱。民族的影响是显著的,但较弱,汉族的跨省迁移发生比只比少数民族高4%。农业户籍的迁移率不仅大大高于非农业户籍,而且其跨省迁移率也大大高于非农业户籍。已婚女性的跨省迁移发生比要低于未婚女性14%,但是孩子数的增加却促进跨省迁移;孩子数每增加一个,跨省迁移发生比上升8%。也许孩子数的增加带来更大的经济压力,促使跨省迁移寻求更好的工作机会和更高的经济收入。受教育程度虽然促进迁移,但是没有促进跨省迁移。尤其是较高教育程度的女性的跨省迁移率更低,可能是因为她们在当地能更容易找到较好的工作,而不需要远距离外出。寻找非农工作、获得较高的经济收入而进行跨省迁移的可能性大大高于省内迁移。回归结果表明外出务工经商而跨省迁移的发生比是省内迁移的3-4倍,而获得较高收入的跨省迁移发生比也比省内迁移高出近2 倍。较好的工作机会和较高的经济收入显然更可能在东部地区获得,发生在东部地区的跨省迁移是省内迁移的7 倍以上。同时,西部地区也比中部地区有更高的跨省迁移可能性。
表2 1990-2016年中国15-34岁女性初次迁移是否跨省的影响因素回归模型
五、结论与讨论
在中国的人口学研究中,对人口迁移的研究相比于对死亡和生育的研究存在很大的不同。对死亡和生育的研究多集中在对事件发生率的测量和分析,相应的指标有出生率、死亡率、一般生育率、总和生育率、平均预期寿命等。而对迁移的研究则基本上集中在对流动迁移人口的规模与结构特征分析,而不是流动迁移事件的发生率。或者说国内的研究主要关注流动人口(存量),而不是人口流动(流量)。在人口研究中,相对于生育和死亡而言,迁移的概念最复杂,最没有一致、可比的定义。测量迁移水平指标和方法也往往更为复杂,同时又没有相对应的数据,因而最缺少考察迁移水平及基于此的比较研究。人口学者都知道人口转变(生育转变)有不同模式,婚姻、生育和死亡都有数理模型,模型生命表更是在人口估计和预测中得到广泛应用。然而在迁移领域,类似的模型有限,其应用就更少。在各种人口预测软件中,有生育和死亡模型可供选择使用,而迁移模型都是空缺的。
实际上,迁移和生育类似,是可重复事件。人口普查中记录普查前一年的生育状况(是否生育过),便可计算普查前一年的生育率指标。如果人口普查中记录前一年的迁移状况(是否迁移过),便也可以计算普查前一年的迁移率指标。小普查中登记的调查前一年的常住地变化是可以用来计算和测量迁移率的。当然,迁移需要在时间和空间上有明确定义,比定义生育更为复杂。连续的年度迁移率指标也可以通过回顾性调查来构建,类似于生育率调查中的生育史回顾性调查。只不过生育只涉及育龄妇女,而迁移涉及所有年龄人口。原国家卫计委既组织生育率调查,也组织流动人口调查。每次生育率调查都记录育龄妇女甚至更年长女性的生育史,这样就可以计算很多年的生育率指标。中国20 世纪40 年代以来到1988 年历年的生育率指标,就是根据1981 年和1988 年两次生育率调查重构的。2017年生育率调查也构建了2006年以来历年的生育率指标。但是流动人口调查由于只涉及流动人口,而不是总人口中一个有代表性的样本,即使记录了迁移史(每次迁移的时间),也无法计算迁移率指标。因此,未来的流动人口调查值得对这一问题进行考虑。
我国的生育率调查或多或少也涉及迁移的问题。我们在本研究中利用2017年生育状况调查中询问的初次迁移时间,计算了15-34 岁女性1990 年以来的迁移率,分析了迁移率的变化趋势及社会经济差异。同时,利用离散时间Logit 模型考察了初次迁移及是否跨省迁移的影响因素。将女性个人数据转换为人年数据,将各人年上是否发生初次迁移与人年数相比,便可计算人口学意义上的迁移率。计算结果表明,15-34 岁女性的初次迁移率由1990 年低于1‰,上升到2000 年的5.4‰、2010年的8‰和2016年的9‰。由于15-34岁是迁移的高发年龄,如果计算全年龄的迁移率,则一定低于该年龄段的迁移率。15-34岁女性初次迁移率自1990年以来一直在持续快速上升,2000年以来上升更快,而2010年以来有所趋缓。另外,在人口普查年和重大事件年份还存在迁移堆积现象。
迁移具有高度的选择性,与个人的经济、社会和人口学特征有着密切的关系。描述性分析和回归分析的结果都显示,户籍、婚姻状况、子女数、受教育程度、职业、收入及区域都与初次迁移发生率存在显著的关系,也与是否是跨省迁移存在显著关系。这种关系与我们的预期是基本一致的。农业户籍、未婚、无子女、较高受教育程度、非农职业、较高收入等特征与较高的迁移率显著相关。同时,这些特征(子女数和受教育程度除外)也与较高的跨省迁移率有显著关系。在是否发生初次迁移和初次迁移是否跨省的这两个回归模型中,出现不一致关系的因素是民族、子女数和受教育程度。汉族和少数民族的迁移率没有显著差异,但是在跨省迁移上存在显著差异,只是实际的差异很小。子女数增加会抑制迁移率,但是更可能促进跨省迁移。相反,较高的受教育程度会促进迁移,但是倾向于抑制跨省迁移。这些结果表明中国女性的初次迁移水平在巨大增长的同时,既有阶段性变化,也有特征性变化,与中国近30 年来的经济社会发展、经济结构调整、经济转型及区域经济格局变化有很大关系。
需要指出本研究因数据的局限,只是对15-34 岁女性的初次迁移的水平、趋势和模式进行了考察分析。虽然15-34岁是迁移的高发和高峰年龄,但是近20年来年龄更小和更大的群体的迁移率也在明显增长,因此15-34岁人口的迁移率并不能反映全体人口的迁移水平和趋势。要全面考察分析中国人口的迁移水平与趋势以及中国人口的迁移转变,有待于人口普查或迁移调查中对迁移测量的有关问题项的增设和完善。只有从流动迁移人口(规模与结构)和人口流动迁移水平(流动迁移率)相结合考察中国人口的迁移转变,才能全面准确地反映中国人口的迁移转变特征与趋势。