年龄-时期-队列视角下流动人口长期居留意愿变迁①
2022-09-20李昀东解韬凌巍
李昀东 解韬 凌巍,3
(1.云南大学 民族学与社会学学院,云南 昆明 650091;2.广东省社会科学院 国际问题研究所,广东 广州 510635;3.贵州师范学院 数学与大数据学院,贵州 贵阳 550018)
1 引言
改革开放40多年来,中国完成了从低流动性的“乡土中国”向高流动性的“迁徙中国”的历史性转变[1],第七次全国人口普查数据显示,我国流动人口总量达到3.76亿人,与2010年第六次全国人口普查相比,增长69.73个百分点[2],意味着每4个人中就有1个是流动人口。但是从数据中也显示出流动人口规模大幅增加但增速变缓和人口流动范围缩小两个趋势,这种人口流动趋势的转变不仅仅意味着人口学上的数字转变,其背后也反映了一种经济发展转轨现象,如何衡量和探索这种人口在社会经济背景下的转型是我们需要思考的问题。
1984年《国务院关于农民进入集镇落户问题的通知》(国发〔1984〕141号)发布后,我国流动人口开始快速增长,在流动中经历了社会环境和市场环境的转变,社会经济的不同发展阶段、社会和市场环境的变迁一定度上形塑了不同时期、不同出生队列流动人口群体,也为我们研究流动人口提供了独特的年龄、队列、时期视角。流动人口的居留意愿是指流动人口在综合衡量个人发展、家庭社会特征和区位因素后,对其自身居住方式的选择和预测[3],长期居留意愿更是流动群体在流动过程中经历了个体、家庭状况,以及社会经济等诸多因素后做出的期望性选择,可以有效的反应不同流动人口群体在宏观环境下的不同决策。因此本文利用全国流动人口卫生计生动态监测数据,通过分层APC模型来刻画年龄、时期队列视角下流动人口的同期群效应,以分析流动人口长期居留意愿的特征规律,为今后研究流动人口趋势性变化提供实证支持。
2 文献综述
传统的用于解释人口迁移的推拉理论、双重劳动力市场理论、新移民经济学理论、迁移制度理论等虽然对人口的迁移流动具有很好的解释力,但这些理论却缺乏对流动人口选择在流入地定居或返回家乡的决策的解释[4]。流动人口的长期居留意愿是一个复杂的决策性指标,包括居留的决策、行为和对后果的评估。研究认为目前我国流动人口流迁主要呈现在流入地城镇定居、循环流动与返回家乡的三维分化的现状[5],因此,目前学界对于流动人口居留意愿的研究主要在居留意愿和长期居留意愿的影响因素、流动主体和流入地的差异性以及城市融入几个方面开展学术研究。
长期居留意愿影响因素的研究认为居留的决定受到多方面因素的影响,个人、家庭和地区因素共同作用于流动人口,影响其居留决策,性别、受教育年限和婚姻状况是影响长期居留意愿的重要个体因素[6],流动人口在迁入地的居留意愿或落户意愿,与其家庭化迁移之间也存在密切的关联[7],家庭化迁移有助于提升流动人口的长期居留意愿[8],其中子女迁移对流动人口长期居留意愿的影响大于配偶迁移和父母迁移[9],地区性因素中的市场潜能[10]、城市级别[11]、城市及基本公共服务[12]等也对长期居留意愿有显著的影响。这些影响在不同流动主体流入地之间也存在差异性,研究发现, 流动人口居留大城市的意愿较高, 其中老生代流动人口居留意愿高于新生代[13],新生代流动人口内部也出现分化,“80后”居留意愿较高, “90后”较低[14]。流入地的差异性方面,城市房价和经济[15]也在长期居留意愿方面的影响有所不同,这些流入地差异,也和不同流动主体之间相互作用、互相影响,朱浩利用2016年流动人口动态监测数据发现,新生代流动人口长期居留意愿整体较强,一线城市中住房(尤其是自购房)、家庭收入和户籍在在移民的居留决策中发挥重要作用,非一线城市中,社会性因素和制度性因素则扮演了决定性角色[16],这些因素的互相作用也造成了流动人口流动的新趋势,是“逆城市化”产生的动力机制[17]。最后,流动人口的长期居留意愿也是衡量流动人口的城市融入程度的重要指标,但是其在不同流动主体中的城市融入机制也有所不同,公共服务可及性显著提升了流动人口的永久迁移意愿,降低了“流而不迁”的暂时性迁居概率[18],制度、文化等不同因素,在不同代际流动人口样本中阻碍效应有所不同[19]。总体而言,流动人口的长期居留意愿受到不同因素的影响,时空差异、群体差异及其带来的不同影响也是解释流动人口长期居留意愿的不同的重要原因。
基于流动人口在流迁方向上的复杂性和不同群体的特异性,可以认为不同年龄、不同出生队列以及处于不同时期流动人口长期居留意愿有所差别,并且这种差别可能“内嵌”于不同的社会经济大环境之下,社会变迁也对其产生不同影响[20],既往的研究虽然对流动人口长期居留意愿的趋势有所探讨。但是研究中样本的出生年代、时期和年龄所起的作用是糅杂在一起的,无法探讨其具体的变化趋势。因此,本文采用年龄—时期—队列分析对流动人口长期居留意愿进行研究,重点关注长期居留意愿的年龄、时期和队列差异,探讨社会经济发展变迁是如何形塑这些差异,并进一步探索其在性别和户籍方面的差异性趋势,以及其背后原因和机制。
3 数据来源与模型设定
3.1 数据来源与变量赋值
根据研究内容和数据可及性,本文选择2012、2014、2015、2016、2017、2018年中国流动人口动态监测调查数据(China Migrants Dynamic Survey,简称CMDS)作为数据来源,该调查调查口径、抽样方法、调查内容均有较好的一致性,增强了不同年份的可比性,调查覆盖了全国31个省(区、市)和新疆生产建设兵团,采用分层、多阶段的PPS抽样,对全国和省级单位及主要城市均有代表性。根据研究目的,本研究将历年数据进行整理合并,剔除缺失值和无效值,并对个别变量进行统一清理,最终纳入变量1048484个,其中六个调查时点的样本数分别为157666个、200076个、204412个、167462个、168288个、150580个。
3.1.1 因变量
本文选取长期居留意愿作为因变量,将长期居留意愿定义为愿意在在本地居住5年以上。为了保持变量定义的一致性,将2012、2014、2015和2016年全国流动人口卫生计生动态监测调查个人问卷问题“您是否打算在本地长期居住(5年及以上)?”用来衡量长期居留意愿,将“打算”赋值为1,将“不打算”和“没想好”赋值为0。将2017和2018年全国流动人口卫生计生动态监测调查个人问卷问题“今后一段时间,您是否打算继续留在本地?”和“如果您打算留在本地,您预计自己将在本地留多久?”两个问题用来衡量长期居留意愿,将选择“是”且居留时间为5年以上赋值为1,将“否”、“没想好”和居留时间为五年以下赋值为0。
3.1.2 自变量
年龄、时期与队列是本文关注的核心变量,观测时期 (2012、2014、2015、2016、2017和 2018年)共6个时期,由于APC方法的假设限定,参照既往研究和传统上“三年一代沟”的考虑,本文将出生队列进行分组,除去出生早于1943年以及晚于2000年的个体分别单独为一个队列以外,临近的三个出生年份被归为一个队列组,一共获得21个队列组。
本文的控制变量共分为个体层面、家庭层面及地区层面控制变量,用于探究不同层面的变量对于流动人口长期居留意愿的影响。个体层面的变量包括:性别、民族、婚姻状况、户口类型、受教育程度和流动范围6个变量;家庭层面的变量包括:家庭月收入对数和子女随迁2个变量;地区层面的变量为流动区域,具体赋值见表1。
表1 变量赋值与描述
3.2 模型选择
本文试图分解年龄、时期与队列因素对流动人口长期居留意愿的影响。但是现实研究中由于年龄、时期和队列这三个维度之间完全共线性的问题,无法求得模型参数唯一解,即存在“不可识别”难题[21]。为了解决这一问题,本文使用Yang和Land提出了APC交叉分类随机效应模型(HAPC-CCREM)[22-23]进行分析,通过将年龄、时期和队列变量置于不同层次,规避了线性约束的问题,通过APC模型可以在了解趋势之外可以获得真实的年龄、时期和队列效应来理解趋势乃至模式的形成机制及影响。
在模型设定方面,多层次APC-交叉分类随机效应模型通常为两层模型,第一层为个体层面模型,包含年龄变量及其他个体层面的控制变量。第二层为时期和队列层次模型,包含队列和时期层面的随机效应。本研究中所构建模型的具体形式为:
个体层次模型(第一层):
其中,Yijk为时期j和队列k的流动人口i的长期居留意愿;β为回归系数,εijk是个体层的随机误差,Xijk为控制变量(受教育程度、收入、民族、户口、性别等)。
时期和队列层面模型(第二层):
其中,γ0为截距,u0j与v0k分别为队列和时期效应,均服从正态分布,对应的总方差分别为和。
将第一层和第二层模型相加后
其中,γ3是变量Xijk的固定系数,μ3j是该队列变量的随机效应,v3k则是时期变量随机效应。
4 数据分析结果
4.1 流动人口长期居留意愿的时期、队列描述分析
图1是不同时期的流动人口长期居留意愿变化趋势,随着年份的增加,流动人口长期居留意愿总体呈下降趋势,2012年调查时期,60.13%的流动人口选择长期居留,2017年这一比例下降到43.16%,2018年有所上升,选择长期居留占比为48.62%。图2是不同队列的流动人口长期居留意愿变化趋势,我国居民的长期居留意愿随着出生队列呈现持续下降趋势,1982年之前的出生队列长期居留意愿下降较慢,1982年之后的出生队列长期居留意愿快速下降。
图1 不同时期的流动人口长期居留意愿占比
图2 不同队列的流动人口长期居留意愿占比
然而单纯的描述混淆了出生队列、时期以及年龄之间的各自效应,并不能精确反映流动人口长期居留意愿的变化趋势。进一步采用HAPC模型将三者的各自效应进行剥离,以便明确流动人口的长期居留意愿在三种时间维度上的真实变动趋势。
4.2 流动人口长期居留意愿的APC分析
表3呈现了HAPC-CCREM模型的回归结果。其中第一层固定效应主要报告控制变量的回归系数和年龄效应,第二层报告时期和队列的随机效应。模型1是基准模型,仅纳入年龄、时期和队列变量,以便检验三个时间维度的显著性。年龄及其平方项系数具有显著性,随机效应表明不同时期和队列的流动人口长期居留意愿差异显著,因此有必要对年龄、时期和队列各自的效应进行分解。模型2在基准模型的基础上加入了个体层面的控制变量,模型3和模型4在加入个体层面的控制变量基础上,分别加入家庭层面和地区层面的控制变量,模型5则纳入所有的控制变量。模型5显示,女性、少数民族、已婚有配偶、城市户口和高教育水平和市内跨县的流动人口长期居留意愿较高,家庭月收入、子女随迁以及流动区域在东部地区流动人口长期居留意愿较高。
表2 流动人口长期居留意愿的APC模型分析
4.2.1 年龄效应
从模型1到模型5,年龄和年龄平方的影响系数均显著,但是在纳入家庭层面的控制变量后,影响方向发生了变化,年龄的影响系数由正转负,年龄平方的影响系数由负转正,年龄和年龄平方影响系数方向的不一致,说明年龄对流动人口长期居留意愿的影响呈现非线性关系,在不加入家庭层面的控制变量之前,呈现倒“U”型变化趋势,加入家庭层面的控制变量之后呈现“U”型变化趋势,说明家庭月收入和子女随迁抑制了低龄流动人口的长期居留意愿,促进了高龄流动人口的长期居留意愿。
4.2.2 时期效应
关于时期和队列的趋势,首先通过随机效应方差的估计结果来判断其显著性,在基准模型1中,时期效应呈边际显著趋势(P=0.057)。纳入所有控制变量后(模型5),时期效应方差系数上升,说明纳入了可能影响流动人口长期居留意愿的个人、家庭和区域层面的因素后,时期的差异性更为显著。图3反映了加入所有控制变量后流动人口长期居留意愿的时期效应变化趋势,和图1相比,整体变化趋势基本一致。
图3 流动人口长期居留意愿的时期效应变化趋势
4.2.3 队列效应
相比较时期效应,流动人口长期居留意愿的队列效应更突出,队列之间呈现高低错落的特点,在基准模型1中,队列效应呈现更为显著的边际趋势(P=0.001)。流动人口长期居留意愿的队列趋势呈现出“下降-上升-下降”的趋势,考虑到各个队列在观察的时期内所处的生命周期并不完全一致,因而不能直接比较,因此本文根据生命周期,大体将队列分为三个区间,如图4所示。第一个区间是1960年以前的出生队列(Ⅰ),这一区间的流动人口观测期内大部分时间都处于老龄阶段,流动原因不是以务工、就业为主,主要流动原因是家属随迁和照顾小孩[24],也呈现出“候鸟式”流动模式[25],通常往返于家乡和养老地,不会在流入地长期居留。我们把 1960-1980年之间(“60后”、“70后”)的出生队列,共同划入第二个区间,因为他们在观察期内几乎都处于的中青年阶段(Ⅱ),其趋势很大程度上反映了初代流动人口的流动模式和长期居留意愿,这一时期的流动人口经济活动参与度非常高, 他们的从业身份以自雇/自营为主[26],尤其是“70后”流动人口,长期居留意愿的效应系数为正,相比于“60后”,其选择长期居留的意愿更为强烈。第三个区间包含所有1980年以后出生的队列(Ⅲ),一般将“80后”流动人口定义为新生代流动人口[27],新生代流动人口相比于初代流动人口,其就业率相对较低,出现了“迁而不工”的现象[28],导致了流动人口的不稳定性流动,进而产生新生代流动人口“迁而不居”的长期居留意愿较低的现象。
图4 流动人口长期居留意愿的队列效应变化趋势
4.3 流动人口长期居留意愿趋势的异质性分析
本研究在关注绝对趋势之外,也关注流动人口长期居留意愿在不同人群中趋势走向的差异,既往的研究已经认为居留意愿表现出性别差异[29],基于我国国情,城乡的分层趋势又是其中最重要的考量[30]。因此,本研究进一步在模型中同时加入性别的队列和时期随机效应,表3为性别、户籍的随机效应分析。
4.3.1 性别的时期、队列趋势差异
表3的模型6显示了在基本控制模型中,男性和女性流动人口长期居留意愿在时期上的变化趋势存在显著差异 (P=0.067),模型8显示了男性和女性流动人口长期居留意愿在队列上的变化趋势存在显著差异(P=0.007)。借助图3(a)和图4(a)可以发现时期和队列上总体表现出女性长期居留意愿高于男性这与既往的研究结论基本一致。男性和女性在时期上波动没有明显差异,但是在队列上反映出差异,在1990年出生队列前后,男女长期居留意愿发生逆转,1990之后出生的男性流动人口长期居留意愿的效应系数表现出升高趋势。
4.3.2 户籍的时期、队列趋势差异
按照户籍属性将流动人口分为“城-城”流动人口和“乡-城”流动人口[31],表3的模型7显示了在基本控制模型中,“城-城”流动人口和“乡-城”流动人口长期居留意愿在时期上的变化趋势存在显著差异(P=0.059),模型9显示了“城-城”和“乡-城”流动人口长期居留意愿在队列上的变化趋势存在显著差异(P=0.011)。从图3(b)可以看到虽然“城-城”和“乡-城”流动人口长期居留意愿整体呈现下降趋势,但是“城-城”流动人口长期居留意愿下降的幅度较为平稳,相比而言,“乡-城”流动人口长期居留意愿在不同年份间波动较大。 图4(b)反映了“城-城”和“乡-城”流动人口的长期居留意愿在队列上的差异,1970年之前的出生队列的“城-城”流动人口的长期居留意愿的效应系数先是低于“乡-城”流动人口,随后开始高于“乡-城”流动人口,1970年之后出生队列的“城-城”流动人口的长期居留意愿的效应系数先是高于“乡-城”流动人口,随后开始低于“乡-城”流动人口。1970年之后出生流动人口,作为初代流动人口的“主力军”,其户籍队列差异反映了不同的流动趋势的差异,“城-城”流动人口更多的是从小城市流向经济发展水平更好的一线城市,近年来随着一线城市的房价增长和生活成本的提高,“城-城”流动人口已经不再倾向于在大城市定居,七普数据中跨省流动和“城—城”流动的比例降低[32],也进一步表明了新生代“城-城”流动人口长期居留意愿的降低趋势。与“城-城”流动人口不同的是“乡-城”流动人口更多的是劳动力转移人口,主要从农村流向小城镇/小城市,三四线城市青壮年生活成本较低,压力小,更容易在流入地居留[33],因此1990年后出生的“乡-城”流动人口长期居留意愿保持平稳趋势。
图3 APC模型的性别、城乡时期效应趋势
图4 APC模型的性别、城乡队列效应趋势
表3 性别、户籍的随机效应分析
4.4 长期居留意愿的流动人口世代划分
可以看到流动人口的长期居留意愿的队列效应的变动趋势,在老年流动人口、初代流动人口和新生代流动人口中呈现出不同的表现,与传统的对老年流动人口、初代流动人口和新生代流动人口的划分方式基本吻合,但是根据本文队列效应的变化趋势,可以发现流动人口中的“60后”、“70后”、“80后”和“90后”流动人口长期居留意愿表现出不同的趋势,1960年出生之前的流动人口,长期居留意愿系数呈现下降趋势,1960-1980年出生的流动人口,属于初代流动人口,长期居留意愿系数趋势上升,1970-1980出生队列人口长期居留意愿系数处于高位状态,1980-1990出生队列效应系数呈下降趋势,处于高位状态,1990之后出生队列,效应系数趋势平稳,处于低位状态。队列之间差异明显,因此本文根据研究将流动人口进一步划分,具体见表3。
1960年前出生队列开始流动的时候,已经不属于劳动力年龄人口,更多的是被动地“卷入”到家庭化流动进程之中[34],异地养老和照顾子女是老年流动人口的主要愿意,老年人流迁的动机以希望与子女同住并得到子女的照料为主[35],在这种流动背景下,老年流动人口很难通过工作和其他方式“嵌入”流入地,市民化程度低,高龄流动老人可能由于需要子女照料而留在流入地,但是低龄流动老人则不会在流入地长期居留,图4的区间Ⅰ的趋势变化反映了这种现象。
1960-1970年出生队列和1970-1980年出生队列虽然同属于初代流动人口,但是其面临的社会环境有所不同,1978年以后,随着城市和农村经济体制改革的不断深入,释放了对劳动力的巨大需求,人口流动主要是从农村流向小城市,1960-1970出生队列进入劳动力市场时,国家虽然对农民流动的限制有所松动,但并没有对农民外出务工经商予以正面的肯定,而是倡导一种“进厂不进城”“离土不离乡”的农业劳动力就地转移的政策[36],以农村劳动力转移为主要形式。1970-1980年出生队列进入劳动市场时,市场环境已经进一步开放,这一队列的流动人口与农村情感联系变弱,主观上更亲近城市,具有比较强烈的留城意愿和留城能力。1970-1980出生队列的流动人口相比于1960-1970年出生队列,流动网络进一步强化,经济回报加强,在20世纪80年代末出现了大量的“民工潮”现象。
表4 流动人口的世代划分
1980-1990年出生队列进入劳动力市场后,各项保障政策进一步完善,市场环境进一步开放、落户门槛放宽“,十五”计划中亦明确指出“:改革城镇户籍制度,形成城乡人口有序流动的机制。”1995年国务院转发了《关于加强流动人口就业证和暂住证制度》,进一步推动了流动人口市民化融合。但是在20世纪末到21世纪初实行住房分配货币化后,房价和生活成本大幅上涨[37],抑制了这一出生队列流动人口的长期居留意愿。1990年之后出生队列“城-城”流动和跨省流动人口比例减少,与1980-1990年出生队列流动人口相比,生活成本和房价进一步约束了长期居留意愿,但是从乡村-小城镇/小城市的流动并未减弱,这一群体的长期居留意愿长期稳定。
5 结论与讨论
本文利用HAPC模型,对我国流动人口长期居留意愿的年龄、时期和队列趋势进行分解,并进一步讨论这些趋势可能存在的分层差异。与以往研究通常静态地去研究某一横截面的状况,而忽视了长期居留意愿在不同时间维度上的变化过程不同,本文在更为宏大的时代背景下探讨流动人口的长期居留意愿,考虑到年龄、时期和出生队列多维度的变迁。就实证分析结果而言,流动人口居留意愿的年龄、时期与队列效应显著,不同时期以及出生队列居留意愿有所不同。首先在年龄效应方面,加入所有控制变量之后年龄和长期居留意愿呈现“U”型关系,说明随着年龄增大,流动人口的长期居留意愿逐渐降低,在迈入老年后又呈现逐渐升高趋势。其次,流动人口长期居留意愿的时期劣势突出,经济社会的不断发展并没有促进流动人口长期居留意愿,反而呈现整体的逐步下降趋势。最后,相比时期趋势流动人口长期居留意愿的队列趋势更显著,随着进入劳动市场的年龄不同和社会环境的差异,老年流动人口、初代流动人口、新生代流动人口和超新生代流动人口的长期居留意愿表现出明显的差异。进一步在随机效应中引入性别和户籍变量后,发现不同性别和户籍的流动人口长期居留意愿在时期效应上没有表现出明显差异性,但是在队列效应上差异明显。
随着我国流动人口规模进入调整期,流动人口之间长期居留意愿的差异揭示了社会经济发展和人口流动之间的关系,但是需要指出的是,虽然HAPC模型可以将年龄、时期和队列各自纯效应剥离开来,但在模型实际操作中缺乏对历史事件及其影响的直接测量,对宏观社会环境很难精确量化,实际研究中我们借助了生命历程理论的视角对结果进行解释,但是在解释队列间差异时,无法明确分割同一历史事件在不同队列间影响的差别,因此,在结果的解释上应更加谨慎。