我国跨省人口流动的影响因素研究
——基于2010年和2020年全国人口普查数据的分析
2023-03-10王明辉
王明辉
我国社会结构的转型升级推动了人口结构的转型,人口流动作为主导力量,是影响我国可持续发展的关键。当前,为顺应社会环境的各种变化,流动人口在面临迁入地的选择以及流动模式等问题时,会进行更加理性的思考。为有效助力经济社会的协调、可持续发展,本文基于现有的人口流动相关理论,利用二次指派程序(QAP)方法分析我国跨省人口流动的形成机制,可以为各地区合理引导人口流动提供参考依据。
一、人口流动相关理论
(一)莱文斯坦迁移法则
莱文斯坦(Ravenstein,1889)以人口学的研究为切入点,对人口迁移的主要成因进行了具体分析,并归纳出六种人口迁移的基本原理。分别是:第一,人口迁移规模与城市空间距离呈负相关,即距离都市或商业中心越远迁入人口数量越小。第二,人口迁移流呈现阶梯递进的模式,即在城镇地区附近出现的人口迁移会造成人口空缺,而这个缺口又由更远处地区出现的人口迁移来填补。因此,人口迁入地区的“拉力”可能影响到城市相对偏远的位置。第三,人口迁移的方向通常为双向流动,即作为流出地的地区同样也可能是流入地。第四,不同类别和不同性别的居民对于人口迁移的主观选择倾向存在差异。相对于农村居民来说,城镇居民的迁移倾向较小,且相对于男性,女性更偏好于稍短距离的流动。第五,交通运输条件的日益便利化和新型城镇化的日益繁荣等,对加快人口的流动速度会有积极的影响。第六,社会经济发展水平的差异是造成人口迁移的主要原因之一。
(二)推拉理论
推拉理论表明,经济因素是人口发生流动的主要动因。美籍学者爱弗雷德·李(E.S.Lee)在二十世纪六十年代提出了关于人口迁移的“推拉理论”,首次将影响人口迁移的因素划分为消极因素——“推力”和积极因素——“拉力”。人口流动正是由“推力”和“拉力”共同作用产生的结果。其中,“推力”是使居民想要离开原居住地的推动因素,而“拉力”是由迁入地产生的,代表着使居民产生迁入新地区意愿的吸引力。
此后,在E.S.Lee发表的题为“移民人口学之理论”的文章中,他又指出了影响人口流动的第三个主要原因:中间障碍因素。中间障碍因素主要包括距离远近、物质障碍、语言文化的差异,还有迁移人口自身对于距离、环境等因素的主观理性选择。地区间人口的自由流动正是由这三种主要原因综合影响的结果。
在人口流动学中,推拉理论的发展经历了由微观向宏观转变的过程。21世纪以来,流动社会的形成使得流动性治理更加关注流动主体的特性。此时,研究者们开始意识到传统上的推拉理论忽略掉了流动人口的内在主体性,并逐步开始尝试在反拉力、反推力因素以及人口中间流动障碍因素等方面展开深层次的理论探究。
(三)二元劳动力市场理论
除认可程度极高的推拉理论外,在人口流动研究领域,迈克尔·皮奥里(Michael Piore,1979)提出一个新的人口迁移动机,进而发展为二元劳动力市场理论。城市劳动力市场的二元结构及其内生的劳动力需求,会导致农村劳动力向城市溢出。这一理论强调,由于现代资本主义的发展,城市劳动力市场的结构越来越趋于二元化,即居民们普遍更加愿意在本地的社会地位较高的主导部门工作,而那些工资较低、工作环境较差的次要部门对本地居民的吸引力几乎为零,进而导致地区劳动力供给不平衡。为改善这种不平衡的现象,城市劳动力市场需要通过吸收外地劳动力,来填补本地的劳动力空缺,从而促使农村劳动力向城市迁移。
(四)移民网络理论
在人口迁移问题的研究中,移民网络理论也具有非常重要的地位。即存在于某一地点的特定的地区性群体,极大地增加了具有同样背景的另外一些人迁移到相同地区的可能性。而那些已经迁移到外地的人口会与其在原住地的家庭、朋友间形成一种关系网络,由这些复杂人际关系网所衍生出来的各种复杂交叉的社会人际联系网络就是移民网络。移民信息网络由于能够及时给被转移的人提供移民信息,可以降低迁移成本、提高迁移收益、减少迁移风险,因此这样的人口迁移并不是盲目的迁移,其中移民网络正是促进人口迁移的重要因素。
二、研究设计
(一)数据来源
本文主要聚焦于我国省级行政单元间的人口流动。由于数据获取的限制,香港、台湾和澳门均未纳入研究范围,因此,本文收集了2010年以及2020年31个省(自治区、直辖市)的样本数据。所用数据来自2010年和2020年的全国人口普查资料,中国统计年鉴、中国劳动统计年鉴以及各省(自治区、直辖市)统计年鉴。因变量人口流动网络矩阵中的数据来源于第六次全国人口普查和第七次全国人口普查的统计数据。其中,列表示人口流出省份,行表示人口流入省份,矩阵中的元素是当年由起始地到目的地的流动人次总和。失业率来源于2011年、2021年中国劳动统计年鉴;第三产业增加值占国内生产总值(GDP)比重、人均GDP、教育支出、节能环保支出、住房价格、外商投资企业投资总额数据均来自2011年、2021年中国统计年鉴;一阶地理邻近、二阶地理邻近矩阵则根据各省级行政单元实际地理位置构建。
(二)变量说明
人口的跨省流动受多种因素的综合影响。当前,学术界多以人口迁移为媒介测度其影响因素,包括地区经济发展水平、地理位置、经济结构、收入水平等。对于西部地区而言,非农就业机会仍然是影响其外出务工的主要因素。纪玉俊等人(2015)发现,地区的对外开放水平对提高服务业竞争力,发挥服务业集聚的经济增长效应具有显著的影响。此外,地理空间邻近性也是影响人口跨省际流动的主要原因,邬滋(2017)在高技术产业知识溢出的研究中验证了一阶地理邻近和二阶地理邻近对知识溢出的不同程度的影响。
结合现有研究成果,本文利用2010年、2020年的全国人口普查数据与相关统计年鉴的经济指标数据对影响人口流动的因素进行QAP分析。以人口流动网络作为因变量,经济发展水平(Pergdp,人均GDP)、失业水平(Unem,城镇登记失业率)、公共服务水平(PS,地方财政教育支出)、开放水平(Open,外商投资企业投资总额)、产业结构(ES,第三产业增加值占GDP比重)、生活成本(Cost,住房价格)、宜居程度(Livab,地方财政节能环保支出)、地理邻近性(GP,一阶地理邻近性&二阶地理邻近性)为自变量,具体各解释变量如表1所示。
在进行矩阵处理时,本文将因变量转换为0—1矩阵,表示2010年和2020年各个省级行政单元间人口往来的关系。赋值原则是根据每年省级行政单元间人口流动总人次矩阵,将每行中大于或等于该行平均值的数据赋值为1,小于平均值的数据赋值为0;自变量中,一阶地理邻近与二阶地理邻近为0—1矩阵,除此之外,其余自变量矩阵均根据各自矩阵内具体数据转换为相应的差值矩阵(见表1)。
表1 变量说明
(三)QAP方法介绍
在社会网络分析中,通常用QAP方法来研究不同“关系”数据之间的关系。利用QAP方法可以对矩阵进行相关分析和回归分析。QAP与其他标准的统计程序的不同之处在于,矩阵的各个值之间不相互独立。因此,许多标准的统计程序不能对其进行参数估计和统计检验,否则会计算出错误的标准差。一般来讲,在进行影响因素分析时,大多数人会想到使用普通最小二乘法(OLS)。然而,由于我们在研究中所构造的关系矩阵存在结构上的自相关性,这往往会使得利用OLS方法的变量显著性检验失效。而由于QAP方法是一种非参数检验,可以避免因观测值相关引起的统计偏误。因此,本研究采用QAP方法来替代多元线性回归方法对网络矩阵之间的“关系”进行假设检验,从而避免出现伪回归现象。
对两个不相互独立的矩阵进行QAP相关性分析的步骤是:首先,把每个矩阵的所有取值看成一个n维长向量,可以计算两个向量之间的相关系数R,作为观察到的相关系数;其次,随机对其中任何一个矩阵的标签进行置换(各行和各列同时置换),最多有n!种置换方式,再将置换后的矩阵与另一个未置换的矩阵进行相关系数的求解,统计置换后得到的相关系数的分布,比较观察得到的相关系数在分布中总的位置,观察是否落入接受域。观测置换后计算出来的所有相关系数大于或等于相关系数的比例,如果该比例在显著性水平(假设显著性水平为0.05)区间内,那么在统计意义上,所研究的两个矩阵之间就存在强相关。
QAP回归模型是以若干个N×N的网络矩阵为自变量,回归同类网络矩阵,判断回归系数并进行显著性检验。运用网络矩阵作为因变量和自变量,具体计算步骤为:首先,对自变量矩阵和因变量矩阵对应的长向量元素进行常规的多元回归分析;其次,同时对因变量的各行各列进行随机置换,重新计算回归,保存系数估计值和判定系数R2,重复之前的步骤多次,得到各统计量的标准误。
三、人口流动的影响因素分析
(一)QAP相关性分析
运用UCINET软件,对2010、2020年人口流动网络与各自自变量分别进行QAP相关性分析,结果如表2和表3所示。相关性分析结果表明:
通过2010、2020两年的相关性结果对比可知,经济发展水平、公共服务水平、对外开放水平与人口流动网络矩阵的相关系数呈下降趋势。其中,经济发展水平的相关系数由2010年的0.338降低到2020年的0.334,公共服务水平的相关系数由2010年的0.271降低到2020年的0.262,对外开放水平的相关系数由2010年的0.351降低到2020年的0.207。对于产业结构、生活成本、地区宜居程度以及地理邻近性而言,其与人口流动网络矩阵相关系数大小的变化则呈上升的趋势。其中,产业结构的相关系数由2010年的0.232上升至2020年的0.249,生活成本的相关系数由2010年的0.146上升至2020年的0.172,地区宜居程度由2010年的0.156上升至2020年的0.207,地理邻近性1则由2010年的0.295上升至2020年的0.308。说明区域产业结构差异、迁移人口主体的主观感受对省际间的人口流动网络的影响在进一步加深。
表2 2010年人口流动网络与各影响因素的相关性分析结果
表3 2020年人口流动网络与各影响因素的相关性分析结果
从显著性检验结果来看,2010年与2020年的经济发展水平、公共服务水平、对外开放水平、产业结构、生活成本、宜居程度以及地理邻近性对省际间的人口流动网络具有一定的相关性,且在0.05的显著性水平下,均通过了显著性检验;除此之外,随着时间的推移,失业水平对省际间人口流动网络矩阵的负向相关性不再显著。
(二)QAP回归分析
利用UCINET软件进行QAP回归分析,在2010年和2020年人口流动网络的回归分析结果中R2、调整后的R2的值均在0.2以上,且均通过了1%的显著性水平检验。因此,本文构造的QAP回归模型较高程度上解释了省域间不同方面的差异对人口流动网络的影响,具体结果如表4、表5所示。
表4与表5分别展示了2010年和2020年人口流动网络与各影响因素的回归结果。以上结果表明:
1.衡量地区经济发展程度的人均GDP水平的回归系数,在2010年和2020年的人口流动网络模型中均大于零,标准化回归系数分别为0.1218和0.2001,且通过了1%水平下的显著性检验,说明经济发展水平对人口流动网络的形成有非常显著的影响;而正向的回归系数说明省际间人均GDP水平差异越大,地区的经济发展水平差异越大,进而人口越容易在这些地区间流动。特别是,从标准化回归系数来看,2020年增加至0.2001,说明随着时间的推移,地区间经济发展水平的差异增加,人口在地区间流动的可能性随之提高。
2.2010年、2020年的回归结果中,公共服务水平的回归系数均为正,标准化系数分别为0.1984和0.1860,且都通过了人口流动网络1%显著性水平下的显著性检验,说明地区公共服务水平对人口流动网络的形成具有显著影响。当地区财政对于教育方面的支出越高时,说明其公共服务水平越高,居民的生活质量可以得到更好的保障。为改善自身生活条件和下一代的教育环境,居民更倾向于流入到公共服务水平高的地区。因此,当地区公共服务水平差异越大时,人口越容易发生跨区域流动。
表4 2010年人口流动网络与各影响因素的QAP回归结果
表5 2020年人口流动网络与各影响因素的QAP回归结果
3.地区开放水平的回归系数在2010年到2020年均为正,标准化系数分别为0.1234和0.0016。然而,从显著性检验结果来看,地区的开放水平差异回归结果经历了从非常显著到不显著的变化,说明地区对外开放水平对人口流动网络的确存在正向影响,但这种影响逐渐弱化。对外开放水平的程度说明一个地区融入全球化的程度,改革开放以来,处于开放前沿的东部沿海地区经济发展迅速,对人口流入产生强大“拉力”,对外开放程度较弱的中西部地区环境、技术等方面相对落后,导致了大量人口流出,因此对外开放程度差异越大的地区,人口越容易在这些地区间流动。而随着经济社会的发展,在推动实现共同富裕目标的努力下,东中西部经济发展差异逐渐缩小,对外开放水平较低地区的经济、交通等条件有所改善,所以对外开放水平的差异对人口流动网络形成的影响不再显著,即对外开放水平的差距对于省际人口的流动不再发挥显著性作用。
4.产业结构对2010年和2020年人口流动网络的形成均具有显著的正向影响,标准化回归系数由2010年的0.1207下降至0.0038。随着我国经济持续发展和各类服务业的发展,省际间的人口流动可能更聚焦于新兴服务产业领域。又由于产业结构的升级变化,三产在经济发展中占的比重越来越大,旅游业、金融业等在人口流动中发挥了作用,所以对人口流动网络的影响非常显著。第三产业的发展有助于提高人民生活水平,因此,省域间第三产业增加值占GDP比重差异越大,人们越有可能进行省际间的跨区域流动。
5.生活成本对2010年人口流动网络的形成有较为显著的正向影响,而在2020年,这种正向影响不再显著。从回归系数来看,标准化回归系数由2010年的0.0380下降至2020年的0.0340。一般来讲,人们倾向于向生活成本较低的地区流动,这可以节省家庭的支出费用。地区的住房价格高,往往意味着该地区的生活成本较高。但是,在经济发展水平高的地区,对于一般的家庭而言,其生活成本比经济发展水平相对落后的地区更高。2010年回归结果显示,人口更容易在生活成本差异大的地区间流动。这很大程度上是因为人们希望获得更高水平的收入,而放弃向生活成本低的地区流动。又由于近十年我国经济的飞速发展,各地区的生活成本都在逐渐提高,且人们的生存压力也越来越大,人们更愿意追求较为舒适放松的环境来缓解压力,因此,2020年的QAP回归结果显示,生活成本对人口流动网络形成的影响不再显著,即生活成本的差异不再是导致人口跨省流动的重要原因。
6.在地理邻近性中,2010年和2020年的一阶地理邻近和二阶地理邻近对人口流动网络的形成均有正向影响,且这两年的一阶地理邻近性对人口流动网络的系数值和显著性水平都要明显高于二阶地理邻近性。说明地理位置越近的地区间人口流动的数量越多,而地区间的地理距离越远,越不利于人口的流动,且直接邻近省份对人口流动更具有吸引力。
7.失业水平、宜居程度对人口流动网络形成的影响不显著。究其原因可能是近年来全国的失业水平呈现下降趋势,各省份均采取有效措施实现失业人口的再就业,失业率对于人口流动网络形成不存在显著的影响效果。在宜居程度方面,由于近十年来,国家出台了一系列政策加强对环境的保护,推进可持续发展,所以全国各省份对环境保护非常重视,地区的环境质量有所改善。因此,2010、2020年省域间失业水平的差异和宜居程度的差异对人口流动的影响并不显著。
通过QAP相关性分析可知,除失业水平外,经济发展水平、公共服务水平、对外开放水平、产业结构、生活成本、宜居程度和地理邻近性对人口流动网络具有显著的相关性。其中,生活成本和宜居程度与人口流动网络的相关性呈现增强的趋势。通过QAP回归分析可知,经济发展水平、公共服务水平、经济结构、地理邻近性对省际人口流动网络始终具有显著的影响,但对外开放水平和生活成本对人口流动网络形成的影响经历了由显著到不显著的变化。总体来说,地区经济发展水平越高、拥有资源越多时,该地区给居民带来的舒适度越高,对流动人口产生的“拉力”越大。因此,当省际间这些条件差异越大时,越容易发生人口流动。