社会网络对流动人口社会融入的影响
——基于中国劳动力动态调查的实证分析①
2022-01-10郑晓冬上官霜月方向明
陈 典 郑晓冬 上官霜月 方向明
(1.中国农业大学 经济管理学院,北京 100083;2.浙江工商大学 经济学院,浙江 杭州 310018)
1 引言
改革开放40年来,大规模的人口流动改变了中国的城乡结构和社会结构,加快了工业化和城镇化进程,为经济社会发展做出了巨大贡献。截至2020年末,我国流动人口总数约2.85亿人②中华人民共和国2020年国民经济和社会发展统计公报,国家统计局,2021年2月28日。。但是,数量巨大的流动人口在经济收入、住房条件和社会保障方面和本地市民存在较大差距,在流入地的归属感较弱、幸福感较低等引致其较低的社会融入水平[1-2]。研究显示,尽管当前由国家力量推动的政治融入和公共服务融入的成效显著,但流动人口在经济、行为和心理等维度的社会融入程度仍然偏低[3]。流动人口长期无法实现流入地的社会融入,不仅将在微观层面对其就业质量、身心健康和主观福利造成不良影响[4-5],在宏观层面也不利于持续减贫、社会稳定和新型城镇化的推进[6-7]。因此,如何提高流动人口的社会融入水平,进而提升其获得感、幸福感、安全感,是决策层和学界高度关注的问题。
已有研究显示,流动人口的社会融入是内外因综合作用的结果。城乡二元的户籍制度及其关联的公共资源与社会服务差异等制度性外因[8-9],以及流动人口的人力资本、素质禀赋等未能满足现代城市的要求、家庭化迁移预算约束和社会资本有限等内因[10-13],共同阻滞该群体的社会融入进程。其中,作为社会资本的重要组成部分,社会网络将个体与社会有机结合,是深入理解流动人口社会融入的重要视角,近年来开始受到学界的关注。相关研究认为,一方面,社会网络能够为流动人口提供临时住处和相关就业信息,有助其在流入地居住和在经济维度融入[14-15];另一方面,社会网络也能为流动人口提供情感和文化支持,满足其内心信息交流、互助协同的需求,在文化、行为和心理层面提升社会融入度[16]。
从现有研究资料来看,既往文献至少存在以下三方面的不足。其一,多数已有研究仅单方面关注建立和拓展社会网络的积极影响,却在很大程度上忽视了维系社会网络可能带来的消极作用。有研究表明,异质性较弱的社会网络规模增加可能会消耗有限的社会资源和精力,带来额外的负担,引起消极情绪[17]。因此,有必要进一步考察社会网络对流动人口社会融入可能存在的非线性影响,进而深化理解两者之间的关系;其二,现有相关文献多采用多元回归模型对社会网络与社会融入的关系进行实证分析,缺少对样本选择问题导致的估计偏误予以的充分考虑;其三,相关研究的结论比较单一,对群体差异和社会融入维度差异缺少必要的扩展分析。
与既往相关研究相比,本文将在以下三个方面做出边际贡献:第一,研究视角上,考察社会网络与社会融入之间的非线性关系,描绘两者关系的真实图景。第二,研究方法上,采用广义倾向得分方法(GPS)建立反事实框架研究社会网络对社会融入的影响,避免传统回归方法可能存在的样本选择偏误。第三,研究内容上,提供了丰富的异质性分析,区分社会网络对不同群体、不同社会融入维度的影响差异,以使估计结果和研究结论更加充实。
2 文献回顾与研究假说
社会融入相关研究源自欧美国家对移民群体在流入国社会融合问题的关注,社会融合指不同移民群体相互分享经历和历史,最终融合到共同的文化生活的一个过程[18]。在我国,社会融入(或社会融合)广泛应用于分析流动人口的生存与发展问题[19]。流动人口的社会融入是流动人口在经济、文化、社会、心理等方面与城市社会相适应、与流入地城市市民相协调的过程[20]。与之相应,社会融入水平的测量指标包含多个维度。例如,朱力认为社会融入包括经济、社会和心理或文化等多个层面,且存在递进关系[21]。孔祥利和卓玛草将社会融入分为社会经济融入、行为融入、心理融入等维度[22]。
已有研究显示,社会网络广泛影响着国际移民决策和社会融入[23]。在我国,流动人口的迁移及社会融入也受到社会网络的影响。首先,劳动者在劳动力市场求职、企业在招工方面均存在信息不完全的问题[24],在不完全信息条件下劳动力市场的价格机制可能失灵,导致劳动力的需求和供给的结构性失衡。流动人口作为流入地劳动力市场的“新来者”,往往比当地居民更缺乏就业信息,因此更倾向于通过已经进入当地劳动力市场的亲戚、朋友、老乡的帮助找工作,对社会网络有着更强的依赖[25]。社会网络作为一种“非市场”渠道,在一定程度上能弥补市场机制的不足,通过信息传递、信用担保、屏蔽或筛选等作用机制,在一定程度上可以调和劳动力供求信息的不对称,降低信息搜寻的交易成本、拓宽流动人口的就业范围与就业渠道、提高流动人口的就业和收入水平[26],因此,社会网络有利于提升流动人口获取物质资本的能力,进而保障其经济融入。其次,流动人口社会网络的扩展有利于增强流动人口对城市生活的参与度,进而有利于增强其与流入地人口的互动与交流,保障其行为融入的“社会性”。最后,经济融入和行为融入为心理融入提供了良好的契机:一方面,经济融入的深化与流动人口在流入地就业年限正相关,再迁移理论认为,随着时间的推移,适应的过程将会使迁移者改变迁移计划,留在迁入地的时间越长,打算永久居留的可能性就会增加,进而加大流动人口在流入地定居的可能性[27];另一方面,经济融入可以进一步提升流动人口的职业阶层和生活质量、幸福感和归属感[28],进而提升其心理融入水平。由此可见,社会网络对流动人口的经济、行为和心理维度的社会融入有积极影响。据此提出:
假说1:社会网络规模的扩展总体有助于促进流动人口的社会融入。
另一方面,增加社会网络规模对流动人口的社会融入也存在潜在的消极作用。流动人口的社会网络具有规模小、紧密度高、趋同性强、异质性弱、网络资源含量较低等特点[29],社会网络规模过大可能从以下三方面发挥负面作用:第一,扩展和维系社会网络的代价。流动人口从社会网络中获取社会支持的同时,也需要为社会网络的扩展及维系付出时间、精力和自由,同时也需要耗费社会资源和物质成本(譬如人情往来成本),一定程度上会带来潜在的额外负担。当社会网络规模较大时,维持紧密度高的社会网络所获得的帮助是趋同的,而付出的代价则相对较高。第二,依托社会网络就业的潜在损失。一方面,社会网络主要通过强关系网络影响对流动人口就业,在强关系网络中,人与人从事同质性的工作,信息掌握趋同,情感维系紧密[30],这可能在一定程度上增加流动人口就业的信息筛选成本;另一方面,尽管社会网络有助于流动人口快速找到工作,但是由于该群体建立和维系社会网络通常并不是为了获得就业信息,因而借助社会网络求职可能仅能使劳动者在劳动力市场的特定职业或细分市场中找到工作,可能导致劳动者的相对生产优势与其职业选择之间的错配,特别是当求职者出于社会交往的压力而接受相应的岗位时,劳动者可能会面临更多的经济损失[31]。第三,正式社会支持匮乏。一方面,当前流动人口的社会关系网络主要基于亲缘、血缘、地缘等,这种关系网可能会进一步固化或内卷化,不利于其对流入地的认同感和归属感的提升[2],进而不利于流动人口的行为与心理融入的推进;另一方面,来自正式系统和社会组织的支持与帮助的缺位将使得流动人口的社会融入缺乏稳定性及可持续性,譬如,“工会”作为正式社会支持的一种,能够维护流动者的劳动权益、促进劳动者间的良性互动,而缺少此类正式社会组织或缺乏常态化服务和支持则不利于流动人口进一步融入城市[32]。综上,社会网络对流动人口社会融入的正向影响可能会随着社会网络规模的扩大而逐渐下降。据此提出:
假说2:社会网络规模与流动人口社会融入存在非线性关系,社会网络规模过大可能不利于流动人口的社会融入。
3 研究设计
3.1 数据来源
本文使用的数据主要来自2016年由中山大学社会调查中心进行的中国劳动力动态调查(China Labor-force Dynamic Survey,CLDS)。CLDS是以我国劳动力为调查对象的综合性数据库,每两年一次对中国城市和农村家户劳动力进行追踪调查,建立了个体、家庭和社区三个层次的追踪调查数据,与本研究直接相关的调查内容包括人口个人特征与社会经济特征、社会参与和社会支持、迁移经历、教育经历、劳动者状态等信息。该调查在全国采用多阶段、多层次与劳动力规模成比例的概率抽样方法进行抽样,覆盖全国29个省、区、市,调查对象为样本家庭户中年龄15~64岁的全部劳动力,本研究从中选取人户分离的劳动力作为流动人口③本文中讨论的流动人口指市辖区内人户分离的人口之外的人户分离人口。其中,市辖区内人户分离的人口是指一个直辖市或地级市所辖区内和区与区之间,居住地和户口登记地不在同一乡镇街道的人口。的考察对象。剔除关键变量缺失样本后,最终进行实证分析的样本为1816个。此外,为验证基本研究结论的可靠性,本文还补充了2014年的2444份流动人口样本建立面板数据进行稳健性检验。
3.2 变量定义
(1)因变量:社会融入
本文的因变量为流动人口的社会融入。根据既往研究和数据可得性[33],构建经济融入、行为融入和心理融入三个维度的指标体系。首先,从影响社会融入的主观倾向和客观情况视角出发,设定三个层面的一级指标;其次,根据己有研究的成果,并在可获得有效数据的基础上,对上述一级指标领域设定二级指标,具体指标体系见表1。其中,经济融入侧重体现个体在流入地实现融入的经济实力与保障能力,行为融入测度个体在流入地的行为适应情况;心理融入反映流动人口对于社会融入与否这一决策的主观意愿和选择、个体对于迁移到城市后生活水平变化程度的主观评价和判断。
表1 社会融入指标的定义与描述
为获得流动人口社会融入的总体状况,将上文讨论的二级指标进行主成分分析,所得综合KMO值为0.815,表明以上指标适合进行主成分分析。而后,运用方差极大化方法对因子负荷进行正交旋转,共提取出三个特征值大于1的公共因子,以公共因子的方差贡献率为权数对这三个公因子进行加总求和,并转换为1到100之间的指数,作为社会融入度,得分越高,表示社会融入度越高。
(2)关键自变量:社会网络
流动人口的社会网络是本文的关键自变量。首先,从社会网络的关系维度切入,着重考察在本地关系密切的亲友所构成的社会网络,既包括以亲缘、血缘、地缘为主的初级社会网络,也包含流动人口在流入地新构建起来的次级社会网络,重点关注社会网络的互动性与亲密性。其次,从社会网络类型进行区分,分别利用在本地可以诉说心事的亲友数和可以讨论重要问题的亲友数作为侧重精神支持的社会网络指标,采用可以借钱(5000元)的亲友数作为侧重物质支持的社会网络指标。
(3)控制变量
参考相关研究[12][19],从流动人口的个人特征、工作特征、家庭特征、社区特征四个层面选取研究的控制变量,具体包括性别、年龄、户籍、婚姻状况、受教育年限、党员、社会经济地位、流动范围等个人特征,工作培训、工作行业等工作特征,家庭规模、兄弟姐妹数等家庭特征,以及社区基础设施、社区人居环境等社区特征。上述变量的描述统计如表2所示。
表2 变量描述性统计
3.3 模型与方法
为了验证前文提出的研究假说,首先采用经典线性回归(OLS)初步考察流动人口的社会网络与社会融入的关系。具体表达式为:
其中 INTi表示流动人口的社会融入度, SNi为流动人口的社会网络规模,Xi 为一系类控制变量。β1为流动人口社会网络与社会融入关系的待估计参数,εi为随机扰动项。
尽管上述OLS方法的估计结果能够初步回答社会网络与社会融入的关系,但所得结论可能并不准确。一个重要原因在于,OLS回归无法较好地克服样本选择偏误问题。比如,学历越高、技能越强的流动人口的社会融入程度通常较高,同时该群体往往有更多的机会扩大社会网络规模、提升社会网络水平。显然,此时的OLS估计结果并不能解释为因果关系。因此,对于流动人口社会网络与社会融入间因果效应的推断,需要构造一个反事实框架,倾向得分匹配(PSM)是用来解决这一问题的重要方法之一。但是传统的PSM方法只能识别二元自变量的处理效应,而本研究的社会网络指标是连续的,将其人为地进行分类将损失其独有的变量信息。因此,采用广义倾向得分匹配法(GPS)进行实证分析。Hirano and Imbens(2004)通过扩展PSM方法,将其引申至能够识别多元变量和连续变量处理效应的广义倾向得分匹配法[33]。在样本满足条件独立性假设的条件下,GPS方法能够较好的控制由样本选择偏差导致的内生性问题。此外,GPS方法可以检验不同规模的社会网络对流动人口社会融入的差异化影响,即个体的剂量反映函数(Unit-level Dose-response Function),从而进一步丰富研究结论。
实现GPS估计过程分为三个步骤。第一步,在给定控制变量 的情况下,估计关键自变量(社会网络)的条件概率密度分布。首先,估算自变量 (需满足正态分布条件)的条件分布g(Ti) :
其中, h(γXi)是控制变量 X的线性函数, γ和δ2是待估参数,可通过最大似然法估计得到。然后,根据用Fractional Logit模型估计出第 个观测样本的概率密度,即广义倾向得分(GPS):
第二步:将因变量(社会融入) inti表达为关键自变量(社会网络) Ti和(3)式估计出的 的函数,并采用OLS法估计其条件期望:
第三步:将(4)式的回归结果代入到以下方程中,估计关键自变量(社会网络)取值为 t时因变量(社会融入) INTi的期望值:
4 实证分析
4.1 基准回归分析
表3汇报了社会网络与流动人口社会融入关系的OLS回归结果。其中,模型1~3以关系密切的亲友数作为社会网络的代理变量,模型1仅控制了省份固定效应,模型2在模型1的基础上加入了流动人口的个体特征变量,模型3进一步将所有控制变量纳入考量。可以看出,关系密切的亲友数的系数符号与显著性水平具有较强的稳健性。模型4~6分别以可谈心的亲友数、可讨论重要问题的亲友数、可借钱的亲友数作为社会网络的代理变量,各模型均考虑了所有控制变量,可以发现,社会网络的各代理变量的系数均正向显著,证实了前文理论假说1的判断。从估计系数来看,相比精神支持型的社会网络(谈心、讨论重要问题的亲友),侧重物质支持的社会网络(可借钱的亲友)发挥的正向作用相对更大。
表3 社会网络与流动人口社会融入的OLS估计
在模型3~模型6中,性别、年龄、户籍、婚姻状况、受教育年限、党员、社会经济地位、社区基础设施、社区人居环境对社会融入也有显著影响。具体而言,在其他条件不变的条件下,已婚男性的社会融入度相对高于其他群体,越年轻、学历越高、社会经济地位比5年提升越多、社区基础设施越好的流动人口社会融入度相对更高。另外,值得关注的一点是,城—城流动人口的社会融入度高于同等条件下的“乡—城”流动人口,这与已有相关研究结论较为一致[34]。
4.2 GPS估计
表4的Panel A给出了GPS方法第一步的Fractional Logit估计结果,用于估计个体处于某一社会网络规模的概率,即个体的GPS得分④平衡性检验显示,经过广义倾向得分调整后的控制变量不存在明显差异,表示匹配效果较好。鉴于篇幅,这里不再单独列出。。结果显示,性别、受教育年限、工作培训、党员、社会经济地位(五年前)、社区基础设施对社会融入有正向影响,表明在同等条件下,男性流动人口的社会网络规模大于女性,人力资本水平越高、社会经济地位提升越多、社区基础设施越好的流动人口有更高水平社会网络。这也意味着,流动人口的社会网络本身受到多种因素影响,如不进行考虑可能导致估计偏误。
表4 社会网络与流动人口社会融入的广义倾向得分(GPS)估计
Panel B是GPS方法第二步的OLS估计结果。值得注意的是,估计结果中 λ3和λ4均在1%的统计水平上显著,证实了流动人口社会网络规模与社会融入的关系存在样本选择偏误。最后,GPS方法的第三步用于估算社会网络在社会融入不同分位点上的期望值及其边际变化,如图1所示。其中,将不同社会网络规模下的总体效应连接起来,便得到整个关键自变量取值区间内社会网络与社会融入的之间的“剂量反应”函数关系。图1的左图显示,社会网络对社会融入的影响始终为正值,但社会网络与社会融入之间并非线性关系,影响效应的大小呈现先上升后下降的倒“U”型趋势,这验证了前文的假说2。图1的右图展示了处理效应函数,可以看出处理效应函数曲线向右下方倾斜,边际效应递减。这说明,对社会网络规模小的流动人口而言,扩大社会网络能够收获更大的边际效益,但社会网络规模的扩大为社会融入带来的边际收益递减。从而进一步证实了前文的理论假说。
图1 基于广义倾向得分(GPS)估计的剂量反应函数与处理效应函数
4.3 异质性分析
(1)群体异质性
本文进一步检验社会网络与社会融入关系的群体异质性。表5以关系密切的亲友数为社会网络的代理变量,模型1~5分别加入了社会网络与性别、新生代流动人口⑤新生代流动人口指1980年及以后出生的流动人口;第一代流动人口指1980年前出生的流动人口。、受教育年限、农村户籍、跨省流动的交互项以区分社会融入的群体差异,均控制了个人特征、工作特征、家庭特征、社区特征、省份固定效应⑥本文也分别以可谈心的亲友数、可讨论重要问题的亲友数、可借钱的亲友数进行了同样的估计,估计结果显示,用其他社会网络代理指标得出的估计结果一致,限于篇幅,文中不再陈列详细的估计结果。。模型2加入了社会网络与新生代流动人口的交互项,交互项的系数显著为负,说明相较于新生代流动人口,社会网络对第一代流动人口产生的作用更大。其原因可能是新生代的流动人口对互联网的使用率更高,一方面,互联网所传递出的有关求职、就业信息部分代替了第一代流动人口的传统社会网络求职的功效,部分对冲了社会网络促进经济融入的作用;另一方面,互联网的使用本身就是行为融入的重要一环,部分打破了流动人口与流入地居民之间的文化隔离。模型3加入了社会网络与受教育年限结果的交互项,交互项的系数显著为负,说明随着受教育程度的提高,社会网络对社会融入的边际效应下降,即当人力资本水平较低时,社会网络对促进社会融入的作用相对更大。可能的原因是,在求职就业时,社会网络是人力资本的有益补充。人力资本水平越高的流动人口,就业议价能力越强[35],社会网络对签订劳动合同和参与劳保福利的价值越弱[36]。这意味着,对人力资本低的群体,除了进行就业培训外,应当关注其本地社会网络的扩展。
表5 社会网络与流动人口社会融入关系的群体异质性
(2)社会融入维度异质性
本研究进一步考察了社会网络与不同维度的社会融入的关系,估计结果如表6所示。总体来看,社会网络对不同维度的社会融入均有显著影响。相比经济融入,社会网络对流动人口行为融入及心理融入维度的作用相对更大。可能原因有二:第一,社会网络虽在短期内有助于流动人口找到工作和居住地,但长期来看,促进经济融入的仍然是个体的人力资本[37]。第二,经济融入更容易受户籍制度牵制,公共服务往往和户籍挂钩,而针对流动人口的社会保障、住房、卫生和医疗等公共服务的缺乏,在较大程度上阻碍流动人口社会经济层面的向上流动。进一步从不同社会网络指标的差异来看,精神支持型的社会网络(谈心、讨论重要问题的亲友)更能促进行为融入和心理融入,而物质支持型(借钱的亲友)则更有助于促进经济融入。综合来看,社会网络是促进流动人口社会融入的重要因素,但多维度提升流动人口的融入程度则需要制度环境、个体人力资本积累和非正式社会支持等的协调配合。
表6 社会网络与流动人口的不同维度社会融入
(3)稳健性检验
尽管GPS估计能够在一定程度上克服样本选择偏误,但仍然难以完全解决遗漏变量和双向因果等潜在的内生性问题。故分别对研究样本、变量和估计方法进行调整,进一步验证研究稳健性,结果如表7所示。首先,我们将研究样本从2016年CLDS截面数据拓展至2014~2016面板数据,而后运用双向固定效应模型消除不随时间变化且不可观测的异质性,以此减轻遗漏变量偏误。如Panel A所示,固定效应模型中不同的社会网络指标均显著为正,且估计系数与OLS估计接近,在一定程度上验证了本研究基本结论的可靠性;其次,更换关键自变量指标测算方法的再检验。具体地,本文进一步构建各社会网络指标的哑变量,流动人口若拥有某项社会网络,虚拟变量取值为1,否则为0。以此替代原社会网络指标进行回归,Panel B的结果显示,各项社会网络指标仍正向显著影响社会融入,研究结论仍然稳健;最后,进一步采用处理效应模型对社会网络与社会融入之间的关系进行再检验。类似于Panel B中的指标设定,将社会网络虚拟变量令为模型的处理变量,而后将其作为因变量对一系列个人、家庭和社区特征进行Logit回归,而后得到第一阶段的逆米尔斯比λ,而后将其代入模型的第二阶段估计社会网络对流动人口社会融入的影响。如Panel C所示,处理效应模型的第一阶段中逆米尔斯比λ在1%的水平上显著,说明采用处理效应模型能够在一定程度上纠正OLS的估计偏误。具体从模型的第二阶段估计结果来看,各个社会网络指标仍然显著为正,且估计系数大于OLS估计,表明OLS估计可能对社会网络与流动人口社会融入的关系存在一定的低估。总体上看,经过以上稳健性检验,本文的基本结论较为可靠。
表7 稳健性检验
5 结论与讨论
流动人口迁移并最终融入城市,是城乡统筹发展的普遍趋势,流动人口的社会融入问题一直是学界乃至整个社会关注的领域。以往研究肯定了社会网络对流动人口社会融入的积极作用,但对其可能存在的消极影响考察与分析不足。本文聚焦社会网络与流动人口的社会融入的关系,使用广义倾向得分匹配法(GPS)验证了二者之间呈先上升后下降的倒“U”型关系,即随着社会网络的扩展,其对流动人口社会融入的正向影响将逐渐下降,究其原因,主要可能受到流动人口社会网络结构的同质性、高密度与人情往来成本的影响。异质性分析结果显示,从群体差异来看,社会网络对第一代以及人力资本水平较低的流动人口社会融入有相对更大的正面作用;从社会融入维度来看,相比经济融入,社会网络对流动人口的行为融入和心理融入的影响相对更大。
上述结论验证了本文的研究假说,主要有以下三个方面的启示:首先,社会网络是提升流动人口社会融入水平的重要渠道,应当建立相应平台促进流动人口社会网络的扩展,提供该群体必要的社会资本投资。其次,社会网络与流动人口社会融入之间的倒“U”型关系表明,对于流动人口甚至更广泛的人群,朋友贵精不贵多,高质量、异质性的社会网络将为社会融入带来相对更加持久的积极影响;对于政府而言,应当侧重对社会网络规模较小的流动人口予以社会支持,提高其融入城市的意愿和能力。再次,由于社会网络对社会融入的影响存在群体差异和融入维度差异,有必要因主体施策,侧重扩展延伸人力资本水平较低和第一代流动人口的社会网络,同时注重推进针对流动人口的基本公共服务均等化,提高其工作福利、社会保障等,同时通过教育和职业培训等进一步提高流动人口的人力资本水平,改善该群体在流入地的相对弱势地位,从而促进其在社会经济层面的融入程度。最后,流动人口的社会网络所提供的社会支持主要源自非正式渠道,因此需要为流动人口提供必要的正式社会网络和社会支持,进而更加有效地提升该群体的社会融入水平。
由于数据限制,本研究仍存在一定的不足。第一,对社会网络维度和质量的探讨有待完善。社会网络受结构维度(家人关系、熟人关系、陌生人关系的划分)、关系维度(互动性与亲密性)以及认知维度(互惠性行为与共同价值观)等多个因素的共同影响。本研究在选取社会网络指标时主要考虑了关系维度,尚未从结构与认知维度进一步区分,故而无法得知社会网络结构及认知对社会融入的影响。同时,本研究所使用的社会网络指标主要表征为网络规模,但未能体现网络质量。第二,影响机制有待实证检验。受数据信息的限制,社会网络的潜在的正向和负向影响渠道难以量化,这使得研究结果仍停留在理论解释层面。尽管存在以上局限,本研究为本主题的研究视角、方法和内容提供了一定补充。运用更新更全面的数据,改进社会网络指标并进一步实证检验本文的研究结论以及影响机制,需要未来相关研究进一步讨论。