跨省流动人口健康自评状况及其影响因素分析*——基于2014年全国流动人口动态监测调查数据
2021-09-10任国强胡梦雪
任国强,胡梦雪
(天津理工大学 管理学院,天津 300384)
1 引言
党的“十九大”指出“实施健康中国策略、完善国民健康政策、为人民群众提供全方位全周期的健康服务”。流动人口是我国人口的重要组成部分,预计在2020年将高达2.91亿人[1],占全国总人口的20.7%。相比当地城市居民或户籍地居民而言,跨省流动人口面临着更高的健康风险,包括在公共卫生政策、健康教育、医疗保险等健康权益问题上的不平等[2-3]。由此,跨省流动人口健康状况越来越受到政府和学界的广泛关注。鉴于此,本研究利用2014年全国流动人口动态监测调查数据,聚焦探讨跨省流动人口的健康状况及其影响因素。
通过梳理相关文献得到,学者们主要针对以下几个流动人口健康的影响因素进行了研究。第一,收入水平,部分学者认为相比省内流动,跨省流动人口可以获得更好地就业机会与就业职位,能够带来显著的收入增长[4],从而有利于流动人口的健康[5]。第二,公共服务利用,李晨等(2010)[6]表明受医疗保险、心理等因素影响,流动范围较大的流动人口对当地基本公共卫生服务的利用更小,而刘胜兰等(2018)[7]认为跨省流动人口的卫生服务利用情况要优于省内流动人口。第三,社会融入,郝晓宁等(2018)[8]证明跨省流动人口相比省内流动人口有更好的社会融合度,能够引导其心理状况向更健康方向发展。第四,家庭纽带,家庭纽带在流动人口流动选择机制中有重要作用,部分表现为家人同住对跨省流动人口心理状态的支持与改善[9-10],另一部分体现为老家事务对跨省流动人口心理的牵制作用[11]。可见,上述因素均会对流动人口健康状况产生一定影响,这为本文奠定坚实的理论基础。
但上述研究也存有一定局限性,即针对某一个影响因素展开跨省和省内流动人口健康问题的比较研究,这与现实情况有较大的差距。跨省和省内流动人口的健康问题是多种因素共同作用的结果,将多种因素纳入估计模型是较为必要的。另一方面,在探究流动范围与人口健康的关系时,两者之间选择性问题通常会导致常规回归分析出现有偏结果[12]。鉴于此,本研究在使用基准回归方法的基础上,采用倾向得分匹配方法(PSM)来消除选择性偏差,更进一步地,在深入分析不同因素对跨省流动人口健康的影响作用同时,还将检验变量的中介效应。
2 研究设计
2.1 数据来源
本文使用的数据为2014年全国流动人口动态监测调查数据,数据覆盖我国北部、中部、东部和南部四大地区,包含北京市朝阳区、浙江省嘉兴市、福建省厦门市、山东省青岛市、河南省郑州市、广东省深圳市和中山市、四川省成都市等八大城市(区),每个城市(区)根据多阶段PPS原则调查了2000名流动人口(在流入地居住一个月以上),除去不合格问卷,共得到有效流动人口样本15999个,其中跨省流动样本8771个,省内跨市和市内跨县样本共7228个。
2.2 变量选择
(1)因变量。因变量为样本个体的健康状况,本文选取自评健康作为健康的评价尺度,由于自评健康与死亡率等客观指标高度相关[13],数据获取方便且数据质量较高,是非常有效的综合性指标,有较好的信度[14-15],使用这一指标作为健康测度的研究也日益增加。自评健康对应问卷中601A问题:“总体来讲,您的健康状况是:差、一般、好、很好、非常好。”
(2)解释变量。本文的核心解释变量为流动范围,若流动范围为跨省流动,则作为处理组,赋值为1;若流动范围为省内流动(包括省内跨市和市内跨县),则作为控制组,赋值为0。
(3)控制变量。依据以往研究流动人口健康的相关文献[2,8,16-21],本文在计量模型中加入了一些控制变量,主要分为五个层面:个人特征(性别、年龄、婚姻、受教育程度)、收入水平(家庭人均收入)、公共服务利用(医疗保险、政府培训、劳动合同、健康档案、健康教育)、社会融入(是否努力缩小与本地人差距、对本地人接受情况、与本地人相处是否融洽)、家庭纽带(随迁人数、老家需要操心的事、老家耕地、老家住宅面积)。其中个人特征为控制实验异质性,收入水平、公共服务利用、社会融入、家庭纽带为跨省流动人口健康的一级影响因素。
各变量的具体定义及描述性统计见表1。
表1 变量描述性统计
2.3 研究方法
(1)回归分析。由于健康是1-5的多分类序次变量,因此采用有序离散逻辑概率模型(Ordered Logit模型)进行回归分析。Ordered Logit回归模型设定如下:
式(1)
其中,Y代表流动人口自评健康状况;αj为常数项回归系数;βi为系数;xi表示包括核心自变量和其他控制变量在内的所有解释变量(i=1,2,…,n;n=18),其中,核心自变量1个,其他控制变量17个;j=1,2,3,4,5分别表示健康状况“差”“一般”“好”“很好”“非常好”。
(2)倾向得分匹配。假定进行跨省流动的健康状况为Y1,进行省内流动的健康状况为Y0,则跨省流动导致的健康效应为两者之差,即Y=Y1-Y0。但对于每个流动人口来说,只能选择跨省流动或省内流动其中一种模式,因而无法得到另一种状态下的数据,因此需要创建一个对照组。在这个对照组中,每个流动者的禀赋特征与真实流动者近似甚至相同,由此得到流动人口在另一种流动状态下的数据。此外,由于流动人口进行流动活动不是一个随机过程,而是理性选择的结果,使用基准回归方法进行回归分析一般会导致结果有偏[22]。为解决这两个问题,本文使用倾向得分匹配方法来模拟自然实验的状态,从而得到准确可靠的估计结果。
倾向得分匹配方法适用于处理非随机数据[23],由Rosenbaum等(1985)首次应用于生物统计领域,后普遍被使用在卫生经济和其他社会科学领域。其核心思想是找到一组与跨省流动人口资源禀赋特征相同或近似的省内流动人口进行健康状况比较。由于两组样本的资源禀赋特征极其相似,因此两组样本的健康状况差异可以解释为跨省流动所带来的效应。运用该方法进行跨省流动对流动人口健康效应评估的基本思路如下。
第一,计算倾向得分。倾向得分是在给定条件下接受干预的条件概率[24]。一般使用Logit或Probit模型估计得到。流动人口进行跨省流动的概率(倾向得分)为:
p(X)=pr[D=1|X]=E[D|X]
式(2)
其中,D为指示变量,当流动人口选择跨省流动时,D=1,反之,D=0;X是一组影响个体选择跨省流动的特征变量。
第二,选择匹配方法。选择合适的匹配方法,将处理组(D=1)中的每一个观测值与对照组(D=0)中倾向得分相近的观测值进行匹配。为保证估计结果的稳健性,本文采用最邻近匹配法(Nearest Neighbors Matching)、半径匹配方法(Radius Matching)和核匹配方法(Kernel Matching)三种方法进行样本匹配。
第三,计算平均处理效应。在给定倾向得分的情况下,跨省流动对流动人口健康的平均处理效应可以通过比较处理组和对照组的健康状况差异得到,即
ATT=E[Y1-Y0|D=1]
=E{E[Y1-Y0|D=1,p(X)]}
=E{E[Y1|D=1,p(X)]-E[Y0|D=0,p(X)]|D=0}
式(3)
其中,Y1和Y0分别表示处理组和对照组中被匹配的流动人口的健康状况。
3 结果分析
3.1 基本回归模型分析
文章基于2014年全国流动人口动态监测调查数据,分析跨省流动对流动人口健康状况影响。回归结果综合整理如表2所示。模型1仅控制了流动人口的个人特征,模型2在模型1的基础上控制了流动人口的收入水平、公共服务利用、社会融入、家庭纽带等因素,模型1与模型2均使用Ordered Logit模型进行回归。
由表2可见,模型1、2均显示相比省内流动人口进行跨省流动的流动人口的健康状况更好。这与李建民等(2018)[25]提到的“健康移民效应”结论相似,即健康的人更倾向于迁移,选择远距离迁移的人健康状况优于近距离迁移的人。当加入流动人口收入水平、公共服务利用、社会融入、家庭纽带等控制变量后,这种效应更加显著。
表2 基本回归结果
模型1显示,年轻、受教育程度高、未婚的男性跨省流动人口更健康。年龄、性别和受教育程度对跨省流动人口健康的影响显著,年龄对跨省流动人口健康呈现负效应,而男性和教育程度都表现出正效应。
模型2显示,在综合考虑多种因素之后,跨省流动人口的健康状况比省内流动人口健康状况明显更好,跨省流动人口的健康评价要高出0.12分,且结果变为显著。在跨省流动人口个人特征来看,与模型1呈现结果一致,虽然受教育程度对健康的影响变为不显著,但仍是年轻、受教育程度高、未婚的男性跨省流动人口健康状况更好。这与以往的研究结论基本一致,即人力资本越高的个体健康状况越好。
从收入水平看,收入对于跨省流动人口健康有显著正效应。相比省内流动跨省流动能够获取更高收入,因此可用于健康投资的资源越多,健康状况也就更好,这与黄乾(2010)[26]所得结论相同。
从公共服务利用状况看,政府培训和健康档案对跨省流动人口健康产生显著正效应,这与阳玉香等(2017)[27]研究结论一致。但医疗保险、劳动合同、健康教育会对跨省流动人口健康产生负效应,且结果不显著,这与侯慧丽(2016)[28]、林李月(2019)[20]的研究结果相同。
从社会融入状况看,“努力缩小与本地人差距”、“对本地人接受情况”、“与本地人相处融洽”均对跨省流动人口健康产生显著正效应。由于跨省流动人口是远距离迁移,这意味着流动人口在生活环境、文化交流和社会交往等方面会发生较大改变。与当地人相处融洽、努力缩小差距等是对当地居民生活方式的认可,会在心理上增强跨省流动人口归属感,从而呈现积极向上的生活态度。
从家庭纽带状况看,随迁人员对跨省流动人口健康产生正效应,即随迁人数越多,跨省流动人口自评健康状况越好。老家有需要操心的事对跨省流动人口产生显著负效应。老家耕地与老家住宅对跨省流动人口健康具有显著的正向促进作用。
表2结果表明,在多层面控制流动人口健康影响因素后,进行跨省流动的流动人口自评健康状况明显更好。但上述回归方法存在一些难以解决的自选择问题,还需使用倾向得分匹配方法去除可能存在的估计偏误,进一步检验结果的稳健性。
3.2 倾向得分匹配分析
(1)流动人口是否跨省流动的倾向得分。在估计倾向得分时,选择匹配变量至关重要,Heckman等(1997)[29]认为选取无关变量不会影响最终结果,但遗漏变量会产生严重偏差。就跨省流动人口健康影响因素考虑,选取流动人口个人特征、收入水平、公共服务利用、社会融入、家庭纽带五个层面17个变量作为匹配变量。使用Logit回归对流动人口跨省流动倾向得分进行估计,结果如表3所示。其中,Pseudo-R2=0.086;LR chi2(17)= 1760.42,P<0.001,AUC估计值为0.796,接近于Sturmer等(2006)[30]建议的0.8的“阈值”,说明模型选择的匹配变量符合平衡性标准的要求。
(2)样本匹配效果检验。在得到倾向得分后,需要对匹配效果进行检验,以便处理组与控制组在倾向得分上保持相似性。检验匹配效果主要包括两点:一是检查匹配前后标准偏误是否减小;二是评估匹配后样本损失情况。
根据Rosenbaum 等(1983)[24]的界定,当匹配后标准偏差绝对值在5%以下时,认为匹配效果非常好,可以使用。由表4匹配效果检验可以发现,除“老家耕地”匹配后的标准偏差为5.1%外,其他控制变量匹配后的标准偏差绝对值均处于5%以下。且匹配前17个控制变量的平均标准偏差为15.05%,匹配后平均标准偏差下降为2.21%,说明样本中各变量均值差异很小,减弱了样本异质性,可认为匹配通过了平衡性检验,匹配变量的一对一匹配效果较好。半径匹配法与核匹配检验结果与表3类似,本文不再一一列出。
表3 样本匹配前后控制变量变化情况
评估匹配后样本的损失情况,可以寻找匹配变量的共同取值范围[31]。PSM要求处理组与控制组的倾向得分有较大的共同取值范围,否则,将认为样本观测值丢失较多,剩余样本不具有代表性。图1显示大部分匹配变量均处于共同取值范围内,因此,匹配后的样本损失数是非常少的。
图1 倾向得分的共同取值范围
(3)跨省流动对流动人口健康的影响。表4为三种不同匹配方法下的跨省流动对流动人口健康影响的平均处理效应估计结果,可以看出,使用最邻近匹配法得到的处理组平均处理效应(ATT)为0.0637,使用半径匹配法和核匹配法得到的ATT分别为0.0675、0.0641,三种方法均在1%水平上显著。无论是平均处理效应的估计值还是显著性,三种方法的结果相近,均表现为跨省流动人口自评健康状况更好,这在一定程度上反映了结果的稳定性。同时,可以看出在消除了跨省流动与省内流动人口可观测异质性导致的偏差后,进行跨省流动的流动人口比其假如进行省内流动健康水平高出6.5%左右。而相比Ordered Logit估计结果,健康效应减少了6.03%,说明传统线性回归模型未考虑样本中的选择性偏差,高估了跨省流动对流动人口健康的处理效应。
表4 是否跨省流动对流动人口健康的平均处理效应估计结果
3.3 中介效应分析
经过上述分析,我们可以得到跨省流动的人群健康自评状况更好。接下来,我们通过中介效应模型探讨跨省流动是否通过影响流动人口的收入水平进而影响其自评健康状况。Baron等(1986)[32]提出了检验中介变量的因果效应逐步回归法(Causal Step Regression),该方法在诸多问题中被广泛应用[33-34]。依据该方法内容,我们设定如下的中介效应模型:
Healthi=α+βFlo_ragei+γZi+εi
式(4)
Ave_Incomei=α+βFlo_ragei+γZi+εi
式(5)
Healthi=α+βFlo_ragei+λAve_Incomei+γZi+εi
式(6)
(4)~(6)式中,Flo_ragei表示流动人口的流动范围,是一个包括“跨省流动”与“省内流动”的二分类变量。Ave_Incomei表示流动人口的家庭人均收入;Zi为控制变量,β、α、γ等为待估参数,α为常数项,εi为随机误差。由于自评健康为一个多分类的排序变量,因此(4)与(6)式使用有序离散逻辑概率模型(Ordered Logit模型)进行回归。(5)式的被解释变量为家庭人均收入,是一个连续变量,使用OLS进行回归。
得到中介效应模型的回归结果如表5所示。模型3的结果显示跨省流动对流动人口健康有显著的正向影响,与前文所得结论一致。模型4的结果显示跨省流动在1%的统计水平上对流动人口家庭人均收入有显著正影响,说明进行跨省流动的流动人口收入水平更高。模型5在同时控制了跨省流动和家庭人均收入之后,跨省流动对流动人口健康表现出1%统计水平的显著正影响,家庭人均收入对跨省流动人口健康表现出5%统计水平的正向促进作用。同时可以观察到,跨省流动对流动人口健康的边际效应从模型3中的0.129下降到模型5中的0.124。根据中介效应逐步法检验原理可知,收入水平在跨省流动影响流动人口健康的过程中发挥着中介作用,且为部分中介效应。温忠麟等(2014)[35]提出,验证中介效应是否存在还需进一步检验,我们使用Bootstrap法自抽样迭代500次得到了直接效应与间接效应95%的置信区间,两个区间内都不包含0,表明直接效应与间接效应均显著,同时说明中介效应存在,其中中介效应占总效应的比率为 5.87%。“跨省流动→收入水平→自评健康水平”的作用机制得以证实。
表5 中介效应模型——跨省流动影响流动人口健康的作用机制分析
4 结论与政策建议
4.1 结论
本文通过上述分析得到以下结论。
第一,使用Ordered Logit模型分析结果表明,跨省流动人口表现出比省内流动人口更好的健康状况,在使用倾向得分匹配方法去除了样本中的选择偏误后得到了一致结论,但相比Ordered Logit回归结果,健康效应减少了6.03%,即基础回归高估了跨省流动对流动人口健康的处理效应。
第二,不同特征的流动人口健康自评状况有所不同,年轻、受教育程度高、未婚的男性跨省流动人口的健康状况更好;收入对跨省流动人口健康有显著正向影响;政府培训、健康档案对跨省流动人口健康有显著正影响,医疗保险、劳动合同、健康教育对跨省流动人口健康表现出负向影响;社会融入表现出对跨省流动人口健康显著的正向影响;家中烦事对跨省流动人口健康表现出显著负效应;随迁人员、老家耕地、老家住宅表现出对跨省流动人口健康正影响。
第三,中介效应检验结果显示,收入水平在跨省流动对流动人口健康影响中存在一定的中介作用,产生的中介效应占总效应的5.87%。
4.2 政策建议
根据文章实证结果,提出有益于提升跨省流动人口健康水平的措施。
第一,提升跨省流动人口收入水平。收入是流动人口进行远距离流动的重要因素,提高跨省流动人口的收入水平有益于获取更多的健康资源。由于大城市工作机会多,工薪报酬较高,大批流动人口选择异地工作,流动距离越远说明流动人口对高收入的倾向性越大。但由于部分工人如农民工、服务业人员他们的教育水平和相关技术能力较低,只能从事劳动力相对较重、薪酬相对较低的工作,此对健康极为不利。针对此点,政府应从丰富其技能知识、提高其技术能力方面入手,使这些跨省流动人口有选择待遇优越工作的机会。对此政府应建立相关法律法规大力扩展教育范围,增大对跨省流动人口的培训力度和广度,进而提升跨省流动人口的学历与技术水平,使其掌握多种技能。
第二,完善社会基本公共服务体系。医疗保健卫生服务是关乎跨省流动人口健康的重要内容,但与本地人相比外来人口对当地公共卫生服务利用率并不高[36],除存在户籍地限制之外,还包括基本公共服务制度和体系的缺陷。对此我们首先应当逐步为跨省流动人口建立健康档案,将其纳入城市公共卫生管理信息系统。其次,消除户籍分割和制度分割带来的不平等,要统筹医保报销制度,尽早实现异地报销,要降低医保自费比例,降低医保报销门槛,转变跨省流动人口“大病拖,小病抗”为“大病小病都能看”。最后,加强对跨省流动人口的健康教育,扩大传播方式和手段,使跨省流动人口在日常生活中关注自身健康并进行改善。
第三,提升跨省流动人口的社会融合程度。文中分析表明,跨省流动人口对融入当地有良好的意愿,而这种良好的意愿促进跨省流动人口健康向更好水平发展,因此应当积极促进跨省流动人员与当地社会进行有益的社会融合。主要包括生活和文化两方面。生活方面,减少外地人当地购房条件限制,住房是给人最高安全感的物品之一,能够大大提高跨省流动人口城市归属感;建立以社区为基础的社会关系网络[37],跨省流动人口远距离流动失去了原有的人际网络,需要新的社会关系支持,以社区为载体更容易为跨省流动人口带来新的社会资本。文化方面,引导外来人口积极参与当地民俗活动,增强文化认同。
第四,保障留守儿童、空巢老人的健康生活。缓解经济压力与保障留守儿童、空巢老人的身心健康是外出务工人员需直面的矛盾,相比省内流动人口跨省流动人口此矛盾程度更深。解决此矛盾需要流入城市与迁出地政府同时做出举措,流入城市应减少外地儿童入学升学障碍,为外地儿童提供当地上学的机会,以减少留守儿童的数量。同时迁出地政府应加强对空巢老人的关心照看,加快乡镇养老院建制,加大养老服务规范化发展,确保每一个空巢老人的基本生活有所保障;对于确实无法流动的留守儿童,迁出地政府要保障留守儿童能够受到良好教育,关注留守儿童心理健康发展。以此缓解由于家人无法照看使跨省流动人口产生的焦虑感,减少后顾之忧,从而促进跨省流动人口的身心健康向更好状态发展。