流动时代的健康中国:社会经济地位、健康素养与健康结果
2022-03-15鲁佳莹刘林平
郭 未,鲁佳莹,刘林平
(1.南京大学 社会学院,江苏 南京 210023;2.江苏省广播电视总台 节目研发与用户研究中心,江苏 南京 210036)
一、引言
流动人口是中国经济社会建设的重要参与者与贡献者,但是他们仍然面临被边缘化的现实处境,在健康问题上存在诸多不平等。[1]因此,在流动时代的中国,如何针对性地维护这一群体的健康权益,保障他们在城市中的身心健康与生存发展竞争力,对实现全民健康具有重要意义。2019 年6月《国务院关于实施健康中国行动的意见》中把“提升健康素养作为增进全民健康的前提”,[2]契合于此背景以及中国的实际情况,在健康不平等议题之下开展对于流动人口社会经济地位、健康素养与健康结果关系的研究,能为构建流动人口的健康政策提供一定的理论与实证支持。
第七次全国人口普查数据显示中国流动人口高达3.76 亿,其从与“农民工”(从农村进入城市从事非农工作)群体的极大重合变为了“农民工”群体与“流动白领”(在家乡具有城市户籍,具有大专及以上教育程度,但在家乡之外的另一座城市中就业和居住)群体为主的亚人口。[3]因此,本文拟利用涵盖健康素养专项调查模块的2016 年中国流动人口动态监测调查(China Migrants Dynamic Survey,CMDS)数据,在“社会因果论”(Social causation theory)视角下,呈现社会经济地位决定流动人口健康水平背后的因果逻辑。并回答如下问题:流动人口的社会经济地位与健康素养的关系如何?健康素养能否成为流动人口社会经济地位与健康水平差异之间的重要因果链,对流动人口的健康结果会产生怎样的影响?社会经济地位及相关政策维度的因素对于流动人口中两个核心群体(农民工与流动白领)健康素养的因果影响机制有何差异?
二、文献回顾与研究假设
1.社会经济地位与健康素养的关系
与不同社会地位群体的健康水平一样,健康素养也存在由社会经济地位导致的差异。[4]随着健康素养的概念与测量方式的不断完善,相当多的研究证实了受教育程度更高的人能够获得、使用与健康相关的更多信息,更有能力在医疗环境或社会生活中做出健康行为与决策。[5-6]一项针对中国城乡居民的分析也支持了高教育水平对个体健康素养具有显著积极影响。[7]一项针对武汉城区流动人口和当地居民健康素养的比较研究发现,流动人口在健康生活方式和技能上显著低于城区居民;[8]同时,健康素养对于不同教育程度的人也表现出差异化影响效应,即相比于高教育水平的人,健康素养对于低教育水平的人有着更为显著的健康影响效应。[9]
收入对个体健康素养的影响总体上在实证研究中得到了一致性的结论。Ettner使用两阶段工具变量法得出了收入对于人们健康及健康素养的稳健的积极效应。[10]Von Wagner等学者的研究也显示低健康素养者一般是自身或家庭收入较低的人。[11-12]Sørensen 等人基于欧洲八国健康素养调查数据发现经济匮乏仍然是低健康素养的最有力的预测因素,其次是社会地位、教育和年龄。[4]但是在中国情景之下,基于西方国家的研究发现可能会存在不一致,尤其是对于本文关注的流动人口而言。我们在本文中拟基于适宜数据探讨中国流动人口的经济状况对健康素养是否存在显著影响,这有待于我们在本文后续部分的实证研究发现来印证。
2.社会经济地位及健康素养与健康结果的关系
国内外不同学科的学者从压力、社会资本、生活方式等视角开展过社会经济地位与健康结果之间的中间机制的研究实践。关于健康素养与健康结果的关系研究中,健康素养被认为是社会健康公平的重要决定因素与保持和提高个人健康水平的一项重要资源,[13]对个人健康的预测比教育水平、收入、职业等更为有效。[9]已有研究表明健康素养越低的人有着更差的自评健康,[14]更高的孤独感及更高的死亡率。[15-16]当然也有研究提出相反观点,认为健康素养与个体健康结果的发生并无关系。[17]但是Stormacq 等人对16 篇相关研究文献进行分析发现健康素养和社会经济地位与健康结果之间有着明显的中介作用,通过提升人们的健康素养能进一步促成较好的健康结果。[18]
那么,健康素养究竟如何对健康结果产生影响呢?首先,疾病知识被认为是一个重要因素。基本上,现有的研究结论支持了健康素养会显著影响人们对疾病知识的认知。[19]其次,健康生活方式(健康行为)也是较普遍的一个解释机制,但西方的实证研究中并无统一的研究结论。一些研究表明健康素养会显著影响人们的锻炼、果蔬摄入、脂肪摄取、饮酒等与健康相关的行为,进而影响人们的健康状况。[11][15]总体而言,健康素养既受到社会结构的影响,人们所处的社会地位所附带的资源和环境(即结构)会显著影响人们的健康认知和能力,同时人们自发利用现有社会网络中的健康资源(即能动性)也将影响其健康素养的获得。但后者的能动性行为显然也不能否定机会结构的作用。另一方面,健康素养也被诸多实证研究证实是提高个体健康水平的一种重要资源,[20]也就是说,健康素养是理解社会经济地位与人们健康水平关系背后的重要因果链。
3.研究假设的提出
个体所处的社会经济地位决定了社会支持的差异,也决定了获得健康素养这一资源的机会。相对于受教育程度低的人,受教育程度越高的人在获取、学习和评判信息的能力上更具优势,多以脑力劳动为主的职业也培养了人们较高的认知能力,这种能力迁移至健康层面则意味着可能获得较高的健康素养。此外,低收入者往往有着较低的健康素养,[11]一方面,低收入者的教育程度往往不高,而另一方面,他们的居住环境和社会网络缺乏健康教育的条件与健康资源的共享,从而导致其拥有较差的健康素养。[21]据此,本文提出如下研究假设:
假设1:社会经济地位对流动人口的健康素养有显著影响。
假设1a:流动人口的受教育程度越高,其健康素养越高。
假设1b:流动人口的经济状况越好,其健康素养越高。
研究发现教育、收入以及职业与个人疾病后果高度相关,对健康产生深刻而持久的影响。[22]与社会地位较高的人相比,社会阶层低的人往往有着较高的死亡率、更大的健康风险以及更为糟糕的心理问题。同时,这一机制被证明在不同人口学特征(种族、性别、年龄等)中依然显著性地存在。[23]针对健康状况,本文从自评健康和患慢性病情况这两个方面来衡量,即是涵盖了主观和客观之下两个维度的健康测量。据此,本文提出研究假设如下:
假设2:社会经济地位对流动人口的健康结果有显著的决定性作用。
假设2a:流动人口的受教育程度越高,其自评健康状况越好。
假设2b:流动人口的受教育程度越高,其患慢性疾病的可能性越低。
假设2c:流动人口的经济状况越好,其自评健康状况越好。
假设2d:流动人口的经济状况越好,其患慢性疾病的可能性越低。
对于流动人口而言,健康素养关系其对健康风险行为的理解、对流入地卫生服务平台的使用、对自身健康权利的维护以及对健康保障的资源寻求能力等。由此,健康素养的高低会显著影响流动人口的健康保障,进而影响其健康损耗的程度。据此,本文提出如下研究假设:
假设3:流动人口的健康素养会对其健康结果产生显著影响:健康素养越高,流动人口的健康状况越好。
假设3a:流动人口的健康素养越高,自评健康状况越好。
假设3b:流动人口的健康素养越高,患慢性疾病的可能性越低。
在探究出健康素养是理解社会结构与健康不平等之间的一个重要因果机制的基础上,本文拟进一步观察社会经济地位及相关重要政策维度的因素对于流动人口中两个核心群体(农民工与流动白领)健康素养的因果影响机制差异。考虑流动白领在原生户籍及教育程度上与农民工的差异,以及祝仲坤等对于政策维度之下的本地健康档案建立对于农民工群体功能性活动与可行能力影响的实证研究发现,[24]本文提出如下研究假设:
假设4:社会经济地位对农民工与流动白领的健康素养有差异化影响。
假设4a:农民工的受教育程度越高,其健康素养越高。
假设4b:流动白领的受教育程度越高,其健康素养越高。
假设4c:农民工的经济状况越好,其健康素养越高。
假设4d:在本地设立健康档案对农民工的健康素养有正向影响。
4.内生性问题
虽然上述的综述与讨论一定程度呈现了社会经济地位、健康素养和健康结果之间的因果链,但这三者之间的统计关系依然可能存在内生性问题。第一,可能存在遗漏重要变量导致的有偏估计问题。比如,受访者的受教育水平往往是家长与本人的决策结果,因而本人的受教育年限与个人能力和家庭背景有关,这些因素会影响受访者的健康素养,从而带来遗漏变量问题。生活在经济状况较好,对教育、健康重视的家庭的人不仅可能经济状况、受教育水平更高,也可能吸收更多健康知识,从而提高自身健康素养,遗漏这些重要变量可能高估受教育水平对健康素养的影响。第二,可能存在联立性偏误,即反向因果。首先,受教育水平、经济状况与健康结果存在反向因果问题。教育和经济是保障健康的基础,如果没有较好的教育和收入,个体可能对健康认识不足,也没有足够的资源保障身体健康,从而引发疾患等;如果没有好的健康,可能无法接受更多的教育,在劳动力市场上会受到极大的限制,从而影响个体受教育水平和经济收入。其次,健康素养与健康结果也存在反向因果。健康素养较高的个体会比较重视自身健康,但同样,拥有较好健康的个体也会更重视对健康知识、健康生活方式、健康技能的掌握。
对于上述可能存在的内生性问题,本文尝试寻找适宜的工具变量以降低内生性带来的偏误。根据工具变量的特性以及借鉴前人对某一类工具变量的使用,参考Angrist和Keueger、吴要武等人的相关研究,[25-26]本文使用配偶的受教育年限、受访者的出生季度作为受访者教育年限的有效工具变量;使用受访者所在城市的最低工资标准数据作为个体经济状况的有效工具变量;使用过去一年接受社区健康教育次数和当前社区开展健康教育方式数等社区数据作为个体健康素养的有效工具变量。
从理论和逻辑来看,选择上述这些变量作为工具变量有四点理由。第一,配偶的受教育年限与本人的受教育年限是相关的,但与本人的能力、家庭关系不大,可以作为本人受教育年限的工具变量。第二,中国就业政策严格规定年满16周岁才可以进入劳动力市场,而中国的学龄儿童一般要年满6 周岁或7 周岁于每年的9 月份入学,所以出生在前三个季度的可以在某学年满16 岁选择退学进入劳动力市场,而第四季度出生的还需要留在学校多接受一年教育。因此,在中国情境下,出生季度是受教育年限的一个强工具变量。[26]第三,受访者的工资水平与所在城市的最低工资标准是相关的,满足工具变量的相关性假设,而最低工资标准的制定和执行是各城市政府的决策,与个体的健康结果无关,满足工具变量的外生性假设,符合工具变量条件。第四,中国从“单位人”时代转换为“社区人”时代,城市里个体生活的重要场景之地是在社区中,因此,当前社区开展健康教育方式数以及过去一年健康教育次数显然会影响当前个体的健康素养,但个体过去接受的社区健康教育次数已经发生,不大可能会对当前的健康结果产生影响;同时当前社区采用何种健康教育方式是社区的决策,与个体的健康结果关系也不大。
当然,以上对工具变量选择的讨论主要是从已有研究和逻辑去认知的,这种认知可能并不全面。比如,配偶的教育水平可能通过本人的教育水平对健康结果产生影响,但也有可能通过提高本人的健康素养对健康结果产生影响。因此,通过控制内生变量后检验工具变量与因变量之间是否相关来判断具有一定的合理性。但是,如果发现控制了内生变量后,工具变量与因变量仍然相关也并不能说明工具变量不满足外生性条件,[27]更重要的是要根据若干个至关重要的统计量来综合判断。[28]本文在接下来的实证分析部分会开展进一步讨论。
三、数据与模型
1.数据
本文主要使用国家卫生健康委员会(后文简称为“卫健委”)的中国流动人口动态监测调查(CMDS)2016年的数据。CMDS 2016在2016年5月集中展开调查,目标总体是“全国在调查前一个月前来本地居住、非本区(县、市)户口且2016 年5 月年龄在15 周岁及以上的流入人口”。其包括普通个人问卷(A 卷)、专项调查问卷(B 卷)和社区问卷(C 卷)三类。其中,健康素养专项调查(B 卷)是在全国流动人口监测调查的基础上抽取了5%的样本展开的调查,对象为15-70周岁的流入人口,这部分数据是本文的核心分析数据。经过数据整合和相应处理后,用于本文的流动人口的有效样本为8 100 个。同时,按照前述对农民工及流动白领的定义来进一步处理数据,最终,用于本文的农民工有效样本为6 708个,流动白领有效样本为956个。
2.变量
因变量包括主观维度之下的“自评健康”和客观维度之下的“慢性病患病数”。首先,考虑CMDS中自评健康的变异度不大(只有13 个人填答健康状况差),同时受访者对于健康主观评判较为准确的判断是在健康与不健康两个维度,本文根据对“在过去一年里,您认为自己的健康状况如何”这一问题的回答来进行具体的操作化,将“好”和“比较好”归为“健康”,赋值为1,将“一般”“比较差”“差”归为“不健康”,赋值为0。其次,慢性病患病数是一个计数型变量。慢性病发病情况与个体健康息息相关,[29]不少研究以其作为健康状况的操作化指标。根据问卷中“您现在是否患有以下慢性病”这一问题的回答,选择“没有患慢性病”赋值为0,其余选项每选择一种记为1,进行累加计算,形成一个取值为0-6的计数变量,该数值越大表示患病数越多,健康状况越差。
核心自变量包括“健康素养”和“社会经济地位”。首先,健康素养是一个连续型变量。《2016年全国流动人口卫生计生动态监测调查-流动人口问卷(B)》中的“健康素养”问卷包括的四个模块不同程度地覆盖了健康素养的基本知识和理念、健康生活方式与行为、基本健康技能这三个维度的内容。本文参照《中国居民健康素养问卷》直接计算答题正确率的方法,按照全部答对得1 分,答错、少答、不答或答“不知道”得0 分的评分标准来计算健康素养总分,生成0-52 分的连续型变量,并进一步进行了标准化处理(0-100分),得分越高者意味着总体健康素养越高。
其次,考虑流动人口职业的变异度较弱,同时在流动人口中教育与收入可能出现变动趋势发生背离的情况,[1]本文直接使用受访者受教育程度和收入两个变量来测量其社会经济地位。对于健康素养而言,教育并非要取得一定的学历才会起作用,接受教育的长短就可能带来影响,因此我们将教育状况设置为连续型变量,根据“受教育程度”选项中的“未上过学”“小学”“初中”“高中/中专”“大学专科”“大学本科”“研究生”,分别换算为0年、6年、9年、12年、15年、16年、19年。经济状况是一个连续型变量。如果受访者目前有工作,则依照问题“您个人上个月(或上次就业)纯收入为多少(不含包吃包住费)”进行操作化,同时为了避免奇异值的干扰,剔除了极少数的月收入大于15 000元的样本,最后对个人月收入进行了取对数处理。如果受访者目前没有工作,则根据其所在城市2016 年第一季度的每月最低生活保障标准进行数据填补。[30]调查数据显示在1 420位未就业者中,约76%是为了务工/工作、经商和家属随迁而流动,近50%流向北上广深等一线城市和长江、珠江三角洲地区,如果将未工作者都简单地赋值为0,可能极大掩盖了他们的经济状况差异。尽管受访者目前未就业,但他们的经济状况可能是不同的,经济状况较好者更有可能流向生活成本更高的城市,也更有能力在未就业的情况下还能维持较高的城市生活成本。所以,使用城市最低生活保障标准作为衡量未就业者的经济状况指标是可行的。
本文的工具变量包括“受访者出生季度”“配偶的受教育年限”“所在城市最低工资标准”“过去一年接受社区健康教育次数”“当前社区开展健康教育方式”。其中,受访者出生季度设置为0-1 虚拟变量,根据受访者的出生月份进行操作化,把出生在前三个季度的赋值为0,出生在第四季度的赋值为1。配偶的受教育年限设置为连续变量,根据受访者提供的配偶受教育程度相应地转算为受教育年限,如果受访者没有结婚,则赋值为本人的受教育年限。这样处理的原因有两点:第一,未婚受访者占比约为19.2%,如果直接删节数据,会造成较大缺失;第二,中国婚姻里长久的门当户对传统给了我们如此处理数据一定意义上的合理性。所在城市最低工资标准设置为连续变量,这是一个外部数据,由我们根据受访者所在城市政府人力资源和社会保障局公布执行的2016年“关于调整最低工资标准的通知”整理而来。过去一年接受社区健康教育次数设置为连续变量,依照CMDS 2016 调查问卷中的问题“过去一年您在社区接受几个方面的健康教育”进行操作化,数字越大表示接受社区健康教育的程度越高。当前社区开展健康教育方式则设置为连续变量,依照CMDS 2016调查问卷中的问题“您在社区是以何种方式接受健康教育”进行操作化,数字越大,表示社区开展健康教育的方式越多元。“社区开展健康教育方式”包括健康知识讲座、宣传资料、电子显示屏、宣传栏、社区医生咨询、社区网站咨询、社区短信/微信咨询和个体化面对面咨询等8种方式。
此外,本文还进一步控制了相关文献中所考虑的其他因素,如人口学特征的年龄、性别、婚姻,流出地特征的户口和所在区域,[31]以及反映流动经历的累计流动次数、累计流动时间、本次流动方式和流入地行政级别等。具体的操作化不再详细展开(见表1)。
表1 变量的基本特征描述(N=8 100)
3.模型
本文采用多元线性回归模型来考察社会经济地位对流动人口健康素养的影响;在估计流动人口社会经济地位和健康素养对健康结果的影响时,自评健康作为因变量,使用的是二分类Probit模型。慢性病患病数作为因变量时主要采用零膨胀负二项模型,从本文用于估计的慢性病患病数样本分布可以看到样本中的0值远远超过了50%,需要采用零膨胀模型,同时,统计发现方差大于均值(均值=0.063;方差=0.091),故不适用于零膨胀泊松模型,而是考虑零膨胀负二项模型为宜。在零膨胀计数模型中,由零计数和非零计数集建立的混合概率分布为:
其中,yi为因变量,pi表示个体源于第一阶段的概率,g(yi)表示个体源自第二个阶段,服从泊松分布或负二项分布,概率1-pi。当g(yi)满足如下条件时,称为零膨胀负二项模型:
公式(2)中,yi指的是慢性病疾病数量,α是伽马(gamma)分布的方差,即个体异质性产生的方差。λi为个体被解释变量期望值,此时,Y=yi的概率密度为:
公式(3)中,Xi表示个体特征的自变量和控制变量,Wi为零膨胀自变量向量,其余符号含义与公式(2)相同。
进一步地,本文根据因变量和内生变量特性,分别采用多元线性工具变量回归(IV-2SLS)进一步考察社会经济地位对流动人口以及流动人口中的农民工与流动白领的健康素养的影响,概率单位工具变量回归(IV-Probit)和零膨胀负二项工具变量回归(IV-ZINB)进一步检验社会经济地位和健康素养对流动人口健康结果的影响。模型设定如下:
其中,yi是因变量,Si是内生解释变量,Xi是一系列控制变量,εi是第二阶段随机误差项,Zi是工具变量,ξi是第一阶段随机误差项。在方程(5)中,必须满足Cov(Zi,εi)=0,Cov(ξi,εi)=0,且Cov(Zi,Si)≠0。因此,工具变量回归就是:在第一阶段对方程(5)进行回归,得到Si的预测值;在第二阶段,将方程(4)里面的Si用替代后进行回归,得到无偏估计量。
四、分析结果
1.社会经济地位与流动人口的健康素养
分析发现流动人口的整体健康素养标准化得分为72.48分(满分100分),按照历年《中国居民健康素养监测报告》,国家卫健委和中国健康教育中心将问卷得分达到总分的80%及以上判定为具备基本健康素养,根据这一标准来看,流动人口的整体健康素养并未达到基本线①本文使用的“健康素养”问卷由中国健康教育中心负责,与国家卫健委和中国健康教育中心组织的《中国居民健康素养问卷》题库基本一致,因此认为具有可比性。。同时,在不同内涵维度上,健康知识理念素养的得分(75.02)明显高于健康生活方式(72.13)和健康技能(70.11)。本文首先来考察社会经济地位(操作化为受教育年限和个人经济状况)对流动人口健康素养的影响(见表2)。
表2 流动人口健康素养的MLR模型、IV-2SLS模型
模型1 仅纳入了受教育年限和个人经济状况这两个核心变量,在未控制其他变量的情况下,流动人口的受教育年限越多,总体健康素养越好,个人经济状况越好,总体健康素养得分也越高。进一步地,模型2 在模型1 的基础上控制了年龄、年龄平方、性别、婚姻、户口、流动特征等变量,结果显示流动人口的受教育年限对健康素养依然有显著且稳定的影响效应。具体来说,在控制相关变量后,受教育年限每增加1 年,流动人口的总体健康素养得分就提高1.192 分(在0.001 统计水平上显著),假设1a 得到数据支持。流动人口的经济状况对总体健康素养影响在0.05统计水平上正向显著,假设1b 也得到数据支持。
阿迪克斯具有完备的道德品质,他引导斯库特学会看到人性真善美、温情的一面。他说:“有一种东西不能遵循从众原则,那就是良心。”拉德利性格孤僻、十几年足不出户,是人人眼中的怪人。人们对他有很多传言,视他为危险人物。经过几次非直接接触,到最后在招到报复袭击时,拉德利出手相救,斯库特发现拉德利跟普通人一样,是一个有血有肉,善良正直的人。泰勒法官在法庭上不拘礼节,但他精通法律,知道汤姆凶多吉少,特地指定阿迪克斯为汤姆的辩护律师。泰特警长为汤姆的冤死感到无能为力和可惜,他努力尊重拉德利的隐居生活,不让人们去打扰怪人拉得利的生活,因为把拉德利拉到聚关灯下就是在犯罪。
模型3 的结果显示:第一,在IV-2SLS 的第一阶段回归中,配偶教育年限、受访者出生季度与受访者的受教育年限,城市最低工资标准与受访者的经济状况都足够相关,且F值都远远大于经验标准值10。第二,过度识别检验显示这三个工具变量是外生的,与扰动项不相关。第三,DWH 内生性检验显示受访者的教育年限、经济状况确实是内生变量。这些统计量表明有必要放弃常规的MLR 模型而采信IV-2SLS模型的结果。模型3的IV-2SLS回归结果显示受教育年限确实对总的健康素养有显著的正向影响,但个人经济状况对总体的健康素养却变成了显著的负向效应。这或间接印证了在流动人口中教育与收入可能出现变动趋势发生背离的情况。此外,我们还认为在流动人口群体中,尽管他们的受教育年限和经济状况总体不高,但同经济水平(控制经济状况变量)的个体其受教育年限越高健康素养越好;而同教育年限(控制教育年限变量)的个体其经济状况越好反而健康素养越差。这可能说明了对底层老百姓而言,经济状况的改善并不能有效提高其健康素养,而教育水平的提高对他们健康素养的提高尤为重要。恰如我们在日常生活中能见到的装修行业中的部分工种(如瓦工、木工等),其收入较高,但从业者的教育程度普遍偏低。因此,IV-2SLS回归结果依旧支持假设1a,说明流动人口的健康素养不仅受到个体特征因素的影响,以教育为特征的社会经济地位的影响效应也十分显著。这也间接说明在流动人口健康研究中,社会经济地位测量要么使用较为综合的测量指标,要么使用教育测量更为有效。
2.健康素养是健康不平等的解释机制吗?
以自评健康来衡量流动人口的健康水平主要采用二分类Probit回归模型(见表3)。模型4、模型6、模型8 是常规的Probit模型,这些均纳入了相同的控制变量。模型4 是基准模型,即社会经济地位模型,着重分析社会经济地位对流动人口健康水平的影响。在控制了相关变量的情况下,受教育水平和个人收入对自评健康有显著的正效应。受教育程度越高,其汇报“健康”的可能性就越高,假设2a得到验证;个人月收入越高,流动人口的自评健康状况也越好,证实了假设2c。模型6是健康素养模型,即单独估计流动人口的健康素养对其健康状况的效应。结果显示在控制其他变量的情况下,总体健康素养越高,流动人口“健康”的可能性也越高(在0.001的统计水平上显著),假设3a得到了支持。接下来,模型8同时纳入了衡量社会经济地位的受教育水平和个人月收入及总体健康素养来共同分析对流动人口自评健康的影响。可以发现与模型4相比,受教育程度和个人月收入在回归系数和显著性上均发生了变化。“受教育年限”这一变量在模型8中的估计参数下降,且显著性降低(在0.01的统计水平上显著);“个人月收入”虽然在参数显著性上没有变化,但回归系数变小。也就是说,常规的Probit模型显示,社会经济地位部分通过健康素养影响了流动人口的健康状况。
表3 流动人口自评健康状况的Probit模型、IV-Probit模型
为了克服可能存在的内生性问题,我们进一步采用Probit 工具变量法来检验社会经济地位和健康素养对自评健康的影响。模型5使用被访者的出生季度、配偶受教育年限作为本人受教育年限的工具变量,使用所在城市最低工资标准作为本人经济状况的工具变量,共同检验社会经济地位对流动人口健康水平的影响,模型7 使用过去一年接受社区健康教育次数、当前社区开展健康教育方式数作为健康素养的工具变量来考察流动人口的健康素养对其健康状况的效应,模型9是同时纳入受教育水平、个人经济状况及总体健康素养来共同分析对流动人口自评健康影响的工具变量模型。从工具变量检验的相关统计量来看,首先,工具变量和内生变量都在0.001 统计水平上高度相关,第一阶段的F值也都远远超过经验值10;其次,过度识别检验表明所有工具变量都是外生的;再次,沃尔德内生性检验表明常规Probit 模型和IV-Probit 模型之间都存在系统差异,表明个人经济状况、总体健康素养确实是内生变量,应采信IV-Probit模型的结果。
表3 表明IV-Probit 模型估计量和Probit 模型估计量有明显不同①由于文章篇幅限制,我们将表3中的其他控制变量简称为“其他控制变量”,并且在模型中以“是”表示这些变量得到了控制。若读者对详细的回归结果感兴趣,可以联系文章第一作者获取。。模型5 显示社会经济地位对自评健康的影响中,个人经济状况对自评健康有显著影响的正向效应,但是受教育水平对自评健康没有显著正向效应;模型7 显示总体健康素养对自评健康的影响仍然发挥显著的正向影响效应;模型9 则显示在同时纳入受教育水平、个人经济状况和总体健康水平变量后,教育对自评健康的显著正向效应消失了,而经济状况对自评健康的正向效应“再一次”显著,总体健康素养对自评健康的正向显著影响仍然存在。总之,与模型5 相比,“经济状况”这一变量在模型9 中的估计参数上升,显著性提高(在0.001 的统计水平上显著);“健康素养”虽然在参数显著性上有所下降,但回归系数变大,数据支持假设2c 和假设3a。由此可以认为IV-Probit 模型表明经济状况和健康素养对健康结果(自评健康)有直接的影响,受教育年限通过健康素养影响流动人口的健康状况。
本文进一步以流动人口的“慢性病患病数”这一客观生理变量作为测量健康状况的变量。表4汇报了模型分析结果,根据其中的Vuong 统计量和alpha 值可知本文使用零膨胀负二项回归模型优于简单的负二项或泊松回归模型。另外,本文用年龄和流入地所在区域来预测过多零值的概率。模型10、模型13 和模型15 是常规的零膨胀负二项模型。其中,模型10 是仅含社会经济地位和控制变量的基准模型,发现在控制其他变量的情况下,流动人口的教育水平及经济收入与其患慢性疾病数不存在统计上的显著性,即慢性疾病数与受教育程度、经济收入无关,假设2b 与2d 在此未得到验证。根据模型13,在控制其他变量的情况下,提高流动人口的总体健康素养,其患慢性病的风险比会显著下降,即流动人口健康素养的提高有利于减少慢性病患病的可能性,保持较好的生理健康状态,假设3b 得到证实。模型15 是进一步纳入社会经济地位和总体健康素养变量的联合模型,通过与模型13 对照,发现流动人口健康素养与慢性病患病的可能性依旧负向显著。从常规的零膨胀负二项模型来看,可以认为健康素养在一定程度上解释了流动人口群体的社会地位对其健康差异的影响。
表4 中模型11、模型12、模型14 和模型16 为零膨胀负二项工具变量模型(IV-ZINB)的回归结果。在使用工具变量法之前,需要检验模型是否存在内生解释变量。模型11、模型12和模型14分别检验了受教育年限、经济状况和健康素养与慢性病患病数之间的内生性问题。从两步法回归的残差项系数来看,受教育年限和健康素养的残差项回归系数并不显著,表明受教育年限和健康素养变量的内生性问题并不严重,可能的原因有两点:第一,慢性病病程时间长,对人的健康损害相对缓慢,因而不会对流动人口的受教育年限造成严重冲击,比如突然中断学业;第二,由于流动人口的慢性病患病数较少,其产生的压力不一定引起流动人口对健康素养的显著重视。因此,受教育年限和总体健康素养与慢性病患病数之间的关系应采信常规零膨胀负二项的回归结果。而经济状况的残差项回归系数通过了0.05 统计水平的显著性检验,表明个人经济状况确实是内生变量,应采信工具变量的零膨胀负二项的回归结果。模型16 是个人经济状况、总体健康素养与慢性病患病情况的工具变量回归全模型,由于经济状况是内生性变量,所以纳入经济状况估计残差以处理内生性问题。
表4 流动人口慢性病患病情况的ZINB模型、IV-ZINB模型
总体来看,社会经济地位对慢性病患病数没有显著影响,也就是说慢性疾病数与受教育程度、经济收入无关,回归结果不支持假设2b和2d。而总体健康素养对慢性病患病数有显著的积极影响,即流动人口健康素养的提高确实会有利于减少慢性病患病的可能性,假设3b得到数据支持,即是健康素养而不是社会经济地位对流动人口群体的健康差异有显著影响,健康素养是健康不平等的重要介入因素。
3.社会经济地位及政策维度下农民工与流动白领健康素养的影响机制
在确定了流动人口范畴中健康素养是健康不平等的重要介入因素后,我们就可以从细分的角度再观察当下社会经济地位及相关重要政策维度的因素对于流动人口中最主要的两个群体(农民工与流动白领)健康素养因果影响机制的差异化特征。在此,首先考察农民工与流动白领两个群体在社会经济地位、健康素养及政策维度的本地健康档案建立层面的描述特征与组间差异。从表5 可以看到流动白领的受教育年限、健康素养及本地健康档案建立均显著高于农民工群体,而在经济收入层面,虽然流动白领的均值高于农民工的均值,但是其没有统计显著性。考虑表5 的刻画是没有控制其他变量的情况,那么,如果控制了其他因素,是否有所不同?为此,我们需要进行进一步的回归处理。
表5 比较视野下的农民工与流动白领的社会经济地位及健康素养差异
表6 中模型17 与模型20 仅纳入了受教育年限和个人经济状况这两个核心变量,在未控制其他变量的情况下,流动白领与农民工的受教育年限越多,其总体健康素养越好。个人经济状况只对农民工的健康素养有显著影响,个人经济状况越好,其总体健康素养得分也越高。进一步地,模型18与模型21 在模型17 与模型20 的基础上控制了年龄、年龄平方、性别、婚姻、户口、流动特征等变量,结果显示受教育年限对流动白领与农民工的健康素养依然有显著且稳定的影响效应。具体来说,在控制相关变量后,流动白领受教育年限每增加1年,其总体健康素养得分就提高1.586分(在0.001统计水平上显著)。农民工受教育年限每增加1年,其总体健康素养得分就提高1.360分(在0.001统计水平上显著)。经济状况依旧只对农民工的总体健康素养有显著影响。
表6 比较视野下的农民工与流动白领的健康素养MLR模型、IV-2SLS模型
进一步,从模型19与模型22的结果可以发现:第一,在IV-2SLS的第一阶段回归中,配偶教育年限、受访者出生季度与受访者的受教育年限,城市最低工资标准与受访者的经济状况都足够相关,且F值都远远大于经验标准值10;第二,过度识别检验显示这三个工具变量是外生的,与扰动项不相关;第三,DWH 内生性检验显示受访者的教育年限、经济状况确实是内生变量。这些统计量表明有必要放弃常规的MLR 模型而采信IV-2SLS 模型的结果。模型19 与模型22 的IV-2SLS 回归结果显示,受教育年限确实对流动白领与农民工总的健康素养都有显著的正向影响,但个人经济状况依旧只对农民工的健康素养有积极影响。由此,研究假设4a 与4b 得到验证。我们还认为在异质化的流动人口群体中,无论是流动白领还是农民工,同经济水平(控制经济状况变量)的个体其受教育年限越多,健康素养越好,可见,教育是健康素养最稳定的预测器。而同教育年限(控制教育年限变量)的流动白领其经济状况对健康素养并无显著影响,与之相对,同教育年限(控制教育年限变量)的农民工其经济状况对健康素养有着显著正向影响。结合回归分析中我们进一步发现的政策维度的“本地健康建档”变量只对农民工的健康素养有积极的影响,研究假设4d得到验证。
五、结论与讨论
流动时代的中国,我们在“健康中国2030”的背景下探索在健康层面存在诸多不平等的流动人口的健康议题极具时代意义与政策含义。[32]在健康主观自我感知的维度,本文基于工具变量(IV-Probit)回归得到的稳健结果显示经济状况和健康素养对健康结果(自评健康)有直接的影响,受教育年限通过健康素养影响流动人口的健康状况;在以慢性病患病情况为健康客观表征刻画的情境下,我们的研究发现是健康素养而不是社会经济地位对流动人口群体的健康差异产生显著影响。这就相应地说明就大多数流动人口而言,较好的健康素养意味着掌握了一种有利于健康的优势资源,由此能够减少流动经历与流动环境所带来的健康损耗,维持或提高健康水平。本文契合于“健康中国2030”战略、流动人口健康服务均等化建设的社会大背景,在理论向度上验证了提高流动人口健康素养对减少他们流动经历中的健康损耗、维持或提高他们健康水平的重要性和关键性。我们发现流动人口自身所处的社会经济地位(主要是以其中的教育程度来呈现的社会经济地位)通过健康素养差异来进一步影响其健康水平,即健康素养是理解社会结构与健康不平等之间的一个重要因果机制。
流动时代的中国,作为其中重点人群的流动人口的健康问题(无论是生理健康还是心理健康)非常关键,而提升其健康福祉,强化其健康素养是最为有效的路径。我们的研究发现流动人口健康素养并未达到中国健康教育中心规定的基本线,这说明在国家倡导的“提升健康素养作为增进全民健康的前提”这一战略框架内,必须要纳入对于流动人口的关照。总体看来,如我们的工具变量(IV-2SLS)回归得到的稳健结果显示以教育为特征的社会经济地位有着显著的正向效应。进一步,在结构的视角下,我们基于对流动人口中核心的流动白领与农民工群体的分析看来,教育对于两个群体的健康素养均有一致的积极影响,知识(教育)是一种重要的个人资源,高学历者在获取、使用和评判健康信息的能力上更加突出,能更为有效地使用卫生系统,从而在医学环境和社会生活中更好地做出健康决策。[5]这一点在一定程度上反映了“资源强化”效应,即拥有优势资源与机会的人们更有可能获得健康资源,拥有更好的健康素养。政府在介入政策设计与推行之时,理应更多关注流动人口的教育提升的可能性,通过相应的专题教育或是培训(这样的教育或是培训可以嵌套于社区中进行),辅助他们提升其使用和评判健康信息的能力,有效地使用卫生系统,从而在医学环境和社会生活中更好地做出健康决策。而社会经济地位中的收入只对流动人口中的农民工有显著的积极影响,这说明对于社会经济地位视角下的提升流动人口健康素养的介入途径,除了在教育维度入手,强化其对于健康信息与资源的触及之外,对流动人口中相对流动白领处于弱势地位的农民工群体而言,强化其收入保障也应是关切之道。考虑回归分析中进一步发现的政策维度的“本地健康建档”变量只对农民工的健康素养有积极的影响,我们认为政府在介入政策设计与推行之时,还应该更多关注流动人口中的农民工群体,在城市里进一步推动为作为常住人口的农民工建立个人健康档案的工作。
当然,本文也存在一些不足。其一,针对“健康素养”这一变量的测量,本文主要采用和官方一致的《中国居民健康素养问卷》。虽然这套本土问卷经由众多专家和学者们的多次讨论,可以认为其中的问题和量表设计是中国当前较为权威和合适的测量方式。但根据“健康素养”的内涵来看,这一测量显然存在缺陷,其更多的偏向于健康认知和健康知识层面,而对实际的健康行为和能力的观测不足。其二,在数据层面上,由于使用的问卷未涉及相关的心理健康问题,针对流动人口健康状况中的心理健康维度不能进行考察,而这一点在流动人口的健康研究中却是非常关键的。其三,CMDS 涉及健康素养的调查只针对流动人口,并未纳入对于可作为参照群体的当地户籍人口的调查,这使得我们不能开展流动人口与户籍人口比较视野下的健康研究。我们在未来获取新的更全面的适宜数据时,会对这些问题进行进一步的思考和改进,并相应地开展更深入的研究。