健康风险对家庭教育支出的影响
2024-01-12张乾
张乾
摘要:文章基于2019年中国家庭金融调查(CHFS)数据,用工具变量法和处理效应模型对健康风险与家庭教育支出的关系进行实证研究。研究发现,家庭健康风险的增加,会显著减少家庭的教育支出;家庭健康风险对不同类型家庭的抑制作用存在差异,非农业户口的户主家庭受到健康风险增加的影响更加明显;家庭健康风险增加对家庭总收入有明显的抑制作用,该作用对户主为农业户口的家庭的影响更加明显。
关键词:健康风险;家庭教育支出;工具变量;处理效应
一、引言
防止“因病致貧,因病返贫”是当前脱贫攻坚和巩固脱贫成果的重点问题。在习近平主席的《在决战决胜脱贫攻坚座谈会上的讲话》里指出,“已脱贫人口中有近200万人存在返贫风险”。而导致返贫的原因中,家庭成员因病无法工作并占用大量家庭支出是一个重要原因。家庭成员出现健康问题时,会面临家庭劳动力减少和家庭医疗支出的增加的问题。对于家庭成员遭遇重大疾病的家庭来说,需要承担不低的医疗支出费用,健康风险增加必然会对家庭的消费支出造成影响。同时,健康风险冲击也会对家庭成员的劳动参与率和收入水平产生影响,健康人力资本减少,间接减少家庭收入和挤占家庭其他的消费,有可能导致家庭缩减对子女教育、成人高等教育和职业技能培训的支出(李昊和张昭, 2020),影响家庭的人力资本积累,使得本就因病陷入贫困的家庭更加难以摆脱贫困,最终导致长期贫困。
本文将利用中国家庭金融调查(CHFS)2019年数据,对健康风险与家庭教育支出的关系进行实证研究。与现有研究相比,本文存在以下可能的创新之处:参照岳崴等(2021)的家庭健康风险定义,以“家庭自评不健康人数”度量健康风险,区别于李昊和张昭(2020)的以“是否住院”度量的方式。在实证策略方面,选用工具变量法及处理效应模型处理健康风险可能会存在的内生性问题。
二、文献综述
已有文献里对家庭教育消费影响因素的研究,主要分为家庭特征、家长特征和子女特征三类。家庭特征包括家庭收入、家庭人数、家庭年龄结构等等,李文利(2006)发现高等收入群体与低收入群体教育必需支出上的差距并不大,而选择性支出方面有比较明显的差别,比如课外辅导教育。一般来说,高收入家庭对未成年子女的教育支出更高。家长特征目前大部分学者都主要探究了家长的受教育程度对家庭教育消费水平的影响,Silova(2010)关于东欧与中亚家庭教育的研究中指出高学历的父母更愿意在孩子的教育上投入更多。子女特征方面,相关研究一般从两个方向上切入,一个是孩子性别和数量,另一个是期望孩子的受教育程度,对于前者,吴强(2020)的研究中发现如果家庭收入上升,则家庭教育消费水平在孩子性别上的差异会明显缩小;对于后者,李佳丽等(2016)发现父母对子女的教育期望会增加子女的教育支出。
关于健康风险与家庭教育支出的关系,目前直接探索这两者关系的文献较少。已有文献发现健康风险会对家庭经济状况产生影响,进而影响家庭的支出决策。廖宇航(2019)认为,健康风险对家庭影响有两部分,其一是给家庭带来额外经济负担,这直接作用于家庭经济决策;其二是健康风险还能影响家庭的劳动力数量,通过影响家庭可支配收入,最终对家庭经济决策产生影响。岳崴等(2021)发现健康风险会显著增加家庭的财务脆弱性,制约家庭的财务自由。李昊和张昭(2020)采用倾向得分匹配和双重差分(PSM-DID)以及三重差分(PSM-DDD)相结合的方法检验了健康冲击会显著挤出家庭教育支出。
综上所述,除了家庭特征、家长特征和子女特征等以外,还有其他可能的经济因素影响着家庭教育支出,比如家庭健康风险情况。然而已有文献关于健康风险对家庭教育支出的讨论较少,也缺乏对相关影响机制的系统分析。因此本文利用2019年的中国家庭金融调查数据(CHFS),研究家庭健康风险对家庭教育支出的影响,并探索可能的影响机制。
三、研究假说
健康风险对家庭教育支出的影响有两个方面。一方面,家庭成员出现健康问题时,会面临家庭医疗支出的增加,除去医疗保险等报销以外,还有相当一部分的医疗支出由居民自己负担,所以健康风险必然会影响家庭的经济决策(李昊和张昭, 2020),健康风险增加导致的医疗支出增加,可能间接挤出家庭其他方面的消费,甚至缩减家庭对教育的投入,对家庭教育投资产生不利影响。据此,提出第一个假说。
假说1:家庭健康风险增加会抑制家庭的教育支出。
另一方面,家庭健康人力资本的减少,也会进一步降低患病者个人以及家庭成员劳动力的参与率,患病个人无法正常参与工作,家庭成员需要照顾患病个体而减少正常工作时间,最终使得家庭收入水平降低,间接影响家庭的教育投资。因此,提出第二个假说。
假说2:家庭健康风险会降低家庭的收入,间接影响家庭的教育投资。
四、模型与变量
(一)模型设定
本文将实证研究家庭的健康风险对家庭教育支出的影响,设定如下计量模型
eduspendingi=β1healthriski+γXi+εi
其中,eduspendingi被解释变量表示第i个家庭在2019年的家庭教育支出。核心解释变量为家庭面临的健康风险healthriski。Xi是一系列控制变量,包括户主和家庭特征变量。εi是误差项。
(二)变量说明
1. 被解释变量
本文的被解释变量是家庭教育支出,它是指过去12个月中,家庭在教育培训上支出的总金额,包括小孩上早教班、幼儿园、大中小学的学费、教材、学习用品和器材费、出国留学费用以及成人高等教育、职业技能培训等。本文选取问卷中“去年受访户教育培训支出”来度量家庭的教育支出,并取对数。
2. 核心解释变量
本文的核心解释变量为健康风险。目前关于健康风险的度量方式,现有论文一般采用健康状况变化来度量,分为客观状况和主观感受两种,两者均蕴含了健康风险相关信息(岳葳等 2021)。客观状况方面,李昊(2020)的研究以“是否住院”的指标去度量家庭健康风险,可归为客观状况角度。而岳葳(2021)则以“家庭自评身体状态差的人数”度量家庭健康风险,属于主观感受方面,本文也将参照此方式去度量家庭健康风险。健康状态越差,健康风险越大,参照岳崴(2021),為度量家庭健康风险程度,本文以“家庭自评身体状态差”的人数作为指标。身体健康状态从“非常好”到“非常不好”共划分五个等级,本文将最后两个等级“不好”和“非常不好”归类为身体状态差。
3. 控制变量
关于控制变量,本文以家庭特征和家庭户主特征作为控制变量。本文回归使用的主要变量的计算见表1。
(三)数据来源及描述性统计
本文所用数据来自2019年的 “中国家庭金融调查”(CHFS)项目,其数据样本地区包括全国29个省份,具体包含中国家庭和个人的金融资产、社会保障与保险、收入消费、人口特征等方面的数据。本文去除“不知道”和少部分缺失样本,最终获得31283份样本。主要变量的统计性描述见表2。
五、实证分析
(一)OLS回归结果
通过OLS模型对家庭健康风险与家庭教育支出的关系进行实证检验,见表3(1)至(2)列。表中healthrisk行的系数代表了对假说1的验证。结果显示,家庭身体状态差人数对家庭教育支出存在显著的正向影响,系数均为负且显著,在加入控制变量和地区效应后系数变小,但仍在1%的水平下显著。这意味着家庭健康风险会降低家庭的教育支出。
本文以(2)列的OLS回归结果为例,来说明系数的经济含义。(2)列中的healthrisk的系数表示,在其他条件不变的情况下,家庭不健康人数增加1人,家庭的教育支出会减少19.63%,并且在1%水平下显著,验证了假说1:家庭健康风险增加会抑制家庭教育支出。
(二)工具变量法处理反向因果和遗漏变量导致的内生性问题
核心解释变量健康风险可能由于反向因果和遗漏变量而产生内生性问题。此处参照岳葳等(2021),本文选取家庭平均年龄为工具变量。选取的工具变量必须满足相关性和外生性,相关性是指内生变量与工具变量必须具有足够的相关性,外生性是指工具变量仅能通过内生变量来影响被解释变量。对于相关性,家庭平均年龄与健康风险存在明显的相关关系,家庭平均年龄越大,家庭老人的占比越高,家庭所面临的健康风险也变得越来越大。对于外生性,家庭平均年龄变化是生命自然规律,具有较强的外生性。因此本文将计算家庭的平均年龄avage,选择家庭平均年龄“avage”为工具变量。相关检验结果见表4的(1)列。
如表4的(1)列所示,Wu-Hausman检验在1%水平上拒绝了变量healthrisk为外生变量的原假设。第一阶段估计的F值对应的p值为0.0000,家庭平均年龄对healthrisk的系数为0.0067,在1%水平下显著为正,以上结果说明工具变量和解释变量的具有强相关性。而关于弱工具变量检验,Cragg-Donald Wald F检验和Kleibergen-Paap Wald rk F检验的值分别为257.725和206.763,由此可以看出不存在弱工具变量问题。根据表4(1)列的结果可知,核心解释变量healthrisk的系数仍然为负,且至少在1%的水平下显著。
(三)处理效应模型应对样本自选择导致的内生性问题
本文模型中也可能存在自选择问题,将进一步使用处理效应模型。由于处理效应模型要求解释变量为0~1离散变量,因而将解释变量改为家庭是否有身体不健康成员的0~1离散变量进行估计(有=1,没有=0)。处理效应模型两步法的第一步估计是否有身体不健康成员的影响因素,且要求至少存在一个外生变量,在此使用前文的工具变量——家庭平均年龄,第二步估计是否有不健康成员对家庭教育支出的影响。表5为模型结果,可见变量healthrisk对家庭教育支出的估计系数在1%水平下显著。综上,本文使用处理效应模型解决潜在的自选择问题后结论仍然成立。
(四)户口的异质性分析
考虑户口可能的异质性影响,以家庭户主的户口类型为基准,分别对农业户口样本和非农业户口样本做回归分析,结果见表4(2)和(3)列。可以看出,无论农业户口样本和非农业户口样本,家庭身体状态差人数对家庭教育支出的影响均显著为负,且非农业户口对应的影响系数的绝对值比农业户口的更高。非农业户口中大部分为城镇户口,这表明城镇家庭的教育支出对健康风险的敏感性更高。造成这一现象的可能原因是收入水平较低抑制了农业家庭的教育支出,农业家庭的校外支出相较于城镇家庭的校外支出少,因此家庭健康风险对农业家庭的教育支出影响相对较小。
(五)稳健性检验
表3的(3)至(5)列对核心解释变量进行了更换,以家庭不健康人数比例(家庭不健康人数÷家庭总人数)来度量家庭健康风险,记为“r_unhealth”。表中的估计结果显示,家庭不健康人数比例对家庭的教育支出仍存在显著的负向关系,这表明健康风险与家庭教育支出的关系较为稳健。
(六)机制检验
根据前文的理论分析,家庭健康风险可能通过影响劳动参与率,进而通过影响家庭总收入,间接减少家庭收入和挤出家庭在其他方面的消费,甚至缩减家庭对子女教育和成人高等教育、职业技能培训的支出。表6给出了家庭健康风险对家庭总收入影响的检验结果,针对健康风险对家庭教育支出的影响机制进行验证。表6结果显示,家庭健康风险对家庭总收入存在显著的负向影响,显著性水平为1%。这验证了假说2:健康风险会显著降低家庭总收入。
同时,对比(4)、(6)列的结果,可以看出,户主为农业户口的家庭,家庭健康风险对家庭收入的影响系数的绝对值要大于户主为非农业户口的家庭。这说明健康风险的增加会使家庭收入显著减少,而且对农业户口的家庭来说,这种影响会更加明显。
六、结论和建议
本文利用中国家庭金融调查(CHFS)2019年数据,对健康风险与家庭教育支出的关系进行实证研究。研究发现,第一,家庭健康风险的增加,会显著减少家庭的教育支出,考虑模型内生性和稳健性后,结果不变。第二,家庭健康风险增加对不同类型家庭的教育支出的抑制作用存在差异,非农业户口的户主家庭受到健康风险增加的影响更加明显。造成这一现象的可能原因是收入水平较低抑制了农业家庭的教育支出,农业家庭的教育支出相较于非农业家庭的教育支出少,因此家庭健康风险对农村家庭的教育支出影响相对较小。第三,家庭健康风险增加对家庭总收入有明显的抑制作用,由于家庭户口差异,该作用对户主为农业户口的家庭的影响更加明显。
上述发现说明,家庭的健康风险增加会抑制其教育支出,影响家庭的受教育水平。一方面,家庭成员出现健康问题会增加医疗支出,挤出家庭对教育的投入。另一方面,家庭健康人力资本的减少也使得家庭的劳动力参与率降低,最终使得家庭收入水平降低,间接影响了家庭的教育投资。而且,健康风险升高,不仅造成了家庭当前的收入水平降低,且由于对子女及自身的教育投入的减少,不利于家庭人力资本积累,最终形成恶性循环。这种由健康风险增加引起的家庭教育投入减少现象如果持续扩大,最终会使家庭陷入长期的低收入甚至是贫困状态,加大了低收入家庭长期陷入贫困的风险。
基于此,本文提出以下建议:
第一,促进教育公平。确保教育资源公平分配以及优质教育的普及,减少贫富家庭的教育差距,让低收入家庭的子女也有机会获得足够的教育,保障家庭人力资本积累。
第二,完善城乡居民的医疗保险制度。现行的医保制度下,居民自己承担的医疗费用仍然较高,要积极推进医疗保险制度的改革,提高医疗保险报销比例,尽可能缓解健康问题对家庭教育投入的挤出效应。
第三,优化劳动者的健康保障制度。要负责劳动者在休假治疗期间的收入保障,在特定情况下提供物资和资金帮助,缓解由于劳动参与率下降造成的家庭收入减少,保障家庭的教育投入。
参考文献:
[1]李昊,张昭.健康冲击对家庭教育投资影响的实证分析[J].统计与决策,2020,36(24):65-69.
[2]岳崴,王雄,张强.健康风险、医疗保险与家庭财务脆弱性[J].中国工业经济,2021(10):175-192.
[3]李文利.高等教育私人支出、家庭贡献与资助需求分析[J].教育与经济,2006(01):14-17.
[4]Silova I.Private tutoring in Eastern Europe and Central Asia:policy choices and implications[J].Compare:A Journal of Comparative and International Education,2010,40(03).
[5]吴强.家庭的收入和特征对家庭教育支出的影响研究[J].华中师范大学学报(人文社会科学版),2020,59(05):175-186.
[6]李佳丽,胡咏梅,范文凤.家庭背景、影子教育和学生学业成绩——基于Wisconsin模型的经验研究[J].教育经济评论, 2016,1(01):70-89.
[7]廖宇航.健康風险冲击对劳动参与的影响——一个反事实的因果分析[J].人口与经济,2019(04):30-46.
(作者单位:广东外语外贸大学数学与统计学院)