APP下载

家庭托育需求测度及其影响因素研究*
——基于自动机器学习算法

2022-07-05王雅楠高传胜刘竞龙

社会保障研究 2022年2期
关键词:托育特征值家庭

王雅楠 高传胜 刘竞龙

(1 南京大学政府管理学院,江苏 南京,210023;2 加泰罗尼亚理工大学信号理论与通信学院,西班牙 巴塞罗那,08028)

一、问题的提出

近年来,我国人口出生率和总和生育率持续走低。国家统计局的数据显示,中国的人口出生率连续5年下跌,由2016年的13.57‰降至2021年的7.52‰。结合第七次全国人口普查数据,2020年中国的总和生育率仅为1.3[1]。这意味着,中国已经进入人口出生率低于11‰、总和生育率低于1.5的“超少子化”阶段[2]。与此同时,中国人口老龄化程度持续深化,到2021年65岁及以上人口占总人口的比重已达到14.2%[3]。为了应对人口老龄化和超少子化叠加的双重压力,我国进一步放开生育政策,在2021年正式实施一对夫妻可以生育三个子女的政策(简称“三孩政策”)及相关配套支持措施[4]。

国际上生育率水平较低的国家和地区大多通过提供时间支持(带薪产假、育儿假等)、经济支持(儿童津贴、税收减免等)、服务支持与就业支持(累积休假制度、弹性工作时间等)等方面的政策措施,为家庭提供综合性、多样化的育儿支持。虽然各国的家庭政策在支持力度与具体方式上有所差异,但均较为重视促进托育服务有效供给[5]。已有研究表明,托育服务有效供给更能对生育产生积极影响,其中包括提高生育率、降低女性的初育年龄等[6][7]。正因如此,发展托育服务也成为促进我国人口长期均衡发展的重要举措。2019年以来,国家陆续出台了多项促进婴幼儿照护服务、托育服务发展的相关政策,例如,国务院办公厅于2019年发布的《关于促进3岁以下婴幼儿照护服务发展的指导意见》、于2020年发布的《关于促进养老托育服务健康发展的意见》,国家发展和改革委员会、国家卫生健康委员会于2019年发布的《支持社会力量发展普惠托育服务专项行动实施方案(试行)》、国家发展和改革委员会于2021年发布的《“十四五”积极应对人口老龄化工程和托育建设实施方案》,以及2021年发布的《中共中央 国务院关于优化生育政策促进人口长期均衡发展的决定》。由此可见,在新发展阶段和新的人口形势下,托育服务供给侧结构性改革已经得到了党和政府的高度重视。

推进托育服务供给侧结构性改革,不仅要求扩大托育服务的供给规模、保证供给质量,还要求增强供给结构对需求变化的适应性与灵活性。受到家庭收入水平、父母受教育程度、隔代照顾、对托育服务的认可程度等多方面因素的影响,托育需求呈多样化、复杂性的特征,这要求管理者在改革之初尽量规避服务供给过程中因需求识别缺位、错位而陷入供给困境。质言之,在提供托育服务时必须要考虑需求侧,研究家庭的托育需求是推进托育服务供给侧结构性改革的逻辑起点。那么,如何精准把握托育需求水平?托育需求又受到哪些因素影响?政府又该如何有效回应托育需求?本文将对这些问题展开探讨。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》(以下简称“十四五”规划)在第四十五章“实施积极应对人口老龄化国家战略”中,明确指出要“健全支持婴幼儿照护服务和早期发展的政策体系”[8]。这意味着,“十四五”时期不仅是全面建成小康社会和开启全面建设社会主义现代化国家新征程的历史交汇期,还是托育服务事业规范发展的关键期。面对新形势、新使命,精准把握家庭的托育需求,对于推动我国托育服务有效供给具有重要的现实意义。

二、文献回顾

国内外已有文献主要从以下几个维度研究托育需求:其一,侧重于探讨家庭背景对托育需求的影响,即主要考察父母的年龄、受教育程度、工作类型以及家庭收入水平等因素与托育需求之间的关系。多项研究表明,家庭收入水平越高或者父母受教育年限越长,越倾向于通过托育服务对子女进行投资[9-12]。进一步地,国内学者在单独考察父母的社会经济特征时发现,父亲的收入水平和受教育程度以及母亲的年龄和收入水平,均与托育需求呈正相关,而母亲受教育程度越高,越倾向于选择家庭照顾[13]。也有研究重点考察了工作类型对托育需求的影响,结果显示,双职工家庭更偏好让子女入托,尤其是当母亲从事全职工作时,托育需求显著提高[14-15]。其二,侧重于考察托育服务属性与托育需求之间的关系。国外学者主要从托育服务的可获得性(Availability)、可及性(Accessibility)、可负担性(Affordability)以及质量(Quality)四个维度出发,探讨托育服务的价格、质量以及托育机构的地理位置等因素对托育需求的影响[16]。近年来,国内学术界也逐渐关注家庭对托育服务的需求偏好,如基于选择实验法(Choice Experiment)的两项研究表明,家庭的托育需求呈现出“安全为重,保教融合,普惠可及”的偏好特征[17],此外,家长更青睐公办机构、有早教师资以及送托距离合适的机构[18]。其三,侧重考察社会支持网络对托育需求的影响。一方面,在预期寿命提高、生育率降低的影响下,隔代照顾在一定程度上缓解了年轻父母的育儿压力,降低了家庭的托育需求[19-20]。另一方面,社区支持也会影响托育需求,如社区对家庭育儿的物质环境支持、教育支持、娱乐设施支持程度越高,家庭托育需求越低[21]。

综合而言,国内学界对托育服务的研究尚处在起步阶段,对于微观层面的托育需求关注不多,缺乏对托育服务供给侧结构性改革的经验证据。首先,现有对托育需求的少量定量研究均建立在传统计量模型的基础上。然而,一方面,传统计量模型在纳入多项解释变量时,拟合精度会显著下降,一定程度上制约了变量的选取。这类研究多从单一维度出发,仅关注家庭背景或者托育服务属性对托育需求的影响,缺乏对影响因素的归纳梳理与系统把握。也有学者尝试将父母特征、婴幼儿结构、社区特征等多方面的影响因素纳入Logit回归模型中,但拟合优度仅接近50%,模型的可解释力一般[22]。另一方面,既有对于托育需求的量化研究,存在的核心问题仍然是用简单的线性关系来应对复杂的需求变化,难以深入地考察解释变量之间、解释变量与被解释变量之间复杂的关系。其次,现有相关文献多以大城市为研究区域来测度家庭的托育需求水平与影响因素,相关结论无法直接被推广到普通地级市中。托育需求水平(每千人口所需的托位数)不仅受到家庭收入水平、父母受教育程度等微观因素的影响,还与地区经济发展水平、城市规模、人口结构、人口出生率等宏观因素密切相关[23-25]。由于大城市与普通地级市在城市规模、经济发展水平等方面存在显著差距,托育需求必然也存在差异,而相关研究缺乏对普通地级市托育需求的关注。

基于此,本研究着眼于测度普通地级市的一般托育需求水平,将最新的自动机器学习算法(AutoGluon)引入到托育需求的影响因素分析中。与以往文献相比,本研究的边际贡献在于:首先,将AutoGluon从计算机领域引入到托育需求的研究中,拓展了传统议题的研究方法,为机器学习方法在公共管理领域的应用提供了实践案例。其次,借助机器学习算法,通过尽可能多地引入特征值(解释变量),避免了传统计量模型处理复杂变量导致的精度下降问题以及遗漏变量导致的内生性问题。最后,从传统实证的有监督学习转换到机器学习的无监督学习,突破了传统计量模型无法准确描述复杂社会系统动态变化的瓶颈,准确测度了主要影响因素与托育需求的非线性关系,有助于地方政府更精准地把握家庭的托育需求,进而推动托育服务有效供给。

三、研究技术与研究区域

(一)研究技术

在分析社会问题时,根据研究问题和目的的不同,往往需要选择不同的研究方法。本研究关注的是托育需求水平及其影响因素,属于分类研究,传统的计量模型与随机森林模型(Random Forest)、神经网络、XGBoost、LightGBM等机器学习算法均可以用于解决此类问题。本研究选取AutoGluon作为研究技术,原因有两点:一方面,相较于传统计量模型,机器学习算法允许特征值数量大于观测值数量,通过尽可能多地引入特征值,更好地解决遗漏变量导致的估计偏误,并获取预测精度更高的模型;另一方面,相较于其他机器学习算法,AutoGluon通过一定的策略建立了方法集成,不仅能够得到拟合效果更好、精度更高的预测模型,而且无须反复调整参数,降低了非专业人士的使用难度,有利于推动机器学习在各个学科中的运用[26]。

具体来看,AutoGluon主要有三大运算策略。一是多模型组合(Multi-Layer Stack Ensembing)。AutoGluon不仅嵌套了随机森林模型(Random Forest)、深度神经网络(Deep Neutral Networks)、LightGBM等主流的机器学习算法,还纳入了YOLOV、BERT等深度学习算法。在融合多种算法的基础上,AutoGluon建立了自己的运算策略,并进一步实现了自动超参数调整、模型选择、架构搜索等优化功能。二是k-折交叉验证(Repeated k-fold Bagging)。k-折交叉验证可以确保嵌入的子模型都能调用完整的数据集,并且能够对所有子模型的训练结果进行重新计算,实现再拟合。三是改进的神经网络架构。神经网络是AutoGluon的基础,也是其最主要的应用方式。然而,单一的神经网络有可能出现过度拟合、欠拟合等问题,导致精度降低[27]。为此,AutoGluon采用了改进的神经网络架构,并在训练过程中增加了Dropout和BatchNorm等测量,从而提高了模型的泛化性。

(二)研究区域

本研究选取江苏省徐州市作为主要的实验区域,测度家庭的托育需求水平与影响因素。从微观层面来看,已有研究表明,家庭收入水平、父母受教育程度等是影响托育需求的关键因素。从宏观层面来看,城市的人口出生率、城市规模、经济发展水平等也会显著影响整体的托育需求水平(每千人口所需的托位数)。因而,本文从人口出生率、城市规模、经济发展水平、平均受教育年限等多个方面综合衡量徐州市的代表性。其中,人口出生率的数据来源于《徐州统计年鉴2021》[28]《中国统计年鉴2021》[29],城市规模的数据来源于《中国城市建设统计年鉴2020》[30],人均GDP、居民可支配收入、平均受教育年限的数据来源于《江苏统计年鉴2021》[31]《中国统计年鉴2021》[32]。从人口出生率来看, 2020年全国人口出生率为8.52‰,徐州市人口出生率为7.10‰,在全国范围内处于中低水平。从城市规模来看,2019年徐州市城区常住人口数量为196.57万人,在297个城市中(4个直辖市和293个地级市)位列第35,属于Ⅱ型大城市(1)分类标准见《国务院关于调整城市规模划分标准的通知》(国发〔2014〕51号),以城区常住人口为统计口径,可以将城市划分为五类七档:城区常住人口超过1000万的城市为超大城市;城区常住人口为500以上1000万以下的城市为特大城市;城区常住人口为100万以上500万以下的城市为大城市,其中,300万以上500万以下的城市为Ⅰ型大城市,100万以上300万以下的城市为Ⅱ型大城市;城区常住人口为50万以上100万以下的城市为中等城市;城市常住人口50万以下的城市为小城市,其中,20万以上50万以下的城市为Ⅰ型小城市,20万以下的城市为Ⅱ型小城市。。从经济发展水平来看,2020年徐州市人均GDP为80673元,比同年全国人均GDP 高出12.04%,处于中等偏上水平。进一步地,从居民人均可支配收入来看,2020年徐州居民人均可支配收入为29376元,比同年全国居民人均可支配收入低8.73%,处于中等偏下水平。从平均受教育年限来看,2020年徐州常住人口中15岁及以上人口的平均受教育年限为9.68年,略低于同年全国平均水平9.91年,人力资本存量处于中等偏下水平。

一方面,在人口出生率、城市规模、经济发展水平等因素的作用下,徐州市的客观托育需求总量(每千人口所需的托位数)应在全国范围内处于中等偏上水平。另一方面,在居民人均可支配收入与平均受教育年限的影响下,该市居民对托育服务的可负担水平与接纳程度在全国范围内处于中等偏低水平。综合而言,在上述因素的综合作用下,徐州市反映了我国城市托育需求的中等水平。因而,本研究选取徐州市为实验区域,旨在刻画当前普通地级市的一般托育需求水平与影响因素,为与徐州在城市规模、经济发展水平等方面特征相似的同类地级市提供有价值的政策建议。

四、数据来源与实验过程

(一)数据来源与数据处理

本研究所使用的数据来自课题组于2021年9月在江苏省徐州市进行的多阶段随机抽样调查。调查对象设定为年龄在20~49岁的已婚女性或男性。为有效筛选出调查对象,课题组联系每个区的托育园、幼儿园配合调研,最终发放问卷1800份,回收有效问卷1601份,回收率为89.44%。其中,各区所下发的问卷数量,主要是依据《徐州市第七次全国人口普查公报》公布的各区0~14岁儿童占总人口的比重进行测算确定[33],最终在铜山区、泉山区、贾汪区、云龙区、经济技术开发区与鼓楼区下发的问卷数量依次为684份、252份、252份、234份、216份、162份。调查内容主要包括四个部分:第一部分是受访者个人及家庭背景,主要包括受访者及其配偶的年龄、受教育程度、收入水平、工作类型,以及婴幼儿的年龄、数量;第二部分是家庭的育儿现状与潜在托育需求,主要包括3岁以下婴幼儿的主要照料者、照料强度、养育模式、对科学育儿知识的了解程度等;第三部分是社会支持网络,既包括社区育儿支持,如娱乐设施、卫生保健、父母讲座等,又包括隔代照顾,如祖辈的年龄、受教育程度等;第四部分是选择偏好,主要考察家庭成员对托育服务的态度,如对托育服务平衡工作与生活功能的认可程度、对托育服务促进早期人力资本积累功能的认可程度等。

具体的数据处理与实验流程如下。首先,对调研信息进行预处理,即进行数据清理和数据编码。其中,数据清理主要是为了减少模型训练中的噪声与异常值,具体地,借助Python库的热力图来观察各个特征值与目标值之间的相关性,去除与目标值相关性特别低的特征值。数据编码的主要目的是将文字语言转化为机器可以识别的语言,本文中,除了职业类型编码为分类变量外,其余特征值的编码均为数值型,空值则用NaN替代。其次,进行模型训练。为确保模型的有效性、提高预测精度,AutoGluon在训练过程中增加了Stack次数、k-折交叉验证的n和k、训练时间等参数,并确保参数的随机迭代。每次训练完成后均会进行精度判断,若满足阈值则输出模型,不满足阈值则继续迭代。最后,模型应用,即解译模型。主要是借助训练后的模型,分析不同特征值对托育需求的影响程度(特征值重要性排序)、单一特征值与托育需求的关系、多特征值与托育需求之间的关系,进而测度地区总体的托育需求水平(每千人口所需的托位数),从而更精确地把握家庭的托育需求,并为政策制定者支持托育服务发展提供重要的决策依据。

(二)特征值评价与模型精度

1.特征值重要性的评价结果

根据机器学习迭代结果,最终保留24个特征值参与模型训练,编码方法与编码结果见表1。其中,目标值(target)为问卷中“若(再)生育,您打算由谁来照顾3岁以下婴幼儿”,0记为家庭照顾,1记为托儿所,其余23个特征值为年龄(age)、母亲受教育程度(m-edu)、母亲月收入水平(m-income)、父亲月收入水平(f-income)等。由于母亲的工作类型为分类变量,无法用单一特征值进行表示,因而,本研究将母亲的工作类型进行逐一编码。表1展示了主要特征值的重要性排序,重要性程度越高,对被解释变量的解释力越强。由表1可知,母亲的年龄是影响托育需求的最重要特征,母亲收入水平次之,再次为对托育服务促进早期人力资本积累功能的认可度、父亲受教育程度、对托育服务平衡工作与生活功能的认可度等,下文会着重分析几个重要的单一特征值与多特征值对家庭托育需求的影响。

表1 特征值的编码方法与重要性排序

(续表1)

值得注意的是,虽然母亲的工作类型的重要性程度总体不高,如特征值m-job_gtjy的重要性仅排在第16位,但不同工作类型对托育需求的影响程度却显著不同。其中,当母亲从事个体经营工作或中断就业时,对托育需求的解释力更强;而当母亲就职于政府部门、企事业单位或者从未就业时,几乎不会对托育需求产生影响。可能的解释是,从事个体经营工作的母亲无法享受法定产假与哺乳假,且因生育选择中断就业可能会给母亲带来较高的机会成本,在此情形下,这类母亲群体对托育服务的需求更为强烈。而就职于政府部门、企事业单位的母亲,可以享受法定的职工产假和哺乳假,这在一定程度上削弱了家庭对托育服务的需求。具体地,从国家层面来看,2012年出台的《女职业劳动保护特别规定》将原有的90天女性职工产假调整为98天,出现难产情况、生育多胞胎等情形,还可(每胎)增加15天产假[34]。此外,2008年,原人事部发布的《机关事业单位工作人员带薪年休假实施办法》[35]与人力资源和社会保障部发布的《企业职工带薪年休假实施办法》均明确规定[36],产假不计入带薪年休假。职工可依据工作年限享受的5~15天带薪年休假,并将其与上述生育类假期合并使用。这些政策增加了职工生育类休假时间,为职工家庭照顾婴幼儿提供了较为宽裕的时间支持保障,却也将从事个体经营工作以及未就业的母亲排斥在这种福利体系之外。可以说,这种现象本质上是职业不平等在儿童照顾问题上的凸显。即使是最新设立的“3岁以下婴幼儿照护个人所得税专项附加扣除”也是选择性的[37]:高税收的个体(家庭)会从中获益更多,而低税收个体(家庭)甚至无须纳税的个体(家庭)则很难受益。这进一步地支持了,提供普遍性的托育服务、扩大家庭政策受益群体的必要性。

2.模型精度评价:模型的有效性

本研究以随机抽样的方式,将所有的数据集划分为训练集与测试集来验证模型的有效性。其中,训练集主要用来学习规律,测试集用来检验训练模型的有效性。在对模型预测精度的评价方面,不同学者选取的评价指标存在差异,主要指标有Accuracy、Recall、Precision、F1、MSE、RMSE等。由于本文关注的是二分类问题,因而选取常用的二分类评价指标体系,即Accuracy、Recall、Precision与 F1,它们是以正例和负例的四种组合为基础的评价指标体系,具体组合情况见表2。一是实际值与预测值均为正例(TP),即用户问卷填写

表2 正例与负例的四种组合形式

的实际值(target)为1且模型训练的预测值(target’)也为1;二是实际值为正例而预测值为负例(TN),即实际值(target)为1,预测值(target’)为0;三是实际值与预测值均为负例(FN),即实际值(target)为0且预测值(target’)也为0;四是实际值为负例而预测值为正例(FP),即实际值(target)为0,预测值(target’)为1。

由表3可知,训练后的模型总精度(Accuracy)为97.19%,意味着模型训练结果有效且总体精度较高。由于本文的研究问题是家庭的托育需求,需要进一步关注实际值(target)为1的预测精度。实际值(target)为1的预测精度越高,模型越能够精准地反映出家庭的托育需求水平。Recall、Precision与 F1是考察实际值(target)为1的预测精度的关键指标:Recall表示实际值(target)为1被正确预测的比重,经过模型拟合,预测值(target’)为1占实际值(target)为1的比率为85.45%;Precision表示所有实际值(target)为1占预测值(target’)为1的比率为97.92%;F1是Recall与Precision的调和平均数,具体的值为91.26%。基于此,对问卷调查的托育需求结果进行修正,修正后的托育需求水平为12.44%(2)托育需求水平为预测值(target’)为1的样本占总样本的比率。。

表3 训练后的模型精度

为进一步检验模型的有效性,本文选取较为常见的随机森林模型(Random Forest)、LightGBM、CatBoost、XGBoost与深度神经网络(Deep Neutral Networks)5个机器学习算法再次进行模型训练,得出的精度评价结果见表4。首先,从总精度(Accuracy)来看,Deep Neutral Networks、Random Forest、CatBoost、XGBoost与LightGBM算法的精度依次为95.00%、94.06%、86.88%、86.56%、84.38%,均低于AutoGluon的训练结果。其次,由于本研究更关注实际值(target)为1的评价精度,所以需进一步考察Recall、Precision、F1的评价结果。不难看出,除Precision的评价精度外,CatBoost、XGBoost与LightGBM算法的Recall与F1的评价精度均较低,模型的可解释力很弱。虽然随机森林模型与深度神经网络的训练精度得到了很大的改进,处在可接受范围内,但仍低于AutoGluon的训练精度。由此可知,AutoGluon的预测精度显著高于其他几个算法、模型解释力更强。

表4 不同机器学习算法的精度评价结果 单位:%

五、实验结果分析

母亲的年龄、月收入水平、对托育服务促进早期人力资本积累功能的认可度、父亲受教育程度与对托育服务平衡工作与生活功能的认可度,是托育需求最重要的5个影响因素。为进一步考察这5个特征值与托育需求之间的复杂关系,本研究引入部分依赖图(Partial Dependence Plot,PDP)与SHAP值,分别可视化机器学习算法学习到的规律,以确保分析结果的准确性。部分依赖图(PDP)展示的是目标函数和一组特征值之间的依赖关系,可以考察特征值与目标值之间的线性与非线性关系[38]。SHAP值属于模型事后解释的方法,主要用来展示计算特征值对模型输出的边际贡献,侧重于考察异质效应[39],其核心思想源于诺贝尔经济学奖获得者罗伊德·沙普利(Lloyd S.Shapley)在合作博弈论中提到的Shapley值及其相关的扩展[40]。由于母亲月收入水平与受教育程度是衡量母亲社会经济地位最重要的指标[41],本文将不再单独讨论这两个因素对目标值的影响,而是考察两个特征值在任意组合上的结果对托育需求的影响。此外,考虑到父亲受教育程度与母亲受教育程度对托育需求的影响具有高度相似性,为节省篇幅,这里不再单独讨论父亲受教育程度对托育需求的影响。

(一)单一特征值与托育需求

1.母亲的年龄与托育需求

图1展示的是母亲的年龄与托育需求之间的关系。从趋势上看,随着母亲年龄的增长,家庭的托育需求水平呈现先降低后提高的趋势。具体地,由图1(a)可知:当母亲年龄小于32岁时,年龄对托育需求的边际贡献为负(SHAP值<0),年龄与托育需求负相关;当母亲年龄在33~46岁时,年龄对托育需求的边际贡献值为正(SHAP值>0),且上升趋势明显,年龄与托育需求正相关。结合图1(b)进行检验,折线表示总体趋势,阴影部分为95%的置信区间:当母亲年龄在20~29岁时,随着母亲年龄的增加,家庭的托育需求逐渐下降;当母亲年龄在29~32岁时,虽然托育需求逐渐上升,但是托育意愿仍呈抑制状态(PDP值<0);而当母亲的年龄大于32岁时,托育需求显著提高,家庭展现出十分旺盛的托育需求(PDP值>0)。PDP与SHAP值的可视化结果基本一致,验证了母亲年龄对托育需求的复杂影响。进一步地,本文尝试解释母亲年龄对托育需求产生上述复杂影响的原因。2017年全国生育状况抽样调查显示,2017年我国平均初育年龄上升至27.3岁,较2006年推迟了3岁[42]。依照此趋势,我国现阶段平均初育年龄应约为29岁。由此,基本可以推断,一孩家庭的托育需求相对较低。从情感出发,母亲更倾向于选择自己照顾第一个孩子,并且一孩家庭也更有可能从亲属网络获取育儿支持。随着母亲年龄的增长,母亲可能会面临“上有老,下有小”的双重照顾压力,在这种情况下,托育需求显著提高。

图1 母亲年龄对托育需求的影响

2.对托育服务功能的认可度与托育需求

从人力资本视角出发,托育服务被视为对早期人力资本的投资,即促进早期人力资本积累是托育服务的主要功能之一。如图2(a)所示,当家庭对托育服务促进早期人力资本积累功能的认可度为“非常不认可=1”“不太认可=2”时,该特征值对托育需求的边际贡献为负(SHAP值<0),此时,家庭的托育需求是极低的。而家庭对托育服务促进早期人力资本积累功能的认可度达到“认可=4”“非常认可=5”时,托育需求显著提高(SHAP值>0)。结合图2(b)进行检验,不难发现,家庭对托育服务的认可度由2向3转变时,托育需求逐渐提高。当对托育服务的认可度由3向4转变时,家庭的托育需求陡增,并且增幅远高于由4向5的转变阶段。由此可知,家庭对托育服务促进早期人力资本积累功能的认可度,一旦从“消极”转为“积极”时,家庭的托育需求就会显著提高。

图2 对托育服务促进早期人力资本积累功能的认可度与托育需求

托育服务的另一个重要功能是帮助女性平衡“工作—家庭”关系,根据上文基于全样本得出的重要性排序结果可知,家庭对托育服务平衡工作与生活功能的认可度也是影响目标值的重要因素。图3展示了这一特征值与托育需求之间复杂的非线性关系。由图3(a)可知,只有当家庭对托育服务平衡工作与生活功能的认可度达到“非常认可=5”时,特征值对托育需求的边际贡献才为正(SHAP值>0)。进一步地,结合图3(b)检验,家庭对托育服务的需求从“抑制状态”(PDP值<0)转变为“积极寻求”(PDP值>0),发生在由4向5的转变过程,即只有当家庭完全认可托育服务能够发挥平衡工作与生活的功能时,家庭的托育需求水平才会显著提高。

图3 对托育服务平衡工作与生活功能的认可度与托育需求

(二)双变量交互对托育需求的影响

构建以母亲受教育程度与月收入水平为双变量交互的PDP,不仅可以帮助我们分析母亲社会经济地位对托育需求的影响,还可以借助它理解这两个特征值的相互依赖关系。图4为双变量交互的PDP结果:从整体上看,随着母亲社会经济地位的提高,托育需求显著提高。进一步地,分析两个特征的部分依赖关系。第一,当母亲月收入水平取值小于3(低于5000元/月)且受教育程度取值小于3(低于大专/本科)时,托育需求水平相对较低(PDP值<0.144)。一方面,母亲受教育程度不高,对早期人力资本投资的意识可能不强。另一方面,母亲月收入水平相对较低,难以负担托育费用,且即使母亲因养育子女而中断就业,在职业领域遭受到的收入惩罚也相对较低。第二,母亲受教育程度较高且月收入水平较低时,家庭对托育服务的需求被抑制。当母亲受教育程度取值大于3且母亲月收入水平取值小于3时,家庭的托育需求会有所提高(0.144

图4 双变量交互对托育需求的影响

对上述结果可能的解释是,从新家庭经济学出发,女性在职业角色和照顾者角色之间存在普遍的不兼容性,这种不兼容性导致了养育幼儿的机会成本产生,即照顾幼儿会使女性减少工作、职业发展受影响甚至中断就业,进而导致女性收入减少。已有研究显示,在我国,生育二孩的女性,其就业概率约下降9.3%[43],且每多生一个孩子,女性的小时工资率降幅约为13%[44]。因此,母亲的收入水平越高,因照顾子女产生的机会成本也越高。当母亲为照顾幼儿所放弃的潜在工作时间带来的经济收益高于不放弃这份工作去购买专业化服务所需的照顾费用时,托育需求随之提高。换而言之,当母亲的收入水平较高时,更有能力通过购买专业化的托育服务将照顾幼儿的“机会成本”转化为向市场支付的“直接成本”,即母亲因照顾幼儿产生的机会成本是影响家庭托育需求的关键因素之一。

(三)婴幼儿照顾方式的决策逻辑

重要性在前十位的特征值依次为:母亲年龄与月收入水平、对托育服务促进早期人力资本积累功能的认可度、父亲受教育水平、对托育服务平衡工作与生活功能的认可度、隔代照顾、家庭对科学育儿知识的了解程度、父亲月收入水平、母亲受教育程度及孩子数量。对特征值进行合并,可知,母亲的年龄与机会成本(母亲月收入水平)、家庭对托育服务功能的认可度(对托育服务促进早期人力资本积累功能的认可度、对托育服务平衡工作与生活功能的认可度)、隔代照顾、孩子的数量是托育需求的重要影响因素。

据此,本文尝试构建婴幼儿照顾方式的决策过程。如图5所示,婴幼儿照顾方式的决策逻辑,应是一个复杂的“阶梯式”进程。即存在不同层级的决策阶段,每一个决策阶段的互动主体相对平等。

首先,在决策的第一层级中,母亲的机会成本是关键因素。当母亲的机会成本处于较低水平时,母亲基本能够承担照顾职责(此时也可能存在隔代照顾);而当母亲的机会成本较高时,则会寻求隔代照顾或者托育服务。

其次,进入到决策的第二层级,即多方照顾主体的互动。中青年父母选择照顾主体时,衡量的是人力资本投资、安全、成本、信任度等问题,这类考量体现在他们与两类替代性照顾主体的互动过程中。一是体现在中青年父母与祖辈之间的互动中。隔代照顾受到多种因素的影响,如代际关系、祖辈的健康、受教育水平、价值观念等,基本上可以从动机(照顾的意愿)与能力(提供照顾的可行性)两个维度归纳。并且,由于代际关系的复杂性,学者从代际交换论、文化形塑论与团结论等不同角度去理论隔代照顾的形成,从而祖辈既是“代际剥削的受害者”、又是“寻求团结的主动者”[45]。研究并不关注祖辈在代际关系中的位置,而是将协商机制引入到决策中,并认为隔代照顾是否执行是两代人在分别评估祖辈动机与能力两个维度的特征后,在情感之上反复沟通和权衡利弊的结果。二是体现在中青年父母与托育服务供给者之间的互动中。双方之间的互动过程表现为“买方”与“卖方”之间的提出诉求与回应诉求:“买方”向“卖方”表达托育需求,并衡量与考察购买服务的成本、服务的安全与质量等;“卖方”通过对设备、环境、师资队伍等的建设与宣传来回应“买方”的需求。三是不排除有些家庭存在“强势”祖辈的情况。拥有足够资源(尤其是经济资源)的祖辈在一定程度上能够替代父母亲做决策,可能会出现托育服务供给者与祖辈之间的直接互动。若祖辈对托育持强烈反对、不信任等态度,双方也可能会出现互动。

最后,进入到第三层级,即决策输出。

注:“+”代表母亲的机会成本高,祖辈提供隔代照顾的动机强度、能力水平高;“-”代表母亲的机会成本低,祖辈提供隔代照顾的动机强度、能力水平低。图5 婴幼儿照顾方式的决策过程

六、研究结论与政策建议

(一)主要结论

为测度家庭的托育需求水平并综合考察托育需求的影响因素,本文基于机器学习算法(AutoGluon)对徐州市1601个家庭的调查数据进行了实证检验,得出训练后的模型总精度(Accuracy)为97.19%,证明模型训练结果有效。研究结果显示:第一,修正后的托育需求水平为12.44%,每千人口所需的托位数约为4.8个(3)根据徐州市统计局数据,2018—2020年该市出生人口数分别为139514人、106644人、106644人,由此可知,该市3岁以下婴幼儿数应为352689人,则入托人数应43875人(352689×12.44%=43875)。进一步地,徐州市常住人口数为9083900人,则入托人数占总人数的比例为0.48%(43875/9083900=0.48%),即每千人口所需的托位数为4.8个。。结合“十四五”规划中“2025年每千人口拥有3岁以下婴幼儿托位数4.5个”的预期性指标[46],基本可推断,当前我国普通地级市的一般托育需求水平较高,但服务供给总量严重不足。第二,家庭特征显著影响托育需求,其中母亲的年龄、月收入水平是影响托育需求的关键因素,父亲受教育程度、隔代照顾次之。第三,家庭对托育服务的认可度也显著影响托育需求,托育服务越能够发挥促进早期人力资本积累、平衡工作与生活的功能,家庭的托育需求越高。第四,根据托育需求影响因素(特征值)的重要性排序,还可以构建以母亲的机会成本为逻辑起点的婴幼儿照顾方式决策过程模型。其中,母亲的机会成本(逻辑起点)为决策的第一层级,多方照顾主体(中青年父母、祖辈与托育机构)相对平等地互动为决策的第二层级,决策输出为第三层级。

(二)政策建议

第一,政策制订应在精准、动态把握需求的基础上,着力增强托育服务有效供给。每千人口4.8个托位数的需求已然较高,而由模型训练得出的托育需求水平建立在当下社会经济发展水平与托育服务发展水平之上,很难判定未来的托育需求是平稳地“线性增长”还是会出现“指数级变化”。原因有两方面:一方面,随着我国托育服务事业的稳步发展,家庭可能会逐步提高对托育服务的认可度、信任度和可负担能力;另一方面,随着家庭政策支持体系的不断完善,家庭照顾负担和养育子女成本会逐步降低,进而会生育率产生积极影响,客观上这也会提升托育需求。并且,每千人口4.8个托位数在一定程度上仅能代表当前我国普通地级市的一般托育需求水平,超大城市与大城市的需求水平应该显著高于该指标。因此,地方政府在统筹规划托育服务供给时,需警惕“唯指标论”,应通过阶段性地调查及时掌握当地的家庭需求,以此促成托育服务的供需匹配。

第二,既应明确政府责任,又应充分调动社会力量参与服务供给,以提高托育服务的供给总量。发展托育服务,不仅是促进我国人口长期均衡发展的重要举措,也与改善家庭福利、促进早期人力资本积累、平衡工作与生活的关系等多元目标相关。由于现代社会中“儿童”更多地具备了公共产品的属性,以及投资于儿童具有正外部效应,因而政府投资托育服务也具有合理性和必要性。但从政府财政能力来看,完全由政府为我国近4000万3岁以下婴幼儿提供普惠性托育服务几乎是不可能实现的。以2020年学前教育生均经费12954元(占国家财政教育经费7.9%)来预估[47],政府至少需投入5181.6亿元,若以义务教育阶段生均教育经费支出来计算,则该投入需扩大近6倍。鉴于我国公共托育资源投入不足的客观现实,必须在适度扩大供给财政投入的同时,完善土地、财税、金融等支持政策。一方面,可以通过公办民营、公助民营等方式提高公共托育服务供给总量,为确实有照顾困难与经济困难的家庭提供福利性托育服务。另一方面,也可以通过财政补贴、税收减免等一系列措施,充分调动企事业单位、社会组织、社会成员参与托育服务供给的积极性。

第三,强化人才队伍建设,并引入激励机制,以提高托育服务供给质量。在提高托育服务供给总量的同时,还要关注托育服务的高质量发展,使托育服务能够很好地适应公众日益增长的多层次、多样化的需求。当前,托育服务从业者的收入水平与社会地位仍然较低,松散的雇佣关系导致了从业者的社会保障和职业福利碎片化,不利于托育人才的培养、选拔与留任。为此,一方面,可以考虑将婴幼儿照护服务相关专业设置为紧急学科开展定向师范生培养,并通过发放艰苦补助金(hardship allowance)或延长学生的无息还贷期限,吸纳更多的人才选择相关专业[48]。另一方面,借鉴国外的“快车项目”(fast-track programs)[49],引入竞争机制,由政府来招聘和保留最有能力的毕业生,缩小托育专职教师与其他教育阶段老师(幼儿园、小学等)的薪资差距,并为其提供额外的培训、职业支持等。

猜你喜欢

托育特征值家庭
《家庭教育促进法》中的托育服务:国家义务与机构角色
解决托育难题需合力托底
深耕“一小”服务体系建设用情用心用力推动托育事业发展
——内蒙古托育产业发展情况调查报告
一类内部具有不连续性的不定Strum-Liouville算子的非实特征值问题
一类带强制位势的p-Laplace特征值问题
基于一类特殊特征值集的扩散算子逆谱问题
单圈图关联矩阵的特征值
全面二孩政策背景下公共托育服务体系构建研究
家庭“煮”夫
恋练有词