我国在婚育龄妇女生育二孩的影响因素分析
2022-12-17王振杰郑翩翩孙陈希
王振杰,郑翩翩,孙陈希
1北京大学人口研究所,北京,100871;2北京大学信息科学技术学院机器感知与智能教育部重点实验室,北京,100871
人口问题是我国社会经济可持续发展面临的一项重大问题。我国的人口结构正伴随着社会经济发展、生育政策的调整经历着深刻的变化。出生人口规模和总体生育水平下降是一大显著趋势。我国总和生育率从20世纪80年代平均在2.6左右,下降到20世纪90年代的更替水平(2.1)以下[1]。2020年第七次全国人口普查数据汇总得出我国总和生育率仅为1.3[2]。党的十九大报告指出,促进生育政策和相关社会经济政策配套衔接,加强人口发展战略研究。我国正在面对人口结构呈现出的新变化趋势,人口发展战略调整以及相关政策体系也积极进行调整。2013年11月,中国共产党第十八届三中全会颁布实施“单独两孩”政策,“单独两孩”政策一定程度上遇冷,并没有达到预期的效果。2015年10月29日,中共十八届五中全会决定进一步实施“全面两孩”政策。在实施生育政策调整后,出生率在短时间内恢复,之后逐渐下降,并在低水平上徘徊。根据第七次人口普查,2020年的总人口为14亿1千万人,与2010年的“第六次人口普查”相比,总人口的平均年增长率仅为0.53%,将在2025-2030年间达到顶峰[3]。这表明中国高速或超高速人口增长的时代正在逐渐过去,人口惯性增长阶段接近尾声,零增长或负人口增长的时代正在越来越近。
在此基础上,探究我国在婚育龄妇女生育二孩问题尤为重要。现有研究指出,年龄、户口、民族等个体基本特征,疾病、身体机能、生殖能力等健康因素,收入水平、住房条件和职业类型等经济条件,婚姻状况、兄弟姐妹数和已育孩子的性别、年龄等家庭情况都与育龄人口二胎生育存在显著关系[4-5]。但是,因素之间的复杂关系可能使其在不同的人群中呈现相异的影响程度、影响方向。因而生育问题的相关研究通常选择某类典型群体开展具体剖析,如流动人口、农村居民、独生子女、城市青年夫妇等[6-7]。出于对健康、照料、就业等个体生育成本的考虑,在婚育龄妇女的再生育选择往往比男性更加谨慎。目前,聚焦在在婚育龄妇女群体的生育研究仍需进一步丰富。本文欲通过随机森林算法与logistic回归模型相结合方式,分析我国在婚育龄妇女生育二孩影响因素,依据研究结果提出相关政策建议。
1 资料来源与方法
1.1 资料来源
本研究使用的数据来源于原国家卫生计生委组织实施的“2017年全国生育状况抽样调查”,调查对象为截至2017年7月1日零时中国大陆15-60岁的中国籍女性,该调查覆盖全国31个省(区、市)和新疆生产建设兵团,涉及2737个县(市、区)的6078个乡(镇、街道),共12500个村(居)级样本点,采用分层三阶段与规模成比例的概率抽样方法概率抽样,最终样本规模近25万人。本研究选取的对象为20-49岁在婚的育龄妇女,剔除变量中的缺失值,最终样本量为123398人。
1.2 研究方法
随机森林算法是基于决策树的集合学习算法,预测精度高,对异常值和噪声的耐受性高,没有过度适应的倾向。随机森林是利用变量(列)和数据(行)随机生成许多分类树,并总结分类树的结果[8-9]。在计算量没有大幅增加的前提下,随机森林可以大幅提高预测精度。随机森林最大可预测数千个说明变量的影响,因此随机森林算法被称为最佳算法之一。随机森林还可以为引用值高的从属变量提供各变量的重要等级。使用随机森林减少数据的维度,使用逻辑回归分析,可以提高测试效率[10-12]。
1.3 统计学方法
本研究根据自变量对因变量的影响重要性排序结果,进行逐步随机森林分析,将袋外估算误差率最小的自变量再纳入logistic回归模型进行分析。所有分析在R 3.6.2中进行,α=0.05作为检验水准。
2 结果
2.1 调查对象基本情况
本次研究纳入分析123398人,发现人口学特征、经济状况、家庭状况的不同,一孩的性别和年龄的不同,育龄妇女的二孩生育行为均具有差异。分析样本中,约50%的育龄妇女已经生育过二孩。仅有50%的在婚育龄妇女年龄范围在20-39岁,47%的在婚育龄妇女兄弟姐妹数量大于等于3个,41%的在婚育龄妇女完成义务教育、26%的在婚育龄妇女受教育程度为小学及以下。见表1。
2.2 随机森林
2.2.1 随机森林数目选择。根据随机森林模型误差率与随机森林规模变化图进行确定,图1中3条误差曲线分别代表生育二孩(赋值为“是”)、生育二孩(赋值为“否”)及生育二孩(赋值为“是”和“否”)。本研究随机森林模型随机种子数设为222,分析结果显示,当树的数量大于400棵树以后,我国在婚育龄妇女生育二孩随机森林模型误差率平稳。因此,我国在婚育龄妇女生育二孩随机森林模型树的数量近似选择整数400。
表1 我国在婚育龄妇女变量描述 n(%)
表1(续)
图1 我国在婚育龄妇女生育二孩随机森林模型
2.2.2 变量重要性排序。随机森林模型随机种子数设为222,分析结果显示,我国在婚育龄妇女生育二孩随机森林模型各变量重要性由高到低依次为(图2):第一个孩子性别、受教育程度、居住地、年龄、家庭总收入、住房面积、初婚年龄、就业状况、兄弟姐妹数、民族、健康状况。由此可见家中第一个孩子性别对该家庭是否生育二孩最为重要。
图2 我国在婚育龄妇女生育二孩随机森林变量重要性排序
2.2.3 降维。根据重要性评分排序结果,从评分最高的变量开始进行逐步随机森林。我国在婚育龄妇女生育二孩随机森林模型分析结果显示(图3),当变量数为10-11时袋外估算误差率最低。重要性评分排名前10的变量依次是第一个孩子性别、受教育程度、居住地、年龄、家庭总收入、住房面积、初婚年龄、就业状况、兄弟姐妹数、民族。
图3 我国在婚育龄妇女生育二孩逐步随机森林分析结果
2.2.4 多因素logistic回归分析。在本研究的多因素logistic回归分析中,所有变量均与我国在婚育龄妇女二孩生育行为存在相关关系。见表2。
表2 我国在婚育龄妇女生育二孩logistic回归分析
从各变量与我国在婚育龄妇女生育二孩的关系强弱来看,性别、年龄与二孩生育行为存在较强的相关关系。相较于第一个孩子性别为男孩的妇女,一孩为女的在婚育龄妇女生育二孩的概率上升了546%。在婚育龄妇女的年龄与二孩生育行为存在倒“U”型相关,年龄的增加会使得生育二孩的概率上升,35-39岁升至最高,该年龄阶段的在婚育龄妇女二孩生育概率是20-24岁妇女的7.35倍。
此外,在婚育龄妇女受教育程度越高生育二孩的概率越低(P趋势<0.001)。相较于居住在城市的妇女,农村妇女生育二孩的可能性下降42%。家庭收入越高生育二孩的概率越低、住房面积越大生育二孩概率越高、初婚年龄越晚生育二孩概率越低(P趋势<0.001)。农业就业的妇女的二孩生育概率是非农就业的1.38倍。兄弟姐妹数越多越可能生育二孩(P趋势<0.001)。少数民族、健康对二孩生育也存在显著的正向促进作用。
3 讨论
3.1 第一个孩子的性别对我国在婚育龄妇女生育二孩的影响较大
本文基于2017年全国生育状况抽样调查数据,采用随机森林算法分析我国在婚育龄妇女生育二孩影响因素,并得出重要性排序:第一个孩子性别、受教育程度、居住地、年龄、家庭总收入、住房面积、初婚年龄、就业状况、兄弟姐妹数、民族、健康状况。而从logistic回归模型的结果来看,这些因素确实与妇女的二孩生育行为存在一定的相关关系,并且第一个孩子性别、年龄的作用最强。虽然以往部分研究结果显示妇女的经济状况是影响妇女二孩生意意愿的核心因素[13],但从现实的生育行为分析可以发现,第一个孩子的性别才是目前促使妇女是否生育二孩的最强有力因素,并且体现了男性偏好。这对我国生育政策和生育文化的调整具有重要的启示意义。
3.2 影响我国在婚育龄妇女生育二孩的因素包括人口学特征、经济及家庭状况
3.2.1 人口学因素。从人口学特征分析,在婚育龄妇女的年龄与二孩生育行为呈现倒“U”型相关,随着在婚育龄妇女年龄的增加,生育二孩的可能性持续上升,并在35-39岁升至最高。这可能是因为相较于35岁以下的年轻妇女,35-39岁的育龄妇女已经经历了更长的生育年龄,有更充分的备孕时间,甚至拥有更优、稳定的经济状况。同时,相较于40岁以上的妇女,她们的健康水平仍保持在较好的水平。因而,从年龄段来看,35-39岁的育龄妇女应该成为目前人口生育政策重点关注的对象。需要注意的是,低年龄段育龄妇女虽生于二孩的概率偏低,但并不代表她们没有生育二孩意愿,有可能是正在备孕只是目前暂未生育,从而造成低年龄组生育二孩的概率偏低,对结果造成一定的影响,未来的相关研究需要考虑这一点。受教育程度越高、初婚年龄越晚的育龄妇女生育孩子的可能性越小,可能是由于初婚年龄较晚、受教育程度较高的育龄妇女往往生育年龄较高或事业发展较好,生育的健康成本和机会成本随之增加,从而抑制了其生育行为。受到以往差异化的生育规定和生育文化影响,少数民族二孩生育意愿显著高于汉族群体。
3.2.2 经济因素。从经济状况分析,在婚育龄妇女的就业状况对二孩生育行为具有显著影响,非农就业生育孩子的可能性小于其他就业形式群体。这也能够为未来促进育龄妇女生育行为带来有益的政策启示,如何平衡家庭与工作是后续值得研究的热点问题。从个体来看,收入水平更高的妇女可能有更强的个人和职业发展意愿。从家庭分析,孩子是家庭的耐用消耗品,家庭收入的不断提高会使得父母选择减少生育数量转而提升生育质量。本研究结果印证此结果,家庭收入越高生育二孩的概率越低。同时,许多发达国家的生育水平更是验证了这一结论。但是,也有学者认为收入与生育之间并非呈现简单的线性关系,而是呈倒U型分布[13]。本研究发现住房面积越大越能增加生育二孩的可能性,这与其他学者“较小面积的房屋会抑制生育欲望和生育数量”的结论相互印证[14]。更大面积的住房能够为生育过程提供良好的物质环境,并且房价变动带来的财富效应与抵押效应也能促进生育选择。
3.2.3 家庭因素。从家庭状况分析,育龄妇女现有子女的孩次性别结构是影响女性再生育行为的强有力因素,育龄妇女在第一个孩子为女孩的情况下生育二孩的可能性更大,这与其他学者的研究结论一致[15]。此外,在婚育龄妇女拥有的兄弟姐妹数量对生育行为具有较为显著的影响,拥有多个兄弟姐妹的在婚育龄妇女生育二孩的可能性最大。这反映了育龄妇女的生育价值取向会受到原生家庭的影响,兄弟姐妹数量多的育龄妇女更可能延续原生家庭的多生育模式。