当代中国人的生育意愿:我们实际上知道多少?
2017-08-09风笑天
摘 要:三十多年生育意愿调查的实践表明,研究者通常采用“理想子女数”或者“假设条件下的意愿生育子女数”来测量人们的生育意愿。但实际上,“理想子女数”所测量的只是人们对生育的看法,而不是人们对于生育的意愿,因而测量效度不高;“假设条件下的意愿生育子女数”则是在有计划生育政策的现实中假设没有政策,因而也不能很好反映人们的真实意愿。但相比较而言,前者比后者离人们的实际生育意愿更远。意识到现有生育意愿调查结果的局限性及其与现实之间的距离,是将其作为制定人口政策重要参考时应特别注意的关键一环。
关键词:生育意愿;理想子女数;意愿生育子女数;测量效度
中图分类号:C921.2 文献标识码: A 文章编号:0257-5833(2017)08-0059-13
作者简介:风笑天, 南京大学社会学系教授、博士生导师 (江苏 南京 210093)
随着“全面二孩”生育政策2016年初在全国范围的迅速落地,有关“是否应该放开二孩生育”、“应该何时放开二孩生育”等问题的讨论或许已经失去了现实意义。但是,近些年来学术界围绕二孩政策放开所进行的一系列学术讨论和众多的争论,却值得我们认真进行反思和检讨。因为,在对社会世界的各种现象及变化规律进行探索、以便为人们的社会实践提供指南的过程中,我们的研究思路、研究方式、研究方法等等都有可能存在偏差。在这种偏差引导下产生的研究结果,则有可能误导我们对社会现实的认识。因此,在上述讨论和争论告一段落的时候,认真反思我们围绕二孩政策问题所进行的各种研究的方式、过程和结果,同样是研究者的一种学术责任。
一、生育政策调整的效果质疑生育意愿调查结果
几年以前,围绕着“单独二孩”生育政策的制定与出台,政府部门和学术界一直在关注两个焦点问题:其一,全国符合“单独二孩”生育政策条件的人口有多少;其二,这些符合“单独二孩”政策条件的人口中,究竟有多少人会再生一个孩子。这两个问题的答案既是回答各种与二孩生育相关的人口问题、经济问题、社会问题的基础,也是国家和政府部门制定新的生育政策的基础。对于第一个问题,国家卫计委已有明确的结果:全国符合“单独二孩”条件的人口大约为1100万1;但对第二个问题,研究预测结果与“单独二孩”政策实施后的实际申请状况、新增人口状况之间则出现了明显差距。学术界以及政府相关部门曾对放开“单独二孩”后的新增人口给出了各种预测,从每年平均130-160万,到每年不超过200万等等。1但政策实施一年后,全国符合“单独二孩”政策条件的1100万人口中,实际申请生育二孩的数量只有107万。2申请比例仅为符合条件人口的10%左右。“‘单独二孩政策‘遇冷”成为近两年来概括这种巨大差距的流行语。3
为什么研究预测的结果与实际申请的结果之间会有这么大的差距?除了因为政策实施的时间只有短短一年等具体因素外,是否与长期以来我们一直用以作为政策制定参考依据的生育意愿调查结果有一定的关系?换句话说,之前大量的生育意愿调查所给出的相关结果,在反映中国人真实的生育意愿方面是否缺乏足够的有效性和准确性?
正是“单独二孩”政策的制定和出台,以及符合政策条件人口的实际申请状况,在不经意间将学术界和政府部门的众多生育意愿调查结果推上了风口浪尖,同时也将生育意愿的测量问题提到了十分重要的位置。或许生育意愿调查的结果从来没有像最近几年这样受到重视,但与此同时,生育意愿调查的结果也从来没有像现在这样受到质疑。正如有学者所指出的:有关生育意愿的“前期研究成果面临前所未有的实践检验和历史考验”4。
客观地说,生育意愿并不等同于生育行为,也不一定能准确地预测生育行为。但目前用来预测生育行为的最好方式依旧是首先了解生育意愿。“在众多关于生育问题的研究中,有关生育意愿的研究一直受到特别的关注,其原因当然是由于人们企望通过对生育意愿的了解来预见到生育水平的变化。”5不仅众多的人口学研究需要在各种人口预测和人口推算的模型中加入生育意愿的变量,并设定生育意愿的具体数值;而且在政府决策部门制定和调整人口生育政策过程中,所考虑的一个重要因素同样也是人们的生育意愿。“在人口研究领域,生育意愿不仅是研究生育观念的主要内容,也被作为预测未来生育水平的指标之一”,“了解生育意愿对判断生育率变化日益重要”。6正是由于学术界对人们生育意愿的这种严重依赖,或者说,正是由于生育意愿在一个国家的人口生产、人口发展、人口政策制定等方面所具有的重要地位,因此,科学地、准确地了解人们的生育意愿,就成为学术界和政府部门的一项重要任务。而“我国20 世纪80 年代以来对育龄人群生育意愿的测量方法的深入研究还是比较缺乏的”7, 因此,我们有理由去重新思考这样一些基本问题:三十多年来,众多研究者(包括笔者在内,后同)在实际调查中是如何测量生育意愿的?各种生育意愿测量的效度究竟如何?众多生育意愿调查的结果究竟在多大程度上反映了人们的生育意愿?探讨和回答这些问题正是本文的主要目标。
二、三十多年来我们在如何测量生育意愿
“生育作为一种社会现象,同时兼有三个特征:即数量、时间和性别”8,因而人们的生育意愿也相应地包含生育子女的数量、生育子女的时间、生育子女的性别三个方面的内容9。在实际研究中,研究者通常将生育意愿操作化为“意愿生育数量”、“意愿生育时间”、“意愿生育性别”等。1其中,意愿生育数量是最为重要的方面。也是与我国人口增长、人口预测、人口控制、人口政策最为相关的方面。因此,本文也将讨论的重点放在这一方面。2
那么,三十多年来我们的生育意愿调查是如何测量人们的生育意愿的?现有的各种生育意愿测量的效度究竟如何?为了回答这些问题,我们需要经验的证据,即需要对现有的大量生育意愿调查进行系统的考察。
据侯佳伟等人统计,改革开放以来的三十多年中,国内学术界发表的大大小小的生育意愿调查结果有两三百个。他们通过筛选,对其中227项研究的结果进行了统计,纵向地描述和分析了我国居民生育意愿的变迁趋势。3候文选取生育意愿调查结果的方式是在现有文献中选取“全部可得的”调查结果,即从CNKI上所能查到的、有生育意愿测量方式的全部调查结果。他们采取这种方法选取样本,主要是出于进行定量统计分析的需要。但这种选取方式的一个不利后果,就是样本中会包括许多一般性的、小范围的、小规模的、低质量的、特别是未公开发表的研究结果(如研究生學位论文)。这样,虽然227项研究中的每一项调查都会有一个生育意愿的具体数字,但这个数字的质量究竟如何、其价值究竟有多大却是值得探讨的。
为了避免候文的选取方法所造成的原始文献质量不高、调查结果代表性不高等缺陷,笔者选取那些相对“重要的”生育意愿调查结果来进行分析。用来衡量“重要”的标准是:(1)调查范围大(调查范围在县、市级范围以上);(2)样本规模大(有效样本规模在500人以上);(3)学术品质高(调查结果公开发表在核心刊物上)。从可行性方面考虑,笔者又增加了第4条标准,即通过中国知网(CNKI)可以被检索到。具体的选择方式和过程如下:
首先,于2016年3月14日,在中国知网的全国期刊全文数据库(CNKI)中,确定搜索范围为“核心期刊”,并以篇名包含“生育意愿”为检索词进行搜索,共得到115篇论文。其次,逐一阅读这115篇论文,排除掉:(1)非经验研究的论文(纯理论探讨、文献综述类、国外研究状况介绍类的论文等);(2)调查范围为县、市以下区域(如村、镇、街道、社区等)的论文;(3)调查的样本规模小于500的论文;(4)采用个案研究等定性研究方法的论文;(5)没有报告(从文中也查不到、辨别不出)生育意愿测量指标的经验研究论文;(6)没有报告调查项目相关信息(如调查时间、地点、总体、样本等)的论文;(7)仅调查二胎生育意愿(即只询问是否会再次生育)的论文。
经过筛选,最终得到符合要求的经验研究论文56篇,这些论文所使用的数据来自41项调查项目。可以说,这41项调查项目构成了目前国内在生育意愿方面的最重要的经验调查。4通过对这41项调查结果的解析,可以在最大程度上揭示出国内目前生育意愿调查的主要现状。下面是这41项调查项目的相关情况,特别是生育意愿测量指标的统计。5
通过表1的统计结果我们看出,国内现有的41项重要生育意愿调查中,研究者对“生育意愿”的测量几乎百分之百地采用了两种方式:一是用“理想子女数”来测量;二是用“假设条件下的意愿生育子女数”来测量。前者大约占了70%(29项),后者大约占了30%(13项)。6
注:a:调查中用来测量二孩生育意愿时所用指标。b:此种测量方式的完整表述应该是:“假设条件下的意愿生育子女数”。此处为简化表格,以“假设意愿子女数”表示,下同。c:北京市2002年的调查在侯亚非、马小红等不同学者的论文中,所介绍的样本规模不一致。d:北京市2006年的调查在侯亚非、马小红等不同学者的论文中,所介绍的样本规模不一致。e:该调查中用紧密相连的两个问题来测量,前一个是“如果不考虑生育政策和其他条件,你认为一般家庭有几个孩子最理想?”紧接着问的第二个问题是“你自己希望生几个孩子?”此处分别作为“理想子女数”和“假设意愿子女数”统计;f:其调查中包括两个问题,一是“您是否打算生二孩”,这实际上是在测量“符合政策人群的二孩生育安排,而不是一般的生育意愿”;“为了尽可能获取被访人真实的生育意愿”,提出的另一个问题是“您理想中的孩子数量”。故只取其这一测量方式。参见石智雷等《符合“单独二孩”政策家庭的生育意愿与生育行为》,《人口研究》2014年第5期。
实际上,不仅本文所考查的这41项重要调查的情况是如此,侯佳伟等人对生育意愿调查进行统计的结果,也发现研究者采用的都是这两种测量方式。他们指出,在其所统计的227项调查中,使用最多的问题是:“您认为一个家庭中最理想的孩子数是几个”,“您认为一对夫妇生几个孩子最合适”,“如果没有计划生育政策,你希望生几个孩子”,“如果完全按个人意愿,您希望生几个孩子”,“如果允许随意生孩子,你希望生几个孩子”。显然,前两种问题是典型的“理想子女数”问题,后三种问题则是典型的“假设条件下的意愿生育子女数”问题。
为什么会形成这样的状况?为什么研究者不直接询问人们“你想生几个孩子”?这是由于,在改革开放后的三十多年中,我国一直实行着以“一对夫妇生育一个孩子”为主要内容的计划生育政策。在这一客观现实面前,研究者无法直接测量人们本源的(即没有生育政策制约和影响的)生育意愿。因此,为了尽可能了解人们心底里的真实意愿,研究者不得已采取了两条间接的途径来进行测量:一条途径是改测量“生育意愿”为测量“理想子女数”,即改“你想生几个孩子”为“你认为理想的家庭应该有几个孩子”;另一条途径则是改“现实有政策”为“假设无政策”,即改“你想生几个孩子”为“如果没有计划生育政策,你想生几个孩子”。现在的问题是:这两种测量方式都是有效的生育意愿测量吗?或者说,这两种方式所测量的真的都是人们的生育意愿吗?如果情况并非如此,那么,研究者通过这两种测量方式得到的生育意愿的调查结果(比如60%的人想生两个孩子,或者人们的平均生育意愿为1.8个孩子等等),究竟在多大程度上反映了人们的生育意愿?
三、两种测量方式的效度如何?
测量的效度(validity of measurement)是指测量的有效性或准确性。效度是衡量测量质量的两个关键指标之一(另一个指标是测量的信度)。下面我们从测量效度的视角,对生育意愿调查中的两种测量方式进行分析。
1、“理想子女数”:测量的是“意愿”还是“看法”?
上述表1的结果表明,绝大多数生育意愿调查采取的是“理想子女数”指标。问题是,“理想子女数”真的是在测量人们的生育意愿吗?让我们从采用“理想子女数”这种测量方式的生育意愿调查所提出的具体问题开始分析。下面是调查问卷中的具体问题:
“你认为理想的家庭应该有几个孩子?” “你认为理想的家庭最好有几个孩子?”“你认为一个家庭中生几个孩子最理想?”“您认为一个家庭中最理想的孩子数是几个?” “你认为一个幸福的家庭最好有几个孩子?”“您认为一对夫妇生几个孩子最合适?”
仔细分析上述各种提问,不难看出,尽管具体表述方式各不相同,但它们都有一个共同的特征:它们都是以“你认为……?”的方式提出问题的。正是这种特定的提问方式决定了它们实际上是在询问人们对某种现象或某件事情的“看法”、“态度”或“认识”,而不是在询问人们对这一现象或事情的“愿望”、“期望”或“想法”!这正是我们理解“理想子女数”这种测量方式实质的關键,也是这种测量方式与生育意愿概念本质内涵之间的差别所在!这种本质的差别揭示出,用“理想子女数”作为“生育意愿”的测量指标,效度并不高!
何为意愿?最简单地说,就是人们内心想去做、希望去做或者希望去达到、实现某件事的想法。而生育意愿,就是人们对于自身生育行为和生育结果的主观期望和意愿,也就是人们内心对于自己生不生孩子、生几个孩子、生男孩还是生女孩、什么时候生等问题的想法或期望。从国外学者的英文表述中我们或许也能得到一定的启示:生育意愿常见的英文表述是fertility intention,或者fertility desire,fertility will。所有这些表述强调的都是“想要”生育孩子的“打算”、“愿望”和“想法”。而“意愿生育子女数”的英文表述则是“desired number of children”或者“intended number of children”1,直译过来就是“渴望要的孩子数目”或者“打算要的孩子数目”。这些正是生育意愿的本意。所以说,生育意愿本质上是人们的一种主观“期望”。而上述各种测量“理想子女数”的调查问题实质上询问的则是人们的一种主观“看法”、“认识”或者一种“态度”。尽管这种“看法”、“认识”或“态度”与这种“期望”相关,但二者却并不是一回事。
“期望”更多地包含着人们内心的某种渴望和追求,而“看法”、“认识”或“态度”则更多地停留在认知层面,具有更多“是好是坏”、“是对是错”、“是合适还是不合适”的判断内涵。更直接地说,“你认为理想的家庭应该有几个孩子”等问题所测量的,其实是被调查者关于“理想的家庭”或者说“理想的家庭结构”(国外也称为理想家庭规模,即ideal family size,实际上指的是理想子女数量)的看法。或者说是人们对“理想的家庭”、“理想的家庭结构”的一种主观认知。而我们想知道的生育意愿,则是人们对生孩子这件事情的“想法”、“期望”或“打算”。它所回答的是诸如“想不想”、“期望如何”、“渴望如何”这样的问题,而不是回答理想家庭“应该如何”、“什么样最好”。
既然“理想子女数”并不是对生育意愿的有效测量,众多研究者为什么都使用这一指标呢?笔者分析,研究者一定程度上是基于这样一种潜在的假设:即人们理想中的孩子数目就是他们希望生育的孩子数目。因此,了解他们的“理想子女数”就可以了解他们的生育意愿。从理论上说,这种潜在的假设并没有错。但是,这种“并没有错”却是有前提的。这种前提就是:社会中既不存在任何限制或者鼓励生育的经济因素、政治因素、文化因素,也不存在任何限制或鼓励生育的人口政策。即人们的生育完全处于一种自主、自发、自然状态中。然而,十分显然地是,我国并不存在这样的前提(即使是目前也不存在)。且不说经济因素、政治因素、文化因素会对人们的生育意愿产生影响,仅仅人口政策这一个方面,就会使得这样的前提不复存在。
人们对“理想子女数”的回答,只能看成是一种在理想条件下、理想状态中的期望,是一种不考虑现实条件和现实情况的期望。而人们的生育意愿,则是一种在国家生育政策与社会的经济、政治、文化背景、自身家庭状况,以及个人价值观念、生活取向、身体条件等多种因素影响下的期望。因此,“最理想有两个孩子”是一件事,但实际生活中自己想不想生两个孩子、愿不愿意生两个孩子、能不能生两个孩子却又是另一件事。比如,研究者在生育意愿调查中经常听到的诸如“虽然有两个孩子最理想,但考虑到经济因素(或抚养孩子的成本等),我们还是只想要一个孩子”,“虽然生两个孩子最理想,但考虑到我们的精力有限(或身体不好、或工作太忙等),我们还是只想生一个孩子”,或者“虽然生一个孩子最理想,但考虑到祖辈的期望(如传宗接代、或增加劳动力、或多子多福等),我们还是想生两个孩子”等回答,就是对这种差别的一种说明。
更为重要的是,在改革开放以来的三十多年中,计划生育政策对人们生育意愿的影响是刚性的。无论是1979年开始的严格限制生育的人口政策,还是现在有条件放宽生育的人口政策,都会使得人们心底里的生育意愿与这种影响下所形成的社会认知产生分离。作为认知层面的“理想子女数”,其反映的主要不是作为个体的人们的“想法”和“愿望”,而是社会中大多数人认可、大多数人接受的某种“看法”或“观念”。用有的研究者的话说,这种“理想子女数”“相当于对孩子数量的主观最优判断”1,“反映的是一种社会观念”、一种“普遍可接受的社会价值和生育观念”。因此,“从概念上和测量上都与生育意愿有差别”2 。“其实,‘理想子女数仅是生育意愿的指标之一,它反映的是生育的社会规范或个人生育观念, 是人们心目中的完美家庭构成,而不是个人或家庭的现实生育需求或个人意愿。”3也正因为“理想子女数”反映的是一种整体性的社会认知,因而其具有相对的稳定性(即在一段时期中对不同对象进行调查,所得到的结果相互之间差别并不大)。
综上所述,生育意愿本质上是人们的一种主观“期望”、“想法”或“打算”,而“理想子女数”的提问方式所测量的实质上只是人们对某种事物的主观“看法”、“认识”或“观念”。它既不同于人們心底里对希望生育几个孩子的真实想法,也不能准确反映人们在现实生活中综合考虑个人及家庭特定条件后选择的实际生育几个孩子的行为。总之,“理想子女数”的确与人们的生育意愿“相关”,但二者并不“相等”。它虽然也会随着时间的变化发生变化(这种变化实质上反映的只是社会观念的变化),但它与人们实际的生育意愿之间却始终存在着一定的距离。它不需要回答者去综合考虑个人的现实情景和家庭的特定条件,不需要考虑诸如子女的抚育成本、家庭的经济条件、夫妇的时间精力、母亲的年龄、祖辈的身体状况、甚至家庭的住房条件等众多客观的、与生育和养育孩子紧密相关的现实因素。而一旦考虑这些现实因素,回答者的回答可能就会大不相同了。这些现实的因素都可能使“理想子女数”所得到的只是人们的一种“理想”,而不可能成为他们的现实。因此,用“理想子女数”来测量人们的生育意愿,效度并不高。然而,现实中70%左右的调查使用的正是这种效度不高的指标。这或许就是按调查结果做出的预测与实际申请生育的结果之间存在差距的重要原因。它启示我们:在认识和预测人们的生育意愿方面,“理想子女数”只能作为一种有限的参考。
2、假设与现实:第二条测量途径的特征及其局限
关于测量生育意愿的第二条途径,我们同样按照测量的效度标准来进行衡量。先来看看第二种测量方式在实际调查问卷中所采取的具体提问形式:
“假如没有计划生育政策,你希望生几个孩子?”“如果没有计划生育政策,你想生几个孩子?”“如果国家政策允许,你打算要几个孩子?”“如果完全按个人意愿,您希望生几个孩子?”“如果允许随意生孩子,你想生几个孩子?”
不难发现,在上述各种不同的提问中,也都有一个共同的特征:即它们都是以“假如”、“如果”等条件句的方式来进行提问的。如果先不看这些假设的条件,只看问题的后一半,即“你希望生几个孩子”、“你想生几个孩子”等等,则它们所测量的正是我们希望得到的生育意愿,或者说,后一半问题对生育意愿的测量具有很好的效度。然而,十分遗憾地是,由于我国社会三十多年来的现实中客观存在着限制人们生育数量的计划生育政策,因此,这种“希望生几个”、“想生几个”的有效测量又受着現实中存在的计划生育政策的干扰和影响,不可能直接询问。所以,研究者不得不在这些具有很好测量效度的问题前面,加上“假如”、“如果”等条件句作为前提。这样一来,所有测量又都变成了一种假设式:“假设没有计划生育政策”、“如果完全按个人意愿”等。第二条途径的测量效度问题也就集中到了“假设条件句”的影响上。这种加上了假设条件语句的调查问题,对于测量人们真实的生育意愿会有什么样的影响呢?
首先,这种“假设条件语句”的提问,客观上将被调查者置身于一种非现实的情境中,即“假设”、“假如”的条件性,也就意味着其所提问题的内容和情境的不现实性。或许研究者的愿望(实际上是研究者主观意识中或潜意识中的一种假设)是:让被调查者暂时不考虑当前面临的计划生育政策的现实,进入到一种假定的、不受限制的、可以任由自己决定生育行为的情境中来考虑问题。那么,他们的回答所反映的就是真的面临这种情景时的想法。这样一来我们就可以了解到真实的生育意愿。虽然笔者不能完全排除研究者的这一良好愿望的确有实现的可能,但是,笔者认为,这种良好的愿望或许更多只是研究者自己的“一厢情愿”。更为理性的考虑则是:应该站在现实的层面,站在被调查者的地位,从被调查者的角度来分析和看待这种假设前提的可能影响和实际效果。试想一下,在现实社会中,当一个普通的被调查者面对调查问卷中这样一个假设性问题,或者说这样一种假设的情景时,他的反应会是什么?他又会如何思考和回答这样的问题?
客观的现实是:调查问卷中的“假如没有计划生育政策”与实际生活中明明有计划生育政策之间存在着明显的差距;问卷中的“如果国家政策允许”与实际生活中明明国家政策不允许之间存在着明显的对立。而且这种明显的差距和对立又客观地存在于被调查者的头脑中。它会导致被调查者在这种超出现实、脱离现实的问题面前,产生一种“这是不可能的”、“这是不现实的”、“这是假的”自然反应,继而在其回答调查问题的潜意识中,形成一种“反正这也不是真的”的心理。即无论我怎么回答,无论我选择的答案是什么,都不会真的变成现实。正是假设条件式的提问所带来的这种心理反应,可能导致被调查者在回答这类调查问题,特别是在回答自填问卷中的这类问题时,不考虑自己真实的想法,而是选择他们认为“合适的”,或者是“任意的”答案。从而导致其回答结果与他们真实的生育意愿之间产生距离。换句话说,“假设性的”问题和“假设的”情景所能得到的,或许也只是被调查者“假设的”意愿,而非他们真实的、实际的意愿。“这种假设性的政策环境不同于真实的政策环境,据此得出的结果可能跟真实政策环境下人们的实际决策有较大的差异。”1因此,用“假设条件下的意愿生育子女数”来测量人们的生育意愿,也存在着缺乏现实性的不足。这种缺乏现实性的特点就是第二种测量方式在效度上所面临的最大挑战。
其次,除了“假设性”的影响外,“假设条件下意愿生育子女数”的测量方式还存在另一个弱点,这就是,要在“有生育政策限制的条件下”去了解人们在“没有生育政策限制条件下”的生育意愿,本身或许就是一件不可能的事情。有研究者认为,那种要求被调查者在“如果没有计划生育政策”的假设条件下来回答生育意愿问题的做法,“对于被调查者来说很难想象”2(即被调查者很难想像出自己在那种不可能、不现实的情景中的想法和行为)。的确,在客观上有计划生育政策的现实社会生活中,去想像自己在没有这种计划生育政策的情景中所具有的想法和行为,或许真的有些不合情理。而以这种想象的结果来代表人们在真的面临没有计划生育政策情境中的想法和行为,也的确有些靠不住。因此,“假设条件下意愿生育子女数”的测量方式所存在的这一“现实效度”问题也同样值得重视。
四、两条路径的相对效果:谁离人们的生育意愿更远?
上述分析表明,从测量的效度来衡量,不仅采用“理想子女数”的方式没有真正测量到研究者想测量的现象,采用“假设条件下的意愿生育子女数”的方式可能同样也很难准确地测量到这一现象。正因为两种测量方式的效度都不高,导致了众多调查的结果与现实社会中人们实际的生育意愿之间存在差距,从而也在一定程度上导致了依据调查结果所做的人口预测偏离了现实社会中人们实际申请和生育的现实。从更深的层面上说,关于当代中国人的生育意愿,我们实际上所了解和认识到的并不十分准确,或者说十分有限。这是我们应该清醒认识到的一个重要现实。
当然,在现有的社会条件下,由于无法采用直接的测量方式,研究者只能退而求其次,采取这两种不尽如人意的测量方式。但是更高的学术标准则要求我们进一步弄清楚,现有的这两种都不太完美的生育意愿测量方式中,哪一种的效果相对会好一些?即从认识和了解当代中国人生育意愿状况的角度,我们还需要进一步比较一下,哪一种方式得到的结果相对接近现实,哪一种方式的结果可能离现实相对更远、误差相对更大一些?
为了回答这一问题,首先需要确立衡量和比较的标准。最好的标准自然是当社会中没有生育政策限制时,或者说当人们不受生育政策限制时的生育意愿调查结果。但由于我国改革开放以来的现实社会中一直存在着计划生育政策,而所有的生育意愿调查也都是在有这种政策的现实条件下进行的,所以,这种最好的标准并不存在。我们只能用其他标准来近似地替代。
笔者认为,在现实条件下,相对可靠且实用的标准是那些“具有现实性”的调查结果。这里所说的“具有现实性”,指的是调查对象在现实的生育政策面前,并不受其限制。换句话说,就是在现行计划生育政策条件下,调查对象依旧符合生育两个孩子的要求。这种具有“现实性”的调查对象主要包括“双独育龄夫妇”、“农村一孩为女孩的育龄夫妇”、2013年底以后的“单独育龄夫妇”、2015年底以后的“所有育龄夫妇”等。只有对这些符合计划生育政策的人群所进行的生育意愿调查,才有可能测量到当事人真正的生育意愿。因为在询问他们的生育意愿时,既可以不用“理想子女数”,也可以去掉“假设没有计划生育政策”的限制语,而是可以直接进行询问。他们对于生育意愿的回答相对来说也会更加接近其真实的意愿。当然,由于这类人群实际上也只是可以生育二孩的人群,所以,调查的问题也主要围绕着是否想生二孩进行。1那么,这些“具有现实性”的调查对象希望生育二孩的比例是多少?他们希望生育的子女数量平均又是多少呢?
文献检索结果表明,到目前为止,这种针对“具有现实性”的调查对象的生育意愿调查共有8项:其中有4项是对北京市“双独夫妇”生育意愿的调查;有2项是对江苏省六个市县“符合生育两个孩子条件者”生育意愿的调查;1项是对全国五大城市“双独夫妇”的生育意愿调查;1项是对湖北省符合“单独二孩”条件的夫妇的调查。下面表2是这8项调查的结果统计:
表2的结果表明:这些符合政策条件可以生育两个孩子的对象中,平均希望生育二孩的比例为36%;希望生育一孩比例为64%;平均希望生育子女数为1.36个。
如果将表2所得到的、对符合政策条件可以生育二孩的调查对象进行调查所得结果作为衡量标准的话,接下来的任务就是要用前述两种测量方式的具体结果来与之进行比较。即看看前述两种测量方式的结果中,哪一种相对接近上述结果,哪一种则离上述结果相对较远。
表2 具有现实性的生育意愿调查中关于二孩生育意愿的结果 (%)
[调查地点 调查时间 调查对象 样本规模 想生二孩 不想生二孩 没想好 北京调查 2006 城市双独夫妇 (249) 26.1 44.2 29.7 2008 农村双独夫妇 (339) 36.3 34.2 29.5 2011 双独夫妇 (178) 29.8 43.3 27.0 2013 双独夫妇 (222) 43.0 29.1 27.8 江苏调查 2006 有一孩符合二孩条件者 (3457) 11.1 68.8 20.1 2010 有一孩符合二孩条件者 (4437) 42.5 57.5 五大城市调查
2008
双独夫妇 (314) 27.1 62.1 10.8 湖北调查 2014 符合二孩条件者 (10030) 23.3 57.3 19.5 符合单独二孩者 (6958) 21.5 59.2 19.3 8项调查平均愿意比例 29.0 50.6 20.4 将“没想好”按“想生”与“不想生”的比例分配后 36.4 63.6 平均意愿生育子女数 1.36个 ]
为此,笔者采用两种方式收集证据。一种方式是将前面表1中的41项调查结果按两种测量方式分别计,从总体上来比较二者的结果;另一种方式是选择那些在同一項研究中同时运用了两种测量方式的调查项目,来具体比较两种方式的测量结果。下面的表3是第一种方式比较的结果:
表3 国内 41项重要生育意愿调查中两种测量方式子女平均数的统计
[调查
平均a 调查 平均 调查 平均 调查 平均
林富德,1988 2.11 风笑天,2000 1.33 风笑天,2002 1.32 莫丽霞,2002 2.01 陈字 等,2004 - 风笑天,2004 1.33 周俊山 等,2004 1.16 谢永飞 等,2005 1.88 王学义 等,2006 - 王天宇 等,00-09 - 覃民 等,2009 1.40 廖庆忠 等,2009 1.53 郑真真,2010b 1.42 以上10项“假设意愿子女数“测量平均值为1.55;除三项外,基本上处于1.3-1.5之间;如去掉例外的三项,则平均为1.36 屈锡华,1990 2.50 梁鸿,1996 1.75 赵景辉,1996 1.25 周长洪 等,1997 1.56 尤丹珍 等,2000 2.01 陈卫 等,2001 1.82 李建新 等,2002 1.71 候亚非 等,2002 1.04 庄渝霞,2002 1.66 王金营 等,2006 1.80 覃民 等,2006 1.60 马小红 等,2006 1.18 侯亚非 等,2006 1.23 侯亚非 等,2006 1.18 江苏课题,2007 1.45 郭志仪 等,2007 2.04 马小红,2008 1.47 廖庆忠 等,2009 1.53 宋健 等,2009 1.61 徐映梅 等,2009 1.70 汤兆云 等,2010 1.84 郑真真,2010 1.65 王军 等,2011 1.85 王军 等,2012 1.86 卿树涛 等,2012 1.61 王军,2013 1.87 庄亚儿 等,2013 1.93 石智雷 等,2014c
1.71 张晓青 等,2015 1.82 以上29项“理想子女数”测量平均值为1.72;除北京、哈尔滨等调查外,基本上都处于1.6-1.9之间;如去掉北京、哈尔滨的结果,则为1.8。 ]
注:a:少数论文没有直接报告平均意愿生育子女数或者平均理想子女数,系笔者根据表中统计数字计算得出。b与c两项研究的测量内容与本文的处理方式参见表1说明。
表3的统计结果表明,从总体上看,“假设条件下意愿生育子女数”的测量结果基本上处于1.3-1.5之间,“理想子女数”的测量结果则基本上处于1.6-1.9之间,“理想子女数”的测量结果明显高于“假设条件下意愿生育子女数”的测量结果。如果去掉少数相对特殊的调查结果,那么,“假设条件下意愿生育子女数”的测量结果与前面表2“具有现实性”的调查结果几乎相同;而“理想子女数”的测量结果则与其相距甚远。第一种方式证明“理想子女数”的测量结果更加远离衡量标准。
下列几项调查中,研究者对同一个样本采用了两种不同的测量方法,正好为我们提供了按第二种方式进行比较的结果。
调查项目1:上海市人口与计划生育委员会在2013年11月对上海市8501名20-49岁、目前在婚、夫妻至少一方为上海户籍的育龄夫妇进行了调查,同时使用了两种不同的测量方式。该调查结果表明,对于“你认为理想的家庭应该有几个孩子”这一问题,73%的被调查者回答为两个,25%的回答为一个,总体的平均理想子女数是1.75个孩子。而对于“在不考虑计划生育政策情况下,只考虑你自己的实际情况,你们打算要几个孩子”的问题,回答要两个孩子的比例为48%,回答要一个的比例为46%,二者比例相当,都接近50%。分别比“理想子女数”的比例少了25%和多了21%。其平均意愿生育子女数为1.46个,比平均理想子女数少了近0.3个。1
调查项目2:北京市西城区计生委和中国人民大学人口与发展研究中心2013年对北京市西城区2504位20-44岁(原文此处误写成20-24岁)的育龄妇女进行了生育意愿调查。该调查同样采用了两种测量方式。其得到的结果是:对于“理想的家庭中应该拥有的孩子数量”(即理想子女数)的问题,调查结果为“被访育龄妇女平均理想子女数量为1.8个”;而对于“在排除政策干扰条件下”“打算生育的孩子数量”的问题(即假设条件下意愿生育子女数),调查结果则为平均1.5个左右。1两相比较,同样是“假设条件下意愿生育子女数”的平均值比“理想子女数”的平均值少了0.3个。2
调查项目3:中国社会科学院人口所与江苏省计生委2010年对江苏6个市县育龄妇女进行的生育意愿追踪调查中,研究者也采用了两个不同的测量问题:“如果不考虑生育政策和其他条件,您认为一般家庭有几个孩子最理想?您自己希望生几个孩子?”其调查结果显示,样本总体的“平均理想子女数显著高于个人期望的平均数(前者为1.65,后者为1.42)”,二者相差0.23个。3
这三项调查项目同样得出了“理想子女数”的测量结果明显高于“假设条件下意愿生育子女数”的结果的结论。也同样证明了“理想子女数”的测量结果更加远离衡量标准。因此,无论是总体统计的方式,还是具体项目实例的方式,两方面证据都一致表明:“理想子女数”的测量结果明显高于“假设意愿子女数”的测量结果;“理想子女数”平均在1.6-1.9之间,即希望生育二孩的比例在60%-90%之间;而“假设条件下意愿生育子女数”平均在1.3-1.5之间,即希望生育二孩的比例在30%-50%之间。通过将这两方面结果与前面的衡量标准进行比较,不难发现,“假设条件下意愿生育子女数”更为接近衡量标准,而“理想子女数”则离衡量标准相对较远。实际上,从前述分析中可知:由于“理想子女数”实际测量的是人们的态度、观念和认识,其测量的内容效度明显不高;“假设条件下的意愿子女数”虽然有缺乏现实性的不足,但其测量问题的内容效度明显比“理想子女数”高得多。因此,采用“假设条件下的意愿子女数”来测量人们的生育意愿,比采用“理想子女数”来测量的效果离人们实际的生育意愿会相对近一些。
五、总结与讨论
1.研究的主要结论
三十多年生育意愿调查的实践表明,研究者通常采用“理想子女數”或者“假设条件下的意愿生育子女数”来测量人们的生育意愿。但实际上,“理想子女数”并不是人们“想生的孩子数”;用“理想子女数”进行测量,所得到的只是人们的对生育的看法和观念,而不是人们对于生育的想法和意愿。所以用“理想子女数”来测量人们的生育意愿,其效度并不高。“假设条件下的意愿生育子女数”是在有计划生育政策的现实中假设没有政策,因而这种测量缺乏现实有效性。即“假设无政策”并不是“真的没有政策”。因此,这两条研究者“不得已而为之”的间接测量方式,并不能很好完成对人们真实生育意愿进行准确测量的任务。但相比较而言,“假设条件下意愿子女数”的测量效果优于“理想子女数”的测量效果。即“理想子女数的测量效度更低,它比“假设条件下意愿子女数”离人们的生育意愿更远。
总结三十多年来生育意愿调查的结果,可以看出,由于两种生育意愿测量方式的效度都不高,特别是由于70%左右调查所采用的是测量效度相对更低的“理想子女数”的方式,因此,现有调查对于认识和反映当代中国人的生育意愿来说无疑存在着较大的偏差。这一状况也从另一个角度说明,现有的生育意愿调查结果并没有准确地测量到人们的生育意愿。因而对于当代中国人的生育意愿,我们实际上了解得并不多。这是一个值得重视的现实。
2.相关问题的讨论
在本研究结果的基础上,下述几个方面的问题值得进一步探讨。
第一,如何看待现有的生育意愿调查结果。现有生育意愿调查的两种测量方式是在有生育政策限制的背景下研究者不得已而为之的结果。本文指出现有生育意愿测量方式缺乏效度并不意味着这些结果没有价值。关键在于我们如何认识和看待它们。换句话说,现有各项生育意愿调查结果的价值会因为我们认识和看待它们的方式的不同而有所不同。
笔者注意到,学术界对现有的调查结果基本上采取的都是接受、相信的态度,即“视调查结果为现实”。很少有学者去分析这些调查结果在反映客观现实方面是否存在局限、问题和差距。这一方面可以从三十多年来所发表的几百篇生育意愿调查结果基本上都没有受到质疑或商榷反映出来(受到商榷的调查结果仅一项);另一方面也可以从现有的关于生育意愿研究的文献综述中看出来。无论是风笑天等人关于上世纪最后二十年中生育意愿研究的综述1,还是姚从荣等人关于新世纪前十年中生育意愿研究的综述2,都有一个共同点,即客观上都承认和接受了现有调查的结果,都在一定程度上把调查结果当作现实看待。两篇综述文章中虽然也有一些分析和评论,但重点都是对调查结果进行归纳和描述,即都是以这些调查结果为基础,来描述生育意愿的变迁趋势。这些情况说明,目前学术界对现有的生育意愿结果的认识,往往都自觉不自觉地基于一种并不成立的前提:即现有调查结果都是对现实社会中人们生育意愿的真实反映,因而相信并接受它们。很少有学者去仔细解析每一项具体生育意愿调查的质量,去认真掂量不同研究结果反映现实生活中人们实际生育意愿的程度。
事实上,可以肯定的是,三十多年来的生育意愿调查,既有较好反映社会现实状况的,也有片面反映社会现实状况的。风笑天曾经以对独生子女进行的生育意愿调查研究为例,进行过具体解析。其研究结果表明:“到目前为止的有关第一代独生子女生育意愿的调查结果,给我们所描述的是一幅杂乱的图像:他们的平均意愿生育子女数目从1.00到1.50,希望生育一孩的比例从最低的45%到最高的80%;期望生育两个孩子的比例从最低的15%到最高的50%;不同调查结果相互之间的差别较大。……现有研究都没有做到完全反映第一代独生子女这一总体所具有的生育意愿的整体状况。或者说,这些调查结果都只是在有限的程度上、描述了这一总体中的一部分对象的生育意愿状况。”3那么,推而广之,现有的众多生育意愿调查结果很可能也是如此。因此,我们应该认识到:一方面,不同调查由于自身质量不同,因而其反映现实社会中人们的生育意愿的正确程度是大不相同的,有的可能相对接近而另一些则可能相对偏离人们的生育意愿;另一方面,每一项具体生育意愿调查所反映的都只是中国社会中彼时彼地、特定群体的生育意愿。或者说,不同调查结果所反映的往往只是现实的一部分。只有认真解析每一项具体生育意愿调查的对象、方法、过程和结果,才能更好地区分和辨识,也才能更好地利用调查所提供的有用信息去增加我们的认识。
第二,认真反思现有生育意愿测量的意义。改革开放三十多年来,学术界和政府相关部门一直都在关注和讨论生育意愿,关注和讨论人们的生育行为及其与社会的生育水平之间的关系。本研究结果的意义,在于提醒我们,在看待现有调查所得到的生育意愿结果时,应该始终保持清醒的认识。虽然在每一项生育意愿调查的结果中,都会得到一个关于人们生育意愿的具体数字,比如1.3、1.5、1.8等等,但这些数字究竟在多大程度上反映了社会现实,则是值得研究者认真分析和仔细推敲的。研究者应该清醒地认识到现有的生育意愿测量与人们真实的生育意愿之间存在什么样的差别,进而认识到我们对人们真实的生育意愿实际上只了解到多少。这是将生育意愿的调查结果作为制定人口政策重要参考时应注意的关键一环。而反思和检讨我们对于生育意愿的测量方式,既可以让我们更加客观、更加准确地看待以往生育意愿调查结果所反映的现实,同时也可以让我们在今后的生育意愿调查中,采取合适的测量指标了解社会现实,更好地为社会决策提供有价值的参考。
第三,影响生育意愿调查结果的其他因素。本文仅讨论了生育意愿调查中的测量效度问题及其对调查结果的影响。实际上,除了测量效度的影响外,生育意愿调查的结果还会受到一些其他因素的影响,比如調查对象选择的影响、调查方式选择的影响等。风笑天等人曾专门针对生育意愿调查中的对象选择及其对调查结果的影响问题进行了探讨。其研究结果表明,“无论是包含了不应该包含的对象,还是缺少了本应该包含的对象,所有不恰当的调查对象选择都会导致生育意愿调查结果形成一定的偏差,这些偏差会对我们的认识产生误导,也会对生育政策制定和调整产生影响”1。而对于不同调查方式的影响,也有研究者早就指出,采用在计生部门人员陪同下入户当面访问的方式进行生育意愿调查,会对调查结果产生明显的影响,“有的夫妇不愿轻易表明自己的真正意愿”,“他们中有的想生二胎,但面对调查员和提倡只生一个的社会舆论不敢言明”2。还有的研究者指出,采用自填问卷的方式,“由被调查者在家中填写,问卷表也不用署名,被调查者的心理压力较小,更容易说真话,因而调查结果相对客观,较少干扰性”3。因此,除了注意测量指标的效度问题外,还应对影响生育意愿调查结果的其他因素给予充分的注意。
第四,“全面二孩”背景中的生育意愿测量问题。如果说以往的生育意愿调查由于客观上受制于“一对夫妇生育一个孩子”的生育政策而无法有效地对人们真实的生育意愿进行测量的话,那么,目前“全面二孩”政策的实施,则为我们提供了相对正常、自然地了解人们生育意愿的空间。研究者既可以不用效度不高的“理想子女数”,也可以去掉“意愿生育子女数”前面的“假设条件”而直接测量生育意愿了。但是应该认识到,即便如此,目前的生育意愿测量实际上仍然只是在一定程度上反映人们的生育意愿。即在“全面二孩”政策实施的背景下,生育意愿调查所能了解到的,其实只是人们在“最多生两个”条件下的生育意愿,而不是一般意义上,没有任何约束条件的生育意愿(或者说,只是在“零至两个孩子”的有限范围内的生育意愿,而不是完整意义上不受限制的0-n个孩子的生育意愿)。这种一般意义上的生育意愿,只有当社会中不存在任何限制或者鼓励生育的人口政策时,即人们的生育完全处于一种自主的、自发的、自然的状态时才能得到。也只有在那时,我们进行生育意愿调查的结果才会相对可靠地反映社会现实。
(责任编辑:薛立勇)
The Fertility Desire of Chinese People:How Much do We Know Exactly?
Feng Xiaotian
Abstract: The survey practice of recent thirty years indicated that researches usually use “ideal number of children” and “number of children desired” to measure fertility desire of the people. But in fact, what “ideal number of children” measured is not the fertility desire of the people, but the view of the people on the fertility. The “number of children desired on the hypothesis” suppose no policy in the situation that there is policy in fact. So it can not reflect the fertility desire of the people perfectly. But it is closer than the “ideal number of children” to the fertility desire of the people. To know the limitation of the survey results of fertility desire and their distance with the reality is the key point when applying these results as the important reference in making population policy.
Keywords: Fertility Desire; Ideal Number of Children; Number of Children Desired;Validity of Measurement