五普以来中国及其分地区死亡漏报模式变迁
2025-01-22李婷闫誉腾支雅婷
【摘要】我国历次人口普查的死亡数据质量备受关注,尤其是不同地区的死亡漏报问题,长期以来对公共卫生政策、社会老龄化应对策略以及经济规划存在深远影响。然而,现有研究对分地区、分年龄段死亡漏报的纵向分析仍然较少,特别是在五普至七普期间中国社会的快速转型背景下,死亡漏报模式是否发生变化尚需深入探讨。文章基于对数二项模型和各级政府公布的死亡相关数据,修订五普至七普间各省、自治区及直辖市的死亡数据,系统分析死亡漏报的变动模式及其背后的潜在影响机制。研究发现全国婴儿死亡漏报率自五普以来呈显著上升趋势,从7.04%升至六普的70.99%以及七普的75.67%。但婴儿死亡漏报数量在七普时已显著减少,每十万人漏报从六普的931人降至七普的474人,婴儿死亡数据质量已有所改善。相比之下,成年段与老年段的死亡漏报问题持续恶化,成年段死亡漏报率从五普的5.28%升至七普的26.18%,漏报数量从每十万人674人增加至2230人;低龄老年段(60~79岁)死亡漏报率从五普的6.21%增至七普的22.64%,漏报数量从每十万人348人增加至920人;高龄老年段(80~99岁)漏报率从1.09%升至4.84%,漏报数量从每十万人108人增加至475人。分地区观察显示各地漏报的严重程度和年龄段侧重存在显著差异。婴幼儿死亡漏报率在华北和东北地区较高;成年段死亡漏报在华北、华东和西北地区尤为严重;低龄老年段漏报以西南、华南地区最高,而高龄老年段漏报则以华南和东北地区最为显著。进一步分析显示不同年龄段的漏报机制存在显著差异。婴幼儿死亡漏报率与其死亡水平之间存在显著的“U”型关系,即死亡率较低时漏报率反而升高,体现出低死亡水平下的统计敏感性的增强;成年段漏报与人口流动密切相关,流动人口参与度对漏报率有负向影响,表明外出人口死亡后返回原籍登记减少了漏报,流动人口能见度则对漏报率有正向影响,反映了流入地因流动人口返乡报告导致的漏报增加;老年段死亡漏报则更多受经济发展水平的影响,但与婴幼儿、成年段有较大不同,其漏报可能与社会经济条件、文化观念和社会支持系统间存在复杂的耦合关系。文章揭示了中国及其分地区死亡漏报模式变迁的基本图景,强调在评估死亡漏报时应结合中国社会的快速转型背景,而非仅依赖静态数理模型。未来研究需特别关注成年段和老年段死亡漏报问题,探索更具针对性的评估和干预策略。
【关键词】人口普查;死亡漏报;数据质量;死亡水平;模型生命表
【中图分类号】C924.24""""""""""""【文献标志码】"A""""""""""doi:10.16405/j.cnki.1004-129X.2025.01.004
【文章编号】1004-129X(2025)01-0049-16
一、引言
人口统计数据(尤其是死亡数据)的准确性直接关系公共卫生策略的制定、老龄化社会的应对措施以及长期经济规划的有效性,因而始终是学术研究和公共政策关注的核心问题。然而,除1982年的第三次人口普查数据质量较高外,历次人口普查均存在不同程度的死亡漏报问题。[1]随着2000年后中国经济的迅速发展、人口流动和结构的深刻变迁,死亡漏报的模式也可能发生了根本性的变化。深入研究死亡漏报的变迁过程不仅对于改进死亡数据收集和提升公共政策的针对性及有效性具有重要的实践价值,对于理解中国人口动态也具有重要意义。
已有对历次人口普查的死亡漏报研究显示婴幼儿与老年人口是死亡漏报的重灾区。在全国层面,对于婴儿死亡漏报率的截面估计,不同学者的估计区间从五普的18.32%、[2]29.46%~30.78%等,[3]到六普的68%、[4]75.5%~77.3%、[5]77.88%、[1]78%、[6]78.83%~84.39%、[7]78.0%~85.55%等,[3]再到七普的75.3%~76.1%、[8]77.8%~85.08%等。[9]同时,对于全国老年段死亡漏报率的截面估计,70~95岁老年人口死亡漏报区间从五普的11.5%~22.2%扩大到了六普的16.5%~24.3%;[10]60~89岁老年人口的漏报区间从六普的2.3%~7.09%、[5]8%~23%,[3]到七普的20.75%~22.55%;[9]60~79岁老年人口的漏报区间在七普则为26.79%~29.27%。[8]各学者对历次普查的估计区间显示婴儿死亡漏报从五普至六普有十分明显的上升,但六普至七普没有显著变化,老年死亡漏报则从五普至七普均有十分明显的上升,暗示了中国死亡漏报模式正在发生着潜在的变动。最近一项针对历次人口普查与人口抽样调查的纵向研究进一步提供了漏报模式变迁的佐证,即婴儿死亡漏报率从2000年的32.50%~41.00%上升至2010年间的67.80%~74.80%,但2016年后又开始下降,60~89岁老年死亡漏报率同样从2000年的11.10%~11.80%上升至2010年的12.60%~13.40%,且2010年的95~99岁老年人口漏报率甚至超过了20%。此外,该纵向研究也讨论了以往研究较为忽略的15~59岁成年人口死亡漏报问题,显示其与老年段十分近似的变动趋势,从2000年的11.80%~12.50%上升至2010年的13.30%~14.00%,[11]结合已有对七普成人死亡漏报的截面估计,其漏报区间大致为23.21%~41.75%,[8]暗示了七普成人死亡漏报率可能进一步攀升。
上述研究很好地揭示了中国普查死亡数据的漏报现状,但对于各省、自治区及直辖市的普查死亡漏报的系统分析和长期变化趋势的讨论却相对较少。已有对各地区普查死亡漏报的讨论仍然是以截面讨论为主,且1990年前后对于三普、四普的各地区死亡漏报差异的讨论没有很好地延续至五普,[12-13]直到六普后,对各地区普查死亡数据质量的讨论开始再次活跃。具体到婴儿死亡漏报,在各地区中,河南、湖南、四川存在较为严重的漏报,有研究对河南漏报率的评估区间甚至高达88.73%~95.51%,[4][6][14]而贵州、云南的数据质量相对较好,其漏报率分别为29.21%~38.20%、29.87%~35.63%。[14]同样的,具体到老年死亡漏报,海南、西藏和新疆可能存在老年段死亡人口的系统性漏报,其中新疆的漏报率可能超过了20%,而同期广东老年男性的漏报率低于1%,福建、上海和浙江的女性漏报率也相对较低。[10][14]部分学者为上述一般性讨论提供了更具地方性的见解,如新疆农村地区的婴儿死亡数据更差,且可能存在婴儿死亡误报为幼儿死亡的问题。新疆老年死亡数据中的农村地区70岁以上男性、80岁以上女性,城市地区70岁以上男性、女性可能存在较为严重的漏报问题。[15]
目前,对于不同年龄段死亡漏报的成因讨论尚无公认的一般性解释,这主要是死亡漏报问题十分复杂。死亡率的计算包括了作为分母的常住人口数与作为分子的死亡人口数,而前者与后者均存在重报、漏报及误报问题,这使死亡漏报率的估计会受到相当程度的干扰。[11]在不考虑重报与误报的前提下,婴幼儿的死亡漏报主要有四个原因,一是社会习俗导致的漏报,即农村地区因死亡避讳或“入土为安”导致的瞒报。二是政策导致的漏报,部分违规超生的新生儿产后死亡,其家人也倾向瞒报。三是技术导致的漏报,即普查填报时未区分死产或活产后死亡以及普查中常住人口与死亡人口的统计时间口径不一,使婴幼儿死亡未被有效登记。四是流动导致的漏报,即流动人口在经济发达地区所生的新生儿不幸死亡,可能会因其返乡休养而造成流入地漏报。[6][16]老年人口的死亡漏报主要有三个原因,一是社会习俗导致的漏报。二是经济因素导致的漏报,享有养老金的老年人口死亡,其家人可能会通过瞒报或缓报以领取养老金。三是流动导致的漏报。有学者猜测,如海南老年人口的漏报,可能是因为在11月1日的普查时点,候鸟老年人口被计算在内,但身体状况欠佳的老年人口会因“落叶归根”而提前返乡,使死亡数被原籍地记录,这一常住人口的增加与死亡人口的减少提升了流入地的漏报率。但对老年流动的漏报影响也存在另一看法,即健康的个体才会流出原籍地,从而降低流入地的死亡率,造成事实上流入地的漏报率减少。[10][16]在上述关于死亡漏报的纷繁解释中存在两个基本的影响因素,即人口流动水平与经济发展水平。流动水平越高的地区普查工作的难度越大,相应各年龄段的死亡漏报可能性越高。经济水平越高的地区对火葬的排斥越小,超生的可能越低,婴幼儿死亡的瞒报可能性越低。但由于较发达地区相对更多的独居老人、更完备的养老金制度,老年段死亡的漏报、瞒报可能性也越高。此外,在较低死亡水平下,较少的死亡数量漏报可能会带来较大的漏报率,这也是死亡漏报率变动的一个重要解释。
对已有研究的简要回溯揭示了两个潜在问题。第一,由于中国的地域广阔、发展不均以及历史上不同时间点的政策和社会环境的差异,导致各地区之间在死亡数据漏报的程度和模式上存在显著差异,但目前仍缺少对历次普查的地区死亡漏报情况的纵向讨论(尤其是七普的各地区死亡漏报是否出现了新的变化)。第二,已有研究在解释死亡漏报时往往基于定性的解释,缺乏将各地区、各年龄段的死亡漏报水平与潜在影响因素之间关联起来的定量分析,难以讨论死亡漏报背后的各影响因素效应大小以及各影响因素效应是否针对不同年龄组存在异质性效应。本文旨在填补上述研究空白,通过采用对数二次项模型,修订了五普至七普期间各地区公布的普查死亡数据,对中国各地区的死亡漏报模式的变迁进行系统研究。这一讨论不仅为死亡漏报的相关讨论提供了新的视角和实证支持,也为政策制定提供了数据质量监测的相应依据,以优化公共卫生策略和应对人口老龄化等挑战。
二、研究方法与数据来源
1.研究方法
为回应前述研究问题,本文对可获得的普查死亡数据进行了修订。已有对死亡数据的修订方法可以被概述为两类,即针对全年龄段的经验模型评估与针对特定年龄段的特殊评估模型,前者以模型生命表为代表,后者以通过拟合各社会经济水平与特定死亡率的回归模型为代表。[8]综合考虑后,本文选择Wilmoth等人开发的对数二项模型作为主要修订方法,[17]这主要是因为随着中国快速的健康转变,经典方法如Brass-Logit模型、联合国模型等所依赖的前提假设正经受着越来越多的挑战,而对数二项模型可以根据实时更新的人类死亡率数据库(HumanMotalityDatabase,HMD)拟合更稳健的修订模型,因其很好的适用性与可复制性,受到了越来越多的应用。[18]
具体以单参数二项法为例,其基本思路认为0~4岁的儿童死亡概率对数与各年龄别死亡率对数存在显著相关,[17-18]即:
[logmx=ax+bx⋅log5q0+cx⋅log5q02+vxk+εx](1)
[mx]为[x]岁的瞬时死亡率,[5q0]为5岁及以下儿童死亡概率,[ax]为[x]岁的截距项,表示当[log5q0=0]时的死亡水平,[bx]为[x]岁死亡率和[log5q0]的线性关系斜率,[cx]为[x]岁死亡率与[log5q02]的二次非线性关系系数,[vx]为[x]岁的偏差项系数,用于捕捉[log5q0]以外的年龄相关性偏差,[k]表示偏离典型死亡率模式的强度参数,尤其用于调整15~59岁的成人死亡水平,[εx]为模型残差值。通过式(1)回归拟合,可以获得主要模型参数([ax]、[bx]、[cx]),但由于系统性偏差模式[vxk]是乘积项,直接回归拟合会将其归入噪声项[εx]中,无法同时分解并估计这两个变量。为此需引入奇异值分解,通过对回归残差矩阵的分解,提取年龄间的偏差模式([vx])及其强度([k]),从而估计潜在的系统性偏差模式[vxk]。参数选择上,对数二项模型可以被扩展至两参数,输入如0岁预期寿命、婴儿死亡率(0岁死亡概率,后同)、成人死亡概率等。由此,本文基于2023年9月人类死亡数据库中获取的1751年至2022年间50个国家或地区的991张生命表数据,拟合获得了可供修订各年龄段死亡概率的基本参数。此外,本文也拟合了剔除问题年份或重叠人群后的840张生命表数据作为敏感性检验,各年龄段死亡概率的估计结果无显著差异。
本文将修订后的死亡概率与普查报告的死亡概率进行比较,获得死亡漏报的估计。[11]与以往多数研究仅评估死亡漏报率不同,本文使用了两种计算方式,以获得更全面的评估。其一是相对的死亡漏报率,如式(2)所示,[nURx]为[x]+[n]岁组年龄别死亡漏报率,[nqx]为修订后的[x]+[n]岁组死亡概率,[nqx]为普查报告的[x]+[n]岁组死亡概率。其二是绝对的每十万人死亡漏报数量,如式(3)所示,[nUNx]为[x]+[n]岁组每十万人死亡漏报数量,[nqx]、[nqx]与式(2)含义相同。前者提供了一个各地区自身变动比较的相对值,后者则提供了一个跨地区比较的绝对值。
[nURx=100×nqx−nqxnqx](2)
[nUNx=nqx−nqx×100000](3)
通过上述工作,本文能够对全国以及各地的不同年龄段死亡漏报率有一般性了解。进一步通过标准化的线性回归模型,引入可能潜在影响漏报率的基本因素,本文得以对五普以来死亡漏报背后的各影响因素进行定量分析。
2.基本数据与修订参数
本文的基础数据来自五普至七普间全国以及各省、自治区和直辖市的死亡数据,获得全体人口的原始生命表共96张。因普查体系不同,本文分析不包括港澳台地区,后不再赘述。
为了对死亡数据进行统一校订,本文收集整理了五普以来的全国以及各地区的预期寿命与5岁以下儿童死亡率参考指标(见表1)。预期寿命指标主要来自《中国人口和就业统计年鉴2021》1。5岁以下儿童死亡率主要来自两个渠道,第一个来源是妇幼卫生监测系统中的2000年、2010年数据,该数据系妇幼卫生监测办公室、中国疾病预防控制中心及IHME等机构联合发表使用的1996—2012年中国2851个区县的5岁以下儿童死亡率数据集,[19]这也是该官方监测系统数据的首次间接性发布,本文通过将其区县代码与五普、六普的区县代码进行匹配,以各区县婴幼儿人口数量作为权重,通过式(4)计算得到省、自治区及直辖市一级的5岁以下儿童死亡率。其中[i]为31个省、自治区及直辖市,[k]为各地区的区县个数,[Ni,j]为[i]地区的[j]区县的0~4岁人口数量,[mi,j]为[i]地区的[j]区县的5岁以下儿童死亡率。
[U5MRi=j=1kNi,j⋅mi,jj=1kNi,j](4)
第二个来源是本文收集整理的全国以及各地区政府公开发布的2020年数据,包括如统计年鉴、妇女与儿童发展规划及其相关监测报告、“十二五”卫生健康事业发展规划等。尽管儿童死亡率方面因数据来源不同,可能存在不同地区间口径的可比性问题,但受限于自五普以后,卫生统计年鉴等政府资料不再提供统一修订的全国以及各地区婴幼儿死亡率,这一整理已是目前能做到的最贴近政府修订值的尝试。此外,为使行文逻辑连贯,对于影响漏报率的潜在因素,其相关数据来源将在死亡漏报的变动机制一节再作介绍。
3.修订结果的简要评估
通过上述工作,在假定收集整理的指标数据是相对准确的前提下,本文得到了修订后的全国以及各地区的分年龄别死亡概率,进而获得相应的死亡漏报率估计值。为了确认这一估计值与已有研究保持了基本一致,本文以学界相对评估最多的六普分省死亡数据作为对照,显示本文估计结果具有很高的信度,其结果如图1所示。
首先,比照作为输入参数的0岁预期寿命与5岁以下儿童死亡率。预期寿命方面,与普查的原始报告值相比,政府修订值和不同学者对预期寿命的估计值均有明显下调。杨明旭和鲁蓓所估计的预期寿命值与政府修订值十分近似,[20]因其使用的基础校订参数来自妇幼卫生监测系统,同样是政府修订时的主要参考数据。以李成和米红的分性别估计值作为上限与下限,[14]则政府修订的全国以及各地区的32个值中有30个值在其区间范围,仅海南和西藏分别有略低(-0.4岁)和略高(0.19岁)的估计值。相对而言,舒星宇等人的估计值显著低于上述估计,[21]可能与其使用曾生子女数的间接估计法有关,该估计方法会高估快速变迁的死亡率,进而拉低预期寿命估计。据此,本文认为《中国人口和就业统计年鉴2021》中政府修订的预期寿命值基本合理。
5岁以下儿童死亡率方面,由于本文与杨明旭和鲁蓓、IHME使用主要参考数据均为妇幼卫生监测数据,[20][22]并进行了近似的加权计算,结果呈现了高度一致。将本文参数与杨明旭和鲁蓓参数、IHME参数比较,在全国以及各地区中差值绝大多数不超过0.5‰。如果将李成和米红估计的男性值作为下限、女性值作为上限1,[14]则本文参数中也有六成样本均在其估计区间,且在区间外的参数与其上下限差值超过2‰的仅有西藏,考虑《西藏自治区儿童发展规划(2011—2015年)》中披露的5岁以下儿童死亡率仅为28.15‰,本文值仍比其高出了15.29‰,具有较高的合理性。据此,本文使用的妇幼监测点数据与已有研究保持了基本一致,具有较高信度。
通过上述参数与模型,本文调整了全年龄段死亡概率,以学界讨论较多的婴儿死亡率与60~89岁老年死亡概率进行比照,体现了本文估计结果较高的信度。婴儿死亡率方面,已有研究中黄荣清和曾宪新的估计值相对较高,[6]黄润龙的估计值相对较低。[4]如果将二者的估计值作为上下限,则本文的修订值超过2/3介于二者估计值之间,且区间外的绝大多数修订值与黄润龙、黄荣清和曾宪新的估计值差值不超过1‰,仅云南、贵州、江西相对较低,新疆、西藏相对较高。本文与黄荣清和曾宪新、黄润龙的部分估计差异应主要是由于拟合模型导致的差异,他们均使用了外部数据如经济发展水平进行校订,可能存在一定高估。同时,本文修订值与李成和米红所估计的区间十分一致,[14]在全国30个地区与其差值不超过±0.5‰,仅西藏低于其估计下限1.96‰。
同样,在60~89岁老年死亡概率方面,本文估计结果在全国以及各地区23个样本均在李成和米红的估计区间内,[14]其余地区与其区间上下限差值不超过5%,仅海南高于其估计区间上限6.87%,吉林、黑龙江低于其估计区间下限5.97%、5.60%。考虑李成和米红对海南的老年段死亡概率估计值是全国最低,低于上海、北京,而已有研究显示吉林、黑龙江在六普的预期余寿分别排位全国第六和第十五,[23]本文对海南的上调与对吉林、黑龙江的下调均较为合理。因此,在老年死亡概率方面,本文与李成和米红估计值的高度一致性,显示了对数二项模型与DCMD模型修订结果的较高的一致性。
三、我国分地区死亡漏报的基本特征和变动趋势
上述修订工作为本节系统评估五普以来的分地区死亡漏报提供了数据基础,本节按全国以及传统的七大经济区划分,对0~4岁婴幼儿、15~59岁成年段、60~79岁低龄老年段以及80~99岁高龄老年段的各地区死亡漏报的基本情况与变动趋势作简要讨论。对于5~14岁死亡漏报,鉴于多数的漏报讨论并未关注,且该年龄段在七普时多数地区的死亡概率已降至极低的1‰以下,本文不再报告。本节结果显示五普以来全国死亡漏报中婴幼儿死亡漏报率呈持续上升趋势,但每十万人婴幼儿死亡漏报数量在七普时已有很大改善;成年段、老年段死亡漏报率、每十万人死亡漏报数量均持续上升,死亡漏报问题趋于严重。各地死亡漏报问题复杂,漏报严重程度与年龄段侧重均存在显著差异。
1.婴幼儿死亡漏报
如图2、图3所示,全国婴儿死亡漏报从五普的7.04%上升至六普和七普的70.99%、75.67%;全国5岁以下儿童死亡漏报从五普的6.80%上升至六普和七普的59.11%、66.21%。结合每十万人死亡漏报数量可以发现全国婴儿死亡漏报数量呈现了先上升后下降的趋势,从五普的每十万人漏报199人到六普的931人,再至七普的474人,全国5岁以下儿童死亡漏报数量呈现了一致的变动趋势。与已有研究一致,本文评估显示了婴幼儿死亡漏报率从五普以来呈现显著上升趋势,婴幼儿死亡漏报问题似乎趋于严重,但更仔细的检视可以发现相对漏报率并不能反映绝对漏报数量,如从漏报数量角度观察,则六普至七普间,全国婴幼儿死亡漏报问题已有很大改善,漏报数量下降了49.09%。
分地区观察婴儿死亡漏报率,五普和七普最高的两个地区为华北、东北,天津始终是华北地区较高漏报率的主要贡献地区。东北地区中黑龙江的漏报率始终最高,且该省在六普、七普的全国漏报率排序始终位列前三。华中地区在六普时漏报率最高,主要是由于河南当年漏报率(93.79%)全国最高,但在七普时华中地区被华东、华南地区超过,主要是由于七普中山东、海南的漏报率排位相较于六普有显著上升。婴儿漏报率最低的地区始终是西南、西北地区,主要是云南、贵州的漏报率始终较低。[14]在婴儿死亡漏报数量方面,五普以来华东地区始终保持最低且以上海为代表的华东地区省份的排位仍在下降。西北、西南地区在五普、六普时较高,青海和贵州始终有较高的死亡漏报人数,但东北地区在七普时的死亡漏报数量稍微超过了西北、西南地区,主要是因为青海和贵州的漏报数量在七普时有显著下降,而吉林的排位从五普至七普间有显著上升。
因此,当结合考察漏报率与漏报数量时可以发现:五普以来就婴儿死亡漏报而言,我国华北、东北、华东地区虽然有较高的漏报率,但漏报数量较低,而西南、西北地区虽然有较低的漏报率,但漏报数量较高,这与死亡水平、漏报率以及漏报数量之间的动态关系有关。漏报率和漏报人数的差异在很大程度上取决于死亡水平,在同等漏报率下,死亡水平越低,漏报数量越低。举例来说,尽管华东地区与西北地区在七普有着十分接近的婴儿死亡漏报率,分别为56.07%、52.37%,但二者的死亡水平不同,分别为3.36‰、5.72‰,这导致每十万人婴儿死亡漏报数量分别为197人、295人,后者是前者的1.50倍,这一数值在六普时达到2.02倍。5岁以下儿童死亡漏报呈现了相近的结果。
上述描述很好地揭示了全国以及地区间婴幼儿死亡漏报的复杂情况,一方面,七普婴儿死亡水平的下降,使全国以及各地区的死亡漏报数量已有很大改善,但这也直接影响了全国以及部分地区的婴儿死亡漏报率的小幅上升;另一方面,在相近的漏报率水平下,因地区间的死亡水平差异,各地死亡漏报数量仍然存在显著差异。
2.成人死亡漏报
如图3所示,与婴儿死亡漏报呈现的漏报率与漏报数量的相异变动趋势不同,15~59岁成人死亡漏报在漏报率与漏报数量上呈现了基本一致的趋势,均在五普至七普间持续上升。全国成人死亡漏报率从五普的5.28%上升至六普和七普的18.98%、26.18%,这与已有研究基本一致,李成和米红估计的六普成人死亡漏报率大致为13.30%~14.00%,[11]李婷等估计的七普成人死亡漏报率大致为23.21%~41.75%。[8]全国每十万人成人死亡漏报数量,则从五普的674人上升至六普和七普的2040人、2230人。
分地区观察可以发现五普以来华北、华东与西北地区始终是成人死亡漏报率较高的地区,而东北、西南地区成人死亡漏报率相对较低。对成人死亡漏报的观察有两点值得注意。第一,全国以及各地的成人死亡漏报问题正在变得突出。相较于六普,七普中西北、华东地区成人死亡漏报率显著升高,但二者背后的驱动原因可能不同。西北地区始终处于较高的死亡水平,七普时的成人死亡概率为126.14‰,漏报率为44.98%。而七普时华东地区的成人死亡概率为51.03‰,但其漏报率也高达43.96%。如按从高到低排位各地的漏报率,则华东地区的浙江、上海,以及西北地区的甘肃刚好位列前三位。显然,西北地区与华东地区相近的成人死亡漏报率,其背后的驱动模式是不同的。在西北地区,尤其是少数民族地区,以“入土为安”等传统习俗主导的死亡瞒报仍十分常见;在华东地区,则可能是由于流入地常住人口死亡后返乡登记导致的漏报。
第二,相对于普查原始值,本文对五普时四川、重庆、海南的成人死亡水平可能有一定低估,这使西南地区和华南地区在死亡数量方面呈现出观测死亡率高于估计死亡率的“多报”现象。这一现象有多种可能的解释,一方面是上述地区可能存在的死亡重报,即同一死亡个体被重复报告,西南地区作为传统劳务输出省份,其人口流动参与度一直很高,在五普、六普时期均处于全国前列,[24]但五普时的普查死亡登记仍是按常住地登记,外出务工的死亡人口有可能经流出地家庭主动上报而被再次记录,[25]使流出地的成年段常住人口死亡数出现多报;另一方面,多报现象可能与死亡重报无关,或是人口数漏报导致的,即某些在普查时点的短期外出务工人口没有被流出地家庭上报,[25]或是人口异质性改变导致的,即按照迁移研究中的健康选择机制来理解,健康的成年个体流入发达地区,不健康的个体留在原地,[26]这可能增加了流出地人群的死亡概率,导致流出地实际死亡人数有所增加。此外,考虑已有研究指出川渝地区在2000年后的死亡模式特征表现为高于全国水平的5~49岁死亡率,[27]本文基于偏重发达国家数据库的HMD数据,所拟合出的模型可能低估了五普时西南地区成人死亡率,因此也不能排除这一多报现象是否是由模型误差导致的。如去除上述可能存在多报的省份,五普时期华南地区的成人死亡漏报率最低,仅4.41%,其次是东北、华东地区,而西北、华北地区漏报则最严重,分别为14.64%与12.91%。
3.老年死亡漏报
老年死亡漏报在漏报率与漏报数量上呈现了基本一致的趋势。全国老年死亡漏报率方面,60~79岁老龄段从五普的6.21%上升至六普和七普的14.71%、22.64%;全国80~99岁老年段从五普的1.09%上升至六普和七普的3.12%、4.84%。全国每十万人成人死亡漏报数量方面,60~79岁老年段从五普的348人上升至六普和七普的722人、920人;全国80~99岁老年段从五普的108人上升至六普和七普的309人、475人。如对90~99岁老年段做进一步检视,则六普中全国90~94岁、95~99岁组的死亡漏报率分别为14.38%、20.53%,这一估计结果与李成和米红的估计结果十分一致,[11]且本文的估计结果显示上述两个年龄组的老年漏报率在七普继续小幅上升至17.29%、21.34%。
分地区观察发现:在低龄段老年(60~79岁,后同)死亡漏报方面,西南、华南地区漏报始终较为严重,而东北、华北、华中地区漏报相对较少。七普中以西南地区漏报率最高、东北地区漏报率最低;在高龄段老年(80~99岁,后同)死亡漏报方面,东北、华南地区始终较为严重,而华东、华中、西南、西北地区漏报相对较少,七普中以东北地区漏报率最高、华东地区漏报率最低。结合来看,以低龄、高龄老年段及其死亡漏报率高低为二乘二交叉组,则华中地区的老年段漏报在低龄、高龄段均较少,以湖北为代表,其七普时的低龄、高龄老年漏报率在5.96%与2.76%。华南地区的老年段漏报在低龄、高龄段均较为严重,以海南为代表,其七普时的低龄、高龄老年漏报率均为全国最高,分别为40.83%、18.63%。东北地区的老年段死亡漏报则表现为低龄段较少而高龄段严重,以吉林为代表,其七普时低龄老年漏报率低于全国平均水平,仅为12.98%,但高龄老年漏报率仅次于海南,为15.60%。西南、华东地区则表现为低龄段较严重而高龄段较少,以重庆、浙江为代表。此外,华北、西北地区并没有在某一年龄段的死亡漏报方面有突出特征,以北京为代表的较发达地区,低龄、高龄漏报均较低,而以陕西、新疆为代表的欠发达地区,低龄、高龄漏报均较高。上述讨论充分显示了各地区不同的老龄年龄段漏报模式存在着显著差异。
此外,本文的估计结果显示五普时期华北、东北地区也呈现了一定的低龄老年死亡多报现象,主要体现在河北、天津、内蒙古以及吉林等地。已有对人口数量重报的研究指出我国五普、六普的中、老年年龄段人口数量无明显异常,[25][28]且流动人口中老年段相对较少,则这一死亡多报可能与本文对上述地区老年段死亡水平的低估有关。有研究认为以天津为代表的直辖市、以吉林为代表的东北地区,以及以内蒙古为代表的西北地区,上述地区的老年死亡水平均超过全国平均值,[27]相对高的普查报告值与相对低的本文估计值可能导致了多报现象。但总体而言,尽管本文对部分地区的老年段死亡估计可能存在一定低估问题,五普至七普间全国以及各地的老年段死亡漏报率与死亡漏报数量仍有明显涨幅,老年死亡漏报问题均趋于严重,这一发现与已有研究一致,[11]并在七普的分地区估计中得到了进一步证实。各地区中,华北地区在六普至七普间的60~79岁老年段死亡漏报率的年均增幅为各地区最高,达12.29%。
四、我国分年龄段死亡漏报的影响机制讨论
上文讨论了五普以来分地区的死亡漏报的基本情况与变动趋势,但已有研究对死亡漏报率背后的驱动机制讨论仍然较少。尽管地区间存在较大异质性,不同年龄段死亡漏报的原因却仍然存在一些相同点,且大致可以被归结为三个主要要素,即死亡水平所带来的统计敏感性、人口流动强度以及经济发展水平。为了更深入地理解上述因素如何影响了死亡漏报率,本节将对上述因素与五普以来各省(区、市)的漏报率进行拟合,研究发现:婴幼儿死亡水平对婴幼儿死亡漏报有重要影响,二者呈“U”型曲线关系;流动强度对成人死亡漏报有重要影响,且人口流入或流出对死亡漏报均有显著作用;经济发展水平则更多解释了老年段死亡漏报。不同年龄段的死亡漏报机制存在明显的差异。
1.外部数据与基本方法
第一,数据方面,以学术界讨论较多的各年龄段死亡漏报率作为因变量。自变量中,在死亡水平方面,本文使用了估计得到的各年龄组死亡概率;在人口流动方面,本文使用段成荣等估计得到的流动人口参与度与流动人口能见度作为流动水平的代表,[24]前者体现了某地区流出的流动活跃度,后者意味着某地区流入的流动活跃度;在经济发展水平方面,本文引入了国家统计局公布的人均GDP、分城乡人均可支配收入,并按1981年GDP指数、CPI指数平减,对上述指标做主成分分析降维,提取的第一主成分贡献率超过85%,作为一般性的经济发展水平。
第二,方法方面,考虑三期普查的样本量有限,主要使用OLS线性回归模型,并对报告系数做标准化处理,以比较各机制的贡献大小。本节同时考察了控制地区后的固定效应模型,结果无显著变化。
2.漏报变动机制的讨论
对各年龄段各潜在机制的拟合模型可见表2的模型(1)至模型(5)。首先,本文检视了不同年龄段的死亡漏报率是否与其自身的死亡水平有关,且考虑死亡水平与死亡漏报率之间可能存在非线性的曲线关系,本文在控制相同变量后,遍历了各年龄组死亡水平的四次项及以下的项组合,根据多重共线性检验与系数显著性检验,发现仅在婴幼儿死亡漏报方面,死亡水平与其对应的漏报率呈现为二次曲线关系,而这一曲线关系并未表现在成人、老年段死亡漏报方面。为行文简洁,本文省去相关检验报告。
模型(1)的婴儿死亡漏报率模型显示:在控制各因素后,婴儿死亡水平及其平方项的标准化系数仍然最高,婴儿死亡水平与婴儿死亡漏报率呈现了很强的“U”型曲线关系。去除可能存在多报的地方后,本文对二者关系再次拟合(见图7)。基于该二次项拟合曲线,当婴儿死亡率逼近0‰时,与之对应的漏报率大约为69.64%,当婴儿死亡率为67.97‰,与之对应的漏报率到达最低点27.14%。按照中国经验拟合的数据显示:随着婴儿死亡率的下降,会经历一个下降后再上升的过程。该变动模式与已有对死亡漏报的评估保持了基本一致,孙福滨等人对四普云南省的估计显示:较低的婴儿死亡漏报率(25.20%~35.14%)却对应着较高的婴儿死亡率(55.53‰~61.51‰)。[13]同时,很多学者认为六普的河南婴儿死亡漏报率近90%,本文计算的河南的婴儿死亡率在六普为13.42‰,按二次曲线预测的漏报率虽仅为54.52%,但也处于拟合曲线的高位。因此,结合前述一节的讨论,虽然我国的婴儿死亡漏报率在最近20年有较大上升,但从绝对值看,漏报数量在七普是下降的,漏报率的上升事实上反映的是极低死亡水平下的高统计敏感性。本文揭示的婴儿死亡水平与婴儿漏报水平的规律,回答了已有截面研究未尽的问题,即六普时婴儿死亡漏报率很高的河南省,与婴儿死亡漏报率很低的贵州省、云南省,其主要机制是因为各地所处的死亡水平不同,而对漏报的敏感性不同导致的。在可预见的未来,我国婴幼儿死亡漏报仍然会维持在相对较高的水平。
其次,本文检视了不同年龄段的死亡漏报率是否与各省流动水平有关。可以看到流动机制更多表现在婴幼儿与成人段方面,但对老年段并没有显著影响。一方面,在婴幼儿组中,模型(1)和模型(2)显示了婴幼儿死亡漏报还受到流动人口能见度的显著负向影响,这没有支持已有研究的观点,即流动人口在经济发达地区所生的新生儿不幸死亡,可能会因其返乡休养而使流入地漏报。相反,模型暗示了婴幼儿死亡可能因普查时流动人口在流入地直接上报,而降低了流入地漏报。另一方面,模型(3)的成人死亡漏报模型显示,除死亡水平外,流动确实是成年段死亡漏报的最主要的影响机制,流动人口参与度与流动人口能见度对成人死亡漏报率均起到了重要作用,前者与成年段死亡漏报呈现显著负向关系,表明流出人口的异地死亡可能会减少流出地死亡漏报率,后者则与成年段死亡漏报呈现显著正向关系,表明流入人口的死亡可能会增加流入地死亡漏报率,这一增减关系暗示,对于成年段死亡而言,成年段流动人口死亡后的返乡报告可能是一个常见现象。总体而言,随着乡土中国向流动中国的进一步转型,人口流动对于普查死亡漏报的重要性正日益凸显。
最后,本文检视了不同年龄段的死亡漏报率是否与经济发展水平有关。经济发展水平机制更多表现在老年段方面,但对婴幼儿与成年段并没有显著影响,且系数极小。一方面,虽然模型(1)和模型(2)中经济发展水平的提高与婴儿死亡漏报率存在正向关系,但这可能是经济发展水平与婴儿死亡率间的强相关导致的,为了验证这一点,本文加入其与婴儿死亡率的交互项后,系数不再显著,为行文简洁不再报告。另一方面,模型(4)和模型(5)的老年段死亡漏报模型显示了低龄老年人口与高龄老年人口的死亡漏报存在相近却不同的机制。
对于低龄老年人口而言,尽管本文纳入的主要因素没有显著,但在另一意义上,本文部分拒绝了低龄老年人口漏报是由于流动、因经济因素导致的漏报或瞒报以及较低死亡水平导致的高漏报敏感原因,这些因素可能存在影响,但并没有想象中重要。结合已有研究,低龄老年人口的漏报问题可能更与难以操作化的文化、观念因素有较大关系。在我国多数地区,个体在平均预期寿命前的死亡仍然被视为不吉事件,且“入土为安”的观念仍十分重要,这可能是低龄老年人口死亡漏报的主要原因。对于高龄老年人口而言,模型显示经济发展水平对漏报率有显著的正向影响,这与已有研究讨论的瞒报死亡以获取养老金可能有关,但随着养老金体系的完备,这一可能性在下降。另一个猜测是随着独居老年人口数量的大幅增加,孤寡老年人口死亡未被及时发现的现象增加,这可能是老年段死亡漏报的新的潜在原因。因此,老年段死亡漏报与婴幼儿、成年段存在较大不同,其漏报可能与社会经济条件、文化观念和社会支持系统存在复杂的耦合关系。
五、结论与讨论
本文基于对数二项法与相关死亡参数,对五普以来的中国及其分地区死亡漏报模式的变迁进行了深入分析。研究表明尽管全国的婴儿死亡漏报率呈持续上升趋势,但在七普时期每十万人婴儿死亡漏报数量显著减少,这一变化可能反映了普查中通过更全面覆盖和严格登记校正措施,实现了普查中婴儿死亡数据统计质量的提升。然而,成年段和老年段的死亡漏报率及数量持续上升,表明这两个年龄段的死亡漏报问题日益严峻。地区层面的分析揭示了死亡漏报的地理分布差异:婴儿死亡漏报率在华北和东北较高,西南和西北较低;成年死亡漏报在华北、华东和西北严重,东北和西南较低;老年死亡漏报在华南突出,华中较低,地区之间的死亡漏报在严重程度和年龄段侧重方面显示出了显著差异。从影响机制的分析中可以进一步看出婴幼儿死亡漏报率与死亡水平存在“U”型关系,反映了不同死亡水平下的统计敏感性差异。成年死亡漏报与人口流动强度有显著关联,流入和流出人口均对死亡漏报有重要影响。高龄老年死亡漏报则更多受经济发展水平影响。不同年龄段死亡漏报的影响机制差异明显,这为理解中国死亡漏报的模式变迁提供了重要线索。
本文存在一些不足。首先,在数据评估方面,由于缺少较新的中国分区模型生命表,本文基于人类死亡率数据库的估计,可能在部分地区、部分年龄段的校正中存在高估或低估问题。其次,在地区细分方面,本文按传统地理区位进行的划分可能掩盖了各地区的内部差异。最后,在机制讨论部分,受限于数据可得性,本文难以量化各地区的文化观念、养老金制度完备性等维度。但是,鉴于当前分地区的纵向死亡漏报讨论仍然很少,本文为死亡漏报的相关讨论提供了新的视角和实证支持,同时,本文在评估方法上也佐证了在成人死亡漏报率正在快速增长的情况下,经典模型生命表如Brass-Logit通常假定的成人死亡率相对准确可能存在较大问题。[8][11]
总结而言,本文对理解中国及其分地区死亡漏报模式的变迁提供了重要的视角和实证基础,对于改进死亡数据收集方法、优化公共卫生政策和应对人口老龄化挑战具有重要的实践和理论价值。鉴于死亡漏报的变动模式可能会对公共卫生政策和老龄化社会的应对策略产生重要影响,未来的研究和政策制定应充分考虑不同地区的死亡漏报的复杂性和多变性,并特别关注普查以及抽样调查中成年和老年死亡漏报情况,探索其漏报影响机制,以实施有效的监测和干预措施。
【参考文献】
[1]张文娟,魏蒙.中国人口的死亡水平及预期寿命评估:基于第六次人口普查数据的分析[J].人口学刊,2016(3):18-28.
[2]翟德华.中国第五次人口普查全国人口死亡水平间接估计[J].人口与经济,2003(5):65-69.
[3]王金营.1990年以来中国人口寿命水平和死亡模式的再估计[J].人口研究,2013(4):3-18.
[4]黄润龙.1991—2014年我国婴儿死亡率变化及其影响因素[J].人口与社会,2016(3):67-75.
[5]李成,米红,孙凌雪.利用DCMD模型生命表系统对“六普”数据中死亡漏报的估计[J].人口研究,2018(2):99-112.
[6]黄荣清,曾宪新.“六普”报告的婴儿死亡率误差和实际水平的估计[J].人口研究,2013(2):3-16.
[7]赵梦晗,杨凡.六普数据中婴儿死亡率及儿童死亡概率的质疑与评估[J].人口研究,2013(5):68-80.
[8]李婷,郑叶昕,闫誉腾.第七次人口普查数据死亡水平估计[J].中国人口科学,2022(5):2-16,126.
[9]王金营,魏晓.中国人口普查死亡数据质量评估及2010—2020年死亡模式转变分析[J].人口学刊,2023(4):1-16.
[10]GuD,HuangR,AndreevK,etal.AssessmentsofMortalityatOldest-oldAgesbyProvinceinChina's2000and2010Censuses[J].InternationalJournalofPopulationStudies,2016,2(2):1-25.
[11]李成,米红.中国1982年后人口普查和抽样调查中死亡漏报的估计:基于bayesian分层回归模型[J].人口研究,2022(1):19-36.
[12]郝虹生,E·阿瑞葛,J·班尼斯特.中国分省死亡率分析[J].人口研究,1988(4):1-10.
[13]孙福滨,李树茁,李南.中国第四次人口普查全国及部分省区死亡漏报研究[J].中国人口科学,1993(2):20-25.
[14]LiC,MiH.AssessmentsofProvincialMortalityinChina's2010PopulationCensusBasedontheDevelopingCountriesMortalityDatabaseModelLifeTable[J].JournalofPopulationResearch,2021,38(2):169-196.
[15]李建新,刘梅,刘瑞平.新疆城乡人口死亡水平分析[J].西北人口,2020(2):39-51.
[16]黄荣清.20世纪90年代中国人口死亡水平[J].中国人口科学,2005(3):11-20,95.
[17]WilmothJ,ZureickS,Canudas-RomoV,etal.AFlexibleTwo-dimensionalMortalityModelforUseinIndirectEstimation[J].PopulationStudies,2012,66(1):1-28.
[18]张震,戴志杰,杨菁.二维死亡模型对中国人口死亡模式的适用性研究[J].中国人口科学,2017(1):81-91,127-128.
[19]WangY,LiX,ZhouM,etal.Under-5Mortalityin2851ChineseCounties,1996-2012:ASubnationalAssessmentofAchievingMDG4GoalsinChina[J].TheLancet,2016,387(10015):273-283.
[20]杨明旭,鲁蓓.中国2010年分省死亡率与预期寿命:基于各省第六次人口普查资料[J].人口研究,2019(1):18-35.
[21]舒星宇,温勇,宗占红,等.对我国人口平均预期寿命的间接估算及评价:基于第六次全国人口普查数据[J].人口学刊,2014(5):18-24.
[22]IHME.ChinaSubnationalMDG4/5[R].Seattle,UnitedStates:InstituteforHealthMetricsandEvaluation(IHME),2015.
[23]乔晓春.全国及各省份老年健康预期寿命变化及差异比较[J].人口与经济,2023(5):1-21.
[24]段成荣,邱玉鼎,黄凡,等.从657万到3.76亿:四论中国人口迁移转变[J].人口研究,2022(6):41-58.
[25]陶涛,张现苓.六普人口数据的漏报与重报[J].人口研究,2013(1):42-53.
[26]郭未,马炬申.远方与故乡:农民工的流动范围、社会环境与健康结果:基于CMDS2017数据的多重假说检验[J].青海民族研究,2023(3):52-69.
[27]李成.中国分省死亡水平和死亡转变模式识别研究[D].杭州:浙江大学,2021.
[28]王广州.对第五次人口普查数据重报问题的分析[J].中国人口科学,2003(1):65-68.
[责任编辑李新伟]
VariationsinthePatternsofMortalityUnderreportinginChina
andItsSubregionssincetheFifthCensus
LITingA,YANYutengB,ZHIYatingB
(A.CenterforPopulationandDevelopmentStudies,RenminUniversityofChina,Beijing,100872,China;
B.SchoolofPopulationandHealth,RenminUniversityofChina,Beijing,100872,China)
Abstract:ThequalityofmortalitydatainChina'snationalcensuseshasgarneredsignificantattention,particularlyconcerningregionaldisparitiesindeathunderreporting,whichcarryprofoundimplicationsforpublichealthpolicies,strategiestoaddresspopulationaging,andeconomicplanning.Despiteitsimportance,longitudinalstudiesonregionalandage-specificunderreportingremainscarce,particularlyregardingshiftsinpatternsamidtherapidsocietaltransformationsbetweenChina'sFifthandSeventhCensuses.ByutilizingtheLog-QuadModelandgovernment-publishedmortalitydatafromvarioussources,thisstudyrevisescensus-reportedmortalityfiguresacrossprovinces,municipalities,andautonomousregions,providingasystematicanalysisofthepatternsandunderlyingmechanismsofmortalityunderreportinginChina.Thefindingsrevealasignificantupwardtrendinthenationalinfantmortalityunderreportingrate,whichrosefrom7.04%intheFifthCensusto70.99%intheSixthand75.67%intheSeventh.However,despitethisincrease,theabsolutenumberofunderreportedinfantdeathssignificantlydeclinedduringtheSeventhCensus,decreasingfrom931per100,000intheSixthCensusto474per100,000,highlightingnotableimprovementsinthequalityofinfantmortalitydata.Incontrast,underreportingissuesforadultsandtheelderlyhaveworsenedovertime.Theadultmortalityunderreportingrateincreasedfrom5.28%intheFifthCensusto26.18%intheSeventhCensus,withunderreporteddeathsrisingfrom674to2,230per100,000.Similarly,theunderreportingratefortheyoungerelderlygroup(aged60-79)rosefrom6.21%to22.64%,withcorrespondingunderreporteddeathsincreasingfrom348to920per100,000.Fortheolderelderlygroup(aged80-99),theunderreportingrateclimbedfrom1.09%to4.84%,withunderreporteddeathsrisingfrom108to475per100,000.Regionalanalysishighlightssignificantdisparitiesintheseverityandage-groupfocusofunderreporting.InfantmortalityunderreportingwasnotablyhigherinnorthernandnortheasternChina.Incontrast,adultmortalityunderreportingreacheditspeakinnorthern,eastern,andnorthwesternregions.YoungerelderlyunderreportingwasmostprevalentinsouthwesternandsouthernChina,whereasolderelderlyunderreportingwasparticularlypronouncedinsouthernandnortheasternregions.Furtheranalysisuncoversdistinctmechanismsdrivingunderreportingacrossagegroups.InfantmortalityunderreportingexhibitedaU-shapedrelationshipwithmortalitylevels,wherelowermortalitylevelscorrelatedwithhigherunderreportingrates,reflectingheightenedstatisticalsensitivityatlowmortalitylevels.Adultunderreportingwascloselytiedtopopulationmobility:themigrationparticipationratehadanegativeeffectonunderreporting,indicatingthatdeathsamongoutmigrantswereregisteredattheirplaceoforigin,reducingunderreporting.Conversely,thevisibilityofthefloatingpopulationhadapositiveeffect,reflectingincreasesinunderreporteddeathsatdestinationsduetodelayedormissingregistrationscausedbyreturnreporting.Elderlyunderreporting,ontheotherhand,wasmoreinfluencedbyeconomicdevelopmentlevels,demonstratingdistinctdynamicscomparedtoinfantsandadults.Thisunderreportingwaslikelydrivenbyacomplexinterplayofsocioeconomicconditions,culturalnorms,andsocialsupportsystems.ThisstudyprovidesacomprehensiveoverviewoftheevolutionofmortalityunderreportingpatternsacrossChinaanditsregions.Itemphasizestheneedtoevaluateunderreportingwithinthecontextofrapidsocietaltransformationsratherthanrelyingsolelyonstaticmathematicalmodels.Futureresearchshouldprioritizeaddressingtheunderreportingofadultandelderlydeathswhiledevelopingmoretargetedevaluationandinterventionstrategies.
KeyWords:CensusData,DeathUnderreporting,DeathDataQuality,DeathLevel,ModelLifeTable