江苏省人口平均预期寿命估计及死因差异分析①
2022-04-24徐晨曦帅友良
徐晨曦 帅友良 温 勇
(南京邮电大学,江苏 南京 210023)
1 引言
“七普”数据显示,江苏省15-59岁人口占62.95%,60岁以上人口占21.84%,其中65岁人口占16.20%,和“六普”对比,15-59岁人口的比例下降了8.05%,65岁以上人口比例上升了5.32%。在江苏13个设市区中,有10个城市65岁以上人口在14%以上,其中两个城市超过21%。上世纪60年代出生的婴儿,将陆续迈入老龄人口的门槛。江苏省具有东部发达地区的典型特征,即经济发展水平高、生育水平低、老龄化程度高,是未来中国发展的一个缩影。因此,对江苏省的死亡率以及死因差异的分析,对全国各个省份人口预期寿命的分析具有一定的借鉴作用。
通常用平均预期寿命来衡量一个地区的死亡率的综合状况,用去死因生命表法来研究疾病因素导致的平均预期寿命差异[1-3]。现有的不少研究利用去死因生命表来研究疾病因素导致的平均预期寿命差异,但是少有对平均预期寿命差异进行分解并比较年龄结构上的差异。如邱红等人利用预期寿命损失率来评价疾病对预期寿命的影响程度[3]。损失值是预期寿命的差值,表示得是活到该年龄段的人群,在剩余的生命中,其死亡率差异导致的预期寿命差异。损失值除以该年龄段原本的预期寿命,就是损失率,这相当于对预期寿命的差异做了一个标准化,然后比较不同年龄段的预期寿命损失率,来评价死因的在各年龄段的影响大小。根据人口的异质性理论,虚弱的个体会较早的死亡,而强壮的个体会存活下来,能存活到某个年龄段的人群和之前的人群,其整体是具有差异的,所以损失值衡量的是不同年龄段不同特质的人口群体,在余生中,死因造成的预期寿命的损耗值,而损失率衡量的是不同年龄段不同特质的人口群体,在余生中,死因造成预期寿命损耗的相对值,即死因的影响程度。无论是损失值,还是损失率,其反应的都是后续年龄别死亡率差异导致的综合影响,并没有将影响分解到后续的各个年龄段,而且衡量的是不同年龄段不同特质的人群。随着年龄的增加,各种疾病的风险增加,疾病死亡的比例增大而其他死亡的比例减小,损失率在后续会随着年龄增加。同一年龄段,不同特质的人群,其差异值在年龄结构上的差异并没有在上述文章中体现出来。出生预期寿命的差异反应的是不同特质的出生队列的差异,更受关注,将差异值分解到各个年龄段,可以探讨不同性别,不同死因,在不同的年龄段,对于出生队列的影响程度大小,其意义在于可以分阶段的对不同死因做重点干预。这是本文想要讨论的内容。
本文将采用完全生命表和quadratic模型计算平均预期寿命,利用去死因生命表计算去死因平均预期寿命,用Arriaga方法对出生预期寿命差异值进行分解并比较年龄结构上的差异。
本文的研究数据包括两部分,一部分是江苏省疾病预防控制中心提供的2019年11月1日到2020年10月31日分死因分年龄段的常住人口死亡数据,另一部分是通过年龄移算得到的分年龄段的常住人口年平均人口数。本文研究的主体是2020年江苏省常住人口。
2 平均预期寿命估计和性别差异比较
2.1 计算方法
平均预期寿命,从本质上来说,是运用假想队列的思想结合生命表方法来估计预期死亡年龄分布的均值。总人口的死亡率指标受到人口年龄结构的影响,在人口年龄结构差异大时,不能反应死亡水平的差异。利用假设一代人法和生命表,将年龄别死亡率转化为平均预期寿命,克服年龄别死亡率指标过多的问题,是一个反应地区死亡水平的综合指标。
在平均预期寿命的计算中,婴幼儿和高龄老年人口的死亡数据质量相对较差,往往需要进行修正和调整,同时,仅对两端进行修正,能够最大程度的利用现有的数据,避免完全重建带来的二次误差,得到较为真实的平均预期寿命估计值[4]。婴幼儿和高龄老年人口的死亡率的调整,要根据真实的数据特点,选择合适的方法进行修正[5]。本文没有有关年度的出生人口数,所以采用一般计算公式以及经验系数来计算和调整婴幼儿的死亡率;比较了compertz模型、logistic模型以及quadratic模型对于80-89岁高龄老年人口的拟合效果,选择了拟合效果最好的quadratic模型作为高龄老年人口的修正模型[6]。具体的过程如下:
2.1.1 quadratic模型
二次方程式模型(quadratic模型)的计算公式如下:
根据等式ux+0.5≈mx将mx带入,两边取对数并用回归方法得到上述模型的估计系数,使用R方值和残差图等来分析拟合效果。利用上述模型对80-89岁的死亡率进行修正。
2.1.2 完全生命表法
先对完全生命表所使用的符号进行一个简要的说明:x代表年龄,lx代表尚存人数,qx代表死亡概率,Lx代表平均生存人年数,Tx代表平均生存人年数累计,ex代表平均预期寿命,r代表婴儿死亡时平均每人的存活时间。
计算步骤如下所示:
步骤1:将年龄别死亡率转化为死亡概率。对于一般年龄组,采用均匀分布假定,计算公式为:;对于0岁组,计算公式为:;对于开口组,计算公式为:qw+=1。
步骤2:计算尚存人数lx。计算公式为:lx=lx-lx·qx。
步骤3: 计算平均生存人年数Lx。一般年龄组公式为:;0岁组公式:L0=rl0+(1-r)l1;因为1-4岁组是0岁组死亡水平下降的延伸,所以需要增加一个修正因子,计算公式为:;最高年龄组的公式为:。
步骤4:计算平均生存人年数累计Tx。一般年龄组:Tx=Tx+1+Lx;开口组的计算公式为:Tw+=Lw+。
2.1.3 出生预期寿命差异的Arriaga分解[7][8]
年龄别死亡率对平均预期寿命的影响并不是独立的。比如在岁死亡率的变化会直接导致在岁内的平均生存人年数发生变化,而存活下来的人,在下一个年龄段按照新的死亡率渡过余生。
Arriaga分解将预期寿命的差异分解为两个部分,第一部分是死亡率的变动对出生预期寿命的直接影响,第二部分是在新的x岁死亡率下,x+n岁的新增存活人数对出生预期寿命所贡献的人年数,后者为间接效应和交互效应之和。间接效应指得是在x+n岁的新增存活人数按照原死亡率生存下去,对预期寿命贡献的人年数,而交互效应就是剩下的部分。这个分解是无残差的,即分解到各个年龄段的值的总和等于出生预期寿命的差异值。
计算的公式如下:
2.2 计算结果与分析
调整高龄老年人口死亡率后,分性别分年龄人口死亡率如图1所示,整个死亡率曲线是“J”型曲线,符合真实的死亡规律曲线。由图1可以看出,未作调整的中间部分,相邻年龄组的死亡率波动幅度较小,死亡数据的质量较好。为了避免完全重建带来的二次误差,尽可能的利用实际的死亡数据,对中间段的人口死亡率不作调整是合适的。
图1 2020年江苏省分性别分年龄人口死亡率(‰)
男性0-4岁的死亡率大于女性,随后死亡率差异缩小,接着随着年龄的增加,死亡率差异逐渐增大,符合人口死亡规律。男性在0-4岁的死亡率分别为2.234‰、0.244‰、0.231‰、0.241‰和 0.162‰,而女性分别为1.718‰、0.208‰、0.170‰、0.160‰和0.136‰,死亡率性别差异分别为0.5150‰、0.036‰、0.061‰、0.081‰和0.026‰;在0到90岁之间,随着年龄的增加,死亡率的性别差异逐渐增加,89岁时候,死亡率的性别差异为73.449‰,开口组的性别死亡差异为111.622‰。
平均预期寿命在提升,但是性别差异并没有缩小。2020年江苏省的人口平均预期寿命约为81.82岁;分性别看,男性约为79.38岁,女性约为84.26岁,差值约为4.88岁。江苏省2010年男性平均预期寿命74.60岁,女性平均预期寿命78.81岁,差值约为4.21岁。不同的计算方法,会导致算出的结果有差异,比较相同计算方法计算出来的差异值,可以看出平均预期寿命的性别差异有所提升。
生存越久的群体,其出生预期寿命越高。根据人口的异质性理论,虚弱的个体会较早的死亡,强壮的个体会生存下来;能活到1岁的群体是相对更强壮的群体,其出生预期寿命更高,比如1岁组的群体,从0岁开始的平均预期寿命81.98岁,大于原人群0岁组的81.82岁。从计算的角度上看,平均预期寿命就是预期死亡年龄分布的均值,而相对强壮的群体预期死亡年龄分布的均值较高。
对男女平均预期寿命的差异值进行Arriage分解,得到年龄别死亡率对平均预期寿命差异的解释程度,如图2所示。Arriage分解是无残差分解,所以各年龄段的分解值,其总和等于出生预期寿命的性别差异值。
图2 2020年出生预期寿命性别差异的年龄分解(岁)
整体上看,在总效应中,间接效应和交互效应的影响更大,所以年龄别死亡率变化导致生存下来的人,其在新的年龄别死亡率下渡过余生,对于出生预期寿命的性别差异解释程度更大。间接效应和交互效应的解释程度在年龄别的占比较大,总效应中绝大部分是间接效应和交互效应;间接效应和交互效应反映的是岁死亡率变换导致的岁存活下来的人数,在新的年龄别死亡率下,渡过余生,对出生预期寿命性别差异的解释程度,所以年龄别死亡率变化导致生存下来的人,其余生对出生预期寿命的性别差异解释度更大。
表1 2020年江苏省人口平均预期寿命(岁)
出生婴儿的性别比例接近自然出生的性别比,男婴偏好改善,婴儿组的性别差异对出生预期寿命的解释程度较小。根据过往文献以及过往的出生性别比来看,江苏省的出生性别比逐渐正常,出生婴儿年平均人口数的性别比为104.18比100,接近自然出生的性别比,男婴偏好改善明显。0岁组对出生预期寿命性别差异的解释程度为0.0429岁,贡献的百分比为0.88%,女婴的死亡率低于男婴的死亡率,解释了出生预期寿命性别差异的0.88%,解释程度较小。
出生预期寿命的性别差异主要集中在中老年组。70-79岁组是总效应的峰,其死亡率差异解释了平均预期寿命性别差异的32.84%,其中,间接效应和交互效应起主导作用。在中老年龄段(50-89岁),女性较低的死亡率解释了约82.19%出生预期寿命性别差异。
3 人口平均预期寿命的死因差异比较
3.1 常住人口的死因分析
江苏省常住人口的前10死亡原因占所有死亡人数的98.18%,前3死亡原因占所有死亡人数的79.27%。主要的死亡原因为循环系统疾病,肿瘤,呼吸系统疾病,构成比分别为39.36%,30.62%,9.29%(见表2)。
表2 2020年江苏省常住人口前10死因
男性和女性前3大死因相同,7、8、10死因不同(见表3)。前三大死因占男性死亡原因的81.06%,占女性死亡原因的77.08%。男性的7、8、10的死因分别是消化系统疾病、其他疾病、传染病和寄生虫;女性的7、8、10死因分别是其他疾病、消化系统疾病、精神和行为障碍。死因1和死因2,相比于男性,女性死因百分比差异较大。男性循环系统疾病比例和肿瘤比例大致相同,分别为35.64%和35.39%;女性循环系统疾病比例和肿瘤比例差异较大,差异值为19.14%。男性和女性的前3死因一致且重要性高,所以后续的分析只针对前3死因。图3分性别显示了各死因死亡人数在年龄上的分布。
图3 主要死因年龄分布图(%)
表3 2020年江苏省常住人口分性别前10死因(男性,女性)
相同死因,分性别来看,分布的趋势具有趋同性,但是女性的分布滞后。主要的3大死因基本发生在50岁之后,而且无论是肿瘤、循环系统疾病还是呼吸系统疾病,不同性别在年龄分布上面都具有相同的趋势和接近的比例,只不过女性在分布上有滞后性。
相比于循环系统疾病和呼吸系统疾病,肿瘤的死亡数集中在相对较小的年龄组里,这可能有两个原因,一个是相对于其他慢性病,肿瘤的发展速度较快,致死率较高,个体的存活时间较短,另一个是肿瘤的发生群体在年轻化。肿瘤发生且导致死亡的年龄较小,所以相比于其他原因导致的个体死亡,就单个个体而言,肿瘤导致的死亡会导致损失更多的生存年数。
3.2 主要疾病对平均预期寿命的影响
3.2.1 分析方法
利用去死因生命表,可以得到去死因平均预期寿命[8]。去死因生命表的计算方法基于两个假设:1)假设各死因之间相互独立;2)假设比值R(见下面公式)等于死因死亡数与总死亡数之比[6]。
当l0=1时,有lx=lix·l-i
x, 其中lx表示x岁时不分死因的存活概率,li
x表示死因i的分年龄段的存活概率,因为lx是已知的,只需要计算得到lix,就可以算得l-i
x。
首先有:
又因为:
可以得到:
出生预期寿命的死因差异是更受关注的,其反应两个不同特质的初始队列整个生命历程的差异。对出生预期寿命损失值进行年龄分解,可以量化损失值到各个年龄段,可以分析年龄别死亡率差异对出生预期寿命差异的解释程度。所以,本文使用Arriage分解,将差异值分解到年龄结构上,比较年龄结构上的不同。具体的计算步骤如下:
步骤1:计算R值和nqix;步骤 2:计算 lix、l-ix;步骤3:计算e i x;步骤4:计算出生预期寿命死因差异值;步骤5:计算Arriage分解值
3.2.2 计算结果与分析
相比于较低比例的疾病死亡因素来说,高比例的疾病死亡因素对0岁组的平均期寿命影响较大(见表4),比如,男性的循环系统疾病的比例较大,其导致的出生预期寿命差异值为4.0787,大于肿瘤导致的差异值3.6660,但是,不同死因在不同的年龄段,其分解值的大小顺序并不与总体上的差异值大小顺序一致,比如,在70-74岁,男性的肿瘤分解值为0.6273,大于循环系统的分解值0.4381,并不与总体上,循环系统疾病大于肿瘤疾病的顺序一致,这说明不同年龄段,不同死因对出生队列的出生预期寿命的影响不同。为了进一步探讨不同死因在不同年龄段对出生队列的出生预期寿命的影响,将年龄组分为婴儿组(0岁)、幼儿组(1-4岁)、少年儿童组(5-14岁)、劳动年龄人口(15-64岁)和老年人口(65岁及以上),并对上述差异分解值进行汇总,见表5。
表4 2020年江苏省出生预期寿命死因差异的年龄分解
表5 死因差异的年龄分解汇总
0岁组,影响程度由大到小,分别是呼吸系统疾病、肿瘤、循环系统疾病;1-4岁组,对男性来说,分别是肿瘤、循环系统疾病、呼吸系统疾病,对女性来说,分别是呼吸系统疾病、肿瘤、循环系统疾病;15-64岁组,分别是肿瘤、循环系统疾病、呼吸系统疾病;65岁以以上,对男性来说,分别是循环系统疾病、肿瘤、呼吸系统疾病,对女性来说,分别是循环系统疾病、呼吸系统疾病、肿瘤。不同性别,不同死因,在不同的年龄段对于出生队列的影响程度是不同的,对于出生队列的不同年龄段,需要关注的重点是不一样的,比如对于15-64岁,应该重点关注肿瘤的防治。
4 总结与讨论
4.1 主要结论与分析
在前文分析的基础上进行归纳,得到如下几点结论:
第一,平均预期寿命在提高,但性别差异没有缩小,且主要集中在中老年组。2020年江苏省的人口平均预期寿命约为81.82岁,男性约为79.38岁,女性约为84.26岁,差值约为4.88岁;2010年江苏省的人口平均预期寿命约为76.63岁,男性约为74.60岁,女性约为78.81岁,差值约为4.21岁;整体寿命在提高,但性别差异仍然存在。从性别差异的年龄分解值看,70-79岁组是总效应的峰,其死亡率差异解释了平均预期寿命性别差异的32.84%,其中,间接效应和交互效应起主导作用;在中老年龄段(50-89岁),女性较低的死亡率解释了约82.19%出生预期寿命性别差异;整体的性别差异集中在中老年组。
第二,循环系统疾病对出生预期寿命的整体影响最大,集中体现在65岁及以上年龄组。循环系统疾病主要包括脑血管病和心脏病,相关的危险因素包括肥胖、吸烟、高血压、高血脂等。整体上看,无论是男性还是女性,循环系统疾病的差异值都是最大的;分年龄组看,循环系统疾病对出生预期寿命的影响集中在65岁及以上年龄组。现有的数据和研究显示,成年人中,全国的高血压患者约为两成,江苏省的高血压患者约为三成;江苏省老龄人群肥胖率上升趋势显著[9]。65岁及以上的老年人群过去生活在物质生活相对匮乏的年代,饮食上习惯上偏向于腌制品。随着物质生活水平的提高,老年群体仍然保留有不健康的生活饮食习惯,使得患高血压等疾病的风险增加。
第三,肿瘤发生群体在年轻化,尤其是男性;肿瘤影响差异是导致男女性别的原因之一。对比循环系统疾病和呼吸系统疾病,肿瘤的死亡数集中在相对较小的年龄组里;从肿瘤比例和分布上看,男性肿瘤整体比例高于女性,男性肿瘤在年龄结构上的分布较女性超前。相比于其他慢性病,肿瘤的发展速度较快,致死率较高,个体的存活时间较短,且肿瘤有年轻化的特征,尤其是男性。从整体影响上看,肿瘤对男性平均预期寿命的影响大于女性;分年龄组看,在15-64岁组和65岁及以上组,肿瘤对男性平均预期寿命的影响均大于女性。平均预期寿命存在性别差异,肿瘤影响差异是导致男女性别差异的原因之一。当代中青年存在一定的不良生活习惯,比如熬夜、加班、过度劳累、抽烟、酗酒等,这会增加患慢性病的风险,使得慢性病年轻化。相比于其他慢性病,肿瘤在初期难以察觉,且发展速度较快,致死率较高,使得肿瘤的死亡分布相比于其他慢性来说,年龄分布靠前。在抽烟、酗酒等不良习惯的比例上,男性高于女性,因此,男性患肿瘤的风险高于女性;这体现在男性肿瘤分布超前且比例大,肿瘤对男性预期寿命的影响更大。
第四,呼吸系统疾病相比于前两大死因来说,对出生预期寿命的影响较小,其主要影响的是65岁及以上年龄组。肺炎高发于5岁以下和65岁以上的人群,慢性下呼吸道疾病高发于65岁以上年龄组,对65岁以上人群影响大。这与65岁及以上年龄组分解值最大一致。
4.2 讨论
第一,常住人口的平均预期寿命会受到迁移、假想队列的影响。江苏省是人口流动的大省,落叶归根的思维方式会使得常住人口的死亡人数统计是小于实际的死亡人数,导致计算的平均预期寿命偏大。死亡率受到经济水平、医疗水平、生活习惯等影响,不同年龄段的人口出生于不同的时期,其受到的经济水平、医疗水平、生活习惯等均具有差异,假想队列把同时期的年龄别死亡率假想为同一队列一生的年龄别死亡率,这本身就会存在有一定的误差。
第二,本文的主要死因都是慢性病,基于死因独立假设的去死因生命表存在一定的误差。慢性病的形成受到生活习惯、生活环境等因素的长期影响,所以慢性病之间存在有一定的关联性,死因之间的独立假设往往是不成立的,但是独立假设能够大大的简化计算量和计算步骤,而在独立假设下,根据以往的研究,其结果是能够保持一定的精度。
第三,死亡数据存在漏报的可能性远大于重报和多报,平均预期寿命的测算往往是偏高的。死亡数据的质量问题一直是影响平均预期寿命估计和测算的基础性问题,根据以往的死亡数据统计来看,统一口径后,妇幼处的死亡统计、疾病预防控制中心的死亡统计以及人口普查的死亡统计,其死亡人口数基本上都不一致,这是平均预期寿命测算的一个困境。死亡率小,平均预期寿命的测算对于死亡人口变动较为敏感,出生预期寿命根据误差相抵的情况,其平均预期寿命测算相对较为准确。