人口因素误差对西安市疫情分析影响的研究报告
2014-04-03龚建仁王江霞李江博
龚建仁 王江霞 李江博
根据对人口因素统计数据和疾病监测统计数据分析计算的传染病发病信息,是反映地区经济发展水平、居民卫生健康状况的重要指标,也是疾控部门开展传染病预防控制工作,政府部门制定传染病预防控制策略,合理配置卫生资源的重要依据。
在确定了计算与分析方法之后,对传染病疫情信息分析的正确与否,就取决于疫情统计数据和人口因素统计数据(以下简称人口数据)的准确性。依据不准确的疫情分析结果对疫情的发展趋势和严重程度做出的误判,将导致疾控部门得出的错误评估结果,并采取不适当的传染病预防控制措施。政府部门依其制定出的错误防控策略,则会使人员、设备、资金等卫生资源的配置偏离重点或造成浪费。此外,根据错误的评估结果发出的预测预警信息,还可能使公众产生不必要的担忧与恐慌,成为影响社会的不稳定因素,对政府部门形成额外的压力与负担。本项研究即是为了解掌握和消除人口因素误差对传染病疫情分析结果的影响开展的。
资料与方法
1.资料
第五次和第六次全国人口普查(以下分别简称“五普”、“六普”)所获的西安市实际人口数据资料由西安市统计局提供。2000-2004 年疫情分析使用的推算人口数据取自于西安市公安或“计生”单位(以下简称“地方”人口数据)。2005-2010 年的推算人口数据来自于中国疾病预防控制信息系统(以下简称“系统”)中基本信息子系统。
2.方法
对两种来源的人口数据进行比较,发现差异,分析导致人口数据误差的原因。使用两种来源的人口数据进行传染病发病分析,对其结果加以比较,探讨人口数据误差对我市疫情分析结果的影响,提出消除误差的对策。
结 果
1.人口因素误差的来源
2005 年前,西安市疾控中心和辖区内13 个区县疾控中心采用的、作为各年度传染病疫情统计分析基础的人口数据,往往按照获取数据的方便程度,取自于统计、公安或“计生”单位。2005-2010 年,则按照“系统”的使用规则,采用了“系统”根据全国平均人口自然增长率和性别、年龄构成比自动推算出的人口数据。事实上,无论是“地方”人口数据,还是“系统”给出的人口数据,均与“五普”和“六普”获得的实际人口数据存在着误差(见表1,图1)。
表1 不同来源的人口数据对西安市乙类传染病发病分析的影响
2.人口因素误差对发病率分析的影响
2000-2004 年,“系统”中使用的西安市人口总数始终低于普查所得的实际人口数。从2005 年起,中国疾控中心为“系统”导入了来自国家统计局的全国千分之一人口调查数据,但由于受到全国平均人口自然增长率、年龄构成比与我市以及我市各区县人口的自然增长率、年龄构成比差别的影响,直至2010 年“系统”推算的我市人口数据与我市“六普”人口数据间的误差仍未能明显缩小。因此在对我市各年度的传染病疫情信息进行分析时,一直存在着“系统”中的报告发病率较实际发病率高的情况。
3.人口因素误差对疫情分析结果的影响
(1)人口数误差对传染病地区分布分析的影响
对传染病地区(空间)分布状况的分析结果,是制定防控策略,合理配置控制传染病的卫生资源的基础。在发生重大的疫情时,及时正确地判断其空间分布状况,对其后采取有重点、有针对性的措施,控制和扑灭传染病疫情,有着重要的指导意义。
2000-2004 年,“系统”为单机版,采用“地方”人口数据作为疫情分析基础数据。由于每年全市人口总数由各区县当年提供的人口数汇总而来,所以虽然“系统”中各区县的人口数与我市“五普”获得的各区县人口数不尽一致,但各区县人口总数的误差对全市人口的4地区分布趋势的影响基本一致,因此在进行传染病发病的地区分布分析时,其结果所受影响有限(见表2)。
2004年,“系统”的联网版正式运行之后,为了取得一致的疫情分析数据,中国疾控中心从2005年开始为“系统”导入了取自国家统计局的人口数据,并且使用全国平均人口自然增长率和性别、年龄构成比,逐年推算各省市、区县的人口数和分性别、年龄组人口数,这就导致了与全国平均人口自然增长率和性别、年龄构成比差别较大的地市、县区的“系统”人口数据,与各地的实际人口数之间出现了误差。至2010年,我市各区县人口总数的误差已对全市传染病发病的地区分布分析产生了较大的影响(见表2)。
表2 2000年、2010年不同来源的人口数据对西安市乙类传染病空间分布的影响
2.分年龄组人口数误差的影响
分年龄组发病率是表示传染病在不同年龄人群中发病严重程度的重要指标。因分年龄组人口数据误差所产生的发病分析误差,将使防病措施所针对的重点人群出现偏移。
(1)分年龄组人口数的误差
图1 显示了“系统”与“六普”分年龄组人口构成上的差别。从总体上看,“系统”与“六普”分年龄组人口构成的主要差别在于:(1)在10 岁以前,除了9 岁组,“系统”中各年龄组的人口数均多于“六普”的各年龄组人口数,10 岁后则相反;(2)15 和20 岁组人口数的误差比其他年龄组大。
各年龄组人口数的误差,对我市传染病分年龄组发病率总体趋势分析的影响较小。对乙类病分年龄组发病率分析的影响主要出现在10~25 岁的各年龄组(见图2)。对丙类病发病率分析的影响则只发生在9 岁前的各年龄组(见图3),其原因为:流腮、手足口病和感染性腹泻占了丙类病发病数的98%以上,而这三种病又是学前儿童多发病种。
图1 2010年西安市“系统”与“六普”分年龄组的人口构成比较
(2)分年龄组人口数误差对重点病种疫情分析的影响
① 淋病、梅毒和乙肝
淋病、梅毒和乙肝均属于按乙类传染病管理的经性接触传播或经血源传播的病种。在我市,淋病的高发人群为15~30 岁的男性,2005 年前,各年度淋病的最高发病年龄组一直为25~岁组。2005 年后,淋病发病年龄分布呈现出小龄化的趋势,最高发病年龄组前移至20~岁组。
图2 2010年西安市不同来源人口数据的分年龄组发病率比较(乙类病)
图3 2010年西安市不同来源人口数据的分年龄组发病率比较(丙类病)
图4 2010年西安市不同来源人口数据的分年龄组发病率比较(淋病)
实际上,2005 年前后我市各大学扩招后,20~岁组的外地人口大量迁入,使我市20~岁组的实际人口数比“系统”中该年龄组人口数增多了40%以上(见图1)。由于“系统”根据全国平均人口自然增长率推算的分年龄组人口数对我市20~岁组增加的人口数未做能出相应的修正,致使“系统”给出的20~岁组人群的淋病发病率较该组实际发病率为高,并高于25~岁组的错误的分析结果(见图4)。
类似的偏差也存在于对梅毒、乙肝等其他血源和性传播传染病的发病分析结果中。由于主要发病人群年龄偏大,丙肝的分析结果没有最高发病年龄组偏移的现象。
②出血热、痢疾和肺结核
对于乙类病的其他重点防控病种,如出血热、痢疾和肺结核,“系统”与“普查”人口数的误差对分年龄组发病率分析的影响主要出现在10~至20~岁组。在这个年龄组段,“系统”给出的各病分年龄组发病率均不同程度的高于实际发病率(见图5 和图6)。
图5 2010年西安市不同来源人口数据分年龄组发病率比较(出血热)
图6 2010年西安市不同来源人口数据的分年龄组发病率比较(肺结核)
③手足口病、流腮和感染性腹泻
对于丙类病,“系统”与“普查”人口数的误差对分年龄组发病率分析的影响主要出现在10 岁以下的各年龄组。与乙类病相反,由于“系统”根据自然增长率推算的10 岁以下各年龄组的人口数均多于实际人口数,所以给出的各病分年龄组发病率均不同程度的低于实际发病率,并且年龄组发病数越多,发病率差距越大。
手足口病和感染性腹泻病的主要发病人群为婴幼儿,分年龄组人口数的误差只对分年龄组的发病率高低有所影响,对分年龄组发病趋势的分析影响则不明显(见图7)。
对高发人群为学龄前儿童和小学生的流腮,按“系统”给出的分析结果,其分年龄组发病率多年来一直在8~9岁时呈现出异常的上升趋势。对这种不符合既往的流腮发病年龄分布规律的情况,在进行我市流腮发病分年龄组发病趋势分析时,一直无法给予合理的解释。当使用 “六普”的分年龄组人口数进行统计分析时,则没有这种异常情况出现(见图8)。
图7 2010年西安市不同来源人口数据的分年龄组发病率比较(手足口病)
4.其他人口因素与疫情分析
(1)性别构成
2000 年,“系统”人口的性别比与“五普”人口的性别比之间仅相差0.02。2010 年,两者的差距进一步缩小至0.01。2000 年至2010 年的疫情分析结果显示,在各年度中,无论是传染病发病总数的性别比例,还是各病病例的性别比例都没有出现明显异常的变化。可以认为,至少在这十年中,西安市人口的性别构成变化没有对疫情分析结果产生影响。
(2)职业构成
发病者的职业分布状况,是疫情信息分析的重要内容之一。但是历次的人口普查结果均未能提供与“系统”中职业分类的对应信息。
(3)流动人口
近年来,我市流动人口的规模不断扩大,全市净流入人口已上百万,流动频率也在不断加快。由于流动人口的经济、居住、住所环境卫生条件等相对较差,传染病在流动人口中更容易传播,分析掌握流动人口的发病情况,对于疫情信息分析和传染病的防控工作具有重要的意义。
“系统”对流动人口发病情况的统计操作较为复杂,但还是可以从中获取相应的数据。
可是由于缺少流动人口的数量、构成与分布状况等信息,对流动人口中传染病发病状况的分析工作难以开展。如何实时获取流动人口数量、构成与分布的统计数据,并及时、充分地把这些数据用于疫情分析工作中,是今后亟需研究的课题之一。
讨 论
1.目前全国各级疾控机构联网共用的“系统”所提供的,作为西安市和所辖区县级疾控中心各年度传染病疫情统计分析基础的人口数据,与我市人口普查数据间存在着误差,这种误差对西安市传染病疫情分析结果有着直接的影响。
2.总人口数和9 至25 岁年龄段分年龄组人口数的误差在“系统”导入普查人口数据并进行推导计算时即已存在,这种误差属于系统性误差,不能随着导入全国人口普查数据而被修正,在中国疾病预防控制中心对“系统”的软件设计和使用规则进行修改之前将一直存在。
3.对于西安市来说,人口数据误差对疫情分析结果的影响主要存在于以下几方面,即:
(1)全市人口总数的负向误差(也属于系统性误差),致使我市的传染病发病率出现虚高。按照“系统”软件的设计,对于我市,这种误差可能会时间的推移而逐渐增大。
(2)在“系统”导入新的人口普查数据之前,随着时间的推移,我市人口空间分布的误差将逐年增大,并导致疫情的地区分布分析结果的误差也逐年增大,这种误差为正负双向的,据此做出的传染病发病空间分析结果将与实际情况偏离渐远。在发生重大传染病疫情时,必然会对卫生行政部门的防控策略决策产生不利的影响。
(3)在青少年年龄组,由于“系统”采用依据全国平均人口自然增长率推算各地分年龄组人口数的设计,未考虑到各地特定年龄组人群的流入、流出情况,致使“系统”给出我市各重点防控传染病在15~25岁年龄组发病状况分析结果出现变异。
(4)“系统”中10 岁以下各年龄组人口数高于实际人口数、10 岁后则相反的原因为系统使用了全国人口的年龄结构推算我市人口的年龄结构所致,这种情况仍将对我市今后的疫情信息分析工作造成影响。
4.2012年,国家疾控中心为系统导入了2010 年全国第六次人口普查所获的人口数据。“系统”根据新的数据推算的2011 年底我市的人口总数和性别比例与我市“六普”调查的结果相差无几,在人口的空间分布上两者亦无差别。但是“系统”与“六普”的分年龄组人口数在9 至25 岁年龄段的差别仍没有消除。因此在进行重点病单病种疫情分析时,市、区、县疾控中心有必要考虑对分析结果进行修正。
5.建议
(1)目前,国家疾控中心尚未对“系统”进行人口推算程序的改造升级,所以消除人口数据误差对我市疫情分析结果的影响短期内尚难实现,因此只能够利用“地方”人口数据对“系统”中的原始疫情数据进行修正计算,从而得到正确的疫情分析结果。特别是在发生类似“非典”、“甲型H1N1 流感”暴发流行等重大疫情时,根据我市实际的人口数据对疫情分析结果进行修正则是必须的。
(2)人口因素变化对疫情分析结果有所影响,但是利用合理的方式去消除这种影响是可能的。采用什么方式,在技术上方法是否合理、可行,又如何用于实际工作中,应是今后的研究方向。
(3)为了达到正确、合理地修正疫情分析结果,以获得真实、准确的疫情信息的目的,疾控机构还应积极与人口统计部门、公安部门沟通协作,共同做好人口因素统计数据和疾病监测统计数据的信息整合利用工作。
参 考 文 献
1.杨功焕,王俊芳,万霞,等.影响中国人群疾病死亡因素的定量分析.中华流行病学杂志,2005,26(12):934-938.
2.叶莺,林曙光,钟文玲等.福建省慢性病死亡率变化的定量分析.海峡预防医学杂志,2007,13(1):16-19.
3.林海,葛可佑.人口因素对社区人群营养状态的影响.国外医学卫生学分册,1994,21(2):97-101.
4.王兴田,郭光萍,周红,等.云南省1975-2005年5岁以下儿童死亡率变化趋势及质量评价.中国自然医学杂志,2007,9(2):103-109.
5.姚建义,苗树军,纪雪梅.我国城市居民主要疾病死亡率分析.中国实用医药,2010,5(10):15-17.