APP下载

世界卫生组织死亡数据库介绍及数据提取流程

2019-03-02郭晓娟田国祥李燕屈彦闫小妮吕军

中国循证心血管医学杂志 2019年12期
关键词:死因世界卫生组织年份

郭晓娟,田国祥,李燕,屈彦,闫小妮,吕军

死亡是生命活动的停止,是导致人口数量变化的重要因素。死亡监测是评价疾病预防干预措施效果的重要依据之一[1]。死亡原因资料分析可以从一个角度反映某个国家或地区的医疗水平、社会经济文化水平及卫生服务状况等对居民健康的影响[2],也为医学、人口学、社会学等学科的研究提供了基础[3,4]。随着大数据时代的到来,数据库共享为科研人员的数据再利用提供了广阔的平台[5]。世界卫生组织死亡数据库(WHO Mortality Database)是目前为止国际上最大的且面向公众开放的死亡资料登记库[6],是对各个成员国居民疾病登记系统的死亡数据进行汇编而形成的死亡资料[7,8]。本文将详细介绍世界卫生组织死亡数据库的相关信息及数据提取流程,帮助需要的医学科研工作者快速实现数据共享。

1 数据库介绍

死亡数据来自各个国家的民事登记系统。当死亡发生时,当地民事登记处登记死亡原因信息,然后由国家当局汇编信息,并每年向世界卫生组织提交。根据ICD-9和ICD-10编码的死因数据从1979年提供至今。死因在线查询(CoDQL)是一个很好的用户工具,它允许用户根据国家、年份、性别和年龄来提取死因数据。该工具还可根据用户需要聚合详细的死因,形成更广泛的死因类别。机构和组织可使用这些数据,并根据需要访问这些级别的详细信息,开展有目的的研究。死亡数据全部采用ICD编码,按国家、年份、死因、性别及年龄划分的年龄标准化死亡率载于一份方便使用的应用程式。其中年龄分为九个不同的年龄组,国家或地区是用四位数字代码表示,死因编码采用由世界卫生组织内部制定的《国际疾病分类编码》(ICD)的三个字符。数据的存储中还包含补充的人口学数据,用于计算死亡率和其他统计数据。国家的名单中并未包括世界上所有的国家,是因为一些国家没有向世界卫生组织报告死亡率数据。还有一些国家,他们发送给WHO的数据不是标准的ICD代码或无ICD代码,所以不在这里显示。在许多资源不足的国家中,很难获得死因资料。主要是因为记录这种资料的系统没有运作或不存在。一般来说,比较发达的国家有相当完整的时间序列,特别是北美、欧洲(包括东欧)、澳大利亚、新西兰、日本,前苏联和前苏联新独立国家也有有限的时间序列。对一些较不发达国家来说,数据集是断断续续的,其中一些数据集的用处也有限。对于其他较不发达国家,特别是拉丁美洲的国家,近年来有一系列质量有了很大改善。除拉丁美洲外,很少有较不发达国家呈现出强劲的时间序列。此外,一个较大的问题是缺乏医疗证明来完成死亡证明。各国通常在其历年记录结束后12~18个月内向世界卫生组织提交数据。因为在国家一级数据的核查、汇编过程都需要相当多的时间。在发现此应用程序的同一网站上,有按照ICD代码、年份、年龄和性别去下载每个国家的原始详细死亡率文件的链接。研究者应有处理大型数据库的经验,因为文件不能导入到Excel中,使用数据库管理或统计软件,如MS Access,Stata,SAS,SPSS或R。

数据库中最新一次更新的数据是2016年,包括200多个国家和地区的死亡数据。死亡数据库由世界卫生组织存档,任何人都可向世界卫生组织提出请求,免费索取其内容。还需注意的是,数据库中选定的报告每年以硬拷贝形式在《世界卫生统计年鉴》上发表,这些出版物可在大多数大型公共图书馆和大学图书馆中找到。这本年刊特别为读者提供了一个简洁的3页,展示了每个国家每年的死因、年龄和性别死亡率。根据所使用疾病的国际分类版本,使用死因标签随时间而异。各国不一定都在新修订的年份采用新修订,从一个修订到下一个修订通常是交错进行。第一个数据年份是1950年,可获得数据的国家数目每年都在变化。同样,时间序列数据的存在性和完整性也因国家而异。为节省开支和储存资料,每一修订本都附有一份较短的清单。

患者的年龄组别因国家而异,并可能随时间而异。各国可根据5~9岁(或5~14岁)和60~64岁(或55~64岁)间的5年(或10年)年龄组对死亡进行分组。5岁以下的年龄组是可变的;一些国家将0岁和1~4岁分组使用,而另一些国家将0岁和1、2、3、4岁单独使用。同样,64岁以上人口的死亡数据的存在和分组也各不相同:65岁及以上、70岁及以上、75岁及以上、或85岁及以上的老年人口的死亡均存在分组。此外,还有最年幼和最年长年龄的不同分组的组合。目前数据库中有9个年龄编码,包括不涉及年龄的死亡。

性别是由所有国家为所有死亡提供的。有性别特定的死亡原因(例前列腺癌、卵巢癌或产科原因),这样有助于验证提交数据的准确性。数据库为每个国家每年提供每个年龄性别组的人口,以便用户能够计算死亡率和得出预期寿命等措施。

2 数据提取流程

2.1 访问数据库网站打开网址:https://www.who.int/healthinfo/mortality_data/en/。可以看到三个选项,分别是“Access the online database/访问在线数据库”,“Query the online database/查询在线数据库”,和“Download raw data files/下载原始数据文件”。访问和查询的主要区别是,访问提供了一个根据国家,年份,死因,性别和年龄分类的死亡数字和根据年龄标准化过的死亡率,时间范围是1979年到现在;而查询可以访问更相似的死亡原因,并根据用户需求对死因聚合,同时时间范围也更大一些,是1950年到现在,本文着重介绍第一种方法(图1)。

图1 数据库访问界面

2.2 访问在线数据库打开网址:http://apps.who.int/healthinfo/statistics/mortality/whodpms/。在当前页面有4个选项,分别是“Select parameters/选择参数”,“Graphs/图表”,“Tables/表格”,“Definitions/定义”,下面有操作介绍(图2)。查询数据分为两个步骤:第一步,选择参数,点击参数按钮,在弹出的页面中勾选想要查看的变量;第二部,点击图标或表格来展示选择的数据。

图2 访问在线数据库界面

2.2.1 选择参数点击“Select parameters”,在弹出的页面中可以看到三个区域,分别是“Indicators/影响因子”,“Countries/国家”,和“Years/年份”。在影响因子中,第一项是“Total deaths by ICD chapter and population/分章节和人口的总死亡人数”,后面选项则是根据不同死因的死亡数字。先来看总死亡人数的分布情况,点击+之后,发现影响因子可选择性别,年龄段,这里将性别总数和年龄段总数分别勾选(图3)。在国家区域中选择美国,年份选择2006~2016,都选好后点击“OK”。

图3 参数选择界面

2.2.2 查看图表在一步之后,退回到首页,然后选择Graphs,可以看到有不同的图表类型可选择,这里我们选择“Bar chart/柱状图”(图4)。

点击“Bar chart”,会默认显示第一个选择的影响因子生成的图。该表显示,从2006年到2016年,美国的总死亡人数成上升趋势(图5)。

点击“Indicators”,可以看到刚才勾选的所有因子,选择小于1岁的新生儿的死亡数据可以看到如下图表(图6),2006~2016年间,新生儿死亡人数显著下降。

2.2.3 查看表格点击“Table”,选择“Table 1”,在弹出的窗口中可看到刚才选择的影响因子以表格的形式展示,除了刚才选择的美国之外,其他国家的数据也都在其中(图7)。

图4 查看图表界面

图5 死亡人数例图界面

图6 新生儿死亡数据界面

图7 表格查看界面

2.3 分析死亡原因首先在影响因子中选择“Diseases of blood and disorders of immune mechanism/血液和免疫系统机制失调“,我们选择另外一种图表,Ranked bar charts(图8)。

图8 图表选择界面

点击“Horizontal”后,选择对比2015年男性和女性因为贫血死亡的数据(图9)。

可以看出,该项死因中,女性是远远高于男性的(图10)。

其他死因分析可以看到,影响因子中涵盖了各个方向,比如循环系统,消化系统,精神及神经系统,生育及外因等,可做的分析很多,且可根据不同国家和年份,分析同一种死因与地理和时间的关系(图11)。

图9 性别选择界面

图11 死因选择界面

3 结语

随着网络信息时代的发展,人类不断开发出存储医疗保健信息的系统,以减少数据收集的所花费的时间的精力,使更多科研人员根据需要获取相关的信息开展研究,这种必要性是毋庸置疑的[9]。世界卫生组织死亡数据库填补了死亡数据汇集的公共数据库的空白,给医学科研人员分析比较世界不同地区不同国家的死亡原因及趋势提供了宝贵的资源。医学科研人员可按照不同的国家、年份、死因等提取需要的信息进行分析。本文通过详细介绍数据库的相关知识及数据提取流程,帮助医务人员快速实现数据共享,为掌握数据库的相关知识及数据提取节省了时间。

猜你喜欢

死因世界卫生组织年份
法医病理学死亡原因分类及死因分析探讨
特殊的一年
世界卫生组织:八成青少年缺乏锻炼
疫情七瞬
死因
什么是闰年?
一样的年份
更正