APP下载

GLOBOCAN数据库架构介绍及数据分析方法

2021-01-04郭晓娟田国祥李燕屈彦李青莉吕军

中国循证心血管医学杂志 2020年7期
关键词:示例死亡率发病率

郭晓娟,田国祥,李燕,屈彦,李青莉,吕军

癌症是最常见的死亡原因之一,其发病率在世界范围内不断增长[1]。癌症发病率和死亡率等数据的准确统计对于开展科学研究及制定癌症防控计划至关重要[2,3]。全球癌症观察站(GCO)是一个基于Web的交互式平台,可提供全球癌症统计信息,以指导癌症控制和癌症研究。该平台使用国际癌症研究机构(International Agency for Research on Cancer,IARC)癌症监管部门多个关键项目的数据,包括GLOBOCAN,着眼于癌症指标的可视化,以说明全球范围内不断变化的规模,流行病学概况和对人类健康的影响。本文通过对GLOBOCAN数据库架构及数据分析方法的介绍,帮助感兴趣的研究者在获取数据库相关知识及使用方法的过程中节约更多的时间。

1 数据库介绍

GLOBOCAN是国际癌症研究机构(IARC)的项目,它使用每个国家/地区的可用数据和几种估算方法,按癌症部位和性别进行估算[4]。因此,要生成高质量的估算值,需采用双重方法来改善报告的数据(正在开发的癌症登记系统和民事/重要登记系统),并且需要持续评估来估算程序的有效性以改进所使用的方法。GLOBOCAN 2018数据库(The GLOBOCAN 2018 database)是IARC于2018年9月12日在瑞士日内瓦发布的全球癌症估算的最新结果,是GLOBOCAN数据库的最新版本,包括对世界上185个国家/地区中的36种癌症以及所有癌症的发病率,死亡率和患病率的估计,并针对全球癌症发病率和死亡率数据提供了全局化和可视化[5,6]。估算按照性别和18个年龄段进行。研究者可在IARC的全球癌症观察站(http://gco.iarc.fr/)上获得结果。该在线工具可以按照国家或地区显示当前癌症负担,并可对未来20年的癌症负担进行预测。这些癌症统计数据的估算方法在基于原先开发方法的基础上,更加强调短期预测和对发病率/死亡率比值的建模。GLOBOCAN允许研究者使用时间趋势和全球任何国家或地区的人口估计值来估算未来的癌症负担。另外,非黑色素瘤皮肤癌(除外基底细胞瘤)发病率估计和死亡率的估算也是一个重要的变更。

2 数据库架构

2.1 访问数据库网站首先,访问全球癌症观察站的网址:https://gco.iarc.fr/ 。可以看到主要有5部分组成,分别是“Today/当前数据”,“Over Time/历史数据”,“Tomorrow/预测”,“Causes/病因”,和“Survival/治愈数据”,图1。

图1 数据库访问界面

2.1.1 Today/当前数据提供基于185个国家,36种癌症类型的可视化工具,可按照性别年龄分析当前癌症病例,死亡数和发病率。点击“Today”查看当前数据,可以看到,该页面提供各种类型的图表,如柱状图,饼状图,地图等,图2。

图2 “Today”数据打开界面

2.1.2 选择饼状图分析2018年的癌症数据。可看到肺癌和乳腺癌是新增病例最多的两种。在该页面的左侧有一些过滤条件,研究者可按照自己的需要选择不同性别、年龄、国家的数据,图3。

图3 2018年的癌症数据分析界面

2.1.3 选择国家示例例如选择中国之后可以看到,前三名分别是肺癌,大肠癌和乳腺癌,肺癌比例明显高于全球平均水平,与中国的空气污染应有着紧密的联系,图4。

图4 中国2018年癌症占比界面

2.2 Over Time/历史数据基于过去半个世纪40个国家的高质量数据,提供根据病例和死亡的可视化工具。 点击后可看到病例和死亡两个选项,图5。

图5 “Over Time/历史数据”界面

2.2.1 选择分析变量示例例如选择“Mortality/死亡”,进入到癌症死亡数据库,该数据库是从“WHO/世界卫生组织”的数据库提取出来的。在左侧,“Data Availability/数据可用性”,提供了按照地区,癌症类型,年份来查询的入口,可以查到在该数据库中某个地区,年份是否有某种癌症的数据,图6。

图6 “Mortality/死亡”数据界面

2.2.2 选择地区示例例如选择中国香港,可看到乳腺癌的数据是从1955年开始一直都有的,而大肠癌的数据是从1966年才开始有的,图7~8。

图7 地区选择界面

图8 中国香港数据显示界面

3 数据分析

3.1 “Online Analysis/在线分析”提供了4个工具用来分析,分别是,“Table/表格”:根据人口和癌症生成一张表;“Graph/图表”:根据死亡数据生成柱状图,饼图,金字塔图等;“Prediction/预测”:根据历史数据预测未来短期和长期的死亡数;“Breakpoint/分水岭”:找出历史上数据趋势发生变化的年份,图9。

图9 “Online Analysis/在线分析”界面

3.2 数据分析示例以香港为例,可以来分析一下过去女性乳腺癌的趋势。选择“Graphs”,然后选择“Time trends/时间趋势”,癌症类型选择“Breast”,性别选择“Female”,地区选择“China Hongkong”。可以看到,乳腺癌在1960年时有个快速增长,而80年代略有下降后,就基本保持在一个稳定的水平,图10。

图10 数据分析示例界面

3.3 “Tomorrow/预测”示例估计从2018~2040年的癌症病例数目变化,可看到2018年因癌症死亡的人数是九百万,在2030年时会达到一千三百万,而到2040年时会到一千六百万,图11。

4 结语

图11 癌症预测界面

在现今大数据时代,数据库共享为研究者开展相关研究提供了广阔的平台[7],也为我们获取知识提供了更便捷的渠道。GLOBOCAN 2018指出,虽然不同经济水平国家地之间发病率和死亡率等存在显着差异,但全球癌症地发病率和死亡率都在显着增加。从2012~2018年,新诊断的癌症病例从1410万增至1810万,癌症死亡人数从820万增至960万。2018年数据显示,最常见的癌症分别是肺癌、乳腺癌和结直肠癌,死亡率最高的癌症是肺癌、结直肠癌和胃癌。从这些数字可以看出,最常见的癌症和死亡的率最高的癌症都是有明确原因的,可以通过有效措施进行尽早预防并发现,从而达到早干预,早获益。吸烟、超重和肥胖、高脂饮食、水果和蔬菜的低摄入量以及久坐等不健康的生活方式与常见癌症的发生有关,其他原因还包括污染,感染,辐射和其他因素等。在高收入国家和许多中等收入国家,由于疾病认识的提高,开展早期发现和乳房X光检查等措施的施行,以及科学的疾病治疗和管理,乳腺癌的死亡率已大大降低。因此,各个国家都应该努力制定预防措施来减少癌症带来的负担,同时应强调对HPV和HBV的认识和通过疫苗接种等措施来减少癌症的发生。

猜你喜欢

示例死亡率发病率
多晒太阳或可降低结直肠癌发病率
走路可以降低死亡率
语文作文点评及升格示例
春季养鸡这样降低死亡率
“口”字大挪移
新冠肺炎的死亡率为何难确定?
ARIMA模型在肺癌发病率预测中的应用
急性烂鳃、套肠、败血症…一旦治疗不及时,死亡率或高达90%,叉尾鮰真的值得养吗?
重庆每小时10人确诊癌症 癌症发病率持续上升
飞吧,云宝