疾病负担统计的数据模型与统计元数据*
2016-12-27何亚楠伍晓玲孙丽君徐勇勇
何亚楠 王 霞 伍晓玲 孙丽君 尚 磊 徐勇勇△
疾病负担统计的数据模型与统计元数据*
何亚楠1王 霞1伍晓玲2孙丽君1尚 磊1徐勇勇1△
目的 建立我国统一的疾病负担统计的数据模型、统计元数据框架和统计元数据的描述内容。方法 依据我国现行的死因统计、疾病统计的工作规范和数据集、数据元标准,参照世界卫生组织疾病负担统计的死因及疾病(伤害)的统计分类标准,用统一建模语言(UML)的类图表达数据模型和元数据框架。结果 (1)建立了包括微观数据和宏观数据的疾病负担统计的数据模型;(2)建立了包括9类28个元数据项的统计元数据框架;(3)创建了一个疾病负担统计指标的统计元数据实例。结论 建立疾病负担统计指标的数据模型和元数据框架能够为指标相关的数据收集、表示、交换及整合提供所需的信息技术规范,有利于指标的跨域比较和信息共享。
健康指标 疾病负担 统计元数据 元数据框架
疾病负担(burden of disease)也称疾病负荷、病残负荷,是用患病率、就诊率、住院率、因病离职时间、治疗费用、死亡率和其他一些专门的卫生统计指标综合反映疾病(伤残)导致的失能(disability)和过早死亡(premature death)对一个国家(地区)所造成的社会负担[1]。1990-2010年,世界卫生组织(WHO)发布了289类疾病(伤害)的伤残调整寿命年(disability-adjusted life years,DALY)、减寿年(years of life lost,YLL)和带病(失能)生存年(years lived with disability,YLD)[2]。2012年,中 国 每 年 损 失 的 DALY 为36551.8万年,其中减寿 24290.2万年,带病生存12261.6万年,即每人平均减寿0.175年(64天),带病存活0.059年(21天)。由于我国尚未建立覆盖全人口的死因登记系统,WHO采用我国145个死因监测点的死因数据(覆盖一千一百万人口,每年约5万人的死因分类)推论全国[3],缺乏地区代表性。为了获得我国不同地区(省(市)、自治区)疾病负担数据,我国拟建立具有省级代表性、覆盖各省20%人口的605个死因监测点[4]。因此,无论是疾病负担统计所需的人口死亡数据还是患病数据,都需要一个统一的数据模型、统计元数据框架和统计元数据的描述内容。
资料与方法
1.死亡的个案数据,如死者标识(姓名、证件号)、性别、出生日期、死亡日期、死因的ICD编码等,以现行死因登记报告规范、《居民死亡医学(推断)书》和WS数据集标准为依据[5-8]。
2.患病(伤害)的个案数据,如患者标识(姓名、证件号)、性别、出生日期、就诊日期、诊断日期、诊断名称、ICD编码等,以现行门诊摘要、住院摘要、传染病报告、伤害监测报告、职业病报告等WS数据集标准为依据[6-9]。
3.GBD的死因及疾病(伤害)的统计分类、伤残调整权重(效用值)及疾病死亡模式采用WHO推荐的标准 [10-12]。
4.数据模型和元数据框架用统一建模语言(UML)的类图表达。
结 果
1.数据模型
GBD的主要统计指标(宏观数据,macro data),包括期望寿命及按照病种分类的死亡率、患病率、YLL、YLD、DALY等。汇总数据包括人口数据及按照病种分类的死亡人数、患病人数、平均健康损失(通过效用值、平均患病时间及测量工具计算),数据模型的类图见图1。图1中的死亡个案登记、患病(伤害)个案登记为微观数据(micro data),数据采集遵循WS发布的数据元和分类代码标准。
图1 疾病负担统计的数据模型
2.统计元数据框架
用于描述图1中的各个统计指标。统计元数据框架包括9类29个元数据。9个类分别是概念、总体代表性、分组模式、微观数据集、宏观数据(变量)、维度、数据质量、数据发布与扩散、其他,见图2。
3.元数据内容
图2中29个元数据定义见表1。
4.实例
图1中疾病负担统计的所有统计指标(包括汇总数据),都需要按照表1的29个元数据一一描述。表2是统计指标YLD元数据描述的实例。
图2 疾病负担统计元数据框架
表1 疾病负担统计元数据定义
表2 统计元数据实例(YLD)
序号 元数据名称 元数据描述15 估计方法 采用人口普查数据、疾病(伤害)监测数据、国家卫生服务调查等历史数据或抽样调查数据,建立统计模型估计人口数、死亡人数、患病人数及当年新发病例人数。16 汇总方法 建制县(市)按月汇总17 计量单位 年18 WHO GBD维度 WHO GBD的大类与细类19 WHO监测与评估框架维度 卫生投入与产出的效果评价20 死亡漏报率 实测数据评估结果21 患病漏报率 实测数据评估结果22 死因垃圾编码比率 实测数据评估结果23 诊断垃圾编码比率 实测数据评估结果24 数据发布机构 国家、省(市)、县(区)卫生与计划生育委员会部门25 数据发布频率 年26 局限性 依赖人口数据、死亡数据、患病数据的准确性和完整性。尤其是各病种的患病人数的登记与报告。27 相关链接 http://www.who.int/healthinfo/global_burden_disease/gbd/en/28 备注 按病种分类的指标集29联系人 中国卫生信息学会卫生信息标准专业委员会
讨 论
疾病负担统计的复杂性源于数据收集、汇总的复杂性,如死因登记仅20%~30%发生在医院,患病记录则散落在各个医疗机构。信息技术(如区域卫生信息平台)虽然可以连接所有医疗卫生机构,但不能保证汇总数据的质量,即使像英国这样有悠久历史的覆盖全人口的生命统计国家,死因分类还有6%~8%的垃圾编码[10]。因此,通过数据模型和统计元数据开发,可以理清疾病负担统计 “统计目的-统计设计-工具开发-数据收集-数据处理-数据分析-结果发布-效果评估”8个阶段,从微观数据(如死亡医学证明书)到宏观数据(如死亡人数、死亡率、DALY)应遵循数据的工作规范、业务标准和数据标准,并将所有统计指标的元数据以知识库的方式发布在区域卫生信息平台,促进我国疾病负担统计及相关健康测量指标的研究与应用。
[1]尚磊主编.卫生管理统计学.统计出版社,2014,14-18.
[2]Vos T,Flaxman AD,Naghavi M,et al.Years lived with disability(YLDs)for 1160 sequelae of 289 diseases and injuries,1990-2010:a systematic analysis for the Global Burden of Disease Study 2010.The Lancet,2012,380:2163-2196.
[3]WHO.DALY estimates,2000-2012.Available at http://www.who.int/healthinfo/global_burden_disease/estimates/en/index2.html.
[4]国家卫生计生委.卫生计生统计信息工作2013年度“十件大事”2014-03-18.Available at http://www.nhfpc.gov.cn/mohwsbwstjxxzx/s8555/201403/a6c13325493 049f4ad780b12d1c94092.shtml.
[5]国家卫生计生委,公安部,民政部.关于进一步规范人口死亡医学证明和信息登记管理工作的通知(国卫规划发〔2013〕57号,2013-12-31).Available at http://www.moh.gov.cn/guihuaxxs/s10741/201401/aadf7c912ca14ccaa28db315487d49a9.shtml.
[6]WS 375-2012疾病控制基本数据集.北京:中国标准出版社,2012.
[7]WS 376-2013儿童保健基本数据集.北京:中国标准出版社,2013.
[8]WS 377-2013妇女保健基本数据集.北京:中国标准出版社,2013.
[9]WS 373-2012医疗服务基本数据集.北京:中国标准出版社,2012.
[10]WHO.WHO Methods and Data Sources for Country Level Causes of Death 2000-2012.WHO/HIS/HSI/GHE/2013.4.Available at http://www.who.int/healthinfo/global_burden_disease/GlobalCOD_method.pdf.
[11]Global Burden of Disease 2004 Update:Disability Weights for Disease and Conditions.Available at http://www.who.int/healthinfo/global_burden_disease/GBD2004_DisabilityWeights.pdf.
[12]Murray CJL,Ezzati M,Flaxman AD,et al.2012a.GBD 2010:design,definitions,and metrics.The Lancet,2012,380:2063-2066.
[13]王霞,刘丹红,徐勇勇,等.卫生统计调查元数据概念模型的建立.中国卫生统计,2008,(4):338-342.
Data Model and Statistical Metadata in the Statistical Measurement on the Burden of Disease
He Yanan,Wang Xia,Wu Xiaoling,et al.
(Department of Health Statistics,Faculty of Preventive Medicine,Fourth Military Medical University(710032),Xi′an)
Objective To establish a unified statistical data model in the statistical business process on the estimate of burden of disease,a statistical metadata framework and statistical metadata descriptive content.Methods Based on the present China's specifications of cause of death registration,disease report,data set standards,data element standards,WHO cause of death and disease statistical classification standard in burden of disease(injury),unified modeling language(UML)diagrams were used to express data model and metadata framework.Results (1)the established data model includes micro data and macro data related to the statistical estimates of burden of disease,(2)the statistical metadata framework includes 9 kinds of 28 metadata items,(3)a statistical metadata instance was created.Conclusion The building of the data model and metadata framework of the disease burden statistical indicator can provide the information needed to technical specifications for indicators related to data collection,representation,exchange and integration,which is helpful for index of cross-domain comparison and information sharing.
Health indicators;Burden of disease;Statistical metadata;Metadata framework
陕西省科学技术研究发展计划项目(社发攻关2013K12-19-02);国家卫生计生委统计信息中心课题(中外卫生统计指标体系比较研究)
1.第四军医大学军事预防医学系卫生统计学教研室(710032)
2.国家卫生计生委统计信息中心
△通信作者:徐勇勇,E-mail:xuyongy@fmmu.edu.cn
刘 壮)