数字化医院智能决策系统的主题分析与实现
2014-11-18方正
方正
【摘 要】随着数字化医院的发展,医院信息系统产生出大量的数据,如何管理这些历史数据,让信息发挥最大的作用,为决策者服务变得尤其重要。本文阐述了数据仓库在医院信息管理的实际应用,总结了医院数据仓库的构建及其OLAP应用,采用某医院的HIS数据库作为数据源,构建针对医院主题进行分析的数据仓库。实现了门诊业务、住院业务、抗菌药物管理等主题的多维数据分析,解决了现有系统中对历史数据分析困难的问题。
【关键词】数字化 医院智能决策系统 主题分析 实现
【Abstract】With the development of digital hospital, the hospital information system to generate a large amount of data, how to manage these historical data, make information play the biggest role, as policymakers become especially important. This paper describes the data warehouse in the practical application of hospital information management, summarizes the construction and application of OLAP data warehouse by the hospital, a hospital HIS database as the data source, the construction of data warehouse analysis for hospital theme. To realize the multidimensional data analysis of outpatient, inpatient service, business theme of antibacterial drug management, solves the problem of the analysis of historical data in the existing system.
【Key words】Digitization; Intelligent decision system of hospital; Subject analysis; Realization
引 言
目前,全球每天产生高达100,000T字节源自医疗信息(2010年)的数据,且在近几年来的所有数据中就有90%的数据是在过去两年间产生的。我国信息化医院的建设从80年代初期起步,经过了近30年的发展已经日趋成熟,医院系统的数据库中都存有大量的数据。在数据量爆炸式增长的今天,如何管理这些历史数据,让信息发挥最大作用、并易于理解和处理为决策者提供有价值的信息服务,就变得尤为重要。这信息服务中需要满足医院不但要知道过去发生的事情,还要知道现在发生什么,未来可能会发生什么,以及应采取哪些措施的各种信息需求。
通过数据仓库技术,可以实现对医院数据的整合,为决策者提供决策的数据基础。目前,我国医院的数字化平台都是由多个子系统组成,各个子系统功能独立,子系统之间通过接口进行信息交互。由于子系统之间的供应厂商不尽相同,在数据库软件的选择和数据内容的定义也会是不同的,因此需要选择一个公共的平台作为基础数据的基础,在此平台之上构建数据仓库。例如,可以选择HIS(医院管理信息)系统作为数据仓库的平台是医院信息化的基础,其提供药房药库管理、财务管理、人事管理、住院门诊收费等众多医院运营的基础管理功能。医院其余子系统都有HIS系统接口,并通过接口传输信息。
1.医院主题与重点绩效指标(KPI)
在医院信息化管理中,为了更加深入、全面地掌握医院各业务的运营状况,我们采用分主题制定的医院管理模式。医院主题是指面向医院各业务的一组业务指标的集合。它可以针对不同的医院业务设定其KPI(重点绩效指标)予以衡量,并自主地选择该业务下的多个维度进行分析与比较。比如对人员构成的分析就可以从编制、职级、工作性质、部门等多个不同维度,对医院的人员构成,如在职员工数、平均年龄以及离职率进行多维分析;多维分析是指按照预先设定的分析角度,对指标进行分析,比如机构、时间、职称、学历、年龄段等。
目前,我们参考了《三级综合医院评审标准与评审细则》(2011年版)、《全国医疗卫生系统“三好一满意”活动2012年工作方案》、《三级综合医院医疗资粮管理与控制指标》等卫生部指导文件,某医院所有报表,医疗行业核心期刊(中国数字医学、中国药学)等国内外论文,人民医院一、二期等数据决策系统实践项目,从而大范围地把医院的主题分析分为:门诊、药房药库、住院、抗菌药物、医院感染、医疗保险、基本监测等医院主题分析,并根据医院的实际情况,为每个主题选取了多个能够全面衡量主题业务情况的KPI。
在门诊的主题分析中,我们选择门诊人次、急诊人次、每诊桌工作量、预付费人次、门诊收入、门诊人均药费、平均处方金额等KPI来衡量门诊业务与财务,可以监测门诊业务的门诊量是否异常,分析门诊不同收费类型的收入占比,并进一步从时间、科室、病人、挂号类型等维度分析医院门诊的基本运营情况。
在药房药库的主题分析中,我们选择药品收入、药品收入占比、当前药房(药库)总库存额、药品库存周转率、库存药品品规数、盘盈盘亏量、毒麻药领取数量等KPI分别来衡量药房与药库业务与财务,并从药品通用名、药品规格、供应商等维度分析医院药房药库的某个时间段的出入库量、金额和各类药品的库存情况。
在住院的主题分析中,我们选择了年住院患者出院例数、每住院人次费用、住院患者实际占用总床日等KPI来衡量住院业务与财务,从时间、病区、病种、科室等维度分析对住院床位使用情况进行合理的了解并提出合理的解决方案,更重要的是能够对住院治疗质量做出实时的监控,如住院死亡率、跌倒率、压疮率等。
在抗菌药物的主题分析中,我们选择了抗菌药品金额、处方西药金额、DDDs统计、DDDs强度、住院病人抗菌药物使用率等KPI来衡量医院抗菌药物的使用情况,从时间、科室、医生、药品分级、药品类型等维度分析医院抗菌药物的使用量、使用金额、使用品规数,对超过规定使用的情况进行控制,有效防止出现滥用抗菌药物的情况。
在医院感染的主题分析中,我们选择了院感总发生率、手术部分总感染率、血管导管所致血行感染率等KPI从时间、科室、病房等维度分析患者在手术过程中发生感染的情况,监测重点科室,比如重症医学科中患者在使用不同器械过程发生感染的例数等。
在医保的主题分析中,我们选择了医保病人总费用、医保在院病人数、医保费用返还额等KPI从时间、病区、病人身份等维度来分析某时间段中不同身份不同病人的医院患者的报销费用、费用返还情况等,并实时地通过计算医保病人的人均费用判断医保收费是否出现异常,实施适当的解决措施。
最后,通过基本监测主题分析,我们能够以一个更加全面与简洁的方式去了解与监测医院所有的业务运营情况,因为它分成资源配置、工作负荷、治疗质量、工作效率、患者负担、资产运营和科研成果七个方面,多维度分析了医院中基本设备使用管理、接收患者的业务量、治疗服务质量水平、各类型员工的工作状态、患者的经济负担、资产财务的合理规划、医院科研技术的成长情况做出了最全面的展现。
2.医院数据仓库总体方案与构建
数据仓库自从1988年被Inomn提出后,经历快速的发展。目前有两种数据仓库体系结构。Bill Inmon提出的CIF体系结构与Ralph Kimball博士提出的MD(Multi-Dimension)体系结构。两种体系结构都能实现数据的整合和数据分析功能。
2.1 CIF数据仓库结构与MD数据仓库结构
CIF数据仓库开发以企业数据模型驱动,采用自顶向下的开发方式。自顶而下的开发方式需对所有系统进行分析,并要求系统相对稳定,不能轻易更换系统。开发周期长,可能不会很快看到结构。
MD体系结构是基于多维数据集市的数据仓库结构,它所有的BI分析都是以多维设计为基础[1]。MD采用自下而上的开发方式,采用迭代的方式逐一完成各个主题的数据集市。MD机构中缺少的是一个独立的数据仓库。在MD结构中,数据仓库的是虚拟的,并且是由所有的独立数据集市构成的。
2.2 医院数据仓库结构选择与构建
从复杂性来说,CIF数据仓库是一个企业级的数据库,它所涉及的数据表必然包括所有主题的数据内容,在初期构建是异常的困难,很容易导致数据冗余或者数据的不规范。随着企业的业务扩展,会增加相应主题的数据表,CIF数据仓库数据开发会持续很长时间,对于医院大数据库表的增加和维护也是一项艰巨的挑战。而MD结构,将不同的主题拆分为不同的数据集市;把复杂的业务数据库简化为面向主题的多维数据集。但是维度的复用将是数据集市设计的重点。医院的系统经常有更换的可能性,如果采用CIF结构,底层数据结构发生变化,对整体的ETL和OLAP分析都会产生巨大的影响,而DM结构,只需要更新相关主题的ETL与数据维度即可,不会产生巨大的修改。综上所述,采用MD结构的数据仓库更适合医院数据仓库开发。
多维模型数据库设计方法的中心是星型连接[2]。中心也称之事实表,围绕着事实表是维度表。事实表数据由两个部分组成,维度键与度量值。度量值(Measure)是决策者所关心的具有实际意义的数值。例如,门诊人次、手术次数。事实表中存放的事实数据通常包含大量的数据行。事实数据表的主要特点是包含数值数据,而这些数值可以统计汇总以提供有关单位运作历史信息。维度键是维度表的外键,事实表中一般不包括描述性信息。维度是人们观察的角度。例如,我们想观察抗菌药和抗菌药的使用比例,药品就是一个维度;希望看看哪个药库库存最多,药库就是一个维度。包含维度信息的表是维度表。维度表包含描述事实数据表中的事实记录的特征。有些特性提供描述性的信息,如病人的性别,年龄,医保类型,有些特性则用于指定如何汇总事实数据表数据以便为分析者提供有用的信息,如病人的性别。
3.医院数据仓库ETL设计与实现
ETL是英文Extract、Transform、Load的英文缩写,在数据仓库项目中代表数据从业务数据库中抽取、转换到最终装载到数据仓库。通常后台的ETL系统常常要花费70%的时间和工作量[3]。
3.1医院数据仓库ETL设计
第一步:统一维度处理。由于数字医院由多个子系统组成,各个系统相互独立。需要把维度进行统一,让不同主题的事实表共享相同的维度。以病人数据为例,HIS中病人信息、手麻系统中的病人信息与电子病历中的病人信息数据存储的内容可能不尽相同。虽然后两个系统可以独立做成两个主题,但是如果各自都有独立的病人维度,会导致各个主题之间相互独立。因此我们需要基于HIS系统中病人一个基础病人表,然后在这张表基础上添加其他系统中额外的病人的数据,所有主题都能连接这唯一的病人维度即可进行病人角度的分析。
第二步:脏数据清洗。业务数据库都存在大量的脏数据,脏数据如果导致数据报表的展现错误,会影响到医院管理者的决策,所以需要尽可能删除业务数据中的脏数据。脏数据主要体现在:重复数据,空数据,错误数据与应该删除但未删除的数据。在ETL的过程中进行数据清洗,修改明显的错误数据,同时也需要各子系统的管理员对自己的历史数据进行维护。
第三步:增量抽取。由于子系统的维护人员会经常修改历史数据,所以简单的抽取增量是不能保证数据的正确性。通过调研,我们定义一个时间点把业务数据库中的数据分为稳定历史数据和非稳定历史数据。每日抽取时间点后的非稳定里数据与稳定数据拼成最新的全量数据。通过修改时间点来调整稳定数据的范围。
3.2医院数据仓库的实现
住院的主题分析,我们可以先从HIS系统中抽取出与住院业务有关的数据,如住院收费信息数据、住院病人信息表、住院病人医嘱信息数据、出院病人信息数据、病房基本信息数据、药房基本信息数据、药品基本信息数据、病人基本情况信息数据、住院床位信息数据等相关数据信息,对这些数据进行整合、统一维度处理、清洗与关联,搭建适合住院业务的数据仓库,制定增量抽取方案。
在住院业务的数据仓库结构图中,我们把住院病人信息数据、住院病人医嘱信息数据、出院病人信息数据作为数据仓库中的主表,时间信息、病房信息、药品信息、病人信息、床位信息、医嘱类型信息、病人身份信息等作为附表,关联于主表上,供OLAP应用中的多维度分析。
4.数据仓库OLAP应用
联机分析处理(OLAP)的主要特点,是直接仿照用户的多角度思考模式,预先为用户组建多维的数据模型,在这里,维度的是用户的分析角度。例如对药品收费数据的分析,时间周期是一个维度,药品类别、开单科室、开单医生也分别是一个维度。一旦多维数据模型建立完成,用户可以快速地从各个分析角度获取数据,也能动态的在各个角度之间切换或者进行多角度综合分析,具有极大的分析灵活性。这也是联机分析处理在近年来被广泛关注的根本原因,它从设计理念和真正实现上都与旧有的管理信息系统有着本质的区别。
综合住院药品主题的维度包括时间维度、药品分类、药品名称、药品剂型、药房名称、病人姓名。用户可以从多个角度进行数据的分析,例如:2010年整年药占比值前十的患者情况,2011年Q1葡糖糖的使用情况;2012年7月科室抗菌药物收费排名。用户不会局限于固定的报表格式,可以灵活的在各个角度灵活组合,找到自己想要的分析数据。
结 语
随着信息技术的发展,医院管理水平的提高,构建科学、合理的数据仓库已经是时代的趋势。通过数据仓库技术,对医院的各个业务系统数据进行整合,为医院管理者提供决策的数据支持,进而提高医院的核心竞争力。