医院决策支持的信息化研究设计
2019-01-06刘庆金牛恒星张寒彬
刘庆金 牛恒星 张寒彬
摘要:目的:为院长正确决策,医疗质量评价,医院等级评审,医院管理流程优化等提供数据支持。方法:通过ETL,CDC等多种技术抽取生产数据库的数据,构建基于Oracle数据库的数据仓库。然后基于数据仓库的数据进行分析,对生产数据库和在线业务系统不产生影响。结果及结论:医院决策支持系统的研究和实现将改变医院管理现状,提高医院管理水平和效率,促进医院健康发展。
关键词:醫院管理;决策系统;数据仓库
中图分类号:R-058 文献标识码:A
文章编号:1009-3044(2019)32-0011-03
1背景
随着信息化不断发展,对医院信息化建设要求越来要高。多年来,医院在信息化建设方面进行许多探索,实现不同程度的信息化。医院信息化建设极大地提高医院运行效率,为医院能更好地服务病人提供保障。
现在,国内大型医院都有比较成熟的信息化系统,医院内实施有HIS,LIS,PACS,EMR,OA,临床路径等系统。对系统进行集成,从业务系统查询报表,进行统计,统计结果可以为医院管理提供数据支持。但是从系统进行查询报表存在许多问题,首先各个业务系统的统计口径不一致,导致查询出的报表结果存在很大的差别。其次,在业务系统中不能统计时间过长,否则,会影响业务系统的使用。最后,各个系统账号和密码不同,如果要进入不同的系统,操作频繁。因此,一套既能满足业务部门的业务需求,又能为院长提供决策支持的系统显得尤为重要。医院决策支持系统可以查询所有想要的信息,而不必登录多个系统。医院决策支持系统拥有集中,统一,宏观的操作界面,更加简洁,人性,满足院长需求。
2系统设计
2.1系统架构
医院决策支持系统可以基于多层架构实现,在业务层,是医院已经应用的各种业务,包括HIS,ERM,LIS,RIS,PACS,手术,麻醉,体检,人事,财务,人工管理以及其他业务系统。各个业务系统每天运行,运行过程当中,产生各种运行数据,这些数据保存在各自系统的数据库之中。每种业务系统使用的数据库不尽相同,包括Oracle,SQLserver,DB2,My SQL,Sybase,Cache等多种数据库。系统架构如图1所示。
医院决策支持系统在后台基于大型数据库Oracle,构建数据仓库。利用ETL,CDC等多种技术从各个业务系统中,抽取各种数据库中的源数据。通过这种方式,所有的数据查询与检索都基于构建的数据仓库,不占用各个业务子系统的生产数据库资源,因此不会影响医院业务系统的运行效率。
2.2数据仓库
对医院中已有的业务系统和信息系统中分散的数据库,进行数据抽取,清理,经过加工,汇总和整理,从而构建医院决策支持系统所需要的数据仓库,利用这种方法消除源数据库中数据的不一致性,从而保证数据仓库内数据的一致。通过数据仓库,为前端查询和分析作基础。数据仓库中的数据随着时间变化,但同时大量数据保持相对稳定。
医院决策支持系统中数据仓库的架构已经非常成熟,首先利用Flume进行数据采集,采集的数据经过处理后被存储下来,然后利用Hive,MR,SparkSQL等技术进行数据的分析和计算。分析和计算得到的有用的结果共享,为报表应用提供数据。医院决策支持系统中,主要对数据进行查询操作,没有数据库的增加,删除,修改操作。
数据仓库设计中,首先要根据医院的需求确定主题域的边界,在医院决策支持系统中需要提供的主题有:综合运营主题,门诊主题,住院主题,手术主题和临床路径主题。确定主题域后要确定各个主题的量度,综合运营主题需要考虑的指标包括:门急诊收入,住院收入,门诊人均费用,住院人均费用,住院耗材,门诊耗材等。门诊主题需要考虑的指标包括:门诊预约类型,门诊量统计,门诊病人来源,门诊费用分类等。住院主题需要考虑的指标包括:床位资源,医疗组,平均住院费用,平均住院天数,药占比等。手术主题需要考虑的指标包括:手术例数,出院手术占比,手术分级占比等。临床路径主题包括:使用率,入径率,完成率,变异率等。
2.3ETL
ETL技术将数据从来源端经过抽取,交互转换,加载至目的端。医院中各个业务系统中的数据经过抽取,清洗,转换后加载到数据仓库。形成标准统一的数据集合,为医院决策提供分析依据。
在ETL设计中,主要分为三个部分。数据抽取,数据清洗转换,和数据加载。ETL实现的方法很多,其中有ETL工具,SQL方式实现以及两者结合的方式。当数据抽取的时候,对于与数据仓库相同数据库系统的数据源,抽取的方式采用两者之间建立链接关系的方式即可。如果数据仓库和数据源的数据库系统不同,可以通过ODBC方式建立数据库连接。对于文件类型数据库,需要利用数据库工具导入指定数据库,然后从指定数据库进行提取。对于数据量巨大的数据库系统,采用增量更新的方式进行抽取。
抽取后的数据需要进行冲洗和转换,对于不完整的数据,首先将其选择出来,然后对缺失部分进行补充完整,然后再写入数据库。对于错误数据,通过SQL语句查询,交给医院业务部门修改后,再进行抽取。对于重复数据,删除重复部分,然后进行抽取。有时候,对不一致数据还要进行数据转换,这是一个不同业务系统数据整合的过程。有些业务系统的数据非常详细,但是数据仓库并不需要如此详细的数据,因此业务系统的数据需要按照数据仓库粒度进行聚合。ETL需要记录运行日志,日志包括执行过程日志,错误日志和总体日志。如果ETL运行出错,可以向系统管理员发送警告。
2.4CDC
CDCESJ是一种增量数据采集的解决方案,这种技术是在or-aele数据库中使用的,这种技术可以识别上次提取后发生变化的数据。CDC技术结构基于发布者和订阅者模型,发布者可以捕捉系统中变化的数据,订阅者从发布者得到变化的数据。在Oracle系统中,CDC拥有一个发布者和多个订阅者。