APP下载

浅谈数据仓库技术在医院管理中应用

2017-07-13张宇武警北京总队第二医院信息科

消费导刊 2017年23期
关键词:数据仓库挂号门诊

张宇 武警北京总队第二医院信息科

一、研究背景

得益于信息与计算机技术的飞速发展,医院信息化不断完善和进步,数字化对于医院而言已不陌生。各家医院普遍采用数据库技术以及网络技术来处理医院的日常工作和管理。医院信息系统(Hospital Information System,简称HIS)的采用,使得医院的业务工作更加高效、快捷、准确,提高了医院的医疗和管理水平。但随着医院信息化技术的深入发展,针对现有的业务和管理工作,HIS的发展遇到了瓶颈。就目前的HIS应用,还限于对日常业务数据的采集、存储、查询等初级阶段,并没有实现对历史数据的筛选、整合和分析,数据中隐含的有价值的信息不能被发现并加以利用。如何让历史数据不成为“历史”,重新发挥作用,是医院“后信息化时代”要解决的主要问题。

二、系统分析和系统设计

(一)系统分析

系统分析是根据用户感兴趣的问题确定主题,主题就是需要通过数据仓库来解决的问题,也是在构建数据仓库时将数据归类的基本依据。此处简单分析两个主题,以此为例,其他主题均可照此例进行。分别是门诊挂号工作量主题和门诊费用情况主题。

1.门诊挂号工作量

门诊挂号是病人来院就诊的第一行为,它所产生的信息相对较少,但是信息相对完整。对门诊挂号数据进行分析,从门诊科室,病人费别,挂号类别,挂号员等不同角度对挂号人次,挂号费用等数据重新归纳总结,可以得到不同科室的接诊情况,各种费别患者的就诊情况以及挂号员的工作量等数据,从而可以了解医院门诊的运行情况,进而对门诊医疗资源的优化调整提供数据参考。

2.门诊费用情况

门诊收费是门诊的主要业务之一,它直接反应医院门诊的收入情况。通过对门诊收费数据的分析,从门诊科室,病人费别,收费类别,收费员等角度对门诊费用进行归纳总结,可以得到门诊科室的收入情况,各种费别患者的门诊费用统计以及各种收费类别的费用统计等数据。对了解门诊各科室的业务开展状况有指导作用,还可以分析出不同费别病人在医院的消费情况。

(二)系统设计

1.概念模型设计

数据仓库的开发人员可以在数据仓库开发之前通过数据仓库的需求分析,了解数据仓库用户的大致需求。这样,就可以界定一个数据仓库的大致系统边界,集中精力进行主要部分的开发。因而,界定边界的工作也可看作是数据仓库系统的概念模型设计。概念模型设计的主要工作就是确定主题域及其相关内容。本文中我们通过需求分析得到两个主题域,门诊挂号主题域和门诊收费主题域。

2.逻辑模型设计

数据仓库的逻辑模型通常采用星形模型和雪花模型,在本案中我们采用的是星形模型。逻辑模型设计包括维度设计以及度量值设计。

(1)维度设计

维度是描述事实表中数据级别的有组织的层次结构,维度的创建需要根据具体问题进行分析确定。例如:构建病人挂号记录的多维数据集后,我们可以通过日期维度统计每日就诊人次,也可以通过科室维度统计各科室接诊人次,再或者通过挂号员维度统计挂号员的工作量。另外,按照使用方式来分,维度可以分为“共享维度”和“专用维度”。“共享维度”可在多个数据集中使用,避免了重复创建,节约了存储空间和创建时间,专用维度是为个别数据集专门使用的维度。本文涉及的数据仓库模型的主要维度如下:

①日期维:日期维属于共享维,是数据仓库中必备的维度,因为对数据仓库的操作通常要加入时间段,否则统计数据将失去意义。根据一般使用需要将时间维分为四个层次:年→季度→月→日。

②科室维:属于共享维,维表中记录全院科室名称及代码。从HIS数据库中科室字典中获取。

③费别维:属于共享维,在统计医疗数据时通常会区分病人的费别,从而有效的对不同类别的病人信息进行分类汇总。费别一般包括“自费”、“免费”、“医疗保险”、“公费”等,从HIS数据库中费别字典中获取。

④工作人员维:包括挂号员维和收费员维,因为这两个维表的数据均取自HIS数据库中人员字典,所以实际上是一个共享维。

⑤收费分类维:门诊收费专用维度,对费用进行分类的依据,数据取自HIS数据库中收费类别字典。

⑥挂号类别维:门诊挂号专用维度,对挂号类别进行分类的依据,数据取自HIS数据库中号类字典。

(2)度量值设计

度量值是多维数据集事实表中的一列或多列数值,是多维数据集最终要计算并显示的结果,供用户浏览查询。数据类型一般为数值型,通常是对数据集中的某一列或几列求和、计数、取平均值等计算。度量值是用户通过数据仓库最终要获取的信息。例如门诊挂号度量值有挂号人次计数和挂号费用求和,门诊收费度量值有当日次均费用等。

三、具体实施

将HIS数据库中数据通过ETL导入SQLServer数据库中。以门诊挂号为例,科室、用户、挂号分类由HIS数据库导入到SQLServer数据库中,时间表由SQL语句生成。基础数据准备完毕后,利用SQLServer的Analysis Services组件,建立Analysis Services项目,设计数据源视图,以及数据仓库的维度及度量值。最后设计数据立方体并部署Analysis Services项目,生成可浏览的多维数据集。

四、结果展示与分析

前面我们通过对数据仓库的设计与构建,最终得到了关于主题的多维数据集。但是对于用户而言,多维数据集本身并不适合浏览与分析,通过SQLServer的报表服务器可以将数据以友好的形式展示给用户。报表服务器,是商业智能报表产品的重要组成部分,主要功能是提供报表资源管理,用户身份与权限管理,任务调度,信息分发等。报表服务器管理的报表资源主要包括数据库元数据,报表模版,报表输出结果等。另外报表不仅可以以表格的形式显示,还可以以图表的形式进行显示,如饼状图、柱状图等形式,在表现方式上更友好、更直观。

五、结论

本文主要阐述了数据仓库技术在医院管理中的应用。伴随着大数据时代的来临,对于陈旧历史数据的整合与应用越来越多的成为人们关注的焦点,这也是本文的研究背景。通过对数据仓库技术的研究以及对数据仓库构建的具体实施,初步掌握了数据仓库的开发技术与实施方法。结合医院历史数据所构建的两个简单实例,为以后构建更复杂的数据仓库,开发决策支持系统奠定了基础。数据仓库技术对数据的整合及再利用,提供多维度、多角度、多层次观察数据的方式,为信息技术带来了新的革命。以往的业务数据分散零碎,没有关联,为了得到某一数据往往需要进行多张数据表的查询,而且一旦查询主题改变,又要反复查询工作,数据仓库技术极好的解决了这些问题。

[1]Jamie Mac Lennan,Zhao Hui Tang,Bogdan Crivat.董艳,程文俊译.数据挖掘原理与应用—SQL Server 2008数据库[M].第2版.北京:清华大学出版社,2012.

[2]Erik Thomasen.朱建秋等译.OLAP解决方案:创建多维信息系统[M].第2版.北京:电子工业出版社,2004.

猜你喜欢

数据仓库挂号门诊
门诊支付之变
分析探讨自助挂号系统在门诊管理中的应用效果
基于数据仓库的住房城乡建设信息系统整合研究
我会独自挂号
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
汉字小门诊系列(四)
汉字小门诊系列(九)
汉字小门诊系列(八)
基于数据仓库的数据分析探索与实践