基于Analysis Service的联机分析在病案管理中的应用
2016-07-10吴桂芳
吴桂芳
利用数据仓库及联机分析技术对病案信息进行科学的管理分析将是医院重大决策的主要依据。本文通过建立病案数据仓库,借助于Analysis Service的联机分析技术为医院管理者作决策提供全方位、可靠的数据支持。
【关键词】病案管理 数据仓库 联机分析 Analysisi Service
OLAP技术与数据仓库技术、数据挖掘技术一起 , 是当今决策支持系统的主流技术。OLAP 多用于支持复杂但目的比较明确的分析操作 , 通过对数据一系列交互的主动查询过程 ,对数据进行多层次、多阶段的分析处理, 为用户提供灵活的信息访问权利、丰富的数据分析和报表功能。尽管数据仓库和联机分析处理是现代优秀的DDS中的核心技术,但是在医疗卫生领域,与医院信息管理系统结合确是一个较新的尝试。
本文正是围绕基于建立病案数据仓库的基础上利用联机分析技术来研究联机分析技术在病案管理中的应用。
1 数据仓库和OLAP技术、Analysis service
通过创建多维数据集来组织和汇总用于进行有效分析查询的数据,OLAP提供了数据仓库数据的一种多维表达方法。数据仓库结构的设计可以影响这些多维数据集在设计和建立方面难易程度。
从数据挖掘的角度上来说,数据仓库和OLAP技术为数据挖掘提供基础。因为数据挖掘应建立在联机分析处理(On Line Analytical Processing,OLAP)的数据环境基础之上,而数据仓库技术能够满足数据挖掘技术对数据环境的要求。
从OLAP是数据仓库最典型的一个应用角度来说,数据仓库为OLAP提供数据来源,而数据仓库想要实现从中提取有价值的数据信息为作决策服务就得靠OLAP技术来分析。因此,数据仓库和OLAP技术存在相互制约的一面。
Analysis service是用于联机分析处理(OLAP)和数据挖掘的中层服务器。
Analysis service将数据仓库中的数据组织成包含预先计算聚合数据的多维数据集,以便为复杂的分析查询提供快速解答。
2 病案数据仓库的建立
2.1 病案管理需求分析
随着HIS系统的发展及我国HIS系统应用水平的提高,数据量越来越大,领导对决策的要求越来越高,希望能够提供更高层次的数据分析功能,更好地辅助领导进行管理决策。因此对病案进行管理是必需的,而病案的管理现在的发展趋势就是基于DW(Data Warehouse)的OLAP(联机分析处理)数据资源。
在本实验中研究主要利用联机分析实现的主题范围是:
从地区、时间、性别、年龄、职业多维度分析与某种病的发病率之间的关系,如:2005年患肺结核的是本院附近地区占50%,可以层层分析下去具体那个季、月,那个区的多。
从科室和医生维分析对某种病的治愈情况,如:内科对脑出血病治愈的占百分之几,好转、未愈的、死亡的各占多少,层层分析下去到那个医生。
新生儿的出生其性别与时间、地区的关系。
2.2 数据仓库建立流程
2.2.1 数据仓库的源数据分析
针对病案数据具有的隐私性及多样性特点,创建出面向主题的数据仓库实现联机分析。识别源数据,从源数据库中的四十几个表中排除不必要的表和属性。取源数据库表中的病人基本信息、病人住院信息、病人诊断信息、妇婴卡等及自己创建一个年龄段表。
2.2.2 建立数据仓库模型
数据仓库模型的好坏将直接影响下来的联机分析工作性能,及在以后对数据仓库数据更新操作的难易程度、用时多少。因此在本实验中采用以下数据仓库模型(见图1)。
2.2.3 数据的提取及加载
利用SQL SERVER 2000中的数据转换服务工具DTS(Datastore Transmission Service)来抽取数据。在提取过程中,首先建立数据源与目标数据源,然后在目标数据源服务器中完成维表、事实表的创建,建立的包图如图2所示。其中事实表的数据加载SQL语句如下:
If exists (select * from dbo.sysobjects where id = object_id(N'[dbo].[shisi]') and OBJECTPROPERTY(id, N'IsUserTable') = 1)
drop table [dbo].[shisi]
GO
CREATE TABLE [dbo].[shisi] (
[prn] [varchar] (16) COLLATE Chinese_PRC_CI_AS NOT NULL ,
[sex] [varchar] (2) COLLATE Chinese_PRC_CI_AS NULL ,
[job] [varchar] (10) COLLATE Chinese_PRC_CI_AS NULL ,
[rydate] [varchar] (10) COLLATE Chinese_PRC_CI_AS NULL ,
[source] [varchar] (1) COLLATE Chinese_PRC_CI_AS NULL ,
[rynum] [varchar] (10) COLLATE Chinese_PRC_CI_AS NULL ,
[zljg] [varchar] (4) COLLATE Chinese_PRC_CI_AS NULL ,
[ryzd10] [varchar] (16) COLLATE Chinese_PRC_CI_AS NULL ,
[age_id] [varchar] (1) COLLATE Chinese_PRC_CI_AS NULL ,
[TOTAL] [int] NULL
) ON [PRIMARY]
GO
3 疾病及新生儿的多维分析
多维数据是OLAP的灵魂,那么如何组织多维数据实现对病案数据从地区维、时间维、年龄段维、职业维、科室和医生维、新生儿维进行联机分析,首先建立系统数据源连接,然后建立数据库和数据源,再建立多维数据集,设计存储和处理多维数据集,最后多维分析。
3.1 创建多维数据集
建立多维数据集这一步是非常重要的,因为这是直接影响分析时数据的访问灵活性、时效性。本实验中的事实数据表包括的字段有:病案号(PRN)、性别代号(SEX)、职业代号(JOB)、入院时间(RYDATE)、病人来源代号(SOURCE)、入院科号(RYNUM)、年龄段代号(AGE-ID)、诊断号(RYZD10)、治疗代号(ZLJG)、患病人数(TOTOL)等。其他维度表有,地区维表、年龄维表、性别维表、时间维表、职业维表和婴儿维表等,这些维表都是使用星型模式架构的,而科室和医生维表是使用雪花模式架构的。
3.2 浏览多维数据
从图3能看出330号医生在这个科内其技能是较好的,他有较多的病人,而那些病人数少的其技能就有待提高了。另在实验中还可以看出,对于不同的科室来说其病人的结构都不同,如 03号科室的主要病人来源是“医院所在区县”, 10号科室的主要病人来源是“本省其它市”。医院管理者在作决策时都能有相关信息作支持,做好战略计划,提高医院的管理水平,造福人们,同时能获得最高的经济效益。
图4从新生儿和地区维来分析的。在图4中可以看到在所有条件下可以得到在这几年内在这间医院出生的新生儿总数为27119人,其中1表示男孩的有15528人,表示女孩的有11591人.新生儿的出生在“医院所在区县”和“本省其他市”的总人数是相同的。但对于“医院所在区县”来说是新生儿男孩是5176人而女孩是3864人,男孩比女孩多1312人次;对于“本省其他市”来说男孩是4208人次,而女孩是4832人次,男孩比女孩少。从而可以知道医院所在区县的男女比例严重失衡,存在重男轻女的现象。从总的人数来说新生儿的出生情况在地区性上差异不大。如果想知道新生儿在那个时间段出生的多少可以加上一个时间维,选择不同的时间段进行细分下去。从这些时间段中可以观察其出生率的走势。那么医院可以将数据报到政府机关,由他们采取措施防止男女失衡,同时医院也要有相应的应对方法不能随便帮孕妇做人流手术等。在进行宣传教育时要针对医院所在区县的人们来进行。
3.3 对决策的支持作用
就本实验的联机分析,从地区维度来说可以得到是医院所在区县、本市其它地区、本省其它市、外省市、港澳台地区、还是外国患某种病(如:脑出血)的人数,再加上性别维,是男的占比例多还是女多,再加上年龄段维是40-59岁的多还是60岁以上的多等等维度来分析,可以作出一个好的解答,对于这种病的预防,在作宣传教育时针对那个地区、那个年龄段、什么职业、男性还是女性来挑选对象作宣传教育,从历史数据中那个季度这种病的发病情况,就选择在这个时间多作宣传。
在医院内部管理方面,在那个月或者那个季度,外科、内科、五官科、还是妇科整体对所遇疾病的治愈情况,钻取下去到具体某位医生的工作情况,在这方面的医疗技术如何,医院管理者可以从中发现,对医生们提要求,为他们设置加强技能培训等。
从新生儿维度可以分析出在那个时间段,那个地区的新生儿出生率情况,男女比例如何,为了平衡男女比例对那个地区那些人群进行教育,政府又应该采取什么有效措施提供一个数据参考。
4 结束语
只要能充分利用联机分析对病案资料的进行整理、利用,就能对医院病案信息进行全方位、多层次的查询和分析,为医院各类人员提供信息查询、数据分析和决策支持。病案信息利用越多其价值越高,改变以“重管轻用”和消极等待利用的思想,做到管理和利用相结合。
参考文献
[1]Microsoft Corporation. Analysis Services[M].MIicrosoft Press ,2001.
[2]魏忠琴 .数据仓库技术在医院病案统计分析中的应用研究[J]甘萧科技,2006.
[3]刘翔. 数据仓库与数据挖掘技术[M].上海:上海交通大学出版,2005.
[4]陈华英. 医疗卫生信息数据仓库及联机分[J].CNKI:CDMD,2001.
[5]https://www.evget.com/article/2015/10/23/22815.html
[6]孔琳.基于HIS的数据仓库构建及多维分析[J].医学信息学杂志,2011,32(11):6-9.
作者单位
广州市增城区新塘医院 广东省广州市 511340