基于WEB的数据挖掘系统在医院管理中的应用
2015-05-15龚林峰
龚林峰
摘要:从医院实际情况出发,基于B/S架构设计通用数据挖掘系统,进行技术分析后形成多维度、可视化的WEB应用。以数据挖掘系统为载体,就数据梳理、统一标准、建立仓库、整合应用、多维分析以及初步运行效益与后续发展规划进行了初步的探讨。
关键词:WEB;数据挖掘;医院管理
中图分类号:TP311 文献识别码:A 文章编号:1009-3044(2015)08-0001-02
1 引言
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但有时潜在有用的信息和知识的过程[1]。随着信息化建设步伐的不断加快,各式应用需求不断涌现,给提升医院信息化建设水平带来了难得的机遇。在长期的应用过程中,我院积累了大量的原始数据,包括定量数据(如化验结果、就诊病人体征、财务数据等)和定性数据(如B超、CT等医学影像数据;病人身份记录、病症描述、诊断结果等的文字信息)等,但是各类数据分别存在异构的数据库中,存在统计标准不一、数据分散、接口众多等问题也给医院信息化管理也带来了极大的挑战[2]。为充分利用数据资源,为医院科学管理提供支持,需建立数据挖掘技术方便数据利用。
2 目前医院信息化建设现状
目前医院运用Oracle、Sql Server两种关系型数据库资源,建立了以医院信息管理系统(Hospital Information System简称HIS)为核心的基础运行管理系统,以电子病历(EMR,Electronic Medical Record简称EMR)、手术麻醉系统、实验室信息系统(Laboratory Information System 简称LIS)、医学影像归档和通信系统(Picture Archiving and Communication Systems简称PACS)为支撑的临床医疗业务管理系统,和以人力资源管理、物资物流管理、经济核算管理等系统为辅助的行政管理系统,并从2012年起开启了数据利用方向的基础性探索。
但是这些应用系统结构各异,数据资源的分散、异构,而且信息系统供应商是多个厂商共存,大量的业务系统之间存在网状的接口关系,造成系统的维护和升级变动非常困难和复杂。因此,急需建设一个统一的系统集成平台,用于连接医院内各业务信息系统进行数据交换,实现不同系统间业务功能整合和信息共享。
3 数据挖掘系统建设方案设计
本方案基于B/S架构设计,从医院各信息系统钻取数据,进行技术分析后形成多维度、可视化的WEB应用,结构图如图1所示。
本方案利用统计报表对数据资源进行梳理,各统计报表按照“医院运营管理”和“科室专题”两个维度来划分。
医院运营管理维度下,第一层分为医院运行分析、绩效指标分析、成本数据分析、工作量统计等不同大类;第二层在各大类下,设计不同组别,如医院运行分析下分成了门(急)诊业务分析、住院业务分析、手术情况分析等;第三层在各组别下设计底层报表,如住院业务分析组下,设计出入院数据分析、出院结算数据分析、住院均次费用分析、平均住院天数分析等报表。
科室专题维度下,第一层分成医务科、药剂科、财务科、检验科、血液科、院感科、门诊办公室等大项;第二层,每个大项下又设计不同业务需求的报表,如医务科下包含门诊抗生素使用分析、医疗质量监测报表、门诊药品指标考核、住院药品指标考核等。
通过上述对数据自上而下,由粗到细地报表设计,钻探并梳理了存在于各异构系统中的数据资源。
通过对医院管理者的决策需求以及各业务科室具体业务需求的调查,在统计分析各报表的基础之上,确定创建数据仓库的主题。以住院病人这一主题为例,选择星型模式建立住院病人记录模型,本模型由住院病人记录(事实表)以及病人、病种、时间、工作人员等维表(小表)所组成。其中事实表用于存放大量关于住院病人的事实数据(数量数据),通常都很大,而且非规范化程度很高。维表用于存放描述性数据,它是围绕事实表建立的较小的表。在此基础上,还需经过数据提取、多维数据库创建、多维数据分析等过程才能完成数据仓库的创建。
构建医院数据仓库既是要将分散在各系统的数据集中到一个仓库当中,后续针对数据仓库,我们可以进行主题集市的数据分类利用。数据仓库的数据资源通过准实时(间隔3秒左右)的方式,由各系统系统汇聚而来。
数据仓库的数据资源,并不会直接用于数据分析应用。部署数据整合应用(ETL系统)的目的就是将数据资源通过既定的规则、逻辑进行数据清洗、转换并加载到分析库的过程。
引入OLAP多维分析模型技术,将各分析主题的数据视角维度化[2]。利用OLAP分析模型灵活的应用特点,给用户提供自主拖拽组合、随需切片过滤、按层次钻透明细链接的数据掘进途径。
OLAP的核心是“维”这个概念。“维”是一种视角,是一个判断、说明、评价、和确定一个事物的多方位、多角度、多层次的条件和概念。通过把一个实体的多项重要的属性定义为多个维,使用户能多不同维上的数据进行动态的多维快速访问和分析。以我院数据挖掘系统中的挂号数据分析报表为例,其可选的维度就有“汇总日期”、“医生”、“挂号方式”、“是否急诊”、“病人性质”、“病人来源”、“挂号科室”、“预约类别”等14个,终端用户可根据不用的需求选择不同的维度,迅速的读取满足需求的报表。
4 数据挖掘系统建设现状及应用效果
我院整体上采用Oracle GoldenGate进行数据仓库的构建,选择ETL、BI系统进行数据整合与分析等利用。保证了后期项目能够顺利实施,也给数据利用的深入发展应用打下良好的基础。
通过一个阶段的推进,我院建成了以运营管理数据、临床医疗质量管理数据、KPI考核数据、职能科室专题数据(包括医务、质控、药剂、院感、核算、医保、门办等科室)为核心数据应用体系。用户涵盖了院办、职能科室、临床科室、临床医生等数百个用户,建成了面向全院统一的数据利用平台,汇聚了各系统的数据资源,通过更灵活、直观、可追溯的方式为用户提供了统一的数据利用平台。实现了数据标准的统一出口,自然统一了所有分析项目的数据口径和出口。在单用户层面上使各用户各取所需,能够实时把握自己权限内的各项数据最新情况和变化情况,可为自身工作决策提供动态依据;在科室层面使各临床科室数据统计口径统一,具备了可比性,促进了良性的竞争;院级层面上缩短了管理指标贯彻路径,避免了以往通过月度会议总结,获取咨询的方法,导致很多质量指标在得知超标后已不可逆转的局面。由于数据源可追溯,明确了数据背后的权责,在一个组织单元内,权责也将更加清晰。数据的综合分析,不仅能指导医院现阶段工作,也为未来业务做出预测,从而能为医院管理决策做出指导。
医院数据仓库构建完成后,所有的业务数据资源都能准实时的向数据仓库集中,这给提供服务集成带来了一种更加便捷的实现渠道。如最常见的住院ADT接口,根据HL7标准的接口消息格式可以在数据仓库层面进行生成,再基于ESB服务广播给业务链上的其他系统进行协作处理;其他常见的公用服务如检验/检查结果查询、排队状态查询、预约服务等多渠道使用的服务,也可以根据数据仓库进行统一的服务集成。
5结束语
通过梳理后的服务集成模式,可以给医院现在各系统之间网状的接口关系松绑,实现各系统之间的松耦合连接,从而规范接口关系、降低故障风险,提高可维护性。利用在前期解决了标准问题,完善了数据质量后,从医院内在的管理角度出发,也必然会对数据应用提出更高的要求。我院后续将重点在临床科研、医保预测控费、趋势预测分析等方向进行探索实践。
参考文献:
[1] JiaWei Han, Micheline Kamber.数据挖掘概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,2008:3-5.
[2] 解亚楼,党卓明.数据仓库的建立和数据挖掘技术在医院管理中应用的讨论[J]中国卫生产业,2013(7):164-165.
[3] 曹洪.OLAP技术在数据分析中的应用[J].计算机光盘软件与应用,2013(2):40-42.