基于HIS数据仓库智能挖掘的决策支持系统研究
2014-01-30袁静王新国刘长兴
袁静,王新国,刘长兴
1.济南军区总医院 信息科,山东 济南 250031;
2.山东省交通医院 信息科,山东 济南 250031
YUAN Jing1, WANG Xin-guo2,LIU Chang-xing1
1.Department of Medical Information, General Hospital of Jinan Military Area Command, Jinan Shandong 250031, China;
2.Department of Information, Shandong Traf fi c Hospital, Jinan Shandong 272000, China
基于HIS数据仓库智能挖掘的决策支持系统研究
袁静1,王新国2,刘长兴1
1.济南军区总医院 信息科,山东 济南 250031;
2.山东省交通医院 信息科,山东 济南 250031
YUAN Jing1, WANG Xin-guo2,LIU Chang-xing1
1.Department of Medical Information, General Hospital of Jinan Military Area Command, Jinan Shandong 250031, China;
2.Department of Information, Shandong Traf fi c Hospital, Jinan Shandong 272000, China
本文基于数据仓库和数据挖掘技术,结合我院实际情况和智能化管理需求进行决策支持系统的研究。通过建立功能明确、维度丰富、粒度细化、展现灵活的数据仓库,进行相关主题的联机分析(OLAP)和数据挖掘(DM)。该系统的应用能够充分利用数据仓库面向主题数据特点,很好地帮助医院进行辅助决策,实现医院的自动化质量监控和智能化临床决策管理。
医院信息系统;Oracle数据库;决策支持系统;数据仓库;智能挖掘
0 前言
医疗卫生信息化走到今天,基于大数据统计分析的业务流程重组日益重要。数字化医院的建设仅靠信息科人员的单兵作战已远远不够,需要全院各科室跨部门并肩协同作战。
我院作为总后勤部指定的医院信息系统(HIS)首批推广应用试点单位,成功地应用 HIS 多年,积累了丰富的数据资源。如何在不影响正常医疗诊治工作的前提下,充分利用 HIS 产生的大量过程信息和数据资源,已成为我院数字化医院建设与发展的重要内容。为此,结合管理层及临床医生的决策分析需求,利用数据仓库和数据挖掘技术构建通用、方便的决策支持系统,使医院管理者和临床医生能够按照自己的需要快速、准确查询到相关内容的各类数据用于决策的分析和制定,
1 系统实现目标
利用多年医院各信息系统的历史数据来建立一个功能明确、维度丰富、粒度细化、展现灵活的数据仓库,并进行相关主题的的联机分析(On-Line Analytical Processing,OLAP)和数据挖掘(Data Mining,DM),从而满足医院分析人员从不同的切入点(如医疗效率、质量、科研等)对数据进行不同维度(如时间、科室、病种、性别、年龄、费用类别、入院病情、治疗结果、诊断对照等)的分析。
2 系统总体设计方案及技术路线
2.1 设计方案
由于 HIS 的特点所限,特别是门诊高峰时期要求极其迅速的响应速度和联机事务处理能力,所以对数据的分析挖掘应当在不影响医院日常诊疗业务的基础上进行。通过数据仓库的重新构建可以使医院的联机事务处理与数据分析处理各自独立运行,避免数据分析处理对高峰期正常业务的影响。我院 HIS 一直使用 Oracle 数据库,为了使数据转移更加方便,所以仍然选择 Oracle 数据仓库技术解决方案,数据装载和转换工具采用 Power Builder9.0。
依托医院多年积累的数据资源,采用 Oracle 数据仓库技术对医院大量历史数据(主要包括各类基础字典信息、病人首页信息、诊疗记录、费用信息)进行面向主题的组织和整理。通过构建基础代码及知识库、病案首页基础数据库、诊疗信息数据库、费用明细库等主题数据库,对 HIS 的数据进行数据采集、分类建库和统计分析,建立一个功能明确、维度丰富、粒度细化、展现灵活的数据仓库。最后使用 Oracle Discoverer、Oracle Express、Oracle Data mining suite 工具中的聚类、挖掘、预测等数据处理技术,对 HIS 内部和外部数据进行多层次、多角度、全方位的分析,并通过人工神经网络算法和微软决策树算法实现对病情诊断和病情治疗分析的数据挖掘,揭示医疗活动的内在规律和变化趋势,形成具有决策价值的战略信息[4-5]。
2.2 技术路线
Oracle Discoverer 是一个直观的特定查询、报表生成和分析的工具,它使人们能够更好地分析数据仓库中的数据,以辅助决策。通过它可以从维中任一属性、级别或同时多个属性、级别来分析各事实表信息,还可以利用维的级别关系上探、下钻、压缩和分析旋转数据来分析各事实表信息,如从某月门诊量情况上探到某年,下钻到某天门诊量,或从某个人门急诊接诊人数上探到某科室门急诊量,为管理者提供各种报表、视图和决策依据。
2.2.1 数据仓库的构建
数据仓库是决策支持系统的基础,整个系统的数据源泉。数据仓库的安装过程及初始化参数的设置与运行数据库完全相同,只是创建数据仓库时选择模板为 Data Warehouse。
2.2.2 逻辑模型的设计
根据对 HIS 数据结构和医院数据运行特点的全面分析,结合医院现行的统计需求和各类报表格式,将数据库仓库中各数据表之间的关联形式设计为星型模式,它的优势在于构建数据仓库中建立事实表与维表之间的连接索引,使得数据库在执行查询时可直接获取数据而不必实施具体的连接操作,这样就可以比较容易地找到一个固定的算法,将用户的多维查询请求转换成针对该数据模式的最优化的标准 SQL 语句。在现有各业务系统的基础上,对数据进行抽取、清理,并有效集成,按照主题进行重新组织,最终确定数据仓库的物理存储结构,同时组织存储数据仓库元数据(具体包括数据仓库的各类基础字典信息、病人首页信息、诊疗记录、费用信息)。
2.2.3 数据装载和转换
应用数据库开发软件 Power Builder9.0 将“军字一号”数据通过数据管道装载到本数据库中,再根据业务特点进行逻辑设计,合并相应的表格,增添和删除相应的列,构建定义事实表(如门诊就诊记录表、门诊费用明细表、住院病人病案首页记录、住院病人费用明细表、检查记录表、检验记录表等),并填充数据;在此基础上,根据决策需求构建维表(对事实表进行分析的角度,如时间维、科室维、病种维、性别维、年龄维等);最后通过外键建立事实表与维表的连接。数据仓库的建立到此基本完成。
2.2.4 数据的管理与维护
数据管理与维护是整个数据仓库系统的核心。构建好的数据仓库必须象运行数据库一样进行定期维护。由于数据仓库系统的原始需求不明确,且需求在不断调整、变化与增加,所以必须根据用户的反馈信息,不断调整或增加主题,寻找数据,对数据仓库进行扩充和完善。医院 OLTP系统运行也在不断产生新的数据,必须定期将这些数据加载到数据仓库中。
2.2.5 数据分析处理
通过聚类、挖掘、预测等数据处理技术,对 HIS 内部和外部数据进行多层次、多角度、全方位的分析和挖掘,引入人工神经网络算法和微软决策树算法实现对病情诊断和治疗分析的数据挖掘,揭示医疗活动的内在规律和变化趋势,形成具有决策价值的战略信息。
基于多维数据集的 OLAP 是将数据想象成多维的立方体,通过对多维数据集从不同的切入点(如医疗效率、质量、科研等)进行不同维度(如时间、科室、病种、性别、年龄、费用类别、入院病情、治疗结果、诊断对照等)的切片、切块、聚合、钻取、旋转等一系列操作,使用户能从多种维度、多个侧面或多种数据综合度查看数据,掌握数据背后蕴含的规律。
(1)数据切片与数据切块。如在科室维中选择“消化内科”,则可形成在科室维上的数据切片,显示消化内科各年的病人分布情况。如果科室维取值为“消化内科”,时间维取值为 2003 年第二季,则得到一个数据切块,显示出消化内科 2003 年第二季度的各职业病人分布情况。若对更多的维进行切块,则在WHERE后面的条件中增加维设置,从而完成更复杂的查询需求。
(2)数据钻取和数据聚合。维度是具有层次性的,如时间维度层次结构的顶层可以是年,下一层是季度,然后是月、周,最后位于层次结构底层的是日。维度的层次实际上反映了数据的综合程度。数据钻取就是从较高的维度层次下降到较低的维度层次上来观察多维数据。
(3)数据旋转。数据旋转改变维度的位置关系,使决策者可以从多角度来观察,如将横向的时间维和科室维进行交换,从而形成横向为科室、纵向为时间的报表。
2.3 系统的功能
通过数据仓库的构建及对数据的分析处理,应用各种挖掘工具,可以迅速得到医院日常所需的各种报表信息,并利用这些信息有的放矢地制定工作措施,加强医疗、护理方面的质量控制,针对性地解决实际问题。更重要的是,针对某一主题对数据仓库中的数据进行更深一步的分析,可以从长期大量的数据中发现其蕴藏的规律,并对未来可能出现的情况进行预测,为医院决策提供依据,这才是构建数据仓库最主要的目的。
(1)医疗业务分析。医疗业务水平的高低和服务质量的好坏将直接影响医院的形象。因此,根据病人诊断及治疗方面的历史数据,按不同的时间维度,包括按年综合、按月综合、按日综合进行类别,统计出各个医疗业务的开展数量,从而对医院重点开展哪些医疗服务类型进行辅助决策。
(2)医疗效率分析。通过对医院门诊 /住院病人的各种构成分析,如病人的来源分布、职业分布等,能够有针对性地采取一些措施来提高服务质量,增加门诊量和住院收容量;根据门诊病人从挂号到取药在医院逗留的时间数列动态分析,掌握影响病人的流动状况及影响诊疗效率的因素,帮助医院管理者进行业务流程的更新和改造,以提高医院的服务水平和经营效率;病人床位占用情况直接影响医疗效率和经济效益,对病区床位信息进行床位占有率方面的统计分析,可以帮助医院管理者掌握经营状况,确定影响医疗效率和经济效益的因素。
(3)医疗质量分析。通过对门诊病人从初诊到复诊,到再复诊的流动状况分析,可以发现门诊医生是否有推诿、敷衍等行为 ;将门诊诊断 ICD 码与病人的检验检查结果与处方进行相关性分析,找出其中的相关性,可以通过数据分析进行医学循证;对病史产生的大量数据进行分析,在病情诊疗质量方面进行多维度、灵活、细化的数据集成,可以找出存在的问题,减少院内感染,避免并发症,提高医疗质量。例如通过抗菌药物监控、病原学送检率、某类切口的各种实时监控,对当前在院病人之前30天的门诊诊疗过程进行筛查,发现事故苗头;对住院病人数据进行分析,评估其潜在的纠纷病人[6]。
(4)医疗经济效益分析。按不同的时间维度(年、月、日)对医院的各种资金流动情况进行分析,进行资金的同期对比动态分析,门诊和住院收入因素分析,使决策者能够快速全方位掌握医院的资金流动状况。通过对病人构成分析(可以按照性别、年龄、文化程度等对病人进行分类),系统可以对病人的经济状况、需求特征和购买行为进行分析,从而得到不同性别、不同年龄、不同文化程度病人的经济水平、需求状况及主要医疗服务类型等信息。根据这些信息,医院决策者可以分析病人差异对医院收益的影响,帮助医院进行市场定位、确定营销策略,从而使医院的经营活动更具主动性和目的性。
(5)医学科研分析。分析不同病种的发展趋势、治疗方法,为医院临床专家提供医疗研究方面的决策支持,如通过决策树技术结合流行病理论来分析某种疾病与患者年龄、生活习惯等因素的关系,从而找出病因及诊治方案;可以将大量的医学经验抽象成为方便和容易使用的规则形式,为临床工作提供可靠的决策信息进行临床实践指南。
3 系统特色和创新之处
把大量历史数据通过提取、转换、装载引入数据仓库,通过清洗纷繁芜杂的数据来解决数据不一致性、数据查询不准确问题以及历史数据查询等;然后利用联机分析系统独特的多维方式对数据进行分析,使用户从不同的维度了解历史及现状,最后利用数据挖掘工具自动地挖掘潜在的模式,提供正确的决策。
根据管理和临床科室的需求,从医疗效率、业务、质量、效益、科研等不同方面确定决策主题,特别是对于病情诊疗质量分析主题,经过数据仓库的物理模型和逻辑模型的详细设计,创建具有时间、病种、性别、年龄、科室、费用类别、入院病情、诊断对照、诊断符合情况、治疗结果等多个维度和具有诊疗人数、住院天数、住院次数、平均住院天数、病种构成比、治愈率、死亡率、诊断符合率、急危重症抢救成功率等多个度量值的病情诊疗质量分析多维数据集,以灵活、细化地进行病种诊疗质量方面的联机分析处理。
本系统创建了病情诊断分析人工神经网络挖掘模型和病情治疗方案分析决策树挖掘模型,可完成多维度的病种构成分析及各时期、各科室、常见病种的各项诊疗指标的多维度查询和动态趋势变化的潜在性规律分析,实现对疾病自然规律及病种诊疗质量的分析,从而有利于医院决策者采取相应的管理措施,提高医院的工作效率和质量。
系统的开放性和可扩展性。系统的研究重点是分析数据,主要包括两个方面的内容 :① 从长期的大量历史数据中提取需求数据 ;② 根据用户不断发展的需求去系统中寻找数据。系统使用过程中,根据用户的反馈信息,如环境的变化,会产生新的需求,或者对获取的信息要求更加具体或更加概括一些等需求,来调整或增加主题及维度;根据运行数据的增长不断扩充和完善数据仓库。因此,系统是一个需要不断迭代开发的过程,以模块化、标准化结构进行系统分析,按统筹规划的原则设计系统方案,在考虑技术先进性和当前业务实用性的同时,必须考虑到业务的扩展需要,可以方便地在系统中增加不同主题的应用。
4 下一步研究的重点
基于 HIS 数据仓库的决策支持系统,与数据仓库、联机分析、数据挖掘的相辅相成,能够为医院决策者提供可信赖的决策依据,实现更有效的决策,填补决策支持技术在医疗领域中应用研究的空白[7-8]。本研究重点实现了医疗效率、医疗质量的决策分析;药品、物资、耗材等数据的分析未能纳入本系统的构建,如何对这些数据进行更深层次的挖掘是下一步研究的重要课题。
[1] 俞磊,杨松涛,王宗殿.基于数据仓库的医院决策支持系统的研究与设计[J].计算机与数字工程,2010,38(4):142-145.
[2] 王炯,夏宏斌.浅析数据挖掘技术在医院信息化平台建设中的应用策略[J].网络与信息,2010,(6):22-23.
[3] 史今驰.数据挖掘技术在医院信息系统中的应用[J].中国医疗设备,2012,27(1):86-88.
[4] 林超英.数据挖掘在医院信息化建设中的应用研究[J].信息与电脑(理论版),2011,(2):127-128.
[5] 施惠娟.可视化数据挖掘技术的研究与实现[D].上海:华东师范大学,2009.
[6] 马利亚,李婧杰,马国鹏.基于数据仓库的医院决策支持系统的应用[J].中国医疗设备,2012,27(12):121-122.
[7] 刘丽华,周忠彬,金水高.基于数据仓库技术建立医院统计数据资源库的应用研究[J].中国医院统计,2005,12(3):195-198.
[8] 何彩升,彭望清,章向宏.基于数据仓库技术的医院管理决策支持系统的研究[J].现代医院,2010,10(2):1-4.
Research on the Decision Supporting System of Intelligent Mining Based on the HIS Data Warehouse
Based on the data warehouse and data mining technology and combined with research on decision supporting system that reflected the actual situation of our hospitals and intelligent management requirements, a data warehouse with clear function, dimension, granularity distribution and rich fl exibility is established to conduct the online topic analysis (OLAP, On-Line Analytical Processing) and data mining (DM, Data Mining). The system can make full use of the data warehouse and data mining, and analyze search functions according to subjects, characters and information, which is very helpful for hospital decision making, realization of the automation of quality monitoring and intelligent hospital clinical decision making.
hospital information system; Oracle data warehouse; decision supporting system; data warehouse; intelligent data mining
TP392
A
10.3969/j.issn.1674-1633.2014.12.014
1674-1633(2014)12-0050-03
2014-02-10
2014-09-11
刘长兴,副主任技师。
作者邮箱:yuanjing0520@163.com