APP下载

数据挖掘技术在医院管理中的应用

2014-01-31戴怡妍

中国卫生产业 2014年14期
关键词:数据挖掘数据库医院

戴怡妍

中山大学附属第一医院教学科,广东广州 510000

在我国目前的经济活动当中,数据挖掘(Data Mining,DM)已经成为电信、金融以及公共管理等多个领域当中的重要技术支持手段,在临床医学当中的应用也随着时间的推移而逐渐增多,但是却并未真正应用于医院管理方面。但是在目前的经济环境当中,由于信息化发展所带来的巨大冲击力,使得医院信息系统(hospital information system,HIS)在数据资料方面形成了大量的积累。而这些电子化的数据资料通过传统的统计分析技术无法满足人们越来越多的需要,传统的数据库管理系统也因此逐渐失去了重要的作用。

1 数据挖掘技术的概述

在上世纪80年代的初期,数据挖掘技术基于数据统计理论以及机器学习开始逐渐形成。数据库当中的知识发现(knowledge discovery in database,KDD)为数据挖掘技术的另一个名称,指的是从海量的数据当中将可信、有效、新颖的数据加以提炼,并且将这些能够被人所理解的信息进行深层次的高级处理,而这些信息通常会隐藏在web、大型数据库、信息库以及数据流当中。

数据挖掘技术的分析方法极其丰富,本文当中将列举五条最为重要以及常用的方法进行具体分析,这些方法将有效应用于医院管理工作当中。

1.1 类描述

由于数据库当中经常会蕴藏着数量较多的细节数据,而通过类描述的分析方法能够将这些数量较多但是信息较为丰富的相关数据,通过研究类别的划分而进行汇总。而进行汇总的方法则分为数据区分以及数据特征化,前者指的是将目标分析数据存在的一般特征与对比数据进行比较,后者则指的是以研究的项目作为标准,将符合研究特征的数据进行汇总。

1.2 聚类分析

在数据挖掘技术当中,聚类分析指的是将研究的目标数据遵循将类之间的相似性最小化、将类内部的相似性最大化的原则,对所有的数据进行分组。换一种说法,那就是将同一种目标数据之间的距离尽可能的缩小,或者同一类的数据当中相似性尽可能放大,不同类别的数据个体之间则尽可能扩大距离或尽可能缩小相似性。见图1。

1.3 关联分析

这种分析方法主要是通过对关联规则的利用,在对数据库进行操作的细节当中将频繁出现的模式进行有效抽取,这种分析的目的是在繁杂的数据当中发现将相关联的信息,并且通过量化之后的数字描述对象之间出现的可行性进行判定与评估。

1.4 时序模式

这种分析方法指的是以时间序列作为分析的标准,将数据当中重复发生并且重复率较高的信息进行筛取,并且通过已经筛选出来的数据对目标值进行分析。这种分析方法内容当中包含了相似度搜索以及趋势分析等概念。

图1 聚类分析结构图

1.5 分类和预测

对数据进行分类以后对其进行分析,这种方法的基础是在训练数据集当中将分类的模型进行初步筛选,随后按照模型的整体预测对未分类的对象进行类别的划分。聚类分析与这种方法本质上的区别在于训练数据集的数据是否为已知数据,而预测则是按照已知的数据进行连续值函数模型的建立,对空缺或未知的数据值进行预测,因此其中所用到的回归分析为最常用的数值预测方法之一。

2 数据挖掘技术对于医院管理的重要性

随着信息化技术在各个领域当中应用后都取得了显著的成果,各个医院当中所应用的信息系统当中也蕴含了丰富的临床以及管理方面的大量数据,例如医院的人事、财务、设备、药物、患者的治疗信息、社会特征等数据,这些信息不仅将医院的日常管理细节进行详尽的记录,还能够对医院进行历史状态的描述。在目前我国的大多数医院当中,在信息处理方面主要是依靠信息系统所带来的简单查询功能等操作性较为有限的功能进行常规事务的处理,只能对工作流程进行有限的简化,虽然在一定程度上会提高工作效率,但是在实际的应用当中,对于操作性要求较强的事务处理工作将无法满足进行数据预测等较为高级的数据分析,这将导致医院在进行大型数据信息处理时依然达不到理想的目的。

与传统的统计分析相比,数据挖掘技术能够更好的发现信息量较为丰富的数据,更加侧重于应用多种方法对模式进行有效的联系和匹配,通过一些专用的算法对数据之间所存在的联系进行描述。而医院的管理人员则可以通过这些方法将很多有效信息从海量的数据当中筛选出来,从中获取到自己能够进行充分利用的数据,并且通过专业技术人员的指导,能够对这些数据进行深层次分析,将能够对决策有利用的价值进行选择。应用数据挖掘技术,能够利用上文当中提到的多种分析方法,将数据当中存在的联系进行解释与分析,并将其转化为与医院管理相关的信息。

从另一个角度来说,数据挖掘技术是利用数据进行模型的构建,随后再通过数据对模型进行分析与验证,而在模型的建立过程当中则是从无到有、从特殊到一般的归纳与总结过程,因此通过这样的分析之后,得到的客观结果则更具有利用价值。在信息系统当中,很大一部分的数据均存在明显的质量缺陷,这种情况无法避免,但是传统的统计分析方法将这些无用的数据默认为有用的数据,因此在分析的结果当中将造成决策的误导。而数据挖掘技术则可以通过预处理的方式,使得数据当中的缺陷进行有效补充,对其中的无用数据进行清理,将有用的数据进行显著的突出,进而提高数据的真实性与可靠性。同时,数据挖掘技术还能够在执行系统当中将数据筛选出来,在减少不必要的信息浪费的基础上,还能够完成一系列的连接转换,通过结构的改变以及聚集的处理,从数量繁多、信息庞杂的信息流当中进行分辨、归类、提取、整理、挖掘,将有用的信息归纳出来,使得医院管理人员能够应用在决策当中。

3 数据挖掘技术在医院管理应用中的实施

在大多数的医院管理当中,数据挖掘技术具有一定程度的实用性,其实施的过程可以通过以下流程进行简单的描述:

3.1 需求确定

按照医院管理方向、内容以及所要达到的目标进行要求的确立,对管理需求的问题进行准确描述,并将这些问题转化为需要进行数据挖掘的问题。

3.2 数据的理解及准备

参照数据挖掘的相关问题,首先要将目标数据进行确定,并从医院的数据库或信息系统当中将适用于挖掘的大量数据进行筛选,并且对数据的质量问题进行初步评估,对于相关的数据进行提取,无关的数据进行清理。

3.3 建模及数据挖掘

针对任务目标的类别划分,对于将要采用数据挖掘的分析方法类别进行确定,例如选择聚类分析,或者是描述,或者是关联规则等方法,随后选择一种最为直接有效的数据挖掘算法,将数学分析的模型通过数据进行建立与完善。

3.4 模型评价

在进行模型评价时,需要通过有效数据对模型进行解释与结果数据的挖掘,并且要经过多次的测试与评价后,才能够对信息的可信度及有效性进行判定。在评价当中所采用的数据分析方法将按照数据挖掘的技术选择而选择,在通常情况下会使用到可视化的数据挖掘技术。在对模型进行建立、解释、评价、验证的过程当中,需要进行多次反复的验证,一个有效的数据模型并不是一次性就能够成功的,因此要在数据模型建立后,通过将其他数据进行带入后,将分析所得到的结果对模型进行评价,如果得到的结果无法令人满意,则可以通过反馈机制进行再一次的数据挖掘,重新进行上述流程,以得到有效的模型为止。

3.5 结果发布

按照管理人员对于信息以及数据的管理要求,对于数据挖掘后所获得的知识进行重新组织,并采用简单易懂的方式呈现给管理人员,进而能够使其在工作当中充分利用,并能够敏锐地发现相关知识[5]。

每一位患者在入院就诊后,将资料档案登录至数据库当中,将患者的基本资料、病情、检查结果、确定后的治疗方案、治疗方法以及恢复情况进行详细记录,并由此建立完整的患者资料库,将每位患者的所有信息制作成列表,方便日后查询。对患者资料的查询可通过主治医师、病情、就诊时间、姓名或其他等一系列方法进行查找,而对一个范围内的患者进行统计的话,也可以通过主治医师、病情、就诊时间或其他条件进行数据统计。这样做的结果就是将所有的患者诊治资料形成具体的数据化,在患者进行复诊、复查以及其他需要时,能够方便快捷地查阅患者以往的就诊资料,方便后续治疗,同样方便医院管理层对整体数据的了解与控制[6]。 见图 2。

图2 患者数据库模型

4 结语

在对数据挖掘技术进行学习之前,要充分了解机器学习、数据库原理以及传统的统计分析方法,在对静态的数据模型进行建立并完善后,通过对数据库当中蕴含的大量信息进行分析,并将数据模型进行反复验证,进而能够帮助医院管理人员对医院信息系统当中的大量电子数据进行归纳与总结,提高数据资源的利用程度与可用性。通过这种方法,能够对医院管理工作的强度进行进一步的提高,并加强医院服务质量,利用科学的方法进行有效的管理。

[1]王新军,胡曼.数据挖掘技术在寿险业交叉销售中的应用[J].保险研究,2009(6):90-99.

[2]于长春,贺佳,范思昌,等.数据挖掘技术在医院管理中的应用[J].第二军医大学学报,2012,24(11):1250-1252.

[3]谢邦昌.数据挖掘clementine应用实务[M].北京:机械工业出版社,2008.

[4]朱世俊,鲍玉荣,刘爱民,等.北京地区医院DRGs付费和临床路径应用研究[J].中华医院管理杂志,2010,24(3):145-147.

[5]王炯,夏宏斌.浅析数据挖掘技术在医院信息化平台建设中的应用策略[J].网络与信息,2011,6(12):128-130.

[6]田霞,徐道芳.数据仓库和数据挖掘在医院管理中的应用[J].医学信息(上旬刊),2011,7(18):283-285.

猜你喜欢

数据挖掘数据库医院
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
数据库
数据库
萌萌兔医院
数据库
数据库
带领县医院一路前行
为县级医院定锚
高级数据挖掘与应用国际学术会议