数据挖掘技术在医院信息系统中的应用
2018-02-07李霁雨
李霁雨
(河北工业大学,天津 021000)
1 数据挖掘技术
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取并发现隐含在其中的、不为人知的,但同时又具有极大潜在使用价值的信息和知识的过程。
数据挖掘的过程是先确定挖掘目标,根据现有数据资源建立数据库。然后通过清洗数据、分析、选择或转换与挖掘目标有关的变量,对原始数据进行预处理。根据数据挖掘的目标和数据特征,选择适合的模型。最后,选用合适的数据挖掘技术与工具,进行模式的分析,从而选择最优的模型,运用到实际问题中。常见的数据挖掘方法有关联规则、聚类、决策树、神经网络、支持向量机等[1]。
2 医院信息系统数据挖掘的主要特征
医院信息系统包括临床医疗信息和医院管理信息。医疗数据由于其专业性及特殊性,与其他行业数据相比有所不同,对医院信息系统的数据挖掘也存在其自有的特点[2]。
2.1 模式的多态性
医疗数据中包含数字型数据和非数字型数据如(信号、图像、文字、语音、视频等)。模式的多态性大大的增加了数据挖掘的难度。
2.2 不完整性
以病历为例,病历的书写过程本身就有不确定和模糊的因素存在,与医生的主观因素有关,有个体差异存在,不能对疾病的信息进行全面的反应与记录,因此形成了医疗数据的不完整性。
2.3 时间性
医疗数据记录的是患者在某一特定时间内接受医疗活动的记录,医疗检查的波形和图像也都是关于时间的函数。
2.4 冗余性
医疗数据库是十分庞大的数据资源,对于某些疾病某些症状,可能会采取相同的治疗,检查与化验的结果也都可能完全一样。如此下来,就会产生大量相同或者相似的数据信息。在数据挖掘过程中,增加了数据预处理的复杂性。
3 医疗数据挖掘的难点
3.1 数据预处理
在数据挖掘之前,医疗数据库中包含着数量相当的不完整的、模糊的、带有噪声的冗余信息。数据预处理技术要完成的主要任务是,将这些冗余信息进行筛选和过滤,将多余的、没有意义的信息删除,把预处理后的数据整理成与数据挖掘时相匹配的形式。
3.2 信息融合技术
由于医疗数据模式的多态性特征,使得处理不同属性的数据时,应采用不同的技术和措施。多种数据类型并存,加大了信息融合的难度[3]。
3.3 数据挖掘的准确度和可靠性
对医疗数据进行挖掘,得到的结果必须具有较高的准确度与可靠性,这样才能为临床医疗活动和医院的管理提供有效的数据支持和决策依据,使理论更好的指导实践,发挥价值。
4 医疗数据挖掘的应用
4.1 在医院管理方面的应用
医院管理信息系统主要处理医院日常经营和内部管理方面的信息,现有的医院信息管理系统,可以实现查询统计、输入修改等基本功能,通过对医疗数据的挖掘,能够实现质控管理、费用控制、人员管理等更多更强大的功能。①通过对门诊人流量的数据进行挖掘,可以分析出就诊时人流量的分布,能够使医生合理安排工作时间,减少患者就诊等待时间,提高医疗资源的使用效率,提高服务质量。②将医院各部门不同的系统数据汇总,建立数据仓库,对医院的成本、收益等情况进行深入分析,可以实现对资源的合理配置,规范医疗行为,提高服务效率。有助于掌握医院经营状况,提高医院经济效益及核心竞争力。③通过数据挖掘技术,对医疗费用进行分析。可以通过分析医疗费用项目的构成,推断医疗行为是否合理,可以有效控制医疗费用不合理增长。④单病种管理。通过对医疗数据进行挖掘,可以帮助规范临床路径,为医疗质量管理提供理论依据,可以缩短患者住院时间、提高床位使用率,提高医院整体收入。⑤质控管理。通过数据挖掘技术,将各个部门的考核指标筛选出来,对各部门进行评价考核,制定管理目标,提高医院的综合实力。⑥对医用耗材的备货管理。医用耗材的消耗容易受到季节、疾病好发时段及手术择期规律的影响,应用数据挖掘技术中的时间序列预测方法,对医院现有的医用耗材用量信息进行计算模拟,得出医用耗材消耗模型。根据实际情况自动产生下一时间段的医用耗材领用量,满足了医院感染管理和各种手术的需要,提高了医用耗材备库的合理性和科学性。
4.2 在临床医疗方面的应用
疾病的诊断,是医生通过自己掌握的各种医学理论知识,以症状与检查结果为基础,进行推理的过程。医学数据挖掘可以为医生进行疾病诊断提供帮助。
①通过对患者的性别、年龄、所在地区等个人信息进行分析,用关联规则挖掘出发病率较高的疾病种类,使医疗工作更具针对性,提高服务效率。②利用决策树可以将疾病进行分类,对疾病的严重程度进行分级,分析不良事件成因,筛选危险因素,对处方药物剂量监控,对治疗方案是否合理做出判断。③CT、MRI等医学图像作为重要的医疗数据,已成为疾病诊断的一种重要工具,对医学图像数据进行数据挖掘,筛选出有效的规则、模型等信息,有助于医生更加准确的诊断疾病。
4.3 医疗方面的其他应用
在医疗方面除了上述应用,数据挖掘还可以用于医疗科研、新药开发,预防保健、流行病学研究、医疗资源利用评价、医药市场预测等诸多方面。
5 医疗数据挖掘的意义
5.1 降低医院运营成本
在医院的支出项目中,药品和医疗设备的采购占比较大,通过数据挖掘技术,对药品数量和种类进行动态监测,制定有针对性的药品采购计划,可以避免不必要的浪费。通过监测医疗设备的运行状态和维修保养情况,可以对资源进行合理配置,有效降低采购成本。
5.2 推动开展多样化医疗服务
通过对医疗数据进行挖掘,是医院科研创新的重要手段,是服务创新的新方法。数据挖掘技术的发展有助于推动医院开展多样化医疗服务。
5.3 提高医院的综合实力
医院综合实力的本质就是知识和技能,提高医院的综合实力,对医疗技术的提升与医院经济效益的提高都有着至关重要的作用。
通过对HIS系统中的数据进行挖掘,可以分析出就诊患者的信息,可以制定不同的服务策略来满足不同类型的患者,提高服务质量和效率,建立和谐医患关系。通过数据挖掘,对医院医疗技术、诊疗水平有较客观的认识,通过发挥优势补足劣势,使医院医疗技术水平得到提高与发展,提升核心竞争力。
6 结语
数据挖掘技术作为一个在海量数据中获取知识的有力工具,在为医院管理中新知识的发现开辟了新的途径,快速发展的图像数据挖掘技术更是具有较高的学术价值和广阔的应用前景。但存在的问题是医疗数据库中存在许多脏数据和已破坏了的数据、数据库中的临床信息标准不统一或者不规范使得数据挖掘过程中对数据库的矫正、去除噪声等显得相当困难,这些实际应用中的困难有待于进一步的研究并给予解决。