APP下载

基于数据挖掘的病例自动化分析系统研究与设计

2016-07-10梁源

电子技术与软件工程 2016年7期
关键词:数据挖掘

梁源

随着医院信息化系统的运行,其积累了海量的病历数据,这些病历数据散乱的、简单的保存于数据库中,为了提高医院科研、诊疗、救治水平,可以利用数据挖掘技术将病历进行整合、分类,从中发现潜在的、有价值的信息,为医院管理、诊断和治疗提供决策指导。论文详细地分析了数据挖掘在医院信息化中的应用现状,设计了一个基于数据挖掘技术的病历自动化分析系统,详细地描述了系统的业务处理流程,为系统实现提供参考。

【关键词】数据挖掘 病历信息 业务理解 数据准备

1 引言

随着光纤网络、移动计算、多媒体通信、智能存储等技术快速发展,促进了云计算、数据挖掘、数据仓库等技术在各个领域得到广泛普及和应用,比如在教育、财务会计、在线学习、智能医疗和在线旅游等领域。随着智能医疗系统的使用,其已经积累了海量的病历资源,医护人员使用病历资源时采用人工查询、审阅的方法,无法快速、精准定位自己期望的信息。数据挖掘可以使用支持向量机、K均值、贝叶斯理论、BP神经网络等算法自动化的对病历数据进行分类,分类主题可以由用户进行设置,比如按照疾病治疗成功率、疾病错误诊断原因等,将数据挖掘技术引入到医院信息化系统中,可充分的利用先进的数据挖掘技术,深层次挖掘病历信息模式,寻找潜藏的、有价值的病历信息和决策知识,指导医院开展管理、医疗诊治工作。

2 数据挖掘技术在医院信息化中的应用

近年来,数据挖掘技术在医院信息化中也得到了广泛的应用,提高了医院信息资源的利用率。为了发挥医院大数据资源的效用,医院信息化系统中引入了多种数据挖掘技术,这些数据挖掘技术可以从海量的、带有噪声数据的、不完全的数据记录中发现隐含的模式,以便能够为医院提供客观的、有价值的决策知识,提高数据的利用率,将静态的、抽象的数据资源与应用背景有效整合,转化为有价值的、有利的信息和知识资源。经过多年的应用,数据挖掘在医院信息系统中的应用主要包括以下几个方面。

2.1 数据挖掘在合理用药方面的分析

目前,医院药品管理系统中引入的药品种类多大上万种,每一种药品的价格、用量都不同,数据量非常大。药品种类的增多大幅度提升用药的复杂度和困难度,需要严格遵循合理用药原则,控制药物使用量。数据挖掘算法可以从药品管理系统中提取海量药品使用数据,精确挖掘和分析用药数量、患者用药成本、药品产生的不良反应等情况,确保医院药品使用合理。

2.2 患者疾病种类分析与预测

随着人们的生活质量提高,易感染的疾病种类也越来越多。数据挖掘算法可以从患者病历资料系统中提取患者诊断、治疗数据,分析患者疾病种类、发病时间、病程、治愈情况等,以便能够预测疾病易感染或发作时间段,挖掘有效的诊断和治疗方法,提高患者医治的成功率。

2.3 构建专家治疗库,便于用户诊断推荐

随着互联网技术的快速发展,许多医院设计了门户网,可以集成共享医疗卫生资源,实现网上预约会诊等功能。由于许多患者或家属对疾病知识不甚了解,无法获取准确的治疗专家信息,因此医院可以使用数据挖掘技术,选取和分析诊断治疗较好的专家,构建专家库,患者输入相关的疾病之后,系统可以采用关联规则自动匹配疾病专家,以便得到有效的会诊和治疗。

3 基于数据挖掘技术的病例自动化分析系统设计

基于数据挖掘的病历自动化分析系统主要功能流程包括业务理解、数据理解、数据准备、建立模型及评估、算法部署运行等阶段。

3.1 业务理解阶段

业务理解可以确定病历分析的挖掘背景、挖掘目标、可行性分析和挖掘计划。数据挖掘的背景是针对病历进行主题化分析,确定知识挖掘的成功标准和详细的挖掘计划,并且查看挖掘需要的资源是否满足执行条件,验证病历自动化分析的可行性。

3.2 数据理解阶段

数据理解可以采集患者的原始病历档案信息,由于数据在算法运行过程中,数据是抽象的,使用人员通常无法获取背景信息,不利于算法执行。数据理解可以描述数据记录、属性等内容,形成一个病历档案数据摘要报告。

3.3 数据准备阶段

原始的病历档案信息会存在许多的错误、缺省值等问题,因此数据准备阶段需要完成的工作包括数据选择、数据清洁、数据创建、数据合并、数据格式化等。该阶段可以根据数据挖掘的目标和质量选择一个合适的数据,选择合适的表、记录和属性,同时可以去除噪声和缺省值的记录,提高病历档案数据的质量,创建一个新的病历数据子集,并且可以将多个数据集形成一个完整的表,转换成算法运行期望的格式。

3.4 建立模型及评估阶段

病历自动分析系统中,建立模型是非常关键的一个内容,其工作包括选择数据挖掘算法、模型训练、模型测试及评估等操作。选择建模技术可以根据病历分析的应用需求确定适合的数据挖掘算法,设置算法模型的运行参数和评估方案,评估模型的质量和有效性,并且使用模型在病历数据集上运行,进一步可以优化模型。

3.5 算法部署运行阶段

算法部署运行阶段的主要工作是将数据挖掘算法嵌入到系统中,按照不同的应用需求主题挖掘病历知识,同时监控挖掘获取的知识在实际业务中应用效果。

4 结束语

医院信息系统的运行积累了海量的病历资源,这些资源蕴含无限的、有价值的知识内容,利用数据挖掘技术可以构建一个完善的病历自动化分析系统,挖掘病历中的潜在模式,指导医院开展各类工作。

参考文献

[1]史淳樵,侯佳音.数据挖掘技术在医院信息管理系统当中的应用[J].电子设计工程,2015,32(21):21-23.

[2]邹芳,田晔,吴卫国,等.基于非结构化电子病历的脑卒中数据挖掘管理系统设计和实现[J].中国数字医学,2015,44(3):41-44.

[3]王慧.数据仓库和数据挖掘在医院信息系统中的应用[J].电脑开发与应用,2014,34(1):76-78.

[4]陈晓琛.医院病案信息系统的数据挖掘在医院中的重要意义[J].当代医学,2014,35(25):8-9.

作者单位

1.承德医学院附属医院网络中心 河北省承德市 067000

2.承德医学院附属医院结算中心 河北省承德市 067000

猜你喜欢

数据挖掘
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
数据挖掘技术综述与应用
基于GPGPU的离散数据挖掘研究
利用数据挖掘技术实现LIS数据共享的开发实践
高级数据挖掘与应用国际学术会议
高级数据挖掘与应用国际学术会议