APP下载

遗传算法的数据挖掘技术在医疗大数据中的应用

2017-04-23吕峰杨宏普奕贾婧蓥

电子技术与软件工程 2017年5期
关键词:数据挖掘技术遗传算法应用

吕峰+杨宏+普奕+贾婧蓥

摘 要 医院在计算机及网络的辅助下,有效的改善了医院医疗服务水平和服务质量。计算机及网络的应用过程中,日常的医院院内患者信息、医疗设备信息和相关日常检验报告、外界数据等信息不断增多,导致院内数据库中的数据信息庞大驳杂。为了有效的在医疗大数据中,攫取有效的数据信息,可以选择基于遗传算法的数据挖掘技术,获得准确有效的目标信息,为提升医疗服务水平和质量打基础。

【关键词】遗传算法 数据挖掘技术 医疗大数据 应用

医疗行业具有其本身的特殊性和复杂性,医疗大数据所包含数据信息更加驳杂,借助医疗大数据能够有效的转变传统的决策依据。同时,借助医疗大数据的数据挖掘技术,可以完成对患者的相关病情研究,并合理对患者进行用药。数据挖掘技术在医疗大数据中的应用价值十分明显。基于此,本文分析基于遗传算法的数据挖掘技术在医疗大数据中的应用,分别对基于遗传算法的数据挖掘技术和具体在医疗大数据中的应用进行阐述,具体内容如下。

1 遗传算法的数据挖掘技术分析

1.1 数据挖掘

医院对日常患者信息收集、药物信息录入和相关管理信息充斥着医院的数据库,导致数据数量日渐增加。而这些庞大的数据信息中,涵盖了作用明显的数据信息和作用不显著的数据信息。而为了从这些驳杂的医疗信息中,获取有效的病例信息、药物信息,需要选择有效技术类型。数据挖掘技术则是一种从海量数据、存在噪声和模糊的数据中进行目标信息的提取,并对相近的数据信息进行提取。借助数据挖掘可以为医院完成治疗预测和降低医疗成本、明确各类药物的基本情况,实现对药物副作用的发现、辅助公共卫生检测,积极推动医院医疗服务水平和服务质量的提升。

在实际的医疗大数据挖掘中,可以对分类算法、聚类算法、实践序列和的关联规则和回归预测等方法进行应用,从而完成对医疗大数据的有效挖掘,进而获取准确的数据信息,保障医院医疗服务的质量和相关决策的效率。

1.2 遗传算法

遗传算法是建立在的“自然选择”和“适者生存”的基础上,结合具体的适应度值情况,先在某一特定种群中选取一定数值的染色体,并通过对种群进行迭代,从而获得满足终止条件的最优解。遗传算法在迭代过程中,主要是通过选择、交叉和变异等操作方式,促使种群完成自然选择。且遗传算法的关键内容主要以染色体编码、种群初始化和适应度函数等。常见的遗传算法实例有人工鱼群算法、蚁群算法等。

借助遗传算法的数据挖掘技术能够有效完成对医疗大数据中的数据信息的攫取,并获得有效医疗数据信息为医疗服务奠定基础。

2 遗传算法的数据挖掘技术在医疗大数据中的应用

2.1 数据挖掘对象

从数据挖掘技术的基本能力上看,数据挖掘技术,可以完成对任意类型的数据信息存储的数据信息挖掘。根据医疗大数据的基本情况,基于遗传算法的数据挖掘对象是互联网的相关医疗数据信息和医院内部的患者病例、药物信息、费用信息和管理信息等内容。其具体的数据挖掘目标是根据使用者的基本需求,完成对目标信息的获取。

2.2 基于遗传算法的k-means算法改进

基于遗传算法的k-means算法改进有效的将遗传算法和k-means算法相结合,在具体的医疗大数据挖掘中的应用,具体的算法设计如下:

(1)编码方案和种群初始化;设聚类中心的坐标为d维,k个簇的每个染色体长度为k×d,染色体为{P1,P2,P3……Pk},其中Pi={Pj1,Pj2,Pj3……Pjd}。对于对应的每条染色体,随机从n个对象中的k个为的初始聚类中心坐标。

(2)适应度函数的选取,为了保障医疗大数据的数据挖掘技术的有效性,必须要对适应度函数进行合理选择,具体的适应度函数如下公式(1)所示:

(3)操作选择。为了完成对遗传算法的更好操作,需要对遗传算法的早熟问题进行控制,可以选择引入免疫机制。

按照上述方式,选择基于遗传算法的k-means算法,可以有效使k-means算法快速收敛,从而有效减少算法所应用的时间,并获得最优解,为医疗大数据的数据挖掘奠定基础。

2.3 应用实例

以基于遗传算法的k-means算法改进在血液系统疾病费用统计分析为例。在医院日常营业中,改进后的k-means算法可以根据患者的年龄、性别和患者等信息完成分组,且客观的显示血液疾病的分布情况,应用基于遗传算法的k-means算法改进,可以获取患者年龄和性别的基础信息,还可以的对不同年龄和性别分组下的临床生化指标特征进行解读,从而相关统计人员能得到目标数据。

将基于遗传算法改进的k-means算法应用到医疗费用数据的处理。主要是对数据进行分类,并得到初始聚类中心情况,再根据遗传算法,完成对聚类中心的迭代和更改,并得到最终的聚类结果。通过聚类结果可以将不同类型的血液系统疾病的总例数和具体的治疗费用进行展示,从而使得相关结算人员能够获得较为准确的费用信息。选择基于遗传算法的k-means算法,可以完成对医疗费用的预测,经过检验得知,具体预测准确性可以达到92.21%。

3 结束语

结合基于遗传算法的k-means算法优化,实现对医疗大数据的数据挖掘技术的应用。在血液系统疾病费用的统计分析中,借助優化后的算法可以完成对不同血液疾病的病例数和治疗费用等信息的获取,以达到降低医院治疗成本的效果,再为提高医疗服务质量提供有效的数据信息,推动医院医疗质量水平的提升。借助遗传算法的数据挖掘技术在提高医疗数据挖掘效率的基础上,更为直接的提高了数据挖掘的质量,为医院决策提供数据信息,这是符合现代医院大数据应用的需求。

参考文献

[1]张宁,李祥,鹿珂珂.遗传算法在数据挖掘技术中的应用研究[J].仪表技术,2015(12).

[2]陈东莉.基于遗传算法的数据挖掘技术在图书馆中的应用研究[J].计算机与现代化,2012(01):37-39.

[3]吴斌.基于数据挖掘技术的医疗影像检查量预测[D].杭州电子科技大学,2014:32-33.

猜你喜欢

数据挖掘技术遗传算法应用
基于自适应遗传算法的CSAMT一维反演
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于遗传算法和LS-SVM的财务危机预测
基于改进的遗传算法的模糊聚类算法