APP下载

数据挖掘技术在中医理论中的运用

2013-08-03

山东工业技术 2013年14期
关键词:数据挖掘分类数据库

李 冰

(黑龙江中医药大学 佳木斯学院,黑龙江 佳木斯154002)

1 数据挖掘

数据挖掘(DM :Data Mining)作为仍在不断完善和发展的技术,到目前为止数据挖掘技术到现在还没有形成统一的普遍的定义,目前比较公认的定义为:数据挖掘是从海量数据中提取或“挖掘”出有用的知识[1-2]使用数据挖掘技术可以对这些复杂的定性描述和隐性知识进行挖掘, 揭示其规律并使隐性知识显性化[3]。 数据挖掘[4](DM :Data Mining)是一个集合数据库、数理统计、机器学习、可视化和信息科学技术为一体的新兴的交叉学科。不仅计算机学科由于它的出现得到了快速的发展,并且也能为过程控制、商务管理、科学研究、优化查询、医药研发等领域提供新的方法和注入新的活力,从而推进各个学科的不断发展。

2 数据挖掘中的基本概念

2.1 数据集

数据集是从某个环境或过程中取得的一系列测量结果。对于一些基本的情况,我们有一系列的测量对象,每一个测量对象都有统一的t个测量数据, 此时可以把这p 个对象的一系列测量结果看作是一个p×t 的数据矩阵。 矩阵中的t 列表示对每个对象所作的t 种测量,称为变量、特征、属性或者字段。这个数据矩阵中的n 行表示被测量的p 个对象,亦可称为个体、实例、实体或记录。

1.2 模式

模式是一个用语言A 来表示的表达式B,它可用来描述数据集C中数据的特性,B 所描述的数据是集合C 的一个子集CB。 T 作为一个模式要求它列举出数据子集CB 中所有元素的描述方法简单。 举例说明,例如,“如果考试成绩在91—100 之间,则成绩优秀”可称为一个模式,而“如果成绩为91、92、93、94、95、96、97、98、99 或100,则成绩优秀”就不能称之为一个模式。模式有很多种,按功能可分为预测型模式和描述型模式等。 从数据集中发现模式是数据挖掘的主要任务。

3 数据挖掘过程

数据挖掘[4](DM :Data Mining)是一个集合数据库、数理统计、机器学习、可视化和信息科学技术为一体的新兴的交叉学科。 不仅计算机学科由于它的出现得到了快速的发展,并且也能为过程控制、商务管理、科学研究、优化查询、医药研发等领域提供新的方法和注入新的活力,从而推进各个学科的不断发展。

图1 数据库知识发展(KDD)过程

4 数据挖掘主要方法

数据挖掘从不同的视角看有几种分类方法,主要是:根据发现知识的种类分类、根据采掘的数据库的种类分类、根据应用和根据采用的技术分类分类等[5]。

根据发现知识的种类分类:这种分类方法有:关联规则挖掘、偏差分析、分类规则挖掘、聚类规则挖掘、序列模式挖掘、趋势分析等。根据采用的技术分类:最近邻技术、决策树、遗传算法、人工神经网络、可视化技术)等。 根据挖掘的数据库分类:关系型、事务型、多媒体、主动型空间型、时间型、面向对象型、文本型、异质数据库和遗留系统等。

5 在中医学研究中应用数据挖掘技术的必要性

祖国医学是中华民族的一颗璀璨明珠,在几千年的发展之中积累了中华民族与疾病斗争的宝贵经验,几千年以来,我国的传统医学积累浩瀚的方剂和丰富的经验,是世界上任何国家都无法比拟的。 历代医家遗留了大量的经典方剂, 这些方剂之中内中蕴涵着丰富的内容,要继承和发扬这些名医名家的学术经验,就迫切需要我们运用现代先进的科学技术手段对其进行研究。 而今人类社会正在处在大规模、高速度的信息化时代,信息已经成为人类社会发展、进步和赖以生存的重要资源和基本资源。 但是目前,先进的科学技术尚未能充分利用于中医药学领域,大量宝贵的经典方剂流失,这严重影响了祖国医学的发展。

在这样的背景下,中医医学现代化的利用、转化和传播的速度及能力是我国传统医学现代化发展的关键性因素。 如果仅单靠“师传徒学” 或个人研读古代经方揣摩名医名家经验信息效率是十分低下的,并且中医学的很多征候还具备很强的辩证性,描述疾病的主观不确切和证候信息所体现出的客观不完整, 形成了中医证候信息的复杂性。这就阻碍了祖国医学的快速发展,要实现中医现代化,就要将我国丰富的中医信息资源和现代计算机方法相结合,整理归纳浩如烟海的古代经典中医文献资料,实现中医药信息资源处理、转化及传播的现代化。现有的中医数据库中的大量数据为建立中医学数据挖掘系统提供了充分的基础,通过先进的计算机信息处理技术,建立新的知识体系构建形成新的知识,为我国传统中医学发扬光大提供新的思路。

[1]乔延江.中药(复方)KDD 研究开发的意义[J].北京中医药大学学报.1998,21(3):15-17.

[2]Jiawei Han Micheline Kamber.范明,孟小峰等译.数据挖掘概念与技术[J].北京:电子工业出版社.2001,3-5.

[3]Fayyad U Piatet sky-Shapiro,Smyth,Uthurussm y [Z].Advances in Knowledge Discovery and Data Mining MIT Press.1996.

[4]秦雪君,施诚.数据挖掘技术在中医药领域的应用[J].医学信息.2006,19(5):28-32.

[5]邵峰晶,于忠清.数据挖掘原理与算法.第1 版[M].北京:中国水利水电出版社.2003.

猜你喜欢

数据挖掘分类数据库
改进支持向量机在特征数据挖掘中的智能应用
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
按需分类
教你一招:数的分类
说说分类那些事
数据库
软件工程领域中的异常数据挖掘算法
数据库
数据库