数据挖掘技术概述
2015-01-26
中国卫生质量管理 2015年6期
数据挖掘技术是一种数据处理的技术,是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中、人们事先不知道又潜在有用信息和知识的过程。数据挖掘需要根据数据仓库中的数据信息,选择合适的分析工具,应用统计方法、事例推理、决策树、规则推理、模糊集,甚至神经网络、遗传算法的方法处理信息,得出有用的分析信息。数据挖掘过程是一个反复循环的过程,每一个步骤如果没有达到预期目标,都需要回到前面的步骤,重新调整并执行。
技术流程:信息收集→数据集成→数据规约→数据清理→数据变换→数据挖掘实施过程→模式评估→知识表示。