档案数据挖掘中数据采集与准备问题浅析
2012-04-29王静辛玉明高鸿雁
现代情报 2012年6期
王静 辛玉明 高鸿雁
〔摘 要〕数据挖掘技术可以帮助人们在海量的信息资源中提取隐含的、潜在的、有价值的信息,因此已经被引入到了处理爆炸式增长的档案信息资源中。而待挖掘的信息是否完整、规范直接关系到之后的挖掘质量。本文根据档案信息资源的现状以及档案数据的特性,在给出执行具体挖掘操作前的数据采集和数据预处理各个环节的概念描述的基础上,探讨各个环节的注意事项及具体实现方法。
〔关键词〕数字档案馆;数据挖掘;数据采集;数据预处理
DOI:10.3969/j.issn.1008-0821.2012.06.018
〔中图分类号〕G270保罚 〔文献标识码〕A 〔文章编号〕1008-0821(2012)06-0072-03