APP下载

基于合并因子的多种格式文件索引技术

2012-04-29孙广路易成岐郎非

哈尔滨理工大学学报 2012年2期

孙广路 易成岐 郎非

摘要:为了改进传统的文本检索技术存在检索文件格式种类单一,索引大数据量文件速度慢,甚至造成内存溢出等问题,基于Lucene系统及相关技术,研究了基于合并因子的多种格式文件索引技术,并在此基础上构建了中文文本信息检索系统,实验分析表明,本系统有效地实现了多种格式文件检索功能,通过合并因子的设定有效提高了索引速度,系统可靠性高。

关键词:文本检索;合并因子;多种格式文件索引

中图分类号:TM391.3文献标志码:A文章编号:1007-2683(2012)02-0001-04