高性能网页索引器JU_Indexer的实现
2006-04-29赫枫龄左万利张雪松
吉林大学学报(理学版) 2006年1期
赫枫龄 左万利 张雪松
摘要:高性能网页索引器JU_Indexer用倒排索引表存储网页索引数据,以多线程并行的方式对网页建立索引数据,采用经过优化的检索算法实现用户的查询。首先给出了JU_Indexer的系统框架,然后描述了索引数据在JU_Indexer中的存储结构、建立网页索引的算法、以及实现用户查询的检索算法。实验结果表明,JU_Indexer能在毫秒级的时间内完成用户的查询,它采用的经过优化的词组检索算法缩短了词组的检索时间。
关键词:Web网页;网络搜索引擎;网页索引器
中图分类号:TP393.09
文献标识码:A
文章编号:1671-5489(2006)01-0050-07