APP下载

网络爬虫网页库智能更新策略分析与研究

2010-12-31周巍巍

电脑知识与技术 2010年31期

  摘要:该文比较分析了几种不同的网页库更新策略,指出了各自的优劣所在,讨论了如何有效的保持已有网页库的新鲜度。并快速有效的提高更新海量网页数据的效率。
  关键词:搜索引擎;网络爬虫;本地网页库;新鲜度;更新策略
  中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2010)31-8814-