社区网络爬虫的设计与实现
2012-04-29郭涛黄铭钧
智能计算机与应用 2012年4期
郭涛 黄铭钧
摘要: 社区互联网是以用户创造内容为主的新型互联网,具有很高的统计价值, 由于权限和数据更新频繁等限制,传统的网络爬虫很难获取这一部分数据,设计并实现了一种可以自动登录并可以根据更新频率快慢智能抓取数据的爬虫,不同于以往爬虫以页面为粒度,该爬虫以人为最小粒度,并以人与人之间的关系为抓取依据,在获取这类数据上有很好的性能。
关键词:
中图分类号:TP31文献标识码:A文章编号:2095-2163(2012)04-0065-03