APP下载

如何快速获得网站更新页全部网址?

2014-10-16马汉

计算机与网络 2014年1期
关键词:头尾源代码网址

大家都知道在网站优化过程中需要进行数据分析,而收录指标是众多数据里尤为重要的一个,并且很多时候我们不仅要查看网站每天更新的收录情况,还要查看整个网站更新页有哪些页面没有收录,而通过百度站长平台查看子栏目收录量或通过在百度利用site+inurl 高级搜索只能查看更新栏目页的收录量,还是不能知道哪些没收录。一般情况下都是利用批量收录查询,但是这个问题来了,这个需要网址,大量的网址,如何快速获得网站更新页全部网址呢? 今天就给大家讲一个方法。

一、打开火车采集器,新建一个名为“更新栏目网址”的任务。

二,点击起始网址框的添加按钮,如下图,选择“批量/多页”。这一步是最重要的了,我以木木seo 博客为例,大家可以看到更新栏目页一共12 页,地址基本一样,只不过是最后一个数字在等差递增,所以可以利用通配符和等差关系按下图进行设置,大家的网站更新栏目也肯定是有这个规律的,仔细看一下就可以进行设置。

三、点击多级网址获取的添加按钮,选择网址获取选项,按照头尾从选定区域提取网址,这里我用的这样的个头尾,为什么?因为查看博客源代码可以发现更新页的每页所有文章的网址都位于这2个注释代码之间,你的网站也一样,观察网站源代码,然后加入包含列表页的头尾代码或其他特征文字,点击保存。

四、到这里可以说就完了,我们不用设置内容采集和发布,直接点击测试网址采集,在弹出的框里面点击导出一级节点就OK 了。

好了,到这里就完了,在图上可以看到导出的一级节点网址,和博客总共的更新文章数量完全吻合。

猜你喜欢

头尾源代码网址
本刊网址变更通知
基于TXL的源代码插桩技术研究
聚酯短纤维头尾丝自动隔离系统的设计
软件源代码非公知性司法鉴定方法探析
磨床头尾架承载变形分析及改进设计
猜谜语
基于语法和语义结合的源代码精确搜索方法
揭秘龙湖产品“源代码”
基于FANUC系统IO-LINK通信的曲轴磨床头尾架同步控制
本刊网址变更通知