百度算法中路径和收录的问题
2013-02-20本刊
下面主要解释一下百度算法中网站路径的问题、收录的问题以及路径和收录的问题。平常困扰我们很多的路径和收录在百度算法中有既定的规律,如果不知道这些规律会给我们的优化带来很多的困扰,或者会走很多弯路。
路径和层次问题
大部分时候我们认为网站的路径代表网站的层次,也有网站路径跟层次不同,我们主要解释层次跟路径相同的做法,也就是一个目录代表一个层次的普通的做法。
1、企业站的层次不能大于3层。一个小型的企业站如果层次过深,超过3层达到4层5层,那么层次越深的内容就越难收录。这事百度根据页面的重要程度来推测的,页面的重要程度不代表页面的权重,而是页面内容在整个网站中的重要程度。我们会把重要的内容往前推,最重要的内容我们会放在首页,其次重要的放在栏目页,最不重要的放在内页。那么百度就认为你首页的内容是最重要的,并且给予最快的收录,其次是栏目页,最后是内页。就像新浪、搜狐新闻首页会把当天或者最近用户关注比较多的内容推荐在头条以及轮展图板块,那么百度就会优先抓取这些内容。但是百度对于不同的站点收录到的最深层次也是不一样的。像新浪、网易这样的大站5层、6层的内页文章很容易被收录,但是我们的企业站4层的内页百度已经很难收录了。因为企业站的内容非常的少,有的站100页面还不到,所以3层以下的内容对于用户来说是没有意义的。所以在设计企业站的层次路径的时候一定要在3层以内。
2、路径的设置。路径是有识别功能的,用户以及搜索引擎的识别。在国内没有用户记忆路径的习惯,但是在SEO或者it这个群体会有用户记忆路径的习惯,在国外用户记忆路径是非常普遍的现象。搜索引擎也会记忆路径的设置,所以跟路径的内容收录和排名有很大的关系。如果我们的一个目录是课程那么我们的路径就应该设置为/kecheng/,建议在设置路径的时候采用全拼的方法,并且最好是2个字的全拼。首个字母的缩写和2个字以上的全拼搜索引擎很难识别是什么意思。对于一些常用的栏目比如 news、faq(常见问题解答)这写可以采用英文的路径,因为这些应为非常常见,用户也很容易看懂。
收录问题
1、不同权重的网站,收录最大限度不一样。比如我们做的一个中小型新站目前的权重是1或者没有权重,那么我们的收录维持在几十、几百到一千的数量。如果你发现不管你怎么更新做原创高质量的内容收录也上不去,是因为网站权重处于一个阶段收录不可能上去。就像一个1-6岁的小孩和一个25-30岁的成年人,小孩的食量再大大多数情况下比不过成年人的食量。那么被分配的食物肯定要比成年的少很多,如果网站要突破这个收录的限制就要在权重上上升一个等级。我们不建议刻意的去提升收录,因为收录不会直接影响到网站排名。
2、等级不同的网站收录的最大限度不同。在新浪上更新1万篇文章可能会收录90%,但是如果在你的企业站更新1w篇文章可能是会收录几十篇。除了两个网站的受众不一样之外,新浪的等级是我们企业站远不能比的。等级不等于权重,权重只是等级的一个部分,等级是网站的重要程度,就像我们一个网站中不同页面的重要程度。所以如果我们是一个小型的企业站就不要担心为什么我的收录这么少,或者为了有大量的收录不断的去更新文章,这样的做法是错误的。不同的行业需要更新的频率是不一样,娱乐新闻行业需要几分钟更新一次,但是小型企业站一周或者几周更新一次都没有关系。
总结:在百度的一些算法规律中很容易就定位到我们自己的网站应该是做到哪一个程度,知道了这些规律在以后的优化中就不会造成很多的误会从而有一些没有必要的担心。