深度分析 谷歌搜索引擎蜘蛛等级那些事儿

作者:ehsy-sem团队 来源:SEO论坛 时间:2008-12-12 14:08:00 



一、GOOGLE搜索引擎蜘蛛的等级

首先先谈下GOOGLE蜘蛛起源。

当GOOGLE搜索引擎刚建立之初,就拥有这一个非常强大的的服务器,其每天放出大量的蜘蛛,我们称为1号蜘蛛,其抓取量抓取速度是非常的快,对其整个互联网每天进行信息进行的采集,可见服务器的速度是多少快,其实最主要的是后期GOOGLE将服务器延伸到了很多城市,所以现在你能发现GOOGLE的运算速率是超前的快。

服务器将采集的信息分类,整理到庞大的数据库。其中有个数据库都是用来存网站域名的。域名只要被搜索引擎索引到,将自动存入此数据库。此数据库是1号蜘蛛的核心。

其内部分为10个PR各等级的小数据库,虽说小数据库,但也是大的可怕。10个等级的数据库 其周期也不同,基本上以一个PR=4的网站来讲 1号蜘蛛爬行的概率也在7天一次。所以基本你也会发现收录有大的幅度也是在7天内的某一天 。

细心的站长会发现其实有时候7天还是蛮准的,但只针对PR=4。越是PR高其周期越是短,越是PR低周期越长,当然说到这很多站长有这样的疑惑。会觉得蜘蛛有时天天收录他的站这里对其收录的也就是接下来要说的2号蜘蛛,2号蜘蛛往往是在1号蜘蛛爬行过程中放出去的,主要针对于被1号蜘蛛爬过的网站的外部链接。PS既然都说是2号蜘蛛 肯定其抓取力度要比1号小很多。

二、当然不只是有2号,还有3号蜘蛛

所谓3号也就 A站1号蜘蛛爬行到B站,B站的2号蜘蛛爬行到C站。

目前GOOGLE为了限制其无限的循环对于蜘蛛只分为这三个等级。并对其等级的抓取率有个很明确的标准,而且2号与3号蜘蛛有个抓取特点 基本以时间的先后顺序进行抓取。

三、 比方讲

A网站被1号蜘蛛爬行后的一篇文章最后时间为 2008-12-12,那当A网站被从别的网站过来的2号蜘蛛给爬行,首先有可能会对其收录的是,最近发表的几篇文章如: 2008-5-31等 2008-5-30等文章将会进行第2次,第3次的访问,之后再爬行2008-12-12以后的信息。如果你网站没有任何更新,它将对其近一个月内的更改内容进行2次爬行。

如果外部来的2号与3号蜘蛛越多,同一篇文章有可能会被爬上好几次。

以下为GOOGLE提供的官方数据。

标签:
0
投稿

猜你喜欢

  • Linux 下如何利用proftpd构架一个ftp服务器

    2007-10-11 14:52:00
  • 新手搜索优化进阶你还应该知道的 关于谷歌

    2008-12-10 12:09:00
  • 去年收入增长两成 门户游戏双引擎支撑业绩

    2010-03-08 08:52:00
  • 网站吸引百度收录的三种最有效的方法

    2008-11-30 18:38:00
  • 展现最优质内容 正确配置Robots文件

    2009-01-14 17:13:00
  • WordPress核心有待改善的十个重要功能

    2010-07-09 17:28:00
  • Debian+vsftpd+MySQL实现虚拟用户

    2009-12-22 19:06:00
  • 美国2009年度10大最佳职业 系统工程师居首

    2009-10-12 08:34:00
  • 关于Linux操作系统下C语言编程注意事项

    2009-09-20 20:24:00
  • 大型媒体网站提升网站流量的三大SEM技巧

    2009-02-04 09:41:00
  • 预防ASP网站被黑 彻底了解ASP木马

    2007-12-21 13:08:00
  • Windows2003服务器安装及设置教程——MSSQL安全篇二删除MSSQL危险存储过程的代码

    2010-04-30 22:08:00
  • 如何快速的呈现我们的网页

    2007-11-23 12:53:00
  • 2009牛年就要你最红 论坛炒作的三个秘籍

    2009-02-11 09:25:00
  • 使用ZendCore给IIS安装PHP+Zend+Mysql+phpMyAdmin

    2011-01-30 17:42:00
  • 以博客为核心的SNS网站

    2008-11-10 12:44:00
  • Hyper-V Server 2008系统管理实战

    2008-12-08 14:18:00
  • 消息称百度一个月前已低调收购点讯输入法

    2009-11-18 08:45:00
  • FTP站点的建立与维护

    2007-03-26 15:08:00
  • 千橡陈一舟:原创网游面临3挑战 三国不下100款

    2009-10-27 14:37:00
  • asp之家 网站运营 m.aspxhome.com