分析百度搜索引擎收录习惯

作者:aspgood 来源:N70 fans 时间:2008-06-15 15:07:00 

百度是全球最大的中文搜索引擎,对中文网页的搜索技术在某种程度上领先于Google,百度在某些方面与Google有相同或相似之处外它还有以下特点:

1、较重视第一次收录印象

网站给百度的第一印象比较重要,相对Google而言,百度搜索引擎的人为参与度较高,也就是说在某些层面上可能由人来决定是否收录网页而不是由机器来决定.所以,网站在登录百度搜索引擎之前最好把内容做得丰富点、原创内容多一点、网页关键词与内容的相关度高一点,这样才能给百度较好的初次印象.

2、对网页的更新较敏感

百度对网页的更新相对Google而言更加敏感,可能这与百度的本土性格有关.百度搜索引擎每周更新,网页视重要性有不同的更新率,频率在几天至一月之间.所以在百度的搜索结果中基本上都标明了收录时间.

3、较重视首页

百度对首页的重视程度要比Google高得多,这与上面提到的“较重视第一次收录印象”一脉相承.百度在显示搜索结果时也常常把网站首页显示出来,而不具体到某个内容页(当其认为不够重要时).相对而言,其用户体验打了折扣,而增加了其“百度快照”的用户量.

4、较重视绝对地址的链接

百度在收录网页时比较重视绝对地址的收录,百度提供的网页快照功能也没有解析相对地址的绝对路径,不知这是百度技术的疏忽还是其偏好的一大体现.

5、较重视收录日期

百度对网页的收录日期非常看重,也是其搜索结果排名的参考点,被收录得越早排名会较高,有时甚至不考虑相关性地把它认为比较重要的内容放在首位,而点击进入之后才发现是早已过时的信息或者垃圾信息.这是百度需要改进的技术.

百度使用的技术:

百度使用以下技术:“一种互联网上镜像和准镜像网站的识别方法”,这个方法解决了搜索引擎对雷同信息的重复获取,节省网络资源和本地资源,提高系统服务的质量和效率;“一种基于词汇的计算机索引和检索方法”,该方法对一段连续的文字信息,经过词汇分析处理后,通过添加隐形词汇的手段,实现对基于词汇索引和检索系统的检索质量提升,使用户获得更加准确的检索结果;“一种使用快照的方式实现对网上信息进行记录和分析的方法”,该方法是通过对互联网上一个特定信息,多次进行快照的方式,将信息当时的状态进行保留.并通过对一系列快照信息的分析,得到有效数据,方便地得到网上信息的变动情况.

标签:百度,搜索,收录
0
投稿

猜你喜欢

  • 关键字优化的十大奇招妙技

    2008-04-27 20:22:00
  • 另一个观念:SEO的最高境界就是不做SEO

    2009-01-16 14:16:00
  • Godaddy主机SSH登录管理

    2010-04-07 12:34:00
  • Jerry mont:如何利用教师节推广网站

    2009-09-09 10:12:00
  • 典型的 SQL 注入过程

    2009-11-19 13:02:00
  • Google尝试在搜索结果中混杂关键词广告

    2008-06-21 16:53:00
  • 做站新理念:融入开发者的理念于其中

    2009-02-03 01:28:00
  • SYN攻击原理与防范技术

    2009-09-20 20:17:00
  • Windows 2000活动目录详解之结构篇

    2009-08-09 13:48:00
  • 做网站采集文章,采还是不采?

    2007-11-13 12:20:00
  • Windows 2003系统Web服务器配置方法

    2010-05-10 18:22:00
  • Windows Server 2008成为IT新宠

    2008-12-08 13:59:00
  • 活动目录:Win2003跨树信任关系

    2007-03-27 11:33:00
  • AdSense官方:创建独特而有价值的内容

    2011-11-21 16:59:42
  • 好好学习:点石 Zac 《网络营销实战密码》

    2009-03-24 14:49:00
  • 网站改版应注意的事项

    2007-09-21 12:02:00
  • 中国大型网游用户数达6931万 休闲游戏猛增

    2009-11-27 12:29:00
  • 我的GG adsense从每周10美金到每周800美金的秘笈

    2008-08-10 18:19:00
  • 最新的IIS“服务没有及时响应启动或控制请求"处理方法

    2010-03-15 12:58:00
  • 配置emule的web服务器功能详解

    2009-01-06 17:00:00
  • asp之家 网站运营 m.aspxhome.com