SEO Google算法解析系列之HillTop算法

来源:SEO研究中心 时间:2009-09-11 16:26:00 

今天我们将介绍超链分析的颠峰之作:HillTop算法,作为现在Google现在最核心的排名算法之一,网上不乏大量介绍她的文献。本文侧重于原始算法的分析,不考虑过多复杂因素,让您更容易理解算法本质。

HillTop算法集PageRank,HITs、相关性算法大成于一身,由康柏系统研究中心的Krishna Bharat和多伦多大学的George A.Mihaila在2001年提出并申请了专利,后授权于Google,2003年12月Google算法更新,其成为Google核心排名算法之一。

HillTop是一种查询相关性链接分析算法,克服了的PageRank的查询无关性的缺点。简单的说HillTop算法是针对热门查询关键词来对搜索结果重新排序的一种算法。之所以针对热门关键词,这是因为HillTop算法运行效率较低的原因。算法主要分为两个过程:

一、 专家页面的寻找和评分;搜索引擎根据用户查询日志发现热门关键词后,开始针对这些热门关键词寻找专家页面,成为专家页的2个必要因素,1)必须拥有足够多而且不存在隶属关系的出链,2)至少存在一个短语包含该热门关键词的所有术语。确定专家页以后,在该页面上找出所有全部包含热门关键词中术语、或者差1到2两个术语的短语,将这些短语分为三个等级,分别为全部包含,差1个和差2个术语,分别对这个三等级计算等级分,等级是分对各个等级中所有短语得分的和,而短语得分取决于这个短语在页面中位置,分数从高到低依次标题、头部和锚文本等等,然后的综合计算这个三个等级得分就得到专家分。以下举个简单的以 “汽车消费”这个热门关键词为例,“中国汽车消费网”的首页和友情链接页就是这个关键词的专家页面,因为他具有足够多而且不隶属315che.com主机域名和同C类ip的出链,同时标题中的“中国汽车消费网”也包含“汽车”和“消费”这两个术语。接下来评分,先算第一等级(包含所有术语的短语)的得分,短语“中国汽车消费网”在标题中得到16分(假设),以及在锚文本中“中国汽车消费理财倾向大调查”得了1分,那么第一等级得分为17分,再算第二等级(差一个术语),第三等级(差两个术语)。这样再算三个等级得分的加权和,就是专家分,注意这三个等级权重相差非常大,在原算法的等级1到等级3的权重分别是2^32,2^16和1,因为HillTop更喜欢完全匹配。

二、 对目标页评分;一个专家页对目标页的评分等于专家本身分值×专家页可区分的短语数量。取前N个指向目标页的专家页,对于多个同一隶属的专家页指向该目标页,取分值最高的专家页,然后这些专家页对目标网页的评分的和就得到,这个页面对应这个热门关键词的得分,有人称之为行业得分。

我们可以看到HillTop算法通过不同等级的评分确保了评价结果对关键词的相关性,通过不同位置的评分确保了主题(行业)的相关性,通过可区分短语数防止了关键词的堆砌。

总结:HillTop算法存在一种博弈的思想,在链接方面同行业的网站既需要竞争更需要合作,只有被同行“认可”的网站对热门关键关键词的查询才会被排在前面。HillTop基本毁灭了小网站对热门关键词的奢望,除非你对热门关键词有超强的预期能力,但是这种流量只会持续很短的时间。当然HillTop只是排名的一个重要因素,并不是全部。

本文由中国汽车消费网(http://www.315che.com/) SEO研究中心撰写。

标签:HillTop,SEO,Google算法解析
0
投稿

猜你喜欢

  • 中关村在线获得信息网络传播视听节目许可证

    2010-03-08 13:49:00
  • 有效分析关键词优化 构筑网站点击的长尾

    2009-01-07 15:26:00
  • 怎样识别诈骗网站-网赚新手注意系列

    2010-05-10 15:18:00
  • 友情链接的作用和好处

    2008-02-02 15:48:00
  • 小谈网站被挂马的防范及解决方法

    2008-11-13 13:14:00
  • Typecho评论列表不要显示博主回复

    2011-04-22 12:49:00
  • 雅虎管理层或将大幅重组 巴茨或兼任董事长

    2009-11-19 11:28:00
  • 腾讯两高管再度减持公司股票 套现8800万港元

    2009-11-27 14:33:00
  • 站内结构对于英文站优化很重要

    2009-07-07 16:34:00
  • 域名转入到godaddy教程

    2010-04-22 16:48:00
  • 链接优化中的小细节:地址格式一定要统一

    2008-12-23 10:03:00
  • 构建DNS服务器指南

    2009-02-10 15:50:00
  • 站长不要讨一时之巧 在网页优化中进行作弊

    2008-12-04 13:32:00
  • 弄清Google Adsense规则 避免账号被封

    2008-10-09 08:54:00
  • 百度 淘宝 个人站长 厚道

    2007-12-04 13:57:00
  • 如何部署Exchange建立ASP应用

    2010-02-26 18:33:00
  • 浅谈广域网(服务器)链路负载均衡

    2008-05-11 19:02:00
  • 动易SiteWeaver利用自定义标签实现随机文章列表

    2009-03-12 18:22:00
  • 在Fedora上建立自己的邮件服务器(3)

    2007-09-10 11:12:00
  • 如何在主流博客中展示你的个性头像

    2011-10-12 20:59:00
  • asp之家 网站运营 m.aspxhome.com