雅虎挑战Google PR
作者:昝辉zac 来源:艾瑞网 时间:2008-01-22 12:23:00
Google PR是现在搜索引擎技术的基石之一,其他搜索引擎不一定叫PR,但肯定也在使用相同的技术。PR值在搜索引擎排名的各个阶段都可能用到,比如计算最后的相关度,决定抓取周期,抓取深度,以及是放在主数据库还是补充材料数据库。
PR值的计算是假设网页上的链接有相同的权重。据SEO by the SEA报道,雅虎今年1月10号刚刚被批准的一份名为用户敏感PageRank的专利对PR值的这一假设做出了挑战。
申请这一专利的人对PR有非常深入的了解,挑战的PR计算基本假设包括:
不是所有链接都是相同的
用户并不是随机的点击网页上的链接,有些链接天生就比其他链接更重要。比如说网页上的隐私权政策链接,很少有人点击。
用户并不随机访问网页
PR计算的一个假设是当用户烦了的时候,并不点击网页上的链接,而是随机的转到网上的另外一个网页。这种假设并不现实。因为一般人离开原来网页去其他网站时,并不真正随机。重要门户和个人网站被随机访问的机会相差甚远。
无聊的用户并不只是去被信任的网页
像上面说的,无聊的用户不再点击链接时,下一个访问目标既不完全随机,也不一定就会去被信任的网站。
网页随时间以不同速率改变
PR值的计算忽略了有时网页会被买卖或起其他变化,有的时候会过时,这些变化的速率对不同网站也是不同的。
雅虎的这份专利引入用户行为数据来修正PR值计算中不现实的假设。考虑的用户行为方式包括:
链接权重
链接权重受用户实际上点击的比例影响。点击多的链接权重比较大。
随机到达新网页的可能性
用户不是点击链接,而是随机来到新网页的可能性也被用户数据所修正。
对网页的满意度
用户停在网页上,并不再继续访问新网页的可能性,也通过用户数据有反应。用户停在某个网页上,意味着对这个网页满意度更高。
这三个部分组合起来,将产生一个网页文件的权重值。
一直以来,雅虎在引入用户行为模式方面走的就比较远,所拥有的社会化网络也比较多。这份专利申请体现了雅虎在用户数据上的专注。
原载: 中新虚拟主机