Google以外17个搜索引擎的创新

作者:张骞 时间:2008-03-20 13:08:00 

有许多新的搜索引擎(最新统计有100多个)都在开创一些搜索技术的创新。下面是一份17大搜索创新清单,我们认为,这些创新将来会是破坏性的(译者:关于破坏性创新,请参见这里)。这些创新分为4类:查询预处理;信息来源;算法改进;结果可视化和后处理。

[其中的某些创新也在Google的存在各种产品中,但是,正如下文所述,Google的主搜索页中不是缺失了这些功能,就是功能还很有限。]

查询预处理

这类改进的主要目的是应用逻辑来尽量预测用户的意图,并由此改进查询的输入。

1. 自然语言处理

这一功能最初是由Ask.com开创的。同期最著名的例子是Hakia 和 Powerset,二者以不同的方式试图理解用户查询背后的语义或意思。这些搜索引擎与Google的很大的不同,是他们认为“忽略词”(stopwords)非常重要,如次要的连词,像by, for, about, of, in等,Google通常会忽略它们。

2. 个人相关性(亦称“个性化”)

长久以来,大家认为按某特定用户的兴趣和要求处理查询,能获得更高相关性的搜索结果。 Google已在其搜索引擎中支持这一功能,但需要登陆才能使用。很多用户理所当然地不情愿这样做,因为这样可能会给Google提供追踪其特殊的搜索内容的条件。 [即使John Battelle也认为这个想法有点可怕,尽管Google的Matt Cutts并不同意这个看法。] 所需要的就是一种虽然是匿名方式,但能提供个性化的搜索方式。从更广泛的角度来说,提供多个网站上的个性化会更加有用。 Collarity就是拥有这一功能的搜索引擎。

3. 定制的、专门的搜索

这是一个简单但强大的功能。这一应用的典型代表是SimplyHired,一个求职招聘的垂直搜索引擎,能提供强大的、预设的搜索,比如“适合年纪大的员工的雇主”、“允许上班带狗的雇主”等。

信息来源

这些改进着重于潜在的数据来源:额外的内容类型和对数据来源的限制,提高了搜索结果的可靠性(减少垃圾信息)。

4. 新的内容类型

今天的年轻人正像交流文字信息一样,在手机上舒服地交流照片和视频,成为这个时代的标记。在网上,富媒体内容-图片、音频、视频、电视等,及与其内容有关的语义信息一起正在 * 性地增长。 搜索引擎也愈加需要相应地支持这些内容类型。一些支持丰富内容的搜索引擎的示例如下:

-富媒体搜索:音频 (odeo, podzinger ),视频(Youtube, truveo),电视 (Blinkx ),图片 (Picsearch, Netvue )

-专业化内容搜索:博客 (Technorati ),新闻(Topix ),分类广告 (oodle )

当然,Google在这一领域也非常活跃,如Google Blogsearch(博客),Searchmash (图片), Google视频, Google新闻等,因此,也许将这一项放在这个清单里不大公平。尽管如此,理想的情况是,将不同的媒体结果集合在一个搜索里,正如Searchmash已经做的那样(Retrevo是另外一个好例子)。

5. 限定的数据来源

最使搜索用户烦心的问题之一是垃圾信息。由于营销商们更加聪明,正日益使用更多侵略性的SEO(搜索引擎优化)技巧,搜索结果的质量就又下降了。 (Google,作为最流行的搜索引擎,更是众矢之的。) 对一系列受信任站点的限制性搜索排除了这一问题,尽管它也缩小了搜索内容的领域—它为某些类型的搜索很好地提供了真实的、优质的结果,比如,当为一个小学项目研究火山时,搜索 * (Wikipedia)、国家地理(National Geographic)和科学/教育站点。

这一应用最好的例子来自A9.com,它能从多种数据来源中提供内容,并允许用户对每一个搜索作出清楚的选择。Google Co-op 和 Yahoo! Search Builder 能使第三方可以创建这种解决方案;Rollyo早已经是这一领域的先行者!

6. 特定领域的搜索(垂直搜索)

通过聚焦一个单一的垂直方向,搜索引擎能提供更好的用户体验,它对某一特定领域更加全面、简明。针对不同的领域有令人难以置信的大量的垂直搜索引擎,更多资料请查看Alex Iskold在读写网(Read/WriteWeb)上的文章或在Software Abstractions博客上的概述。 [要更全面地了解这方面的信息,Sramana Mitra的在线旅游服务概述介绍了垂直搜索与通用搜索的关系。]

标签:搜索引擎,搜索,google
0
投稿

猜你喜欢

  • eBay CEO:eBay将关注中国出口的电子商务市场

    2009-11-11 10:24:00
  • 揭秘谷歌"第八次"改版流程

    2010-05-12 12:34:00
  • 伊坎从雅虎董事会辞职 不再需要激进投资者

    2009-10-24 10:00:00
  • 传谷歌或计划联手印度公司竞拍印度3G牌照

    2009-10-28 11:54:00
  • adsense广告查看中心已经向所有发布商开放

    2008-04-27 20:29:00
  • linux服务器CPU飙高排查分析

    2023-10-12 17:40:44
  • CentOS 7系统下安装ftp服务器的全过程

    2023-07-31 06:22:54
  • CentOS使用本地yum源搭建LAMP环境图文教程

    2023-10-12 18:20:12
  • 威力妈妈博客月入120万 别小看自己威力

    2008-04-19 22:08:00
  • 从Google Analytics分析AdSense的广告点击行为

    2009-02-12 14:08:00
  • Linux系统Apache服务的信息查看模块介绍

    2010-05-02 18:32:00
  • 做站长的十大好处

    2007-09-12 12:13:00
  • linux下快速列出局域网中所有主机名(计算机名)的脚本

    2023-07-22 14:13:38
  • 什么是rss?rss由来 历史 应用

    2007-10-02 12:33:00
  • WordPress在IIS ISAPI ReWrite下的URL规则

    2008-07-01 12:09:00
  • 让SEO工作更有效 谈五个不同外部链接形式

    2009-02-01 11:28:00
  • GoDaddy:如何创建新目录

    2010-05-01 13:11:00
  • Google +1按钮:应该注意的31项

    2011-06-07 14:18:00
  • SpringBoot整合Activiti7的实现代码

    2023-11-03 20:58:29
  • 谷歌第三季度游说费用首次超过100万美元

    2009-11-05 08:34:00
  • asp之家 网站运营 m.aspxhome.com