Google以外17个搜索引擎的创新

作者:张骞 时间:2008-03-20 13:08:00 

有许多新的搜索引擎(最新统计有100多个)都在开创一些搜索技术的创新。下面是一份17大搜索创新清单,我们认为,这些创新将来会是破坏性的(译者:关于破坏性创新,请参见这里)。这些创新分为4类:查询预处理;信息来源;算法改进;结果可视化和后处理。

[其中的某些创新也在Google的存在各种产品中,但是,正如下文所述,Google的主搜索页中不是缺失了这些功能,就是功能还很有限。]

查询预处理

这类改进的主要目的是应用逻辑来尽量预测用户的意图,并由此改进查询的输入。

1. 自然语言处理

这一功能最初是由Ask.com开创的。同期最著名的例子是Hakia 和 Powerset,二者以不同的方式试图理解用户查询背后的语义或意思。这些搜索引擎与Google的很大的不同,是他们认为“忽略词”(stopwords)非常重要,如次要的连词,像by, for, about, of, in等,Google通常会忽略它们。

2. 个人相关性(亦称“个性化”)

长久以来,大家认为按某特定用户的兴趣和要求处理查询,能获得更高相关性的搜索结果。 Google已在其搜索引擎中支持这一功能,但需要登陆才能使用。很多用户理所当然地不情愿这样做,因为这样可能会给Google提供追踪其特殊的搜索内容的条件。 [即使John Battelle也认为这个想法有点可怕,尽管Google的Matt Cutts并不同意这个看法。] 所需要的就是一种虽然是匿名方式,但能提供个性化的搜索方式。从更广泛的角度来说,提供多个网站上的个性化会更加有用。 Collarity就是拥有这一功能的搜索引擎。

3. 定制的、专门的搜索

这是一个简单但强大的功能。这一应用的典型代表是SimplyHired,一个求职招聘的垂直搜索引擎,能提供强大的、预设的搜索,比如“适合年纪大的员工的雇主”、“允许上班带狗的雇主”等。

信息来源

这些改进着重于潜在的数据来源:额外的内容类型和对数据来源的限制,提高了搜索结果的可靠性(减少垃圾信息)。

4. 新的内容类型

今天的年轻人正像交流文字信息一样,在手机上舒服地交流照片和视频,成为这个时代的标记。在网上,富媒体内容-图片、音频、视频、电视等,及与其内容有关的语义信息一起正在 * 性地增长。 搜索引擎也愈加需要相应地支持这些内容类型。一些支持丰富内容的搜索引擎的示例如下:

-富媒体搜索:音频 (odeo, podzinger ),视频(Youtube, truveo),电视 (Blinkx ),图片 (Picsearch, Netvue )

-专业化内容搜索:博客 (Technorati ),新闻(Topix ),分类广告 (oodle )

当然,Google在这一领域也非常活跃,如Google Blogsearch(博客),Searchmash (图片), Google视频, Google新闻等,因此,也许将这一项放在这个清单里不大公平。尽管如此,理想的情况是,将不同的媒体结果集合在一个搜索里,正如Searchmash已经做的那样(Retrevo是另外一个好例子)。

5. 限定的数据来源

最使搜索用户烦心的问题之一是垃圾信息。由于营销商们更加聪明,正日益使用更多侵略性的SEO(搜索引擎优化)技巧,搜索结果的质量就又下降了。 (Google,作为最流行的搜索引擎,更是众矢之的。) 对一系列受信任站点的限制性搜索排除了这一问题,尽管它也缩小了搜索内容的领域—它为某些类型的搜索很好地提供了真实的、优质的结果,比如,当为一个小学项目研究火山时,搜索 * (Wikipedia)、国家地理(National Geographic)和科学/教育站点。

这一应用最好的例子来自A9.com,它能从多种数据来源中提供内容,并允许用户对每一个搜索作出清楚的选择。Google Co-op 和 Yahoo! Search Builder 能使第三方可以创建这种解决方案;Rollyo早已经是这一领域的先行者!

6. 特定领域的搜索(垂直搜索)

通过聚焦一个单一的垂直方向,搜索引擎能提供更好的用户体验,它对某一特定领域更加全面、简明。针对不同的领域有令人难以置信的大量的垂直搜索引擎,更多资料请查看Alex Iskold在读写网(Read/WriteWeb)上的文章或在Software Abstractions博客上的概述。 [要更全面地了解这方面的信息,Sramana Mitra的在线旅游服务概述介绍了垂直搜索与通用搜索的关系。]

标签:搜索引擎,搜索,google
0
投稿

猜你喜欢

  • YouTube影片服务规格升至1080P 近期将上线

    2009-11-17 08:58:00
  • 草根站长走出蜗居 小聚会让我赚到了5000元

    2010-05-10 22:27:00
  • 核心揭秘:搜索引擎算法的139个相关因素

    2009-01-22 16:03:00
  • SEO知识问答:谷歌对站群的态度是如何的

    2009-01-12 13:15:00
  • 网页游戏鱼龙混杂 偷菜模式能否成救命稻草?

    2009-11-18 07:15:00
  • v5shop为“一伍一拾”提供企业电子商务解决方案

    2010-04-22 16:58:00
  • 聚有客之路(二)对Google AdSense的期待

    2009-01-05 14:13:00
  • 基于XP架设Web和FTP服务器

    2010-04-14 18:00:00
  • 微软在线业务连亏15个季度 损失4.8亿美元

    2009-10-24 10:31:00
  • 51wan 性感女王胸女来袭 太平公主纷纷落马

    2009-10-12 16:46:00
  • 个人网站选购虚拟主机的五大原则/技巧

    2010-03-21 16:16:00
  • Godaddy主机购买图解教程

    2010-04-20 12:56:00
  • 网站要进行优化的原因

    2007-12-02 14:52:00
  • phpwindV6.3关于猪头术对系统头像无效问题

    2009-02-20 15:59:00
  • 网游业盲目追风致市场混乱 行业洗牌在即

    2009-10-14 09:48:00
  • 百度框计算的终极目标

    2009-10-06 14:28:00
  • 微软上下文广告展开内测 将单挑Google AdSense

    2008-07-19 12:05:00
  • 学生建站应该注意四个要点

    2009-02-01 12:32:00
  • 在Fedora上建立自己的邮件服务器(1)

    2007-09-06 14:03:00
  • 传Google将于一周内发布Chrome操作系统

    2009-11-14 08:49:00
  • asp之家 网站运营 m.aspxhome.com