Google以外17个搜索引擎的创新
作者:张骞 时间:2008-03-20 13:08:00
有许多新的搜索引擎(最新统计有100多个)都在开创一些搜索技术的创新。下面是一份17大搜索创新清单,我们认为,这些创新将来会是破坏性的(译者:关于破坏性创新,请参见这里)。这些创新分为4类:查询预处理;信息来源;算法改进;结果可视化和后处理。
[其中的某些创新也在Google的存在各种产品中,但是,正如下文所述,Google的主搜索页中不是缺失了这些功能,就是功能还很有限。]
查询预处理
这类改进的主要目的是应用逻辑来尽量预测用户的意图,并由此改进查询的输入。
1. 自然语言处理
这一功能最初是由Ask.com开创的。同期最著名的例子是Hakia 和 Powerset,二者以不同的方式试图理解用户查询背后的语义或意思。这些搜索引擎与Google的很大的不同,是他们认为“忽略词”(stopwords)非常重要,如次要的连词,像by, for, about, of, in等,Google通常会忽略它们。
2. 个人相关性(亦称“个性化”)
长久以来,大家认为按某特定用户的兴趣和要求处理查询,能获得更高相关性的搜索结果。 Google已在其搜索引擎中支持这一功能,但需要登陆才能使用。很多用户理所当然地不情愿这样做,因为这样可能会给Google提供追踪其特殊的搜索内容的条件。 [即使John Battelle也认为这个想法有点可怕,尽管Google的Matt Cutts并不同意这个看法。] 所需要的就是一种虽然是匿名方式,但能提供个性化的搜索方式。从更广泛的角度来说,提供多个网站上的个性化会更加有用。 Collarity就是拥有这一功能的搜索引擎。
3. 定制的、专门的搜索
这是一个简单但强大的功能。这一应用的典型代表是SimplyHired,一个求职招聘的垂直搜索引擎,能提供强大的、预设的搜索,比如“适合年纪大的员工的雇主”、“允许上班带狗的雇主”等。
信息来源
这些改进着重于潜在的数据来源:额外的内容类型和对数据来源的限制,提高了搜索结果的可靠性(减少垃圾信息)。
4. 新的内容类型
今天的年轻人正像交流文字信息一样,在手机上舒服地交流照片和视频,成为这个时代的标记。在网上,富媒体内容-图片、音频、视频、电视等,及与其内容有关的语义信息一起正在 * 性地增长。 搜索引擎也愈加需要相应地支持这些内容类型。一些支持丰富内容的搜索引擎的示例如下:
-富媒体搜索:音频 (odeo, podzinger ),视频(Youtube, truveo),电视 (Blinkx ),图片 (Picsearch, Netvue )
-专业化内容搜索:博客 (Technorati ),新闻(Topix ),分类广告 (oodle )
当然,Google在这一领域也非常活跃,如Google Blogsearch(博客),Searchmash (图片), Google视频, Google新闻等,因此,也许将这一项放在这个清单里不大公平。尽管如此,理想的情况是,将不同的媒体结果集合在一个搜索里,正如Searchmash已经做的那样(Retrevo是另外一个好例子)。
5. 限定的数据来源
最使搜索用户烦心的问题之一是垃圾信息。由于营销商们更加聪明,正日益使用更多侵略性的SEO(搜索引擎优化)技巧,搜索结果的质量就又下降了。 (Google,作为最流行的搜索引擎,更是众矢之的。) 对一系列受信任站点的限制性搜索排除了这一问题,尽管它也缩小了搜索内容的领域—它为某些类型的搜索很好地提供了真实的、优质的结果,比如,当为一个小学项目研究火山时,搜索 * (Wikipedia)、国家地理(National Geographic)和科学/教育站点。
这一应用最好的例子来自A9.com,它能从多种数据来源中提供内容,并允许用户对每一个搜索作出清楚的选择。Google Co-op 和 Yahoo! Search Builder 能使第三方可以创建这种解决方案;Rollyo早已经是这一领域的先行者!
6. 特定领域的搜索(垂直搜索)
通过聚焦一个单一的垂直方向,搜索引擎能提供更好的用户体验,它对某一特定领域更加全面、简明。针对不同的领域有令人难以置信的大量的垂直搜索引擎,更多资料请查看Alex Iskold在读写网(Read/WriteWeb)上的文章或在Software Abstractions博客上的概述。 [要更全面地了解这方面的信息,Sramana Mitra的在线旅游服务概述介绍了垂直搜索与通用搜索的关系。]


猜你喜欢
eBay CEO:eBay将关注中国出口的电子商务市场
揭秘谷歌"第八次"改版流程
伊坎从雅虎董事会辞职 不再需要激进投资者
传谷歌或计划联手印度公司竞拍印度3G牌照
adsense广告查看中心已经向所有发布商开放
linux服务器CPU飙高排查分析

CentOS 7系统下安装ftp服务器的全过程
CentOS使用本地yum源搭建LAMP环境图文教程

威力妈妈博客月入120万 别小看自己威力
从Google Analytics分析AdSense的广告点击行为
Linux系统Apache服务的信息查看模块介绍
做站长的十大好处
linux下快速列出局域网中所有主机名(计算机名)的脚本
什么是rss?rss由来 历史 应用
WordPress在IIS ISAPI ReWrite下的URL规则
让SEO工作更有效 谈五个不同外部链接形式
GoDaddy:如何创建新目录
Google +1按钮:应该注意的31项
SpringBoot整合Activiti7的实现代码
