逐步构建面向未来的搜索引擎

标签: 未来 搜索引擎 | 发表时间:2012-08-09 14:06 | 作者:joydandan
出处:http://googlechinablog.blogspot.com/
发表者: Amit Singhal,Google高级副总裁 

什么是完美的搜索引擎?拉里·佩奇(Larry Page)曾经这样形容:它能够理解你的真正意图,并为你提供最想要的答案。这与我曾经梦想过的计算机非常像。我在印度长大,小时候经常守在家里的黑白电视机旁,每一集《星际迷航》都不愿错过,在我的想象中,未来会有一台“星际迷航”式的计算机:它能够即刻回答我可能会提出的任何问题。今天,我们离这个梦想又近了一些,而且比我在自己工作生涯中曾经预想过的还要近——以下是我们目前在提升搜索智慧方面取得的一些进展: 

理解现实世界 
今年五月份,我们推出了 Knowledge Graph; 这是Google的一个数据库,里面包含超过5亿条关于现实世界中人物、地点、事实的信息,以及超过35亿条不同事物的属性和它们之间的关系。用户对这个功能的反馈很好,所以我们想要把这项功能呈现给美国以外的用户。从今天开始,您将可以在世界上每一个英语国家使用Knowledge Graph。如果你在澳大利亚搜索[chiefs],会得到关于这支橄榄球队的所有信息——包括其队员、战绩以及历史。 

此外,当您的搜索请求可能具有不同含义时,我们还将使用这一功能,帮助您更迅速地找到准确结果。例如,当您搜索[rio]时,说明您感兴趣的可能是巴西的这座著名城市,或者是最近上映的那部动画电影,又或者是拉斯维加斯的一家叫“Rio”的赌场。现在,有了Knowledge Graph,当您键入搜索内容时,我们可以在搜索框中给您提供下面这些关于现实世界实体的不同建议: 


最后,您所提问题的最佳答案,不一定是某个单独实体,有时候会是一个互相联系的事实的列表或组合。自动从网络上获取这些列表是一项相当具有挑战性的工作。但我们现在将开始接受这一挑战。因此,现在当您搜索 [california lighthouses](加州灯塔)、[hurricanes in 2008](2008年飓风)或[famous female astronomers](著名女天文学家)时,我们将在页面顶端向您显示关于这些事实的一个列表。而且,通过将Knowledge Graph与网络上的集体智慧结合,我们甚至可以提供更为主观的列表,比如[best action movies of the 2000s](2000年至今的最佳动作电影)或[things to do in paris](游巴黎必访之处)等。如果您点击某个条目,则可以在网络上更深入地探究相关结果: 


到目前为止,我们可以生成几十万个这样的列表,涉及数以百万计的条目,而且我们会不断增加列表数量,以满足您的好奇心,快速预览。

获取信息更便捷
有时侯,您所提问题的最佳答案,是不能在网络上获得的 —— 它可能在其他地方,比如您的电子邮件中。我们认为您不应该自己再去查找邮件获得相关的信息—它应该能够自行工作。搜索就是搜索,我们希望我们提供的搜索结果具有真正的普遍性。因此,我们正在为您开发一种实用且低调的寻找这种信息的方法,而且我们非常希望您能够提供反馈。从今天起,我们将进行区域性的尝试,您可以通过<注册>Gmail,在搜索结果页面右侧获得来自您的Gmail的信息。 

如果您计划骑自行车到塔霍(Tahoe)旅行,并在搜索相关信息,搜索结果页面右侧就会显示朋友们发给您的相关邮件,告诉您最好的骑车线路,或绝佳的就餐地点。如果你觉得这些结果具有相关性,那么您可以展开该框,阅读电子邮件内容: 


并且我们正在开发一些更为实用的功能。例如,如果您搜索[my flights](我的航班),那么我们将会以美观易读的方式,将所有包含航班信息的邮件显示在搜索结果页面右侧: 


理解搜索意图 

最自然的提问方式往往是大声问出来。因此,我们整合了语音识别技术、对语言的理解以及Knowledge Graph,以使语音搜索能够更有效地理解您的问题,有时甚至可以使用语音整句回答问题。这项 功能已经在Android设备上试运行了几个星期,深受人们喜爱,并很快可在iPhone 或 iPad (iOS4.2及以上的版本)上使用了。 

您只需点击麦克风图标,说出自己的问题,就如同向朋友提问一样。例如,如果您问“这个周末会放什么电影?”,Google显示您附近的电影院最新上映的电影列表,并提供排片表,甚至预告片。你可以问任何问题,从名人趣闻,到乞力马扎罗山的高度等等。当Google为你提供搜索结果的同时,也会以语音方式将答案“告诉”您。 

这些只是我们取得的一些小进展,但却是Google在构建面向未来的知识搜索引擎之路上迈出的重要几步 ——与短短几年前相比,未来的搜索引擎会更加智慧,更加实用。能够从事搜索领域的工作,真是让人激动事情。

相关 [未来 搜索引擎] 推荐:

逐步构建面向未来的搜索引擎

- - Google China Blog
发表者: Amit Singhal,Google高级副总裁 . 拉里·佩奇(Larry Page)曾经这样形容:它能够理解你的真正意图,并为你提供最想要的答案. 这与我曾经梦想过的计算机非常像. 我在印度长大,小时候经常守在家里的黑白电视机旁,每一集《星际迷航》都不愿错过,在我的想象中,未来会有一台“星际迷航”式的计算机:它能够即刻回答我可能会提出的任何问题.

【解读】搜索引擎优化(SEO)的未来:社会化

- - SocialBeta
如果有一天SEO(搜索引擎优化:Search Engine Optimiztion)消失了,那么五年后社会化网络也将不复存在. 不必感动惊讶,即便在社交网站如日中天的今天,我任相信搜索引擎和社交网站之间的关系并不是相互取代,而是互相促进,共同发展. 在今天的搜索领域,越来越多的人认为社交网站将怎么样颠覆互联网世界,搜索引擎会慢慢沦为一种过时的技术,SEO也将慢慢走向死忙.

实体搜索引擎现在的发展状况如何?未来是否明晰?

- - 知乎每日精选
实体(entity)搜索是相对于关键词(keyword)搜索而言的. 传统的关键词搜索虽然目前已经可以达到很高的"智能"水平, 搜索结果在很大程度上可以帮助用户找到需要的信息. 但对于"搜索引擎"这个系统自身而言, 其实并不了解搜索query本身有什么意思, 对于搜索"盗梦空间"和"喵喵喵", 搜索引擎做的事情基本差不多.

uSniff:BT种子搜索引擎

- leqoqo - 软件志
一、uSniff相关信息: 1、官方主页:http://www.usniff.com/ 2、简介:uSniff是一个BT种子搜索引擎,简单、易用、实时是其最大的优点,其搜索引擎数据库包含了17个知名种子站点的种子信息,目的是想发展成为世界上最大的BT种子搜索引擎,而且对于每个种子,该搜索引擎都会进行安全认证,以保证用户的正常使用.

人眼启发视觉搜索引擎

- feng823 - Solidot
Google上周宣布将支持声音和图片进行搜索,但一家创业公司在图像搜索方面走在了Google前面. 源自伦敦帝国学院研究项目的创业公司Cortexica,开发出视觉搜索工具,通过手机拍摄产品照片,它会自动呈现价格信息. Cortexica已经发布了一个用于比较酒价格的工具WINEfindr. Cortexica的视觉搜索技术是受到了人眼视觉系统的启发,它能识别出一个目标的关键特征,不受方位、大小、光线亮暗的影响.

比较好的学术搜索引擎

- hfut_chen - C++博客-首页原创精华区
     摘要: 1、http://scholar.google.com/. Google学术搜索滤掉了普通搜索结果中大量的垃圾信息,排列出文章的不同版本以及被其它文章的引用次数. 略显不足的是,它搜索出来的结果没有按照权威度(譬如影响因子、引用次数)依次排列,在中国搜索出来的,前几页可能大部分为中文的一些期刊的文章.

Blekko 对搜索引擎的新探索

- thinkingit - 知乎的博客
Blekko 这款搜索产品做的如何. 从目前我的使用过程来看,Blekko还是很让人激动的. 在谈Blekko之前就要先问:为何在搜索这个看似已经垄断的行业还会有人想去分一杯羹,这些小团队能与Google或微软这样的巨头抗衡吗. 比如之前的Powerset,后来的Cuil,和现在的Blekko. 在Google之前Yahoo是靠人工收录网页,Google的算法和蜘蛛革了搜索的命,一直垄断搜索业十余年,而现在随着WEB 2.0的发展,让人又看到了搜索业革命的火种,可以说Blekko就是这样的一个产品.

Mr.Icons:图标icon搜索引擎

- 壮壮爱 - 够趣堂
之前Anliu在如何更换更好的icon文章里面推荐了4个icon搜索引擎,目前部分已经不复存在. 不过Mr.Icons倒是又一个不错的选择,可以搜索图标icon进行下载,有PNG、ico格式以及不同大小提供下载. Mr.Icons还提供图标icon集打包下载,比如动物图标等. 和之前的介绍几款搜索引擎一样,依然不支持中文.

迅搜全文搜索引擎 XunSearch

- Le - 开源中国社区最新软件
迅搜(xunsearch)是采用 C/C++ 基于 xapian 和 scws 开发的全文搜索引擎解决方案,提供 PHP 语言的开发接口. 支持海量数据高速检索,功能强大,简单易用. 本项目旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎. 全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验.

搜索引擎的特殊用法

- iVane - 崔凯,前端开发
下周组内分享要讨论“工具”,介绍几个搜索引擎的特殊用法,凑凑数:. 通配符,这么搜可以得到“崔凯前端开发”,也能得到“崔凯大连开发” 崔凯*开发. 用于搜索查询词出现在URL中的页面. 由于关键词出现在URL中对排名有一定影响,因此使用inurl:搜索也是定位竞争对手的一种方式. 该指令搜索结果返回的是页面title中包含关键词的页面.