Google的潘多拉星球

标签: 推荐 评论 Google 搜索 | 发表时间:2011-10-09 13:21 | 作者:wangyixin Cary
出处:http://www.36kr.com
《阿凡达》剧照

《阿凡达》剧照

Google搜索引擎的使命,就如同它的界面一样简单:左边有一大堆(持续增加中的)信息,右边有一位用户需要某个问题的答案,于是搜索引擎负责从左边的信息中挑选出适合做答案的部分并交给这位用户。

在 搜索引擎的运行过程中有四个过程,crawl(爬行)指派出蜘蛛在万维网上搜集信息,index(收录)则将这些信息整理储存,然后通过 relavance(相关性)选出适合信息,最后deliver(传送)给需要答案的用户。问题是,在这四个过程中,只有crawl、index和 deliver像是机器能完成的任务,完成relevance 则需要人类的思维。如果我们将搜索引擎想像成一个人,那么它的工作核心,就是理解人类用户的知识和认识,它需要“懂得”用户的提出问题,也需要“懂得”相 应的答案,否则就无法完美完成“匹配”的工作。

在上世纪90年代初期,搜索引擎这种东西刚出现的时候,其工作机制离“人工智能”还很远很 远。Google之前的搜索引擎如Altavista、Excite等等,其工作机制基于Priority(重要性排名)。排名只是一个指标,可以从很多 纬度和角度来设立,比如说某个页面的流量越大排名就越高,或者页面上出现搜索词的次数越多则排名越高,等等。显而易见的,这类排名系统很容易被作弊手段攻 破,比如说在页面上隐藏一堆与页面实际内容无关的搜索词来吸引搜索引擎的注意。

当时,Google也在给页面排名——无论如何,当搜索引擎 为用户呈现结果的时候,多个结果总要按一定顺序排列出来才行。而Google的精彩之处在于Page Rank机制,根据某个页面与其它页面的交叉链接程度来确定页面内容的可信度。例如,如果某个含有“比尔 克林顿”字样的页面被白宫的网站引用了,那么这个页面与比尔 克林顿的关联就很可能值得信赖。打个比方来说,其它搜索引擎的排名根据是“页面声称自己很靠谱”,而Google的排名则根据“很多人说这个页面很靠 谱”,相比之下显然后者更为可靠。

这种可靠性确保Google迅速击败对手,成为网络用户搜索的不二之选。大量的用户涌到Google,大 量的搜索行为时刻发生。每次搜索都意味着用户提出了问题,Google给出的搜索结果则是Google对这个问题的回答。接下来还有更奇妙的事情:用户对 Google的搜索结果进行评价——如果他们点击了前几位的结果链接,则意味着Google答对了这道题;如果他们翻了好几页,或者更换搜索词重新尝试, 则意味着Google的本次回答不靠谱。

Google迅速认识到了这一点:用户在教育搜索引擎。就好比老师教育学生并用考试来考察,学生答 对问题就给个勾,打错了就画个叉,然后换一道类似的题,学生最终答对就意味着他/她掌握了这个知识点。每一位用户在搜索的时候都在教育 Google,Google不断尝试新的答案,直到它有一天在这个问题上不断获得对号——它学会了。

这大概是历史上最精彩的用户与产品交互 促进的案例。用户的使用过程本身帮助产品不断改进,而产品的改进反过来助益用户。网络产品的瞬时性和直接性,以及Google所拥有的顶级科学家与工程 师,使得搜索引擎的学习过程变为现实。hot(热)与boiling(沸腾)意思相近,puppies(小狗崽)与dog(狗)差不多一样,但是与hot dog(热狗面包)相关的是面包馒头芥末酱,而不是boiling puppies(沸腾的小狗崽)!基于每秒钟都在大量积累的知识和常识,搜索引擎开始自动识别用户的语言并试图揣测用户的真实意图。

到了这 一步,Google赖以起步的Page Rank就完成了历史使命。搜索引擎已经积累(并且在不断学习)足够的可靠的知识,而且能在理解问题的基础上给于回答。搜索引擎自己足够正确和自信,不再 需要Page Rank为它的回答进行背书。于是,到了2009年底,Google宣布取消Page Rank机制。这个宣告在当时引起了酣然大波,毕竟多少年来站长们的奋斗目标就是页面上的PR数字,而这个目标却在一瞬间成了浮云。当时也有很多揣测,主 流的说法Google是为了防范针对PR的作弊机制才采取这一举动。然而,“防范”这种被动而无奈的行为并不符合Google的风格。真正的原因是,它有 了更好的办法。

就像我们每个人从一无所知的新生儿开始,逐渐成长为在复杂的现实中顺利生存的个体,我们每个人都是一个学习和反应的机制。我 们从零开始,学习和储存了各种知识和常识,并在这些知识和常识的基础上形成了直觉和经验。然后,当我们遇到现实问题的时候,我们在自己的储备中调出最适合 应对的那个部分。

今天的Google正在做类似的事情。作为这个星球上最幸运的学生,有无数老师不断向它输送知识并且每时每刻帮它纠错。它也很好的回报了这个世界,它为世界上无数用户提供答案,正如同学习成绩优秀的学生经常帮助其他同学答疑解难。

在 电影《阿凡达》中,潘多拉星球是一个“活”的星球,这颗星球上的神树是星球的精神网络与现实连接的节点,通过这些节点为潘多拉的子民们提供帮助,同时也接 受子民的拥戴和供养。今天,当万维网联系了人类群体的意识和思维,我们的星球也在成为潘多拉。我们有avatar,我们也有神树——目前,神树之名为 Google。

作者:王一辛

除非注明,本站文章均为原创或编译,转载请注明: 文章来自36氪



相关 [google 潘多拉 星球] 推荐:

Google的潘多拉星球

- Cary - 36氪
Google搜索引擎的使命,就如同它的界面一样简单:左边有一大堆(持续增加中的)信息,右边有一位用户需要某个问题的答案,于是搜索引擎负责从左边的信息中挑选出适合做答案的部分并交给这位用户. 在 搜索引擎的运行过程中有四个过程,crawl(爬行)指派出蜘蛛在万维网上搜集信息,index(收录)则将这些信息整理储存,然后通过 relavance(相关性)选出适合信息,最后deliver(传送)给需要答案的用户.

《阿凡达2》:聚焦潘多拉海洋,也会有其他星球

- 牛 - 新影像日报
詹姆斯·卡梅隆(James Cameron)近日接受ABC电视台《夜线》(Nightlin)节目的访谈,谈到了他正在创作的《阿凡达》续集,据他透露《阿凡达2》(Avatar 2)将探索潘多拉星球的海洋,同时也会有其他星球. 卡梅隆说:“续集故事仍然会发生在潘多拉星球上,我是第二集、第三集一起写的,某种程度上算是个三部曲吧.

潘多拉的启示

- ItTalks - 《商业价值》杂志
在以潘多拉为代表的众多在线音乐电台身上,人们看到了互联网科技和音乐产业重新拥抱的希望. 在2011年上市的美国高科技公司中,于6月中旬登录纽交所的在线音乐电台服务提供商潘多拉(Pandora)是最耀眼的明星之一. 这是因为自新世纪以来,沿着黑胶唱片时代、磁带时代、CD时代一路走来的,由科技推动音乐产业发展的轨迹,突然被互联网上的数字音乐大潮所冲断——唱片公司和乐迷被互联网隔离开来,整个音乐产业在盗版横行、歌手自立门户的大潮中大厦将倾.

轻松获取你的手机号,这个“潘多拉魔盒”正在全国热销

- - FreeBuf互联网安全新媒体平台
如果有一个盒子,只要你在它百米之内,就能直接获取你的手机号,你害不害怕. 最近一则新闻“一个盒子就能获取任意的手机号”被媒体报道出来,新闻提到,长沙一家公司正在售卖一个智能盒子,只要手机打开WIFI,在这个盒子周围100米范围内,任意手机号都可以被轻松获取. 今天,妮美就带大家一起来了解下这个黑科技(产)盒子.

谷奥: Google = Google+

- 吞佛 - 谷奥聚合——谷奥主站+谷安 aggregator
在上周举办的Google Zeitgeist 2011大会上,John Battelle问Larry Page:在Google大部分的历史里,人们会想到搜索,那么Google品牌=搜索. 但在随后Google的发展史里,Google品牌会等于什么. Larry Page并未直面回答这个问题,至少没有从市场角度来回答.

Google宣布Google CDN

- way - Solidot
Google宣布了最新的帮助加快互联网速度的工具Page Speed Service,加快静态网页的载入速度,不支持动态网页. 在开发者注册该服务之后,可将网站的DNS入口记录指向Google,然后Page Speed Service从服务器上抓取内容,采用最佳的Web性能方案重写网页,通过Google在全球部署的服务器将内容展示给终端用户,加快网页载入速度.

Google将关闭Google Labs

- yifan - Solidot
Google宣布将关闭Google实验室,搜索巨人表示此举将帮助他们将精力集中在优先的产品项目上. Google称,关闭Google实验室意味着大部分试验项目将会被放弃,但不是每一个项目都会被抛弃. Google会将部分试验项目整合到其它产品中. Android应用程序如Google Goggles和Google Listen,则将会继续留在Android Market中.

當Google Docs遇上Google Finances

- 沒有暱稱 - 海芋小站
Google Finances是由Google所推出的一個財經服務,裡面記錄了全球的財經資訊,而如果我們要在Google文件中插入這些財經資訊,如某支股票的收盤價,開盤價等資訊,那要怎麼辦到呢. Google其實提供了非常簡單的函式,怎麼用就往下看啦. 其實在Google文件的試算表中,以插入股票為例,只要輸入「=GoogleFinance("股票代碼.tw"; "參數")」就可以了,以鴻海為例,代碼就是「2317」,記得一定要加變成「2317.tw」才可以.

Google Reader将和Google+整合

- Richard - 月光博客
  Google Reader官方博客宣布,即将对Google Reader进行重大改版,并和Google+进行整合,新版本将重新设计,包括friending、following等功能将会被删除. 之前Google Reader的社交功能是和Buzz整合,随着Buzz的关闭,Google Reader的改版有可能会和以前的Buzz一样,将关注和被关注整合到Google+中,然后用户在Google Reader的分享自动同步到Google+.

孤独星球:中国

- mophist - 译言-每日精品译文推荐
来源China Image - Card game, China - Lonely Planet. (译者注:明长城东起鸭绿江畔辽宁虎山,西至祁连山东麓甘肃嘉峪关,是明朝在北部地区修筑的军事防御工程,亦称边墙,区别于由秦始皇所修的万里长城,总长度8851.8公里). 一位喇嘛微笑着走向松赞林寺入口处.