Google 搜尋不簡單,背後的故事、數字大揭密

标签: google 故事 | 发表时间:2012-01-16 16:49 | 作者:sugizo
出处:http://www.techbang.com.tw/
Google 專門介紹搜尋技術的  Inside Search 網站,其中  Under The Hood 網頁是告訴大家 Google 為了讓搜尋更快且更有效率,默默在背後做了多少事情。例如 Google 的索引(index)可是有超過1億GB內容;加入  Google Instant 、 自動完成技術也都是為了加快搜尋速度。

Google  Inside SearchUnder The Hood介紹網頁最近改版了, Under The Hood是讓對 Google 搜尋有興趣的人知道Google在背後默默做了哪些努力。「Under the hood」片面翻譯是打開引擎蓋,語意則是接近「知其然,知其所以然」的意思。

Experiments Lab所做的努力

Google會與使用者一同測試最先進的搜尋技術,當使用者每次進行搜尋,也是在一同參與實驗。

▲Experiments Lab不斷研發改進最新的搜尋技術。

Experiments Lab進行的工作:

  • 自動完成實驗(Auto complete experiments):Google持續嘗試不同的方法以加快 Google Instant呈現結果速度,Google的實驗還包含在打出完整字句前就開始進行搜尋。
  • 搜尋排名實驗(Search Ranking experiments):Google會測試即將推出的最新版運算法改進,幫助使用者找到更高品質的搜尋結果。
  • 使用者介面實驗(User Interface Experiments):當Google推出新功能給全世界的使用者前,會先把主要功能開放給1/100的使用者,你現在可能就已經見到Google即將推出的新功能。
  • 2010年的實驗(Experiments in 2010):Google始終不斷在進行實驗,在2010年已經實現超過6000項特定的搜尋實驗。

搜尋已經是生活中的一部分

身為全球最大的搜尋引擎,你可以想像Google首頁乾淨簡截的白色頁面背後,究竟有多少誇張的數字呢?Google的索引(index)可是有超過1億GB的內容,光是龐大的資料量就得付出許多功夫來整理。

▲Google搜尋背後的小故事。

搜尋背後的小故事:

  • 100萬小時運算:Google花了100萬小時建立索引資料(index)。
  • 每天10億次 搜尋次數:Google每天要處理超過10億次搜尋。
  • 4500億個獨特查詢:自從2003年以來,Google回答了4500億個新的獨特查詢(也就是Google以往從沒見過的關鍵字搜尋)。
  • 1000人工年:Google花上超過1000人工年(1000 man-years,意旨1000個人工作1年、或1人工作1000年)進行Google搜尋演算法的開發。
  • 閃電般的預覽速度:Instant Preview的平均載入時間只需要1/10秒。
  • 獨特查詢:每天都會出現20%的獨特查詢(unique queries,以往沒見過的關鍵字搜尋)。
  • 跨越1500英里的回答:每個搜尋平均要跨越1500英里的距離取得答案,回到使用者的電腦中。
  • 索引規模:過去數年間Google索引內容增加超過數10億個, Coffeine索引的內容也超過1億GB。

快!還要更快!

Google每天處理超過10億則來自世界各地的查詢,平均回覆搜尋結果為0.25秒,如何更快、更有效率的搜尋就是一大挑戰。

▲Google搜尋的平均回覆時間為0.25秒。

Google的快速搜尋理念:

  • Google知道等待是多麼令人洩氣:這就是Google為何希望能瞬間顯示搜尋結果的原因,更好的是,Google希望能幫助使用者在輸入關鍵字每個字母(或講話)的瞬間就進行搜尋,並立即顯示搜尋結果。
  • Google持續加快搜尋引擎的速度:除了漂亮的程式碼之外,Google在全球建立的分佈式計算系統(distributed computing systems),確保使用者可到更快的回應時間。隨著 自動完成(autocomplete)Google Instant等技術,Google能在使用者打好關鍵字之前就找出搜尋結果。此外Google也不斷抓取網路上的內容,確保使用者在幾分鐘內即可找到最新的新聞、部落格、以及狀態更新。在 Realtime search加入後,也能在事件發生後隨即提供即時話題內容。
  • 即時搜尋(Realtime search)案例,以 2011年埃及革命為例:2011年1月28日,埃及的示威抗議過了3天之後,網路上包含埃及「Egypt」這個字的Tweet推特訊息超過24萬5千則。Google也在48小時內增加索引加入1000萬個相關的部落格文章、以及22,350個相關的新聞結果。

隨時、隨地都能搜尋

過去2年間,Google在手機等行動裝置的搜尋量,比起桌上型電腦的Google搜尋增加5倍,使用者已經不侷限在桌上型電腦前進行搜尋,而是隨時隨地都會進行搜尋。Google針對iOS、Android平台推出多款應用程式,讓使用者在外也能立即進行搜尋。

▲Google提供了iOS、Android系統多款應用程式,可快速查詢到需要的內容。

資料、圖片來源: Under The Hood

延伸閱讀:

Google 搜尋再進化,讓你挖出 Google+ 訊息、照片和用戶

專訪 Google 台灣總經理簡立峰,談網路搜尋難題

用 Google 畫函數圖,幫你寫數學作業,還能畫愛心做告白

Google 在 Inside Search 大會宣佈 3大新搜尋功能

Google 以圖搜尋 繁中版上線,有圖就幫你找到人

Google Instant 搶先體驗,台灣在地版隨打即搜!

加入T客邦Facebook粉絲團

相关 [google 故事] 推荐:

Google 搜尋不簡單,背後的故事、數字大揭密

- - T客邦
Google 專門介紹搜尋技術的  Inside Search 網站,其中  Under The Hood 網頁是告訴大家 Google 為了讓搜尋更快且更有效率,默默在背後做了多少事情. 例如 Google 的索引(index)可是有超過1億GB內容;加入  Google Instant 、 自動完成技術也都是為了加快搜尋速度.

不是谁都能做地图:Google地图背后的故事

- - VooSee - 拮取生活中的彩虹
在每张Google地图的背后,都有一张肉眼不可见的地图,正是这张隐藏地图隐含着真实地理位置的逻辑:哪些地方不能左转,哪些是高速公路匝道,限速要求和实时路况等等. 正是这些数据让Google为你提供导航成为可能. 上周,Google请我去参观这张隐藏地图背后的构建机制,这是Google首次向外界披露这项名为Ground Truth或者GT(地面实况)的计划到底是怎么回事.

差点死掉的「翡翠海计划」到Google+,背后的故事

- llpazxj - 36氪
一年多前我写过一篇 Google Me 的文章,里面有一份 Google 内部流出的「The Real Life Social Network」投影片. 但大伙不知道的,是从那里到今天一出发就声势如此浩大的 Google+,中间发生了什么事. 昨天一名曾经参与「翡翠海计划」,也就是 Google+ 前身的工程師,突然跑出來把背后整个故事补齐了,里面有很多值得创业者参考的地方.

10個 Google 早期的趣味小故事,員工出書爆料

- 文竹 - T客邦
Google 第59號員工 Doug Edwards (Douglas Edwards) 新書「I'm feeling Lucky」已經在美國上市,裡面有許多關於 Google 早期的一些趣味小故事,有別於相關的科技新聞,這些小故事能讓人更明白 Google 擁有什麼樣的文化,現在就讓我們來看看這10個小故事吧.

Google是如何让照片管理工具“Stories”学会讲故事的?

- - 36氪
“ Stories” 是Google+上一个很棒的照片管理工具,由Google 的社交网络工程师Joseph Smarr 负责. Stories 希望人们把所拍的照片都上传到网上,并自动将其生成为一个 由一系列照片讲述而成的故事. 也许Stories 所提供的功能听起来很简单——对人类而言,叙事能力是很自然的一件事.

谷奥: Google = Google+

- 吞佛 - 谷奥聚合——谷奥主站+谷安 aggregator
在上周举办的Google Zeitgeist 2011大会上,John Battelle问Larry Page:在Google大部分的历史里,人们会想到搜索,那么Google品牌=搜索. 但在随后Google的发展史里,Google品牌会等于什么. Larry Page并未直面回答这个问题,至少没有从市场角度来回答.

Google宣布Google CDN

- way - Solidot
Google宣布了最新的帮助加快互联网速度的工具Page Speed Service,加快静态网页的载入速度,不支持动态网页. 在开发者注册该服务之后,可将网站的DNS入口记录指向Google,然后Page Speed Service从服务器上抓取内容,采用最佳的Web性能方案重写网页,通过Google在全球部署的服务器将内容展示给终端用户,加快网页载入速度.

贪的故事

- Andre - 白板报
跟公务员一起吃饭有三个永恒的话题:房,车,贪. 他们谈起房和车固然兴奋,但只有谈起身边哪个小官又落马时才会眉飞色舞. 我发现,他们喜欢谈的话题不是大贪大腐,那个自有全国媒体去关注,而是“三小”案件. 所谓“三小”是指“小工程、小项目、小干部”. 因为小,往往不会被马上双规,这为小干部赢得了时间,他们会对纪检部门说,“我现在想不起来了,等回家好好梳理梳理.

Scrum的故事

- Philip - 《程序员》杂志官网
2001年2月,17位敏捷先驱齐聚犹他雪鸟度假村,起草《敏捷宣言》的时候,Scrum只是众多方法中不太起眼的一个. 十年之后,Scrum却成为最流行的敏捷方法,几乎成为敏捷的代名词. 本文来介绍下Scrum的两位创始人——Jeff Sutherland与Ken Schwaber. 大家可能不会想到,Jeff Sutherland的第一份工作居然是美国空军战斗机飞行员,还曾于1967年获得了“壮志凌云”称号,完成过100次飞越北部越南的作战任务.

Google将关闭Google Labs

- yifan - Solidot
Google宣布将关闭Google实验室,搜索巨人表示此举将帮助他们将精力集中在优先的产品项目上. Google称,关闭Google实验室意味着大部分试验项目将会被放弃,但不是每一个项目都会被抛弃. Google会将部分试验项目整合到其它产品中. Android应用程序如Google Goggles和Google Listen,则将会继续留在Android Market中.