探访谷歌数据中心内部的秘密:服务器自主设计
谷歌技术员麦克巴哈姆安装一块主板(腾讯科技配图)
腾讯科技讯(林靖东)北京时间10月20日消息,据国外媒体报道,史蒂文列维(Steven Levy)是第一位有幸进入谷歌数据中心的记者。他将自己的亲身经历娓娓道来,令读者有种身临其境的感觉。
列维写道:“谷歌数据中心门口有一个标识牌,注明如果没有戴耳塞或耳套就不得入内。你可以使用自动出货机吐出的橙红色耳塞或佩戴象机场地勤人员佩戴的那种头盔。我们戴好耳塞,卡瓦(Kava)将手抬起来对准安全扫描器进行身份验证,然后厚重的大门就打开了。然后我们就走进这个充满数据的世界。”
但是正如列维在他的文章末尾所指出的那样,谷歌仍然将它的数据中心帝国看作是它在网络竞争中掌握的最重要的一项优势,它仍然决定不向竞争对手透露它的最新技术。数据中心技术成熟后,谷歌可能会向外界分享它的一点点技术成果,但最新的研发成果只有它自己掌握。谷歌基础设施主管乌尔兹霍尔泽(Urs Holzle)称:“我们尽可能保持开放性,但前提是不能失去我们的竞争优势。我们将传播思想,而不是行为。”
在过去的几年里,我们对谷歌网络了解了很多,它被公认为最先进的网络业务。但是我们不知道的东西还有很多。最明显的是,谷歌一直对其数据中心帝国中使用的联网技术守口如瓶。它只说想要开发自己的服务器。与Facebook等大型网络公司一样,它没有透露它在全球运行着多少台服务器。
这些问题的答案都值得探寻,因为谷歌是整个技术行业的巨无霸。它的数据中心建设总是领先于行业,当那些数据中心建设方法或技术被披露出来后,立刻就会被整个行业采用。
现在,谷歌 联网设置中存在着巨大问题。今年秋季,谷歌承认它正在设计定制 联网设备,利用OpenFlow开源协议在数据中心之间传递信息。但是这种技术与在计算设备中传递信息的 联网技术是不同的。我们在今年夏季的时候曾采访过霍尔泽,但他当时拒绝谈论相关事宜。
谷歌所有的 联网设备都是它自己设计的,这已经是公开的秘密。据谷歌前工程师JR李沃斯(JR Rivers)称,谷歌从2005年起就开始设计自己的 联网设备了。今年2月,一台名为Pluto Switch的神秘 联网设备的照片出现在一个不知名的论坛上,那些照片显然是发错了地方。从照片泄露的信息来看,那似乎是谷歌在3年前开发出来的一台廉价的交换机,但谷歌仍然没有公开关于那台设备的任何信息。
有人怀疑谷歌已经在其数据中心中使用了一种全新的光纤 联网交换机,但这似乎不大可能。对于在服务器之间短程传输数据来说,光纤交换机的成本一直都太高。而且要想用光纤交换机替代铜线交换机,还需要解决一些技术上的难题。
目前还不清楚谷歌是否在其数据中心中使用了OpenFlow技术。据推测,这是谷歌内部业务的很大一部分内容。但谷歌也可能会采用某种虚拟 联网方案和Nicira提供的虚拟化技术。Nicira最近刚刚被虚拟化厂商VMware以12.6亿美元的价格收购。
鉴于OpenFlow是一种远程管理网络硬件的技术,虚拟化联网技术让你可以只利用软件就能架设其复杂的网络,这样就可以更容易地在数据中心内部调整数据的流向。在谷歌的各个数据中心之间传送信息的广域网上,谷歌使用了它与Nicira合作开发的一款网络控制器。
现在,谷歌已经坦言承认它自己的服务器都是它自己设计的这一事实。它在2009年的时候对外公布了某些设计。但在过去的3年里,它可能又开发了不少的新设备,至于到底有多少,谁也说不清楚。谷歌发言人对我们说,至少谷歌开发的一些最新的服务器设计可以在这段视频中看到。
截至上个月,我们已经知道谷歌为它的部分服务器配备了GPS设备和原子钟,以协助构建其全球性数据库Spanner。是的,GPS设备和原子钟。 上周,谷歌工程师杰夫迪恩(Jeff Dean)在洛杉矶召开的一次系统工程师会议上对我们说,这些设备相对更廉价一些,可能每台设备的成本只有几千美元。
我们仍然不知道谷歌到底运行着多少台服务器。列维认为这个数据并不重要。 他写道:“走在庞大的数据中心内部,我意识到那是一个庞大的天文数字。即便可以数清楚,那个数字基本上也是毫无意义的。现在的设备配备着多核心处理器和其他先进组件,它们的处理能力和功能不知道比以前提高了多少倍。 谷歌现在的一台服务器也许相当于以前的20台服务器。无论如何,谷歌已经在使用群集技术了。” 他的说法也有一定的道理,但是从另一个角度来说,谷歌运行的服务器数量仍然是重要的。
由于谷歌的服务器都是它自己设计的,而且它运行着云服务,这将推动全球硬件市场发生巨大的变化。据英特尔的狄安布莱恩特(Diane Bryant)称,谷歌现在是英特尔的第五大服务器芯片客户,这明显说明谷歌已经成为全球最大的硬件制造商之一,它正在蚕食戴尔和惠普等厂商的业务。
显然,谷歌在制造它自己设计的设备时需要与外部厂商签订合同。这就会鼓励许多其他的公司如Facebook和高盛等直接到谷歌的原设备厂商处设计它们自己的硬件。 但是在今年夏天的时候,霍尔泽对我们说,谷歌没有必要将所有的设备都交给原设备厂商来制造。也许谷歌将通过加拿大、墨西哥或是南美洲的一家代工厂商来制造它的设备。 从目前的情况来看,加拿大厂商Celestica就是一个很好的选择。
那么谷歌运行着多少个数据中心呢? 它在美国拥有6个数据中心,在欧洲有3个数据中心,还有4个数据中心正在建设之中(其中有3个在建的数据中心位于亚洲,1个位于南美洲)。 但谷歌没有透露它通过与其他公司合作获得使用权的数据中心有多少个。
另一个重要的问题是,谷歌正在对其基础设施进行维护。那也是一个秘密。