Facebook运维内幕曝光:一人管理2万台服务器

标签: facebook 内幕 曝光 | 发表时间:2013-11-22 05:18 | 作者:
分享到:
出处:http://www.iteye.com


目前,Facebook 已经凭借它在网络基础建设上的可扩展能力成为了行业的领军者。Facebook 数据中心运维主管 Delfina Eberly(图中人物) 在“7x24 Exchange 2013 秋季会议”上的演讲中为我们透露了 Facebook 部分内部运维数据,下面我们来具体了解下。

服务器数量惊人,一人管理 2 万台

Facebook 服务器数量惊人,其硬件方面的工作重点主要放在“可服务性”上,内容也涉及服务器的初期设计,一系列工作的目标就是为了保证数据机房的设备维修最简单、最省时。她介绍说,每个 Facebook 数据中心的运维工作人员管理了至少 20,000 台服务器,其中部分员工会管理数量高达 26,000 多个的系统。

近期 Facebook 的服务器与管理人数比又创下了新高,目前已经超过 10000:1,可以查看文章 高扩展性对此进行更加详细的了解。

大数据汹涌,运维工作不轻松

在 Facebook 数据中心做运维工作并不轻松,对工作人员的能力要求很高。他们每天面对的是海量数据。

据统计,Facebook 目前拥有 11.5 亿用户,日常登录用户约 7.2 亿。每天 Facebook 用户分享的内容达到 47.5 亿条,“赞”按钮点击次数近 45 亿次。Facebook 目前存储了 2400 亿张照片,每月照片存储容量约增加 7 PB(注,单位换算:1PB=1024TB)。

自动故障诊断系统:原为留住人才

为了管理运维工作,Facebook 已经开发了相应软件来自动化处理日常运维任务,如 CYBORG 可自动检测服务器问题并进行修复。如果 CYBORG 无法自动修复检查出的问题,系统将自动给订单系统发送警告,并分派给数据中心工作人员,以对相应问题进行详细追踪与分析。

Eberly 提到,自动化工作的目标是尽量避免将技术人员派往现场解决问题,除非必须对服务器进行现场处理。强调自动化不是因为 Facebook 对打造无人数据中心感兴趣,原因在于 Facebook 重视自己的员工。

Eberly 解释说:我们要留住人才,因为大家更喜欢高水平的任务,公司希望让他们留下来与我们一起进步成长,这对 Facebook 来说至关重要。

“可服务性”主导服务器设计:节时 54%

在 Facebook,运维团队的时间与工作量是根据 Facebook 硬件设计来安排的。比方说,全部服务器从头开始就坚持“可服务性”这一原则来进行设计,那么数据中心的工作人员就没有必要老钻机房了;服务器被设计成无需工具就可以对磁盘和组件进行替换。这样做的结果就是:Facebook 用来修理服务器的时间减少了 54%。

Eberly 介绍说,Facebook 运维团队会仔细跟踪设备故障率,这一数据会为公司的采购提供参考。公司的财产管理和订单系统用序列号来跟踪硬盘和其他组件,这方便完整了解每个硬件的生命周期。

Eberly 还提到,虽然这些系统很复杂,但并不需要太多开发者。Facebook 的运维团队仅有 3 名软件工程师,但他们对数据中心的工作来讲至关重要。

最后

从 Eberly 的介绍中,我们可以看到 Facebook 在可扩展性网络建设上的实力。同时,这也为行业提供了一些可参考的经验,如:开发自动故障系统,根据“可服务性”设计基础架构。同时,运维也是一个系统工程,需要得到其他部门的配合支持才行。

Via Datacenterknowledge

感谢 tuhaihe 投递这篇资讯

已有 0 人发表留言,猛击->> 这里<<-参与讨论


ITeye推荐



相关 [facebook 内幕 曝光] 推荐:

Facebook运维内幕曝光:一人管理2万台服务器

- - ITeye资讯频道
目前,Facebook 已经凭借它在网络基础建设上的可扩展能力成为了行业的领军者. Facebook 数据中心运维主管 Delfina Eberly(图中人物) 在“7x24 Exchange 2013 秋季会议”上的演讲中为我们透露了 Facebook 部分内部运维数据,下面我们来具体了解下. 服务器数量惊人,一人管理 2 万台.

Facebook iPad应用曝光(图)

- Brant - 36氪
Facebook实际上已经有iPad应用了,就隐藏在iPhone应用的代码中. MG Siegler已经用了一个晚上了. 他说感觉还不错,虽然Facebook最终发布该应用时不一定跟他现在用的一样,但至少他觉得这个应用的感觉是对的. 据MG的几个消息来源称,他们已经看过这个应用,并且这就是Facebook近期打算发布的.

新版新浪微博曝光,类似Facebook

- Titian - GeekPark 捕风捉影
36氪获取到了即将发布的第4版新浪微博(目前大家使用的是第三版v3)的截图. 从这张首页截图来看,新版的新浪微博的设计更加像是一个类似Facebook 的SNS了,而不是Twitter. 新版的新浪微博开始采用SNS 经常采用的3栏模式,并且顶部也有一个时下流行的灰黑色条(36氪、Google+、Twitter都采用了这一设计).

今日头条: Facebook iPhone版照片共享App更多细节曝光

- PH囧ENIX - Tech2IPO
两天前,笔者曾向大家爆料Facebook即将发布iPhone版照片共享App. , 当时笔者也觉得那篇文章还不够给力,因为仅仅凭借一张图片的确没有什么说服力. 所以,写那篇爆料之时,笔者向大家承诺,一旦有任何最新消息,一定及时和大家分享. 现在是北京时间6月17日凌晨1点05分,终于笔者盼来了大家期待的更多细节.

Graph Search的内幕故事:搜索业务如何助力Facebook新发展?

- - TECH2IPO创见
今天凌晨,Facebook正式推出了Graph Search服务,在不少人看来,Google、Yelp、LinkedIn等将或多或少地受到这一产品的影响,试想,拥有超过10亿用户以及一万亿以上的用户关系,Graph Search无论在社交平台还是在商业前景上都激起了外界的好奇和希望. 对Facebook的将来又有哪些影响.

天朝粉丝速速学习:天朝超市内幕大曝光

- wuzhez - 天朝娱乐 | 每天开心一下!
以前一直知道超市的肉和熟食生鲜等不新鲜,从来没买过里面的熟食,昨天因为急用,又晚上了,就去超市买了一块肉,看着也不怎么样,想想好歹也是正规超市卖的,就算有问题应该不会太严重吧,可回来打开就一股恶臭扑来,肉已经变乌红,发暗,并且已经开始流水,很郁闷的丢掉了. 上网搜索了一下,一直知道超市的生鲜熟食肉类不新鲜,可天朝的事永远比我们想象的不堪.

央视曝光百度凤巢内幕:市场对“老大”也会说“不”

- sunnyboy.xue - cnBeta.COM
[世华财讯]央视曝光,使得百度再次陷入了舆论漩涡. 而百度如果继续利用此前积累的公信力和市场地位唯利是图、选择短期行为,必将为广大网民所抛弃.

央视曝光百度推广链接内幕真相:诚信与利益 孰轻孰重

- IwfWcf - GeekPark 捕风捉影
2008年12月份,百度宣布推出凤巢系统,以替代遭人诟病的竞价系统. 2009年12月1日,百度正式推出凤巢系统搜索推广专业版. 央视财经频道 报道记者以两家虚构的公司做试验,发现“凤巢搜索推广系统”即“推广链接”,其实质仍然是以出价高低决定搜索结果的排名,只是更不 透明,并且存在估算系统虚高报价、设消费上限却被强制消费、著名商标作为关键词被他人搭车等诸多问题…….

Facebook’s architecture(转)

- Adam - 淘宝JAVA中间件团队博客
Facebook’s HipHop [1] then converts it to C++ and compiles it using g++, thus providing a high performance templating and Web logic execution layer. Some of these services are implemented in PHP, C++ or Java depending on service requirements (some other languages are probably used…).

中国的Facebook?

- Lorna - It Talks--上海魏武挥的博客
腾讯近日很低调地推出了一个名为“朋友”的网络服务(也是一个使用独立域名的网站),这是一个与时下社交网站,比如人人、开心等非常类似的产品. 与它们一样,目前这个“朋友”上也加载了一些应用,当然,一贯的,以腾讯自家出品为主. 而且,我个人以为,未来会有更多的腾讯在QQ这个客户端上的应用,逐步向这个网站迁移.