Twitter 是如何为硬件故障做准备的

标签: 新闻 | 发表时间:2016-01-02 11:10 | 作者:Matthew Lynley
出处:http://techcrunch.cn
twitter-down

在理想的情况下,Twitter 的基础设施与运营总监马兹达克·哈希米(Mazdak Hashemi)可以走到公司的数据中心,然后拔掉其中一台服务器的电源线,这时公司的服务也不会受到影响。虽然他现在还不会这么做,但是他和他的团队一直在研究如何在 Twitter 内部模拟类似的故障,同时确保服务能够维持正常运行。

“在如此大的服务规模之下,我们的基础设施有可能会出现各种各样的问题,我们随时都可能出现断电、机架故障、配置不当或者网络故障。”哈希米说道,“所以我们开始思考,除了面对突如其来的故障以外,检测故障的最佳方式是什么。”

他的工程团队基本上设计了一系列的测试,他们会以可控的方式向系统注入故障,模拟上面提到的情况。这样做的目的是确保所有工作人员可以为各种意外故障做好准备,比如服务器宕机,或者电源线意外脱落导致整个服务器节点离线。

Twitter 会在服务中注入一些小型的故障,测试运行系统和基础设施的反应。它会监控 Twitter 服务的系统健康状况,确保不会有全站规模的故障发生,然后回滚之前注入的故障状态。在整个测试过程当中,这支团队还可以使用一系列的工具来了解系统的情况。他们希望可以监控服务器集群出现断电,或者在写入新配置的时候出现断网的问题。

screen-shot-2015-12-14-at-2-40-59-pm

以上都是 Twitter 内部应急工具的一部分,确保 Twitter 在任何情况之下都不会束手无策。“失败鲸”(Fail Whale)曾经是 Twitter 网站上的常驻吉祥物,不过现在 Twitter 正不遗余力地避免这条鲸鱼再次出现。

最终这个工具有望会被开源,这样就可以让开发者社区找到更多的使用方式,甚至对它进行改进。“Twitter 与其他公司的区别在于——我们的所有东西都是实时的。”哈希米说道,“我们不会说‘你去准备黑色星期五,你去准备超级碗。’其他人想到某些日子将要来临的时候就会做准备,但是对我们来说,每一天都可以是黑色星期五,每一天都可以是超级碗。我们的网站是充满不确定性的,世界这么大,什么事情都有可能发生。”

这些测试的意义当然不止如此。如果仅仅是为了测试的话,他们随时都可以拔掉 服务器的网线来测试服务能否继续运行。这些测试的目标是为了确保每个团队都能准备好应对任何级别的真正事故。

“我希望终有一天可以在数据中心里随便拔掉一条电线,然后看看会发生什么事情。”哈希米说道,“我今天会这么做吗?也许不会,不过我现在还不想这么做。我对部分情况还是比较放心的,但是如果故障的层级越高,它所造成的影响也会越大。我们团队的终极考验是,当我们在数据中心随意拔掉各种线缆的时候,系统能否保持安然无恙。”

题图来自:Bryce Durbin

翻译:关嘉伟( @consideRay

A Look At One Way Twitter Prepares For Hardware Failures

相关 [twitter 硬件] 推荐:

Twitter 是如何为硬件故障做准备的

- - TechCrunch 中国
在理想的情况下,Twitter 的基础设施与运营总监马兹达克·哈希米(Mazdak Hashemi)可以走到公司的数据中心,然后拔掉其中一台服务器的电源线,这时公司的服务也不会受到影响. 虽然他现在还不会这么做,但是他和他的团队一直在研究如何在 Twitter 内部模拟类似的故障,同时确保服务能够维持正常运行.

Twitter 中文版

- 幻幽 or A書 - Gea-Suan Lin's BLOG
前幾天 Twitter 推出了中文版 (包括繁體與簡體):「Five new languages」. 對岸的市場可能還是進不去,但在台灣會加速 Plurk 的死亡… 從 Google+ 的出現以後就愈來愈明顯了,現在 Microblogging 的大魔頭再加入戰局,應該會更快….

Twitter和Facebook合作

- Woooon - cnBeta.COM
很重磅的新闻,两大社交网络巨头开始有合作了. Twitter 今天在用户的个人档案页面添加「Post Tweets to Facebook」按钮,让用户快速将自己的 Tweets 同步到 Facebook 状态中去.

twitter-mysql改进点

- - CSDN博客推荐文章
目前最新的twitter-mysql版本基于mysql5.5.22,以下总结了一些比较明显的改进点,大部分已经亲自证实,其他一些诸如修复的比较次要的问题(例如编译问题)这里暂不列出,可以详细参阅 https://github.com/twitter/mysql/wiki/Change-History .

Tribalfish = Twitter + 博客 + 论坛

- Kofai - 36氪
在网络上讨论流行话题有多重选择,你可以在Twitter上追踪话题或名人,也可以在博客上分享经验,更可以在论坛上你来我往,不过,Twitter上的讨论不够深入,博客讨论足够深入又不够及时,Tribalfish 就是集以上讨论工具的大成. 注册登陆后,你会看到好像论坛的界面,只是,不同于一般的论坛界面必须前后查找不同的话题,开启一页又一页的分布,Tribalfish让你可以仪在原页,直接点选感兴趣的内容,并在右方预览,也可以点选分享人的名字后追踪该使用者,这些设计也很像Twitter.

回顾 Twitter 的演变史

- tiansiyuan - 爱范儿 · Beats of Bits
2011 年 3 月后,Twitter 度过了五岁生日. 这只小鸟的飞行速度没有减缓,事实上,Twitter 在 4 月份的动作还挺多. Twitter  推出了新的网页版本,更加时尚的设计,主动推荐潜在关注对象;. “本地趋势”功能拓展到了 70 多个城市和国家;. 新的搜索工具,帮助人们更方便地去寻找新用户.

修改Hosts访问Twitter/Facebook

- cheng - 启光博客
  以前没感觉Facebook多么特别,最近又玩了一些日子,感觉还不错. 因为关注Facebook所以对最新Hosts比较关注,今天发现一个网友整理的,测试可直接使用. 虽然一直在文章中说以后不再发布类似的文章,不过没忍住,网友低调点使用吧,希望对经常访问Twitter与Facebook的网友有此帮助.

Twitter API中文文档

- Jacob - 月光博客
  目前的国内的微博客很多,不少微博客都提供Open API,然而,很多微博提供的API和Twitter的API有一些或多或少的差别,调用格式上并不完全相同.   我建议所有提供API的微博客系统,都将各自的API统一为Twitter的API调用格式,例如目前较有影响的开源微博系统StatusNet(Laconica)的API格式就完全兼容Twitter,这种统一API对于开发者和用户都有很大的好处.

Twitter估值84亿美元

- vieplivee - Solidot
《华尔街日报》报导(中文),Twitter宣布获得俄罗斯风投公司Digital Sky Technologies牵头的一笔融资,这笔约8亿美元的投资将Twitter估值推高至84亿美元. 报导引用消息人士的话称,此轮融资将部分用于收购现有股东的持股:一半的投资将用于Twitter,而另一半4亿美元将被用来收购现有股东持有的股份.

向Twitter Bootstrap 学习什么?

- junyu - 知乎的博客
什么是 Twitter Bootstrap. Twitter 有一位风格清新的设计师 Mark Otto(此人之前在 Zurb)[1],他负责了很多 Twitter 非前台的页面设计,比如 Dev、Support 和 Promoted Products 的设计. 去年,Mark 在自己网站发布了一套基于 Less [2] 框架的工具合集(mixins)—— Bootstrap.less [3],方便前端开发(静态部分).