Facebook的实时Hadoop系统

- wangjia - Solrex Shuffling

Facebook 在今年六月 SIGMOD 2011 上发表了一篇名为“Apache Hadoop Goes Realtime at Facebook”的会议论文 (pdf)，介绍了 Facebook 为了打造一个实时的 HBase 系统使用到的独门秘技. 由于该论文提到的应用场景与小弟负责的系统要解决的问题域有相似之处，因而抽时间仔细阅读了这篇论文.

论文：Hadoop在Facebook的实时应用

- Adam - NoSQLFan

Facebook在其最新的消息系统中使用了HBase，这已经不是什么新闻了，而HBase与其基础设施HDFS也因此越来越受追捧，下面是Facebook在SIGMOD 2011大会上发表的论文，描述了Hadoop系列工具在Facebook中的应用情况. Facebook为何选择了Hadoop和HBase.

在今年的SIGMOD‘11上，Facebook又发了一篇新paper（点此下载），讲述了它们在提高Hadoop实时性上的工作及其应用. 简单来讲，他们的项目需求主要有：. Elasticity（伸缩性）. High write throughput（高写吞吐量）. Efficient and low-latency strong consistency semantics within a data center（单个data center内高性能、低延迟的强一致性）.

Amazon、Facebook、Yahoo 都愛 Hadoop！掌握 Hadoop 包你人見人愛

- - TechOrange

這可是 Hadoop 官網上的代表吉祥物喔，也是 Hadoop 的 Logo. 是個新造的字，也象徵了一個新時代的來臨. 「Hadoop」是其原創者 Doug Cutting 新造的名詞，字典裡並沒有這個英文單字. Doug Cutting 曾表示，Hadoop 這個名稱的由來，是來自於自己小孩所擁有的一隻絨毛填充黃色大象玩具.

Facebook使用Corona提升Hadoop的可伸缩性

- - InfoQ cn

Facebook已经开源了Corona，这是一款内部开发的用以改善Hadoop MapReduce调度的软件. Corona将集群管理和作业跟踪这两个关键任务分开. 这与 Apache YARN在概念上不谋而合，YARN也是MapReduce调度器和资源管理器的一个改进版本. Facebook的工程团队发表了一篇文章来解释Corna及其背景.

MySQL添加Hadoop数据实时复制功能

- - searchdatabase

　　MySQL复制操作可以将数据从一个MySQL服务器(主)复制到其他的一个或多个MySQL服务器(从). 试想一下，如果从服务器不再局限为一个MySQL服务器，而是其他任何数据库服务器或平台，并且复制事件要求实时进行，是否可以实现呢?. 　　MySQL团队最新推出的 MySQL Applier for Hadoop(以下简称Hadoop Applier)旨在解决这一问题.

简讯：2013年Hadoop实时查询将成现实

- - 博客 - 伯乐在线

2013年Hadoop实时查询将成现实，Cloudera公司的两个新项目： Impala 和 Trevni，将有助在2013年实现Hadoop实时查询. Impala 是开源版的 Dremel （Dremel 是 Google 大数据查询解决方案，其原理可参见这篇博文《 Google Dremel 原理 – 如何能3秒分析1PB》）.

Google Realtime Search 加入 Quora、Gowalla、Facebook 等实时信息源

- Tian - 谷奥——探寻谷歌的奥秘

Google Realtime Search最近加入了一些新的实时信息源，除了最初的Twitter之外，增加了Quora、Gowalla等网站. Quora里已经有了关于这个问题的解答，貌似Quora是今天才刚刚出现在Google实时搜索里的，包括问题、额外问题、对问题的投票和提交的答案，这对Quora来说显然是个好消息.

真正的将 Google+ 信息流实时自动同步到 Twitter 和 Facebook

- jejer - 谷奥——探寻谷歌的奥秘

虽然我们不能把 Twitter / Facebook 的信息同步到 Google+ 来，但是我们可以反过来在 Google+ 写东西然后分享到别的地方去. 以前我们介绍过一个Chrome扩展可以实现这个，但它只是在你发Google+信息流的时候加一个发送到Twitter的按钮，你还是要点一下手动发消息过去.

基于OGG的Oracle与Hadoop集群准实时同步介绍 - 偶素浅小浅 - 博客园

- -

Facebook的实时Hadoop系统

1. 应用场景和需求

2. 打造实时的 HDFS

2.1 实现 NameNode 的高可用——AvatarNode

2.2 Hadoop RPC 兼容性和数据块可用性

2.3 实时负载的性能优化

2.4 HDFS sync 优化和并发读

3. 打造实时生产坏境的 HBase

3.1 行级别原子性和一致性

3.2 可用性

3.3 性能优化

4. 总结

您可能对这些感兴趣：

相关 [facebook 实时 hadoop] 推荐：