论文：Hadoop在Facebook的实时应用

- Adam - NoSQLFan

Facebook在其最新的消息系统中使用了HBase，这已经不是什么新闻了，而HBase与其基础设施HDFS也因此越来越受追捧，下面是Facebook在SIGMOD 2011大会上发表的论文，描述了Hadoop系列工具在Facebook中的应用情况. Facebook为何选择了Hadoop和HBase.

Facebook的实时Hadoop系统

- wangjia - Solrex Shuffling

Facebook 在今年六月 SIGMOD 2011 上发表了一篇名为“Apache Hadoop Goes Realtime at Facebook”的会议论文 (pdf)，介绍了 Facebook 为了打造一个实时的 HBase 系统使用到的独门秘技. 由于该论文提到的应用场景与小弟负责的系统要解决的问题域有相似之处，因而抽时间仔细阅读了这篇论文.

在今年的SIGMOD‘11上，Facebook又发了一篇新paper（点此下载），讲述了它们在提高Hadoop实时性上的工作及其应用. 简单来讲，他们的项目需求主要有：. Elasticity（伸缩性）. High write throughput（高写吞吐量）. Efficient and low-latency strong consistency semantics within a data center（单个data center内高性能、低延迟的强一致性）.

Amazon、Facebook、Yahoo 都愛 Hadoop！掌握 Hadoop 包你人見人愛

- - TechOrange

這可是 Hadoop 官網上的代表吉祥物喔，也是 Hadoop 的 Logo. 是個新造的字，也象徵了一個新時代的來臨. 「Hadoop」是其原創者 Doug Cutting 新造的名詞，字典裡並沒有這個英文單字. Doug Cutting 曾表示，Hadoop 這個名稱的由來，是來自於自己小孩所擁有的一隻絨毛填充黃色大象玩具.

Facebook使用Corona提升Hadoop的可伸缩性

- - InfoQ cn

Facebook已经开源了Corona，这是一款内部开发的用以改善Hadoop MapReduce调度的软件. Corona将集群管理和作业跟踪这两个关键任务分开. 这与 Apache YARN在概念上不谋而合，YARN也是MapReduce调度器和资源管理器的一个改进版本. Facebook的工程团队发表了一篇文章来解释Corna及其背景.

Hadoop Streaming 编程

- - 学着站在巨人的肩膀上

Hadoop Streaming是Hadoop提供的一个编程工具，它允许用户使用任何可执行文件或者脚本文件作为Mapper和Reducer，例如：. 采用shell脚本语言中的一些命令作为mapper和reducer（cat作为mapper，wc作为reducer）. 本文安排如下，第二节介绍Hadoop Streaming的原理，第三节介绍Hadoop Streaming的使用方法，第四节介绍Hadoop Streaming的程序编写方法，在这一节中，用C++、C、shell脚本和python实现了WordCount作业，第五节总结了常见的问题.

您可能还喜欢：
Facebook为何选择了Hadoop和HBase	下一代Hadoop MapReduce	HBase运维碎碎念	HBase 文件结构图	图形化理解 HBase 数据写操作、压缩操作过程
无觅

论文：Hadoop在Facebook的实时应用

相关 [论文 hadoop facebook] 推荐：