Facebook的Realtime Hadoop及其应用

- Version - 并行实验室 | Parallel Labs

在今年的SIGMOD‘11上，Facebook又发了一篇新paper（点此下载），讲述了它们在提高Hadoop实时性上的工作及其应用. 简单来讲，他们的项目需求主要有：. Elasticity（伸缩性）. High write throughput（高写吞吐量）. Efficient and low-latency strong consistency semantics within a data center（单个data center内高性能、低延迟的强一致性）.

Google Realtime Search 加入 Quora、Gowalla、Facebook 等实时信息源

- Tian - 谷奥——探寻谷歌的奥秘

Google Realtime Search最近加入了一些新的实时信息源，除了最初的Twitter之外，增加了Quora、Gowalla等网站. Quora里已经有了关于这个问题的解答，貌似Quora是今天才刚刚出现在Google实时搜索里的，包括问题、额外问题、对问题的投票和提交的答案，这对Quora来说显然是个好消息.

Facebook的实时Hadoop系统

- wangjia - Solrex Shuffling

Facebook 在今年六月 SIGMOD 2011 上发表了一篇名为“Apache Hadoop Goes Realtime at Facebook”的会议论文 (pdf)，介绍了 Facebook 为了打造一个实时的 HBase 系统使用到的独门秘技. 由于该论文提到的应用场景与小弟负责的系统要解决的问题域有相似之处，因而抽时间仔细阅读了这篇论文.

论文：Hadoop在Facebook的实时应用

- Adam - NoSQLFan

Facebook在其最新的消息系统中使用了HBase，这已经不是什么新闻了，而HBase与其基础设施HDFS也因此越来越受追捧，下面是Facebook在SIGMOD 2011大会上发表的论文，描述了Hadoop系列工具在Facebook中的应用情况. Facebook为何选择了Hadoop和HBase.

Amazon、Facebook、Yahoo 都愛 Hadoop！掌握 Hadoop 包你人見人愛

- - TechOrange

這可是 Hadoop 官網上的代表吉祥物喔，也是 Hadoop 的 Logo. 是個新造的字，也象徵了一個新時代的來臨. 「Hadoop」是其原創者 Doug Cutting 新造的名詞，字典裡並沒有這個英文單字. Doug Cutting 曾表示，Hadoop 這個名稱的由來，是來自於自己小孩所擁有的一隻絨毛填充黃色大象玩具.

Google Realtime出现404错误

- lube - Solidot

hidenosense 写道 "我的Google搜索页面左边工具栏里的realtime没了. 直接打开http://www.google.com/realtime返回404.

Facebook使用Corona提升Hadoop的可伸缩性

- - InfoQ cn

Facebook已经开源了Corona，这是一款内部开发的用以改善Hadoop MapReduce调度的软件. Corona将集群管理和作业跟踪这两个关键任务分开. 这与 Apache YARN在概念上不谋而合，YARN也是MapReduce调度器和资源管理器的一个改进版本. Facebook的工程团队发表了一篇文章来解释Corna及其背景.

Hadoop Streaming 编程

- - 学着站在巨人的肩膀上

Hadoop Streaming是Hadoop提供的一个编程工具，它允许用户使用任何可执行文件或者脚本文件作为Mapper和Reducer，例如：. 采用shell脚本语言中的一些命令作为mapper和reducer（cat作为mapper，wc作为reducer）. 本文安排如下，第二节介绍Hadoop Streaming的原理，第三节介绍Hadoop Streaming的使用方法，第四节介绍Hadoop Streaming的程序编写方法，在这一节中，用C++、C、shell脚本和python实现了WordCount作业，第五节总结了常见的问题.

Hadoop使用（一）

- Pei - 博客园-首页原创精华区

Hadoop使用主/从（Master/Slave）架构，主要角色有NameNode，DataNode，secondary NameNode，JobTracker，TaskTracker组成. 其中NameNode，secondary NameNode，JobTracker运行在Master节点上，DataNode和TaskTracker运行在Slave节点上.

Hadoop MapReduce技巧

- - 简单文本

我在使用Hadoop编写MapReduce程序时，遇到了一些问题，通过在Google上查询资料，并结合自己对Hadoop的理解，逐一解决了这些问题. Hadoop对MapReduce中Key与Value的类型是有要求的，简单说来，这些类型必须支持Hadoop的序列化. 为了提高序列化的性能，Hadoop还为Java中常见的基本类型提供了相应地支持序列化的类型，如IntWritable，LongWritable，并为String类型提供了Text类型.

Facebook的Realtime Hadoop及其应用

相关日志

相关 [facebook realtime hadoop] 推荐：