Hadoop 之父 Doug Cutting 在清华的讲座记录

- - IT瘾-dev

2014年，Hadoop之父Doug Cutting在清华开了一次讲座，当时三个小伙伴一起翘班骑自行车到现场听了这场讲座，很认真地做了笔记. 现在翻出来回顾一下感觉还是有不少感触的，稍加整理分享出来. 整个讲座约一个小时，两点半左右开始，前半个小时左右Doug Cutting 总共大概7张PPT，后半个小时互动.

Doug Edwards 新书里揭露的 10 个 Google 早期趣闻

- Cubic - 谷奥——探寻谷歌的奥秘

第59号Google员工的新书I'm Feeling Lucky上架，昨天我们已经爆了一些书里写的内幕，今天我们再挖一些料出来. Google第6号员工曾经发现有人连续查询了39,000次“this is the CIA”（这里是中央情报局）这个关键字，他以为这是一个试图改进某网站搜索排名的自动机器人在不停的访问同一个搜索结果链接地址，其实这是一个CIA的工作人员不小心将一本书压在了回车键上.

Google 第 59 号员工 Doug Edwards 爆公司早期内幕的书终于上架

- mornlee - 谷奥——探寻谷歌的奥秘

1999年，Doug Edwards成为Google的第59号员工，担任Google首位市场和品牌经理的他似乎跟其他员工看起来与众不同──他当时已经四张儿多了，而且之前是做报纸业务的记者. 这周，Houghton Mifflin开始发行他对Google公司早期的回忆录I'm Feeling Lucky.

Hadoop Streaming 编程

- - 学着站在巨人的肩膀上

Hadoop Streaming是Hadoop提供的一个编程工具，它允许用户使用任何可执行文件或者脚本文件作为Mapper和Reducer，例如：. 采用shell脚本语言中的一些命令作为mapper和reducer（cat作为mapper，wc作为reducer）. 本文安排如下，第二节介绍Hadoop Streaming的原理，第三节介绍Hadoop Streaming的使用方法，第四节介绍Hadoop Streaming的程序编写方法，在这一节中，用C++、C、shell脚本和python实现了WordCount作业，第五节总结了常见的问题.

Hadoop使用（一）

- Pei - 博客园-首页原创精华区

Hadoop使用主/从（Master/Slave）架构，主要角色有NameNode，DataNode，secondary NameNode，JobTracker，TaskTracker组成. 其中NameNode，secondary NameNode，JobTracker运行在Master节点上，DataNode和TaskTracker运行在Slave节点上.

Hadoop MapReduce技巧

- - 简单文本

我在使用Hadoop编写MapReduce程序时，遇到了一些问题，通过在Google上查询资料，并结合自己对Hadoop的理解，逐一解决了这些问题. Hadoop对MapReduce中Key与Value的类型是有要求的，简单说来，这些类型必须支持Hadoop的序列化. 为了提高序列化的性能，Hadoop还为Java中常见的基本类型提供了相应地支持序列化的类型，如IntWritable，LongWritable，并为String类型提供了Text类型.

Hadoop TaskScheduler浅析

- - kouu's home

TaskScheduler，顾名思义，就是MapReduce中的任务调度器. 在MapReduce中，JobTracker接收JobClient提交的Job，将它们按InputFormat的划分以及其他相关配置，生成若干个Map和Reduce任务. 然后，当一个TaskTracker通过心跳告知JobTracker自己还有空闲的任务Slot时，JobTracker就会向其分派任务.

HADOOP安装

- - OracleDBA Blog---三少个人自留地

最近有时间看看hadoop的一些东西，而且在测试的环境上做了一些搭建的工作. 首先，安装前需要做一些准备工作. 使用一台pcserver作为测试服务器，同时使用Oracle VM VirtualBox来作为虚拟机的服务器. 新建了三个虚拟机以后，安装linux，我安装的linux的版本是redhat linux 5.4 x64版本.

Hadoop Corona介绍

- - 董的博客

Dong | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明. 网址: http://dongxicheng.org/hadoop-corona/hadoop-corona/. Hadoop Corona是facebook开源的下一代MapReduce框架. 其基本设计动机和Apache的YARN一致，在此不再重复，读者可参考我的这篇文章 “下一代Apache Hadoop MapReduce框架的架构”.

Hadoop RPC机制

- - 企业架构 - ITeye博客

RPC(Remote Procedure Call Protocol)远程过程调用协议，它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议. Hadoop底层的交互都是通过 rpc进行的. 例如：datanode和namenode 、tasktracker和jobtracker、secondary namenode和namenode之间的通信都是通过rpc实现的.

Hadoop 之父 Doug Cutting 在清华的讲座记录

0x00 前言

0x01 讲座记录

PPT One：Means For Change ： Hardware

PPT Two：Fuel For Change : Data

PPT Three：Seeds For Change ：Open Source

PPT Four：New DataStyle：Hadoop

PPT Five：Style Catches on：Ecosystem

PPT Six：Victor Emerges：Enterprise Data Hub

PPT Seven：The Data Multi-Tool

0x02 现场问答

1.安全问题。

2.relational database和 nosql

3.spark，storm的存在

4.什么是bigdata

5.Cloudera和Hortonworks

0xFF 总结

相关 [hadoop doug cutting] 推荐：