关于hadoop的入门和进阶文章收录
1 Hadoop http://hadoop.apache.org
2 网上比较权威和受欢迎的大部分是来自 IBM DW 的文章,尤其是那两个经典系列的文章,此外还有一些案例型和实践型的文章与指南,这里集中收录如下:
两篇云计算理论与概念的入门文章/教程:
云计算:基础
概念、优势、挑战和向云计算过渡需要考虑的事情
发布日期: 2012 年 2 月 13 日 (最初发布 2011 年 3 月 18 日)
级别:初级
选择了四星
(14 个评分)
http://www.ibm.com/developerworks/cn/training/kp/cl-kp-cloudfundamentals/
云计算新手?
http://www.ibm.com/developerworks/cn/cloud/newto.html
关于 hadoop的:
用 Linux 和 Apache Hadoop 进行云计算
发布日期: 2009 年 11 月 19 日
级别: 初级
http://www.ibm.com/developerworks/cn/aix/library/au-cloud_apache/
使用 Linux 和 Hadoop 进行分布式计算(简介)
http://www.ibm.com/developerworks/cn/linux/l-hadoop/
系列1:
用 Hadoop 进行分布式并行编程, 第 1 部分
http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop1/index.html
用 Hadoop 进行分布式并行编程, 第 2 部分
http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop2/index.html
用 Hadoop 进行分布式并行编程, 第 3 部分
http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop3
系列2:
用 Hadoop 进行分布式数据处理,第 1 部分: 入门
http://www.ibm.com/developerworks/cn/linux/l-hadoop-1
用 Hadoop 进行分布式数据处理,第 2 部分: 进阶
http://www.ibm.com/developerworks/cn/linux/l-hadoop-2
用 Hadoop 进行分布式数据处理,第 3 部分: 应用程序开发
http://www.ibm.com/developerworks/cn/linux/l-hadoop-3
hadoop@yahoo
http://developer.yahoo.com/hadoop/
The hadoop distributed file system
http://developer.yahoo.com/hadoop/tutorial/module2.html
CSDN Hadoop专题
http://subject.csdn.net/hadoop/
iteye hadoop 讨论组
http://hadoop.group.iteye.com/
开源中国 hadoop 频道
http://www.oschina.net/search?q=hadoop&scope=project
stackoverflow 上的hadoop问答
http://stackoverflow.com/search?q=hadoop
另外,看到其他网友推荐的文章:
Michael G. Noll
http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/
http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-multi-node-cluster/
分布式文件系统
http://www.cnblogs.com/duguguiyu/archive/2009/02/22/1396034.html
分布式计算(Map/Reduce)
http://www.cnblogs.com/duguguiyu/archive/2009/02/28/1400278.html
hadoop安装
http://www.cnblogs.com/wayne1017/archive/2007/03/20/678724.html
http://blog.sina.com.cn/s/blog_62186b4601011c6a.html
http://blog.chinaunix.net/uid-128922-id-289987.html
hadoop教程
hadoop笔记
http://www.cnblogs.com/Dreama/category/307220.html
ps:
我最早是在09年底了解和安装过hadoop,当时正好有庞大的cluster资源可用,可惜只是局限于学习,没有在正式项目中使用。 如今随着nosql的发展,以及ssd硬件发展,一种使用ssd硬盘+大内存+nosql+hadoop平台的基因组序列分析套件成为可能性! 希望有人已经开发出了产品吧。
已有 0 人发表留言,猛击->> 这里<<-参与讨论
ITeye推荐