Hoop：Hadoop HDFS的RESTFul封装

Hadoop剖析之HDFS

- - CSDN博客数据库推荐文章

Hadoop的分布式文件系统（HDFS）是Hadoop的很重要的一部分，本文先简单介绍HDFS的几个特点，然后再分析背后的原理，即怎样实现这种特点的. 这是HDFS最核心的特性了，把大量数据部署在便宜的硬件上，即使其中某些磁盘出现故障，HDFS也能很快恢复丢失的数据. 这个的意思是HDFS适合一次写入，多次读取的程序，文件写入后，就不需要修改了.

Hadoop之HDFS子框架

- - CSDN博客云计算推荐文章

由图片可以看到HDFS主要包含这样几个功能组件. Namenode:存储文档的元数据信息，还有整个文件系统的目录结构. DataNode:存储文档块信息，并且文档块之间是有冗余备份的. 这里面提到了文档块的概念，同本地文件系统一样，HDFS也是按块存储的，只不过块的大小设置的相对大一些，默认为64M.

hadoop深入研究:(一)——hdfs介绍

- - CSDN博客云计算推荐文章

转载请注明出处： http://blog.csdn.net/lastsweetop/article/details/8992505. 这里的非常大是指几百MB,GB,TB.雅虎的hadoop集群已经可以存储PB级别的数据. hdfs的高可用是用软件来解决，因此不需要昂贵的硬件来保障高可用性，各个生产商售卖的pc或者虚拟机即可.

Hadoop优化第一篇 : HDFS/MapReduce - leocook

- - 博客园_首页

比较惭愧，博客很久（半年）没更新了. 最近也自己搭了个博客，wordpress玩的还不是很熟，感兴趣的朋友可以多多交流哈. 地址是：http://www.leocook.org/. 另外，我建了个QQ群：305994766，希望对大数据、算法研发、系统架构感兴趣的朋友能够加入进来，大家一起学习，共同进步（进群请说明自己的公司-职业-昵称）.

flume写入hadoop hdfs报错 Too many open files

- - CSDN博客云计算推荐文章

网络搜索，怀疑linux nofile超过最大限制，当前设置大小1024，默认值. 而查看flume进程打开的文件数量为2932（这个比较奇怪，怎么超过1024了呢. 1.修改nfile配置文件，手工增加nofile的大小. 2.重启flume进程，也就是进程29828，问题解决. 作者：hijk139 发表于2013-2-17 16:37:34 原文链接.

Apache Hadoop 1.0.0支持Kerberos验证，支持Apache HBase，提供针对HDFS的RESTful API

- - InfoQ中文站

海量数据框架Apache Hadoop怀胎六年终于瓜熟蒂落发布1.0.0版本. 本次发布的核心特性包括支持Kerberos身份验证，支持Apache HBase，以及针对HDFS的RESTful API. InfoQ就此次发布请Apache Hadoop项目的VP——Arun Murthy回答了几个问题.

Hadoop分布式文件系统HDFS和OpenStack对象存储系统Swift有何不同？

- - ITeye博客

HDFS使用集中式单一节点架构(NameNode)来维护文件系统元数据，而在Swift中，元数据分布在整个集群中并拥有多个副本. 注意：集中式元数据存储使HDFS存在单点故障和扩展性问题，因此规模越大就性能越低，就越难扩展甚至不能扩展，所幸的是HDFS2使用NameNode HA和HDFS Federation解决了这两个问题.

HDFS-压缩

- - Java - 编程语言 - ITeye博客

文件压缩带来了两大益处1）减少存贮空间2)加速网络(磁盘）传输. 基于大数据的传输，都需要经过压缩处理. 压缩格式工具算法文件扩展名可分块. Java代码复制代码收藏代码. 24. // io.compression.codecs 定义列表中的一个 . Native gzip 库减少解压缩时间在50%，压缩时间在10%(同java实现的压缩算法).

HDFS架构

- - 数据库 - ITeye博客

在阅读了GFS的论文之后，对GFS的框架有了基本的了解，进一步学习自然是对HDFS的解析，不得不说，之前对GFS的一些了解，对理解HDFS还是很有帮助的，毕竟后者是建立在前者之上的分布式文件系统，二者在框架上可以找到很多的共同点，建议初次接触HFDS的技术人员可以先把GFS的那篇论文啃个两三遍，毕竟磨刀不砍柴工.