HADOOP OS部分优化

- - 数据库 - ITeye博客

文件描述符是一个索引值，指向内核为每一个进程所维护的该进程打开文件的记录表. 当程序打开一个现有文件或者创建一个新文件时，内核向进程返回一个文件描述符. 在程序设计中，一些涉及底层的程序编写往往会围绕着文件描述符展开，文件描述符这一概念往往只适用于UNIX、Linux这样的操作系统. 在Linux系列的操作系统上，由于Linux的设计思想便是把一切设备都视作文件.

Hadoop集群与Hadoop性能优化

- - 学着站在巨人的肩膀上

本文讲解一下Hadoop集群、Hadoop性能优化、Hadoop机架感知实现、Hadoop配置等，下面是有关这些命令的具体介绍. Hadoop性能优化：Hadoop机架感知实现及配置：分布式的集群通常包含非常多的机器，由于受到机架槽位和交换机网口的限制，通常大型的分布式集群都会跨好几个机架，由多个机架上的机器共同组成一个分布式集群.

hadoop集群调优－OS和文件系统部分

- - 开源软件 - ITeye博客

根据Dell（因为我们的硬件采用dell的方案）关于hadoop调优的相关说明，改变几个Linux的默认设置，Hadoop的性能能够增长大概15%. 文件描述符是一个索引值，指向内核为每一个进程所维护的该进程打开文件的记录表. 当程序打开一个现有文件或者创建一个新文件时，内核向进程返回一个文件描述符.

Hadoop 优化总结(一)

- - 开源软件 - ITeye博客

自带的Text很好用，但是字符串转换开销较大，故根据实际需要自定义Writable，注意作为Key时要实现WritableCompareable接口. 避免output.collect(new Text( ),new Text()). 提倡key.set( ) value.set( ) output.collect(key,value).

【Hadoop】MapReduce使用combiner优化性能

- - CSDN博客云计算推荐文章

当MapReduce模型中，reduce执行的任务为统计分类类型的值总量或去重后的数量，或最大值最小值时，可以考虑在Map输出后进行combine操作；这样可以减少网络传输带来的开销，同时减轻了reduce任务的负担. Combine操作是运行在每个节点上的，只会影响本地Map的输出结果；Combine的输入为本地map的输出结果(一般是数据在溢出到磁盘之前，可以减少IO开销)，其输出则作为reduce的输入.

hadoop的IO和MapReduce优化参数

- - CSDN博客系统运维推荐文章

在MapReduce执行过程中，特别是Shuffle阶段，尽量使用内存缓冲区存储数据，减少磁盘溢写次数；同时在作业执行过程中增加并行度，都能够显著提高系统性能，这也是配置优化的一个重要依据. 下面分别介绍I/O属性和MapReduce属性这两个类的部分属性，并指明其优化方向.

Hadoop优化第一篇 : HDFS/MapReduce - leocook

- - 博客园_首页

比较惭愧，博客很久（半年）没更新了. 最近也自己搭了个博客，wordpress玩的还不是很熟，感兴趣的朋友可以多多交流哈. 地址是：http://www.leocook.org/. 另外，我建了个QQ群：305994766，希望对大数据、算法研发、系统架构感兴趣的朋友能够加入进来，大家一起学习，共同进步（进群请说明自己的公司-职业-昵称）.

Hadoop 升级创建硬链接效率优化

- - 董的博客

Hadoop版本升级过程中，namenode会将元数据信息拷贝一份（fsimage，edits等），而datanode会对所有数据块建立硬链接，以防升级过程中出现问题，进行回滚操作. 在databode上，采用了ln命令对每个block文件建立硬链接，而当集群规模非常大时，用ln命令（Apache Hadoop-0.20.2以及之前版本采用的方法）对大量文件建立硬链接的代价非常大，为了提高建立硬链接的效率，本文讨论了几种方法.

HADOOP OS部分优化

open file descriptors and files

File System

Network

Transparent Huge Page

Linux kernal swappiness parameter

相关 [hadoop os 优化] 推荐：