YARN动态资源池使用配置 - CSDN博客

标签: | 发表时间:2018-01-05 12:49 | 作者:
出处:http://blog.csdn.net

动态资源池是用来做资源配置和调度策略管理,动态资源池中可以运行YARN应用和Impala查询任务。动态资源池允许用户在运行YARN应用或Impala查询任务的时候指定特定的池并调度池中可用的资源。一个典型的应用场景就是当我们通过Oozie调度Pig任务的时候,如果我们同时提交大量的Oozie任务,Oozie任务在启动launch的时候是需要占用资源的,可能就会导致资源占满而使后续的Pig任务无法执行。在CDH3U5中,我们会在FairScheduler中配置2个queue,一个放置Oozie的Launch任务,并设置其可用的slot数,另外一个放置Pig任务来解决。在YARN中资源已经不是用slot来表示,而是用VCores和Memory来表示。我们可以通过YARN动态资源管理来解决上述问题。

使用步骤:

1)关闭未声明资源池的自动生成。

进入YARN面板,选择配置->服务范围->资源管理->yarn.scheduler.fair.allow-undeclared-pools,默认选项是开启的,需要关闭,否则如果用户指定一个尚未声明的资源池时,YARN将为自动生成一个相对于的资源池。我们需要关闭该选项,修改之后点击保存更改,重启YARN服务生效。

 

2)关闭"使用默认队列时的Fair Scheduler用户"选项

进入YARN面板,选择配置->ResourceManager Default Group->yarn.scheduler.fair.user-as-default-queue,该选项默认是开启,表示用户提交任务时,如果未指定池名称,就使用用户名作为默认的池名称,我用需要关闭该选项,让未指定此名称时,任务运行在default池中。点击保存更改,重启YARN服务生效。


3)进入动态资源池配置界面

通过集群->资源管理->动态资源池进入。

 默认情况下只有一个资源池root.default,我们可以手动添加资源池并分配使用权重、VCores和内存。

4)添加动态资源池。

选择动态资源池->配置->添加资源池。

 

将弹出一个引导界面:

 

在常规面板输入资源池名称:譬如oozie,计划策略一般默认采用DRF策略。

在YARN面板我们可以配置权重,虚拟内核,内存大小,以及正在运行的应用程序最大数量,当配置虚拟内核和内存之后着2个参数将优先于权重配置。其中权重定义了资源池之间分配资源的比例,譬如上图中oozie池全权重为1而default池的权重为2,那么集群资源的33.3%会分配给oozie。注意,这里提到的资源分配不是一个静态的概念,如果当前资源池default中没有任务执行,那么资源池oozie是可以运行使用超过33.3%的集群资源的,譬如50%。虚拟内核表示资源池能够调度的虚拟内核数,可以不做配置。内存大小表示资源池能够调度的内存大小,可以不做配置。正在运行的应用程序最大数量表示资源池中能够同时运行的application数量,也就是MapReduceV1中所说的job数量。

 

点击确认即可。

5)根据需要配置计划模式

YARN动态资源池可以根据需要配置在不同时间段选择不同的资源调度规则。

操作流程:

a)选择动态资源池->配置->计划模式->添加计划模式。

 

点击之后将弹出一个引导界面。

 

我们添加一个工作日的计划模式,在配置集中输入配置集的名称,选择重复的模式,以及重复的天数和时间。

最终我们添加2个计划模式,一个在工作日全天运行,一个在周末全天运行。

 

b)根据不同的计划模式配置不同的调度规则。

添加2个计划模式后,我们在编辑资源池的编辑界面就可以看到新添加的YARN配置级了,我们可以根据需要配置相应的权重、虚拟内核、内存和运行应用程序的最大数量值。

譬如我们可以配置在weekday模式下选择default池权重为66.7%,oozie池权重为33.3%。

 

在weekend模式下选择default池权重为50%,oozie池权重为50%。


在default模式下选择default池权重为75%,oozie池权重为25%。

 

6)在Oozie中使用动态资源池方法:

在workflow.xml文件中分别加入oozie launch的启动配置池和mapreduce的job运行池即可。参数如下:

<property>

<name>oozie.launcher.mapred.job.queue.name</name>

<value>root.oozie</value>

</property>

<property>

<name>mapred.job.queue.name</name>

<value>default</value>

</property>

加入以上配置之后运行对于的oozie任务可以在动态资源池面板中看到资源池的使用情况。下图表明配置成功。

 

相关 [yarn 资源 csdn] 推荐:

YARN动态资源池使用配置 - CSDN博客

- -
动态资源池是用来做资源配置和调度策略管理,动态资源池中可以运行YARN应用和Impala查询任务. 动态资源池允许用户在运行YARN应用或Impala查询任务的时候指定特定的池并调度池中可用的资源. 一个典型的应用场景就是当我们通过Oozie调度Pig任务的时候,如果我们同时提交大量的Oozie任务,Oozie任务在启动launch的时候是需要占用资源的,可能就会导致资源占满而使后续的Pig任务无法执行.

利用yarn多队列实现hadoop资源隔离 - bbaiggey_bigdata的博客 - CSDN博客

- -
大数据处理离不开hadoop集群的部署和管理,对于本来硬件资源就不多的创业团队来说,做好资源的共享和隔离是很有必要的,毕竟不像BAT那么豪,那么怎么样能把有限的节点同时分享给多组用户使用而且互不影响呢,我们来研究一下yarn多队列做资源隔离. 请尊重原创,转载请注明来源网站www.shareditor.com以及原始链接地址.

YARN动态资源池配置案例_Alex_新浪博客

- -
CDH作为统一的企业级数据中心,往往是一个多租户的应用环境. 在该环境中,不同用户会同时使用集群资源. 如何保证任务的权限控制 (例如用户A不能任性地取消用户B的任务). 如何确保用户资源使用不超过他们的配额. 开启HDFS权限检查 (默认是开启的). "Check HDFS Permissions"选中.

YARN/MRv2 NodeManager整体架构

- - 董的博客
Dong | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及 版权声明. 网址: http://dongxicheng.org/mapreduce-nextgen/nodemanager-architecture/. (注:本文章主要翻译自Hortonworks官方博客的 “Apache Hadoop YARN – NodeManager”,红色部分为我的注解.

文章: Arun Murthy谈Apache YARN

- - InfoQ cn
Apache Hadoop YARN是一种新的Hadoop资源管理器,前不久被提升为高层次的Hadoop子项目. InfoQ有幸在Hortonworks与YARN的创始人和架构师Arun Murthy进行了讨论. 黑客马拉松•杭州 12月15-16日-Hacking Different,名额有限,请速报名.

一文精通 Flink on YARN

- - IT瘾-dev
本文主要是讲解flink on yarn的部署过程,然后yarn-session的基本原理,如何启动多个yarn-session的话如何部署应用到指定的yarn-session上,然后是用户jar的管理配置及故障恢复相关的参数. flink on yarn的整个交互过程图,如下:. 要使得flink运行于yarn上,flink要能找到hadoop配置,因为要连接到yarn的resourcemanager和hdfs.

Yarn(MR2)上的应用汇总

- - BlogJava-首页技术区
Yarn做为hadoop下一代集群资源管理和调度平台, 其上能支持多种计算框架, 本文就简要介绍一下这些计算框架.. 首先是大家熟悉的mapreduce, 在MR2之前, hadoop包括HDFS和mapreduce, 做为hadoop上唯一的分布式计算框架, 其优点是用户可以很方便的编写分布式计算程序, 并支持许多的应用, 如hive, mahout, pig等.

YARN/MRv2 中基本术语介绍

- - 董的博客
YARN/MRv2是下一代MapReduce框架(见 Hadoop-0.23.0),该框架完全不同于当前的MapReduce框架,它在扩展性,容错性和通用性等方面更出色,据统计,Yarn有超过150000行代码,完全是重写编写的. 本文介绍了YARN/MRv2中基本术语的含义,帮助有兴趣的程序员们对YARN有一个初步的理解.

Hadoop YARN安装部署初探

- - 董的博客
Dong | 新浪微博: 西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及 版权声明. 网址: http://dongxicheng.org/mapreduce-nextgen/hadoop-yarn-install/. 本文主要介绍了在实验环境下,能使YARN(以CDH4为例,Apache版本安装方法类似)正常工作的最简单的配置部署方法.

YARN/MRv2 MRAppMaster深入剖析—概述

- - 董的博客
Dong | 新浪微博: 西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及 版权声明. 网址: http://dongxicheng.org/mapreduce-nextgen/yarn-mrappmaster-introduction/. 1. 什么是MRAppMaster.