《Spark 官方文档》监控和工具

环境变量	含义
`SPARK_DAEMON_MEMORY`	history server分配多少内存（默认: 1g）
`SPARK_DAEMON_JAVA_OPTS`	history server的 JVM参数（默认：none）
`SPARK_PUBLIC_DNS`	history server的外部访问地址，如果不配置，那么history server有可能会绑定server的内部地址，这可能会导致外部不能访问（默认：none）
`SPARK_HISTORY_OPTS`	history server配置项（默认：none）：spark.history.*

属性名称	默认值	含义
spark.history.provider	org.apache.spark.deploy .history.FsHistoryProvider	Spark应用历史后台实现的类名。目前可用的只有spark自带的一个实现，支持在本地文件系统中查询应用日志。
spark.history.fs.logDirectory	file:/tmp/spark-events	history server加载应用日志的目录
spark.history.fs.update.interval	10s	history server更新信息的时间间隔。每次更新将会检查磁盘上的日志是否有更新。
spark.history.retainedApplications	50	UI上保留的spark应用历史个数。超出的将按时间排序，删除最老的。
spark.history.ui.port	18080	history server绑定的端口
spark.history.kerberos.enabled	false	history server是否启用kerberos验证登陆。如果history server需要访问一个需要安全保证的hadoop集群，则需要开启这个功能。该配置设为true以后，需要同时配置 spark.history.kerberos.principal 和 spark.history.kerberos.keytab
spark.history.kerberos.principal	(none)	登陆history server的kerberos 主体名称
spark.history.kerberos.keytab	(none)	history server对应的kerberos keytab文件路径
spark.history.ui.acls.enable	false	指定是否启用ACL以控制用户访问验证。如果启用，那么不管某个应用是否设置了 spark.ui.acls.enabled，访问控制都将检查用户是否有权限。Spark应用的owner始终有查看的权限，而其他用户则需要通过 spark.ui.view.acls 配置其访问权限。如果禁用，则不会检查访问权限。
spark.history.fs.cleaner.enabled	false	指定history server是否周期性清理磁盘上的event log
spark.history.fs.cleaner.interval	1d	history server清理磁盘文件的时间间隔。只会清理比 spark.history.fs.cleaner.maxAge 时间长的磁盘文件。
spark.history.fs.cleaner.maxAge	7d	如果启用了history server周期性清理，比这个时间长的Spark作业历史文件将会被清理掉

端点	含义
`/applications`	所有应用的列表
`/applications/[app-id]/jobs`	给定应用的全部作业列表
`/applications/[app-id]/jobs/[job-id]`	给定作业的细节
`/applications/[app-id]/stages`	给定应用的stage列表
`/applications/[app-id]/stages/[stage-id]`	给定stage的所有attempt列表
`/applications/[app-id]/stages/[stage-id]/[stage-attempt-id]`	给定attempt的详细信息
`/applications/[app-id]/stages/[stage-id]/[stage-attempt-id]/taskSummary`	指定attempt对应的所有task的概要度量信息
`/applications/[app-id]/stages/[stage-id]/[stage-attempt-id]/taskList`	指定的attempt的所有task的列表
`/applications/[app-id]/executors`	给定应用的所有执行器
`/applications/[app-id]/storage/rdd`	给定应用的已保存的RDD列表
`/applications/[app-id]/storage/rdd/[rdd-id]`	给定的RDD的存储详细信息
`/applications/[app-id]/logs`	将给定应用的所有attempt对应的event log以zip格式打包下载
`/applications/[app-id]/[attempt-id]/logs`	将给定attempt的所有attempt对应的event log以zip格式打包下载

- - 并发编程网 - ifeve.com

spark-1.6.0 原文地址. 监控Spark应用有很多种方式：web UI，metrics 以及外部工具. 每个SparkContext都会启动一个web UI，其默认端口为4040，并且这个web UI能展示很多有用的Spark应用相关信息. 一个stage和task的调度列表. 一个关于RDD大小以及内存占用的概览.

Azkaban2官方配置文档

- - CSDN博客云计算推荐文章

最近工作实在是太忙了，我把之前翻译的官方的文档先放上来吧，希望对大家有所帮助~. 3、更容易设置job的依赖关系. 6、Kill和restart工作流. 8、日志和设计工作流和job. Azkaban2是相当容易搭建的，尽管它比azkaban要进行更多的插件组装. 在Azkaban2中有两个server和一个数据库需要搭建：.

Spark概览

- - 简单文本

Spark具有先进的DAG执行引擎，支持cyclic data flow和内存计算. 因此，它的运行速度，在内存中是Hadoop MapReduce的100倍，在磁盘中是10倍. 这样的性能指标，真的让人心动啊. Spark的API更为简单，提供了80个High Level的操作，可以很好地支持并行应用.

我本人是类似Hive平台的系统工程师，我对MapReduce的熟悉程度是一般，它是我的底层框架. 我隔壁组在实验Spark，想将一部分计算迁移到Spark上. 年初的时候，看Spark的评价，几乎一致表示，Spark是小数据集上处理复杂迭代的交互系统，并不擅长大数据集，也没有稳定性. 但是最近的风评已经变化，尤其是14年10月他们完成了Peta sort的实验，这标志着Spark越来越接近替代Hadoop MapReduce了.

Spark迷思

- - ITeye博客

目前在媒体上有很大的关于Apache Spark框架的声音，渐渐的它成为了大数据领域的下一个大的东西. 证明这件事的最简单的方式就是看google的趋势图：. 上图展示的过去两年Hadoop和Spark的趋势. Spark在终端用户之间变得越来越受欢迎，而且这些用户经常在网上找Spark相关资料. 这给了Spark起了很大的宣传作用；同时围绕着它的也有误区和思维错误，而且很多人还把这些误区作为银弹，认为它可以解决他们的问题并提供比Hadoop好100倍的性能.

Spark 优化

- - CSDN博客推荐文章

提到Spark与Hadoop的区别，基本最常说的就是Spark采用基于内存的计算方式，尽管这种方式对数据处理的效率很高，但也会往往引发各种各样的问题，Spark中常见的OOM等等. 效率高的特点，注定了Spark对性能的严苛要求，那Spark不同程序的性能会碰到不同的资源瓶颈，比如：CPU，带宽、内存.

Spark&Spark性能调优实战

- - CSDN博客互联网推荐文章

Spark特别适用于多次操作特定的数据，分mem-only和mem & disk. 其中mem-only:效率高，但占用大量的内存，成本很高;mem & disk:内存用完后，会自动向磁盘迁移，解决了内存不足的问题，却带来了数据的置换的消费. Spark常见的调优工具有nman、Jmeter和Jprofile,以下是Spark调优的一个实例分析：.

Mesos上部署spark

- - 开源小站

还是回到之前一直持续的 Mesos话题. 在之前的环节里，我们已经尝试了Mesos的安装，Marathon守护服务以及相对比较主流的Mesos作为Hadoop的资源管理器的实际操作. 这次就说说同属于伯克利出品的Spark. 其实spark最初0.7以前的版本还没有自己的资源管理系统，资源的调度都是通过Mesos来执行的.

Spark容错机制

- - zzm

一般来说，分布式数据集的容错性有两种方式：数据检查点和记录数据的更新. 面向大规模数据分析，数据检查点操作成本很高，需要通过数据中心的网络连接在机器之间复制庞大的数据集，而网络带宽往往比内存带宽低得多，同时还需要消耗更多的存储资源. 因此，Spark选择记录更新的方式. 但是，如果更新粒度太细太多，那么记录更新成本也不低.

beeline 连接SPARK /Hive

- - 开源软件 - ITeye博客

hiveclient所在主机的jdk 1.7_51，hive 0.12和hadoop 2.3.0是从服务器端拷贝过来的，环境变量一切OK. 执行连接报了Invalid URL的错误：. 开始的一段时间都在纠结这个jdbc的URL格式问题，后来在cloudra论坛上找到了一个方法,. 直接调用的jdbc:hive2的驱动测试是正常的，证明CLASSPATH等环境变量没有问题.

《Spark 官方文档》监控和工具

spark-1.6.0 原文地址

监控和工具

Web界面

事后查看

REST API

度量

高级工具

相关 [spark 官方文档] 推荐：