大规模使用 Apache Kafka 的20个最佳实践

- - 开源软件 - ITeye博客

Apache Kafka是一款流行的分布式数据流平台，它已经广泛地被诸如New Relic(数据智能平台)、Uber、Square(移动支付公司)等大型公司用来构建可扩展的、高吞吐量的、且高可靠的实时数据流系统. 例如，在New Relic的生产环境中，Kafka群集每秒能够处理超过1500万条消息，而且其数据聚合率接近1 Tbps.

Kafka 最佳实践【译】 | Matt's Blog

- -

这里翻译一篇关于 Kafka 实践的文章，内容来自 DataWorks Summit/Hadoop Summit（. Hadoop Summit）上一篇分享，PPT 见. Apache Kafka Best Pratices，里面讲述了很多关于 Kafka 配置、监控、优化的内容，绝对是在实践中总结出的精华，有很大的借鉴参考意义，本文主要是根据 PPT 的内容进行翻译及适当补充.

apache kafka消息服务

- - CSDN博客架构设计推荐文章

apache kafka中国社区QQ群:162272557. apache kafka参考. 消息生产者生产消息发送到queue中，然后消息消费者从queue中取出并且消费消息. 消息被消费以后，queue中不再有存储，所以消息消费者不可能消费到已经被消费的消息. Queue支持存在多个消费者，但是对一个消息而言，只会有一个消费者可以消费.

高负载下 Apache 内存与进程的最佳实践

- - SegmentFault 最新的文章

检查 Apache 是否运行在 prefork 的工作模式. 查看当前每个进程所占用的内存. RES column 是 Apache process 使用的内存量，左起第六列. 最大进程数＝ Apache 所能消耗的内存总量／每个进程消耗内存量. apache 实际会在这个框架内，再控制进程.

转自：http://shift-alt-ctrl.iteye.com/blog/1930345. 前言: kafka是一个轻量级的/分布式的/具备replication能力的日志采集组件,通常被集成到应用系统中,收集"用户行为日志"等,并可以使用各种消费终端(consumer)将消息转存到HDFS等其他结构化数据存储系统中.因为日志消息通常为文本数据,尺寸较小,且对实时性以及数据可靠性要求不严格,但是需要日志存储端具备较高的数据吞吐能力,这种"宽松"的设计要求,非常适合使用kafka. .

Apache Kafka开发入门指南之2

- - CSDN博客云计算推荐文章

Apache Kafka开发入门指南之2. 作者：chszs，转载需注明. 博客主页： http://blog.csdn.net/chszs. Apache Kafka目标是统一离线和在线处理，与Flume和Scribe相比较，Kafka在处理活动流数据方面更具优势. 但是从架构的视野来看，Kafka与传统的消息系统（例如ActiveMQ或RabbitMQ）更相似一些.

实用 | 从Apache Kafka到Apache Spark安全读取数据

- - IT瘾-bigdata

随着在CDH平台上物联网(IoT)使用案例的不断增加，针对这些工作负载的安全性显得至关重要. 本篇博文对如何以安全的方式在Spark中使用来自Kafka的数据，以及针对物联网(IoT)使用案例的两个关键组件进行了说明. Cloudera Distribution of Apache Kafka 2.0.0版本(基于Apache Kafka 0.9.0)引入了一种新型的Kafka消费者API，可以允许消费者从安全的Kafka集群中读取数据.

Oryx 2: Lambda architecture on Apache Spark, Apache Kafka for real-time large scale machine learning

- -

Apache Kafka：下一代分布式消息系统

- - zzm

Apache Kafka是分布式发布-订阅消息系统. 它最初由LinkedIn公司开发，之后成为Apache项目的一部分. Kafka是一种快速、可扩展的、设计内在就是分布式的，分区的和可复制的提交日志服务. Apache Kafka与传统消息系统相比，有以下不同：. 它被设计为一个分布式系统，易于向外扩展；.

【译】调优Apache Kafka集群 - huxihx - 博客园

- -

　　今天带来一篇译文“调优Apache Kafka集群”，里面有一些观点并无太多新颖之处，但总结得还算详细. 该文从四个不同的目标出发给出了各自不同的参数配置，值得大家一读~ 原文地址请参考：https://www.confluent.io/blog/optimizing-apache-kafka-deployment/.

大规模使用 Apache Kafka 的20个最佳实践

针对Partitions的最佳实践

针对Consumers的最佳实践

针对Producers的最佳实践

针对Brokers的最佳实践

其他资源

相关 [apache kafka 最佳实践] 推荐：