apache kafka消息服务

测试指标	性能相关说明	结论
消息堆积压力测试	单个kafka broker节点测试，启动一个kafka broker和Producer，Producer不断向broker发送数据，直到broker堆积数据为18GB为止(停止Producer运行)。启动Consumer，不间断从broker获取数据，直到全部数据读取完成为止，最后查看Producer==Consumer数据，没有出现卡死或broker不响应现象	数据大量堆积不会出现broker卡死或不响应现象
生产者速率	1.200byte/msg,4w/s左右。2.1KB/msg,1w/s左右	性能上是完全满足要求，其性能主要由磁盘决定
消费者速率	1.200byte/msg,4w/s左右。2.1KB/msg,1w/s左右	性能上是完全满足要求，其性能主要由磁盘决定

- - CSDN博客架构设计推荐文章

apache kafka中国社区QQ群:162272557. apache kafka参考. 消息生产者生产消息发送到queue中，然后消息消费者从queue中取出并且消费消息. 消息被消费以后，queue中不再有存储，所以消息消费者不可能消费到已经被消费的消息. Queue支持存在多个消费者，但是对一个消息而言，只会有一个消费者可以消费.

Apache Kafka：下一代分布式消息系统

- - zzm

Apache Kafka是分布式发布-订阅消息系统. 它最初由LinkedIn公司开发，之后成为Apache项目的一部分. Kafka是一种快速、可扩展的、设计内在就是分布式的，分区的和可复制的提交日志服务. Apache Kafka与传统消息系统相比，有以下不同：. 它被设计为一个分布式系统，易于向外扩展；.

转自：http://shift-alt-ctrl.iteye.com/blog/1930345. 前言: kafka是一个轻量级的/分布式的/具备replication能力的日志采集组件,通常被集成到应用系统中,收集"用户行为日志"等,并可以使用各种消费终端(consumer)将消息转存到HDFS等其他结构化数据存储系统中.因为日志消息通常为文本数据,尺寸较小,且对实时性以及数据可靠性要求不严格,但是需要日志存储端具备较高的数据吞吐能力,这种"宽松"的设计要求,非常适合使用kafka. .

Apache Kafka开发入门指南之2

- - CSDN博客云计算推荐文章

Apache Kafka开发入门指南之2. 作者：chszs，转载需注明. 博客主页： http://blog.csdn.net/chszs. Apache Kafka目标是统一离线和在线处理，与Flume和Scribe相比较，Kafka在处理活动流数据方面更具优势. 但是从架构的视野来看，Kafka与传统的消息系统（例如ActiveMQ或RabbitMQ）更相似一些.

实用 | 从Apache Kafka到Apache Spark安全读取数据

- - IT瘾-bigdata

随着在CDH平台上物联网(IoT)使用案例的不断增加，针对这些工作负载的安全性显得至关重要. 本篇博文对如何以安全的方式在Spark中使用来自Kafka的数据，以及针对物联网(IoT)使用案例的两个关键组件进行了说明. Cloudera Distribution of Apache Kafka 2.0.0版本(基于Apache Kafka 0.9.0)引入了一种新型的Kafka消费者API，可以允许消费者从安全的Kafka集群中读取数据.

Oryx 2: Lambda architecture on Apache Spark, Apache Kafka for real-time large scale machine learning

- -

kafka发布订阅消息

- - 企业架构 - ITeye博客

① 每个partition会创建3个备份replica,并分配到broker集群中； --replication-factor 3. ② 用zookeeper来管理，consumer、producer、broker的活动状态；. ③ 分配的每个备份replica的id和broker的id保持一致；.

【译】调优Apache Kafka集群 - huxihx - 博客园

- -

　　今天带来一篇译文“调优Apache Kafka集群”，里面有一些观点并无太多新颖之处，但总结得还算详细. 该文从四个不同的目标出发给出了各自不同的参数配置，值得大家一读~ 原文地址请参考：https://www.confluent.io/blog/optimizing-apache-kafka-deployment/.

大规模使用 Apache Kafka 的20个最佳实践

- - 开源软件 - ITeye博客

Apache Kafka是一款流行的分布式数据流平台，它已经广泛地被诸如New Relic(数据智能平台)、Uber、Square(移动支付公司)等大型公司用来构建可扩展的、高吞吐量的、且高可靠的实时数据流系统. 例如，在New Relic的生产环境中，Kafka群集每秒能够处理超过1500万条消息，而且其数据聚合率接近1 Tbps.

分布式消息系统：Kafka

- - 标点符

Kafka是分布式发布-订阅消息系统. 它最初由LinkedIn公司开发，之后成为Apache项目的一部分. Kafka是一个分布式的，可划分的，冗余备份的持久性的日志服务. 在大数据系统中，常常会碰到一个问题，整个大数据是由各个子系统组成，数据需要在各个子系统中高性能，低延迟的不停流转. 传统的企业消息系统并不是非常适合大规模的数据处理.

apache kafka消息服务

apache kafka中国社区QQ群:162272557

apache kafka参考

发布/订阅

kafka消息队列调研

总体结构：

kafka特性：

可靠性（一致性)

kafak系统扩展性

kafka设计目标

Producer负载均衡和HA机制

Consumer的pull机制

Consumer与topic关系以及机制

Producer均衡算法

Consumer均衡算法

kafka broker集群内broker之间replica机制

总结:

性能测试

相关 [apache kafka 消息] 推荐：