Apache Kafka：下一代分布式消息系统

- - zzm

Apache Kafka是分布式发布-订阅消息系统. 它最初由LinkedIn公司开发，之后成为Apache项目的一部分. Kafka是一种快速、可扩展的、设计内在就是分布式的，分区的和可复制的提交日志服务. Apache Kafka与传统消息系统相比，有以下不同：. 它被设计为一个分布式系统，易于向外扩展；.

apache kafka消息服务

- - CSDN博客架构设计推荐文章

apache kafka中国社区QQ群:162272557. apache kafka参考. 消息生产者生产消息发送到queue中，然后消息消费者从queue中取出并且消费消息. 消息被消费以后，queue中不再有存储，所以消息消费者不可能消费到已经被消费的消息. Queue支持存在多个消费者，但是对一个消息而言，只会有一个消费者可以消费.

转自：http://shift-alt-ctrl.iteye.com/blog/1930345. 前言: kafka是一个轻量级的/分布式的/具备replication能力的日志采集组件,通常被集成到应用系统中,收集"用户行为日志"等,并可以使用各种消费终端(consumer)将消息转存到HDFS等其他结构化数据存储系统中.因为日志消息通常为文本数据,尺寸较小,且对实时性以及数据可靠性要求不严格,但是需要日志存储端具备较高的数据吞吐能力,这种"宽松"的设计要求,非常适合使用kafka. .

Apache Kafka开发入门指南之2

- - CSDN博客云计算推荐文章

Apache Kafka开发入门指南之2. 作者：chszs，转载需注明. 博客主页： http://blog.csdn.net/chszs. Apache Kafka目标是统一离线和在线处理，与Flume和Scribe相比较，Kafka在处理活动流数据方面更具优势. 但是从架构的视野来看，Kafka与传统的消息系统（例如ActiveMQ或RabbitMQ）更相似一些.

实用 | 从Apache Kafka到Apache Spark安全读取数据

- - IT瘾-bigdata

随着在CDH平台上物联网(IoT)使用案例的不断增加，针对这些工作负载的安全性显得至关重要. 本篇博文对如何以安全的方式在Spark中使用来自Kafka的数据，以及针对物联网(IoT)使用案例的两个关键组件进行了说明. Cloudera Distribution of Apache Kafka 2.0.0版本(基于Apache Kafka 0.9.0)引入了一种新型的Kafka消费者API，可以允许消费者从安全的Kafka集群中读取数据.

Oryx 2: Lambda architecture on Apache Spark, Apache Kafka for real-time large scale machine learning

- -

【译】调优Apache Kafka集群 - huxihx - 博客园

- -

　　今天带来一篇译文“调优Apache Kafka集群”，里面有一些观点并无太多新颖之处，但总结得还算详细. 该文从四个不同的目标出发给出了各自不同的参数配置，值得大家一读~ 原文地址请参考：https://www.confluent.io/blog/optimizing-apache-kafka-deployment/.

大规模使用 Apache Kafka 的20个最佳实践

- - 开源软件 - ITeye博客

Apache Kafka是一款流行的分布式数据流平台，它已经广泛地被诸如New Relic(数据智能平台)、Uber、Square(移动支付公司)等大型公司用来构建可扩展的、高吞吐量的、且高可靠的实时数据流系统. 例如，在New Relic的生产环境中，Kafka群集每秒能够处理超过1500万条消息，而且其数据聚合率接近1 Tbps.

批处理ETL已经消亡，Apache Kafka才是数据处理的未来吗？

- -

最近的一些数据发展趋势推动传统的批处理抽取-转换-加载（ETL）架构发生了巨大的变化：数据平台要在整个企业范围内运行；数据源的类型变得更多；流数据得到了普遍性增长. 在实时ETL方面，早期采用的方式是企业应用集成（EAI），但是这里所用的技术通常是不可扩展的. 这给传统的数据集成带来了两难的选择：实时但不可扩展，或者可扩展但采用的是批处理方案.

[译] 每个 Apache Kafka 开发者都应该知道的 5 件事

- - IT瘾-dev

Apache Kafka 是一个开源流处理平台，如今有超过30％的财富500强企业使用该平台. Kafka 有很多特性使其成为事件流平台（event streaming platform）的事实上的标准. 在这篇博文中，我将介绍每个 Kafka 开发者都应该知道的五件事，这样在使用 Kafka 就可以避免很多问题.

Apache Kafka：下一代分布式消息系统

简介

企业应用云化中的选型策略与技术储备

传统电商技术架构背后的多业务模式演进

证券行业大数据应用的典型场景

饿了么数据仓库治理与架构探索

银行客户意见挖掘海量文本数据分析实践

架构

Kafka存储

Kafka代理

ZooKeeper与Kafka

Apache Kafka对比其它消息服务

LinkedIn的研究

生产者测试

消费者测试

示例应用

总结

相关 [apache kafka 下一代] 推荐：