分享一些 Kafka 消费数据的小经验

- - crossoverJie's Blog

之前写过一篇《从源码分析如何优雅的使用 Kafka 生产者》，有生产者自然也就有消费者. 建议对 Kakfa 还比较陌生的朋友可以先看看. 就我的使用经验来说，大部分情况都是处于数据下游的消费者角色. 也用 Kafka 消费过日均过亿的消息（不得不佩服 Kakfa 的设计），本文将借助我使用 Kakfa 消费数据的经验来聊聊如何高效的消费数据.

Kafka重复消费和丢失数据研究 | Zollty's Blog

- -

底层根本原因：已经消费了数据，但是offset没提交. 原因1：强行kill线程，导致消费后的数据，offset没有提交. 原因2：设置offset为自动提交，关闭kafka时，如果在close之前，调用 consumer.unsubscribe() 则有可能部分offset没提交，下次重启会重复消费.

kafka消费者客户端 - sowhat1943 - 博客园

- -

消费者与消费者组之间的关系. 每一个消费者都隶属于某一个消费者组，一个消费者组可以包含一个或多个消费者，每一条消息只会被消费者组中的某一个消费者所消费. 不同消费者组之间消息的消费是互不干扰的. 消费者组出现主要是出于两个目的:. (1) 使整体的消费能力具备横向的伸缩性. 可以适当增加消费者组中消费者的数量，来提高整体的消费能力.

kafka监控之kafka-run-class.sh

- - 开源软件 - ITeye博客

kafka自带了很多工具类，在源码kafka.tools里可以看到：. 这些类该如何使用呢，kafka的设计者早就为我们考虑到了，在${KAFKA_HOME}/bin下，有很多的脚本，其中有一个kafka-run-class.sh，通过这个脚本，可以调用其中的tools的部分功能，如调用kafka.tools里的ConsumerOffsetChecker.scala,.

闲扯kafka mq

- - 开源软件 - ITeye博客

本文主要讲解关于kafka mq的设计思想及个人理解. 关于kafka的详细信息，大家可以参考官网的文献 http://kafka.apache.org/documentation.html这是一篇相当不错的文章，值得仔细研读. 第一个问题：消息队列（Message Queue）是干嘛用的. 首先，要对消息队列有一个基本的理解.

Kafka优化

- - ITeye博客

配置优化都是修改server.properties文件中参数值. 1.网络和io操作线程配置优化. # broker处理消息的最大线程数. # broker处理磁盘IO的线程数. 一般num.network.threads主要处理网络io，读写缓冲区数据，基本没有io等待，配置线程数量为cpu核数加1.

Kafka 0.9+增加了一个新的特性 Kafka Connect,可以更方便的创建和管理数据流管道. 它为Kafka和其它系统创建规模可扩展的、可信赖的流数据提供了一个简单的模型，通过 connectors可以将大数据从其它系统导入到Kafka中，也可以从Kafka中导出到其它系统. Kafka Connect可以将完整的数据库注入到Kafka的Topic中，或者将服务器的系统监控指标注入到Kafka，然后像正常的Kafka流处理机制一样进行数据流处理.

kafka consumer group offset

- - 开源软件 - ITeye博客

kafka0.9及以前版本kafka offset 保存在zookeeper，因频繁读写zookeeper性能不高；从0.10开始，主题分区offset存储于kafka独立主题中. 管理监控kafka主题及分区offset至关重要，原网上很开源流行工具KafkaOffsetMonitor、kafka-manager，旧版offset保存于zookeeper，kafka consumer无相应API，从kafka0.10.1.1以后提供相应API读取主题分区offset（也可以调用KafkaClient API，kafka管理API由scala语言编写）.

Swipe：另类的消费分享服务

- cgeek - WebLeOn's Blog

用户如果愿意分享消费记录或者Wishlist，对于商家或者广告主来说会有很大的价值. 但从用户的角度来讲，却往往没有兴趣主动分享这些信息. Swipe也是一个分享消费记录和愿望列表的服务，但是它却包含了不少最流行的互联网应用元素. 用Facebook就可以直接登录Swipe，并可以方便地把在Swipe发布的内容直接发送到涂鸦墙，分享给Facebook好友.

Kafka设计解析（二）：Kafka High Availability （上）

- -

Kafka在0.8以前的版本中，并不提供High Availablity机制，一旦一个或多个Broker宕机，则宕机期间其上所有Partition都无法继续提供服务. 若该Broker永远不能再恢复，亦或磁盘故障，则其上数据将丢失. 而Kafka的设计目标之一即是提供数据持久化，同时对于分布式系统来说，尤其当集群规模上升到一定程度后，一台或者多台机器宕机的可能性大大提高，对Failover要求非常高.

分享一些 Kafka 消费数据的小经验

前言

单线程消费

多线程消费

独立消费者模式

消费组模式

消费组自平衡

总结

相关 [分享 kafka 消费] 推荐：