Kafka 源码解析之 Producer 单 Partition 顺序性实现及配置说明（五） | Matt's Blog

参数名	说明	默认值
bootstrap.servers	Kafka Broker 的一个列表，不用包含所有的 Broker，它用于初始化连接时，通过这几个 broker 来获取集群的信息，比如： `127.0.0.1：9092,127.0.0.2：9092,127.0.0.3：9092`	-
key.serializer	对 key 进行序列化的 class，一般使用 `StringSerializer`	-
value.serializer	对 value 进行序列化的 class，一般使用 `StringDeserializer`	-
acks	用于设置在什么情况一条才被认为已经发送成功了。acks=0：msg 只要被 producer 发送出去就认为已经发送完成了；acks=1：如果 leader 接收到消息并发送 ack （不会等会该 msg 是否同步到其他副本）就认为 msg 发送成功了； acks=all或者-1：leader 接收到 msg 并从所有 isr 接收到 ack 后再向 producer 发送 ack，这样才认为 msg 发送成功了，这是最高级别的可靠性保证。	1
buffer.memory	producer 可以使用的最大内存，如果超过这个值，producer 将会 block `max.block.ms` 之后抛出异常。	33554432（32MB）
compression.type	Producer 数据的压缩格式，可以选择 none、gzip、snappy、lz4	none
retries	msg 发送失败后重试的次数，允许重试，如果 `max.in.flight.requests.per.connection` 设置不为1，可能会导致乱序	0

参数名	说明	默认值
batch.size	producer 向 partition 发送数据时，是以 batch 形式的发送数据，当 batch 的大小超过 `batch.size` 或者时间达到 `linger.ms` 就会发送 batch，根据经验，设置为1MB 吞吐会更高，太小的话吞吐小，太大的话导致内存浪费进而影响吞吐量	16384（16KB）
linger.ms	在一个 batch 达不到 `batch.size` 时，这个 batch 最多将会等待 `linger.ms` 时间，超过这个时间这个 batch 就会被发送，但也会带来相应的延迟，可以根据具体的场景进行设置	0
client.id	client 的 id，主要用于追踪 request 的来源	null
connections.max.idle.ms	如果 connection 连续空闲时间超过了这个值，将会被关闭，主要使用 Selector 的 `maybeCloseOldestConnection` 方法	540000（9min）
max.block.ms	控制 `KafkaProducer.send()` 和 `KafkaProducer.partitionsFor()` block 的最大时间，block 的原因是 buffer 满了或者 metadata 不可用导致。	60000
max.request.size	一个请求的最大长度	1048576（1MB）
partitioner.class	获取 topic 分区的 class	org.apache.kafka.clients.producer.internals.DefaultPartitioner
receive.buffer.bytes	在读取数据时 TCP receive buffer （SO_RCVBUF）的大小	32768（32KB）
request.timeout.ms	如果 producer 超过这么长时间没有收到 response，将会再次发送请求	30000
timeout.ms	用于配置 leader 等待 isr 返回 ack 的最大时间，如果超过了这个时间，将会返回给 producer 一个错误。	30000

参数名	说明	默认值
block.on.buffer.full	当 Producer 使用 buffer 达到最大设置时，如果设置为 false，将会 block `max.block.ms` 后然后抛出 `TimeoutException` 异常，如果设置为 true，将会把 `max.block.ms` 设置为 `Long.MAX_VALUE`。	false
interceptor.classes	使用拦截器，实现这个 `ProducerInterceptor` 接口，可以对 topic 进行简单的处理。	null
max.in.flight.requests.per.connection	对一个 connection，同时发送最大请求数，不为1时，不能保证顺序性。	5
metadata.fetch.timeout.ms	获取 metadata 时的超时时间	60000
metadata.max.age.ms	强制 metadata 定时刷新的间隔	300000（5min）
metric.reporters	A list of classes to use as metrics reporters. Implementing the MetricReporter interface，JmxReporter 是默认被添加的。	“”
metrics.num.samples	统计 metrics 时采样的次数	2
metrics.sample.window.ms	metrics 采样计算的时间窗口	30000
reconnect.backoff.ms	重新建立建立连接的间隔	50
retry.backoff.ms	发送重试的间隔	100

Kafka深度解析

- - zzm

原创文章，转载请务必将下面这段话置于文章开头处. 本文转发自Jason’s Blog，原文链接. http://www.jasongj.com/2015/01/02/Kafka深度解析. Kafka是一种分布式的，基于发布/订阅的消息系统. 以时间复杂度为O(1)的方式提供消息持久化能力，即使对TB级以上数据也能保证常数时间的访问性能.

Kafka设计解析（二）：Kafka High Availability （上）

- -

Kafka在0.8以前的版本中，并不提供High Availablity机制，一旦一个或多个Broker宕机，则宕机期间其上所有Partition都无法继续提供服务. 若该Broker永远不能再恢复，亦或磁盘故障，则其上数据将丢失. 而Kafka的设计目标之一即是提供数据持久化，同时对于分布式系统来说，尤其当集群规模上升到一定程度后，一台或者多台机器宕机的可能性大大提高，对Failover要求非常高.

Kafka 源码解析之 Producer 单 Partition 顺序性实现及配置说明（五） | Matt's Blog

- -

最后，简单介绍一下 Producer 的参数配置说明，只有正确地理解 Producer 相关的配置参数，才能更好地使用 Producer，发挥其相应的作用. 这里再看一下 RecordAccumulator 的数据结构，如下图所示，每个 topic-partition 都有一个对应的 deque，deque 中存储的是 RecordBatch，它是发送的基本单位，只有这个 topic-partition 的 RecordBatch 达到大小或时间要求才会触发发送操作（但并不是只有达到这两个条件之一才会被发送，这点要理解清楚）.

深入解析Kafka高可用设计如何步步为营

- - IT瘾-bigdata

kafka监控之kafka-run-class.sh

- - 开源软件 - ITeye博客

kafka自带了很多工具类，在源码kafka.tools里可以看到：. 这些类该如何使用呢，kafka的设计者早就为我们考虑到了，在${KAFKA_HOME}/bin下，有很多的脚本，其中有一个kafka-run-class.sh，通过这个脚本，可以调用其中的tools的部分功能，如调用kafka.tools里的ConsumerOffsetChecker.scala,.

闲扯kafka mq

- - 开源软件 - ITeye博客

本文主要讲解关于kafka mq的设计思想及个人理解. 关于kafka的详细信息，大家可以参考官网的文献 http://kafka.apache.org/documentation.html这是一篇相当不错的文章，值得仔细研读. 第一个问题：消息队列（Message Queue）是干嘛用的. 首先，要对消息队列有一个基本的理解.

Kafka优化

- - ITeye博客

配置优化都是修改server.properties文件中参数值. 1.网络和io操作线程配置优化. # broker处理消息的最大线程数. # broker处理磁盘IO的线程数. 一般num.network.threads主要处理网络io，读写缓冲区数据，基本没有io等待，配置线程数量为cpu核数加1.

Kafka Connect简介

- - 鸟窝

Kafka 0.9+增加了一个新的特性 Kafka Connect,可以更方便的创建和管理数据流管道. 它为Kafka和其它系统创建规模可扩展的、可信赖的流数据提供了一个简单的模型，通过 connectors可以将大数据从其它系统导入到Kafka中，也可以从Kafka中导出到其它系统. Kafka Connect可以将完整的数据库注入到Kafka的Topic中，或者将服务器的系统监控指标注入到Kafka，然后像正常的Kafka流处理机制一样进行数据流处理.

kafka consumer group offset

- - 开源软件 - ITeye博客

kafka0.9及以前版本kafka offset 保存在zookeeper，因频繁读写zookeeper性能不高；从0.10开始，主题分区offset存储于kafka独立主题中. 管理监控kafka主题及分区offset至关重要，原网上很开源流行工具KafkaOffsetMonitor、kafka-manager，旧版offset保存于zookeeper，kafka consumer无相应API，从kafka0.10.1.1以后提供相应API读取主题分区offset（也可以调用KafkaClient API，kafka管理API由scala语言编写）.

GitHub - andreas-schroeder/kafka-health-check: Health Check for Kafka Brokers.

- -

At AutoScout24, to keep the OS up to date of our clusters running on AWS, we perform regular in-place rolling updates. As we run immutable servers, we terminate each broker and replace them with fresh EC2 instances (keeping the previous broker ids).

Kafka 源码解析之 Producer 单 Partition 顺序性实现及配置说明（五） | Matt's Blog

RecordAccumulator

mutePartition() 与 unmutePartition()

ready()

drain()

顺序性如何保证？

Producer Configs

high importance

medium importance

low importance

相关 [kafka 源码解析] 推荐：

Kafka深度解析

Kafka设计解析（二）：Kafka High Availability （上）

Kafka 源码解析之 Producer 单 Partition 顺序性实现及配置说明（五） | Matt's Blog

深入解析Kafka高可用设计如何步步为营

kafka监控之kafka-run-class.sh

闲扯kafka mq

Kafka优化

Kafka Connect简介

kafka consumer group offset

GitHub - andreas-schroeder/kafka-health-check: Health Check for Kafka Brokers.

相关文章

订阅

Kafka 源码解析之 Producer 单 Partition 顺序性实现及配置说明（五） | Matt's Blog

RecordAccumulator

mutePartition() 与 unmutePartition()

ready()

drain()

顺序性如何保证？

Producer Configs

high importance

medium importance

low importance

相关 [kafka 源码 解析] 推荐：

相关文章

订阅

相关 [kafka 源码解析] 推荐：