透彻理解Kafka（九）——Consumer：协调器

每个消费者组都会选择一个Broker作为自己的Coordinator，这个GroupCoordinator协调器负责监控这个消费组里的各个消费者的心跳，判断它们是否宕机，如果宕机则进行Rebalance。

那么，这里就要思考几个问题：

消费者组应该选择哪一个Broker作为GroupCoordinator？
GroupCoordinator是如何为它的消费者组进行Rebalance的？

一、GroupCoordinator

1.1 选择GroupCoordinator

我们先来看下消费者组是如何选择GroupCoordinator的。

我之前说过，每个Consumer在提交offset时，会将offset提交到__consumer_offsets这个内部Topic的某个分区上，默认分区数是50，事实上， Consumer提交offset的那个Leader分区所在的Broker就是GroupCoordinator 。

举个例子，假设有一个消费者组，groupId = membership-consumer-group：

Consumer启动的时候，会对groupId进行hash运算，然后与__consumer_offsets的分区数取模，得到一个数值；
消费者组下的所有Consumer在提交offset时，会提交到这个数值对应的__consumer_offsets的那个分区；
最终，上述Leader分区所在的Broker就是这个消费者组的GroupCoordinator，组里的消费者会维护Socket连接与这个Broker进行通信。

1.2 分区分配

确认GroupCoordinator后，我们再来看下分区分配是如何进行的。

初始时，消费者组内的每个Consumer都会发送JoinGroup请求到GroupCoordinator；
GroupCoordinator会从消费组内选择一个Consumer作为Leader，然后把消费者组的情况发送给这个Leader；
消费者Leader会负责制定分区方案，并通过SyncGroup请求告知GroupCoordinator；
最后，GroupCoordinator会把分区方案下发给所有Consumer，各个Consumer就会跟指定Leader分区所在的Broker建立Socket连接，开始消费消息。

二、Reblance策略

当消费者组中的某个Consumer宕机或者增减分区时，GroupCoordinator会负责分区重分配，也就是所谓的 reblance 。在reblance期间，消费者组会变得 不可用 。另外，reblance可能会引发“重复消费”的问题，比如Consumer消费完某个分区中的一部分消息后还没有来得及提交offset，此时发生了reblance，然后这个分区被分配给了消费组内的另一个Consumer，这样原来被消费完的那部分消息又会被新的Consumer重新消费一遍，即发生了重复消费。

Kafka一共提供了三种Rebalance的策略： Range 、 Round-Robin 、 Sticky 。

2.1 Range策略

Range策略就是按照Partition的序号范围进行分配，也是 默认策略 。

举个例子，某个主题有8个分区：partition0-partition7。那么分区partition0-2分配给Consumer1，partition3-5给一个Consumer2，partition6-7给一个consumer3。

2.2 Round-Robin策略

Round-Robin策略，就是轮询分配。

举个例子，某个主题有8个分区：partition0-partition7。那么partiton0给Consumer1，partiton1给另一个Consumer2，依此类推……最后Consumer1分配到partiton0、3、6，Consumer2分配到partition1、4、7，Consumer3分配到partition2、5。

2.3 Sticky策略

Range策略和Round-Robin策略都存在一个问题，就是发生Rebalance的时候会导致分区被频繁重新分配。

举个例子，比如Consumer2挂掉了，那么会导致原本分配给Consumer1和Consumer3的分区也要被重新分配，这种分配很多时候是没必要的。

所以，Kafka又新增了一种 Sticky策略 ，就是说在发生Rebalance时，尽量让原本属于这个Consumer的分区不变动，再把多余的分区均匀分配出去，这样就能尽可能维持原来的分区分配策略。

Java 面试宝典是大明哥全力打造的 Java 精品面试题，它是一份靠谱、强大、详细、经典的 Java 后端面试宝典。它不仅仅只是一道道面试题，而是一套完整的 Java 知识体系，一套你 Java 知识点的扫盲贴。

它的内容包括：

大厂真题：Java 面试宝典里面的题目都是最近几年的高频的大厂面试真题。
原创内容：Java 面试宝典内容全部都是大明哥原创，内容全面且通俗易懂，回答部分可以直接作为面试回答内容。
持续更新：一次购买，永久有效。大明哥会持续更新 3+ 年，累计更新 1000+，宝典会不断迭代更新，保证最新、最全面。
覆盖全面：本宝典累计更新 1000+，从 Java 入门到 Java 架构的高频面试题，实现 360° 全覆盖。
不止面试：内容包含面试题解析、内容详解、知识扩展，它不仅仅只是一份面试题，更是一套完整的 Java 知识体系。
宝典详情：https://www.yuque.com/chenssy/sike-java/xvlo920axlp7sf4k
宝典总览：https://www.yuque.com/chenssy/sike-java/yogsehzntzgp4ly1
宝典进展：https://www.yuque.com/chenssy/sike-java/en9ned7loo47z5aw

目前 Java 面试宝典累计更新 400+ 道，总字数 42w+。大明哥还在持续更新中，下图是大明哥在 2024-12 月份的更新情况：

想了解详情的小伙伴，扫描下面二维码加大明哥微信【daming091】咨询

同时，大明哥也整理一套目前市面最常见的热点面试题。微信搜[大明哥聊 Java]或扫描下方二维码关注大明哥的原创公众号[大明哥聊 Java] ，回复【面试题】即可免费领取。

阅读全文