Kafka的幂等性

Mr.Wang大约 3 分钟

我是 javapub，一名 Markdown 程序员从👨‍💻，八股文种子选手。

：嗨，小明！听说你对Kafka的幂等性很感兴趣，是吗？

是的，我一直听说Kafka的幂等性很重要，但是具体是什么意思呢？

：哈哈，别担心，我来给你解释一下。幂等性其实就是指无论执行多少次相同的操作，结果都是一样的。在Kafka中，幂等性保证了消息的处理不会因为重复发送而产生副作用。

哦，明白了！那Kafka是怎么实现幂等性的呢？

：很好的问题！Kafka通过消息的唯一标识（通常是消息的key）来实现幂等性。在发送消息之前，Kafka会检查消息的key是否已经存在于特定的主题分区中。如果存在，Kafka就会认为这是一条重复的消息，并且不会将其写入分区。

那如果我想要发送相同的消息，但是又希望它们被写入分区怎么办呢？

：好问题！为了解决这个问题，Kafka引入了幂等性序列号（Idempotent Sequence Number）。每个生产者都会生成一个唯一的序列号，并将其附加到消息中。Kafka会使用这个序列号来判断消息的唯一性，而不是仅仅依赖于消息的key。这样，即使发送相同的消息，只要序列号不同，Kafka仍然会将其写入分区。

哇，这个设计真巧妙！那Kafka是如何保证幂等性的呢？

：很好奇心！Kafka使用了一种叫做"幂等性写入"的机制。当生产者发送消息时，Kafka会为每个分区维护一个递增的序列号。在写入消息之前，Kafka会检查消息的序列号是否大于分区中最后一条消息的序列号。如果是，Kafka会将消息写入分区，并更新序列号；如果不是，Kafka会认为这是一条重复的消息，并且不会写入分区。

哇，这样一来，就能保证消息不会被重复写入了！Kafka真是个聪明的家伙！

：是的，Kafka的设计确实很巧妙。通过幂等性的机制，Kafka能够保证消息的可靠性和一致性，让我们在处理大规模数据流时更加放心。

面试官，谢谢你的解答！我对Kafka的幂等性有了更深入的理解。

：不客气，小明！如果你还有其他关于Kafka或者其他技术的问题，随时都可以问我。记得在学习和工作中保持好奇心，不断探索新的知识和技术！

最近我在更新《面试1v1》系列文章，主要以场景化的方式，讲解我们在面试中遇到的问题，致力于让每一位工程师拿到自己心仪的offer，感兴趣可以关注公众号JavaPub追更！

🎁目录合集：

Gitee：https://gitee.com/rodert/JavaPub

GitHub：https://github.com/Rodert/JavaPub

http://javapub.net.cn