那 Kafka 到底在什么情况下才能保证消息不丢失呢?

Kafka 只对“已提交”的消息(committed message)做有限度的持久化保证。

    第一个核心要素是“已提交的消息”。什么是已提交的消息?当 Kafka 的若干个 Broker 成

功地接收到一条消息并写入到日志文件后,它们会告诉生产者程序这条消息已成功提交。此

时,这条消息在 Kafka 看来就正式变为“已提交”消息了。

    那为什么是若干个 Broker 呢?这取决于你对“已提交”的定义。你可以选择只要有一个

Broker 成功保存该消息就算是已提交,也可以是令所有 Broker 都成功保存该消息才算是

已提交。不论哪种情况,Kafka 只对已提交的消息做持久化保证这件事情是不变的。

    第二个核心要素就是“有限度的持久化保证”,也就是说 Kafka 不可能保证在任何情况下

都做到不丢失消息。举个极端点的例子,如果地球都不存在了,Kafka 还能保存任何消息

吗?显然不能!倘若这种情况下你依然还想要 Kafka 不丢消息,那么只能在别的星球部署

Kafka Broker 服务器了。

    现在你应该能够稍微体会出这里的“有限度”的含义了吧,其实就是说 Kafka 不丢消息是

有前提条件的。假如你的消息保存在 N 个 Kafka Broker 上,那么这个前提条件就是这 N

个 Broker 中至少有 1 个存活。只要这个条件成立,Kafka 就能保证你的这条消息永远不会

丢失。

     总结一下,Kafka 是能做到不丢失消息的,只不过这些消息必须是已提交的消息,而且还要

满足一定的条件。当然,说明这件事并不是要为 Kafka 推卸责任,而是为了在出现该类问

题时我们能够明确责任边界。

最佳实践

  • 不要使用 producer.send(msg),而要使用 producer.send(msg, callback)。记住,一

定要使用带有回调通知的 send 方法。

  •  设置 acks = all。acks 是 Producer 的一个参数,代表了你对“已提交”消息的定义。

如果设置成 all,则表明所有副本 Broker 都要接收到消息,该消息才算是“已提交”。

这是最高等级的“已提交”定义。

  •  设置 retries 为一个较大的值。这里的 retries 同样是 Producer 的参数,对应前面提到

的 Producer 自动重试。当出现网络的瞬时抖动时,消息发送可能会失败,此时配置了retries > 0 的 Producer 能够自动重试消息发送,避免消息丢失。

  • 设置 unclean.leader.election.enable = false。这是 Broker 端的参数,它控制的是哪

些 Broker 有资格竞选分区的 Leader。如果一个 Broker 落后原先的 Leader 太多,那么

它一旦成为新的 Leader,必然会造成消息的丢失。故一般都要将该参数设置成 false,

即不允许这种情况的发生。

  • 设置 replication.factor >= 3。这也是 Broker 端的参数。其实这里想表述的是,最好将

消息多保存几份,毕竟目前防止消息丢失的主要机制就是冗余。

6. 设置 min.insync.replicas > 1。这依然是 Broker 端参数,控制的是消息至少要被写入

到多少个副本才算是“已提交”。设置成大于 1 可以提升消息持久性。在实际环境中千

万不要使用默认值 1。

  • 确保 replication.factor > min.insync.replicas。如果两者相等,那么只要有一个副本挂

机,整个分区就无法正常工作了。我们不仅要改善消息的持久性,防止数据丢失,还要

在不降低可用性的基础上完成。推荐设置成 replication.factor = min.insync.replicas +

1。

  • 确保消息消费完成再提交。Consumer 端有个参数 enable.auto.commit,最好把它设

置成 false,并采用手动提交位移的方式。就像前面说的,这对于单 Consumer 多线程

处理的场景而言是至关重要的。


推荐阅读

  • 事件风暴在DDD中的应用
  • 网关层数据脱敏
  • 建立估算软件开发工作量的方法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/88343.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/88343.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/88343.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

集成CommitLInt+ESLint+Prettier+StyleLint+LintStaged

代码可读性低代码 代码规范落地难代码格式难统一代码质量低下 配置 ESLint ESLint 是一个用来识别 ECMAScript 并且按照规则给出报告的代码检测工具,使用它可以避免低级错误和统一代码的风格。它拥有以下功能: 查出 JavaScript 代码语法问题。根据配置…

寻找两个正序数组的中位数(C++)

给定两个大小分别为 m 和 n 的正序(从小到大)数组 nums1 和 nums2。请你找出并返回这两个正序数组的 中位数 。算法的时间复杂度应该为 O(log (mn)) 。示例 1:输入:nums1 [1,3], nums2 [2] 输出:2.00000 解释&#x…

Expected Sarsa 算法的数学原理

🌟 一、Expected Sarsa 算法的数学原理 1. 什么是 Expected Sarsa? Expected Sarsa 是一种基于 时序差分(Temporal Difference, TD)学习 的强化学习算法,用于估计 动作值函数 ( q_{\pi}(s, a) )。它是 Sarsa 算法的一种…

Vue的watch和React的useEffect

参考文章:https://zhuanlan.zhihu.com/p/686329898

idea中合并git分支

1.把本地dev代码合并到本地master代码在提交代码之前,先确保dev和master都拉取了最新的代码都进行了Git->pull了这时候确保Local的第一个分支是master分支,然后选择dev分支 ,鼠标右键-》Merge dev into master这时候会提示 有合并到本地master最新的代…

《Spring 中上下文传递的那些事儿》Part 7:异步任务上下文丢失问题详解

📝 Part 7:异步任务上下文丢失问题详解 在现代 Java 应用中,异步编程已经成为提升性能、解耦业务逻辑的重要手段。无论是使用 CompletableFuture、线程池(ExecutorService)、定时任务(ScheduledExecutorSe…

大语言模型驱动智能语音应答:技术演进与架构革新

在智能客服、电话银行等场景中,用户时常遇到这样的困境:“请描述您的问题...抱歉没听清,请重试...正在为您转接人工”。传统语音应答(IVR)系统受限于规则引擎与浅层语义理解,难以应对复杂多变的自然语言表达…

【Linux】内存管理

要求:1、编写程序,实现如下功能。(1)随机生成 1000000 个 0~1 之间的数;(2)统计分析这些数据,计算均值、方差和分布情况,分布情况按0.01 的步长进行统计;&…

苍穹外卖—day1

文章目录前言一、接口文档导入与生成二、前端环境搭建三、后端环境搭建1. 了解项目结构2. 环境搭建常见问题总结前言 (简要说明笔记的目的:记录搭建过程、关键配置和结构理解) 一、接口文档导入与生成 Apifox 导入 使用工具:https…

基于微信小程序的在线疫苗预约小程序源码+论文

基于微信小程序的在线疫苗预约系统源码论文代码可以查看文章末尾⬇️联系方式获取,记得注明来意哦~🌹 分享万套开题报告任务书答辩PPT模板 作者完整代码目录供你选择: 《SpringBoot网站项目》800套 《SSM网站项目》1200套 《小程序项目》600套…

Windows 11 安装过程中跳过微软账户创建本地账户

背景 在 Windows 11 的安装和设置过程中,Microsoft 账号登录是默认的认证方式。然而,在某些情况下,可能需要绕过此步骤以创建本地账户。 微软在 2025 年 3 月推送的 Windows 11 预览版(Build 26120.3653 和 Build 26200.5516&am…

利用DBeaver实现异构数据库数据定时任务同步

1、背景 本需求需要实现抽取KingBaseEs数据库的某几张表数据,定时同步到MySQL中 2、工具准备 2.1 DBeaverEE25.1(必须要企业版,如果用社区版没有定时任务功能) https://dbeaver.io/download/ 2.2 KingBaseEs数据库及驱动 https://www.kingbase.com…

【TCP/IP】1. 概述

1. 概述1. 概述1.1 因特网及技术催生新时代1.1.1 信息化时代1.1.2 关键技术1.1.3 国家战略1.2 网络互联的动机和技术1.2.1 网络互联的动机1.2.2 网络互联技术1.3 因特网的形成和发展1.3.1 国际因特网发展轨迹1.3.2 中国互联网发展1.4 有关因特网的组织机构1.5 请求注解&#xf…

中老年人的陪伴,猫咪与机器人玩具有什么区别?

在人口结构深度老龄化的背景下,中老年群体的精神需求与情感陪伴已成为重要的社会议题。猫咪作为活生生的伴侣动物,与日新月异的智能陪伴机器人,代表了两种截然不同的情感慰藉路径——前者承载着生命互动的温度与责任,后者则彰显了…

day11-微服务面试篇

微服务在面试时被问到的内容相对较少,常见的面试题如下:SpringCloud有哪些常用组件?分别是什么作用?服务注册发现的基本流程是怎样的?Eureka和Nacos有哪些区别?Nacos的分级存储模型是什么意思?R…

昇腾 k8s vnpu配置

参考文档: https://www.hiascend.com/document/detail/zh/mindx-dl/500/AVI/cpaug/cpaug_018.html 此文档实现为NPU910B3卡 主机设置静态虚拟npu 设置虚拟化模式 !本命令只支持再物理机执行,取值为0或1,(如果是在虚拟机内划分vNPU…

Redis常用数据结构以及多并发场景下的使用分析:Set类型

文章目录前言redis中的set结构疑问1 :为什么使用数组后 整体时间复杂度还是O(1)疑问2: set特性是无序的那为什么当元素少的时候 用连续数组 去存储呢?疑问3:当元素少于512的时候即使用intset存储的时候 是如何维护唯一性的&#x…

Linux中rw-rw-r--相关的访问权限讲解

下面就是关于 rw-rw-r-- 的知识图谱式讲解。核心节点:rw-rw-r-- (文件权限表示法) 这是一个在 Linux/Unix 操作系统中,通过 ls -l 命令查看到的,用于描述文件或目录访问权限的10字符字符串。分支一:字符串的解剖 (Anatomy of the …

C#异常处理:更优雅的方式

C#异常处理:更优雅的方式 在 C# 编程的世界里,异常处理是绕不开的重要环节。程序运行时难免会出现各种意外,若处理不当,可能导致程序崩溃,给用户带来糟糕体验。所以,掌握更优雅的异常处理方式,对…

Qt6中模态与非模态对话框区别

一.阻塞 vs 非阻塞1.模态对话框阻塞父窗口:打开后,用户必须先处理该对话框(关闭或完成操作),才能继续操作父窗口。应用场景:强制用户立即响应的场景,如确认对话框、登录窗口、文件选择器等。2.非…