当前位置: 首页 > ai >正文

Kafka Controller的作用是什么?故障时如何恢复? (管理分区和副本状态;通过ZooKeeper选举新Controller)

Apache Kafka Controller 是 Kafka 集群的核心协调组件,主要承担两大核心职责:

一、核心作用

  1. 分区领导者选举 1
// 分区领导者选举逻辑示例(伪代码)
def electLeader(partition: Partition): Unit = {val isr = partition.inSyncReplicasval newLeader = isr.minBy(_.brokerId) // 实际使用更复杂算法partition.leader = newLeader
}
  1. 副本状态管理
  • 维护所有分区的 ISR(In-Sync Replicas)列表
  • 监控副本同步状态(通过 replica.lag.time.max.ms 参数)
  1. 集群元数据维护
  • 处理 Broker 上下线事件
  • 触发分区重分配(如使用 kafka-reassign-partitions 时)

二、故障恢复机制

  1. Controller 选举流程 2
# ZooKeeper 临时节点路径
ls /controller # 查看当前 Controller ID# 选举过程伪代码
1. 监控 /controller 节点消失
2. 各 Broker 尝试创建临时节点
3. 最先创建成功的成为新 Controller
  1. 故障恢复步骤
  • 元数据重建:从 ZooKeeper 加载 topics/brokers 数据
  • 状态机重置:重建分区状态机(PartitionStateMachine)和副本状态机(ReplicaStateMachine)
  • 补偿操作:处理故障期间未完成的管控请求

补充说明

  • 从 Kafka 2.8 版本开始支持 KRaft 模式(不依赖 ZooKeeper),故障恢复机制改为基于 Raft 共识算法 3
  • Controller 故障期间,已有生产消费不受影响,但无法执行管理操作(如创建 topic)
http://www.xdnf.cn/news/4350.html

相关文章:

  • Linux系统Shell脚本之shell函数
  • Kafka的核心组件有哪些?简要说明其作用。 (Producer、Consumer、Broker、Topic、Partition、ZooKeeper)
  • java多线程------synchronized
  • CVE体系若消亡将如何影响网络安全防御格局
  • git合并分支后回滚,再次合并导致更改没有合并的问题
  • CentOS 7 基础环境安装脚本
  • Milvus(16):索引解释
  • 【前端基础】6、CSS的文本属性(text相关)
  • 嵌入式通信协议总览篇:万物互联的基石
  • 记一次SSE数据被缓存导致实时性失效问题
  • 链表——C语言
  • 常见的卷积神经网络列举
  • 用go从零构建写一个RPC(仿gRPC,tRPC)--- 版本1(Client端)
  • Umi+React+Xrender+Hsf项目开发总结
  • 基于Django汽车数据分析大屏可视化系统项目
  • SSHv2 密钥交换(Key Exchange)详解
  • 体育培训的实验室管理痛点 质检LIMS如何重构体育检测价值链
  • TikTok 矩阵运营新手实操保姆级教程 2.0 版本
  • 从一次被抄袭经历谈起:iOS App 安全保护实战
  • 【AWS+Wordpress-准备阶段】AWS注册+创建EC2实例
  • Scrapy框架之Scrapyd部署及Gerapy分布式爬虫管理框架的使用
  • 记录学习《手动学习深度学习》这本书的笔记(十)
  • 协方差与皮尔逊相关系数:从定义到应用的全面解析
  • isNotBlank和isNotEmpty有什么区别?
  • Python学习笔记--FastAPI入门常规操作
  • penEuler操作系统结合豆包测试github仓库8086-Emulator项目
  • react中的用法——setDisabled dva dispatch effects
  • leetcode 160. 相交链表
  • os梳理5——第五章:存储器管理
  • 汽车免拆诊断案例|车辆行驶中急加速车身抖动故障排除 2 例