当前位置: 首页 > news >正文

【C/C++】从零开始掌握Kafka

文章目录

  • 从零开始掌握Kafka
    • 一、Kafka 基础知识理解(理论)
      • 1. 核心组件与架构
      • 2. 重点概念解析
    • 二、Kafka 面试重点知识梳理
    • 三、C++ 使用 Kafka 的实践(librdkafka)
      • 1. librdkafka 简介
      • 2. 安装 librdkafka
    • 四、实战:高吞吐生产者与消费者
      • 1. 生产者示例(Producer.cpp)
      • 2. 消费者示例(Consumer.cpp)
    • 五、Kafka 开发相关 C++ 能力要求
      • 必备 C++ 能力
      • 推荐工具链
    • 六、项目实践建议
      • 1. 项目目标
      • 2. 模块设计建议
    • 七、推荐资料与开源项目

从零开始掌握Kafka

一、Kafka 基础知识理解(理论)

1. 核心组件与架构

组件作用
BrokerKafka 节点,负责存储消息
Topic消息主题,逻辑上的分类
Partition一个 Topic 的分片,支持并发与扩展性
Producer负责发送消息
Consumer负责消费消息
Consumer Group多消费者协作消费
Zookeeper / KRaft负责元数据与协调(未来版本转向 KRaft 模式)

2. 重点概念解析

  • Partition:分片,支持水平扩展(每个 partition 是一个有序日志)。

  • 副本机制(Replication):每个 Partition 有一个 leader + N 个 follower,保证高可用。

  • 消费者组(Consumer Group):Kafka 实现广播和负载均衡消费的机制。

  • offset 管理

    • 自动提交(enable.auto.commit)
    • 手动提交(commitSync / commitAsync)
    • Kafka 默认 offset 存在 __consumer_offsets topic 中。

二、Kafka 面试重点知识梳理

面试点说明
消息顺序性同一个 partition 内有顺序,跨 partition 无法保证
幂等性生产使用 enable.idempotence=true,避免 producer 重试造成重复发送
分布式一致性ISR 机制,消息写入需同步到 follower;ACK=all 实现强一致
消费位点提交手动提交 offset 是保证消费语义精确一次的关键
Rebalance 原理消费者上下线会触发 Rebalance,导致 partition 分配变化

三、C++ 使用 Kafka 的实践(librdkafka)

1. librdkafka 简介

  • 官方提供的高性能 C/C++ Kafka 客户端库。

  • GitHub 地址:https://github.com/edenhill/librdkafka

  • 支持:

    • 高吞吐的生产与消费
    • offset 提交
    • topic/partition 管理
    • 幂等发送、压缩、批处理

2. 安装 librdkafka

# Ubuntu
sudo apt-get install librdkafka-dev# Or from source
git clone https://github.com/edenhill/librdkafka.git
cd librdkafka
./configure
make
sudo make install

四、实战:高吞吐生产者与消费者

1. 生产者示例(Producer.cpp)

#include <librdkafka/rdkafkacpp.h>class ExampleDeliveryReportCb : public RdKafka::DeliveryReportCb {
public:void dr_cb(RdKafka::Message &message) override {if (message.err()) {std::cerr << "Delivery failed: " << message.errstr() << std::endl;} else {std::cout << "Delivered message to " << message.topic_name()<< " [" << message.partition() << "] at offset "<< message.offset() << std::endl;}}
};int main() {std::string errstr;std::string topic = "test_topic";RdKafka::Conf *conf = RdKafka::Conf::create(RdKafka::Conf::CONF_GLOBAL);conf->set("bootstrap.servers", "localhost:9092", errstr);ExampleDeliveryReportCb dr_cb;conf->set("dr_cb", &dr_cb, errstr);RdKafka::Producer *producer = RdKafka::Producer::create(conf, errstr);delete conf;for (int i = 0; i < 10000; ++i) {std::string message = "Message " + std::to_string(i);producer->produce(topic, RdKafka::Topic::PARTITION_UA,RdKafka::Producer::RK_MSG_COPY,const_cast<char *>(message.c_str()), message.size(),nullptr, 0, 0, nullptr);producer->poll(0); // 异步发送需要poll触发回调}producer->flush(10000); // 等待所有消息发送完成delete producer;
}

2. 消费者示例(Consumer.cpp)

#include <librdkafka/rdkafkacpp.h>int main() {std::string errstr;RdKafka::Conf *conf = RdKafka::Conf::create(RdKafka::Conf::CONF_GLOBAL);conf->set("bootstrap.servers", "localhost:9092", errstr);conf->set("group.id", "my_group", errstr);conf->set("enable.auto.commit", "false", errstr); // 手动提交RdKafka::KafkaConsumer *consumer = RdKafka::KafkaConsumer::create(conf, errstr);delete conf;std::vector<std::string> topics = {"test_topic"};consumer->subscribe(topics);while (true) {RdKafka::Message *msg = consumer->consume(1000);switch (msg->err()) {case RdKafka::ERR_NO_ERROR:std::cout << "Read msg at offset " << msg->offset()<< ": " << static_cast<const char *>(msg->payload()) << std::endl;consumer->commitAsync(msg);  // 或 commitSync(msg)break;case RdKafka::ERR__TIMED_OUT:break;default:std::cerr << "Error: " << msg->errstr() << std::endl;}delete msg;}consumer->close();delete consumer;
}

五、Kafka 开发相关 C++ 能力要求

必备 C++ 能力

  • 熟练使用 RAII、智能指针、异常处理
  • 理解线程安全、异步模型(poll, callback)
  • 能够结合 JSON/XML 配置 Kafka 客户端
  • 编写模块化、高性能的消息收发组件

推荐工具链

  • 构建系统:CMake
  • 日志:spdlog 或 glog
  • 单元测试:gtest
  • JSON:nlohmann/json

六、项目实践建议

1. 项目目标

构建一个 C++ Kafka 模块,支持:

  • 高吞吐量生产(批量发送,压缩)
  • 幂等性保障
  • 多线程消费 + 位点提交策略
  • 简单的失败重试机制
  • 支持 JSON 格式的序列化消息

2. 模块设计建议

模块功能
KafkaProducer封装 Producer 初始化/发送逻辑
KafkaConsumer封装 Consumer + offset 管理
ConfigManager读取配置
Message消息封装与解析(支持 JSON)

七、推荐资料与开源项目

  • 📚 Kafka 权威指南(原书第2版)

  • 📘 librdkafka 文档

  • 📖 Apache Kafka 官方文档

  • 💻 开源项目参考:

    • confluent-kafka-cpp
    • cppkafka(封装更现代 C++)
http://www.xdnf.cn/news/634537.html

相关文章:

  • P2676 [USACO07DEC] Bookshelf B
  • 电商小程序店铺详情页:头部无限分类与筛选功能实现
  • LabVIEW实战项目推荐与学习建议
  • 打卡第28天:装饰器
  • 【HarmonyOS5】DevEco Studio 预览器与模拟工具详解
  • 掌握聚合函数:COUNT,MAX,MIN,SUM,AVG,GROUP BY和HAVING子句的用法,Where和HAVING的区别
  • TIGER - 一个轻量高效的语音分离模型,支持人声伴奏分离、音频说话人分离等 支持50系显卡 本地一键整合包下载
  • 【Android】非System用户下Persist应用不自动拉起
  • 破解C/C++内存分配与管理:内存对象模型硬核剖析
  • LeetCode-图论-岛屿数量+腐烂的橘子
  • Leetcode 3103. 查找热门话题标签 II
  • 仓鼠找sugar--lca+图论判断点在路径
  • LangChain02-Agent与Memory模块
  • git子模块--命令--列表版
  • 机器学习——支持向量机SVM
  • 类欧几里得算法(floor_sum)
  • uni-app学习笔记十四-vue3中emit的使用
  • Lua 脚本在 Redis 中的运用-23(Lua 脚本语法教程)
  • 计算机视觉中的可重复性:深入案例分析与Python代码实现
  • 【MySQL成神之路】MySQL函数总结
  • 【寻找Linux的奥秘】第八章:进程控制
  • 我的第1个爬虫程序——豆瓣Top250爬虫的详细步骤指南
  • 云原生安全:网络协议TCP详解
  • GO 语言进阶之 时间处理和Json 处理
  • 2025.05.23 Axure 动态面板学习笔记
  • Python经典算法实战
  • 股票程序化交易-使用python获取新浪财经期货行情数据
  • 历年吉林大学保研上机真题
  • 历年复旦大学保研上机真题
  • React整合【ECharts】教程003:关系图的构建和基本设置