当前位置: 首页 > ai >正文

数据湖技术之Iceberg-03 Iceberg整合Flink 实时写入与增量读取

文章目录

  • 数据湖技术
    • 数据湖技术之Iceberg
      • Flink 与 Iceberg 整合
        • 1. DataFrame API 操作 Iceberg
          • DataStream API实时写入Iceberg表
          • DataStream API 批量/实时读取 Iceberg 表
          • 指定基于快照实时增量读取数据
          • 合并data files
        • 2. SQL API 操作 Iceberg
          • SQL API 创建 Iceberg 表并写入数据
          • SQL API 批量查询 Iceberg 表数据
          • SQL API 实时查询 Iceberg 表数据
          • SQL API 指定基于快照实时增量读取数据
        • 3. SQL API读取kafka数据实时写入Iceberg表
      • Iceberg 与 Hudi 对比
        • 1. 共同点
        • 2. 不同点

数据湖技术

数据湖技术之Iceberg

Flink 与 Iceberg 整合

  • Flink 版本:1.14.4
  • iceberg:0.13.2
  • Maven依赖:
<!-- Flink与Iceberg整合的依赖包-->
<dependency><groupId>org.apache.iceberg</groupId><artifactId>iceberg-flink-runtime-1.14</artifactId><version>${iceberg.version}</version>
</dependency>
<!-- 开发Flink程序依赖包-->
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-java</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-streaming-java_${scala.version}</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-clients_2.12</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-streaming-scala_${scala.version}</artifactId><version>${flink.version}</version>
</dependency>
<!-- Flink Kafka连接器依赖包-->
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-connector-kafka_${scala.version}</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-connector-base</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-csv</artifactId><version>${flink.version}</version>
</dependency>
<!-- 读取 hdfs 文件需要 jar 包-->
<dependency><groupId>org.apache.hadoop</groupId><artifactId>hadoop-client</artifactId><version>${hadoop.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-table-common</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-table-api-java</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-table-api-java-bridge_${scala.version}</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-table-planner_${scala.version}</artifactId><version>${flink.version}</version>
http://www.xdnf.cn/news/14857.html

相关文章:

  • 创意Python爱心代码
  • 7.7晚自习作业
  • 基于Java+SpringBoot的在线小说阅读平台
  • 以科技为刃,铸强国之基
  • 【Swift开发】屏蔽NSSecureCoding频繁警告
  • Chatbox➕知识库➕Mcp = 机器学习私人语音助手
  • 2025 年使用大模型进行软件工程:现实检验
  • [附源码+数据库+毕业论文]基于Spring+MyBatis+MySQL+Maven+jsp实现的高校实验室资源综合管理系统,推荐!
  • 汽车功能安全系统阶段开发【技术安全需求TSR】4
  • 算法学习笔记:8.Bellman-Ford 算法——从原理到实战,涵盖 LeetCode 与考研 408 例题
  • Python 3 -- 第一章 基础语法
  • RSTP 拓扑收敛机制
  • 牛客周赛99
  • java ThreadLocal源码分析
  • 基于Java+springboot 的车险理赔信息管理系统
  • centos7.9安装ffmpeg6.1和NASM、Yasm、x264、x265、fdk-aac、lame、opus解码器
  • CentOS-7的“ifupdown“与Debian的“ifupdown“对比 笔记250706
  • 【LeetCode 热题 100】240. 搜索二维矩阵 II——排除法
  • [netty5: WebSocketFrameEncoder WebSocketFrameDecoder]-源码解析
  • 《Spring AI实战:Java智能开发速成指南》
  • 设计模式---观察者模式(发布-订阅模式)
  • 【STM32】通用定时器PWM
  • Spring AI(12)——调用多模态模型识别和生成图像
  • 关于笔记本充电,使用氮化镓充电器
  • Omi录屏专家 Screen Recorder by Omi 屏幕录制Mac
  • 高效处理大体积Excel文件的Java技术方案解析
  • 云原生 Serverless 架构下的智能弹性伸缩与成本优化实践
  • SNAT DNAT实验
  • 探索实现C++ STL容器适配器:优先队列priority_queue
  • MySQL CDC与Kafka整合指南:构建实时数据管道的完整方案