当前位置: 首页 > ai >正文

回顾|Apache Cloudberry™ (Incubating) Meetup·2025 杭州站

2025 年 4 月 19 日,由酷克数据与中启乘数联合举办的 Apache Cloudberry™ (Incubating) Meetup · 杭州站在浙江省杭州市滨江区滨江会展中心成功举办。本次活动邀请了 Cloudberry PPMC 团队成员、活跃内核贡献者以及中兴 EBASE-A、阿里云 ADB-PG、网易、中启乘数等多家团队的顶尖技术专家,共同探讨 Cloudberry / Greenplum 内核前沿进展、一线生产实践和周边生态工具。活动现场气氛热烈,干货满满,为社区开发者与用户搭建了自由交流的平台,吸引线上线下近千名开发者与用户参与。

让我们一起回顾整场活动的议题干货吧!

Apache Cloudberry 简介与路线图展望

演讲嘉宾:杨瑜(Cloudberry PPMC 成员,酷克数据研发 VP,前 Greenplum 全球研发总监)

活动伊始,酷克数据研发 VP、Apache Cloudberry PPMC 成员杨瑜从项目背景、技术架构到未来规划,全面解读了 Apache Cloudberry 的发展蓝图。作为基于 Greenplum 和 PostgreSQL 的开源 MPP 数据库,Cloudberry 旨在通过开源模式将企业级优化成果回馈社区,解决闭源带来的不确定性。目前 Cloudberry 已正式进入 Apache 孵化器进行孵化,经过社区的充分讨论,已形成项目发展路线图;同时,社区正在准备推出第一个 Apache Release —— Cloudberry 2.0。未来,Cloudberry 将聚焦内核升级、执行引擎优化及社区合作,携手开发者共建开源生态。

酷克数据HashData

Apache Cloudberry 向量化实践:向量数据重分布性能优化

演讲嘉宾:赵熙(Cloudberry 贡献者,内核研发工程师)

酷克数据内核研发工程师、Apache Cloudberry 贡献者赵熙聚焦向量化技术在Join+Motion数据重分布中的性能瓶颈,分享了Cloudberry从系统性能分析到优化落地的完整实践。通过Gandiva表达式优化与分组算法重构,显著降低CPU负载,512节点下耗时从2004ms降至180ms,提速11倍。结合内存布局优化与性能分析工具,有效提升向量化 Join+Motion 吞吐,为大规模查询提供高效支撑。这一分享为内核开发者提供了可落地的优化范式。

酷克数据HashData,赞1

EBASE-A 实时流式入库实现机制及应用实践

演讲嘉宾:柏楠(中兴 EBASE-A 团队工程师)

中兴 EBASE-A 团队工程师柏楠介绍了 EBASE-A 的实时流式入库架构及核心技术。作为支持多写多读、湖仓一体的 OLAP 数据库,EBASE-A 依托自研向量化引擎与存算分离架构实现 PB级分析。其 APFlow 组件通过零拷贝技术将吞吐推至磁盘极限,结合性能为 Flink 两倍的 Saturn 流引擎替代 JStorm 架构,资源消耗降低 50%,入库效率提升 30%,有效支撑通信行业实时数据处理。

酷克数据HashData,赞1

Data+AI 时代下的数据处理分析架构与技术演进 

演讲嘉宾:印才华(阿里云资深技术专家)

阿里云 ADB-PG 技术负责人、阿里云资深技术专家印才华分享了企业在 Data + AI 背景下的数据分析架构演进,特别介绍了基于 Greenplum 构建的阿里云 ADB-PG 云数仓在高性能实时数仓、向量化,以及 In-Database AI 方面的探索洞察与行业用户融合实践。

酷克数据HashData

Greenplum/Cloudberry 第三方管控平台 APCC 详解

演讲嘉宾:唐成(中启乘数科技 CTO)

中启乘数 CTO 唐成分享第三方可视化管控平台 APCC 的设计理念与实践路径。APCC 平台支持多版本、跨平台部署,提供可视化集群管理、一键扩容、慢 SQL 优化等丰富能力,旨在通过“自动化 + 图形化”的方式大幅降低 Greenplum 及 Cloudberry 运维门槛,实现高效、智能的数据库运维。

酷克数据HashData

Apache SeaTunnel 架构解析与 Cloudberry 集成实践

演讲嘉宾:陈虹宇 (Apache SeaTunnel 贡献者,网易数据集成研发工程师)

最后,网易数据集成研发工程师、Apache SeaTunnel 贡献者陈虹宇详细介绍了 SeaTunnel 的核心架构及其与 Cloudberry 的集成方案。Apache SeaTunnel 是一个易用的支持海量数据同步的超高性能分布式数据集成平台;SeaTunnel 中的 Cloudberry 连接器基于标准 JDBC 构建,继承了 PostgreSQL 连接器的所有核心逻辑。通过简单命令,即可实现 Cloudberry 数据库的读写操作,无需复杂配置,使得数据流转更加轻松高效。未来,计划引入基于 gpfdist 协议和外部表机制的全新连接器,充分利用 Cloudberry 的并行计算能力,持续提升大规模数据迁移传输的性能表现。

酷克数据HashData

本次 Meetup 汇聚了来自社区与企业的一线技术力量,分享内容兼具深度与实战价值,涵盖数据库内核、数据集成、运维、AI 融合等多个关键方向,为开发者与用户搭建了高质量的技术交流平台。

特别感谢中启乘数对本次活动的全程支持与协作,也感谢每一位演讲嘉宾与参会者的积极投入,感谢 Apache SeaTunnel 等众多社区合作伙伴的支持!欢迎更多开发者、用户与企业伙伴加入 Apache Cloudberry 社区,共同打造开源时代的分布式数据基础设施!

http://www.xdnf.cn/news/2276.html

相关文章:

  • MyBatis 类型处理器(TypeHandler)注册与映射机制:JsonListTypeHandler和JsonListTypeHandler注册时机
  • 174页Deepseek大模型在银行系统的部署方案
  • 一、I/O的相关概念
  • Spark RDD行动算子与共享变量实战:从数据聚合到分布式通信
  • 基于SpringBoot+PostgreSQL+ROS Java库机器人数据可视化管理系统
  • 热红外遥感在火情监测中有什么作用?
  • 深入Java JVM常见问题及解决方案
  • Java位运算符大全
  • 亚组风险比分析与可视化
  • OceanBase单机重启和配置修改
  • 再学GPIO(一)
  • 汽车制造行业如何在数字化转型中抓住机遇?
  • springboot不连接数据库启动(原先连接了mysql数据库)
  • 【Redis】Redis Zset实现原理:跳表+哈希表的精妙设计
  • C++初阶-STL简介
  • 怎样给MP3音频重命名?是时候管理下电脑中的音频文件名了
  • FlinkUpsertKafka深度解析
  • 重温TCP通信过程
  • C++ 类与对象(中)—— 默认成员函数与运算符重载的深度解析:构造函数,析构函数,拷贝构造函数,赋值运算符重载,普通取地址重载,const取地址重载
  • 【项目篇之垃圾回收】仿照RabbitMQ模拟实现消息队列
  • HTTP header Cookie 和 Set-Cookie
  • 系统架构师---基于规则的系统架构
  • FreeBSD可以不经过windows服务器访问windows机器上的共享文件吗?
  • PID程序实现
  • 高速系统设计理论基础
  • (done) 吴恩达版提示词工程 4. 摘要 (生成摘要,指定信息摘要,提取指定信息,多条评论摘要)
  • 什么是智能导诊知识库?
  • Pinia 详细解析:Vue3 的状态管理利器
  • 【油猴脚本 2】bilibili 视频合集标题搜索
  • 软件维护类型四大类型(IEEE 14764 标准)