当前位置: 首页 > ds >正文

DeepSeek致谢腾讯!

近日,DeepSeek公开致谢腾讯技术团队,盛赞其对DeepEP通信框架的优化为“huge speedup(巨大的加速)”级代码贡献。

DeepEP是DeepSeek于今年2月开源的五大核心代码库之一,专为AI大模型的专家混合(MoE)架构设计,凭借突破性技术将通信效率提升300%,打破MoE模型对英伟达NCCL的依赖。但该框架在成本更低、应用广泛的RoCE网络中存在性能短板,成为开源社区关注的焦点。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻坚,精准锁定两大瓶颈:双端口网卡带宽利用率不足、CPU控制面交互时延过高。经针对性优化,DeepEP在RoCE网络环境下性能实现100%翻倍提升,在IB(InfiniBand)网络中也斩获30%的效率增长,成功突破原有技术限制。

目前,优化后的DeepEP已全面开源,并应用于腾讯混元大模型等项目的训练推理环节。在腾讯星脉与H20服务器搭建的高性能环境中,该方案展现出优异的通用性,为企业AI大模型训练提供了更高效、经济的解决方案。

只有适应变化、迅速学习新技能的人才才能在未来就业市场中占据优势。无论前方是机遇还是挑战,提前做好准备都是关键所在 。现在正是学习AI的最佳时机。

http://www.xdnf.cn/news/5184.html

相关文章:

  • 热蛋白质组分析(TPP)技术的优劣势探讨
  • EPS三维测图软件
  • CDGP重点知识梳理(82个)
  • 20250509 相对论中的\*\*“无空间”并非真实意义上的虚无,而是时空结构尚未形成\*\*的状态。 仔细解释下这个
  • (undone) MIT6.S081 Lec17 VM for APP 学习笔记
  • LeetCode面试题 17.21 直方图的水量
  • 基于扩展卡尔曼滤波(EKF)目标轨迹算法仿真实例
  • 五一旅游潮涌:数字化如何驱动智慧旅游升级
  • IP协议.
  • GUC并发编程和SpringCloud,二者之间的关系
  • MySQL核心内容【持续更新中】
  • Linux——MySQL基础
  • SSH(安全外壳协议)
  • O2OA(翱途)开发平台系统安全-用户登录IP限制
  • 从RR到RC:解析大厂数据库隔离级别变革的背后逻辑
  • ‌2.4G芯片无晶振方案的技术影响分析
  • istio in action之流量控制与路由
  • 深入理解 Istio v1.25.2
  • 后缀表达式+栈(详解)(c++)
  • 自由学习记录(59)
  • WHAT - Node vs Python 执行速度
  • 如何把win10 wsl的安装目录从c盘迁移到d盘
  • DevExpressWinForms-布局容器之PanelControl
  • Linux服务:Nginx服务重写功能
  • 不同渲染任务,用CPU还是GPU?
  • 什么是项目管理的经营思维本质,怎样将其应用于项目实践
  • 解锁健康养生新境界
  • 【RAG】Milvus、Pinecone、PgVector向量数据库索引参数优化
  • UI设计公司兰亭妙微分享:汽车 MHI 设计的界面布局创新法则
  • Ubuntu 第11章 网络管理_常用的网络配置命令