当前位置: 首页 > backend >正文

数据并行基础概念知识

架构分为PS与ring-allreduce;方法主要是zero系列zeroDP123、ZeroR 、Zero-offerload、Zero-Infinite、Zero++
相关博客介绍的很清楚,在这里总结一下
图解系列很通透,通俗易懂1
更详细的介绍后面几种方式,提供动图链接2
提供混合精度解读3
Ring All-reduce的数学推导4
图片画的很漂亮5
对checkout技术进行补充说明6
比较通俗易懂7


  1. # 图解大模型训练之:数据并行下篇(ZeRO,零冗余优化) ↩︎

  2. # Zero系列三部曲:Zero、Zero-Offload、Zero-Infinity ↩︎

  3. # 论文精读:Mixed Precision Training ↩︎

  4. # 手把手推导Ring All-reduce的数学性质 ↩︎

  5. # ZeRO: Zero Redundancy Optimizer,一篇就够了。 ↩︎

  6. # 大模型并行训练技术(一)—— ZeRO系列 ↩︎

  7. # DeepSpeed之ZeRO系列:将显存优化进行到底 ↩︎

http://www.xdnf.cn/news/5511.html

相关文章:

  • openai接口参数max_tokens改名max-completion-tokens?
  • 17前端项目----支付弹框
  • 10.二叉搜索树中第k小的元素(medium)
  • 用pymysql操作数据库
  • POST请求 、响应、requests库高级用法
  • 甜蜜聊天话术库
  • Go语言标识符
  • 嵌入式STM32学习——433M无线遥控灯
  • AI-Talk开发板之驱动1.28寸圆屏
  • 深入理解 Polly:.NET Core 中的健壮错误处理策略
  • HTTP/1.1 host虚拟主机详解
  • USB学习【6】USB传输错误的处理
  • Typescript 源码核心流程
  • 【C语言练习】035. 编写结构体的函数
  • MySQL视图深度解析:从基础语法到高级应用
  • Mask-aware Pixel-Shuffle Down-Sampling (MPD) 下采样
  • vector 常见用法及模拟
  • 算法题(144):跳石头
  • 游戏逆向开发全阶段电子资料分享 – 从入门到精通实战教程
  • 软件架构师知识点总结
  • nfs挂载
  • python实现用户登录
  • 系统架构设计(四):架构风格总结
  • 常见的 DCGM 设备级别指标及其含义
  • 2024睿抗编程赛国赛-题解
  • 作业...
  • 【C/C++】无符号调试:GDB解栈实战指南
  • nrf52832 ble_app_templete_s132及nrf5_sdk packs下载安装
  • 使用FastAPI和React以及MongoDB构建全栈Web应用07 FastAPI实现经典三层架构
  • 2025低空经济发展趋势