当前位置: 首页 > ds >正文

Day34打卡 @浙大疏锦行

知识点回归:

  1. CPU性能的查看:看架构代际、核心数、线程数
  2. GPU性能的查看:看显存、看级别、看架构代际
  3. GPU训练的方法:数据和模型移动到GPU device上
  4. 类的call方法:为什么定义前向传播时可以直接写作self.fc1(x)

作业

 

  1. 计算资源分配与调度:虽然losses.append(loss.item()) 是同步操作,但 GPU 和 CPU 之间的资源分配与调度并非简单线性。每次记录操作时,系统可能会根据当前整体负载、其他进程占用资源情况等动态调整资源分配。比如,即使记录次数减少,如果此时系统中其他任务占用了 CPU 或 GPU 资源,也会影响计算时长,导致剩余时长不按记录次数成比例变化。
  2. 硬件特性与缓存机制:硬件层面的缓存机制会影响计算速度。当记录间隔不同时,数据在缓存中的命中情况会变化。记录间隔小,数据频繁访问,可能存在缓存未及时更新或频繁失效的情况;记录间隔大,数据访问间隔长,缓存可能在较长时间内保持有效。这些都会对实际计算时间产生影响,破坏记录次数和剩余时长的线性关系。
  3. 计算任务的复杂性与动态性:深度学习训练中的计算任务并非完全均一。不同的记录间隔下,每次计算涉及的数据量、计算图的构建与执行等可能存在差异。比如,间隔小的时候,每次计算的数据可能存在更多中间依赖,计算图更复杂,即使记录次数多,也不一定能简单按比例反映在剩余时长上。

@浙大疏锦行

http://www.xdnf.cn/news/8569.html

相关文章:

  • debian12下安装搜狗输入法
  • 计算机系统结构1-3章节 期末背诵内容
  • Keil调试(2)不停止调试
  • 算法修仙传 第二章 坊市奇遇:链表操作入门
  • sessionStorage 和localStorage
  • Lock锁
  • 2025.05.22-携程春招机考真题解析-第一题
  • 思 维 方 式
  • 生产环境CPU飙升问题排查与优化实战
  • 后端环境配置
  • C/C++的OpenCV 进行轮廓提取
  • FastAPI 入门指南
  • 阿里通义千问3(Qwen3)开源掀桌子(附完整使用教程)
  • PET,Prompt Tuning,P Tuning,Lora,Qlora 大模型微调的简介
  • AI编程对传统软件开发的冲击和思考
  • 【Python数据库全栈指南】从SQL到ORM深度实践
  • youyu:91501
  • 互联网大厂Java求职面试:Spring Boot 3.2+自动配置原理、AOT编译及原生镜像
  • 嵌入式系统C语言编程常用设计模式---参数表驱动设计
  • 快排-P1923求第 k 小的数
  • 开发指南117-文字阴影特效
  • 七彩喜康养护理——科技赋能下的全周期健康守护
  • 60道Angular高频题整理(附答案背诵版)
  • 动态防御体系实战:AI如何重构DDoS攻防逻辑
  • 实时操作系统革命:实时Linux驱动的智能时代底层重构
  • 向量数据库该如何选择?Milvus 、ES、OpenSearch 快速对比:向量搜索能力与智能检索引擎的应用前景
  • 小白学习顺序表 之 通讯录实现
  • JAVA查漏补缺(2)
  • 并发容器(Collections)
  • 文章记单词 | 第109篇(六级)