当前位置: 首页 > ds >正文

Python day39

@浙大疏锦行 python day39.

        图像数据介绍:区别于机器学习中的数据(特征1,特征2,,,),单个图像数据通常有三维,即(C,H,W)分别代表了通道数、高度以及宽度;而在大规模训练中通常会按照batch的形式训练,此时为四维(B,C,H,W);

        使用MLP神经网络时,就需要将上面的多维数据展平为一维数据(Flatten);

        使用batch训练的模式时,模型的定义并不需要修改,只需要在Dataloader中设置batch size大小即可,Pytorch会自动进行处理,每次从Dataloader中读取batch size大小的数据;

        显存可以看作GPU使用的内存,如果训练过程中显存不够,则会爆出OOT的错误;针对训练过程中占用的显存大致包括如下部分:模型的参数,梯度,优化器状态,输入的数据以及前向传播反向传播中的中见变量,如果不能选择合适的设置可能会导致无法训练;主要通过调整batch size的大小来调整显存的占用,通常合适的 batch_size = 硬件显存允许的最大值 × 0.8(预留安全空间);

        使用batch进行训练时,更新参数所用的梯度为batch内每个样本梯度的平均值,因此使用batch或者较大的batch训练的好处就是可以训练更稳定更迅速,但是相应的显存占用也会增多。

http://www.xdnf.cn/news/17519.html

相关文章:

  • Linux系统之lua 详解
  • 一周学会Matplotlib3 Python 数据可视化-标注 (Annotations)
  • 【线性代数】6二次型
  • Windows设置英文路径显示为中文名称的文件夹
  • Android 设置/修改系统NTP服务地址
  • Golang的本地缓存freecache
  • Nginx 功能扩展与二次开发实践
  • HUAWEI交换机命令基础
  • C++面向对象及其特性
  • AI 边缘计算网关:开启智能新时代的钥匙
  • Claude Code 的核心能力与架构解析
  • 【软考中级网络工程师】知识点之防火墙
  • CosyVoice 语音合成模型性能优化实战:从 CPU 瓶颈到 GPU 加速的完整解决方案
  • 北京JAVA基础面试30天打卡05
  • springBoot集成easyExcel 实现文件上传
  • 【Spring Boot启动流程底层源码详解】
  • 【从汇编语言到C语言编辑器入门笔记7】 - C语言编译器执行过程
  • Web3: 用ERC-1400革新公司股权激励
  • 【LeetCode 热题 100】(六)矩阵
  • 扩散LLM推理新范式:打破生成长度限制,实现动态自适应调节
  • 组合期权:垂直价差
  • 【股票数据API接口17】如何获取强势股池数据之Python、Java等多种主流语言实例代码演示通过股票数据接口获取数据
  • 【线性代数】线性方程组与矩阵——行列式
  • Red Hat Enterprise Linux 7.9安装Oracle 11.2.0.4单实例数据库-图文详解
  • Docker部署whisper转写模型
  • VS Git巨坑合并分支失败导致多项无关改变
  • urmom damn the jvm
  • SqlSugar vs EF Core 对比 2025年 .NET ORM
  • GPT-5深度解析:革命性AI模型的全面报告与实战指南
  • 零基础小白如何使用QGIS制作研究区地形区位图教程