当前位置: 首页 > web >正文

PyTorch的dataloader制作自定义数据集

PyTorch的dataloader是用于读取训练数据的工具,它可以自动将数据分割成小batch,并在训练过程中进行数据预处理。以下是制作PyTorch的dataloader的简单步骤:

  1. 导入必要的库

import torch
from torch.utils.data import DataLoader, Dataset
  1. 定义数据集类 需要自定义一个继承自torch.utils.data.Dataset的类,在该类中实现__len____getitem__方法。

class MyDataset(Dataset):def __init__(self, data):self.data = datadef __len__(self):return len(self.data)def __getitem__(self, index):# 返回第index个数据样本return self.data[index]
  1. 创建数据集实例

data = [1, 2, 3, 4, 5]
dataset = MyDataset(data)
  1. 创建dataloader实例

使用torch.utils.data.DataLoader创建dataloader实例,可以设置batch_sizeshuffle等参数。

dataloader = DataLoader(dataset, batch_size=2, shuffle=True)
  1. 使用dataloader读取数据

for batch in dataloader:# batch为一个batch的数据,可以直接用于训练print(batch)

以上是制作PyTorch的dataloader的简单步骤,根据实际需求可以进行更复杂的操作,如数据增强、并行读取等。

5.已经分类的文件生成标注文件

假设你已经将所有的图片按照类别分别放到了十个文件夹中,可以使用以下代码生成标注文件:

import os
# 定义图片所在的文件夹路径和标注文件的路径
img_dir = '/path/to/image/directory'
ann_file = '/path/to/annotation/file.txt'
# 遍历每个类别文件夹中的图片,将标注信息写入到标注文件中
with open(ann_file, 'w') as f:for class_id in range(1, 11):class_dir = os.path.join(img_dir, 'class{}'.format(class_id))for filename in os.listdir(class_dir):if filename.endswith('.jpg'):# 写入图片的文件名和类别f.write('{} {}\n'.format(filename, class_id))
http://www.xdnf.cn/news/5908.html

相关文章:

  • 机器学习之决策树与决策森林:机器学习中的强大工具
  • Matlab基于SSA-MVMD麻雀算法优化多元变分模态分解
  • [特殊字符]CentOS 7.6 安装 JDK 11(适配国内服务器环境)
  • 【华为】现场配置OSPF
  • Axure应用交互设计:表格跟随菜单移动效果(超长表单)
  • 软件的价值维度
  • GraspVLA:基于Billion-级合成动作数据预训练的抓取基础模型
  • DIFY教程第七弹:Echarts可视化助手生成图表
  • 按键精灵ios脚本新增元素功能助力辅助工具开发(三)
  • 五大静态博客框架对比:Hugo、Hexo、VuePress、MkDocs、Jekyll
  • Node.js中的洋葱模型
  • Linux架构篇、第五章git2.49.0部署与使用
  • 部署安装git-2.49.0.tar.xz
  • 市政务服务技能竞赛流程策划方案
  • 大模型—— FastGPT 知识库无缝集成到 n8n 工作流 (基于 MCP 协议)
  • 正点原子T80烙铁拆解学习
  • el-select 结合 el-tree:树形下拉数据
  • 为什么 import _ “github.com/go-sql-driver/mysql“ 要导入但不使用?_ 是什么意思?
  • SLAM论文——简析Cartographer
  • flinksql实践(从kafka读数据)
  • 在Linux系统中开放指定端口访问(允许远程访问数据库)
  • 电脑关机再开机会换IP吗?深入解析分配机制
  • PHP-FPM 调优配置建议
  • linux入门学习(介绍、常用命令、vim、shell)
  • .Net HttpClient 处理错误与异常
  • 机器学习 --- 数据集
  • 【Java】网络编程(Socket)
  • set(CMAKE_C_FLAGS “${CMAKE_C_FLAGS} -ansi -pedantic -Wall“)
  • JVM——方法内联之去虚化
  • 【go】binary包,大小端理解,read,write使用,自实现TCP封包拆包案例