当前位置: 首页 > ops >正文

打卡第43天

作业: kaggle找到一个图像数据集,用cnn网络进行训练并且用grad-cam做可视化 进阶:并拆分成多个文件

一、数据集准备

  1. Kaggle 选数据集

    • 登录 Kaggle,搜索关键词如 “image classification dataset”(例:CIFAR-10、猫狗分类、MNIST)。
    • 下载数据集(需注册账号,部分需同意协议)。
  2. 数据拆分文件

    • 用 Python 脚本拆分数据集为:
      • train/(训练集,约 80%)
      • val/(验证集,约 10%)
      • test/(测试集,约 10%)
    • 代码:
from sklearn.model_selection import train_test_split
import shutil, os# 假设原始数据在data/目录下,每个类别一个子文件夹
classes = os.listdir('data/')
for cls in classes:img_paths = [os.path.join('data/', cls, f) for f in os.listdir(f'data/{cls}/')]train_val, test = train_test_split(img_paths, test_size=0.1, random_state=42)train, val = train_test_split(train_val, test_size=0.111, random_state=42)  # 10%/90%拆验证集# 创建文件夹os.makedirs(f'train/{cls}', exist_ok=True)os.makedirs(f'val/{cls}', exist_ok=True)os.makedirs(f'test/{cls}', exist_ok=True)# 移动文件for path in train: shutil.move(path, f'train/{cls}/')for path in val: shutil.move(path, f'val/{cls}/')for path in test: shutil.move(path, f'test/{cls}/')

二、CNN 模型训练

  1. 环境搭建

    • 安装库:pip install torch torchvision torchaudio matplotlib grad-cam(PyTorch 版)。
  2. 构建 CNN 模型

    • 示例:

 

import torch
import torch.nn as nn
import torch.optim as optimclass CustomCNN(nn.Module):def __init__(self, num_classes=10):super().__init__()self.conv_layers = nn.Sequential(nn.Conv2d(3, 16, kernel_size=3, stride=1, padding=1),nn.ReLU(),nn.MaxPool2d(kernel_size=2, stride=2),nn.Conv2d(16, 32, kernel_size=3, stride=1, padding=1),nn.ReLU(),nn.MaxPool2d(kernel_size=2, stride=2))self.fc_layers = nn.Sequential(nn.Linear(32*7*7, 128),nn.ReLU(),nn.Dropout(0.5),nn.Linear(128, num_classes))def forward(self, x):x = self.conv_layers(x)x = x.view(x.size(0), -1)x = self.fc_layers(x)return xmodel = CustomCNN(num_classes=数据集类别数).to('cuda' if torch.cuda.is_available() else 'cpu')

3.训练流程

  • 定义损失函数、优化器、数据加载器,循环训练:
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)
epochs = 10for epoch in range(epochs):model.train()for inputs, labels in train_loader:inputs, labels = inputs.to(device), labels.to(device)optimizer.zero_grad()outputs = model(inputs)loss = criterion(outputs, labels)loss.backward()optimizer.step()# 验证集评估...

三、Grad-CAM 可视化

  1. 安装工具

    • pip install grad-cam
  2. 生成热力图

    • 代码:
from grad_cam import GradCAM
from torchvision import transforms
import matplotlib.pyplot as plt# 加载单张测试图像
img_path = 'test/某类别/某图片.jpg'
img = Image.open(img_path).convert('RGB')
transform = transforms.Compose([transforms.Resize((224, 224)),  # 需与模型输入尺寸一致transforms.ToTensor(),transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])
input_tensor = transform(img).unsqueeze(0).to(device)# 指定目标层(通常取最后一个卷积层)
target_layer = model.conv_layers[-1]  # 根据模型结构调整
cam = GradCAM(model=model, target_layer=target_layer)
grayscale_cam = cam(input_tensor=input_tensor)
grayscale_cam = grayscale_cam[0, :]  # 取第一个样本的热力图# 可视化
plt.imshow(img)
plt.imshow(grayscale_cam, cmap='jet', alpha=0.5)
plt.axis('off')
plt.savefig('grad_cam_visualization.jpg')
plt.show()

 四、文件结构建议

项目根目录/
├─ data/                # 原始数据集(Kaggle下载)
├─ train/               # 训练集(拆分后)
├─ val/                 # 验证集(拆分后)
├─ test/                # 测试集(拆分后)
├─ models/              # 保存训练好的模型
├─ visualizations/      # 保存Grad-CAM结果
├─ train.py            # 训练脚本
├─ split_data.py       # 数据拆分脚本
├─ grad_cam.py         # 可视化脚本
└─ requirements.txt    # 依赖库列表(pip freeze > requirements.txt)

进阶

  • 数据拆分工具:也可使用 Kaggle 自带的 “Split Data” 插件或 Python 的split-folders库简化操作。
  • 模型优化:尝试预训练模型(如 ResNet、VGG)迁移学习,提升准确率。
  • 可视化优化:用matplotlib调整热力图透明度、颜色映射,或叠加原始图像增强效果。

 @浙大疏锦行

http://www.xdnf.cn/news/10515.html

相关文章:

  • 【Ragflow】24.Ragflow-plus开发日志:增加分词逻辑,修复关键词检索失效问题
  • 从 AMQP 到 RabbitMQ:核心组件设计与工作原理(一)
  • [Java恶补day13] 53. 最大子数组和
  • 判断使用什么技术来爬取数据详细讲解
  • 【Redis】笔记|第5节|Redisson实现高并发分布式锁核心源码
  • 个人总结八股文之-基础篇(持续更新)
  • 汽车软件 OTA 升级技术发展现状与趋势
  • 设计模式——中介者设计模式(行为型)
  • 【Qt开发】对话框
  • 深入理解 Linux 文件系统与日志文件分析
  • NodeJS全栈WEB3面试题——P8项目实战类问题(偏全栈)
  • 安全态势感知中的告警误报思考
  • 多群组部署
  • X浏览器APP:轻巧快捷,畅享极速浏览
  • TomSolver 库 | config详解及其测试
  • ANN与SNN的那些事
  • 动态规划(10):状态压缩
  • 力扣LeetBook数组和字符串--数组简介
  • Spring Security入门:创建第一个安全REST端点项目
  • [RoarCTF 2019]Easy Calc
  • SQL 逻辑处理顺序详解
  • 第二章支线五 ·CSS炼金续章:变量与暗黑主题术
  • 放弃 tsc+nodemon 使用 tsx 构建Node 环境下 TypeScript + ESM 开发环境搭建指南
  • SpringMVC的注解
  • StarRocks物化视图
  • 可视化大屏通用模板Axure原型设计案例
  • 代码随想录60期day54
  • [leetcode] 二分算法
  • 密码学:解析Feistel网络结构及实现代码
  • 传送文件利器wormhole的使用方法