当前位置: 首页 > news >正文

python打卡day50@浙大疏锦行

知识点回顾:

  1. resnet结构解析
  2. CBAM放置位置的思考
  3. 针对预训练模型的训练策略
    1. 差异化学习率
    2. 三阶段微调

ps:今日的代码训练时长较长,3080ti大概需要40min的训练时长

作业:

  1. 好好理解下resnet18的模型结构
  2. 尝试对vgg16+cbam进行微调策略

ResNet结构解析与CBAM微调策略

1.ResNet18核心结构

# ResNet18基础结构(基于torchvision实现)
from torchvision.models import resnet18
model = resnet18(pretrained=True)# 核心组件:
# - 初始卷积层(conv1): 7x7卷积+BN+ReLU
# - 4个layer结构(包含BasicBlock)
# - 平均池化层(avgpool)
# - 全连接层(fc)

 2.CBAM放置策略

class VGG16_CBAM(nn.Module):def __init__(self):super().__init__()self.features = nn.Sequential(# 第一个卷积块nn.Conv2d(3, 64, kernel_size=3, padding=1),CBAM(64),  # 在卷积层后添加CBAMnn.ReLU(inplace=True),nn.Conv2d(64, 64, kernel_size=3, padding=1),CBAM(64),  # 每个卷积块添加nn.ReLU(inplace=True),nn.MaxPool2d(kernel_size=2, stride=2)# ... 后续层同理)

3.三阶段微调策略

# 阶段1:冻结特征层
for param in model.features.parameters():param.requires_grad = False# 阶段2:解冻后半部分层
for layer in list(model.features.children())[-4:]:for param in layer.parameters():param.requires_grad = True# 阶段3:全解冻+小学习率
optimizer = optim.SGD([{"params": model.features.parameters(), "lr": 1e-4},{"params": model.classifier.parameters(), "lr": 1e-3}
], momentum=0.9)

作业

一、ResNet18结构理解 :

- 使用torchsummary查看详细结构

from torchsummary import summary
summary(resnet18().to("cuda"), (3, 224, 224))

二、VGG16+CBAM微调 :

- 训练命令建议

python train.py --model vgg16_cbam --batch-size 64 --lr 1e-3 --freeze-epochs 5

 

 

http://www.xdnf.cn/news/973189.html

相关文章:

  • 1.1 ROS1应用商店APT源
  • 全国大学生计算机应用能力与数字素养大赛 C语言程序设计赛项——本科组练习
  • plc开篇学习。
  • maven依赖冲突解决
  • JAVA(Day_2)
  • 5g LDPC编译码-LDPC编码
  • Win系统下的Linux系统——WSL 使用手册
  • Docker安装openGauss
  • 使用kubeadm部署Kubernetes(k8s)集群的步骤
  • Linux ELF文件详解:深入理解可执行文件格式
  • 将对透视变换后的图像使用Otsu进行阈值化,来分离黑色和白色像素。这句话中的Otsu是什么意思?
  • Alpine Linux基本介绍与新手使用指南
  • Spring MVC 核心枢纽:DispatcherServlet 的深度解析与实践价值
  • FastAPI 教程:从入门到实践
  • V837s-调整内核dmesg内容ring buffer大小
  • k8s从入门到放弃之Ingress七层负载
  • 字符串序列判定
  • pip install 安装traj_dist库失败
  • PCB设计教程【大师篇】——STM32开发板原理图设计(单片机最小系统)
  • 树莓派超全系列教程文档--(61)树莓派摄像头高级使用方法
  • 智能在线客服平台:数字化时代企业连接用户的 AI 中枢
  • 【PCL无法读取点云PLY或者PCD格式】
  • esp32idf 关于SPIRAM的使用
  • 第四章 W55MH32初体验
  • Web后端基础:Maven基础
  • PostgreSQL--安装方法
  • 力扣Hot100每日一题[1,3]
  • 【CF】Day80——Codeforces Round 872 (Div. 2) C⭐D (思维 + 模拟 | 树 + 思维 + 组合数学 + 分数取模)
  • 小天互连IM:信创体系下的安全、高效即时通讯新选择
  • 【小记】2024-2025生物计算类热点问题