当前位置: 首页 > ops >正文

python打卡day52@浙大疏锦行

知识点回顾:

  1. 随机种子
  2. 内参的初始化
  3. 神经网络调参指南
    1. 参数的分类
    2. 调参的顺序
    3. 各部分参数的调整心得

神经网络调参核心实践

一、全局随机种子设置(修改 src/models/train.py )

def set_seed(seed=42):torch.manual_seed(seed)torch.cuda.manual_seed_all(seed)np.random.seed(seed)random.seed(seed)torch.backends.cudnn.deterministic = Truetorch.backends.cudnn.benchmark = False# 在训练开始时调用
set_seed(config.SEED)

 二、智能参数初始化(新增 src/models/initialization.py )

def initialize_weights(m):if isinstance(m, nn.Conv2d):nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')if m.bias is not None:nn.init.constant_(m.bias, 0)elif isinstance(m, nn.Linear):nn.init.xavier_uniform_(m.weight)nn.init.normal_(m.bias, mean=0, std=0.01)# 在模型定义后调用
model.apply(initialize_weights)

三、系统化调参流程

# 参数优先级调优顺序
调参步骤 = [('基础学习率', {'lr': [1e-3, 3e-4]}),('优化器选择', {'optim': ['adam', 'sgd']}),('批量大小', {'batch_size': [32, 64]}),('正则化组合', {'weight_decay': [0, 1e-4],'dropout_rate': [0.2, 0.5]})
]# 自适应学习率配置示例
scheduler = torch.optim.lr_scheduler.OneCycleLR(optimizer, max_lr=config.MAX_LR,steps_per_epoch=len(train_loader),epochs=config.EPOCHS
)

调参心得
1. 参数分类 :
   
   - 架构参数:卷积核尺寸/通道数
   - 训练参数:学习率/批量大小
   - 正则参数:Dropout率/L2系数
2. 优化顺序 :

flowchart LRA[数据预处理] --> B[初始学习率]B --> C[优化器类型]C --> D[批量大小]D --> E[正则强度]

3.实战技巧 :
- 使用 torch.utils.tensorboard 记录超参数实验
- 对边界层(如第一个卷积层)使用更大学习率
- 采用贝叶斯优化进行自动化超参数搜索

http://www.xdnf.cn/news/13774.html

相关文章:

  • BROOKS 5850E 系列质量流量控制器和流量计Mass Flow Controllers Meters
  • 6月软硬件技术问答第一期
  • riverpod最基本例子:在一个组件里更新状态,在另一个组件里获取更新的数据
  • 龙虎榜——20250612
  • JavaScript原型,原型链。
  • Elasticsearch 的自动补全以及RestAPI的使用
  • Arduino入门教程:1-1、先跑起来(点亮LED打印Helloworld)
  • `setVisible(false)` 隐藏菜单不生效的分析思路
  • Java Solon v3.3.2 发布(可替换,美国博通公司的 Spring 方案)
  • 轻松聊测试报告
  • Vue3学习(6)-Vue3的生命周期和自定义hook
  • 浅谈软件开发工作流
  • 论文参考文献干干货
  • Null-text Inversion for Editing Real Images using Guided Diffusion Models
  • ChatGPT革命升级!o3-pro模型重磅发布:开启AI推理新纪元
  • 人工智能应用案例:如何处理数据、分析数据并训练模型迭代至满意程度
  • Conan 包管理工具介绍与使用
  • 下载量飙升153.6%,《Solvely》如何成为出海AI教育应用新晋“黑马“?
  • Windows下安装MySQL5.7安装过程
  • Verilog基础:$timeformat系统任务的使用
  • Linux服务器部署n8n实战教程
  • AWS-EFS
  • 智能安全带:建筑行业安全防护的新利器
  • 黑群晖NAS部署DeepSeek模型与内网穿透实现本地AI服务
  • Linux中升级或者切换python版本
  • 网络上搜集的IFC资源共享(含下载链接)
  • LLM基础7_用于文本分类的微调
  • Cesium1.95中加载模型过多导致内存溢出的解决方案
  • 用户态与内核态是什么?有什么作用?两者在什么时候切换?为什么要切换?
  • 知识变现新趋势:创客匠人解析创始人 IP 打造与行业破局之道