当前位置：首页 > ops >正文

python打卡day52@浙大疏锦行

ops 2025/6/19 9:41:28

知识点回顾：

随机种子
内参的初始化
神经网络调参指南
1. 参数的分类
2. 调参的顺序
3. 各部分参数的调整心得

神经网络调参核心实践

一、全局随机种子设置（修改 src/models/train.py ）

def set_seed(seed=42):torch.manual_seed(seed)torch.cuda.manual_seed_all(seed)np.random.seed(seed)random.seed(seed)torch.backends.cudnn.deterministic = Truetorch.backends.cudnn.benchmark = False# 在训练开始时调用
set_seed(config.SEED)

二、智能参数初始化（新增 src/models/initialization.py ）

def initialize_weights(m):if isinstance(m, nn.Conv2d):nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')if m.bias is not None:nn.init.constant_(m.bias, 0)elif isinstance(m, nn.Linear):nn.init.xavier_uniform_(m.weight)nn.init.normal_(m.bias, mean=0, std=0.01)# 在模型定义后调用
model.apply(initialize_weights)

三、系统化调参流程

# 参数优先级调优顺序
调参步骤 = [('基础学习率', {'lr': [1e-3, 3e-4]}),('优化器选择', {'optim': ['adam', 'sgd']}),('批量大小', {'batch_size': [32, 64]}),('正则化组合', {'weight_decay': [0, 1e-4],'dropout_rate': [0.2, 0.5]})
]# 自适应学习率配置示例
scheduler = torch.optim.lr_scheduler.OneCycleLR(optimizer, max_lr=config.MAX_LR,steps_per_epoch=len(train_loader),epochs=config.EPOCHS
)

调参心得
1. 参数分类：

- 架构参数：卷积核尺寸/通道数
- 训练参数：学习率/批量大小
- 正则参数：Dropout率/L2系数
2. 优化顺序：

flowchart LRA[数据预处理] --> B[初始学习率]B --> C[优化器类型]C --> D[批量大小]D --> E[正则强度]

3.实战技巧：
- 使用 torch.utils.tensorboard 记录超参数实验
- 对边界层（如第一个卷积层）使用更大学习率
- 采用贝叶斯优化进行自动化超参数搜索

查看全文

http://www.xdnf.cn/news/13774.html

BROOKS 5850E 系列质量流量控制器和流量计Mass Flow Controllers Meters

6月软硬件技术问答第一期

riverpod最基本例子：在一个组件里更新状态，在另一个组件里获取更新的数据

龙虎榜——20250612

JavaScript原型，原型链。

Elasticsearch 的自动补全以及RestAPI的使用

Arduino入门教程：1-1、先跑起来（点亮LED打印Helloworld）

`setVisible(false)` 隐藏菜单不生效的分析思路

Java Solon v3.3.2 发布（可替换，美国博通公司的 Spring 方案）

轻松聊测试报告

Vue3学习（6）-Vue3的生命周期和自定义hook

浅谈软件开发工作流

论文参考文献干干货

Null-text Inversion for Editing Real Images using Guided Diffusion Models

ChatGPT革命升级！o3-pro模型重磅发布：开启AI推理新纪元

人工智能应用案例：如何处理数据、分析数据并训练模型迭代至满意程度

Conan 包管理工具介绍与使用

下载量飙升153.6%，《Solvely》如何成为出海AI教育应用新晋“黑马“？

Windows下安装MySQL5.7安装过程

Verilog基础：$timeformat系统任务的使用

Linux服务器部署n8n实战教程

AWS-EFS

智能安全带：建筑行业安全防护的新利器

黑群晖NAS部署DeepSeek模型与内网穿透实现本地AI服务

Linux中升级或者切换python版本

网络上搜集的IFC资源共享（含下载链接）

LLM基础7_用于文本分类的微调

Cesium1.95中加载模型过多导致内存溢出的解决方案

用户态与内核态是什么？有什么作用？两者在什么时候切换？为什么要切换？

知识变现新趋势：创客匠人解析创始人 IP 打造与行业破局之道

相关文章：