当前位置：首页 > java >正文

Pytorch 的模型保存

java 2025/7/3 7:36:35

预加载模型及存储

import torchvision.models as models
models.resnet18(pretrained=True)

加载预训练好的模型，如未在路径中找到对应模型，会自动从网上下载。

默认的模型保存路径：C:\Users\Administrator\.torch；

如需修改模型保存路径，可在程序脚本中制定，如：os.environ['TORCH_HOME'] = 'D:\\PyTorch'

也可以在环境变量中为‘TORCH_HOME’配置路径；模型下载好后，程序会在指定路径下的 models 文件夹中加载对应的模型，下载的时候如没有这个文件夹会自动创建。

Pytorch 模型保存

保存模型权重

模型权重文件较小，与模型的定义解耦，便于在不同环境中加载。

torch.save(model.state_dict(), 'model_weights.pth')

加载模型权重：加载时要先定义相同的模型结构，再加载权重：
例如，模型结构如下
model = resnet18(pretrained=False) # 使用与保存时相同的模型架构
num_ftrs = model.fc.in_features
model.fc = nn.Linear(num_ftrs, num_classes)

# 加载模型权重
model.load_state_dict(torch.load('model_weights.pth'))
model.eval() # 切换到评估模式

保存整个模型

包括模型的结构和权重，加载时不需要重新定义模型结构，但文件较大。
保存整个模型：torch.save(model, 'model_full.pth')

加载整个模型：model = torch.load('model_full.pth')

保存和加载模型时的设备

在保存和加载模型时，要保持CPU 或 GPU的一致性。如果保存时使用的是 GPU，加载时也需要使用 GPU，反之亦然。如要在不同设备之间加载模型，可以使用 `map_location` 参数。

在 CPU 上加载 GPU 训练的模型

加载模型时指定设备
model = torch.load('model_full.pth', map_location=torch.device('cpu'))

在 GPU 上加载 CPU 训练的模型

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = torch.load('model_full.pth', map_location=device)
model.to(device).eval()

保存训练状态

在保存模型时，还可以保存优化器的状态，以便在训练中断后恢复训练。
torch.save({
'epoch': epoch,
'model_state_dict': model.state_dict(),
'optimizer_state_dict': optimizer.state_dict(),
'loss': loss,
}, 'checkpoint.pth')

加载：
checkpoint = torch.load('checkpoint.pth')
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
epoch = checkpoint['epoch']
loss = checkpoint['loss']

查看全文

http://www.xdnf.cn/news/4179.html