当前位置: 首页 > ds >正文

LoRA modules_to_save解析及卸载适配器(62)

LoRA modules_to_save解析及卸载适配器

    • modules_to_save解析
    • PEFT 模型中卸载适配器
    • 在需保存模块列表中,还可以添加什么

modules_to_save解析

还有一个配置参数可用于指定你希望保持 “活跃且可训练” 的层列表 —— 也就是说,这些层会被设为可训练状态。更便捷的是,你无需提供完整的层全称列表;该参数会通过正则表达式,将你列表中的名称与模型中的层进行匹配。因此,若我们确实希望让层归一化层(layer norm)保持可训练,只需在列表中添加 “layer_norm” 即可。

PEFT 模型中卸载适配器

我们应始终将配置应用于 “全新的” 模型。get_peft_model()函数会在原地修改底层模型,因此若我们使用多个不同的配置对象重复调用该函数,这些配置会相互混淆。我们固然可以重新加载量化模型并重新准备,但更简单的方法是直接从现有的 PEFT 模型中卸载(移除)适配器。有关unload()方法的更多细节,请参阅 “Managing Adapters”(适配器管理)章节。

_ = peft_model.unload()

在典型的工作流程中,我们只需加载一次配置,这样就无需采用这种变通方法了。

以下是完全实现该操作的示例:

http://www.xdnf.cn/news/19154.html

相关文章:

  • 怎样将Word转成高质量的DITA
  • 构建AI智能体:十六、构建本地化AI应用:基于ModelScope与向量数据库的文本向量化
  • RGW层Op的组织
  • 【大前端】React Native(RN)跨端的原理
  • Day16_【机器学习—模型拟合问题】
  • 【MySQL 为什么默认会给 id 建索引? MySQL 主键索引 = 聚簇索引?】
  • 【实战】连锁商超出口网络割接项目案例分享
  • 从CTFshow-pwn入门-pwn43理解栈溢出到底跳转call还是plt
  • 【Word】用 Python 轻松实现 Word 文档对比并生成可视化 HTML 报告
  • 深入 OpenHarmony 内核:设备待机管理模块的休眠调度与资源节能技术
  • 【SpringBoot 版本升级整合Redis异常解决】Unable to connect to 127.0.0.1:6379
  • 5G核心网的架构和功能详解
  • 浏览器访问 ASP.NET Core wwwroot 目录下静态资源的底层实现
  • 新手向:Python编写简易翻译工具
  • 实时标注+硬件加速 | Bandicam 8.2 屏幕录制软件特色功能
  • 局域网共享访问各种报错全记录:从「能 ping 不能进」到「IP/名称差异」一次说清
  • OpenAI重组受阻:微软“锁链”与生态博弈
  • 从 WPF 到 Avalonia 的迁移系列实战篇3:ResourceDictionary资源与样式的差异与迁移技巧
  • 使用 httpsok 工具全面排查网站安全配置
  • @HAProxy 介绍部署使用
  • Copilot、Cursor、Trae、ChatGPT 的“四件套”场景选择表
  • 5G相对于4G网络的优化对比
  • 卷积神经网络实现mnist手写数字集识别案例
  • 三、计算机网络与分布式系统(上)
  • Linux DNS配置文件resolv.conf简介
  • Centos 8 磁盘扩展xfs文件系统 (LVM)
  • 云计算学习100天-第32天
  • 1-ATSAMV71Q21
  • 大模型后训练——Online-RL实践
  • DistributedLock 实现.Net分布式锁