当前位置: 首页 > ai >正文

LoRA 微调

LoRA 微调

LoRA(Low-Rank Adaptation)是一种高效微调大型模型的技术,通过低秩分解减少参数量,显著降低计算成本。其核心思想是为原始权重矩阵WWW添加一个低秩增量ΔW\Delta WΔW

ΔW=BA \Delta W = BA ΔW=BA
其中:

  • B∈Rd×rB \in \mathbb{R}^{d \times r}BRd×rA∈Rr×kA \in \mathbb{R}^{r \times k}ARr×k为可训练的低秩矩阵
  • r≪min⁡(d,k)r \ll \min(d,k)rmin(d,k),通常r∈{1,2,4,8}r \in \{1,2,4,8\}r{1,2,4,8}
  • 更新后权重为Wnew=W+ΔWW_{\text{new}} = W + \Delta WWnew=W+ΔW
实现步骤
  1. 冻结原始模型:保持预训练权重WWW不变
  2. 注入适配层:在Transformer的注意力模块(如Q/K/V投影层)旁添加BABABA矩阵
  3. 仅训练增量参数:优化BBBAAA,梯度仅作用于低秩矩阵
伪代码示例
class LoRALayer(nn.Module):def __init__(self, base_layer, rank=8):super().__init__()self.base = base_layer  # 原始冻结层 (e.g., nn.Linear)self.lora_A = nn.Parameter(torch.randn(base_layer.in_features, rank))self.lora_B = nn.Parameter(torch.zeros(rank, base_layer.out_features))def forward(self, x):base_output = self.base(x)  # 原始输出lora_output = x @ self.lora_A @ self.lora_B  # 低秩适配return base_output + lora_output
核心优势
  1. 参数效率:可训练参数量减少100×100 \times100×以上(例如:175B模型仅需0.1%参数)
  2. 无推理延迟:增量矩阵可合并回原权重:Wmerged=W+BAW_{\text{merged}} = W + BAWmerged=W+BA
  3. 模块化适配:不同任务对应独立BABABA矩阵,支持动态切换
典型应用场景
  • 大语言模型(LLaMA, GPT)的领域适配
  • 多任务学习(不同任务使用不同LoRA模块)
  • 资源受限设备上的轻量微调

注意:秩rrr需平衡表达能力和效率;建议在注意力层应用,全连接层效果次之。

http://www.xdnf.cn/news/18551.html

相关文章:

  • Trip Footprint旅行足迹App技术架构全解析
  • 迭代器模式与几个经典的C++实现
  • 机器学习案例——预测矿物类型(模型训练)
  • 【JVM内存结构系列】一、入门:先搞懂整体框架,再学细节——避免从一开始就混淆概念
  • Linux服务器利用Systemd配置定时任务
  • FLOPs、TFLOPs 与 TOPS:计算能力单位
  • 纠删码技术,更省钱的分布式系统的可靠性技术
  • JAVA核心基础篇-枚举
  • Claude Code 新手使用入门教程
  • 【Kubernetes知识点】资源配额与访问控制
  • Qt + windows+exe+msvc打包教程
  • AI热点周报(8.17~8.23):Pixel 10“AI周”、DeepSeek V3.1发布,英伟达再起波澜?
  • 【python】get_dummies()用法
  • AI大模型 限时找我领取
  • 心灵笔记:人生管理模型
  • 简单AI:搜狐公司旗下AI绘画产品
  • 均匀实心球内部引力与半径成正比的牛顿壳层定理证明
  • MATLAB实现CNN-LSTM-Attention 时序和空间特征结合-融合注意力机制混合神经网络模型的风速预测
  • c语言学习_数组使用_扫雷1
  • 1.十天通关常见算法100题(第一天)
  • 科研笔记:博士生手册
  • 【每天一个知识点】训推一体机
  • 数据结构的线性表:顺序表
  • 坑洼铁皮矫平机:把“波浪”变成“镜面”的科学魔法
  • 旅行足迹App技术架构全解析
  • 二、BPMNJS简介
  • 【51单片机非精准延时演示来回流水灯效果】2022-11-10
  • Claude Code赋能企业级开发:外卖平台核心系统的智能化重构
  • n8n 键盘快捷键和控制
  • 【Canvas与徽章】中国制造金色玻璃光徽章