当前位置: 首页 > ds >正文

LoRA(Low-Rank Adaptation,低秩适应)

文章目录

      • LoRA 的核心原理
      • LoRA 在 Stable Diffusion 中的应用
        • **1. 作用位置**
        • **2. 优势**
        • **3. 代码中的实现**
      • LoRA 的典型使用场景
      • LoRA vs 其他微调方法

LoRA(Low-Rank Adaptation,低秩适应)是一种高效微调大模型的技术,主要用于在不显著增加计算资源的情况下,对预训练模型(如Stable Diffusion)进行轻量级适配。它的核心思想是通过低秩矩阵分解来减少可训练参数数量,从而实现对特定任务或风格的快速适配。


LoRA 的核心原理

  1. 低秩分解
    对原始权重矩阵 W ∈ R d × k W \in \mathbb{R}^{d \times k} WRd×k(例如Attention层的 Q / K / V Q/K/V Q/K/V矩阵),LoRA将其更新量 Δ W \Delta W ΔW分解为两个小矩阵的乘积:
    Δ W = B A 其中 B ∈ R d × r , A ∈ R r × k , r ≪ min ⁡ ( d , k ) \Delta W = BA \quad \text{其中} \quad B \in \mathbb{R}^{d \times r}, \ A \in \mathbb{R}^{r \times k}, \ r \ll \min(d,k) ΔW=BA其中BRd×r, ARr×k, rmin(d,k)

    • ( r ) 是秩(rank),通常取 4~64,远小于原矩阵维度。
    • 训练时只更新 A A A B B B,冻结原始权重 W W W
  2. 前向计算
    实际计算时,将原始输出加上低秩适配项:
    h = W x + Δ W x = W x + B A x h = Wx + \Delta W x = Wx + BAx h=Wx+ΔWx=Wx+BAx


LoRA 在 Stable Diffusion 中的应用

1. 作用位置

通常注入到UNet的交叉注意力层(Cross-Attention)和文本编码器中,例如:

  • to_qto_kto_v 投影矩阵
  • 输出投影矩阵 to_out[0]
2. 优势
  • 参数高效
    微调时仅需训练原模型参数的 0.1%~1%(例如SD模型原始参数约1B,LoRA可能只需1-10M参数)。
  • 即插即用
    训练后的LoRA权重(.safetensors文件)可独立于原模型加载/卸载。
  • 组合灵活
    多个LoRA权重可以叠加使用(需注意scale比例)。
3. 代码中的实现

在Stable Diffusion Pipeline中,LoRA相关逻辑主要通过:

  • StableDiffusionLoraLoaderMixin 类处理权重加载
  • scale_lora_layers()unscale_lora_layers() 控制适配强度
  • 通过 cross_attention_kwargs={"scale": lora_scale} 传递缩放因子

LoRA 的典型使用场景

场景说明
风格微调让模型学习特定艺术风格(如动漫、水彩)
主题适配适配特定对象(如特定角色、品牌logo)
可控生成增强对某些属性的控制(如光照、姿势)
多任务切换通过加载不同LoRA快速切换任务,无需存储多个完整模型

LoRA vs 其他微调方法

方法参数量存储开销训练速度灵活性
全参数微调100%极大
Adapter~3-10%中等
LoRA0.1-1%极小
Prompt Tuning~0.1%极小

http://www.xdnf.cn/news/13362.html

相关文章:

  • leetCode- 两数相加
  • 【AI学习】一、向量表征(Vector Representation)
  • 报告精读:金融算力基础设施发展报告 2024【附全文阅读】
  • 构建欺诈事件的结构化威胁建模框架
  • Coze 和 Dify 对比
  • 销售心得分享
  • 保险风险预测数据集insurance.csv
  • vivado IP核High speed/Low latency设置对系统性能的影响
  • 深入浅出Diffusion模型:从原理到实践的全方位教程
  • 改进系列(13):基于改进U-ResNet的脊椎医学图像分割系统设计与实现
  • 游戏盾的功能是什么
  • 关于前端常用的部分公共方法(二)
  • 2.6 查看动态库或程序的依赖库
  • PH热榜 | 2025-06-06
  • 高保真组件库:上传
  • “深时数字地球”新进展!科学智能助推地球科学研究范式变革
  • if综合演练——石头剪刀布
  • 命令行关闭Windows防火墙
  • 网络爬虫解析技术与实战代码详解
  • 可编程光子处理器新范式:《APL Photonics》封面级成果展示多功能集成突破
  • 报文口令重写功能分析(以某巢为例)
  • 一款 AI 驱动的 Wiki 知识库
  • python中的闭包
  • 安装和使用G4F(GPT4Free) 最新0.5.3.2 版本
  • 算法从0到1 Day 17 二叉树part 06
  • Linux 关键目录解析:底层机制与技术细节
  • 从制造出海到智造全球,艾芬达如何拥抱工业互联网革命?
  • Sass具有超能力的CSS预处理器
  • 【leetcode】136. 只出现一次的数字
  • RAG质量评估