当前位置: 首页 > backend >正文

Prompt Tuning:轻量级微调与反向传播揭秘

Prompt Tuning 损失函数与反向传播原理解析

在Transformers中,Prompt Tuning是一种轻量级参数高效微调方法,其核心思想是只训练额外添加的提示词向量(prompt embeddings),而冻结预训练模型的主体参数。

损失函数设计

Prompt Tuning的损失函数与标准的语言模型训练类似,主要基于交叉熵损失:

  1. 对于生成任务(如文本生成、摘要):

    L = -1/N ∑ log P(y_i | [P;x])
    

    其中[P;x]表示原始输入x前拼接上可训练的提示P,y_i是目标词,N是序列长度。

  2. 对于分类任务(如情感分析、文本分类):

    L = - ∑ y_true * log(softmax(cls([P;x])))
    

    其中cls()表示取[CLS]标记的输出,y_true是真实标签分布。

反向传播机制

Prompt Tuning的反向传播有两个关键特点:

http://www.xdnf.cn/news/8318.html

相关文章:

  • 分布式缓存:缓存的三种读写模式及分类
  • Wkhtmltopdf使用
  • 医学人工智能中的分层处理与跨模态融合:深度架构设计研究(基础教程.上)
  • 从负债到上岸:湖北理元理律师事务所的专业债务规划之道
  • 如何升级 npm:从版本管理到最佳实践
  • 未来安全与持续进化
  • PaddleX 使用案例
  • 车载诊断架构 --- 车载诊断有那些内容(上)
  • Win/Linux安装flash attention2
  • Python刷题:神奇的函数
  • VSCode如何像Pycharm一样“““回车快速生成函数注释文档?如何设置文档的样式?
  • 在 Ubuntu 虚拟机中实现 HTML 表单与 C 语言 HTTP 服务器交互
  • AI与.NET技术实操系列(七):使用Emgu CV进行计算机视觉操作
  • Linux系统编程-DAY03
  • 26-RTOS的基本介绍
  • Vitis 2021.1安装步骤
  • oracle数据库查看当前session会话数、查询最大支持连接数、修改最大支持连接数
  • SDL文字库介绍和RV1126交叉编译SDL文字库
  • 【Java】CompletableFuture.orTimeout在JDK21以下版本有内存泄漏及解决方案
  • 软件设计师“IP协议与子网划分”真题考点分析——求三连
  • Docker安装postgres数据库
  • Vue.js教学第十章:自定义命令的创建使用与应用
  • python——多线程编程(threading)
  • 【工具】Quicker/VBA|PPT 在指定位置添加有颜色的参考线
  • 交叉编译DirectFB报错解决方法
  • Day 28 训练
  • nginx和docker常用指令
  • thinkpad x220降频到0.7Ghz解决办法
  • 遥控器芯片6nm与3nm技术对比!
  • 如何将吉客云奇门数据无缝对接金蝶云星空