当前位置: 首页 > ops >正文

三大微调技术对比:Prompt/Prefix/P-Tuning

Prompt Tuning、Prefix Tuning和P - Tuning的区别

  • 概念方面
    • Prompt Tuning:在输入序列前添加可训练的额外Token以适配下游任务预训练语言模型参数不变。比如在文本分类中,在句子前加特定Token如“(OPINION)”,让模型理解是对观点进行分类的任务。
    • Prefix Tuning:在每层Transformer结构输入前都添加一组可训练的Token,使模型每层处理输入时都考虑这些额外信息。例如在机器翻译任务中,在每层输入前加“(TRANSLATION)”相关的可训练Token,让模型更好地进行翻译任务。
    • P - Tuning:Prompt Tuning的变体,在特定位置插入可训练的Token,早期版本位置不固定,后来的P - Tuning v2在每层也加入了Prompt tokens。如在命名实体识别任务中,在文本中实体可能出现的位置附近插入可训练Token来引导模型识别实体。
  • 操作方式方面<
http://www.xdnf.cn/news/8935.html

相关文章:

  • C++ : list
  • TDengine 中集群维护
  • 基于开源链动2+1模式AI智能名片S2B2C商城小程序的产品驱动型增长策略研究
  • 猿大师办公助手网页编辑Office/wps支持服务器文件多线程下载吗?
  • 技术文档写作方法——以MATLAB滤波为例
  • 仓储物流场景下国标GB28181视频平台EasyGBS视频实时监控系统应用解决方案
  • Webtrees 手册/程序概述
  • 组态王KingSCADA3.53连接S7-1200PLC实战教程
  • Nginx 基本概念深度解析:从服务器特性到代理模式应用​
  • 亚当·斯密思想精髓的数学建模与形式化表征
  • 《软件工程》第 15 章 - 软件度量与估算:从概念到实践​
  • 离线安装Microsoft 照片【笔记】
  • Language Model
  • Vue-01(Vue CLI创建项目以及文件配置说明)
  • 爬虫学习-Scrape Center spa2 超简单 JS 逆向
  • 【WEB3】区块链、隐私计算、AI和Web3.0——可信数字身份体系构建(3)
  • Science Robotics 具身智能驱动的空中物理交互新范式:结合形态和传感,与非结构化环境进行稳健交互
  • 2025.05.22-得物春招机考真题解析-第二题
  • 【算法深练】双序列双指针:用“双轨并行”思维,高效破解算法难题
  • RabbitMQ 集群与高可用方案设计(三)
  • 基于多模态提示融合的交互式图像标注系统设计与实现
  • Java 访问者模式深度重构:从静态类型到动态行为的响应式设计实践
  • FastDFS集群部署与性能优化实战
  • 【后端高阶面经:MongoDB篇】41、MongoDB 是怎么做到高可用的?
  • 【自然语言处理与大模型】大模型Agent四大的组件
  • AI时代新词-大模型(Large Language Model)
  • 网络编程——UDP网络编程
  • flash_attn 安装慢的解决方法
  • 《软件工程》第 14 章 - 持续集成
  • 软考 系统架构设计师系列知识点之杂项集萃(75)