当前位置: 首页 > news >正文

ATPrompt方法:属性嵌入的文本提示学习

ATPrompt方法:属性嵌入的文本提示学习

让视觉-语言模型更好地对齐图像和文本(包括未知类别)。
在这里插入图片描述

一、问题场景:传统方法的局限

假设你有一个模型,能识别图像中的物体并关联到文本标签(如“狗”“猫”)。

  • 传统方法
    用“软提示”(可学习的文本标签)和“硬类别标记”(如“[DOG]”)训练模型,让图像和已知类别(如“金毛犬”“波斯猫”)对齐。
    局限:遇到未知类别(如“薮猫”“爱尔兰猎狼犬”)时,模型无法关联,因为没学过这些标签。

  • ATPrompt的目标
    让模型通过通用属性(如“体型大/小”“毛发颜色”“耳朵形状”)作为桥梁,理解未知类别。
    例子

http://www.xdnf.cn/news/653311.html

相关文章:

  • 饭卡管理系统(接口文档)
  • 对接 uniapp 通过中间层(JSBridge)集成零信任 原生androiid和ios SDK
  • 【iOS】 锁
  • 【iOS】 GCD小结
  • NTDS.dit 卷影副本提权笔记
  • sass,less是什么?为什么要使用他们?
  • [特殊字符]《Qt实战:基于QCustomPlot的装药燃面动态曲线绘制(附右键菜单/样式美化/完整源码)》
  • 华为云物联网应用接入对于API及接口调试的梳理
  • Java设计模式之责任链模式:从基础到高级的全面解析
  • Chrome 开发中的任务调度与线程模型实战指南
  • Redis批量删除Key的三种方式
  • LSTM模型进行天气预测Pytorch版本
  • 索尼PS4模拟器shadPS4最新版 v0.9.0 提升PS4模拟器的兼容性
  • 【Linux】基础IO
  • 提问:鲜羊奶是解决育儿Bug的补丁吗?
  • mysql存储过程(if、case、begin...end、while、repeat、loop、cursor游标)的使用
  • 从0开始学习R语言--Day10--时间序列分析数据
  • 手机平板等设备租赁行业MDM方案解析
  • OpenCV计算机视觉实战(8)——图像滤波详解
  • vite常见面试问题
  • 新书速览|ASP.NET MVC高效构建Web应用
  • 精益数据分析(87/126):市场-产品契合度重构——现有产品寻找新市场的实战指南
  • springboot 微服务下部署AI服务
  • 2025年5月26日工作总结
  • 论文阅读:2024 arxiv Prompt Injection attack against LLM-integrated Applications
  • c#基础07(调试与异常捕捉)
  • [Git] 如何将已经执行的修改操作撤销
  • 力扣热题100之LRU缓存机制
  • 力扣 394.字符串解码
  • mysql-tpcc-mysql压测工具使用