当前位置: 首页 > news >正文 ATPrompt方法:属性嵌入的文本提示学习 news 2025/5/29 5:48:00 ATPrompt方法:属性嵌入的文本提示学习 让视觉-语言模型更好地对齐图像和文本(包括未知类别)。 一、问题场景:传统方法的局限 假设你有一个模型,能识别图像中的物体并关联到文本标签(如“狗”“猫”)。 传统方法: 用“软提示”(可学习的文本标签)和“硬类别标记”(如“[DOG]”)训练模型,让图像和已知类别(如“金毛犬”“波斯猫”)对齐。 局限:遇到未知类别(如“薮猫”“爱尔兰猎狼犬”)时,模型无法关联,因为没学过这些标签。 ATPrompt的目标: 让模型通过通用属性(如“体型大/小”“毛发颜色”“耳朵形状”)作为桥梁,理解未知类别。 例子 查看全文 http://www.xdnf.cn/news/653311.html 相关文章: 饭卡管理系统(接口文档) 对接 uniapp 通过中间层(JSBridge)集成零信任 原生androiid和ios SDK 【iOS】 锁 【iOS】 GCD小结 NTDS.dit 卷影副本提权笔记 sass,less是什么?为什么要使用他们? [特殊字符]《Qt实战:基于QCustomPlot的装药燃面动态曲线绘制(附右键菜单/样式美化/完整源码)》 华为云物联网应用接入对于API及接口调试的梳理 Java设计模式之责任链模式:从基础到高级的全面解析 Chrome 开发中的任务调度与线程模型实战指南 Redis批量删除Key的三种方式 LSTM模型进行天气预测Pytorch版本 索尼PS4模拟器shadPS4最新版 v0.9.0 提升PS4模拟器的兼容性 【Linux】基础IO 提问:鲜羊奶是解决育儿Bug的补丁吗? mysql存储过程(if、case、begin...end、while、repeat、loop、cursor游标)的使用 从0开始学习R语言--Day10--时间序列分析数据 手机平板等设备租赁行业MDM方案解析 OpenCV计算机视觉实战(8)——图像滤波详解 vite常见面试问题 新书速览|ASP.NET MVC高效构建Web应用 精益数据分析(87/126):市场-产品契合度重构——现有产品寻找新市场的实战指南 springboot 微服务下部署AI服务 2025年5月26日工作总结 论文阅读:2024 arxiv Prompt Injection attack against LLM-integrated Applications c#基础07(调试与异常捕捉) [Git] 如何将已经执行的修改操作撤销 力扣热题100之LRU缓存机制 力扣 394.字符串解码 mysql-tpcc-mysql压测工具使用
ATPrompt方法:属性嵌入的文本提示学习 让视觉-语言模型更好地对齐图像和文本(包括未知类别)。 一、问题场景:传统方法的局限 假设你有一个模型,能识别图像中的物体并关联到文本标签(如“狗”“猫”)。 传统方法: 用“软提示”(可学习的文本标签)和“硬类别标记”(如“[DOG]”)训练模型,让图像和已知类别(如“金毛犬”“波斯猫”)对齐。 局限:遇到未知类别(如“薮猫”“爱尔兰猎狼犬”)时,模型无法关联,因为没学过这些标签。 ATPrompt的目标: 让模型通过通用属性(如“体型大/小”“毛发颜色”“耳朵形状”)作为桥梁,理解未知类别。 例子