当前位置：首页 > news >正文

ATPrompt方法：属性嵌入的文本提示学习

news 2025/5/29 5:48:00

ATPrompt方法：属性嵌入的文本提示学习

让视觉-语言模型更好地对齐图像和文本（包括未知类别）。
在这里插入图片描述

一、问题场景：传统方法的局限

假设你有一个模型，能识别图像中的物体并关联到文本标签（如“狗”“猫”）。

传统方法：
用“软提示”（可学习的文本标签）和“硬类别标记”（如“[DOG]”）训练模型，让图像和已知类别（如“金毛犬”“波斯猫”）对齐。
局限：遇到未知类别（如“薮猫”“爱尔兰猎狼犬”）时，模型无法关联，因为没学过这些标签。
ATPrompt的目标：
让模型通过通用属性（如“体型大/小”“毛发颜色”“耳朵形状”）作为桥梁，理解未知类别。
例子

http://www.xdnf.cn/news/653311.html

相关文章：

饭卡管理系统（接口文档）

对接 uniapp 通过中间层（JSBridge）集成零信任原生androiid和ios SDK

【iOS】 GCD小结

NTDS.dit 卷影副本提权笔记

sass,less是什么?为什么要使用他们?

[特殊字符]《Qt实战：基于QCustomPlot的装药燃面动态曲线绘制（附右键菜单/样式美化/完整源码）》

华为云物联网应用接入对于API及接口调试的梳理

Java设计模式之责任链模式：从基础到高级的全面解析

Chrome 开发中的任务调度与线程模型实战指南

Redis批量删除Key的三种方式

LSTM模型进行天气预测Pytorch版本

索尼PS4模拟器shadPS4最新版 v0.9.0 提升PS4模拟器的兼容性

【Linux】基础IO

提问：鲜羊奶是解决育儿Bug的补丁吗？

mysql存储过程(if、case、begin...end、while、repeat、loop、cursor游标)的使用

从0开始学习R语言--Day10--时间序列分析数据

手机平板等设备租赁行业MDM方案解析

OpenCV计算机视觉实战（8）——图像滤波详解

vite常见面试问题

新书速览|ASP.NET MVC高效构建Web应用

精益数据分析（87/126）：市场-产品契合度重构——现有产品寻找新市场的实战指南

springboot 微服务下部署AI服务

2025年5月26日工作总结

论文阅读：2024 arxiv Prompt Injection attack against LLM-integrated Applications

c#基础07(调试与异常捕捉)

[Git] 如何将已经执行的修改操作撤销

力扣热题100之LRU缓存机制

力扣 394.字符串解码

mysql-tpcc-mysql压测工具使用