当前位置: 首页 > news >正文

NEGATIVE LABEL GUIDED OOD DETECTION WITH PRETRAINED VISION-LANGUAGE MODELS

1. 介绍:

  这篇论文也是基于CLIP通过后处理的方法实现的OOD的检测,但是设计点在于,之前的方法是使用的ID的类别,这篇工作是通过添加一些在语义上非常不同于ID的类别的外分布类来做的OOD检测。

  CLIP做OOD检测的这个系列里面我看的以及记录的第一篇就是MCM的方法,这也是确实是借助CLIP做zero-shot OOD detection的最早的办法,但是MCM之利用了ID的类别的语义信息,这对于VLM本身对于文本强大而丰富的表达能力来说没有得到充分的开发利用。所以这篇论文设计的方法的出发点之一就是为了更好地利用VLM中的丰富的知识来做OOD的检测,具体就是引入了很多的负样本类别来更好地区分ID和OOD,本论文的方法的简称为NegLabel,主要是利用OOD的输入图像样本和ID的类别及我们引入的负样本之间的亲密度来判定。

  根据基本的方法逻辑首先是要从丰富的语料数据库中得到一群负样本类别,通过利用负类别和ID类别之间的语义差距的距离差作为他们的评价指标,选择的负类别应该要和ID 的类别之间有足够的语义差距,从而确保ID和OOD样本之间的分离度。同时他们还设计了一种新的OOD评定的分数,这个分数结合了ID空间和负类别空间的知识,因此能够更好的利用VLM的强大的文本理解能力,且和图像与类别标签之间的亲密度非常相关。最后他们还提供了这个方法的理论依据。

http://www.xdnf.cn/news/138079.html

相关文章:

  • LeetCode 每日一题 2845. 统计趣味子数组的数目
  • 70.评论日记
  • js数据结构之栈
  • C语言大写转小写2.0
  • 自回归模型的多级关系建模:从单一指向到指向性Token的范式革新
  • 线程函数库
  • 矩阵运营:抢占市场与流量的利器
  • c++头文件知识
  • 数字孪生:从概念到实践,重构未来产业的“虚拟镜像”
  • OpenCv高阶(十)——光流估计
  • Oracle_开启归档日志和重做日志
  • AXOP34062: 40V双通道运算放大器
  • C 语言内存分配方法及优缺点
  • 国内多层PCB供应商优选指南
  • 【每天一个知识点】IPv4(互联网协议版本4)和IPv6(互联网协议版本6)
  • vite+vue构建的网站项目localhost:5173打不开
  • ASP.NET MVC​ 入门指南二
  • [基础] Windows PCIe设备驱动框架与开发实践深度解析
  • 面向高性能运动控制的MCU:架构创新、算法优化与应用分析
  • DeepSeek大模型应用学习通知
  • 嵌入式:ARM系列分类及主要应用场景
  • SpringCloud搭建Eureka注册中心
  • Python解析地址中省市区街道
  • 3D Web轻量化引擎HOOPS Communicator 发布3.0版本:平台支持扩展至Linux on ARM64!
  • 【Leetcode 每日一题】2845. 统计趣味子数组的数目
  • 技术面试一面标准流程
  • MiniMind模型的web交互功能初试
  • 28、.NET 中元数据是什么?
  • LeNet5 神经网络的参数解析和图片尺寸解析
  • 《R语言SCI期刊论文绘图专题计划》大纲