当前位置: 首页 > news >正文

常见的对比学习的损失函数

在多模态任务中,为了让模型能更好地关联视觉信息与语言信息,需要衡量语言视觉特征的对齐程度,以下是一些常见的指标和损失函数:

常见损失函数:

对比损失(Contrastive Loss)

  • 原理:对比损失旨在最大化正样本对(匹配的语言 - 视觉对)之间的相似性,同时最小化负样本对(不匹配的语言 - 视觉对)之间的相似性。通常使用余弦相似度等方式来衡量特征之间的相似性。
  • 公式:
    在这里插入图片描述

三元组损失(Triplet Loss)

  • 原理:三元组由一个锚点(可以是语言或视觉样本)、一个正样本(与锚点匹配的另一种模态样本)和一个负样本(与锚点不匹配的另一种模态样本)组成。其目标是让锚点与正样本的距离小于锚点与负样本的距离,并且差距要大于一个预设的边界值(margin)。
  • 公式:
    在这里插入图片描述
    其中,a 是锚点,p 是正样本,n 是负样本,d(\cdot) 是距离函数(如欧氏距离),m 是边界值。
    在这里插入图片描述

InfoNCE损失(Noise - Contrastive Estimation Loss)

  • 原理:InfoNCE损失是对比学习中常用的损失函数,它通过在多个候选样本中区分出正样本,来最大化正样本对之间的互信息。在语言 - 视觉对齐中,它能有效引导模型从一组候选视觉特征中识别出与给定语言特征匹配的特征。
  • 公式:
    在这里插入图片描述
    其中,l\mathbf{l}l 是语言特征向量,v+\mathbf{v}^+v+ 是正样本视觉特征向量,vi\mathbf{v}_ivi 表示包括正样本和负样本在内的所有候选视觉特征向量,N 是候选样本总数,τ\tauτ 是温度超参数,用于调整相似度得分的分布。
http://www.xdnf.cn/news/1328311.html

相关文章:

  • DataAnalytics之Tool:Metabase的简介、安装和使用方法、案例应用之详细攻略
  • 数字ic后端设计从入门到精通14(含fusion compiler, tcl教学)半定制后端设计
  • plantsimulation知识点25.8.19 工件不在RGV中心怎么办?
  • c#联合halcon的基础教程(案例:亮度计算、角度计算和缺陷检测)(含halcon代码)
  • 力扣面试150(60/150)
  • 机器学习之决策树:从原理到实战(附泰坦尼克号预测任务)
  • Mac(七)右键新建文件的救世主 iRightMouse
  • 大数据MapReduce架构:分布式计算的经典范式
  • 20250819 强连通分量,边双总结
  • 从线性回归到神经网络到自注意力机制 —— 激活函数与参数的演进
  • 人工智能统一信息结构的挑战与前景
  • 比赛准备之环境配置
  • 进程间的通信1.(管道,信号)
  • LINUX 软件编程 -- 线程
  • 决策树(续)
  • LeetCode100-560和为K的子数组
  • 决策树1.1
  • 项目一系列-第5章 前后端快速开发
  • 项目管理.管理理念学习
  • react-quill-new富文本编辑器工具栏上传、粘贴截图、拖拽图片将base64改上传服务器再显示
  • LeetCode算法日记 - Day 16: 连续数组、矩阵区域和
  • 第4章 React状态管理基础
  • 算法训练营day56 图论⑥ 108. 109.冗余连接系列
  • 项目过程管理的重点是什么
  • Ansible 角色管理
  • 点大餐饮独立版系统源码v1.0.3+uniapp前端+搭建教程
  • GStreamer无线图传:树莓派到计算机的WiFi图传方案
  • GEO 优化专家孟庆涛:技术破壁者重构 AI 时代搜索逻辑
  • RESTful API 开发实践:淘宝商品详情页数据采集方案
  • Apache IoTDB:大数据时代时序数据库选型的技术突围与实践指南